GLM TTS
Z.ai
Z.ai·Audio
LLMベースのtext-to-speechで、3〜10秒の音声からゼロショットのボイスクローンと、マルチリワード強化学習(RL)による感情表現で制御可能な出力を実現しています。