GLM TTS
Z.ai
Z.ai·Audio
LLM-basierte text-to-speech mit Zero-Shot-Sprachklonen aus 3-10 Sekunden Audio und emotionsausdrucksstarkem, steuerbarem Output über Multi-Reward RL.