GLM TTS
Z.ai
Z.ai·Audio
text-to-speech basado en LLM con clonación de voz sin disparo a partir de 3-10 segundos de audio y salida expresiva emocionalmente controlable mediante RL multi-recompensa.