NetEase Youdao abrió EmotiVoice al público un motor de texto a voz potente y moderno.

NetEase Youdao abre al público EmotiVoice, un motor de texto a voz potente y moderno.

NetEase Youdao anunció el lanzamiento oficial del “Yi Mo Sheng”: Un motor de síntesis de voz a texto abierto (TTS). Está disponible en la plataforma GitHub. Las interfaces web y de scripting que ofrece hacen posible generar resultados por lotes, lo que lo hace ideal para aplicaciones que requieren síntesis emocional de timbres.

Youdao creó este motor de síntesis de voz a texto. En la actualidad cuenta con más de 2.000 timbres y admite tanto el chino como el inglés. También contiene una característica única de síntesis de emociones que puede crear sentimientos de alegría, emoción, tristeza o enojo. Además, ofrece una gran cantidad de vocalizaciones expresivas.

En cuanto a los motores de síntesis de voz a texto de código abierto, EmotiVoice se encuentra en lo más alto. EmotiVoice cuenta con más de 2000 voces únicas y puede conversar en inglés y chino. La función más notable es la síntesis emocional, que te permite generar habla con una amplia gama de emociones, incluyendo felicidad, entusiasmo, tristeza, furia y otras.

Hay una interfaz en línea fácil de usar disponible. Los resultados se pueden generar en masa a través de una interfaz de scripting. Las imágenes de Docker facilitan la prueba de EmotiVoice. Se requiere una computadora con una unidad de procesamiento gráfico NVidia. Si aún no lo has hecho, instala la herramienta de contenedor NVidia en Linux o Windows WSL2.

En el sistema actual, las indicaciones controlan cómo se siente o actúa un usuario. Se pasa por alto el género en favor de enfatizar el tono, el ritmo, la intensidad y la pasión. Un controlador de estilo/timbre, como el diseño original de código cerrado, se puede añadir bastante fácilmente.

El artículo NetEase Youdao Open-Sources EmotiVoice: A Powerful and Modern Text-to-Speech Engine apareció primero en MarkTechPost.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Med-PaLM 2 de Google será la IA médica más avanzada

Google, una de las principales empresas de tecnología del mundo, está dando un paso audaz hacia el ámbito de la atenc...

Inteligencia Artificial

Aprendamos IA juntos - Boletín de la Comunidad Towards AI #3

Buenos días, entusiastas de la IA! Estoy emocionado de compartir el episodio de podcast de esta semana, en el que cha...

Inteligencia Artificial

¿Pueden los LLM reemplazar a los analistas de datos? Construyendo un analista potenciado por LLM

Creo que cada uno de nosotros se ha preguntado al menos una vez durante el año pasado si (o más bien cuándo) ChatGPT ...

Inteligencia Artificial

Microsoft recibe duras críticas por su seguridad groseramente irresponsable

Azure parece una casa de naipes colapsando bajo el peso de los exploits y vulnerabilidades.

Inteligencia Artificial

Aprende IA juntos - Boletín de la comunidad Towards AI #5

¡Buenos días, entusiastas de la IA! El episodio de podcast de esta semana es imprescindible y se destaca como el mejo...

Inteligencia Artificial

Duck AI presenta DuckTrack un recolector de datos de interacción multimodal con computadoras.

El seguimiento preciso y exacto de las interacciones del usuario constituye un pilar fundamental para avanzar en las ...