NetEase Youdao abrió EmotiVoice al público un motor de texto a voz potente y moderno.
NetEase Youdao abre al público EmotiVoice, un motor de texto a voz potente y moderno.
NetEase Youdao anunció el lanzamiento oficial del “Yi Mo Sheng”: Un motor de síntesis de voz a texto abierto (TTS). Está disponible en la plataforma GitHub. Las interfaces web y de scripting que ofrece hacen posible generar resultados por lotes, lo que lo hace ideal para aplicaciones que requieren síntesis emocional de timbres.
Youdao creó este motor de síntesis de voz a texto. En la actualidad cuenta con más de 2.000 timbres y admite tanto el chino como el inglés. También contiene una característica única de síntesis de emociones que puede crear sentimientos de alegría, emoción, tristeza o enojo. Además, ofrece una gran cantidad de vocalizaciones expresivas.
En cuanto a los motores de síntesis de voz a texto de código abierto, EmotiVoice se encuentra en lo más alto. EmotiVoice cuenta con más de 2000 voces únicas y puede conversar en inglés y chino. La función más notable es la síntesis emocional, que te permite generar habla con una amplia gama de emociones, incluyendo felicidad, entusiasmo, tristeza, furia y otras.
- Manejando el procesamiento de datos por lotes con Versatile Data Kit (VDK)
- ¿Cómo sabe un árbol de decisiones cuál es la próxima mejor pregunta a hacer basado en los datos?
- De Álgebra Lineal a Aprendizaje Profundo en 7 Libros (Actualización Invierno 2023)
Hay una interfaz en línea fácil de usar disponible. Los resultados se pueden generar en masa a través de una interfaz de scripting. Las imágenes de Docker facilitan la prueba de EmotiVoice. Se requiere una computadora con una unidad de procesamiento gráfico NVidia. Si aún no lo has hecho, instala la herramienta de contenedor NVidia en Linux o Windows WSL2.
En el sistema actual, las indicaciones controlan cómo se siente o actúa un usuario. Se pasa por alto el género en favor de enfatizar el tono, el ritmo, la intensidad y la pasión. Un controlador de estilo/timbre, como el diseño original de código cerrado, se puede añadir bastante fácilmente.
El artículo NetEase Youdao Open-Sources EmotiVoice: A Powerful and Modern Text-to-Speech Engine apareció primero en MarkTechPost.
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Google Maps se ha mejorado con funciones de IA
- Training de IA en IA GatorTronGPT a la Vanguardia de las Innovaciones de IA Médica de la Universidad de Florida
- Esta investigación sobre IA de China presenta 4K4D una representación en la nube de puntos 4D que admite rasterización de hardware y permite una velocidad de renderizado sin precedentes.
- Este artículo de inteligencia artificial del MIT explora la escala de los modelos de aprendizaje profundo para la investigación química.
- Maestría en Ciencia de Datos con el 3er Mejor Programa en línea
- Philips acelera el desarrollo de soluciones de atención médica habilitadas para IA con una plataforma de MLOps construida en Amazon SageMaker
- En el Omniverso Mejoras de OpenUSD para Autodesk Maya hacen que los flujos de trabajo 3D sean un cuento de hadas