Esta startup de IA con sede en Finlandia presenta a Poro un revolucionario modelo de lenguaje de código abierto que impulsa las capacidades europeas de IA multilingüe.
Poro La startup finlandesa de IA que revoluciona el lenguaje y potencia la IA multilingüe en Europa.
Crear modelos de lenguaje grandes para idiomas europeos que pueden tener menos datos que el inglés es un desafío en inteligencia artificial. Las empresas en el mundo de la tecnología han estado trabajando en esto y recientemente, una startup de Helsinki, Finlandia, ha presentado una nueva solución a este problema.
Antes de esto, algunos modelos de lenguaje estaban disponibles, pero a menudo eran específicos de un idioma y podrían haber rendido mejor para idiomas con menos datos. El problema era que estos modelos necesitaban capturar las características únicas, la cultura y la base de valor de cada idioma europeo. Las soluciones existentes eran limitadas y había una necesidad de algo más inclusivo.
Ahora, una startup de IA finlandesa ha desarrollado una solución de código abierto llamada Poro. Es un modelo de lenguaje grande que tiene como objetivo cubrir los 24 idiomas oficiales de la Unión Europea. La idea es crear una familia de modelos que comprendan y representen la diversidad de los idiomas europeos. La startup cree que esto es importante para la soberanía digital, asegurando que el valor creado por estos modelos se mantenga dentro de Europa.
- Real AI gana el proyecto para construir el modelo de lenguaje abierto de Europa de inteligencia artificial
- Descubriendo los Secretos de la Pérdida Logarítmica
- Gestionando tu almacenamiento de datos en la nube con Rclone
Poro está diseñado para abordar el desafío de entrenar modelos de lenguaje para idiomas con menos datos disponibles, como el finlandés. Utiliza un enfoque de entrenamiento interlingüístico, lo que significa que aprende de datos en idiomas con más recursos, como el inglés, para mejorar su rendimiento en idiomas con menos recursos.
El modelo Poro 34B tiene 34.2 mil millones de parámetros y utiliza una arquitectura única llamada BLOOM transformer con incrustaciones de ALiBi. Se entrena en un conjunto masivo de datos multilingües, que incluyen lenguajes y lenguajes de programación como Python y Java. El entrenamiento se realiza en uno de los superordenadores más rápidos de Europa, lo que proporciona una enorme potencia de cálculo.
La startup publica puntos de control durante todo el proceso de entrenamiento del modelo, mostrando su progreso. Incluso al 30% de finalización, Poro muestra resultados de vanguardia. En las pruebas, supera a los modelos existentes para el finlandés y está en camino de igualar o superar el rendimiento del inglés.
En conclusión, Poro representa un avance en IA, específicamente para los idiomas europeos. No se trata solo de crear un modelo de lenguaje potente, sino de hacerlo de manera abierta y transparente y respetando la diversidad de idiomas y culturas en Europa. Si tiene éxito, Poro podría ser un cambio de juego, ofreciendo una alternativa autóctona a los modelos de lenguaje de las principales empresas tecnológicas.
El artículo Esta Startup de IA con sede en Finlandia presenta Poro: Un revolucionario modelo de lenguaje de código abierto que impulsa las capacidades de la IA multilingüe europea apareció primero en MarkTechPost.
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Este documento de IA explora la comprensión del espacio latente de los modelos de difusión a través de la geometría de Riemann.
- Un enfoque de 3 pasos para evaluar un Retrieval Augmented Generation (RAG)
- Construye una Red Neuronal Convolucional desde cero utilizando Numpy
- Tu guía para AI y ML generativos en AWS reInvent 2023
- La instancia de Amazon EC2 DL2q para inferencia de IA rentable y de alto rendimiento ahora está disponible en general
- Explorando la próxima gran tendencia en el Gen de IA con Sandeep Singh
- Microsoft Research presenta Florence-2 un nuevo modelo de base para la visión con una representación unificada basada en indicaciones para una variedad de tareas de visión por computadora y visión del lenguaje.