Esta startup de IA con sede en Finlandia presenta a Poro un revolucionario modelo de lenguaje de código abierto que impulsa las capacidades europeas de IA multilingüe.

Poro La startup finlandesa de IA que revoluciona el lenguaje y potencia la IA multilingüe en Europa.

Crear modelos de lenguaje grandes para idiomas europeos que pueden tener menos datos que el inglés es un desafío en inteligencia artificial. Las empresas en el mundo de la tecnología han estado trabajando en esto y recientemente, una startup de Helsinki, Finlandia, ha presentado una nueva solución a este problema.

Antes de esto, algunos modelos de lenguaje estaban disponibles, pero a menudo eran específicos de un idioma y podrían haber rendido mejor para idiomas con menos datos. El problema era que estos modelos necesitaban capturar las características únicas, la cultura y la base de valor de cada idioma europeo. Las soluciones existentes eran limitadas y había una necesidad de algo más inclusivo.

Ahora, una startup de IA finlandesa ha desarrollado una solución de código abierto llamada Poro. Es un modelo de lenguaje grande que tiene como objetivo cubrir los 24 idiomas oficiales de la Unión Europea. La idea es crear una familia de modelos que comprendan y representen la diversidad de los idiomas europeos. La startup cree que esto es importante para la soberanía digital, asegurando que el valor creado por estos modelos se mantenga dentro de Europa.

Poro está diseñado para abordar el desafío de entrenar modelos de lenguaje para idiomas con menos datos disponibles, como el finlandés. Utiliza un enfoque de entrenamiento interlingüístico, lo que significa que aprende de datos en idiomas con más recursos, como el inglés, para mejorar su rendimiento en idiomas con menos recursos.

El modelo Poro 34B tiene 34.2 mil millones de parámetros y utiliza una arquitectura única llamada BLOOM transformer con incrustaciones de ALiBi. Se entrena en un conjunto masivo de datos multilingües, que incluyen lenguajes y lenguajes de programación como Python y Java. El entrenamiento se realiza en uno de los superordenadores más rápidos de Europa, lo que proporciona una enorme potencia de cálculo.

La startup publica puntos de control durante todo el proceso de entrenamiento del modelo, mostrando su progreso. Incluso al 30% de finalización, Poro muestra resultados de vanguardia. En las pruebas, supera a los modelos existentes para el finlandés y está en camino de igualar o superar el rendimiento del inglés.

En conclusión, Poro representa un avance en IA, específicamente para los idiomas europeos. No se trata solo de crear un modelo de lenguaje potente, sino de hacerlo de manera abierta y transparente y respetando la diversidad de idiomas y culturas en Europa. Si tiene éxito, Poro podría ser un cambio de juego, ofreciendo una alternativa autóctona a los modelos de lenguaje de las principales empresas tecnológicas.

El artículo Esta Startup de IA con sede en Finlandia presenta Poro: Un revolucionario modelo de lenguaje de código abierto que impulsa las capacidades de la IA multilingüe europea apareció primero en MarkTechPost.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Acelere su pronóstico de series temporales en un 50 por ciento con Amazon SageMaker Canvas UI y las API de AutoML.

Estamos emocionados de anunciar que Amazon SageMaker Canvas ahora ofrece una forma más rápida y fácil de crear modelo...

Aprendizaje Automático

Conoce Paella Un Nuevo Modelo de IA Similar a Difusión que Puede Generar Imágenes de Alta Calidad Mucho Más Rápido que Usando Difusión Estable.

Durante los últimos 2-3 años, ha habido un aumento fenomenal en la calidad y cantidad de investigación realizada en l...

Inteligencia Artificial

¿Qué puedes hacer cuando la inteligencia artificial miente sobre ti?

Las personas tienen poca protección o recurso cuando la tecnología crea y difunde falsedades sobre ellas.

Inteligencia Artificial

Desenmascarando Deepfakes Aprovechando los patrones de estimación de la posición de la cabeza para mejorar la precisión de detección

La aparición de la capacidad de producir videos “falsos” ha generado preocupaciones significativas con re...

Inteligencia Artificial

Un nuevo artículo de IA explica los diferentes niveles de experiencia que pueden tener los modelos de lenguaje grandes como máquinas de patrones generales

LLMs, o modelos de lenguaje grandes, se enseñan a incorporar los muchos patrones tejidos en la estructura de un idiom...