Esta startup de IA con sede en Finlandia presenta a Poro un revolucionario modelo de lenguaje de código abierto que impulsa las capacidades europeas de IA multilingüe.

Poro La startup finlandesa de IA que revoluciona el lenguaje y potencia la IA multilingüe en Europa.

Crear modelos de lenguaje grandes para idiomas europeos que pueden tener menos datos que el inglés es un desafío en inteligencia artificial. Las empresas en el mundo de la tecnología han estado trabajando en esto y recientemente, una startup de Helsinki, Finlandia, ha presentado una nueva solución a este problema.

Antes de esto, algunos modelos de lenguaje estaban disponibles, pero a menudo eran específicos de un idioma y podrían haber rendido mejor para idiomas con menos datos. El problema era que estos modelos necesitaban capturar las características únicas, la cultura y la base de valor de cada idioma europeo. Las soluciones existentes eran limitadas y había una necesidad de algo más inclusivo.

Ahora, una startup de IA finlandesa ha desarrollado una solución de código abierto llamada Poro. Es un modelo de lenguaje grande que tiene como objetivo cubrir los 24 idiomas oficiales de la Unión Europea. La idea es crear una familia de modelos que comprendan y representen la diversidad de los idiomas europeos. La startup cree que esto es importante para la soberanía digital, asegurando que el valor creado por estos modelos se mantenga dentro de Europa.

Poro está diseñado para abordar el desafío de entrenar modelos de lenguaje para idiomas con menos datos disponibles, como el finlandés. Utiliza un enfoque de entrenamiento interlingüístico, lo que significa que aprende de datos en idiomas con más recursos, como el inglés, para mejorar su rendimiento en idiomas con menos recursos.

El modelo Poro 34B tiene 34.2 mil millones de parámetros y utiliza una arquitectura única llamada BLOOM transformer con incrustaciones de ALiBi. Se entrena en un conjunto masivo de datos multilingües, que incluyen lenguajes y lenguajes de programación como Python y Java. El entrenamiento se realiza en uno de los superordenadores más rápidos de Europa, lo que proporciona una enorme potencia de cálculo.

La startup publica puntos de control durante todo el proceso de entrenamiento del modelo, mostrando su progreso. Incluso al 30% de finalización, Poro muestra resultados de vanguardia. En las pruebas, supera a los modelos existentes para el finlandés y está en camino de igualar o superar el rendimiento del inglés.

En conclusión, Poro representa un avance en IA, específicamente para los idiomas europeos. No se trata solo de crear un modelo de lenguaje potente, sino de hacerlo de manera abierta y transparente y respetando la diversidad de idiomas y culturas en Europa. Si tiene éxito, Poro podría ser un cambio de juego, ofreciendo una alternativa autóctona a los modelos de lenguaje de las principales empresas tecnológicas.

El artículo Esta Startup de IA con sede en Finlandia presenta Poro: Un revolucionario modelo de lenguaje de código abierto que impulsa las capacidades de la IA multilingüe europea apareció primero en MarkTechPost.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

AI ShortsApplicationsartificial intelligenceEditors PickLanguage Model

Was this article helpful?

93 out of 132 found this helpful

Esta startup de IA con sede en Finlandia presenta a Poro un revolucionario modelo de lenguaje de código abierto que impulsa las capacidades europeas de IA multilingüe.

Was this article helpful?

Real AI gana el proyecto para construir el modelo de lenguaje abierto de Europa de inteligencia artificial

Google IA presenta Mirasol3B un modelo autoregresivo multimodal para el aprendizaje a través de modalidades de audio, video y texto

Inteligencia Artificial

HuggingFace presenta TextEnvironments un orquestador entre un modelo de aprendizaje automático y un conjunto de herramientas (funciones de Python) que el modelo puede llamar para resolver tareas específicas.

Acelere su pronóstico de series temporales en un 50 por ciento con Amazon SageMaker Canvas UI y las API de AutoML.

Conoce Paella Un Nuevo Modelo de IA Similar a Difusión que Puede Generar Imágenes de Alta Calidad Mucho Más Rápido que Usando Difusión Estable.

¿Qué puedes hacer cuando la inteligencia artificial miente sobre ti?

Desenmascarando Deepfakes Aprovechando los patrones de estimación de la posición de la cabeza para mejorar la precisión de detección

Un nuevo artículo de IA explica los diferentes niveles de experiencia que pueden tener los modelos de lenguaje grandes como máquinas de patrones generales