El equipo de Estabilidad AI presenta FreeWilly1 y FreeWilly2 Nuevos Modelos de Lenguaje de Acceso Abierto y Gran Tamaño (LLMs)

El equipo de Estabilidad AI presenta FreeWilly1 y FreeWilly2, nuevos LLMs de acceso abierto y gran tamaño.

FreeWilly1 y su sucesor FreeWilly2 son nuevos y potentes modelos de lenguaje de código abierto (LLMs) desarrollados por el equipo CarperAI de Stability AI. Ambos modelos tienen un rendimiento excepcional en competencias de razonamiento utilizando diferentes métricas. Se utilizó el ajuste supervisado (SFT) en el formato estándar de la industria Alpaca para ajustar el modelo FreeWilly1, construido sobre el modelo base LLaMA 65B original. FreeWilly2 utiliza el modelo base LLaMA 2 70B para lograr un rendimiento similar al de GPT-3.5 en algunas tareas.

El entrenamiento de los modelos FreeWilly fue fuertemente influenciado por el enfoque innovador de Microsoft, descrito en el artículo “Orca: Aprendizaje progresivo a partir de trazas de explicación complejas de GPT-4”. El equipo proporcionó instrucciones de alta calidad a los modelos de lenguaje para generar nuestra copia del conjunto de datos, que contiene 600,000 puntos de datos (aproximadamente el 10% del tamaño del conjunto de datos utilizado en el trabajo original de Orca).

Utilizando este método, los investigadores generaron 500,000 casos utilizando un modelo de LLM menos complejo y 100,000 adicionales utilizando un modelo de LLM más complejo. Estos conjuntos de datos fueron minuciosamente examinados, eliminando los casos provenientes de las evaluaciones de referencia para garantizar comparaciones válidas. Su enfoque de conjuntos de datos generados sintéticamente se valida mediante el excelente rendimiento de los modelos FreeWilly en múltiples evaluaciones, a pesar de haber sido entrenados con sólo una décima parte del tamaño de muestra utilizado en el artículo original de Orca.

Los investigadores utilizaron el marco de evaluación lm-eval-harness de EleutherAI, al cual agregaron AGIEval, para realizar evaluaciones de estos modelos. Los resultados muestran que ambos modelos FreeWilly son excelentes al resolver problemas difíciles en disciplinas especializadas como el derecho y las matemáticas, realizar razonamientos complejos y reconocer matices del lenguaje.

El equipo cree que estos dos modelos mejoran nuestra capacidad para comprender el lenguaje hablado y abren posibilidades que antes eran imposibles. Esperan ver todos los usos innovadores de estos modelos en la inteligencia artificial.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Robot inspirado en tortugas bebé puede nadar bajo la arena

Un nuevo robot inspirado en las crías de tortugas puede moverse a través de la arena a una profundidad de 5 pulgadas ...

Inteligencia Artificial

Científicos simulan la guerra de las hormigas utilizando el juego de ordenador Age of Empires

Científicos utilizaron el videojuego Age of Empires para simular la guerra de hormigas, en un esfuerzo por erradicar ...

Inteligencia Artificial

Aumenta la productividad en Amazon SageMaker Studio Presentamos JupyterLab Spaces y herramientas de inteligencia artificial generativa

Amazon SageMaker Studio ofrece un conjunto amplio de entornos de desarrollo integrados completamente administrados (I...

Noticias de Inteligencia Artificial

Multimodal AI Inteligencia Artificial que puede ver y escuchar

La inteligencia artificial (IA) ha recorrido un largo camino desde su inicio, pero hasta hace poco, sus capacidades s...

Inteligencia Artificial

Together AI presenta Llama-2-7B-32K-Instruct un avance en el procesamiento del lenguaje con contexto extendido

Ha surgido un desafío multifacético en el amplio campo del procesamiento del lenguaje natural: la capacidad de compre...

Inteligencia Artificial

Los Gemelos Digitales Brindan un Camino más Verde para el Crecimiento del Hidrógeno

Un investigador cree que los gemelos digitales podrían ayudar a reducir los costos de producción de hidrógeno limpio ...