GPT privado ajustar fino LLM en datos empresariales

GPT privado para ajuste fino de LLM en datos empresariales

Haciendo cosas geniales con los datos

Foto de Robynne Hu en Unsplash

Introducción

En la era del big data y la inteligencia artificial avanzada, los modelos de lenguaje han surgido como herramientas formidables capaces de procesar y generar texto similar al humano. Los modelos de lenguaje grandes, como ChatGPT, son bots de propósito general capaces de tener conversaciones sobre muchos temas. Sin embargo, los modelos de lenguaje también se pueden afinar con datos específicos del dominio, lo que los hace más precisos y pertinentes para preguntas empresariales específicas del dominio.

Muchas industrias y aplicaciones requerirán modelos de lenguaje afinados. Algunas razones incluyen:

  • Mejor rendimiento de un chatbot entrenado con datos específicos
  • Los modelos de OpenAI como chatgpt son una caja negra y las empresas pueden dudar en compartir sus datos confidenciales a través de una API
  • Los costos de la API de ChatGPT pueden ser prohibitivos para aplicaciones grandes

El desafío con el afinamiento de un modelo de lenguaje es que el proceso es desconocido y los recursos computacionales necesarios para entrenar un modelo de mil millones de parámetros sin optimizaciones pueden ser prohibitivos.

Afortunadamente, se ha realizado mucha investigación sobre técnicas de entrenamiento que ahora nos permiten afinar modelos de lenguaje en GPU más pequeñas.

En este blog, cubriremos algunas de las técnicas utilizadas para afinar modelos de lenguaje. ¡Entrenaremos el modelo Falcon 7B en datos financieros en una GPU de Colab! Las técnicas utilizadas aquí son generales y se pueden aplicar a otros modelos más grandes como MPT-7B y MPT-30B.

En Deep Learning Analytics, hemos estado construyendo modelos de aprendizaje automático personalizados durante los últimos 6 años. Contáctenos si está interesado en afinar un modelo de lenguaje para su aplicación.

QLoRA

QLoRA, que significa “Adaptación de rango bajo cuantizado”, presenta un enfoque que combina la cuantización y la adaptación de rango bajo para lograr un afinamiento eficiente de los modelos de IA. Ambos términos se explican con más detalle a continuación.

QLoRA reduce la memoria requerida para el afinamiento de modelos de lenguaje, sin que haya una disminución en el rendimiento en comparación con un modelo de afinamiento estándar de 16 bits. Este método permite afinar un modelo de 7 mil millones de parámetros en una GPU de 16GB, un modelo de 33 mil millones de parámetros en una sola GPU de 24GB y un modelo de 65…

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Conoce circ2CBA un modelo novedoso de aprendizaje profundo que revoluciona la predicción de los sitios de unión circRNA-RBP

En un reciente avance, un equipo de investigadores de China ha presentado un modelo de aprendizaje profundo, llamado ...

Inteligencia Artificial

La Carrera para Regular la Inteligencia Artificial

Por qué Europa tiene ventaja sobre América y China.

Inteligencia Artificial

¿Pueden los LLM reemplazar a los analistas de datos? Construyendo un analista potenciado por LLM

Creo que cada uno de nosotros se ha preguntado al menos una vez durante el año pasado si (o más bien cuándo) ChatGPT ...

Inteligencia Artificial

Investigadores de Stanford presentan BLASTNet el primer conjunto de datos de aprendizaje automático grande para la dinámica fundamental de fluidos

Investigadores de Stanford presentaron un avance revolucionario llamado BLASTNet, anunciando una nueva era en la diná...

Inteligencia Artificial

Premio Gordon Bell otorgado por simulaciones de materiales que logran precisión cuántica a gran escala

Un equipo de investigadores de instituciones estadounidenses e indias fue galardonado con el Premio Gordon Bell 2023 ...

Aprendizaje Automático

Google AI presenta Imagen Editor y EditBench para mejorar y evaluar el rellenado de imágenes guiado por texto.

Ha habido un reciente aumento en la curiosidad sobre los convertidores de texto a imagen. Estos modelos generativos s...