Cómo ajustar finamente un LLM para una tarea de preguntas y respuestas (QA) localmente
Ajuste fino de LLM para QA local.
Una guía práctica paso a paso para extraer información de tus datos personalizados haciendo preguntas
Existen tres tipos principales de tareas de preguntas y respuestas.
QA Extractivo: Es la tarea en la que los sistemas extraen la respuesta a la pregunta de un texto dado (texto alimentado). Esta es la forma más común de sistema de preguntas y respuestas y forma parte de la mayoría de los sistemas de automatización de propósito general como Alexa o Google Search, etc.
QA Generativo Abierto: Es una tarea en la que el sistema genera respuestas en lenguaje natural. El enfoque se centra en una IA más generativa para que la respuesta se sienta más natural que una simple extracción de información. Sin embargo, las tareas de QA generativo abierto necesitan que se proporcione el contexto y la respuesta se genera a partir del contexto (en su mayoría, recordar las alucinaciones)
QA Generativo Cerrado: Esta es la tarea en la que no se proporciona contexto y la respuesta se genera puramente a partir del modelo.
- GPT4Readability Nunca vuelvas a escribir un README de nuevo
- Liberando la creatividad Explorando las aplicaciones artísticas de la IA generativa
- Guía introductoria completa sobre el reconocimiento de voz a texto con Transformers
Guía práctica para QA Extractivo
Hoy haremos una rápida descripción de cómo ajustar un modelo utilizando tus propios datos personalizados. ¡Soy partidario de ajustar los modelos generando tus propios datos! Así que empecemos con
- Cómo crear los datos para el entrenamiento?
- Cómo convertirlos al formato correcto – Preprocesamiento?
- Cómo tokenizarlos?
- Cómo ajustar el modelo en tu computadora?
- Bonus – cómo ajustar el API en la nube como Hugging Face?
Tuve que reescribir este tutorial ya que la documentación de HuggingFace está bastante desactualizada y las dependencias están rotas. He solucionado todos los problemas con su tutorial y he compartido una versión completa y funcional que puedes seguir fácilmente (con un colab completo compartido). ¡Salud!
Creación de datos personalizados
Utilizaremos datos de SQuAD como ejemplo. Aprende más sobre SQuAD (Stanford Question Answering Dataset) aquí.
Supondré que estás ejecutando este experimento en el Jupyter Notebook/Ipython notebook.
Instala los conjuntos de datos (porque podemos ver cómo se ven los datos)
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- ¿Cómo cambiar tu carrera de Marketing a Ciencia de Datos?
- Reduciendo la huella de carbono en el entrenamiento de IA mediante la optimización
- Investigadores de IA de Google presentan Pic2Word Un nuevo enfoque para la recuperación de imágenes compuestas sin disparo (ZS-CIR)
- Conoce a PoisonGPT Un método de IA para introducir un modelo malicioso en una cadena de suministro de LLM de otra manera confiable
- Informe de la OCDE el 27% de los empleos están en alto riesgo debido a la IA
- La IA está ayudando a los pacientes de ELA a preservar su voz
- 14 Mejores Proyectos de Minería de Datos con Código Fuente