ToolFormer Guía para que los modelos de IA utilicen herramientas externas
Guía de ToolFormer para que los modelos de IA utilicen herramientas externas
Meta’s LLM se enseña a sí mismo a llamar a API externas
![Imagen creada por el autor usando Midjourney](https://ai.miximages.com/miro.medium.com/v2/resize:fit:640/format:webp/1*aG77cCmXmL2IWV-TkJ8hlg.png)
Ahora que el polvo ha asentado, se conocen las debilidades de los LLM.
Incluso el poderoso GPT-4 tiene dificultades con las operaciones matemáticas.
Además, el tiempo de entrenamiento es una debilidad inherente de todos los LLM. Tienen dificultades para responder preguntas sobre cosas nuevas.
Una solución superficial es usar Plugins externos (por ejemplo, los plugins de ChatGPT). Aun así, el usuario tiene que especificar manualmente algunas acciones, y estos plugins a veces no son confiables.
- MiniGPT-5 Generación Interleada de Visión y Lenguaje a través de Generative Vokens
- ¿Cómo se construyó DALL·E 3? (El mejor modelo de texto a imagen de OpenAI)
- 7 plataformas para conseguir empleos de ciencia de datos de alto pago
¿Qué pasaría si hubiera un modelo que conociera sus debilidades y estuviera entrenado para llamar de manera nativa a la herramienta externa óptima cuando esté inseguro?
Eso es lo que hizo Meta, creando ToolFormer[1]. En este artículo, discutiremos:
- ¿Qué es ToolFormer y por qué es un avance?
- Cómo funciona el modelo.
- Cómo se puede aplicar la metodología de ToolFormer a cualquier LLM.
- Por qué la investigación de IA se dirige hacia la visión de ToolFormer.
Sumergámonos.
Debilidades de los Grandes Modelos de Lenguaje
Antes de comenzar a describir ToolFormer, exploremos los problemas que enfrentan los LLM modernos:
- Progresión del Tiempo: Cada LLM tiene una fecha límite de entrenamiento. Por lo tanto, no pueden acceder a información actualizada y eventos recientes.
- Hechos Incorrectos: Los LLM son conocidos por inventar hechos, lugares, eventos, productos e incluso documentos de investigación.
- Operaciones aritméticas: Los LLM tienen dificultades con cálculos matemáticos.
- Idiomas raros: Los LLM no pueden manejar idiomas de baja cantidad de recursos, generalmente debido a la falta de datos de entrenamiento.
Obviamente, estos problemas son irrelevantes para la mecánica del lenguaje. Una solución ideal sería combinar la generación de texto con herramientas externas.
Aquí entra ToolFormer.
¿Qué es ToolFormer?
ToolFormer es un LLM entrenado para decidir a qué APIs llamar, cuándo llamarlas y qué argumentos pasarles.
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Si eres un entusiasta de los idiomas, necesitas conocer las capacidades multilingües de ChatGPT
- Doctran y LLMs Un poderoso dúo para analizar las quejas de los consumidores
- Gráfico del pensamiento Un nuevo paradigma para la resolución detallada de problemas en modelos de lenguaje grandes
- LLMOps la próxima frontera de MLOps
- Una introducción a la ingeniería de análisis
- Equilibrando la innovación y la sostenibilidad Desentrañando el impacto ambiental de la IA generativa
- Equilibrando la urgencia vs. la sostenibilidad como equipo de análisis