ToolFormer Guía para que los modelos de IA utilicen herramientas externas

Guía de ToolFormer para que los modelos de IA utilicen herramientas externas

Meta’s LLM se enseña a sí mismo a llamar a API externas

Imagen creada por el autor usando Midjourney

Ahora que el polvo ha asentado, se conocen las debilidades de los LLM.

Incluso el poderoso GPT-4 tiene dificultades con las operaciones matemáticas.

Además, el tiempo de entrenamiento es una debilidad inherente de todos los LLM. Tienen dificultades para responder preguntas sobre cosas nuevas.

Una solución superficial es usar Plugins externos (por ejemplo, los plugins de ChatGPT). Aun así, el usuario tiene que especificar manualmente algunas acciones, y estos plugins a veces no son confiables.

¿Qué pasaría si hubiera un modelo que conociera sus debilidades y estuviera entrenado para llamar de manera nativa a la herramienta externa óptima cuando esté inseguro?

Eso es lo que hizo Meta, creando ToolFormer[1]. En este artículo, discutiremos:

¿Qué es ToolFormer y por qué es un avance?
Cómo funciona el modelo.
Cómo se puede aplicar la metodología de ToolFormer a cualquier LLM.
Por qué la investigación de IA se dirige hacia la visión de ToolFormer.

Sumergámonos.

Debilidades de los Grandes Modelos de Lenguaje

Antes de comenzar a describir ToolFormer, exploremos los problemas que enfrentan los LLM modernos:

Progresión del Tiempo: Cada LLM tiene una fecha límite de entrenamiento. Por lo tanto, no pueden acceder a información actualizada y eventos recientes.
Hechos Incorrectos: Los LLM son conocidos por inventar hechos, lugares, eventos, productos e incluso documentos de investigación.
Operaciones aritméticas: Los LLM tienen dificultades con cálculos matemáticos.
Idiomas raros: Los LLM no pueden manejar idiomas de baja cantidad de recursos, generalmente debido a la falta de datos de entrenamiento.

Obviamente, estos problemas son irrelevantes para la mecánica del lenguaje. Una solución ideal sería combinar la generación de texto con herramientas externas.

Aquí entra ToolFormer.

¿Qué es ToolFormer?

ToolFormer es un LLM entrenado para decidir a qué APIs llamar, cuándo llamarlas y qué argumentos pasarles.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Was this article helpful?

93 out of 132 found this helpful

ToolFormer Guía para que los modelos de IA utilicen herramientas externas

Meta’s LLM se enseña a sí mismo a llamar a API externas

Debilidades de los Grandes Modelos de Lenguaje

¿Qué es ToolFormer?

Was this article helpful?

¿Cómo se construyó DALL·E 3? (El mejor modelo de texto a imagen de OpenAI)

El poder del Análisis de Componentes Independientes (ICA) en aplicaciones del mundo real – ejemplo de EEG

Inteligencia Artificial

La Huella de Carbono de la Inteligencia Artificial

ChatGPT obtiene una puntuación en el 1% superior en la prueba de creatividad humana

Revolucionando la eficiencia de la IA El SqueezeLLM de UC Berkeley presenta la cuantificación densa y dispersa, uniendo la calidad y la velocidad en la entrega de modelos de lenguaje grandes.

Usando los GPT, el creador de aplicaciones de IA personal sin código de OpenAI

Descifrando los misterios de los modelos de lenguaje grandes un análisis detallado de las funciones de influencia y su escalabilidad

Herramientas de IA Médica pueden cometer errores peligrosos. ¿Puede el Gobierno ayudar a prevenirlos?