ToolFormer Guía para que los modelos de IA utilicen herramientas externas

Guía de ToolFormer para que los modelos de IA utilicen herramientas externas

Meta’s LLM se enseña a sí mismo a llamar a API externas

Imagen creada por el autor usando Midjourney

Ahora que el polvo ha asentado, se conocen las debilidades de los LLM.

Incluso el poderoso GPT-4 tiene dificultades con las operaciones matemáticas.

Además, el tiempo de entrenamiento es una debilidad inherente de todos los LLM. Tienen dificultades para responder preguntas sobre cosas nuevas.

Una solución superficial es usar Plugins externos (por ejemplo, los plugins de ChatGPT). Aun así, el usuario tiene que especificar manualmente algunas acciones, y estos plugins a veces no son confiables.

¿Qué pasaría si hubiera un modelo que conociera sus debilidades y estuviera entrenado para llamar de manera nativa a la herramienta externa óptima cuando esté inseguro?

Eso es lo que hizo Meta, creando ToolFormer[1]. En este artículo, discutiremos:

  • ¿Qué es ToolFormer y por qué es un avance?
  • Cómo funciona el modelo.
  • Cómo se puede aplicar la metodología de ToolFormer a cualquier LLM.
  • Por qué la investigación de IA se dirige hacia la visión de ToolFormer.

Sumergámonos.

Debilidades de los Grandes Modelos de Lenguaje

Antes de comenzar a describir ToolFormer, exploremos los problemas que enfrentan los LLM modernos:

  • Progresión del Tiempo: Cada LLM tiene una fecha límite de entrenamiento. Por lo tanto, no pueden acceder a información actualizada y eventos recientes.
  • Hechos Incorrectos: Los LLM son conocidos por inventar hechos, lugares, eventos, productos e incluso documentos de investigación.
  • Operaciones aritméticas: Los LLM tienen dificultades con cálculos matemáticos.
  • Idiomas raros: Los LLM no pueden manejar idiomas de baja cantidad de recursos, generalmente debido a la falta de datos de entrenamiento.

Obviamente, estos problemas son irrelevantes para la mecánica del lenguaje. Una solución ideal sería combinar la generación de texto con herramientas externas.

Aquí entra ToolFormer.

¿Qué es ToolFormer?

ToolFormer es un LLM entrenado para decidir a qué APIs llamar, cuándo llamarlas y qué argumentos pasarles.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

La Huella de Carbono de la Inteligencia Artificial

Buscando formas de reducir la emisión de gases de efecto invernadero atribuibles al uso de la inteligencia artificial...

Inteligencia Artificial

ChatGPT obtiene una puntuación en el 1% superior en la prueba de creatividad humana

La inteligencia artificial (IA) ha alcanzado nuevas alturas, según una investigación realizada por la Universidad de ...

Inteligencia Artificial

Usando los GPT, el creador de aplicaciones de IA personal sin código de OpenAI

Aprende a crear ChatGPT personalizados para análisis de datos, tareas visuales y más con los GPT de OpenAI sin necesi...

Inteligencia Artificial

Descifrando los misterios de los modelos de lenguaje grandes un análisis detallado de las funciones de influencia y su escalabilidad

Los modelos de lenguaje grandes (LLMs) han acelerado el desarrollo en varios campos del mundo real y han demostrado h...

Inteligencia Artificial

Herramientas de IA Médica pueden cometer errores peligrosos. ¿Puede el Gobierno ayudar a prevenirlos?

La administración de Biden ha propuesto un sistema de etiquetado para aplicaciones de inteligencia artificial en el c...