Investigadores de la Universidad Tsinghua y Microsoft presentan ToRA un agente de razonamiento integrado con herramientas de inteligencia artificial para la resolución de problemas matemáticos.

ToRA El agente de razonamiento integrado con inteligencia artificial desarrollado por investigadores de la Universidad Tsinghua y Microsoft para solucionar problemas matemáticos

Se han realizado avances significativos en inteligencia artificial y resolución de problemas matemáticos, especialmente con la llegada de modelos de lenguaje de gran tamaño. Sin embargo, estos modelos aún enfrentan desafíos matemáticos complejos. Los investigadores de Microsoft y la Universidad de Tsinghua presentan TORA, un enfoque innovador conocido como Agentes de Razonamiento Integrado a Herramientas (Tool-integrated Reasoning Agents), diseñado para abordar problemas matemáticos intrincados mediante la combinación de razonamiento de lenguaje natural con herramientas computacionales externas.

Los investigadores han recurrido a la integración de herramientas externas como calculadoras, intérpretes de código y solucionadores simbólicos para enfrentar estos desafíos. Si bien los métodos basados en programas han transformado eficazmente las tareas de razonamiento en tareas de síntesis de programas, enfrentan problemas de razonamiento sutil, planificación y manejo de errores. La mejora de los modelos de lenguaje de gran tamaño (LLMs, por sus siglas en inglés) con estas herramientas ha mejorado significativamente el rendimiento de razonamiento y generación. Las técnicas de destilación de conocimiento, como las trayectorias generadas por LLM para el ajuste fino, también han desempeñado un papel en la transferencia de conocimiento de modelos maestros a modelos estudiantes.

Los LLM han logrado avances notables en tareas de lenguaje, incluido el razonamiento matemático, pero las matemáticas complejas siguen siendo desafiantes. Las estrategias actuales para mejorar la destreza matemática en los LLM implican razonamiento de lenguaje natural paso a paso y síntesis de programas. Si bien el primero sobresale en razonamiento semántico y abstracto, el último se destaca en operaciones rigurosas y puede aprovechar herramientas especializadas como solucionadores de ecuaciones. Su enfoque supera a modelos de código abierto en conjuntos de datos de razonamiento matemático, logrando alta precisión, especialmente en el conjunto de datos de MATHS a nivel de competencia. Su método también ofrece conocimientos sobre las ventajas y desafíos sin resolver en el razonamiento matemático mediante la interacción con herramientas, orientando así futuras investigaciones en este ámbito.

Los modelos TORA se entrenaron utilizando trayectorias de uso de herramientas interactivas en conjuntos de datos matemáticos, aplicando aprendizaje por imitación en las anotaciones y perfeccionando el comportamiento de razonamiento con la configuración del espacio de salida. GPT-4 generó patrones de razonamiento diversos en los conjuntos de entrenamiento. Se compusieron instrucciones y ejemplos de pocos disparos en un formato entrelazado para la curación de la consulta, y se evaluó la eficacia de TORA, que integra razonamientos con programas. Se lograron mejoras significativas en el rendimiento de razonamiento. Los desafíos identificados incluyen una comprensión más profunda del espacio geométrico y la resolución simbólica de problemas de álgebra intermedia y pre cálculo.

TORA mejora el razonamiento matemático al integrar el razonamiento de lenguaje natural con herramientas externas. Los modelos TORA sobresalen en diez conjuntos de datos de razonamiento matemático, superando a los modelos de código abierto con mejoras absolutas del 13% al 19% en promedio y en resolución de problemas basados en programas. Su enfoque analiza los beneficios y desafíos de la interacción con herramientas, resaltando la efectividad del formato de razonamiento integrado a herramientas de TORA, que entrelaza razonamientos y ejecución de programas.

TORA representa un importante avance en la resolución de problemas matemáticos al integrar de manera fluida el razonamiento basado en el lenguaje natural con el uso de herramientas basadas en programas. Logra un rendimiento de vanguardia en diversas tareas de razonamiento matemático, superando enfoques existentes basados en razonamientos o programas. El análisis exhaustivo de los beneficios y desafíos de la interacción con herramientas ofrece conocimientos críticos para investigaciones futuras, prometiendo desarrollar agentes de razonamiento más avanzados y adaptables.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Hoja de ruta de Aprendizaje Automático Recomendaciones de la Comunidad 2023

En el último artículo, Parte 1 de este mapa de ruta, discutimos brevemente las herramientas iniciales y las direccion...

Inteligencia Artificial

Investigadores de Meta IA publican como código abierto Pearl una biblioteca de agentes de IA de aprendizaje por refuerzo lista para la producción.

Aprendizaje por refuerzo (RL) es un subcampo del aprendizaje automático en el cual un agente toma acciones adecuadas ...

Inteligencia Artificial

Maximizar el rendimiento en aplicaciones de IA de borde

Este artículo proporciona una visión general de las estrategias para optimizar el rendimiento del sistema de IA en im...

Inteligencia Artificial

El próximo guardia de seguridad de tu escuela podría ser un robot

Varias compañías tecnológicas han comenzado a ofrecer robots de seguridad a las escuelas de Estados Unidos.