Investigadores de Microsoft proponen TaskWeaver un marco de trabajo de aprendizaje automático basado en el código para construir agentes autónomos impulsados por LLM.

Investigadores de Microsoft proponen TaskWeaver un marco de aprendizaje automático basado en código para construir agentes autónomos impulsados por LLM.

Los Modelos de Lenguaje Grandes (LLMs) han demostrado impresionantes habilidades de creación e interpretación de lenguaje natural. Ejemplos de estos modelos son GPT, Claude, Palm y Llama. Numerosas aplicaciones, como chatbots, asistentes virtuales y sistemas de generación de contenido, han utilizado extensamente estos modelos. Los LLMs pueden cambiar por completo la forma en que las personas interactúan con la tecnología al ofrecer una experiencia más intuitiva y natural. Un agente se define como una entidad autónoma que puede planificar tareas, monitorear su entorno y tomar las acciones adecuadas en respuesta. Los agentes que utilizan Modelos de Lenguaje Grandes (LLMs) u otras tecnologías de inteligencia artificial entran en esta categoría.

Muchos marcos han intentado utilizar LLMs para conversaciones orientadas a tareas, incluyendo Langchain, Semantic Kernel, Transformers Agent, Agents, AutoGen y JARVIS. Utilizando estos marcos, los usuarios pueden comunicarse con bots impulsados por LLM formulando preguntas en lenguaje sencillo y obteniendo respuestas. Sin embargo, muchos marcos tienen limitaciones que restringen su capacidad para realizar actividades de análisis de datos y situaciones peculiares a un área específica. La falta de soporte nativo para manejar estructuras de datos sofisticadas en la mayoría de los marcos actuales es una de sus principales limitaciones. Para aplicaciones de análisis de datos y muchos otros escenarios empresariales, los agentes impulsados por LLMs a menudo tienen que manejar estructuras de datos complicadas como listas anidadas, diccionarios o marcos de datos.

Sin embargo, muchos marcos actuales necesitan ayuda para gestionar estas estructuras, especialmente cuando se trata de compartir datos entre diferentes complementos o rondas de chat. En estas situaciones, estos marcos codifican estructuras sofisticadas como cadenas u objetos JSON en las indicaciones o persisten datos en disco. Estos métodos funcionan; sin embargo, al trabajar con conjuntos de datos enormes en particular, pueden volverse difíciles y aumentar las tasas de error. La incapacidad de los métodos actuales para ser configurados incluyendo conocimiento de dominio es otra limitación. Aunque estos marcos ofrecen herramientas y ejemplos de ingeniería rápidos, deben ofrecer un medio sistemático para incorporar información específica del dominio en el proceso de planificación y generación de código.

Controlar el proceso de planificación y generación de código de acuerdo con las necesidades específicas del dominio es difícil debido a la restricción. Otro problema con muchos marcos actuales es que podrían ser más flexibles, lo que dificulta satisfacer la amplia gama de requisitos del usuario. Los complementos pueden manejar requisitos típicos, pero podrían necesitar ayuda para manejar solicitudes ad hoc. Es inviable escribir un complemento diferente para cada consulta ad hoc. En estos casos, se vuelve esencial la capacidad del agente para desarrollar código único para llevar a cabo la consulta del usuario. Para resolver este problema, se necesita una solución que combine de manera fluida la ejecución de código personalizado con la ejecución de complementos.

Para superar estas limitaciones, el equipo de investigación de Microsoft propuso TaskWeaver, un marco de programación para crear agentes autónomos impulsados por LLMs. La característica única de TaskWeaver es su capacidad para tratar los complementos definidos por el usuario como funciones invocables, convirtiendo cada solicitud del usuario en código ejecutable. TaskWeaver ofrece soporte para estructuras de datos sofisticadas, uso flexible de complementos y selección dinámica de complementos, lo que ayuda a superar las limitaciones de otros marcos. Implementa lógica complicada utilizando las capacidades de codificación de LLMs e integra conocimiento específico del dominio a través de ejemplos.

Además, TaskWeaver ofrece a los desarrolladores una interfaz intuitiva y ha mejorado significativamente la ejecución segura del código creado. El equipo de investigación describe la arquitectura e implementación de TaskWeaver en este documento y presenta varios estudios de caso que demuestran cómo maneja diferentes tareas. TaskWeaver ofrece un marco sólido y adaptable para crear agentes conversacionales con inteligencia que pueden manejar trabajos desafiantes y adaptarse a condiciones específicas del dominio.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Los investigadores de Meta AI presentan GenBench un marco revolucionario para avanzar en la generalización en el procesamiento del lenguaje natural.

La capacidad de generalización de un modelo o de aplicar de manera efectiva su conocimiento aprendido a nuevos contex...

Inteligencia Artificial

Web LLM Trae los Chatbots de LLM al Navegador.

¿No sería genial si pudieras ejecutar LLMs y chatbots de LLM de forma nativa en tu navegador? Aprendamos más sobre el...

Ciencias de la Computación

El perro robot detecta mejor los nidos invasores de hormigas de fuego que los humanos.

Científicos en China y Brasil están probando perros robóticos e inteligencia artificial (IA) para detectar nidos inva...

Inteligencia Artificial

Aplicación de juegos bilingües tiene como objetivo combatir la demencia

Una aplicación multilingüe desarrollada por investigadores de la Universidad de Tecnología y Diseño de Singapur tiene...

Inteligencia Artificial

Lanzando un gato entre las palomas? Aumentando la computación humana con modelos de lenguaje grandes

Siempre me ha fascinado la etimología. Más a menudo que no, hay una historia intrigante detrás de cómo las palabras y...

Inteligencia Artificial

GANs (Redes Generativas Adversarias)

GANs, redes generativas adversariales, primero vamos a entender qué son GANs. Así que ya he escrito un blog sobre IA ...