Conoce a MetaGPT El marco de inteligencia artificial de código abierto que transforma a los GPT en ingenieros, arquitectos y gerentes.

Conoce a MetaGPT, el marco de IA de código abierto que convierte a los GPT en profesionales.

Los Modelos de Lenguaje Grandes (LLMs) basados en sistemas multiagente tienen oportunidades excepcionales para imitar y mejorar las operaciones humanas. Sin embargo, como han demostrado estudios recientes, los sistemas actuales a veces necesitan ser más precisos en la complejidad presente en aplicaciones del mundo real. Estos sistemas necesitan principalmente ayuda para fomentar la colaboración constructiva a través de intercambios verbales y basados en herramientas, lo que crea dificultades para generar intercambios coherentes, reducir los bucles de retroalimentación contraproducentes y facilitar interacciones colaborativas fructíferas. Los Procedimientos Operativos Estandarizados (SOP) bien estructurados son necesarios para que los procesos multifacéticos sean efectivos. Es crucial tener un conocimiento exhaustivo e integración de prácticas del mundo real. 

Es importante abordar estas limitaciones comunes e incorporar estos conocimientos para mejorar el diseño y la estructura de los sistemas multiagente basados en LLM y aumentar su eficacia y aplicación. Además, a través de una práctica colectiva extensa, las personas han creado SOP generalmente reconocidos en varios campos. Estos SOP son esenciales para facilitar el desglose efectivo del trabajo y la coordinación. Por ejemplo, el proceso de cascada en ingeniería de software establece pasos lógicos para el análisis de requisitos, el diseño del sistema, la codificación, las pruebas y los entregables. 

Con la ayuda de este flujo de trabajo consensuado, varios ingenieros pueden trabajar juntos de manera productiva. Además, los trabajos humanos tienen conocimientos especializados adecuados para sus tareas: los ingenieros de software utilizan sus habilidades de programación para crear código, mientras que los gerentes de productos utilizan investigaciones de mercado para identificar las demandas de los clientes. La colaboración se desvía de los resultados típicos y se vuelve desorganizada. Por ejemplo, los gerentes de productos deben realizar estudios competitivos exhaustivos que analicen las necesidades de los usuarios, las tendencias del mercado y los productos competidores para impulsar el desarrollo. Estos análisis deben ir seguidos de la creación de Documentos de Requisitos de Producto (PRDs), que tienen un formato claro y estandarizado y objetivos prioritizados. 

Estos artefactos normativos son esenciales para avanzar en emprendimientos complicados y diversos que requieren contribuciones relacionadas de varios roles. Cristalizan la comprensión comunitaria. Por lo tanto, es crucial utilizar documentación organizada, informes y gráficos que muestren dependencias. En este estudio, investigadores de DeepWisdom, la Universidad de Xiamen, la Universidad China de Hong Kong Shenzhen, la Universidad de Nanjing, la Universidad de Pensilvania y la Universidad de California, Berkeley presentan MetaGPT, un marco multiagente innovador que incluye conocimiento práctico basado en SOP. Primero, se utiliza un título de trabajo que describe sus tareas para identificar a cada agente. Esto permite que el sistema se inicialice con el prefijo adecuado de la indicación específica del rol. En lugar de pistas torpes de interpretación de roles, esto incorpora conocimientos de dominio en las definiciones de los agentes. En segundo lugar, examinan procesos humanos efectivos para extraer SOP con el conocimiento procedimental necesario para proyectos grupales. 

Estos SOP se codifican utilizando especificaciones de acción basadas en roles en la arquitectura del agente. En tercer lugar, para facilitar el intercambio de información, los agentes crean salidas de acción estandarizadas. MetaGPT simplifica la coordinación entre trabajos interdependientes al formalizar los artefactos que los expertos humanos intercambian. Los agentes están conectados por un entorno compartido que ofrece información sobre actividades y uso compartido de herramientas y recursos. Todas las comunicaciones entre agentes se encuentran en este entorno. También proporcionan una memoria global donde se almacenan todos los registros de cooperación, lo que permite que cualquier agente se suscriba o busque los datos que necesita. Los agentes pueden recuperar mensajes anteriores de esta memoria para obtener más contexto. 

A diferencia de la absorción pasiva de información a través del diálogo, esta arquitectura permite a los agentes observar y extraer información relevante de manera activa. El entorno imita los sistemas que se encuentran en los lugares de trabajo reales que fomentan el trabajo en equipo. Muestran flujos de trabajo colaborativos de desarrollo de software y experimentos relacionados con la implementación de código, que abarcan tanto la producción de pequeños juegos como sistemas más grandes y complejos, para ilustrar la eficacia de su arquitectura. MetaGPT maneja una complejidad de software mucho mayor que GPT-3.5 u otros marcos de código abierto como AutoGPT y AgentVerse, medida en líneas de código producidas. 

Además, MetaGPT genera documentos de requisitos de alta calidad, artefactos de diseño, diagramas de flujo y especificaciones de interfaz a lo largo del proceso automatizado de principio a fin. Estas salidas estandarizadas intermedias aumentan enormemente la tasa de éxito de la ejecución final del código. Gracias a la documentación generada automáticamente, los desarrolladores humanos pueden aprender y mejorar rápidamente su experiencia en el tema para mejorar aún más sus requisitos, diseños y código. También permite una interacción humano-AI más sofisticada. En conclusión, validan MetaGPT mediante una amplia investigación en diversos proyectos de software. 

Las posibilidades que ofrece el paradigma de cooperación de agentes expertos basados en roles de MetaGPT se demuestran a través de puntos de referencia cuantitativos de producción de código y evaluaciones cualitativas de las salidas de todo el proceso. En resumen, principalmente contribuyeron lo siguiente: 

• Diseñaron un nuevo mecanismo de meta-programación, que incluye definición de roles, descomposición de tareas, estandarización de procesos y otros diseños técnicos. 

• Proponen MetaGPT, un marco de colaboración multiagentes basado en LLM que codifica los SOP humanos en agentes LLM y amplía fundamentalmente la capacidad de resolución de problemas complejos.

• Realizan extensas pruebas en el desarrollo de código CRUD2, trabajos básicos de análisis de datos y juegos de Python con AutoGPT, AgentVerse, LangChain y MetaGPT.

De esta manera, MetaGPT puede crear software complejo empleando el SOP. Los hallazgos generales muestran que MetaGPT supera significativamente a sus competidores en cuanto a la calidad del código y el cumplimiento del proceso previsto.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

No es el Vader que piensas 3D VADER es un modelo de IA que difunde modelos 3D

La generación de imágenes nunca ha sido tan fácil. Con el surgimiento de los modelos de IA generativos, el proceso se...

Inteligencia Artificial

¡Construye y juega! ¡Tu propio modelo V&L equipado con LLM!

Los modelos de lenguaje grandes (LLM) están demostrando cada vez más su valor. La incorporación de imágenes en los LL...

Inteligencia Artificial

Premio Gordon Bell otorgado por simulaciones de materiales que logran precisión cuántica a gran escala

Un equipo de investigadores de instituciones estadounidenses e indias fue galardonado con el Premio Gordon Bell 2023 ...

Inteligencia Artificial

Aprende IA juntos - Boletín de la comunidad Towards AI #5

¡Buenos días, entusiastas de la IA! El episodio de podcast de esta semana es imprescindible y se destaca como el mejo...