Gráfico del pensamiento Un nuevo paradigma para la resolución detallada de problemas en modelos de lenguaje grandes
Un nuevo paradigma gráfico para una resolución detallada de problemas en modelos de lenguaje grandes
Resumen clave
- Graph of Thoughts (GoT) es un nuevo marco diseñado para mejorar las capacidades de promoción de los Modelos de Lenguaje Grande (LLMs) para tareas de resolución de problemas complejos.
- GoT supera a paradigmas existentes como Chain-of-Thought (CoT) y Tree of Thoughts (ToT) al representar la información generada por un LLM como un gráfico, permitiendo un razonamiento más flexible y eficiente.
- El marco ha mostrado mejoras significativas en el rendimiento de las tareas, incluyendo un aumento del 62% en la calidad de clasificación y una reducción de costos de más del 31% en comparación con Tree of Thoughts.
Este trabajo acerca el razonamiento de LLM al pensamiento humano o a los mecanismos cerebrales como la recurrencia, ambos formando redes complejas.
Introducción
El creciente panorama de la inteligencia artificial ha dado lugar a Modelos de Lenguaje Grande (LLMs) cada vez más sofisticados capaces de una amplia gama de tareas. Sin embargo, uno de los desafíos continuos es mejorar la capacidad de estos modelos para resolver problemas elaborados de manera eficiente. Entra en escena Graph of Thoughts (GoT), un marco que espera dar un gran salto en esta dirección. GoT avanza en las capacidades de promoción de los LLMs al estructurar la información que generan en un gráfico, permitiendo así una forma de razonamiento más intrincada y flexible.
Aunque paradigmas existentes como Chain-of-Thought (CoT) y Tree of Thoughts (ToT) han contribuido a la salida estructurada y al razonamiento jerárquico en los LLMs, a menudo operan dentro de una restricción lineal o similar a un árbol. Esta limitación a veces puede dificultar la capacidad del modelo para manejar tareas complejas de resolución de problemas que requieren razonamiento multidimensional y la capacidad de combinar piezas de información dispares. Graph of Thoughts aborda esta brecha al introducir una estructura basada en gráficos para administrar “pensamientos de LLM”. Esto permite un nivel de flexibilidad sin precedentes en cómo se almacena, accede y manipula la información dentro del modelo. Con GoT, los desarrolladores e investigadores pueden ajustar la estrategia de promoción para navegar eficazmente por este gráfico, permitiendo a los LLMs resolver problemas intrincados de manera más parecida a la humana.
Comprendiendo Graph of Thoughts
Graph of Thoughts se basa en un concepto simple pero poderoso: modela la información producida por un LLM como un gráfico en el que cada vértice representa una unidad de información, a menudo denominada “pensamientos de LLM”. Las aristas entre estos vértices representan las dependencias o relaciones entre diferentes unidades de pensamiento. Este enfoque basado en gráficos permite:
- Combinar pensamientos arbitrarios de LLM en resultados armoniosos
- Refinar la esencia de redes complejas de pensamientos
- Fortalecer pensamientos con el uso de bucles de retroalimentación
En comparación con paradigmas existentes como CoT y ToT, GoT ofrece una forma más flexible y eficiente de administrar y manipular la información generada por los LLMs.
Implementando Graph of Thoughts
Para implementar GoT, los desarrolladores deben representar el proceso de resolución de problemas como un grafo, donde cada nodo o vértice representa un pensamiento o una pieza de información. Luego, las relaciones o dependencias entre estos pensamientos se mapean como aristas en el grafo. Este mapeo permite diversas operaciones como fusionar nodos para crear pensamientos más complejos o aplicar transformaciones para mejorar los pensamientos existentes.
Una de las características destacadas de GoT es su capacidad de extensibilidad, lo que le permite adaptarse a una variedad de tareas y dominios. A diferencia de las estructuras más rígidas, la representación basada en gráficos en GoT puede modificarse dinámicamente durante el proceso de resolución de problemas. Esto significa que a medida que un LLM genera nuevos pensamientos o adquiere información adicional, estos pueden incorporarse de manera fluida en el grafo existente sin necesidad de una revisión completa.
Además, GoT permite implementar bucles de retroalimentación, donde el modelo puede volver a examinar y refinar sus pensamientos anteriores en función de la información recién adquirida. Este proceso dinámico e iterativo sirve para mejorar significativamente la calidad de la salida del modelo, convirtiéndolo en una herramienta especialmente poderosa para tareas complejas que requieren un perfeccionamiento y adaptación continuos.
Conclusión
La introducción de GoT podría marcar un avance significativo en el campo de los LLMs y su aplicación en tareas complejas de resolución de problemas. Al adoptar un enfoque basado en gráficos para representar y manipular la información generada por los LLMs, GoT ofrece una forma de razonamiento más flexible y eficiente. Su éxito en mejorar el rendimiento de las tareas y reducir los costos computacionales lo convierte en un marco prometedor para futuras investigaciones y aplicaciones. Los desarrolladores e investigadores deben explorar este nuevo paradigma para intentar desbloquear todo el potencial de resolución de problemas de sus LLMs y mejorar su promoción.
****[Matthew Mayo](https://www.kdnuggets.com/wp-content/uploads/./profile-pic.jpg)**** (@mattmayo13) tiene un título de maestría en ciencias de la computación y un diploma de posgrado en minería de datos. Como Editor en Jefe de VoAGI, Matthew tiene como objetivo hacer que los conceptos complejos de la ciencia de datos sean accesibles. Sus intereses profesionales incluyen el procesamiento del lenguaje natural, algoritmos de aprendizaje automático y explorar la IA emergente. Lo impulsa una misión de democratizar el conocimiento en la comunidad de la ciencia de datos. Matthew ha estado programando desde que tenía 6 años.
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Equilibrando la urgencia vs. la sostenibilidad como equipo de análisis
- Google Cloud se compromete a proteger a los clientes mediante indemnización de IA generativa
- Google AI presenta PaLI-3 un modelo de lenguaje de visión (VLM) más pequeño, rápido y potente que se compara favorablemente con modelos similares que son 10 veces más grandes.
- Investigadores de UCSD y Microsoft presentan ColDeco una herramienta de inspección sin código para columnas calculadas.
- Una nueva investigación de IA de China propone 4K4D una representación en nube de puntos 4D que admite rasterización de hardware y permite una velocidad de renderizado sin precedentes
- El poder de los codificadores y decodificadores avanzados en la IA generativa
- Aplicaciones del AIoT que se utilizan hoy en día