Gráfico del pensamiento Un nuevo paradigma para la resolución detallada de problemas en modelos de lenguaje grandes

Un nuevo paradigma gráfico para una resolución detallada de problemas en modelos de lenguaje grandes

 

Resumen clave

 

  • Graph of Thoughts (GoT) es un nuevo marco diseñado para mejorar las capacidades de promoción de los Modelos de Lenguaje Grande (LLMs) para tareas de resolución de problemas complejos.
  • GoT supera a paradigmas existentes como Chain-of-Thought (CoT) y Tree of Thoughts (ToT) al representar la información generada por un LLM como un gráfico, permitiendo un razonamiento más flexible y eficiente.
  • El marco ha mostrado mejoras significativas en el rendimiento de las tareas, incluyendo un aumento del 62% en la calidad de clasificación y una reducción de costos de más del 31% en comparación con Tree of Thoughts.

 

Este trabajo acerca el razonamiento de LLM al pensamiento humano o a los mecanismos cerebrales como la recurrencia, ambos formando redes complejas.

 

Introducción

 

El creciente panorama de la inteligencia artificial ha dado lugar a Modelos de Lenguaje Grande (LLMs) cada vez más sofisticados capaces de una amplia gama de tareas. Sin embargo, uno de los desafíos continuos es mejorar la capacidad de estos modelos para resolver problemas elaborados de manera eficiente. Entra en escena Graph of Thoughts (GoT), un marco que espera dar un gran salto en esta dirección. GoT avanza en las capacidades de promoción de los LLMs al estructurar la información que generan en un gráfico, permitiendo así una forma de razonamiento más intrincada y flexible.

Aunque paradigmas existentes como Chain-of-Thought (CoT) y Tree of Thoughts (ToT) han contribuido a la salida estructurada y al razonamiento jerárquico en los LLMs, a menudo operan dentro de una restricción lineal o similar a un árbol. Esta limitación a veces puede dificultar la capacidad del modelo para manejar tareas complejas de resolución de problemas que requieren razonamiento multidimensional y la capacidad de combinar piezas de información dispares. Graph of Thoughts aborda esta brecha al introducir una estructura basada en gráficos para administrar “pensamientos de LLM”. Esto permite un nivel de flexibilidad sin precedentes en cómo se almacena, accede y manipula la información dentro del modelo. Con GoT, los desarrolladores e investigadores pueden ajustar la estrategia de promoción para navegar eficazmente por este gráfico, permitiendo a los LLMs resolver problemas intrincados de manera más parecida a la humana.

 

Comprendiendo Graph of Thoughts

 

Graph of Thoughts se basa en un concepto simple pero poderoso: modela la información producida por un LLM como un gráfico en el que cada vértice representa una unidad de información, a menudo denominada “pensamientos de LLM”. Las aristas entre estos vértices representan las dependencias o relaciones entre diferentes unidades de pensamiento. Este enfoque basado en gráficos permite:

  • Combinar pensamientos arbitrarios de LLM en resultados armoniosos
  • Refinar la esencia de redes complejas de pensamientos
  • Fortalecer pensamientos con el uso de bucles de retroalimentación

En comparación con paradigmas existentes como CoT y ToT, GoT ofrece una forma más flexible y eficiente de administrar y manipular la información generada por los LLMs.

  

Implementando Graph of Thoughts

 

Para implementar GoT, los desarrolladores deben representar el proceso de resolución de problemas como un grafo, donde cada nodo o vértice representa un pensamiento o una pieza de información. Luego, las relaciones o dependencias entre estos pensamientos se mapean como aristas en el grafo. Este mapeo permite diversas operaciones como fusionar nodos para crear pensamientos más complejos o aplicar transformaciones para mejorar los pensamientos existentes.

Una de las características destacadas de GoT es su capacidad de extensibilidad, lo que le permite adaptarse a una variedad de tareas y dominios. A diferencia de las estructuras más rígidas, la representación basada en gráficos en GoT puede modificarse dinámicamente durante el proceso de resolución de problemas. Esto significa que a medida que un LLM genera nuevos pensamientos o adquiere información adicional, estos pueden incorporarse de manera fluida en el grafo existente sin necesidad de una revisión completa.

Además, GoT permite implementar bucles de retroalimentación, donde el modelo puede volver a examinar y refinar sus pensamientos anteriores en función de la información recién adquirida. Este proceso dinámico e iterativo sirve para mejorar significativamente la calidad de la salida del modelo, convirtiéndolo en una herramienta especialmente poderosa para tareas complejas que requieren un perfeccionamiento y adaptación continuos.

 

Conclusión

 

La introducción de GoT podría marcar un avance significativo en el campo de los LLMs y su aplicación en tareas complejas de resolución de problemas. Al adoptar un enfoque basado en gráficos para representar y manipular la información generada por los LLMs, GoT ofrece una forma de razonamiento más flexible y eficiente. Su éxito en mejorar el rendimiento de las tareas y reducir los costos computacionales lo convierte en un marco prometedor para futuras investigaciones y aplicaciones. Los desarrolladores e investigadores deben explorar este nuevo paradigma para intentar desbloquear todo el potencial de resolución de problemas de sus LLMs y mejorar su promoción.  

****[Matthew Mayo](https://www.kdnuggets.com/wp-content/uploads/./profile-pic.jpg)**** (@mattmayo13) tiene un título de maestría en ciencias de la computación y un diploma de posgrado en minería de datos. Como Editor en Jefe de VoAGI, Matthew tiene como objetivo hacer que los conceptos complejos de la ciencia de datos sean accesibles. Sus intereses profesionales incluyen el procesamiento del lenguaje natural, algoritmos de aprendizaje automático y explorar la IA emergente. Lo impulsa una misión de democratizar el conocimiento en la comunidad de la ciencia de datos. Matthew ha estado programando desde que tenía 6 años.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

El modelo de IA puede ayudar a determinar dónde se originó el cáncer de un paciente

Las predicciones del modelo OncoNPC podrían permitir a los médicos elegir tratamientos específicos para tumores difíc...

Inteligencia Artificial

Explicar decisiones médicas en entornos clínicos utilizando Amazon SageMaker Clarify

En esta publicación, mostramos cómo mejorar la explicabilidad del modelo en entornos clínicos utilizando Amazon SageM...

Investigación

Usando reflexiones para ver el mundo desde nuevos puntos de vista.

Un nuevo sistema de visión por computadora convierte cualquier objeto brillante en una especie de cámara, lo que perm...

Inteligencia Artificial

Investigadores de KAIST presentan FaceCLIPNeRF un canal de manipulación impulsado por texto de una cara en 3D utilizando NeRF deformable

Un componente crucial de las mejoras en el contenido digital humano en 3D es la capacidad de manipular fácilmente la ...

Inteligencia Artificial

¡Abrocha tu cinturón ¡El Falcon 180B está aquí!

Vamos a sumergirnos en el modelo de lenguaje abierto más grande del mundo.

Inteligencia Artificial

Investigadores de Microsoft presentan Hydra-RLHF Una solución eficiente en memoria para el aprendizaje por refuerzo con retroalimentación humana

Desde que se hicieron conocidos, los modelos familiares ChatGPT, GPT-4 y Llama-2 han conquistado a los usuarios con s...