Investigadores de UCSD liberan Graphologue de código abierto una técnica única de IA que transforma las respuestas de modelos de lenguaje grandes como GPT-4 en diagramas interactivos en tiempo real.

Investigadores de UCSD liberan Graphologue de código abierto, una técnica única de IA que transforma respuestas de modelos de lenguaje grandes en diagramas interactivos en tiempo real.

Los Modelos de Lenguaje Grandes (LLMs, por sus siglas en inglés) han ganado recientemente una inmensa popularidad debido a su accesibilidad y notable capacidad para generar respuestas de texto para una amplia gama de consultas de usuarios. Más de mil millones de personas han utilizado LLMs como ChatGPT para obtener información y soluciones a sus problemas. Estos LLMs son herramientas clave en muchos campos y tienen el potencial de revolucionar la forma en que las personas realizan trabajos relacionados con la información.

Aunque son muy poderosos, los LLMs como ChatGPT tienen muchas limitaciones cuando se trata de abordar requisitos de información complicados. Estas limitaciones existen debido a los límites intrínsecos de las interfaces basadas en texto y los patrones de conversación lineales. Como una secuencia lineal de símbolos, el texto puede ser inadecuado para transmitir ideas complejas con relaciones y estructuras intrincadas. Esto a menudo resulta en comentarios excesivamente largos que son difíciles de comprender por completo. Además, la estructura de conversación lineal de las interfaces de texto puede dificultar la realización de tareas que requieren exploración no lineal y puede hacer que los usuarios tengan que seguir diálogos largos y complicados.

Para abordar estas limitaciones, un equipo de investigadores ha llevado a cabo un estudio formativo con diez voluntarios con el objetivo principal de comprender las dificultades que encuentran los usuarios al tratar con LLMs, particularmente en situaciones que implican tareas informativas desafiantes. Se descubrió que las respuestas verbosas de las interfaces de LLMs frecuentemente dificultaban que los usuarios comprendieran e interactuaran de inmediato con la información que se mostraba. Este problema se vuelve particularmente pronunciado durante tareas complejas en las que los usuarios deben navegar por detalles intrincados.

El equipo ha desarrollado Graphologue, que es una técnica única para superar los problemas. Ha sido diseñado con el objetivo de mejorar la comunicación entre los usuarios y los LLMs. Esto se logra transformando instantáneamente las respuestas basadas en texto producidas por los LLMs en diagramas gráficos. Los principales atributos y capacidades de Graphologue son:

Utiliza técnicas de indicación novedosas para derivar entidades y relaciones de las respuestas textuales producidas por los LLMs. Esto implica identificar componentes textuales importantes y organizarlos en representaciones gráficas.

Utilizando los datos obtenidos de las respuestas de los LLMs, el sistema crea diagramas de nodos y enlaces en tiempo real, que actúan como representaciones visuales del texto, facilitando la comprensión de relaciones y conceptos intrincados para los usuarios.

Los usuarios pueden interactuar con los diagramas de formas más allá de simplemente verlos de manera pasiva. Las representaciones gráficas pueden ser interactuadas activamente por los usuarios, y estos pueden cambiar la disposición y el contenido para adaptarse a sus necesidades individuales.

Basándose en sus interacciones con los diagramas, los usuarios de Graphologue pueden enviar indicaciones específicas del contexto. Estas preguntas dirigen al LLM a ofrecer más detalles o explicaciones, facilitando un discurso más perspicaz y flexible.

Tras la evaluación, el equipo se ha centrado en las ventajas y desventajas de combinar respuestas generadas por LLMs con representaciones diagramáticas. También se analizó cómo varias representaciones, incluyendo texto, esquemas y diagramas, podrían mejorar entre sí para ayudar a los usuarios a comprender mejor el contenido producido por los LLMs. Esta revisión también proporcionó información sobre posibles direcciones futuras para interactuar con los LLMs utilizando interfaces gráficas. Su objetivo principal fue evaluar el rendimiento de Graphologue y el potencial de los gráficos en general para aplicaciones de LLMs.

En conclusión, Graphologue altera la interacción entre las personas y los LLMs. Las conversaciones no lineales facilitadas por este método gráfico son especialmente útiles para actividades que implican exploración, organización y comprensión del conocimiento. Los usuarios pueden moverse más fácilmente a través de la información, cambiar la representación gráfica según sea necesario e interactuar activamente con el sistema para comprender mejor el contenido.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

AI ShortsApplicationsartificial intelligenceComputer VisionEditors PickLanguage ModelLarge Language ModelMachine LearningStaffTech NewsTechnologyUncategorized

Was this article helpful?

93 out of 132 found this helpful

Deci AI presenta DeciDiffusion 1.0 un modelo de difusión latente de texto a imagen de 820 millones de parámetros y 3 veces más rápido que la difusión estable.

Investigadores de UCSD liberan Graphologue de código abierto una técnica única de IA que transforma las respuestas de modelos de lenguaje grandes como GPT-4 en diagramas interactivos en tiempo real.

Was this article helpful?

Hugging Face es el nuevo GitHub para LLMs

Deci AI presenta DeciDiffusion 1.0 un modelo de difusión latente de texto a imagen de 820 millones de parámetros y 3 veces más rápido que la difusión estable.

Inteligencia Artificial

Meta AI anuncia Purple Llama para ayudar a la comunidad a construir de manera ética con modelos de IA abiertos y generativos.

La GPU NVIDIA H100 Tensor Core utilizada en la nueva serie de máquinas virtuales de Microsoft Azure ya está disponible de forma general

Esta investigación de IA propone SMPLer-X Un modelo de base generalista para captura de movimiento humano en 3D/4D a partir de entradas monoculares.

Investigadores de Inteligencia Artificial (IA) de la Universidad de Cornell proponen un nuevo marco de red neuronal para abordar el problema de la segmentación de video.

¿Qué es la generación aumentada por recuperación?

Drones Protegen los Aerogeneradores del Hielo