Luchando contra los ‘hechos’ falsos con dos pequeñas palabras

Luchando contra los 'hechos' falsos con dos palabras

Inspirados por los periodistas, los investigadores descubrieron una nueva técnica para fundamentar las respuestas de un modelo de lenguaje grande en la realidad. ¶ Crédito: Getty Images

Investigadores de la Universidad Johns Hopkins (JHU) han desarrollado un método para disminuir las alucinaciones provocadas por los modelos de lenguaje grande (LLMs) al incluir “según” en las consultas de LLM.

Utilizando este método, los LLMs son dirigidos a citar fuentes confiables en sus datos de entrenamiento, en lugar de producir respuestas falsas.

Los investigadores utilizaron Data Portraits, una herramienta desarrollada previamente en JHU, para verificar si las respuestas del LLM estaban presentes en el conjunto de datos de entrenamiento sin descargar grandes cantidades de texto.

Observaron que el puntaje QUIP (Precisión de Información Citada) de un LLM aumentó entre un 5% y un 15% cuando se incorporó la indicación de fundamentación “según” en las consultas.

Las indicaciones de fundamentación también generaron respuestas más detalladas y precisas en general.

Dijo Daniel Khashabi de JHU: “Nuestro objetivo es que los modelos tengan acceso a contenido útil, como cadenas memorizadas de documentos de alta calidad o confiables”.

Debido a que la precisión de las respuestas depende de la calidad del conjunto de datos de entrenamiento, el método puede filtrar datos de sitios web no confiables. De Johns Hopkins University Hub Ver artículo completo

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Herramientas de IA Generativa se están quedando rápidamente 'sin texto' para entrenarse

Es la última preocupación planteada en relación a las prácticas de recopilación de datos de OpenAI y otros desarrolla...

Inteligencia Artificial

Conoce ConceptGraphs Una representación gráfica estructurada de vocabulario abierto para escenas en 3D

La captura y codificación de información sobre una escena visual, típicamente en el contexto de la visión por computa...

Inteligencia Artificial

15+ Herramientas de IA para Desarrolladores (Diciembre 2023)

GitHub Copilot GitHub Copilot se destaca como un asistente de codificación impulsado por IA líder en el mercado. Dise...

Inteligencia Artificial

Deci presenta DeciCoder un modelo de lenguaje grande de código abierto con 1 billón de parámetros para generación de código.

En el mundo acelerado de la IA, la generación eficiente de código es un desafío que no se puede pasar por alto. Con l...