Investigadores de Microsoft presentan Table-GPT Elevando modelos de lenguaje para destacar en la comprensión de tablas bidimensionales y tareas relacionadas.

Investigadores de Microsoft presentan Table-GPT Elevando los modelos de lenguaje para sobresalir en la comprensión de tablas bidimensionales y tareas relacionadas

Con los recientes avances en el campo de la inteligencia artificial, los Modelos de Lenguaje Grande, incluyendo GPT y LLaMa, están mostrando un rendimiento notable en un amplio espectro de tareas de lenguaje natural. Estos modelos han demostrado ser eficaces en diversos dominios y han avanzado significativamente en el procesamiento del lenguaje natural. Los modelos de lenguaje son capaces de recibir instrucciones de los seres humanos y llevar a cabo diferentes tareas. Sin embargo, tienen una desventaja, que es que tienen dificultades con las tareas que implican el conocimiento de tablas. Esto se debe a que su entrenamiento principal se basa en textos de lenguaje natural unidimensionales, mientras que las tablas son estructuras bidimensionales, lo que genera esta limitación.

Para abordar este problema, un equipo de investigadores ha propuesto el concepto de sintonización de tablas, una forma innovadora de aliviar esta dificultad. Este método implica entrenar u optimizar aún más los modelos de lenguaje preexistentes, como GPT-3.5 y ChatGPT, utilizando una amplia gama de tareas relacionadas con tablas derivadas de tablas reales. El objetivo principal de la sintonización de tablas es mejorar la capacidad de estos modelos de lenguaje para comprender y manipular tablas.

Los modelos de Table-GPT, que han sido generados mediante sintonización de tablas, muestran capacidades mejoradas en la comprensión de tablas. Estos modelos superan consistentemente a GPT-3.5 estándar y ChatGPT en una amplia gama de tareas basadas en tablas. Esto significa que pueden interpretar y manipular datos tabulares de manera más precisa. Los modelos Table-GPT mantienen un alto grado de generalización incluso si se especializan en trabajos con tablas. Pueden adaptarse a nuevas actividades que involucren tablas porque pueden reaccionar a una variedad de instrucciones humanas con eficacia. Esta flexibilidad es comparable a la capacidad de ChatGPT para administrar una variedad de tareas de lenguaje natural y al GPT-3.5 original.

Se han resumido las principales contribuciones de la siguiente manera.

Paradigma de Sintonización de Tablas: Se ha introducido el paradigma de sintonización de tablas, que consiste en entrenar modelos de lenguaje una vez más con el propósito expreso de mejorar su eficiencia en tareas que involucran tablas. Emplea una variedad de tareas basadas en tablas que se sintetizan a partir de tablas reales utilizando una metodología de sintetización y aumentación.

Enfoques de Aumentación de Datos: Se han desarrollado enfoques de aumentación de datos a nivel de tarea, table, instrucción y completado. Estos métodos son esenciales para mantener la capacidad de generalización de Table-GPT y evitar el sobreajuste. Al agregar valor al conjunto de entrenamiento, fortalecen el modelo.

Rendimiento en Tareas de Tablas: Desde el principio, Table-GPT demuestra una competencia excepcional en tareas basadas en tablas, tanto en escenarios de cero disparo como en escenarios de pocos disparos. Esto indica que el modelo puede realizar estas tareas de manera bastante buena, incluso con poco entrenamiento especializado o ejemplos.

La capacidad de adaptación de Table-GPT lo hace adecuado como modelo fundamental para tablas. Cuando se trata de optimizaciones de tareas específicas como el ajuste fino específico de la tarea y la ingeniería de indicaciones, puede ser un mejor punto de partida que el GPT convencional. Esto demuestra lo útil que es para una variedad de propósitos más allá del trabajo con tablas.

En resumen, el paradigma de sintonización de tablas propuesto proporciona una forma de superar la dificultad de enseñar a los modelos de lenguaje a utilizar tablas. Mejora su comprensión de las estructuras de datos bidimensionales y les brinda las herramientas necesarias para tener éxito en una amplia gama de trabajos relacionados con tablas, tanto conocidos como desconocidos.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

AI ShortsApplicationsartificial intelligenceComputer VisionEditors PickLanguage Model

Was this article helpful?

93 out of 132 found this helpful

Investigadores de Microsoft presentan Table-GPT Elevando modelos de lenguaje para destacar en la comprensión de tablas bidimensionales y tareas relacionadas.

Was this article helpful?

Solo usa LLMs si sabes cómo hacer la tarea por ti mismo/a

5 libros gratuitos para dominar el aprendizaje automático

Inteligencia Artificial

Un superordenador de inteligencia artificial cobra vida, impulsado por gigantes chips de computadora

Un cambio de paradigma en el desarrollo de software los agentes de inteligencia artificial AI de GPTConsole abren nuevos horizontes

Este boletín de inteligencia artificial es todo lo que necesitas #59

De Oppenheimer a la IA generativa Valiosas lecciones para las empresas de hoy

¿Cómo sabemos qué tan inteligentes son los sistemas de IA?

Investigadores del MIT y de FAIR Meta revelan RCG (Generación de imágenes condicionadas por la representación) un innovador marco de IA en la generación de imágenes sin condiciones de clase.