Investigadores de ETH Zurich y Microsoft presentan SCREWS Un marco de inteligencia artificial para mejorar el razonamiento en modelos de lenguaje grandes.
Investigadores de ETH Zurich y Microsoft presentan SCREWS Un marco de inteligencia artificial para potenciar el razonamiento en modelos de lenguaje amplios.
Los grandes modelos de lenguaje (LLMs) han tenido éxito en varias tareas de razonamiento diferentes. Para garantizar que se logre el objetivo deseado, a veces es necesario ajustar de manera iterativa los resultados del LLM porque la salida solo es ocasionalmente precisa en el primer intento. Estas técnicas de refinamiento asumen que los resultados consecutivos (del mismo modelo, un modelo externo o alguna herramienta) resultan en un mejor rendimiento. Sin embargo, no hay garantía de que las versiones posteriores siempre sean mejores, como se muestra en la Figura 1, el refinamiento puede resultar en un falso positivo. Esto alienta al modelo a elegir un resultado anterior utilizando la técnica de selección. Además, las investigaciones anteriores sobre refinamiento iterativo suelen utilizar una técnica de razonamiento única y fija. Pero los humanos son más adaptables.
Figura 1: Un estudio de caso ilustrativo de cómo la remuestreo condicional (también conocida como “refinamiento”) puede provocar una modificación incorrecta de la respuesta inicial. La respuesta original, que en este caso es correcta, puede ser elegida por un módulo de selección en lugar de la alteración.
Un gerente de producto puede utilizar una técnica de lluvia de ideas para generar varias ideas antes de pasar a una técnica de priorización para clasificarlas según su viabilidad o efecto. De manera similar, un estudiante que se prepara para un examen puede utilizar el razonamiento deductivo para responder preguntas y el razonamiento inductivo para confirmar los resultados. Esto sugiere una estrategia modular para responder a los refinamientos, lo que nos permite probar diferentes tácticas. En este artículo, investigadores de ETH Zurich y Microsoft Semantic Machines presentan SCREWS, un marco modular para razonar sobre cambios. El muestreo, el remuestreo condicional y la selección son los tres componentes principales de la arquitectura que se presentan en detalle en la Figura 2. Instancian SCREWS mediante la fijación de los submódulos para cada módulo (por ejemplo, pueden elegir “Cadena de pensamiento” para el muestreo). Esto se hace para un trabajo específico y una secuencia de entrada.
- Investigadores de Stanford presentan un novedoso método de inteligencia artificial que puede descomponer eficaz y eficientemente el sombreado en una representación estructurada en forma de árbol’.
- Investigadores del Instituto de Tecnología Shibaura revolucionan la detección de la dirección del rostro con Aprendizaje Profundo navegando los desafíos de las características faciales ocultas y ampliando los ángulos del horizonte.
- Conoce ConceptGraphs Una representación gráfica estructurada de vocabulario abierto para escenas en 3D
Figura 2 presenta una imagen de alto nivel del sistema modular SCREWS para razonar sobre revisiones. Las tres cajas sustanciales (o “módulos”) contienen varias opciones (o “submódulos”). Muchos esfuerzos anteriores, como Self-Refine, Least to Most, LLMs Know (Mostly), Self-Consistency, Self-Improve, PHP CoT, Self-Correct, Socratic CoT, Programme of Thoughts y muchos más, se pueden ver como ejemplos del marco de trabajo. (…) denota componentes adicionales que se pueden agregar a cada módulo, incluyendo, pero no limitado a, memoria en caché o búsqueda en línea para el módulo de muestreo, un modelo ajustado o un verificador externo para el remuestreo condicional y selección basada en humanos o un oráculo para el módulo de selección.
Las primeras salidas del muestreo se entregan al remuestreo condicional, que determina si crear una revisión en función de la muestra original y lo hace si es necesario. Luego, el módulo de selección elige el mejor de todas las muestras y revisiones. Dado el diseño modular de su marco de trabajo, se pueden utilizar elementos adicionales del marco para mejorar varios enfoques de auto-refinamiento recientemente propuestos. Un ejemplo es la combinación de su técnica de selección basada en el modelo y el método de auto-refinamiento, lo que puede mejorar el rendimiento general. Utilizan ChatGPT o GPT-4 para evaluar SCREWS en varias tareas de razonamiento, incluyendo preguntas de múltiples saltos, razonamiento aritmético y depuración de código.
En comparación con los procedimientos de muestra estándar y muestreo repetido, sus soluciones sugeridas producen mejoras significativas (10-15%). Demuestran el valor del muestreo heterogéneo, mostrando cómo puede influir en la lógica del modelo y mejorar sustancialmente las líneas de base a un costo total muy bajo. También explican la importancia de un enfoque de selección basado en el modelo, un elemento crucial de los modelos lineales mixtos contemporáneos que permite al modelo volver a salidas anteriores, más seguras.
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Una actualización sobre los controles del editor web
- ¡Es posible la exploración multi-dimensional!
- Usar con más frecuencia
- Retro-ingeniería de un esquema de base de datos GPT vs. Bard vs. LLama2 (Episodio 2)
- Tipos de Edge ML y casos de uso empresariales
- Explorando el fascinante mundo de la coloración de grafos
- Acelere su pronóstico de series temporales en un 50 por ciento con Amazon SageMaker Canvas UI y las API de AutoML.