Conoce EasyEdit Un marco de inteligencia artificial de edición de conocimientos fácil de usar para LLMs.

EasyEdit es un marco de IA de edición de conocimientos fácil de usar para LLMs.

Necesitamos constantemente mantenernos al día en este mundo en constante cambio, al igual que los modelos de aprendizaje automático, para producir resultados precisos. Los modelos de lenguaje grandes a menudo sufren problemas de falacia; es decir, no son conscientes de eventos no vistos o generan texto con hechos incorrectos debido a datos desactualizados/ruidosos. Por ejemplo, los modelos de lenguaje grandes como ChatGPT y LlaMA solo poseen información hasta su último punto de entrenamiento, y esencialmente, necesitamos actualizar el conocimiento paramétrico dentro de los modelos de lenguaje grandes para modificar sus comportamientos específicos. Se han introducido numerosos métodos de edición de conocimiento o edición de modelos para realizar ediciones en los modelos de aprendizaje automático minimizando el impacto en las entradas no relacionadas.

Para abordar los desafíos persistentes basados en el corte de conocimiento/resultados sesgados, los investigadores han aplicado dos métodos principales:

Ajuste fino: el ajuste fino tradicional y el ajuste delta utilizan conjuntos de datos específicos de dominio, pero consumen enormes recursos y corren el riesgo de un olvido catastrófico.
Aumento de la consigna: cuando se proporcionan amplias demostraciones o contextos recopilados, los modelos de lenguaje grandes (LLMs) muestran la capacidad de mejorar sus capacidades de razonamiento y mejorar sus tareas de generación mediante la integración de conocimientos externos. El inconveniente de esta técnica es que puede ser sensible a factores como la plantilla de consigna y la selección de ejemplos en contexto.

Debido a las diferencias significativas entre los diversos métodos de edición de conocimiento y las variaciones en las configuraciones de tareas, no existe un marco de implementación estándar disponible. Para abordar estos problemas y proporcionar un marco unificado, los investigadores han presentado EASYEDIT, un marco de edición de conocimiento fácil de usar para LLMs. Admite enfoques de edición de conocimiento de vanguardia y se puede aplicar fácilmente a muchos LLMs conocidos como T5, GPT-J y LlaMA.

La plataforma EASYEDIT presenta una interfaz de “edición” fácil de usar que permite modificar fácilmente el modelo. Con elementos clave como Hparams, Método y Evaluar, esta interfaz incorpora sin problemas diversas estrategias de edición de conocimiento. El mecanismo principal para implementar estas estrategias es la función APPLY_TO_MODEL, accesible a través de diferentes métodos. La figura anterior muestra una instancia de aplicación de MEND a LLaMA, alterando la salida del Presidente de los Estados Unidos a Joe Biden.

EASYEDIT emplea un enfoque modular para organizar los métodos de edición y evaluar su eficacia, teniendo en cuenta también su interacción y combinación. La plataforma se adapta a una variedad de escenarios de edición, que incluyen edición de una sola instancia, edición por lotes y edición secuencial. Además, realiza evaluaciones de métricas críticas como Confiabilidad, Generalización, Localidad y Portabilidad, que ayudan a los usuarios a identificar el método más adecuado adaptado a sus requisitos específicos.

Los resultados de edición de conocimiento en LlaMA-2 con EASYEDIT demuestran que la edición de conocimiento supera al ajuste fino tradicional en cuanto a confiabilidad y generalización. En conclusión, el marco EasyEdit surge como un avance fundamental en el ámbito de los grandes modelos de lenguaje (LLMs), abordando la necesidad crítica de una edición de conocimiento accesible e intuitiva.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

AI ShortsApplicationsartificial intelligenceEditors PickLanguage ModelLarge Language ModelMachine LearningStaffTech NewsTechnologyUncategorized

Was this article helpful?

93 out of 132 found this helpful

Conoce EasyEdit Un marco de inteligencia artificial de edición de conocimientos fácil de usar para LLMs.

Was this article helpful?

Presentación de datos espaciales de forma interactiva con Story Maps #2

Tres gráficos para representar un porcentaje que quizás no conozcas

Inteligencia Artificial

Conoce a FastSAM La solución revolucionaria en tiempo real que logra una segmentación de alto rendimiento con una carga computacional mínima.

Robots de entrega de comida de Uber Eats listos para ser utilizados en múltiples ciudades de EE. UU.

Mejorando el procesamiento inteligente de documentos de AWS con IA generativa

¿Qué es Machine Learning como Servicio? Beneficios y principales plataformas de MLaaS.

Conoce a CityDreamer Un modelo generativo compositivo para ciudades 3D ilimitadas

La guía de campo de datos sintéticos