Conoce EasyEdit Un marco de inteligencia artificial de edición de conocimientos fácil de usar para LLMs.

EasyEdit es un marco de IA de edición de conocimientos fácil de usar para LLMs.

Necesitamos constantemente mantenernos al día en este mundo en constante cambio, al igual que los modelos de aprendizaje automático, para producir resultados precisos. Los modelos de lenguaje grandes a menudo sufren problemas de falacia; es decir, no son conscientes de eventos no vistos o generan texto con hechos incorrectos debido a datos desactualizados/ruidosos. Por ejemplo, los modelos de lenguaje grandes como ChatGPT y LlaMA solo poseen información hasta su último punto de entrenamiento, y esencialmente, necesitamos actualizar el conocimiento paramétrico dentro de los modelos de lenguaje grandes para modificar sus comportamientos específicos. Se han introducido numerosos métodos de edición de conocimiento o edición de modelos para realizar ediciones en los modelos de aprendizaje automático minimizando el impacto en las entradas no relacionadas.

Para abordar los desafíos persistentes basados en el corte de conocimiento/resultados sesgados, los investigadores han aplicado dos métodos principales:

  • Ajuste fino: el ajuste fino tradicional y el ajuste delta utilizan conjuntos de datos específicos de dominio, pero consumen enormes recursos y corren el riesgo de un olvido catastrófico.
  • Aumento de la consigna: cuando se proporcionan amplias demostraciones o contextos recopilados, los modelos de lenguaje grandes (LLMs) muestran la capacidad de mejorar sus capacidades de razonamiento y mejorar sus tareas de generación mediante la integración de conocimientos externos. El inconveniente de esta técnica es que puede ser sensible a factores como la plantilla de consigna y la selección de ejemplos en contexto.

Debido a las diferencias significativas entre los diversos métodos de edición de conocimiento y las variaciones en las configuraciones de tareas, no existe un marco de implementación estándar disponible. Para abordar estos problemas y proporcionar un marco unificado, los investigadores han presentado EASYEDIT, un marco de edición de conocimiento fácil de usar para LLMs. Admite enfoques de edición de conocimiento de vanguardia y se puede aplicar fácilmente a muchos LLMs conocidos como T5, GPT-J y LlaMA.

https://arxiv.org/abs/2308.07269

La plataforma EASYEDIT presenta una interfaz de “edición” fácil de usar que permite modificar fácilmente el modelo. Con elementos clave como Hparams, Método y Evaluar, esta interfaz incorpora sin problemas diversas estrategias de edición de conocimiento. El mecanismo principal para implementar estas estrategias es la función APPLY_TO_MODEL, accesible a través de diferentes métodos. La figura anterior muestra una instancia de aplicación de MEND a LLaMA, alterando la salida del Presidente de los Estados Unidos a Joe Biden.

EASYEDIT emplea un enfoque modular para organizar los métodos de edición y evaluar su eficacia, teniendo en cuenta también su interacción y combinación. La plataforma se adapta a una variedad de escenarios de edición, que incluyen edición de una sola instancia, edición por lotes y edición secuencial. Además, realiza evaluaciones de métricas críticas como Confiabilidad, Generalización, Localidad y Portabilidad, que ayudan a los usuarios a identificar el método más adecuado adaptado a sus requisitos específicos.

Los resultados de edición de conocimiento en LlaMA-2 con EASYEDIT demuestran que la edición de conocimiento supera al ajuste fino tradicional en cuanto a confiabilidad y generalización. En conclusión, el marco EasyEdit surge como un avance fundamental en el ámbito de los grandes modelos de lenguaje (LLMs), abordando la necesidad crítica de una edición de conocimiento accesible e intuitiva.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Aprendizaje Automático

Conoce a FastSAM La solución revolucionaria en tiempo real que logra una segmentación de alto rendimiento con una carga computacional mínima.

El Modelo Segment Anything (SAM) es una propuesta más reciente en el campo. Es un concepto fundamental en la visión q...

Ciencias de la Computación

Robots de entrega de comida de Uber Eats listos para ser utilizados en múltiples ciudades de EE. UU.

La compañía de robots de servicio Serve Robotics informó que Uber Eats desplegará hasta 2,000 de sus robots de entreg...

Inteligencia Artificial

Mejorando el procesamiento inteligente de documentos de AWS con IA generativa

La clasificación, extracción y análisis de datos puede ser un desafío para las organizaciones que manejan volúmenes d...

Aprendizaje Automático

¿Qué es Machine Learning como Servicio? Beneficios y principales plataformas de MLaaS.

El aprendizaje automático utiliza análisis estadísticos para generar resultados de predicción sin requerir programaci...

Inteligencia Artificial

Conoce a CityDreamer Un modelo generativo compositivo para ciudades 3D ilimitadas

La creación de entornos naturales en 3D ha sido objeto de mucha investigación en los últimos años. Se han realizado a...

Ciencia de Datos

La guía de campo de datos sintéticos

Si quieres trabajar con datos, ¿cuáles son tus opciones? Aquí tienes una respuesta lo más general posible podrías obt...