Conoce EasyEdit Un marco de inteligencia artificial de edición de conocimientos fácil de usar para LLMs.
EasyEdit es un marco de IA de edición de conocimientos fácil de usar para LLMs.
Necesitamos constantemente mantenernos al día en este mundo en constante cambio, al igual que los modelos de aprendizaje automático, para producir resultados precisos. Los modelos de lenguaje grandes a menudo sufren problemas de falacia; es decir, no son conscientes de eventos no vistos o generan texto con hechos incorrectos debido a datos desactualizados/ruidosos. Por ejemplo, los modelos de lenguaje grandes como ChatGPT y LlaMA solo poseen información hasta su último punto de entrenamiento, y esencialmente, necesitamos actualizar el conocimiento paramétrico dentro de los modelos de lenguaje grandes para modificar sus comportamientos específicos. Se han introducido numerosos métodos de edición de conocimiento o edición de modelos para realizar ediciones en los modelos de aprendizaje automático minimizando el impacto en las entradas no relacionadas.
Para abordar los desafíos persistentes basados en el corte de conocimiento/resultados sesgados, los investigadores han aplicado dos métodos principales:
- Ajuste fino: el ajuste fino tradicional y el ajuste delta utilizan conjuntos de datos específicos de dominio, pero consumen enormes recursos y corren el riesgo de un olvido catastrófico.
- Aumento de la consigna: cuando se proporcionan amplias demostraciones o contextos recopilados, los modelos de lenguaje grandes (LLMs) muestran la capacidad de mejorar sus capacidades de razonamiento y mejorar sus tareas de generación mediante la integración de conocimientos externos. El inconveniente de esta técnica es que puede ser sensible a factores como la plantilla de consigna y la selección de ejemplos en contexto.
Debido a las diferencias significativas entre los diversos métodos de edición de conocimiento y las variaciones en las configuraciones de tareas, no existe un marco de implementación estándar disponible. Para abordar estos problemas y proporcionar un marco unificado, los investigadores han presentado EASYEDIT, un marco de edición de conocimiento fácil de usar para LLMs. Admite enfoques de edición de conocimiento de vanguardia y se puede aplicar fácilmente a muchos LLMs conocidos como T5, GPT-J y LlaMA.
- Presentación de datos espaciales de forma interactiva con Story Maps #2
- Una Tienda Online Multilingüe de Prestashop Utilizando ChatGPT
- Promoviendo la participación del paciente Cómo las aplicaciones móviles revolucionan el desarrollo de software en el sector de la salud
La plataforma EASYEDIT presenta una interfaz de “edición” fácil de usar que permite modificar fácilmente el modelo. Con elementos clave como Hparams, Método y Evaluar, esta interfaz incorpora sin problemas diversas estrategias de edición de conocimiento. El mecanismo principal para implementar estas estrategias es la función APPLY_TO_MODEL, accesible a través de diferentes métodos. La figura anterior muestra una instancia de aplicación de MEND a LLaMA, alterando la salida del Presidente de los Estados Unidos a Joe Biden.
EASYEDIT emplea un enfoque modular para organizar los métodos de edición y evaluar su eficacia, teniendo en cuenta también su interacción y combinación. La plataforma se adapta a una variedad de escenarios de edición, que incluyen edición de una sola instancia, edición por lotes y edición secuencial. Además, realiza evaluaciones de métricas críticas como Confiabilidad, Generalización, Localidad y Portabilidad, que ayudan a los usuarios a identificar el método más adecuado adaptado a sus requisitos específicos.
Los resultados de edición de conocimiento en LlaMA-2 con EASYEDIT demuestran que la edición de conocimiento supera al ajuste fino tradicional en cuanto a confiabilidad y generalización. En conclusión, el marco EasyEdit surge como un avance fundamental en el ámbito de los grandes modelos de lenguaje (LLMs), abordando la necesidad crítica de una edición de conocimiento accesible e intuitiva.
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Crea videos virales de conversación con IA para ganar dinero en línea
- Conoce a SQLCoder Un nuevo modelo de código abierto y de última generación para convertir preguntas en lenguaje natural en consultas SQL
- La Pequeña Historia sobre la IA Generativa El Desafío de Dibujo
- Construyendo un Agente Conversacional con un Microservicio de Memoria con OpenAI y FastAPI
- Rastreador web de OpenAI y errores de la FTC
- Los 6 principales casos de uso de GPT-4
- Primeros 50 sesiones anunciadas para ODSC West 2023