Reformando la memoria del modelo sin necesidad de volver a entrenarlo

Reformulando la memoria del modelo sin necesidad de reentrenamiento

| IA | GRANDES MODELOS DE LENGUAJE | DESAPRENDIZAJE DE MÁQUINAS |

Borrando cualquier eco de contenido problemático que un gran modelo de lenguaje haya aprendido

“Perdonar es sabiduría, olvidar es genio”. – Joyce Cary

Los grandes modelos de lenguaje (LLM, por sus siglas en inglés) se han convertido en un fenómeno mundial. En menos de un año, son omnipresentes y ahora son utilizados por millones de usuarios. Estos modelos a menudo se entrenan con grandes cantidades de texto (incluido material problemático y datos sensibles). ¿Cómo haces que un modelo olvide? ¿Lo mismo que podría almacenar la totalidad del conocimiento humano?

Aprender cómo olvidar

Los LLM son un testimonio tanto de nuestros logros como de los desafíos que tenemos por delante – fuente

Los grandes modelos de lenguaje han sorprendido tanto a los usuarios como a los investigadores con su capacidad para aprender de grandes cantidades de texto e identificar patrones de lenguaje y matices culturales. Si bien podrían ser la base de una nueva aplicación y una revolución científica, también tienen un lado oscuro.

Se deben utilizar enormes corpus para entrenar estos patrones. Si bien es cierto que cuanto mayor sea la cantidad de datos utilizados, mejor será el rendimiento de un LLM, recopilar estos datos es costoso. Para limitar los costos, a menudo se utiliza la extracción indiscriminada de datos de Internet. Estos corpus también contienen datos extremadamente problemáticos: textos con derechos de autor, datos tóxicos o maliciosos, contenido inexacto o falso, datos personales y más.

Desaprendizaje de máquinas: el deber de olvidar

Cómo y por qué es importante borrar la información de los puntos de datos de un modelo de IA

towardsdatascience.com

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Was this article helpful?

93 out of 132 found this helpful

Reformando la memoria del modelo sin necesidad de volver a entrenarlo

| IA | GRANDES MODELOS DE LENGUAJE | DESAPRENDIZAJE DE MÁQUINAS |

Borrando cualquier eco de contenido problemático que un gran modelo de lenguaje haya aprendido

Aprender cómo olvidar

Desaprendizaje de máquinas: el deber de olvidar

Cómo y por qué es importante borrar la información de los puntos de datos de un modelo de IA

Was this article helpful?

QLoRA Entrenando un Modelo de Lenguaje Grande en una GPU de 16GB.

¡Oh, ¿Querías decir Gestionar el cambio?

Inteligencia Artificial

Una nueva investigación de IA presenta GPT4RoI un modelo de visión y lenguaje basado en la sintonización de instrucciones de un Gran Modelo de Lenguaje (LLM) en pares de región-texto.

Tabnine presenta Tabnine Chat una aplicación de chat centrada en el código de grado empresarial en beta que permite a los desarrolladores interactuar con los modelos de IA de Tabnine utilizando lenguaje natural.

IBM presenta un chip de computadora inspirado en el cerebro que podría impulsar la inteligencia artificial (IA) al trabajar más rápido con mucha menos energía.

Abacus AI presenta un nuevo modelo de lenguaje grande de contexto largo y abierto (LLM) Conoce a Giraffe

¿Cómo funciona realmente la Difusión Estable? Una explicación intuitiva

Este boletín de inteligencia artificial es todo lo que necesitas #71