Este artículo de Alibaba Group presenta FederatedScope-LLM un paquete integral para el ajuste fino de LLMs en el aprendizaje federado

Alibaba Group presenta FederatedScope-LLM, un paquete integral para ajuste fino de LLMs en el aprendizaje federado.

Hoy en día, plataformas como Hugging Face han facilitado el acceso y la utilización de Modelos de Lenguaje de Gran Tamaño (LLMs, por sus siglas en inglés) pre-entrenados a una amplia gama de usuarios, desde investigadores de IA hasta aquellos con experiencia limitada en aprendizaje automático, para diferentes entidades. Cuando múltiples organizaciones o entidades comparten tareas de interés similares pero no pueden intercambiar directamente sus datos locales debido a regulaciones de privacidad, el aprendizaje federado (FL) se presenta como una solución prominente para aprovechar los datos colectivos de estas entidades. El FL también proporciona una sólida protección de privacidad, mantiene seguras sus ideas de modelo y les permite crear modelos personalizados utilizando diferentes métodos.

En este trabajo, los investigadores han establecido un completo flujo de trabajo de referencia de extremo a extremo, optimizando los procesos de preprocesamiento de conjuntos de datos, ejecución o simulación de ajuste fino federado y evaluación del rendimiento en el contexto del ajuste fino federado de Modelos de Lenguaje de Gran Tamaño (LLM), diseñado para diversos propósitos de demostración de capacidad.

La imagen anterior muestra la arquitectura de FS-LLM, que consta de tres módulos principales: LLMBENCHMARKS, LLM-ALGZOO y LLM-TRAINER. El equipo ha desarrollado implementaciones sólidas de algoritmos de ajuste fino federado eficientes en términos de parámetros (PEFT) e interfaces de programación versátiles para facilitar futuras extensiones, permitiendo que los LLMs operen de manera efectiva en escenarios de Aprendizaje Federado (FL) con una comunicación y una carga computacional mínimas, incluso al tratar con LLMs de código cerrado.

En su página web se proporciona un tutorial detallado: federatedscope.io

Puedes probar FederatedScope a través de FederatedScope Playground o Google Colab.

Su enfoque también incorpora técnicas de aceleración y estrategias eficientes en recursos para ajustar finamente los LLMs bajo restricciones de recursos, junto con subrutinas de enchufabilidad flexibles para investigaciones interdisciplinarias, como la aplicación de LLMs en entornos de Aprendizaje Federado personalizados.

La investigación incluye una serie de experimentos extensos y reproducibles que validan la efectividad de FS-LLM y establecen puntos de referencia para LLMs avanzados, utilizando algoritmos de ajuste fino eficientes en términos de parámetros de última generación en un contexto federado. Basándonos en los hallazgos de estos resultados experimentales, delineamos algunas direcciones prometedoras para futuras investigaciones en el ajuste fino federado de LLMs para avanzar en la comunidad de FL y LLM.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Ciencia de Datos

La IA se está comiendo la Ciencia de Datos.

Cuando todo esté dicho y hecho, y la Inteligencia Artificial haya sido universalmente reconocida como nuestros legíti...

Inteligencia Artificial

Más allá de Photoshop Cómo Inst-Inpaint está revolucionando la eliminación de objetos con modelos de difusión

El inpainting de imágenes es un arte antiguo. Es el proceso de eliminar objetos no deseados y rellenar píxeles faltan...

Inteligencia Artificial

Robot humanoide puede pilotar un avión mejor que un humano

Ingenieros e investigadores están desarrollando un robot humanoide que puede volar aviones sin necesidad de modificac...

Ciencias de la Computación

Singapur planea una red nacional para protegerse contra futuras amenazas cuánticas.

Las empresas de telecomunicaciones en Singapur planean renovar las redes de fibra existentes para protegerse a sí mis...

Inteligencia Artificial

Abacus AI presenta un nuevo modelo de lenguaje grande de contexto largo y abierto (LLM) Conoce a Giraffe

Los modelos de lenguaje recientes pueden tomar contextos largos como entrada; se necesita más información sobre cómo ...