¿Cómo elimina el nuevo paradigma de Google AI el costo de composición en algoritmos de aprendizaje automático de múltiples pasos para una mayor utilidad?
¿Cómo elimina Google AI el costo de composición en algoritmos de aprendizaje automático de múltiples pasos?
En el panorama actual impulsado por datos, garantizar la privacidad al tiempo que se maximiza la utilidad de los algoritmos de aprendizaje automático y análisis de datos ha sido un desafío apremiante. El costo de la composición, un fenómeno donde la garantía general de privacidad se deteriora con múltiples pasos de cálculo, ha sido un obstáculo significativo. A pesar de los avances en la investigación fundamental y la adopción de la privacidad diferencial, encontrar el equilibrio adecuado entre privacidad y utilidad ha sido esquivo.
Enfoques existentes como DP-SGD han logrado avances en la preservación de la privacidad durante el entrenamiento de modelos de aprendizaje automático. Sin embargo, dependen de la partición aleatoria de ejemplos de entrenamiento en mini lotes, lo que limita su efectividad en escenarios donde se necesita una selección dependiente de los datos.
Conozca el paradigma Reorder-Slice-Compute (RSC), un desarrollo innovador presentado en STOC 2023. Este marco innovador ofrece una solución que permite la selección adaptativa de rebanadas y evita el costo de la composición. Al adherirse a una estructura específica que involucra puntos de datos ordenados, tamaño de las rebanadas y un algoritmo de privacidad diferencial, el paradigma RSC abre nuevas oportunidades para mejorar la utilidad sin comprometer la privacidad.
- Una nueva investigación de IA de Tel Aviv y la Universidad de Copenhague introduce un enfoque de conectar y usar para ajustar rápidamente modelos de difusión de texto a imagen utilizando una señal discriminativa.
- Investigadores de Google AI presentan MADLAD-400 un conjunto de datos de dominio web con tokens de 2.8T que abarca 419 idiomas.
- Este artículo de Alibaba Group presenta FederatedScope-LLM un paquete integral para el ajuste fino de LLMs en el aprendizaje federado
Las métricas de investigaciones y experimentos extensos demuestran el poder del paradigma RSC. A diferencia de los enfoques tradicionales, el análisis RSC elimina la dependencia del número de pasos, lo que resulta en una garantía general de privacidad comparable a la de un solo paso. Este avance mejora significativamente la utilidad de los algoritmos de privacidad diferencial para una variedad de tareas fundamentales de agregación y aprendizaje.
Una destacada aplicación del paradigma RSC radica en resolver el problema de punto de intervalo privado. Mediante la selección inteligente de rebanadas y el aprovechamiento de un análisis novedoso, el algoritmo RSC logra soluciones preservadoras de la privacidad con un orden de log*|X| puntos, cerrando una brecha significativa en los algoritmos de privacidad diferencial anteriores.
El paradigma RSC también aborda tareas comunes de agregación como la mediana aproximada privada y el aprendizaje privado de rectángulos alineados con los ejes. Mediante el empleo de una secuencia de pasos RSC adaptados al problema específico, el algoritmo limita los puntos mal etiquetados, ofreciendo resultados precisos y privados.
Además, el paradigma RSC ofrece un enfoque revolucionario para el entrenamiento de modelos de aprendizaje automático. Al permitir la selección dependiente de los datos en el orden de los ejemplos de entrenamiento, se integra perfectamente con DP-SGD, eliminando el deterioro de la privacidad asociado con la composición. Este avance está destinado a revolucionar la eficiencia del entrenamiento en entornos de producción.
En conclusión, el paradigma Reorder-Slice-Compute (RSC) es una solución transformadora para el desafío de largo plazo de equilibrar la privacidad y la utilidad en entornos impulsados por datos. Su estructura única y análisis novedoso prometen desbloquear nuevas posibilidades en diversas tareas de agregación y aprendizaje. El paradigma RSC allana el camino para un entrenamiento de modelos de aprendizaje automático más eficiente y preservador de la privacidad al eliminar el costo de la composición. Este cambio de paradigma marca un momento crucial en la búsqueda de una sólida privacidad de datos en la era del big data.
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Una técnica de mapeo de posturas podría evaluar de forma remota a pacientes con parálisis cerebral
- Desplegando modelos de PyTorch con el servidor de inferencia Nvidia Triton
- Cómo construir gráficos de cascada con Plotly Graph Objects
- ¡Pide tus documentos con Langchain y Deep Lake!
- Inteligencia Artificial y la Estética de la Generación de Imágenes
- Hoja de referencia de Scikit-learn para Aprendizaje Automático
- Conoce FLM-101B Un decodificador de solo lectura de LLM de código abierto con 101 mil millones de parámetros