Microsoft Research lanza el ‘Cuarteto de Heavy Metal’ de los compiladores de IA Rammer, Roller, Welder y Grinder
Microsoft Research lanza los compiladores de IA Rammer, Roller, Welder y Grinder, el 'Cuarteto de Heavy Metal'.
La evolución de los modelos de inteligencia artificial (IA) y los aceleradores de hardware ha traído desafíos únicos para los compiladores. Estos desafíos se derivan de la arquitectura en constante evolución de los modelos de IA, como la transición de RNN y CNN a modelos más recientes como Transformers, junto con los avances rápidos en aceleradores de hardware como GPUs y NPUs. Como resultado, la compilación eficiente se ha vuelto crucial para garantizar que estos nuevos modelos de IA puedan funcionar de manera efectiva en hardware moderno.
Los compiladores tradicionales de IA generalmente han enfrentado limitaciones al optimizar la ejecución de redes neuronales profundas (DNN). Los compiladores actuales tratan la computación de DNN como flujos de datos con funciones de biblioteca opacas, lo que resulta en una programación de dos niveles que incurre en una sobrecarga significativa y recursos de hardware subutilizados. Además, la partición de datos y la optimización del acceso a memoria para modelos de IA pueden llevar mucho tiempo.
Por último, la mayoría de los compiladores de IA se han centrado principalmente en optimizar la ejecución de flujos de datos, prestando atención a la ejecución eficiente del código de flujo de control dentro de los modelos de IA. Esta limitación afecta a los modelos con lógica de control compleja, obstaculizando su capacidad para aprovechar al máximo la aceleración de hardware.
- Las 50 mejores herramientas de escritura de IA para probar (septiembre de 2023)
- Python en Excel Abriendo la puerta al análisis avanzado de datos
- Cómo StackOverflow se está adaptando frente a la IA generativa
Un grupo de investigadores de Microsoft Research presentó un conjunto innovador de compiladores de IA llamados el “cuarteto de heavy metal”. Este cuarteto incluye a Rammer, Roller, Welder y Grinder, cada uno diseñado para abordar aspectos específicos de la compilación de IA.
- Rammer: Rammer redefine el espacio de programación para la compilación de IA como un plano bidimensional y optimiza la ejecución de cargas de trabajo de DNN en unidades de aceleración paralela masiva. Rammer minimiza la sobrecarga de programación en tiempo de ejecución al organizar tareas computacionales como “ladrillos” en este plano, mejorando significativamente la utilización del hardware.
- Roller: Roller optimiza la eficiencia de la compilación formulando estrategias eficientes para la partición de bloques de datos. Genera núcleos altamente optimizados en segundos, logrando una mejora de tres órdenes de magnitud en el tiempo de compilación en comparación con los compiladores existentes.
- Welder: Welder optimiza de manera integral la eficiencia del acceso a memoria para modelos de DNN, reduciendo la brecha entre el ancho de banda de memoria y la utilización del núcleo de cálculo. Logra mejoras de rendimiento notables en varios modelos de DNN y compiladores.
- Grinder: Grinder se enfoca en optimizar la ejecución de flujo de control dentro de los modelos de IA, integrando eficientemente el flujo de control en el flujo de datos para una ejecución eficiente en aceleradores de hardware. Logra mejoras sustanciales de velocidad para modelos de DNN con flujo de control intensivo.
El rendimiento del cuarteto se evaluó en varios dispositivos y modelos de IA. Rammer superó a los compiladores de vanguardia, logrando mejoras de velocidad de hasta 20.1 veces en GPUs. Roller demostró una reducción de tres órdenes de magnitud en el tiempo de compilación manteniendo un rendimiento competitivo. Welder superó los marcos y compiladores existentes hasta 21.4 veces, con mejoras aún más significativas en hardware con núcleos de cálculo más rápidos. Grinder logró una aceleración de hasta 8.2 veces en modelos de DNN con flujo de control intensivo, convirtiéndolo en el más rápido entre los compiladores de DNN para el flujo de control.
En conclusión, a medida que los modelos de IA y el hardware continúan evolucionando, el papel de los compiladores en garantizar una ejecución eficiente se vuelve aún más vital. Las contribuciones del cuarteto en este sentido abren el camino para una implementación de IA más efectiva en una variedad de aplicaciones, desde reconocimiento de imágenes hasta procesamiento de lenguaje natural (NLP), avanzando así las capacidades de la tecnología de IA en el mundo digital.
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- HubSpot presenta HubSpot AI y el nuevo Sales Hub en INBOUND 2023
- Aumentar la eficiencia matemática Navegando por las operaciones de matrices Numpy
- ¿Puede la IA realmente restaurar detalles faciales de imágenes de baja calidad? Conozca DAEFR un marco de doble rama para mejorar la calidad
- Este artículo de IA propone un método de generación de memoria recursivo para mejorar la consistencia conversacional a largo plazo en modelos de lenguaje grandes
- ¿Se entienden Do Flamingo y DALL-E? Explorando la simbiosis entre los modelos de generación de subtítulos de imágenes y síntesis de texto a imagen
- Investigadores de UCSC y TU Munich proponen RECAST un nuevo modelo basado en el aprendizaje profundo para predecir réplicas
- Preguntas, encogimientos de hombros y lo que viene después Un cuarto de siglo de cambio