Microsoft Research lanza el ‘Cuarteto de Heavy Metal’ de los compiladores de IA Rammer, Roller, Welder y Grinder

Microsoft Research lanza los compiladores de IA Rammer, Roller, Welder y Grinder, el 'Cuarteto de Heavy Metal'.

La evolución de los modelos de inteligencia artificial (IA) y los aceleradores de hardware ha traído desafíos únicos para los compiladores. Estos desafíos se derivan de la arquitectura en constante evolución de los modelos de IA, como la transición de RNN y CNN a modelos más recientes como Transformers, junto con los avances rápidos en aceleradores de hardware como GPUs y NPUs. Como resultado, la compilación eficiente se ha vuelto crucial para garantizar que estos nuevos modelos de IA puedan funcionar de manera efectiva en hardware moderno.

Los compiladores tradicionales de IA generalmente han enfrentado limitaciones al optimizar la ejecución de redes neuronales profundas (DNN). Los compiladores actuales tratan la computación de DNN como flujos de datos con funciones de biblioteca opacas, lo que resulta en una programación de dos niveles que incurre en una sobrecarga significativa y recursos de hardware subutilizados. Además, la partición de datos y la optimización del acceso a memoria para modelos de IA pueden llevar mucho tiempo.

Por último, la mayoría de los compiladores de IA se han centrado principalmente en optimizar la ejecución de flujos de datos, prestando atención a la ejecución eficiente del código de flujo de control dentro de los modelos de IA. Esta limitación afecta a los modelos con lógica de control compleja, obstaculizando su capacidad para aprovechar al máximo la aceleración de hardware.

Un grupo de investigadores de Microsoft Research presentó un conjunto innovador de compiladores de IA llamados el “cuarteto de heavy metal”. Este cuarteto incluye a Rammer, Roller, Welder y Grinder, cada uno diseñado para abordar aspectos específicos de la compilación de IA.

Rammer: Rammer redefine el espacio de programación para la compilación de IA como un plano bidimensional y optimiza la ejecución de cargas de trabajo de DNN en unidades de aceleración paralela masiva. Rammer minimiza la sobrecarga de programación en tiempo de ejecución al organizar tareas computacionales como “ladrillos” en este plano, mejorando significativamente la utilización del hardware.
Roller: Roller optimiza la eficiencia de la compilación formulando estrategias eficientes para la partición de bloques de datos. Genera núcleos altamente optimizados en segundos, logrando una mejora de tres órdenes de magnitud en el tiempo de compilación en comparación con los compiladores existentes.
Welder: Welder optimiza de manera integral la eficiencia del acceso a memoria para modelos de DNN, reduciendo la brecha entre el ancho de banda de memoria y la utilización del núcleo de cálculo. Logra mejoras de rendimiento notables en varios modelos de DNN y compiladores.
Grinder: Grinder se enfoca en optimizar la ejecución de flujo de control dentro de los modelos de IA, integrando eficientemente el flujo de control en el flujo de datos para una ejecución eficiente en aceleradores de hardware. Logra mejoras sustanciales de velocidad para modelos de DNN con flujo de control intensivo.

El rendimiento del cuarteto se evaluó en varios dispositivos y modelos de IA. Rammer superó a los compiladores de vanguardia, logrando mejoras de velocidad de hasta 20.1 veces en GPUs. Roller demostró una reducción de tres órdenes de magnitud en el tiempo de compilación manteniendo un rendimiento competitivo. Welder superó los marcos y compiladores existentes hasta 21.4 veces, con mejoras aún más significativas en hardware con núcleos de cálculo más rápidos. Grinder logró una aceleración de hasta 8.2 veces en modelos de DNN con flujo de control intensivo, convirtiéndolo en el más rápido entre los compiladores de DNN para el flujo de control.

En conclusión, a medida que los modelos de IA y el hardware continúan evolucionando, el papel de los compiladores en garantizar una ejecución eficiente se vuelve aún más vital. Las contribuciones del cuarteto en este sentido abren el camino para una implementación de IA más efectiva en una variedad de aplicaciones, desde reconocimiento de imágenes hasta procesamiento de lenguaje natural (NLP), avanzando así las capacidades de la tecnología de IA en el mundo digital.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

AI Shortsartificial intelligenceEditors PickTech NewsTechnologyUncategorized

Was this article helpful?

93 out of 132 found this helpful

Microsoft Research lanza el ‘Cuarteto de Heavy Metal’ de los compiladores de IA Rammer, Roller, Welder y Grinder

Was this article helpful?

Las 50 mejores herramientas de escritura de IA para probar (septiembre de 2023)

Training a un Agente para Dominar un Juego Simple a través de Juego Autónomo

Inteligencia Artificial

AI Ve lo que tú Ves Mind's Eye es un Modelo de IA que Puede Reconstruir Escaneos Cerebrales en Imágenes.

La inteligencia artificial ayuda a los robots domésticos a reducir a la mitad el tiempo de planificación

Clave maestra para la separación de fuentes de audio Presentamos AudioSep para separar cualquier cosa que describas

Diseñar coches eléctricos ahora es más rápido con la IA de Toyota.

Conoce GPTCache una biblioteca para desarrollar una caché semántica de consultas LLM.

Investigadores de la Universidad de Pennsylvania han desarrollado un marco de aprendizaje automático para evaluar la eficacia de las características de inteligencia artificial basadas en la visión mediante la realización de una serie de pruebas en