Microsoft Research lanza el ‘Cuarteto de Heavy Metal’ de los compiladores de IA Rammer, Roller, Welder y Grinder

Microsoft Research lanza los compiladores de IA Rammer, Roller, Welder y Grinder, el 'Cuarteto de Heavy Metal'.

La evolución de los modelos de inteligencia artificial (IA) y los aceleradores de hardware ha traído desafíos únicos para los compiladores. Estos desafíos se derivan de la arquitectura en constante evolución de los modelos de IA, como la transición de RNN y CNN a modelos más recientes como Transformers, junto con los avances rápidos en aceleradores de hardware como GPUs y NPUs. Como resultado, la compilación eficiente se ha vuelto crucial para garantizar que estos nuevos modelos de IA puedan funcionar de manera efectiva en hardware moderno.

Los compiladores tradicionales de IA generalmente han enfrentado limitaciones al optimizar la ejecución de redes neuronales profundas (DNN). Los compiladores actuales tratan la computación de DNN como flujos de datos con funciones de biblioteca opacas, lo que resulta en una programación de dos niveles que incurre en una sobrecarga significativa y recursos de hardware subutilizados. Además, la partición de datos y la optimización del acceso a memoria para modelos de IA pueden llevar mucho tiempo.

Por último, la mayoría de los compiladores de IA se han centrado principalmente en optimizar la ejecución de flujos de datos, prestando atención a la ejecución eficiente del código de flujo de control dentro de los modelos de IA. Esta limitación afecta a los modelos con lógica de control compleja, obstaculizando su capacidad para aprovechar al máximo la aceleración de hardware.

Un grupo de investigadores de Microsoft Research presentó un conjunto innovador de compiladores de IA llamados el “cuarteto de heavy metal”. Este cuarteto incluye a Rammer, Roller, Welder y Grinder, cada uno diseñado para abordar aspectos específicos de la compilación de IA.

  • Rammer: Rammer redefine el espacio de programación para la compilación de IA como un plano bidimensional y optimiza la ejecución de cargas de trabajo de DNN en unidades de aceleración paralela masiva. Rammer minimiza la sobrecarga de programación en tiempo de ejecución al organizar tareas computacionales como “ladrillos” en este plano, mejorando significativamente la utilización del hardware.
  • Roller: Roller optimiza la eficiencia de la compilación formulando estrategias eficientes para la partición de bloques de datos. Genera núcleos altamente optimizados en segundos, logrando una mejora de tres órdenes de magnitud en el tiempo de compilación en comparación con los compiladores existentes.
  • Welder: Welder optimiza de manera integral la eficiencia del acceso a memoria para modelos de DNN, reduciendo la brecha entre el ancho de banda de memoria y la utilización del núcleo de cálculo. Logra mejoras de rendimiento notables en varios modelos de DNN y compiladores.
  • Grinder: Grinder se enfoca en optimizar la ejecución de flujo de control dentro de los modelos de IA, integrando eficientemente el flujo de control en el flujo de datos para una ejecución eficiente en aceleradores de hardware. Logra mejoras sustanciales de velocidad para modelos de DNN con flujo de control intensivo.

El rendimiento del cuarteto se evaluó en varios dispositivos y modelos de IA. Rammer superó a los compiladores de vanguardia, logrando mejoras de velocidad de hasta 20.1 veces en GPUs. Roller demostró una reducción de tres órdenes de magnitud en el tiempo de compilación manteniendo un rendimiento competitivo. Welder superó los marcos y compiladores existentes hasta 21.4 veces, con mejoras aún más significativas en hardware con núcleos de cálculo más rápidos. Grinder logró una aceleración de hasta 8.2 veces en modelos de DNN con flujo de control intensivo, convirtiéndolo en el más rápido entre los compiladores de DNN para el flujo de control.

En conclusión, a medida que los modelos de IA y el hardware continúan evolucionando, el papel de los compiladores en garantizar una ejecución eficiente se vuelve aún más vital. Las contribuciones del cuarteto en este sentido abren el camino para una implementación de IA más efectiva en una variedad de aplicaciones, desde reconocimiento de imágenes hasta procesamiento de lenguaje natural (NLP), avanzando así las capacidades de la tecnología de IA en el mundo digital.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Aprendizaje Automático

AI Ve lo que tú Ves Mind's Eye es un Modelo de IA que Puede Reconstruir Escaneos Cerebrales en Imágenes.

Desde hace tiempo, nos ha intrigado el desafío de entender cómo funciona nuestro cerebro. El campo de la neurociencia...

Inteligencia Artificial

La inteligencia artificial ayuda a los robots domésticos a reducir a la mitad el tiempo de planificación

PIGINet utiliza el aprendizaje automático para simplificar y mejorar la planificación de tareas y movimientos de los ...

Inteligencia Artificial

Clave maestra para la separación de fuentes de audio Presentamos AudioSep para separar cualquier cosa que describas

La Análisis de Escena Auditiva Computacional (CASA, por sus siglas en inglés) es un campo dentro del procesamiento de...

Investigación

Diseñar coches eléctricos ahora es más rápido con la IA de Toyota.

El Instituto de Investigación de Toyota (TRI) ha hecho un anuncio en el mundo del diseño de vehículos. Han presentado...

Inteligencia Artificial

Conoce GPTCache una biblioteca para desarrollar una caché semántica de consultas LLM.

ChatGPT y los modelos de lenguaje grandes (LLMs) son extremadamente flexibles, lo que permite la creación de numeroso...