Una guía para científicos de datos para crear y utilizar makefiles

Guía para científicos de datos y makefiles

Cómo utilizar Make y Makefiles para optimizar tu pipeline de aprendizaje automático

Antecedentes

Ahora se espera que los científicos de datos escriban código de producción para implementar sus algoritmos de aprendizaje automático. Por lo tanto, debemos conocer los estándares y métodos de ingeniería de software para asegurar que nuestros modelos se implementen de manera robusta y efectiva. Una de las herramientas más conocidas en la comunidad de desarrolladores es make. Este es un poderoso comando de Linux que los desarrolladores conocen desde hace mucho tiempo y en este artículo quiero mostrar cómo se puede utilizar para construir pipelines de aprendizaje automático eficientes.

¿Qué es Make?

make es un comando/ejecutable de terminal, al igual que ls o cd, que se encuentra en la mayoría de los sistemas operativos tipo UNIX, como MacOS y Linux.

El uso de make es para simplificar y desglosar tu flujo de trabajo en un grupo lógico de comandos de shell.

Es ampliamente utilizado por los desarrolladores y también está siendo adoptado por los científicos de datos, ya que simplifica el pipeline de aprendizaje automático y permite una implementación de producción más robusta.

¿Por qué Make para la ciencia de datos?

make es una herramienta poderosa que los científicos de datos deben utilizar por las siguientes razones:

Automatizar la configuración de entornos de aprendizaje automático
Documentación más clara del pipeline de principio a fin
Más fácil probar modelos con diferentes parámetros
Estructura y ejecución obvias de tu proyecto

¿Qué es un Makefile?

Un Makefile es básicamente lo que los comandos make leen y ejecutan. Tiene tres componentes:

Objetivos: Estos son los archivos que estás intentando construir o tienes un objetivo PHONY si solo estás ejecutando comandos.
Dependencias: Archivos fuente que deben ejecutarse antes de que se ejecute este objetivo.
Comando: Como dice el nombre, esta es la lista de pasos para producir el objetivo.

Ejemplo básico

Vamos a ver un ejemplo muy sencillo para poner en práctica esta teoría.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Was this article helpful?

93 out of 132 found this helpful

Una guía para científicos de datos para crear y utilizar makefiles

Cómo utilizar Make y Makefiles para optimizar tu pipeline de aprendizaje automático

Antecedentes

¿Qué es Make?

¿Por qué Make para la ciencia de datos?

¿Qué es un Makefile?

Ejemplo básico

Was this article helpful?

Una guía para mejorar el rendimiento de tus juegos en máquinas virtuales

Los científicos de datos necesitan especializarse para sobrevivir al invierno tecnológico

Inteligencia Artificial

Investigadores de Microsoft presentan Hydra-RLHF Una solución eficiente en memoria para el aprendizaje por refuerzo con retroalimentación humana

Preguntas y respuestas Gabriela Sá Pessoa sobre la política brasileña, los derechos humanos en la Amazonía y la inteligencia artificial

Google DeepMind presenta AlphaCode 2 Un sistema de inteligencia artificial (IA) que utiliza el poder del modelo Gemini para un notable avance en la excelencia de la programación competitiva.

Esta revisión de investigación de IA explora la integración de imágenes satelitales y aprendizaje profundo para medir la pobreza basada en activos.

Principal Financial Group utiliza la solución de análisis posterior a la llamada de AWS para extraer información sobre los clientes omnicanal

Toma el control NVIDIA NeMo SteerLM permite a las empresas personalizar las respuestas de un modelo durante la inferencia