Una guía para científicos de datos para crear y utilizar makefiles

Guía para científicos de datos y makefiles

Cómo utilizar Make y Makefiles para optimizar tu pipeline de aprendizaje automático

Foto de Nubelson Fernandes en Unsplash

Antecedentes

Ahora se espera que los científicos de datos escriban código de producción para implementar sus algoritmos de aprendizaje automático. Por lo tanto, debemos conocer los estándares y métodos de ingeniería de software para asegurar que nuestros modelos se implementen de manera robusta y efectiva. Una de las herramientas más conocidas en la comunidad de desarrolladores es make. Este es un poderoso comando de Linux que los desarrolladores conocen desde hace mucho tiempo y en este artículo quiero mostrar cómo se puede utilizar para construir pipelines de aprendizaje automático eficientes.

¿Qué es Make?

make es un comando/ejecutable de terminal, al igual que ls o cd, que se encuentra en la mayoría de los sistemas operativos tipo UNIX, como MacOS y Linux.

El uso de make es para simplificar y desglosar tu flujo de trabajo en un grupo lógico de comandos de shell.

Es ampliamente utilizado por los desarrolladores y también está siendo adoptado por los científicos de datos, ya que simplifica el pipeline de aprendizaje automático y permite una implementación de producción más robusta.

¿Por qué Make para la ciencia de datos?

make es una herramienta poderosa que los científicos de datos deben utilizar por las siguientes razones:

  • Automatizar la configuración de entornos de aprendizaje automático
  • Documentación más clara del pipeline de principio a fin
  • Más fácil probar modelos con diferentes parámetros
  • Estructura y ejecución obvias de tu proyecto

¿Qué es un Makefile?

Un Makefile es básicamente lo que los comandos make leen y ejecutan. Tiene tres componentes:

  • Objetivos: Estos son los archivos que estás intentando construir o tienes un objetivo PHONY si solo estás ejecutando comandos.
  • Dependencias: Archivos fuente que deben ejecutarse antes de que se ejecute este objetivo.
  • Comando: Como dice el nombre, esta es la lista de pasos para producir el objetivo.

Ejemplo básico

Vamos a ver un ejemplo muy sencillo para poner en práctica esta teoría.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Investigadores de Microsoft presentan Hydra-RLHF Una solución eficiente en memoria para el aprendizaje por refuerzo con retroalimentación humana

Desde que se hicieron conocidos, los modelos familiares ChatGPT, GPT-4 y Llama-2 han conquistado a los usuarios con s...

Inteligencia Artificial

Esta revisión de investigación de IA explora la integración de imágenes satelitales y aprendizaje profundo para medir la pobreza basada en activos.

Investigadores de la Universidad de Lund y la Universidad de Halmstad llevaron a cabo una revisión sobre la inteligen...

Inteligencia Artificial

Principal Financial Group utiliza la solución de análisis posterior a la llamada de AWS para extraer información sobre los clientes omnicanal

Una empresa de servicios financieros establecida con más de 140 años en el negocio, Principal es líder mundial en ges...

Inteligencia Artificial

Toma el control NVIDIA NeMo SteerLM permite a las empresas personalizar las respuestas de un modelo durante la inferencia

Los desarrolladores tienen un nuevo volante de conducción asistida por IA para ayudarles a mantenerse en la carretera...