Una introducción a la ingeniería de análisis

Una introducción al análisis de ingeniería

¿Quién es un Ingeniero de Análisis y qué se supone que debe hacer?

Tradicionalmente, los equipos de datos estaban formados por Ingenieros de Datos y Analistas de Datos.

Los Ingenieros de Datos son responsables de construir la infraestructura para soportar las operaciones de datos. Esto incluye la configuración de bases de datos y la implementación de procesos ETL que se utilizan para ingresar datos desde fuentes externas hacia un sistema de destino (posiblemente otra base de datos). Además, los Ingenieros de Datos suelen ser los encargados de asegurar la integridad, frescura y seguridad de los datos para que los Analistas puedan realizar consultas. Un conjunto típico de habilidades para un Ingeniero de Datos incluye Python (o Java), SQL, orquestación (usando herramientas como Apache Airflow) y modelado de datos.

Por otro lado, se espera que los Analistas de Datos construyan paneles de control e informes utilizando Excel o SQL para brindar información empresarial a usuarios y departamentos internos.

Formación tradicional de los equipos de datos

Transición de ETL a ELT

¿Para procesar datos y obtener información valiosa, primero necesitamos extraerlos, ¿verdad? 🤯

La ingestión de datos se realiza mediante procesos ETL (y más recientemente con ELT). Tanto los paradigmas ETL como ELT involucran tres pasos principales: Extracción, Transformación y Carga. Por ahora, ignoremos la secuencia de ejecución de estos pasos y centrémonos en lo que hace cada paso de forma independiente.

Extracción

Este paso se refiere al proceso de extraer datos de una fuente persistente. Esta fuente de datos podría ser una base de datos, un punto de conexión de API, un archivo o una cola de mensajes.

Transformación

En el paso de Transformación, se espera que el pipeline realice cambios en la estructura y/o formato de los datos para lograr un objetivo específico. Una transformación podría ser una modificación (por ejemplo, mapear “Estados Unidos” a “EE. UU.”), una selección de atributos, un cálculo numérico o una unión.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Was this article helpful?

93 out of 132 found this helpful

Una introducción a la ingeniería de análisis

¿Quién es un Ingeniero de Análisis y qué se supone que debe hacer?

Transición de ETL a ELT

Extracción

Transformación

Was this article helpful?

Equilibrando la urgencia vs. la sostenibilidad como equipo de análisis

LLMOps la próxima frontera de MLOps

Inteligencia Artificial

La minería de Bitcoin utilizó más agua que la ciudad de Nueva York el año pasado.

Nueva York planea invertir 1.000 millones de dólares para expandir la investigación de chips

Destaques y Contribuciones de NeurIPS 2023

Las características de IA SaaS se encuentran con aplicaciones sin fosos

¿Qué significa implementar un modelo de aprendizaje automático?

Convirtiendo viejos mapas en modelos digitales en 3D de vecindarios perdidos.