Streaming en Ingeniería de Datos
El streaming en la Ingeniería de Datos
Flujos de datos en tiempo real y análisis en tiempo real
Streaming es uno de los patrones de diseño de flujos de datos más populares. Utilizando un evento como un único punto de datos, se crea un flujo constante de datos de un punto a otro, lo que permite la oportunidad de ingestión y análisis de datos en tiempo real. Si deseas familiarizarte con el flujo de datos y aprender cómo construir flujos de datos en tiempo real, esta historia es para ti. Aprende cómo probar la solución y simular flujos de eventos con datos de prueba falsos. Este artículo es una excelente oportunidad para adquirir habilidades muy buscadas en ingeniería de datos trabajando con herramientas y marcos de trabajo populares de streaming, como Kinesis, Kafka y Spark. Me gustaría hablar sobre los beneficios, ejemplos y casos de uso de la transmisión de datos.
¿Qué es exactamente el streaming de datos?
El streaming de datos, también conocido como procesamiento de flujos de eventos, es un patrón de diseño de flujos de datos en el que los puntos de datos fluyen constantemente desde la fuente hasta el destino. Puede ser procesado en tiempo real, lo que permite capacidades de análisis en tiempo real para actuar sobre flujos de datos y eventos de análisis de manera extremadamente rápida. Las aplicaciones pueden responder de inmediato a nuevos eventos de datos gracias al procesamiento de flujos y típicamente sería una de las soluciones más populares para procesar los datos a nivel empresarial.
Existe una tubería de datos siempre que haya procesamiento de datos entre los puntos A y B [1].
![Ejemplo de tubería de datos en tiempo real. Imagen del autor](https://ai.miximages.com/miro.medium.com/v2/resize:fit:640/format:webp/1*RuEJ5-5qQOYVSuufF3GSWg.png)
En este ejemplo, podemos crear una tubería de datos en tiempo real utilizando ELT para AWS Redshift. La tubería de entrega de Firehose de AWS puede ofrecer este tipo de integración perfecta cuando crea un flujo de datos directamente en la tabla del almacén de datos. Luego, los datos se transformarán para generar informes con AWS Quicksight como herramienta de inteligencia empresarial.
- Acuerdo preliminar de la UE sobre la regulación de la IA Implicaciones para ChatGPT
- Investigación de Google revela Transformadores Generativos de Vocabulario Infinito (GIVT) Pioneros en secuencias de vectores de valor real en IA
- Regresando a lo humano El viaje de la IA desde el código hasta los abrazos
Imaginemos que necesitamos crear un panel de informes para mostrar los flujos de ingresos en nuestra empresa. En muchos casos, un requisito empresarial es generar información en tiempo real. Esto es exactamente lo que necesitaríamos utilizar el streaming.
Los flujos de datos pueden generarse a partir de diversas fuentes de datos, como IoT, flujos de datos de servidores, eventos de marketing en aplicaciones, actividad de usuarios, transacciones de pago, entre otros.
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Rastreando la memoria de la sesión de Python usando Tracemem
- Potenciando la fiabilidad del aprendizaje automático Cómo la atipicidad mejora el rendimiento del modelo y la cuantificación de la incertidumbre
- EE.UU. acuerda sobre reglas históricas de Inteligencia Artificial
- Enfoque de computación cuántica utiliza moléculas individuales como bits cuánticos por primera vez
- Gafas de realidad virtual para ratones crean escenarios inmersivos para la investigación cerebral
- El año en que la inteligencia artificial se comió internet
- Bloqueo de Apple de Beeper Mini en iMessage solo es parte de la gran saga de la burbuja azul/verde