Pandas para series de tiempo
Pandas para series de tiempo
Procesamiento de datos en Python
Este artículo explica los métodos de pandas para series de tiempo. Tratemos la serie de tiempo como profesionales.
![Foto de Aron Visuals en Unsplash](https://miro.medium.com/v2/resize:fit:640/format:webp/1*AOjEMTVtkvCxjBfAUZ-Bcw.jpeg)
Desde que me uní a la fuerza laboral como científico de datos, la mayoría de los datos con los que trabajo son series de tiempo. Bueno, hay muchas definiciones para una serie de tiempo, generalmente se define como un conjunto de puntos de datos recopilados durante un período de tiempo. O hablando de manera Pythonica, se refiere a un conjunto de datos con un índice de fecha y hora, y al menos una columna con valores numéricos.
Puede ser el precio de una acción en los últimos meses, las ventas de un hipermercado en las últimas semanas, o incluso los registros de nivel de azúcar en sangre recopilados a lo largo de los meses para un paciente.
En este artículo, mostraré cómo aplicar pandas a un conjunto de datos de series de tiempo, con un ejemplo de registros generados de nivel de azúcar en sangre.
Con eso, este artículo se estructurará de la siguiente manera:
- Lo Bueno, lo Malo y lo Feo de Pd.Get_Dummies
- openCypher* contra cualquier base de datos relacional
- Explicación del artículo de las Redes de Atención en Grafos con ilustración e implementación en PyTorch
- Manipulación del formato de fecha y hora: cambiar la serie de fecha y hora al formato deseado
- Conversión de fecha y hora a un período específico: convertir cada punto de datos al período de tiempo específico
- Filtrar series de fecha y hora basadas en una condición: filtrar puntos de datos basados en un período de tiempo seleccionado
- Desplazamiento de tiempo: desplazar puntos de datos hacia abajo por un número específico de períodos
- Remuestreo de series de tiempo: agrupar puntos de datos según el período de tiempo especificado
- Gráfico de línea
¡Comencemos!
Como siempre, el primer paso en cualquier análisis con Python es importar la biblioteca necesaria.
Importar bibliotecas
import pandas as pdimport randomimport numpy as npfrom datetime import datetime
Crear datos
Luego, generemos un conjunto de datos de registros de nivel de azúcar en sangre para esta demostración.
def create_demo_data(): random.seed(365) np.random.seed(365) number_of_data_rows = 2160 # generar una lista de fechas dates = pd.bdate_range(datetime(2020, 7, 1), freq='4H', periods=number_of_data_rows).tolist() # crear un diccionario con los...
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Noticias de VoAGI, 26 de julio Entrenamiento gratuito de IA generativa de Google • Guía para principiantes en Ingeniería de Datos • GPT-Engineer Tu nuevo asistente de codificación de IA
- La Guía Esencial para la Ingeniería de Instrucciones en ChatGPT
- ¿Cómo deberíamos almacenar imágenes de IA? Investigadores de Google proponen un método de compresión de imágenes utilizando modelos generativos basados en puntuación
- Transforma imágenes de moda en impresionantes videos fotorrealistas con el marco de IA DreamPose
- Optimización de la programación de programas de televisión utilizando algoritmos genéticos en Python
- 5 Errores que cometí al cambiar a la carrera de Ciencia de Datos
- NLP moderno Una descripción detallada. Parte 3 BERT