Pandas para series de tiempo

Procesamiento de datos en Python

Este artículo explica los métodos de pandas para series de tiempo. Tratemos la serie de tiempo como profesionales.

Desde que me uní a la fuerza laboral como científico de datos, la mayoría de los datos con los que trabajo son series de tiempo. Bueno, hay muchas definiciones para una serie de tiempo, generalmente se define como un conjunto de puntos de datos recopilados durante un período de tiempo. O hablando de manera Pythonica, se refiere a un conjunto de datos con un índice de fecha y hora, y al menos una columna con valores numéricos.

Puede ser el precio de una acción en los últimos meses, las ventas de un hipermercado en las últimas semanas, o incluso los registros de nivel de azúcar en sangre recopilados a lo largo de los meses para un paciente.

En este artículo, mostraré cómo aplicar pandas a un conjunto de datos de series de tiempo, con un ejemplo de registros generados de nivel de azúcar en sangre.

Con eso, este artículo se estructurará de la siguiente manera:

Manipulación del formato de fecha y hora: cambiar la serie de fecha y hora al formato deseado
Conversión de fecha y hora a un período específico: convertir cada punto de datos al período de tiempo específico
Filtrar series de fecha y hora basadas en una condición: filtrar puntos de datos basados en un período de tiempo seleccionado
Desplazamiento de tiempo: desplazar puntos de datos hacia abajo por un número específico de períodos
Remuestreo de series de tiempo: agrupar puntos de datos según el período de tiempo especificado
Gráfico de línea

¡Comencemos!

Como siempre, el primer paso en cualquier análisis con Python es importar la biblioteca necesaria.

Importar bibliotecas

import pandas as pdimport randomimport numpy as npfrom datetime import datetime

Crear datos

Luego, generemos un conjunto de datos de registros de nivel de azúcar en sangre para esta demostración.

def create_demo_data():    random.seed(365)    np.random.seed(365)    number_of_data_rows = 2160        # generar una lista de fechas    dates = pd.bdate_range(datetime(2020, 7, 1), freq='4H', periods=number_of_data_rows).tolist()        # crear un diccionario con los...

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Was this article helpful?

93 out of 132 found this helpful

Pandas para series de tiempo

Procesamiento de datos en Python

Este artículo explica los métodos de pandas para series de tiempo. Tratemos la serie de tiempo como profesionales.

Importar bibliotecas

Crear datos

Was this article helpful?

Lo Bueno, lo Malo y lo Feo de Pd.Get_Dummies

¿Tratando con métricas de conversión? Considera el Modelo Beta-Binomial

Inteligencia Artificial

¡La Bendición de la Dimensionalidad?! (Parte 1)

Meet FreeU Una nueva técnica de IA para mejorar la calidad generativa sin entrenamiento adicional ni ajuste fino

Los Gemelos Digitales Brindan un Camino más Verde para el Crecimiento del Hidrógeno

Los Chatbots de IA construyen software en minutos por menos de $1

Aplicación de juegos bilingües tiene como objetivo combatir la demencia

Investigadores de Apple presentan DeepPCR Un novedoso algoritmo de aprendizaje automático que paraleliza operaciones típicamente secuenciales para acelerar la inferencia y el entrenamiento de redes neuronales.