Pandas para series de tiempo

Pandas para series de tiempo

Procesamiento de datos en Python

Este artículo explica los métodos de pandas para series de tiempo. Tratemos la serie de tiempo como profesionales.

Foto de Aron Visuals en Unsplash

Desde que me uní a la fuerza laboral como científico de datos, la mayoría de los datos con los que trabajo son series de tiempo. Bueno, hay muchas definiciones para una serie de tiempo, generalmente se define como un conjunto de puntos de datos recopilados durante un período de tiempo. O hablando de manera Pythonica, se refiere a un conjunto de datos con un índice de fecha y hora, y al menos una columna con valores numéricos.

Puede ser el precio de una acción en los últimos meses, las ventas de un hipermercado en las últimas semanas, o incluso los registros de nivel de azúcar en sangre recopilados a lo largo de los meses para un paciente.

En este artículo, mostraré cómo aplicar pandas a un conjunto de datos de series de tiempo, con un ejemplo de registros generados de nivel de azúcar en sangre.

Con eso, este artículo se estructurará de la siguiente manera:

  1. Manipulación del formato de fecha y hora: cambiar la serie de fecha y hora al formato deseado
  2. Conversión de fecha y hora a un período específico: convertir cada punto de datos al período de tiempo específico
  3. Filtrar series de fecha y hora basadas en una condición: filtrar puntos de datos basados en un período de tiempo seleccionado
  4. Desplazamiento de tiempo: desplazar puntos de datos hacia abajo por un número específico de períodos
  5. Remuestreo de series de tiempo: agrupar puntos de datos según el período de tiempo especificado
  6. Gráfico de línea

¡Comencemos!

Como siempre, el primer paso en cualquier análisis con Python es importar la biblioteca necesaria.

Importar bibliotecas

import pandas as pdimport randomimport numpy as npfrom datetime import datetime 

Crear datos

Luego, generemos un conjunto de datos de registros de nivel de azúcar en sangre para esta demostración.

def create_demo_data():    random.seed(365)    np.random.seed(365)    number_of_data_rows = 2160        # generar una lista de fechas    dates = pd.bdate_range(datetime(2020, 7, 1), freq='4H', periods=number_of_data_rows).tolist()        # crear un diccionario con los...

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

¡La Bendición de la Dimensionalidad?! (Parte 1)

Creemos que se puede lograr un gran avance en uno o más de estos problemas si un grupo cuidadosamente seleccionado de...

Inteligencia Artificial

Meet FreeU Una nueva técnica de IA para mejorar la calidad generativa sin entrenamiento adicional ni ajuste fino

Los modelos de difusión probabilística, una categoría de vanguardia de modelos generativos, se han convertido en un p...

Inteligencia Artificial

Los Gemelos Digitales Brindan un Camino más Verde para el Crecimiento del Hidrógeno

Un investigador cree que los gemelos digitales podrían ayudar a reducir los costos de producción de hidrógeno limpio ...

Inteligencia Artificial

Los Chatbots de IA construyen software en minutos por menos de $1

En un estudio esclarecedor, los chatbots de inteligencia artificial han demostrado su increíble potencial al dirigir ...

Inteligencia Artificial

Aplicación de juegos bilingües tiene como objetivo combatir la demencia

Una aplicación multilingüe desarrollada por investigadores de la Universidad de Tecnología y Diseño de Singapur tiene...