3 funciones de pandas para combinar DataFrames

3 pandas functions to combine DataFrames

Aprende cómo funcionan las funciones de fusión de Pandas con ejemplos de código

Foto de Lance Grandahl en Unsplash

Es común en el trabajo de datos tener múltiples conjuntos de datos de la fuente de datos o como resultado del análisis de datos.

A veces, queremos fusionar dos o más conjuntos de datos diferentes por varias razones. Por ejemplo:

  • Queremos integrar datos de múltiples fuentes de datos en un solo conjunto de datos para un análisis más profundo
  • Queremos realizar la imputación de valores faltantes de un conjunto de datos a otro conjunto de datos
  • Dividimos el conjunto de datos para realizar diferentes análisis en cada conjunto de datos y queremos devolverlos en un solo conjunto de datos

La fusión de conjuntos de datos es posible con las funciones disponibles del paquete Pandas. En este artículo, aprenderemos tres funciones diferentes para la fusión con ejemplos de código. Vamos a ello.

1. merge

La función merge es la función principal en Pandas para realizar la fusión básica de conjuntos de datos. Esta función combinaría dos conjuntos de datos en función del índice o columna de datos proporcionada.

Por ejemplo, creemos un ejemplo de conjunto de datos para mostrar cómo funciona la función merge.

import pandas as pdcliente = pd.DataFrame({'id_cliente': [1,2,3,4,5],                    'nombre_cliente': ['Maria', 'Fran', 'Dominique', 'Elsa', 'Charles'],                   'país': ['Alemania', 'España', 'Japón', 'Polonia', 'Argentina']})pedido = pd.DataFrame({'id_pedido': [200, 201,202,203,204],                      'id_cliente':[1,3,3,4,2],                      'fecha_pedido': ['2014-07-05', '2014-07-06', '2014-07-07', '2014-07-07', '2014-07-08'],                      'valor_pedido': [10.1, 20.5, 18.7, 19.1, 13.5]})
Imagen de Autor

En el ejemplo anterior, intentamos simular dos conjuntos de datos diferentes: datos de clientes y datos de pedidos, donde tenemos la columna id_cliente en ambos DataFrame.

Realicemos la fusión de los DataFrame para comprender mejor la función.

pd.merge(cliente, pedido)

Por defecto, la función merge ya tiene algunas cosas configuradas:

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Un nuevo estudio de investigación de IA de DeepMind propone dos codificaciones posicionales direccionales y estructurales para grafos dirigidos

Los modelos Transformer han ganado mucha popularidad recientemente. Estos modelos de redes neuronales siguen las rela...

Aprendizaje Automático

Conoce TRACE Un Nuevo Enfoque de IA para la Estimación Precisa de la Postura y la Forma Humana en 3D con Seguimiento de Coordenadas Globales.

Muchas áreas pueden beneficiarse y utilizar los avances recientes en la estimación de la pose y forma humana 3D (HPS)...

Inteligencia Artificial

Microsoft Research lanza el 'Cuarteto de Heavy Metal' de los compiladores de IA Rammer, Roller, Welder y Grinder

La evolución de los modelos de inteligencia artificial (IA) y los aceleradores de hardware ha traído desafíos únicos ...

Inteligencia Artificial

Esta investigación de IA presenta un nuevo enfoque para el reconocimiento de pose de objetos como predicción del próximo token'.

¿Cómo podemos abordar de forma efectiva el reconocimiento de objetos? Un equipo de investigadores de Meta AI y la Uni...

Noticias de Inteligencia Artificial

Fármaco diseñado por inteligencia artificial listo para ensayos en humanos.

Una empresa biotecnológica, Insilico Medicine, respaldada por el conglomerado chino Fosun Group y el gigante de capit...