3 funciones de pandas para combinar DataFrames
3 pandas functions to combine DataFrames
Aprende cómo funcionan las funciones de fusión de Pandas con ejemplos de código
Es común en el trabajo de datos tener múltiples conjuntos de datos de la fuente de datos o como resultado del análisis de datos.
A veces, queremos fusionar dos o más conjuntos de datos diferentes por varias razones. Por ejemplo:
- Queremos integrar datos de múltiples fuentes de datos en un solo conjunto de datos para un análisis más profundo
- Queremos realizar la imputación de valores faltantes de un conjunto de datos a otro conjunto de datos
- Dividimos el conjunto de datos para realizar diferentes análisis en cada conjunto de datos y queremos devolverlos en un solo conjunto de datos
La fusión de conjuntos de datos es posible con las funciones disponibles del paquete Pandas. En este artículo, aprenderemos tres funciones diferentes para la fusión con ejemplos de código. Vamos a ello.
1. merge
La función merge
es la función principal en Pandas para realizar la fusión básica de conjuntos de datos. Esta función combinaría dos conjuntos de datos en función del índice o columna de datos proporcionada.
- Microsoft recibe duras críticas por su seguridad groseramente irresponsable
- Optimizar la preparación de datos con nuevas funciones en AWS SageMaker Data Wrangler
- Mejora tus fotos con IA desde la mejora de resolución HD hasta los filtros de dibujos animados
Por ejemplo, creemos un ejemplo de conjunto de datos para mostrar cómo funciona la función merge
.
import pandas as pdcliente = pd.DataFrame({'id_cliente': [1,2,3,4,5], 'nombre_cliente': ['Maria', 'Fran', 'Dominique', 'Elsa', 'Charles'], 'país': ['Alemania', 'España', 'Japón', 'Polonia', 'Argentina']})pedido = pd.DataFrame({'id_pedido': [200, 201,202,203,204], 'id_cliente':[1,3,3,4,2], 'fecha_pedido': ['2014-07-05', '2014-07-06', '2014-07-07', '2014-07-07', '2014-07-08'], 'valor_pedido': [10.1, 20.5, 18.7, 19.1, 13.5]})
![Imagen de Autor](https://miro.medium.com/v2/resize:fit:640/format:webp/1*ues0yYIIijcLKRzAClEFGw.png)
En el ejemplo anterior, intentamos simular dos conjuntos de datos diferentes: datos de clientes y datos de pedidos, donde tenemos la columna id_cliente
en ambos DataFrame.
Realicemos la fusión de los DataFrame para comprender mejor la función.
pd.merge(cliente, pedido)
Por defecto, la función merge
ya tiene algunas cosas configuradas:
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- De cero a avanzado en la ingeniería de comandos con Langchain en Python
- Conoce MovieChat un innovador sistema de comprensión de video que integra modelos fundamentales de video y grandes modelos de lenguaje.
- IA Generativa en la Salud
- V-Net, el hermano mayor de U-Net en la segmentación de imágenes
- Una Introducción Suave al Aprendizaje Profundo Bayesiano
- Olvida ChatGPT, este nuevo asistente de IA está a años luz y cambiará la forma en que trabajas para siempre
- Revisión de Synthesys ¿El mejor generador de videos de IA? (agosto de 2023)