Creando animación para mostrar 4 algoritmos de agrupamiento basados en centroides usando Python y Sklearn

Creando animación de 4 algoritmos de agrupamiento basados en centroides con Python y Sklearn

Usando visualización de datos y animaciones para entender el proceso de 4 algoritmos de clustering basados en centroides.

Foto de Mel Poole en Unsplash

Análisis de clustering

El análisis de clustering es una técnica efectiva de aprendizaje automático que agrupa datos según sus similitudes y diferencias. Los grupos de datos obtenidos pueden ser utilizados para diversos propósitos, como segmentación, estructuración y toma de decisiones.

Para realizar el análisis de clustering, existen muchos métodos basados en diferentes algoritmos. Este artículo se centrará principalmente en el clustering basado en centroides, que es una técnica común y útil.

Clustering basado en centroides

Básicamente, la técnica basada en centroides funciona calculando repetidamente para obtener centroides óptimos (centros de agrupación) y luego asignando puntos de datos a los más cercanos.

Debido a tener muchas iteraciones, la visualización de datos se puede utilizar para expresar lo que sucede durante el proceso. Por lo tanto, el propósito de este artículo es crear animaciones para mostrar el proceso basado en centroides con Python y Sklearn.

Un ejemplo de una animación de clustering en este artículo. Imagen de Autor.

Sklearn (Scikit-learn) es una biblioteca poderosa que nos ayuda a realizar análisis de clustering de manera eficiente. A continuación, se presentan las técnicas de clustering basadas en centroides con las que trabajaremos.

  1. Clustering K-means
  2. Clustering K-means en mini lotes
  3. Clustering K-means bisectante
  4. Clustering Mean-Shift

Empecemos

Obteniendo los datos

Comienza importando las bibliotecas.

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns

Como ejemplo, este artículo utilizará un conjunto de datos generado, que se puede crear fácilmente utilizando make_blobs() de sklearn. Si tienes tu propio conjunto de datos, este paso se puede omitir.

from sklearn.datasets import make_blobsX, y…

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Explorando el Procesamiento del Lenguaje Natural - Inicio de NLP (Paso #2)

Recientemente, como parte de un proceso de entrevista, se me pidió explorar dos preguntas y en el camino, aprendí alg...

Inteligencia Artificial

Entropía de IA El círculo vicioso del contenido generado por IA

Imagina si pudieras clonarte para estar en múltiples lugares a la vez, manejando todas tus responsabilidades sin esfu...

Inteligencia Artificial

Disney empaqueta grandes emociones en un pequeño robot

La semana pasada, un equipo de científicos de Disney Research presentó un personaje robótico bipedal que combina un c...

Inteligencia Artificial

El diagnóstico y tratamiento del cáncer podrían recibir un impulso de la IA

Se diseñó un nuevo algoritmo de aprendizaje automático para ayudar a los médicos a diagnosticar tipos específicos de ...

Ciencia de Datos

Vuelva a entrenar los modelos de aprendizaje automático y automatice las predicciones por lotes en Amazon SageMaker Canvas utilizando conjuntos de datos actualizados.

Ahora puedes re-entrenar modelos de aprendizaje automático (ML) y automatizar flujos de trabajo de predicción en lote...