¿Cómo sabe un árbol de decisiones cuál es la próxima mejor pregunta a hacer basado en los datos?

¿Cómo decide un árbol de decisiones cuál es la próxima mejor pregunta basándose en los datos?

Construye tu propio clasificador de árboles de decisión (desde cero en Python) y entiende cómo utiliza la entropía para dividir un nodo

Foto de Daniele Levis Pelusi en Unsplash

Introducción

Los árboles de decisión son algoritmos de aprendizaje automático versátiles que pueden realizar problemas de clasificación y regresión. Toman decisiones haciendo preguntas sobre los datos basadas en sus características, utilizando una estructura SI-NO para seguir un camino que finalmente lleva a la predicción final. El desafío es descubrir qué pregunta hacer en cada paso del proceso de toma de decisiones, lo que también equivale a preguntar cómo determinar la mejor división en cada nodo de decisión.

En este artículo, intentaremos construir un árbol de decisión para una tarea simple de clasificación binaria. El objetivo de este artículo es comprender cómo se utiliza una medida de impureza (por ejemplo, entropía) en cada nodo para determinar la mejor división, construyendo finalmente una estructura similar a un árbol que utiliza un enfoque basado en reglas para llegar a la predicción final.

Para obtener una intuición sobre la entropía y la impureza de Gini (otra métrica utilizada para medir la aleatoriedad y determinar la calidad de la división en los árboles de decisión), echa un vistazo rápido a este artículo.

Definición del problema y datos

Problema: Dada la longitud y el peso de un pez, predecir si es atún o salmón.

El desafío es predecir el tipo (variable objetivo) de pez dadas su peso y longitud. Esto es un ejemplo de una tarea de clasificación binaria ya que hay dos valores posibles de nuestra variable objetivo, es decir, atún y salmón.

Puedes descargar el conjunto de datos desde aquí.

Es muy recomendable que sigas el código mientras lees este artículo para obtener la máxima comprensión 🙂

Prerrequisitos para el código

Asegurémonos de que tienes todo lo necesario para empezar (apuesto a que ya lo tienes, pero por si acaso).

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Descifrando la regulación génica con Deep Learning Un nuevo enfoque de IA para entender el empalme alternativo

El empalme alternativo es un proceso fundamental en la regulación génica, que permite que un solo gen produzca múltip...

Aprendizaje Automático

Implemente un punto final de inferencia de ML sin servidor para modelos de lenguaje grandes utilizando FastAPI, AWS Lambda y AWS CDK.

Para los científicos de datos, trasladar los modelos de aprendizaje automático (ML) desde la prueba de concepto a la ...

Inteligencia Artificial

¿Qué es la generación aumentada por recuperación?

Para entender el último avance en inteligencia artificial generativa, imagina un tribunal. Los jueces escuchan y deci...

Inteligencia Artificial

¿Deberían las escuelas depender del gobierno para la protección cibernética?

¿Puede el gobierno federal proteger a las escuelas de K-12 y a sus estudiantes de los ciberataques?

Inteligencia Artificial

Células complejas del pulpo son clave para su alta inteligencia

Investigadores exploraron la estructura neural del pulpo que define sus procesos de aprendizaje utilizando preparació...