¿Qué características son perjudiciales para su modelo de clasificación?

Características perjudiciales para el modelo de clasificación.

Cómo calcular la Contribución de Error de las características de un clasificador, con el objetivo de comprender y mejorar el modelo

[Imagen por Autor]

La importancia de las características es la herramienta más común para explicar un modelo de aprendizaje automático. Es tan popular que muchos científicos de datos terminan creyendo que la importancia de las características es igual a la bondad de las características.

No es así.

Cuando una característica es importante, simplemente significa que el modelo la encontró útil en el conjunto de entrenamiento. Sin embargo, ¡esto no dice nada acerca de la capacidad de la característica para generalizar en nuevos datos!

Para tener en cuenta eso, necesitamos hacer una distinción entre dos conceptos:

  • Contribución de Predicción: el peso que una variable tiene en las predicciones realizadas por el modelo. Esto se determina por los patrones que el modelo encontró en el conjunto de entrenamiento. Esto es equivalente a la importancia de las características.
  • Contribución de Error: el peso que una variable tiene en los errores cometidos por el modelo en un conjunto de datos de retención. Esto es un mejor indicador del rendimiento de la característica en nuevos datos.

En este artículo, explicaré la lógica detrás del cálculo de estas dos cantidades en un modelo de clasificación. También mostraré un ejemplo en el cual utilizar la Contribución de Error para la selección de características conduce a un resultado mucho mejor en comparación con el uso de la Contribución de Predicción.

Si estás más interesado en la regresión en lugar de la clasificación, puedes leer mi artículo anterior “¿Tus características son importantes? No significa que sean buenas”.

Tabla de Contenidos

  1. Partiendo de un ejemplo sencillo
  2. ¿Qué “error” deberíamos usar para modelos de clasificación?
  3. ¿Cómo deberíamos manejar los valores SHAP en modelos de clasificación?
  4. Calculando “Contribución de Predicción”
  5. Calculando “Contribución de Error”
  6. Un ejemplo de conjunto de datos real
  7. Probando que funciona: Eliminación de Características Recursiva con “Contribución de Error”
  8. Conclusiones

1. Partiendo de un ejemplo sencillo

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Integración de datos multimodales Cómo la inteligencia artificial está revolucionando la atención del cáncer

Recientemente leí este artículo (enlace) sobre la integración de datos multimodales para la oncología con inteligenci...

Inteligencia Artificial

Revelando Redes de Flujo Bayesiano Una Nueva Frontera en la Modelización Generativa

La Modelización Generativa se encuentra dentro del aprendizaje automático no supervisado, donde el modelo aprende a d...

Inteligencia Artificial

El cucaracha cibernético puede navegar por un laberinto

Los investigadores han desarrollado un método para crear cucarachas ciborg para ser utilizadas en misiones de búsqued...

Inteligencia Artificial

Este artículo de IA presenta un estudio sobre las pruebas de AIS (Síndrome de Insensibilidad a los Andrógenos) utilizando modelos de aprendizaje profundo

AIS significa Síndrome de Insensibilidad a los Andrógenos. AIS es un problema cerebral espinal que afecta a la genera...

Inteligencia Artificial

Revolucionando la segmentación panóptica con FC-CLIP un marco unificado de IA (Inteligencia Artificial) en una sola etapa

La segmentación de imágenes es una tarea fundamental en la visión por computadora, donde una imagen se divide en part...