¿Qué características son perjudiciales para su modelo de clasificación?

Características perjudiciales para el modelo de clasificación.

Cómo calcular la Contribución de Error de las características de un clasificador, con el objetivo de comprender y mejorar el modelo

La importancia de las características es la herramienta más común para explicar un modelo de aprendizaje automático. Es tan popular que muchos científicos de datos terminan creyendo que la importancia de las características es igual a la bondad de las características.

No es así.

Cuando una característica es importante, simplemente significa que el modelo la encontró útil en el conjunto de entrenamiento. Sin embargo, ¡esto no dice nada acerca de la capacidad de la característica para generalizar en nuevos datos!

Para tener en cuenta eso, necesitamos hacer una distinción entre dos conceptos:

Contribución de Predicción: el peso que una variable tiene en las predicciones realizadas por el modelo. Esto se determina por los patrones que el modelo encontró en el conjunto de entrenamiento. Esto es equivalente a la importancia de las características.
Contribución de Error: el peso que una variable tiene en los errores cometidos por el modelo en un conjunto de datos de retención. Esto es un mejor indicador del rendimiento de la característica en nuevos datos.

En este artículo, explicaré la lógica detrás del cálculo de estas dos cantidades en un modelo de clasificación. También mostraré un ejemplo en el cual utilizar la Contribución de Error para la selección de características conduce a un resultado mucho mejor en comparación con el uso de la Contribución de Predicción.

Si estás más interesado en la regresión en lugar de la clasificación, puedes leer mi artículo anterior “¿Tus características son importantes? No significa que sean buenas”.

Tabla de Contenidos

Partiendo de un ejemplo sencillo
¿Qué “error” deberíamos usar para modelos de clasificación?
¿Cómo deberíamos manejar los valores SHAP en modelos de clasificación?
Calculando “Contribución de Predicción”
Calculando “Contribución de Error”
Un ejemplo de conjunto de datos real
Probando que funciona: Eliminación de Características Recursiva con “Contribución de Error”
Conclusiones

1. Partiendo de un ejemplo sencillo

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Was this article helpful?

93 out of 132 found this helpful

Investigadores de Google proponen MEMORY-VQ un nuevo enfoque de IA para reducir los requisitos de almacenamiento de los modelos de memoria aumentada sin sacrificar el rendimiento

¿Qué características son perjudiciales para su modelo de clasificación?

Cómo calcular la Contribución de Error de las características de un clasificador, con el objetivo de comprender y mejorar el modelo

Tabla de Contenidos

1. Partiendo de un ejemplo sencillo

Was this article helpful?

Conoce T2I-Adapter-SDXL Modelos de Control Pequeños y Eficientes.

Investigadores de Google proponen MEMORY-VQ un nuevo enfoque de IA para reducir los requisitos de almacenamiento de los modelos de memoria aumentada sin sacrificar el rendimiento

Inteligencia Artificial

Integración de datos multimodales Cómo la inteligencia artificial está revolucionando la atención del cáncer

Revelando Redes de Flujo Bayesiano Una Nueva Frontera en la Modelización Generativa

Esta investigación de IA de UCLA indica que los grandes modelos de lenguaje (como GPT-3) han adquirido la capacidad emergente de encontrar soluciones sin guía para una amplia gama de problemas de analogía.

El cucaracha cibernético puede navegar por un laberinto

Este artículo de IA presenta un estudio sobre las pruebas de AIS (Síndrome de Insensibilidad a los Andrógenos) utilizando modelos de aprendizaje profundo

Revolucionando la segmentación panóptica con FC-CLIP un marco unificado de IA (Inteligencia Artificial) en una sola etapa