¿Tus características son importantes? No significa que sean buenas

¿Son importantes tus características? No necesariamente son buenas.

“La importancia de las características” no es suficiente. También debes considerar la “Contribución del Error” si quieres saber qué características son beneficiosas para tu modelo.

“Importante” y “Bueno” no son sinónimos

El concepto de “importancia de las características” se utiliza ampliamente en el aprendizaje automático como el tipo más básico de explicabilidad del modelo. Por ejemplo, se utiliza en la Eliminación Recursiva de Características (RFE), para eliminar de forma iterativa la característica menos importante del modelo.

Sin embargo, existe una idea equivocada al respecto.

¡El hecho de que una característica sea importante no implica que sea beneficiosa para el modelo!

De hecho, cuando decimos que una característica es importante, simplemente significa que la característica aporta una alta contribución a las predicciones realizadas por el modelo. Pero debemos considerar que tal contribución puede ser incorrecta.

Tomemos un ejemplo simple: un científico de datos olvida accidentalmente el ID del cliente entre las características de su modelo. El modelo utiliza el ID del cliente como una característica altamente predictiva. Como consecuencia, esta característica tendrá una alta importancia, incluso si en realidad empeora el modelo, ya que no puede funcionar bien en datos no vistos.

Para aclarar las cosas, necesitaremos hacer una distinción entre dos conceptos:

Contribución a la Predicción: qué parte de las predicciones se debe a la característica; esto es equivalente a la importancia de la característica.
Contribución al Error: qué parte de los errores de predicción se debe a la presencia de la característica en el modelo.

En este artículo, veremos cómo calcular estas cantidades y cómo utilizarlas para obtener información valiosa sobre un modelo predictivo (y mejorarlo).

Partiendo de un Ejemplo Sencillo

Supongamos que construimos un modelo para predecir los ingresos de las personas en función de su trabajo, edad y nacionalidad. Ahora usamos el modelo para hacer predicciones sobre tres personas.

Por lo tanto, tenemos la verdad absoluta, la predicción del modelo y el error resultante:

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Was this article helpful?

93 out of 132 found this helpful

¿Tus características son importantes? No significa que sean buenas

“La importancia de las características” no es suficiente. También debes considerar la “Contribución del Error” si quieres saber qué características son beneficiosas para tu modelo.

“Importante” y “Bueno” no son sinónimos

Partiendo de un Ejemplo Sencillo

Was this article helpful?

Meer Pyrus Base Una nueva plataforma de código abierto basada en Python para la simulación bidimensional (2D) de RoboCup Soccer

Búsqueda autónoma de información visual con modelos de lenguaje grandes

Inteligencia Artificial

Robot humanoide puede pilotar un avión mejor que un humano

¿Podemos mapear escenas a gran escala en tiempo real sin aceleración de GPU? Este artículo de IA presenta 'ImMesh' para la localización y mapeo avanzado basado en LiDAR.

La Casa Blanca propone un programa de ciberseguridad para hogares inteligentes

Ve este nuevo sistema de IA llamado Estudiante de Juegos (SoG) que es capaz de vencer a los humanos en una variedad de juegos y aprender a jugar nuevos'.

Este artículo de IA revela las implicaciones de ciberseguridad de los modelos de IA generativa riesgos, oportunidades y desafíos éticos'.

¿Es verdaderamente seguro el IA multilingüe? Exponiendo las vulnerabilidades de los grandes modelos de lenguaje en idiomas con recursos limitados