¿Tus características son importantes? No significa que sean buenas

¿Son importantes tus características? No necesariamente son buenas.

“La importancia de las características” no es suficiente. También debes considerar la “Contribución del Error” si quieres saber qué características son beneficiosas para tu modelo.

[Imagen por el autor]

“Importante” y “Bueno” no son sinónimos

El concepto de “importancia de las características” se utiliza ampliamente en el aprendizaje automático como el tipo más básico de explicabilidad del modelo. Por ejemplo, se utiliza en la Eliminación Recursiva de Características (RFE), para eliminar de forma iterativa la característica menos importante del modelo.

Sin embargo, existe una idea equivocada al respecto.

¡El hecho de que una característica sea importante no implica que sea beneficiosa para el modelo!

De hecho, cuando decimos que una característica es importante, simplemente significa que la característica aporta una alta contribución a las predicciones realizadas por el modelo. Pero debemos considerar que tal contribución puede ser incorrecta.

Tomemos un ejemplo simple: un científico de datos olvida accidentalmente el ID del cliente entre las características de su modelo. El modelo utiliza el ID del cliente como una característica altamente predictiva. Como consecuencia, esta característica tendrá una alta importancia, incluso si en realidad empeora el modelo, ya que no puede funcionar bien en datos no vistos.

Para aclarar las cosas, necesitaremos hacer una distinción entre dos conceptos:

  • Contribución a la Predicción: qué parte de las predicciones se debe a la característica; esto es equivalente a la importancia de la característica.
  • Contribución al Error: qué parte de los errores de predicción se debe a la presencia de la característica en el modelo.

En este artículo, veremos cómo calcular estas cantidades y cómo utilizarlas para obtener información valiosa sobre un modelo predictivo (y mejorarlo).

Partiendo de un Ejemplo Sencillo

Supongamos que construimos un modelo para predecir los ingresos de las personas en función de su trabajo, edad y nacionalidad. Ahora usamos el modelo para hacer predicciones sobre tres personas.

Por lo tanto, tenemos la verdad absoluta, la predicción del modelo y el error resultante:

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Robot humanoide puede pilotar un avión mejor que un humano

Ingenieros e investigadores están desarrollando un robot humanoide que puede volar aviones sin necesidad de modificac...

Inteligencia Artificial

La Casa Blanca propone un programa de ciberseguridad para hogares inteligentes

El objetivo de la nueva certificación es ayudar a los consumidores a tomar decisiones.

Inteligencia Artificial

Ve este nuevo sistema de IA llamado Estudiante de Juegos (SoG) que es capaz de vencer a los humanos en una variedad de juegos y aprender a jugar nuevos'.

Existe una larga tradición de utilizar juegos como indicadores de rendimiento de la IA. Los enfoques basados ​​en bús...

Inteligencia Artificial

Este artículo de IA revela las implicaciones de ciberseguridad de los modelos de IA generativa riesgos, oportunidades y desafíos éticos'.

Los modelos de IA generativa (GenAI), como ChatGPT, Google Bard y GPT de Microsoft, han revolucionado la interacción ...

Inteligencia Artificial

¿Es verdaderamente seguro el IA multilingüe? Exponiendo las vulnerabilidades de los grandes modelos de lenguaje en idiomas con recursos limitados

GPT-4 tiene como predeterminación decir: “Lo siento, pero no puedo ayudar con eso”, en respuesta a solici...