¿Tus características son importantes? No significa que sean buenas
¿Son importantes tus características? No necesariamente son buenas.
“La importancia de las características” no es suficiente. También debes considerar la “Contribución del Error” si quieres saber qué características son beneficiosas para tu modelo.
![[Imagen por el autor]](https://miro.medium.com/v2/resize:fit:640/format:webp/1*8y7XEV80pDiVQO6pn9NGmQ.png)
“Importante” y “Bueno” no son sinónimos
El concepto de “importancia de las características” se utiliza ampliamente en el aprendizaje automático como el tipo más básico de explicabilidad del modelo. Por ejemplo, se utiliza en la Eliminación Recursiva de Características (RFE), para eliminar de forma iterativa la característica menos importante del modelo.
Sin embargo, existe una idea equivocada al respecto.
¡El hecho de que una característica sea importante no implica que sea beneficiosa para el modelo!
De hecho, cuando decimos que una característica es importante, simplemente significa que la característica aporta una alta contribución a las predicciones realizadas por el modelo. Pero debemos considerar que tal contribución puede ser incorrecta.
- Meer Pyrus Base Una nueva plataforma de código abierto basada en Python para la simulación bidimensional (2D) de RoboCup Soccer
- BERT vs GPT Comparando a los gigantes de NLP
- Un tutorial de variograma amigable para científicos de datos para cuantificar la continuidad espacial
Tomemos un ejemplo simple: un científico de datos olvida accidentalmente el ID del cliente entre las características de su modelo. El modelo utiliza el ID del cliente como una característica altamente predictiva. Como consecuencia, esta característica tendrá una alta importancia, incluso si en realidad empeora el modelo, ya que no puede funcionar bien en datos no vistos.
Para aclarar las cosas, necesitaremos hacer una distinción entre dos conceptos:
- Contribución a la Predicción: qué parte de las predicciones se debe a la característica; esto es equivalente a la importancia de la característica.
- Contribución al Error: qué parte de los errores de predicción se debe a la presencia de la característica en el modelo.
En este artículo, veremos cómo calcular estas cantidades y cómo utilizarlas para obtener información valiosa sobre un modelo predictivo (y mejorarlo).
Partiendo de un Ejemplo Sencillo
Supongamos que construimos un modelo para predecir los ingresos de las personas en función de su trabajo, edad y nacionalidad. Ahora usamos el modelo para hacer predicciones sobre tres personas.
Por lo tanto, tenemos la verdad absoluta, la predicción del modelo y el error resultante:
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Los 10 mejores generadores de códigos QR de IA en 2023
- IID Significado e Interpretación para Principiantes
- Conoce CipherChat Un marco de inteligencia artificial para examinar sistemáticamente la generalización de la alineación de seguridad a lenguajes no naturales, específicamente cifrados.
- Chat con PDFs | Potenciando la interacción textual con Python y OpenAI
- Podado de redes neuronales con optimización combinatoria
- Moderación de contenido a clasificación sin entrenamiento
- Introducción al Control de Versiones de Datos