Puntuación F1 Una guía visual – Y por qué no te salvará de los datos desequilibrados
Puntuación F1 guía visual y su limitación con datos desequilibrados
TL;DR al final
Nuestro trabajo es crear un modelo para clasificar si las personas están sanas o enfermas. Se nos proporcionan datos sobre ellos, hemos creado múltiples modelos de clasificación y es hora de seleccionar el mejor.
Precisión y Recall
Una forma común de estimar el rendimiento de un modelo es medir su precisión y recall.
Precisión — Qué proporción de todos los positivos predichos son positivos reales.
- Conoce Cursive Un Marco de Inteligencia Artificial Universal e Intuitivo para Interactuar con LLMs
- Deci presenta DeciCoder un modelo de lenguaje grande de código abierto con 1 billón de parámetros para generación de código.
- Cómo interpretar los coeficientes de regresión logística
Recall — Qué proporción de todos los positivos reales en nuestros datos hemos predicho correctamente.
La precisión y el recall son métricas excelentes, pero todavía son dos números. Si quieres comparar dos modelos diferentes para decidir cuál es mejor, sería más fácil tener un número único.
Media aritmética
Una forma de combinar la precisión y el recall es simplemente su promedio (media aritmética).
Este método combina efectivamente las dos métricas en un solo valor. Sin embargo, aquí está el detalle.
Aquí, tenemos el mismo promedio. ¿Pero los modelos son igual de buenos?
El primer modelo podría estar llamando a todo en nuestro conjunto de datos un positivo sin ninguna lógica, mientras que el segundo modelo parece más útil.
Cuando buscamos un buen modelo, queremos evitar aquellos con baja precisión o recall. Probablemente no sean modelos útiles, y nos gustaría reducir la “puntuación” si uno de los números es mucho más pequeño que el otro.
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Organizando la IA generativa 5 lecciones aprendidas de los equipos de ciencia de datos
- Apoyando la sostenibilidad, la salud digital y el futuro del trabajo
- Cómo ayudar a los estudiantes de secundaria a prepararse para el auge de la inteligencia artificial
- Increíble nueva función de Inpainting a mitad de camino (Región variable)
- Los mejores cursos de IA de universidades con listas de reproducción de YouTube
- Aumentando la precisión del modelo Técnicas que aprendí durante mi tesis de Machine Learning en Spotify (+fragmentos de código)
- Microsoft Azure vs. Google Cloud Platform’ ‘Microsoft Azure vs. Google Cloud Platform