Puntuación F1 Una guía visual – Y por qué no te salvará de los datos desequilibrados

Puntuación F1 guía visual y su limitación con datos desequilibrados

TL;DR al final

Nuestro trabajo es crear un modelo para clasificar si las personas están sanas o enfermas. Se nos proporcionan datos sobre ellos, hemos creado múltiples modelos de clasificación y es hora de seleccionar el mejor.

Precisión y Recall

Una forma común de estimar el rendimiento de un modelo es medir su precisión y recall.

Precisión — Qué proporción de todos los positivos predichos son positivos reales.

Recall — Qué proporción de todos los positivos reales en nuestros datos hemos predicho correctamente.

La precisión y el recall son métricas excelentes, pero todavía son dos números. Si quieres comparar dos modelos diferentes para decidir cuál es mejor, sería más fácil tener un número único.

Media aritmética

Una forma de combinar la precisión y el recall es simplemente su promedio (media aritmética).

Este método combina efectivamente las dos métricas en un solo valor. Sin embargo, aquí está el detalle.

Aquí, tenemos el mismo promedio. ¿Pero los modelos son igual de buenos?

El primer modelo podría estar llamando a todo en nuestro conjunto de datos un positivo sin ninguna lógica, mientras que el segundo modelo parece más útil.

Cuando buscamos un buen modelo, queremos evitar aquellos con baja precisión o recall. Probablemente no sean modelos útiles, y nos gustaría reducir la “puntuación” si uno de los números es mucho más pequeño que el otro.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Was this article helpful?

93 out of 132 found this helpful

Puntuación F1 Una guía visual – Y por qué no te salvará de los datos desequilibrados

TL;DR al final

Precisión y Recall

Media aritmética

Was this article helpful?

Conoce Cursive Un Marco de Inteligencia Artificial Universal e Intuitivo para Interactuar con LLMs

Comenzando con la IA

Inteligencia Artificial

Línea Open-Sources ‘japanese-large-lm’ Un modelo de lenguaje japonés con 3.6 mil millones de parámetros

Más personas están quedando ciegas. La IA puede ayudar a combatirlo.

Mejore las respuestas de LLM en casos de uso de RAG interactuando con el usuario

Investigadores de Google proponen MEMORY-VQ un nuevo enfoque de IA para reducir los requisitos de almacenamiento de los modelos de memoria aumentada sin sacrificar el rendimiento

Los emojis son cada vez más legalmente vinculantes. Pero todavía están abiertos a una amplia interpretación

Bots, granjas fraudulentas responsables del 73% del tráfico web