Puntuación F1 Una guía visual – Y por qué no te salvará de los datos desequilibrados

Puntuación F1 guía visual y su limitación con datos desequilibrados

Foto de Lightscape en Unsplash

TL;DR al final

Nuestro trabajo es crear un modelo para clasificar si las personas están sanas o enfermas. Se nos proporcionan datos sobre ellos, hemos creado múltiples modelos de clasificación y es hora de seleccionar el mejor.

Precisión y Recall

Una forma común de estimar el rendimiento de un modelo es medir su precisión y recall.

Precisión — Qué proporción de todos los positivos predichos son positivos reales.

Recall — Qué proporción de todos los positivos reales en nuestros datos hemos predicho correctamente.

La precisión y el recall son métricas excelentes, pero todavía son dos números. Si quieres comparar dos modelos diferentes para decidir cuál es mejor, sería más fácil tener un número único.

Media aritmética

Una forma de combinar la precisión y el recall es simplemente su promedio (media aritmética).

Este método combina efectivamente las dos métricas en un solo valor. Sin embargo, aquí está el detalle.

Aquí, tenemos el mismo promedio. ¿Pero los modelos son igual de buenos?

El primer modelo podría estar llamando a todo en nuestro conjunto de datos un positivo sin ninguna lógica, mientras que el segundo modelo parece más útil.

Cuando buscamos un buen modelo, queremos evitar aquellos con baja precisión o recall. Probablemente no sean modelos útiles, y nos gustaría reducir la “puntuación” si uno de los números es mucho más pequeño que el otro.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Línea Open-Sources ‘japanese-large-lm’ Un modelo de lenguaje japonés con 3.6 mil millones de parámetros

Desde noviembre de 2020, LINE se ha embarcado en un viaje transformador de investigación y desarrollo para crear y ap...

Ciencias de la Computación

Más personas están quedando ciegas. La IA puede ayudar a combatirlo.

La detección temprana es crucial para tratar enfermedades oculares. Los análisis de escaneo ocular mejorados por AI p...

Inteligencia Artificial

Mejore las respuestas de LLM en casos de uso de RAG interactuando con el usuario

Una de las aplicaciones más comunes de la IA generativa y los grandes modelos de lenguaje (GML) es responder pregunta...

Inteligencia Artificial

Los emojis son cada vez más legalmente vinculantes. Pero todavía están abiertos a una amplia interpretación

Cada año, más casos en los tribunales de Estados Unidos consideran los emojis como legalmente vinculantes. Sin embarg...

Inteligencia Artificial

Bots, granjas fraudulentas responsables del 73% del tráfico web

Arkose Labs informó que los ataques maliciosos realizados por bots y granjas de fraudes humanos representaron el 73% ...