Las dos métricas que revelan la verdadera dispersión de datos más allá de la desviación estándar
Dos métricas revelan dispersión de datos más allá de desviación estándar
ESTADÍSTICAS
Una guía para calcular e interpretar el coeficiente de variación y el coeficiente de dispersión de cuartiles
![Imagen generada por el autor utilizando StockImg.AI](https://miro.medium.com/v2/resize:fit:640/format:webp/0*4AQaGKh0teFAFB3h.png)
Introducción
Todos hemos escuchado el dicho, “La variedad es el condimento de la vida”, y en los datos, esa variedad o diversidad a menudo toma la forma de dispersión.
La dispersión de datos hace que los datos sean fascinantes al resaltar patrones e ideas que de otra manera no habríamos encontrado. Típicamente, utilizamos las siguientes medidas de dispersión: varianza, desviación estándar, rango y rango intercuartílico (IQR). Sin embargo, en algunos casos, es posible que necesitemos examinar la dispersión del conjunto de datos más allá de estas medidas típicas.
Aquí es donde el Coeficiente de Variación (CV) y el Coeficiente de Dispersión de Cuartiles (QCD) brindan información al comparar conjuntos de datos.
En este tutorial, exploraremos los dos conceptos de CV y QCD y responderemos las siguientes preguntas para cada uno de ellos:
- Desbloqueando la creatividad Cómo la inteligencia artificial generativa y Amazon SageMaker ayudan a las empresas a producir creatividades publicitarias para campañas de marketing con AWS
- Explorando opciones de resumen para Healthcare con Amazon SageMaker
- Código de Destilación de Conocimiento y Pesos de SD-Small y SD-Tiny de código abierto
- ¿Qué son y cómo se definen?
- ¿Cómo se pueden calcular?
- ¿Cómo se interpretan los resultados?
Todas las preguntas anteriores se responderán a fondo y a través de dos ejemplos.
Comprendiendo la Variabilidad y la Dispersión
Ya sea que estemos midiendo las alturas de las personas o los precios de las viviendas, rara vez encontramos que todos los puntos de datos sean iguales. No esperamos que todos sean iguales. Algunas personas son altas, promedio o bajas. Los datos generalmente varían. Para estudiar esta variabilidad o dispersión de los datos, generalmente la cuantificamos utilizando medidas como el rango, la varianza, la desviación estándar, etc. Las medidas de dispersión cuantifican qué tan dispersos están nuestros puntos de datos.
Sin embargo, ¿qué sucede si deseamos evaluar la variabilidad entre conjuntos de datos? Por ejemplo, ¿qué sucede si queremos comparar los precios de venta de una joyería y una librería? La desviación estándar no funcionará aquí, ya que las escalas de los dos conjuntos de datos probablemente sean muy diferentes.
El CV y el QCD son indicadores útiles de dispersión en este contexto.
Profundizando: Coeficiente de Variación
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Generación práctica de activos en 3D Una guía paso a paso
- Gigantesco Telescopio Adopta Robots de Mantenimiento Inteligentes
- 4 Herramientas de IA para trabajar con PDFs – Además de herramientas adicionales de bonificación
- Identificación Lingüística con Python
- Análisis de acordes de jazz con Transformers
- Principales artículos de Visión por Computadora durante la semana del 24/7 al 31/7
- 10 Mejores Herramientas de Intercambio de Caras de IA (Agosto 2023)