Las dos métricas que revelan la verdadera dispersión de datos más allá de la desviación estándar

Dos métricas revelan dispersión de datos más allá de desviación estándar

ESTADÍSTICAS

Una guía para calcular e interpretar el coeficiente de variación y el coeficiente de dispersión de cuartiles

Imagen generada por el autor utilizando StockImg.AI

Introducción

Todos hemos escuchado el dicho, “La variedad es el condimento de la vida”, y en los datos, esa variedad o diversidad a menudo toma la forma de dispersión.

La dispersión de datos hace que los datos sean fascinantes al resaltar patrones e ideas que de otra manera no habríamos encontrado. Típicamente, utilizamos las siguientes medidas de dispersión: varianza, desviación estándar, rango y rango intercuartílico (IQR). Sin embargo, en algunos casos, es posible que necesitemos examinar la dispersión del conjunto de datos más allá de estas medidas típicas.

Aquí es donde el Coeficiente de Variación (CV) y el Coeficiente de Dispersión de Cuartiles (QCD) brindan información al comparar conjuntos de datos.

En este tutorial, exploraremos los dos conceptos de CV y QCD y responderemos las siguientes preguntas para cada uno de ellos:

  • ¿Qué son y cómo se definen?
  • ¿Cómo se pueden calcular?
  • ¿Cómo se interpretan los resultados?

Todas las preguntas anteriores se responderán a fondo y a través de dos ejemplos.

Comprendiendo la Variabilidad y la Dispersión

Ya sea que estemos midiendo las alturas de las personas o los precios de las viviendas, rara vez encontramos que todos los puntos de datos sean iguales. No esperamos que todos sean iguales. Algunas personas son altas, promedio o bajas. Los datos generalmente varían. Para estudiar esta variabilidad o dispersión de los datos, generalmente la cuantificamos utilizando medidas como el rango, la varianza, la desviación estándar, etc. Las medidas de dispersión cuantifican qué tan dispersos están nuestros puntos de datos.

Sin embargo, ¿qué sucede si deseamos evaluar la variabilidad entre conjuntos de datos? Por ejemplo, ¿qué sucede si queremos comparar los precios de venta de una joyería y una librería? La desviación estándar no funcionará aquí, ya que las escalas de los dos conjuntos de datos probablemente sean muy diferentes.

El CV y el QCD son indicadores útiles de dispersión en este contexto.

Profundizando: Coeficiente de Variación

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Personalizando compañeros de codificación para organizaciones

Los modelos de IA generativa para compañeros de codificación se entrenan principalmente con código fuente disponible ...

Inteligencia Artificial

Los robots reciben una mejora 'gripante' ¡AO-Grasp enseña a los bots el arte de no dejar caer tus cosas!

En los últimos años, los robots han encontrado un mayor uso en diversas industrias, desde la fabricación hasta la ate...

Inteligencia Artificial

Este artículo AI propone AugGPT un enfoque de ampliación de datos de texto basado en ChatGPT.

NLP, o Procesamiento del Lenguaje Natural, es un campo de la IA que se centra en la interacción entre humanos y compu...