Cómo utilizar la prueba t y su contraparte no paramétrica
Uso de prueba t y su versión no paramétrica
¿Realmente comprendes esta prueba que probablemente aprendiste en la escuela secundaria?
Como científico de datos, sería bueno que comprendas algunas estadísticas. Después de todo, es uno de los pilares de este campo.
Este es el primer artículo de una serie en la que intentaremos dar una visión general concisa y práctica de diferentes pruebas estadísticas y las situaciones en las que deben utilizarse. La información buscará un equilibro: no será tan larga y técnica como para ser inaccesible, pero tampoco tan corta como para ser inútil.
En este primer artículo, hablaré sobre una de las pruebas estadísticas más conocidas: la prueba t. Incluso si no sabes exactamente qué es, es probable que hayas oído hablar de ella. Al final de este artículo, deberías comprender cómo funciona la prueba y cuándo debes utilizarla.
Si no estás familiarizado en general con el diseño de pruebas estadísticas, te recomiendo encarecidamente que leas el artículo introductorio de esta serie, Un Prontuario de Conceptos Fundamentales que Necesitas Conocer para Realizar Pruebas Estadísticas.
- ¿Cuál es la conexión entre los Transformers y las Máquinas de Vectores de Soporte? Revelando el sesgo implícito y la geometría de optimización en las arquitecturas de los Transformers
- Conoce a CodiumAI El Asistente Definitivo para Pruebas Basado en Inteligencia Artificial para Desarrolladores
- Salesforce presenta la nueva plataforma Einstein 1 Elevando la productividad y la confianza del cliente a través de la IA impulsada por datos y el CRM.
Entonces, empecemos.
¿Qué es la prueba t?
En esencia, la prueba t se utiliza para comparar datos de dos muestras diferentes. Toma en cuenta dos factores: la diferencia entre las medias de las muestras y la variabilidad de los datos de las muestras. Lógicamente, esto tiene sentido, simplemente comparar las medias no es suficiente para determinar si las muestras son realmente diferentes (las medias podrían diferir mucho con conjuntos de datos similares, o ser similares con conjuntos de datos muy diferentes).
La prueba t calcula una estadística conocida como el valor t, que tiene en cuenta ambos factores mencionados anteriormente. Puede calcularse manualmente utilizando una fórmula algo molesta, pero prácticamente cualquier software estadístico lo calculará automáticamente por ti. Si calculas la estadística manualmente, puedes compararla con un valor t crítico de tablas preexistentes (si el valor t es mayor que el valor t crítico, corresponde a que el valor p es menor que el nivel deseado para tu prueba, lo que indica una diferencia estadísticamente significativa entre muestras). Una vez más, el software estadístico generalmente te dirá si el valor t calculado es estadísticamente…
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Desbloqueando la eficiencia en Transformers de Visión Cómo los MoEs de Visión Móvil Escasos superan a sus contrapartes densas en aplicaciones con recursos limitados
- La inteligencia artificial de Alibaba, Tongyi Qianwen, está abierta al público.
- ¿ChatGPT tomará trabajos de ciencia de datos?
- Gestión de memoria en Apache Spark Derrame en disco
- Competencias culturales para la gestión de riesgos del aprendizaje automático
- Drones abordan la seguridad de los tiburones en las playas de Nueva York
- Mejorando la Ajuste de Hiperparámetros con el Estimador Parzen Estructurado en Árbol (Hyperopt)