Prediciendo Touchdowns de Futbol Americano con Aprendizaje Automático
Prediciendo Touchdowns en el Fútbol Americano con Aprendizaje Automático
Fútbol. Un pasatiempo estadounidense que une a los fanáticos de todo el país. Con un promedio de 16.7 millones de vistas por partido y 113 millones de espectadores del Super Bowl LVII, claramente el deporte es amado por muchos. Creé un modelo de aprendizaje automático para desglosar y analizar el juego. Vamos a sumergirnos en él.
En primer lugar, debemos reconocer al jugador clave en la ofensiva de cualquier equipo de fútbol: el mariscal de campo. Este jugador distribuye el balón a sus compañeros de equipo con la esperanza de ganar yardas o, incluso mejor, anotar un touchdown (encuentra las reglas básicas del juego aquí). Los touchdowns recompensan a los equipos con la mayoría de puntos entre todas las opciones de puntuación, y aunque son difíciles de lograr, generalmente son una prioridad en la ofensiva. ¿Y si pudiéramos analizar los factores que llevan a los touchdowns y predecir qué mariscales de campo tendrán un mejor desempeño en las próximas temporadas?
Datos. Hay muchos datos de fútbol. Encontré archivos csv de jugada por jugada desde 1999 en este repositorio de GitHub (incluyendo nombres de jugadores clave, yardas ganadas, pases completados, etc.). Semejante cantidad de datos exige… ¡aprendizaje automático!
Características. Antes de crear el modelo de aprendizaje automático, tuve que determinar qué características tienen una mayor correlación con más touchdowns (¡hay 372 características en el conjunto de datos!). Mediante pruebas y gráficos de varios factores, encontré que los cinco factores que más se correlacionan con los touchdowns son las yardas ganadas, pases completados, pases en general, intercepciones y capturas. Estos factores se correlacionan de forma progresiva con menos touchdowns, y es importante recordar que la correlación no implica causalidad. Por ejemplo, si un mariscal de campo ha lanzado más intercepciones, eso podría ser simplemente una indicación de que ha jugado/lanzado mucho, lo cual también podría afectar su cantidad de touchdowns. Aunque correr puede ser un medio principal de anotación para algunos mariscales de campo, estos datos se refieren a todos los mariscales de campo de la liga. Esto significa que algunos valores atípicos podrían marcar más touchdowns sin lanzar tanto debido a que anotan a través de otros métodos, como correr.
- Explorando Google Cloud Platform Una Visión General Completa de Servicios y Capacidades
- Detrás de Ghostbuster El nuevo método de la Universidad de Berkeley para detectar contenido generado por IA
- Optimizando el análisis de datos Integrando GitHub Copilot en Databricks
![Correlación de touchdowns con estadísticas de la misma temporada](https://ai.miximages.com/miro.medium.com/v2/resize:fit:640/format:webp/1*NRdAFbPhrPbUaeK6XPyVrQ.png)
Año tras año. Es evidente que en un año determinado, ciertas estadísticas de los mariscales de campo se correlacionan con sus touchdowns. Sin embargo, ¿las estadísticas de la temporada anterior se correlacionarían con sus touchdowns? En otras palabras, ¿podrían las estadísticas de un mariscal de campo de una temporada indicar su rendimiento en la siguiente temporada? Necesitaba saberlo, ya que esto es fundamental para predecir qué mariscales de campo tendrán éxito en futuras temporadas. Después de graficar los touchdowns con las estadísticas de la temporada anterior, ¡descubrí que todavía hay una correlación! Además, esta vez también podemos incluir la correlación entre los touchdowns de la temporada anterior y la actual. Desafortunadamente, la correlación no es tan fuerte como antes, pero aún así significa que podemos pasar al siguiente paso: el aprendizaje automático.
![Correlación de touchdowns con estadísticas de la temporada anterior](https://ai.miximages.com/miro.medium.com/v2/resize:fit:640/format:webp/1*eVcRrwrMSqkFDT_CKOao4A.png)
Aprendizaje Automático. Al utilizar el aprendizaje automático, podemos predecir qué mariscales de campo tendrán un buen desempeño en la próxima temporada de fútbol. La regresión lineal, un término que quizás recuerdes de la clase de matemáticas, es la técnica de análisis de datos que predice el valor de datos desconocidos (touchdowns) utilizando otros datos relacionados y conocidos (las características que decidimos anteriormente). Creé el modelo de regresión lineal utilizando una división de prueba de entrenamiento (explicación sencilla). En realidad, también probé un modelo de bosque aleatorio, pero el modelo de regresión tuvo mejores resultados.
Y es posible que te preguntes, ¿un modelo de regresión lineal cuenta como aprendizaje automático? Sí, lo hace, principalmente porque implica el uso de técnicas estadísticas para aprender un modelo a partir de datos que pueden realizar predicciones o estimar relaciones entre variables; este concepto es bastante fundamental en el campo del aprendizaje automático.
Factores externos. Es importante tener en cuenta que muchos factores juegan un papel en determinar qué hace que un mariscal de campo sea “bueno”. Por ejemplo, los demás jugadores del equipo del mariscal de campo, la dirección de entrenamiento del mariscal de campo y sus habilidades específicas, como correr vs. pasar, también juegan un papel. Estos factores pueden ser difíciles de tener en cuenta en el proceso de entrenamiento y los efectos probablemente se verán en las predicciones finales. Por eso me enfoqué en este modelo solo en los touchdowns alcanzados en lugar de las clasificaciones generales de los mariscales de campo.
Resultados. Con un error cuadrático medio de 7.4649 (lo que significa que las predicciones están fuera por un promedio de ~7.5 touchdowns) y un puntaje de r-cuadrado de 0.709 (lo que significa que las variables tienen un fuerte efecto en la variable dependiente), diría que el modelo funcionó decentemente. ¡Espera, pero eso no suena muy bien! Como mencioné anteriormente, en el fútbol americano entran en juego otros factores como lesiones, novatos, etc. Mi modelo predijo con precisión 6 de los 10 máximos anotadores de touchdowns para 2022 basándose en datos de 2021, y las predicciones incorrectas se tuvieron en cuenta debido a la edad, lesiones y otros factores. También probé el modelo para predecir el éxito de los mariscales de campo en la próxima temporada de la NFL 23-24, ¡y fue bastante exitoso! Las 10 predicciones de los mariscales de campo con más anotaciones coincidieron con 7 de las 10 predicciones de Fox News, y las discrepancias se tuvieron en cuenta debido a lesiones, ser buenos en otras cosas (como yardas terrestres en lugar de lanzamientos), una mala temporada anterior o un nuevo equipo. Y quién sabe, ¡quizás mis predicciones resulten precisas!
![Predicciones de los 10 mejores mariscales de campo de la NFL para 2023-2024. ('Preds' significa touchdowns totales predichos)](https://ai.miximages.com/miro.medium.com/v2/resize:fit:640/format:webp/1*FHZGMoN8ANI8c6AJ-dDfgA.png)
¿Qué significa esto? Creé un modelo de aprendizaje automático que podría predecir los touchdowns de los mariscales de campo con una precisión razonablemente alta al encontrar patrones complejos en datos complejos. Esto demuestra lo poderoso que es el aprendizaje automático y cómo tiene una amplia variedad de aplicaciones. Es importante recordar que se requiere otra información en ciertas áreas, como el fútbol americano, para tomar el mejor juicio sobre jugadores y estadísticas. Sin embargo, ¿quién sabe? Tal vez el uso de este modelo pueda ayudarte a ganar apuestas o tus ligas de fútbol fantástico. ¿Y hay algo más que puedas hacer con esto? La aplicación más destacada es cuando analizas equipos y la liga en general. Si bien analizamos los touchdowns de los mariscales de campo con datos jugada por jugada de los años anteriores, también se pueden implementar y utilizar otras informaciones para analizar el éxito general de los mariscales de campo, distintas posiciones y equipos en general. Explorar datos del fútbol (o datos deportivos en general) puede revelar ideas y predicciones que pueden cambiar el juego. Acercarse al deporte desde un punto de vista analítico no es algo nuevo, pero estar equipado con la tecnología más poderosa que tenemos hoy seguramente revolucionará cómo entendemos, analizamos y destacamos en el juego.
Tal vez en el futuro podremos tener una computadora que haga predicciones perfectas de brackets o realice apuestas deportivas óptimas a través del aprendizaje automático…
Puedes encontrar mi código en mi repositorio de GitHub aquí.
A continuación, listaré algunos recursos y fuentes que pueden ser interesantes:
- Artículo académico sobre el análisis del fútbol con aprendizaje profundo
- Cómo la NFL está utilizando el aprendizaje automático
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- El papel proactivo de la IA en el combate a la corrupción en el gobierno
- Una Guía Completa para la División de Entrenamiento-Prueba-Validación en 2023
- La recuperación del conocimiento toma el centro del escenario
- El catálogo de modelos de inteligencia artificial de Azure de Microsoft se expande con modelos innovadores de inteligencia artificial
- Desbloquea el avance de la comprensión de video de IA con MM-VID para GPT-4V(isión)
- Humane lanza un revolucionario wearable con inteligencia artificial el AI Pin
- Creando un GPT personalizado Lecciones y consejos