Prediciendo Touchdowns de Futbol Americano con Aprendizaje Automático

Prediciendo Touchdowns en el Fútbol Americano con Aprendizaje Automático

Fútbol. Un pasatiempo estadounidense que une a los fanáticos de todo el país. Con un promedio de 16.7 millones de vistas por partido y 113 millones de espectadores del Super Bowl LVII, claramente el deporte es amado por muchos. Creé un modelo de aprendizaje automático para desglosar y analizar el juego. Vamos a sumergirnos en él.

En primer lugar, debemos reconocer al jugador clave en la ofensiva de cualquier equipo de fútbol: el mariscal de campo. Este jugador distribuye el balón a sus compañeros de equipo con la esperanza de ganar yardas o, incluso mejor, anotar un touchdown (encuentra las reglas básicas del juego aquí). Los touchdowns recompensan a los equipos con la mayoría de puntos entre todas las opciones de puntuación, y aunque son difíciles de lograr, generalmente son una prioridad en la ofensiva. ¿Y si pudiéramos analizar los factores que llevan a los touchdowns y predecir qué mariscales de campo tendrán un mejor desempeño en las próximas temporadas?

Foto de Keith Johnston en Unsplash

Datos. Hay muchos datos de fútbol. Encontré archivos csv de jugada por jugada desde 1999 en este repositorio de GitHub (incluyendo nombres de jugadores clave, yardas ganadas, pases completados, etc.). Semejante cantidad de datos exige… ¡aprendizaje automático!

Características. Antes de crear el modelo de aprendizaje automático, tuve que determinar qué características tienen una mayor correlación con más touchdowns (¡hay 372 características en el conjunto de datos!). Mediante pruebas y gráficos de varios factores, encontré que los cinco factores que más se correlacionan con los touchdowns son las yardas ganadas, pases completados, pases en general, intercepciones y capturas. Estos factores se correlacionan de forma progresiva con menos touchdowns, y es importante recordar que la correlación no implica causalidad. Por ejemplo, si un mariscal de campo ha lanzado más intercepciones, eso podría ser simplemente una indicación de que ha jugado/lanzado mucho, lo cual también podría afectar su cantidad de touchdowns. Aunque correr puede ser un medio principal de anotación para algunos mariscales de campo, estos datos se refieren a todos los mariscales de campo de la liga. Esto significa que algunos valores atípicos podrían marcar más touchdowns sin lanzar tanto debido a que anotan a través de otros métodos, como correr.

Correlación de touchdowns con estadísticas de la misma temporada

Año tras año. Es evidente que en un año determinado, ciertas estadísticas de los mariscales de campo se correlacionan con sus touchdowns. Sin embargo, ¿las estadísticas de la temporada anterior se correlacionarían con sus touchdowns? En otras palabras, ¿podrían las estadísticas de un mariscal de campo de una temporada indicar su rendimiento en la siguiente temporada? Necesitaba saberlo, ya que esto es fundamental para predecir qué mariscales de campo tendrán éxito en futuras temporadas. Después de graficar los touchdowns con las estadísticas de la temporada anterior, ¡descubrí que todavía hay una correlación! Además, esta vez también podemos incluir la correlación entre los touchdowns de la temporada anterior y la actual. Desafortunadamente, la correlación no es tan fuerte como antes, pero aún así significa que podemos pasar al siguiente paso: el aprendizaje automático.

Correlación de touchdowns con estadísticas de la temporada anterior

Aprendizaje Automático. Al utilizar el aprendizaje automático, podemos predecir qué mariscales de campo tendrán un buen desempeño en la próxima temporada de fútbol. La regresión lineal, un término que quizás recuerdes de la clase de matemáticas, es la técnica de análisis de datos que predice el valor de datos desconocidos (touchdowns) utilizando otros datos relacionados y conocidos (las características que decidimos anteriormente). Creé el modelo de regresión lineal utilizando una división de prueba de entrenamiento (explicación sencilla). En realidad, también probé un modelo de bosque aleatorio, pero el modelo de regresión tuvo mejores resultados.

Y es posible que te preguntes, ¿un modelo de regresión lineal cuenta como aprendizaje automático? Sí, lo hace, principalmente porque implica el uso de técnicas estadísticas para aprender un modelo a partir de datos que pueden realizar predicciones o estimar relaciones entre variables; este concepto es bastante fundamental en el campo del aprendizaje automático.

Factores externos. Es importante tener en cuenta que muchos factores juegan un papel en determinar qué hace que un mariscal de campo sea “bueno”. Por ejemplo, los demás jugadores del equipo del mariscal de campo, la dirección de entrenamiento del mariscal de campo y sus habilidades específicas, como correr vs. pasar, también juegan un papel. Estos factores pueden ser difíciles de tener en cuenta en el proceso de entrenamiento y los efectos probablemente se verán en las predicciones finales. Por eso me enfoqué en este modelo solo en los touchdowns alcanzados en lugar de las clasificaciones generales de los mariscales de campo.

Resultados. Con un error cuadrático medio de 7.4649 (lo que significa que las predicciones están fuera por un promedio de ~7.5 touchdowns) y un puntaje de r-cuadrado de 0.709 (lo que significa que las variables tienen un fuerte efecto en la variable dependiente), diría que el modelo funcionó decentemente. ¡Espera, pero eso no suena muy bien! Como mencioné anteriormente, en el fútbol americano entran en juego otros factores como lesiones, novatos, etc. Mi modelo predijo con precisión 6 de los 10 máximos anotadores de touchdowns para 2022 basándose en datos de 2021, y las predicciones incorrectas se tuvieron en cuenta debido a la edad, lesiones y otros factores. También probé el modelo para predecir el éxito de los mariscales de campo en la próxima temporada de la NFL 23-24, ¡y fue bastante exitoso! Las 10 predicciones de los mariscales de campo con más anotaciones coincidieron con 7 de las 10 predicciones de Fox News, y las discrepancias se tuvieron en cuenta debido a lesiones, ser buenos en otras cosas (como yardas terrestres en lugar de lanzamientos), una mala temporada anterior o un nuevo equipo. Y quién sabe, ¡quizás mis predicciones resulten precisas!

Predicciones de los 10 mejores mariscales de campo de la NFL para 2023-2024. ('Preds' significa touchdowns totales predichos)

¿Qué significa esto? Creé un modelo de aprendizaje automático que podría predecir los touchdowns de los mariscales de campo con una precisión razonablemente alta al encontrar patrones complejos en datos complejos. Esto demuestra lo poderoso que es el aprendizaje automático y cómo tiene una amplia variedad de aplicaciones. Es importante recordar que se requiere otra información en ciertas áreas, como el fútbol americano, para tomar el mejor juicio sobre jugadores y estadísticas. Sin embargo, ¿quién sabe? Tal vez el uso de este modelo pueda ayudarte a ganar apuestas o tus ligas de fútbol fantástico. ¿Y hay algo más que puedas hacer con esto? La aplicación más destacada es cuando analizas equipos y la liga en general. Si bien analizamos los touchdowns de los mariscales de campo con datos jugada por jugada de los años anteriores, también se pueden implementar y utilizar otras informaciones para analizar el éxito general de los mariscales de campo, distintas posiciones y equipos en general. Explorar datos del fútbol (o datos deportivos en general) puede revelar ideas y predicciones que pueden cambiar el juego. Acercarse al deporte desde un punto de vista analítico no es algo nuevo, pero estar equipado con la tecnología más poderosa que tenemos hoy seguramente revolucionará cómo entendemos, analizamos y destacamos en el juego.

Tal vez en el futuro podremos tener una computadora que haga predicciones perfectas de brackets o realice apuestas deportivas óptimas a través del aprendizaje automático…

Puedes encontrar mi código en mi repositorio de GitHub aquí.

A continuación, listaré algunos recursos y fuentes que pueden ser interesantes:

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Desbloquea el avance de la comprensión de video de IA con MM-VID para GPT-4V(isión)

En todo el mundo, las personas crean una gran cantidad de videos todos los días, incluyendo transmisiones en vivo gen...

Aprendizaje Automático

Conoce Paella Un Nuevo Modelo de IA Similar a Difusión que Puede Generar Imágenes de Alta Calidad Mucho Más Rápido que Usando Difusión Estable.

Durante los últimos 2-3 años, ha habido un aumento fenomenal en la calidad y cantidad de investigación realizada en l...

Ciencia de Datos

Creando Operaciones de Aprendizaje Automático para Empresas

En mi carrera, he notado que la clave para estrategias exitosas de inteligencia artificial radica en la capacidad de ...

Inteligencia Artificial

En el Festival de Wagner, la nueva tecnología revela una brecha de liderazgo

El uso de la realidad aumentada en una producción de la ópera Parsifal que inaugura el Festival de Bayreuth de Aleman...

Inteligencia Artificial

La SEC le está dando a las empresas cuatro días para informar ciberataques

Los críticos cuestionan si las nuevas reglas podrían causar más daño que beneficio.

Inteligencia Artificial

Esta investigación de OpenAI presenta DALL-E 3 Revolucionando los modelos de texto a imagen con capacidades mejoradas de seguimiento de indicaciones.

En inteligencia artificial, la búsqueda de mejorar los modelos de generación de texto a imagen ha ganado una gran inf...