Módulo 9: ¡Partido terminado! ¿Y ahora qué?
El pitido final: resumen del partido
¡Felicidades por llegar hasta el final! Has completado un viaje intensivo desde los conceptos más básicos de la programación hasta realizar tu primer análisis de datos real. No es un logro menor. Miremos por un momento todo el terreno que hemos cubierto:
- Entendiste el “porqué”: Comprendiste cómo Python y los datos están cambiando el fútbol profesional.
- Construiste tu “vestuario”: Instalaste un entorno de desarrollo profesional con Python y VS Code.
- Aprendiste las reglas del juego: Dominas los fundamentos de la programación, incluyendo variables, listas, bucles y funciones.
- Entraste al “taller”: Te familiarizaste con los Jupyter Notebooks, el estándar de la industria para el análisis interactivo.
- Fichaste a tu “estrella”: Cargaste y exploraste tus primeros datos con Pandas, la librería más importante para un analista.
Has construido una base increíblemente sólida. Ahora, es momento de ponerla a prueba.
El reto final: la tanda de penaltis
Es hora de que tomes el balón. Te propongo un pequeño reto para que apliques todo lo que has aprendido.
Tu Misión: Te proporciono un pequeño set de datos con los máximos asistentes de la Premier League. Tu objetivo es escribir un script en tu Jupyter Notebook que determine quién fue el líder en asistencias.
-
Crea un nuevo archivo CSV: En la misma carpeta de tu curso, crea un archivo llamado
asistencias_pl.csv
y pega estos datos:Jugador,Equipo,Asistencias Kevin De Bruyne,Manchester City,16 Mohamed Salah,Liverpool,12 Leandro Trossard,Arsenal,10 Michael Olise,Crystal Palace,11 Bukayo Saka,Arsenal,9
-
Escribe el código en tu notebook: Ahora, en una celda de tu Jupyter Notebook, escribe el código necesario para: a. Cargar el archivo
asistencias_pl.csv
en un DataFrame de Pandas. b. Encontrar la fila del jugador con el mayor número de asistencias. c. Imprimir un mensaje claro con el resultado.Pista: Después de cargar el DataFrame (llamémoslo
df
), puedes encontrar el índice del valor máximo condf['Asistencias'].idxmax()
.
Solución Sugerida:
import pandas as pd
# Cargar los datos
df = pd.read_csv('asistencias_pl.csv')
# Encontrar la fila del máximo asistente
lider_asistencias = df.loc[df['Asistencias'].idxmax()]
# Obtener los datos del jugador
jugador = lider_asistencias['Jugador']
asistencias = lider_asistencias['Asistencias']
# Imprimir el resultado
print(f"El líder en asistencias es {jugador} con {asistencias} asistencias.")
Si lograste completar este reto, has validado exitosamente todas las habilidades que aprendimos.
La próxima temporada: Python intermedio para fútbol
Este curso ha sido el calentamiento; has aprendido las reglas y a controlar el balón. En la próxima formación, “Python Intermedio para Fútbol”, nos sumergiremos en el análisis táctico. Dejaremos de ser jugadores y nos convertiremos en analistas.
Aprenderás a usar Pandas a un nivel más profundo para responder preguntas reales de un partido:
-
Filtrado de Datos Avanzado: ¿Cómo podemos aislar todos los pases que hizo un jugador específico en el último tercio del campo?
-
Manipulación de DataFrames: Aprenderemos a combinar diferentes sets de datos. Por ejemplo, unir las estadísticas de un jugador con la información de su equipo.
-
Agrupación y Agregación: ¿Cuál es el promedio de distancia de tiro de cada equipo? ¿Qué jugador es el que más pases progresivos intenta?
-
Análisis Básico de Partidos: Trabajaremos con un set de datos de un partido completo para empezar a extraer insights tácticos sencillos.
Este ha sido solo el comienzo. ¡Gracias por acompañarme en esta formación y prepárate para la próxima temporada, donde empezaremos a analizar el juego de verdad!