Módulo 8: El fichaje estrella - Introducción a Pandas
El director deportivo: gestionando la plantilla con Pandas
Hemos aprendido a programar, a crear listas y a diseñar funciones. Ahora, necesitamos una herramienta que nos permita gestionar no solo una convocatoria, sino la información de toda una liga, con todos sus jugadores, partidos y estadísticas. Necesitamos fichar a una superestrella para nuestro equipo de análisis, y esa superestrella se llama Pandas.
Pandas es una librería de Python, lo que significa que es un conjunto de código preescrito que podemos importar a nuestros proyectos para realizar tareas complejas de forma sencilla. Es, sin duda, la herramienta más fundamental y utilizada en el mundo del análisis de datos. Aprender a usarla es el paso definitivo para pasar de escribir scripts a realizar análisis de datos profesionales.
¿Qué es Pandas y qué nos permite hacer?
Si Python es el idioma, Pandas es el dialecto específico para hablar con datos tabulares (piensa en una hoja de Excel o una tabla en una base de datos). Nos da una estructura de datos increíblemente potente llamada DataFrame.
Un DataFrame es, en esencia, una tabla inteligente. Nos permite:
- Cargar datos desde múltiples fuentes (archivos CSV, Excel, bases de datos…).
- Limpiar y transformar los datos de forma masiva.
- Filtrar, agrupar y realizar cálculos complejos sobre la información.
- Manejar datos faltantes o incorrectos.
Para un analista de fútbol, un DataFrame podría contener todos los pases de un partido, las estadísticas de todos los jugadores de una temporada o los datos físicos de la plantilla.
La instalación: trayendo al nuevo fichaje
Como con cualquier librería externa, el primer paso es instalarla en nuestro entorno. A estas alturas, ya eres un experto en esto.
Abre tu terminal y ejecuta el siguiente comando:
pip install pandas
El primer contacto: cargando datos en un notebook
Ahora que tenemos a Pandas en nuestro equipo, vamos a ponerlo a prueba en nuestro taller, el Jupyter Notebook que configuramos en el módulo anterior.
Crea un archivo de datos
: Antes de cargar datos, necesitamos tenerlos. Crea un nuevo archivo en tu carpeta CursoPythonFutbol llamado plantilla_liverpool.csv. La extensión .csv significa “Comma-Separated Values” (Valores Separados por Comas), y es el formato más común para intercambiar datos tabulares. Pega el siguiente contenido dentro:
Jugador,Posicion,Dorsal
Alisson Becker,Portero,1
Virgil van Dijk,Defensa,4
Trent Alexander-Arnold,Defensa,66
Alexis Mac Allister,Mediocentro,10
Mohamed Salah,Delantero,11
Darwin Núñez,Delantero,9
-
Abre tu Jupyter Notebook: Lanza un nuevo notebook desde tu terminal (jupyter notebook).
-
Importa y usa Pandas: En la primera celda de tu notebook, escribiremos nuestro primer código con Pandas. Primero, importamos la librería y le damos un “apodo” (
pd
) para que sea más fácil de usar, una convención que verás en el 99% de los análisis de datos. Luego, le pediremos que lea nuestro archivo CSV.
# Importamos la librería pandas y la renombramos como pd
import pandas as pd
# Usamos la función de pandas para leer nuestro archivo .csv
df = pd.read_csv('plantilla_liverpool.csv')
- Explora los datos: La variable
df
ahora contiene nuestro DataFrame. Una de las primeras cosas que siempre se hace es explorar las primeras filas para asegurarse de que todo se ha cargado correctamente. Para ello, usamos el método.head()
. Escribe esto en una nueva celda y ejecútala:
df.head()
¡Y ahí está! Verás una tabla perfectamente formateada en la salida de la celda, mostrando los datos de nuestra plantilla.
Un nuevo comienzo
Este módulo es el final de tu introducción a los fundamentos y el verdadero comienzo de tu viaje como analista de datos. Has pasado de no tener nada a tener un entorno de desarrollo profesional, entiendes las bases de la programación y has cargado tu primer set de datos real con la herramienta más importante del sector.
A partir de aquí, el camino se abre a un mundo de posibilidades: crear visualizaciones avanzadas, analizar eventos de partidos, construir modelos predictivos y mucho más. ¡Felicidades por completar esta formación!