top of page

Big Data y Fútbol: Cómo crear un programa para filtrar los goles y partidos de La Sele 🇨🇷 con pandas


En los tiempos modernos de nuestro hermoso juego, ha sido muy común utilizar programas estadísticos como Python y R para ser más productivos y simplificar la numerosa colección de datos o lo que se conoce como "Big Data" o grandes datos en español.


En fútbol, especialmente el lado administrativo de una selección nacional o un club, naturalmente uno acumula una cantidad enorme de datos. En el siguiente articulo, les mostraremos la mejor manera de filtrar creando un programa de python específicamente para filtrar goles y partidos de La Selección Femenina de Costa Rica con pandas.

 

Programa para Partidos y Goles: Filtrando con pandas


Ante todo, tenemos que instalar y llamar a nuestro querido amigo, pandas 🐼:

import pandas as pd

Proseguimos con llamando nuestro archivo de partidos. Para este ejemplo, utilizaremos crcwnt_caps.csv, en otras palabras, las apariencias y goles de la convocatoria de la "Women's Revelations Cup" ⚽ en León, México 🇲🇽. Es importante poner el indice la seccion de 'Name' para utilizar data.loc en lugar de números. El método loc nos proporciona el acceso directo al marco de datos permitiendo la asignación a ubicaciones específicas. Adicionalmente, queremos solo ver las primeras 🔟 filas de la nuestro archivo .csv

data = pd.read_table('crcwnt_caps.csv', sep = ',' )
data.set_index('Name', inplace = True)
data.head(10)

Vemos que nuestra base de datos tiene una mezcla de números y textos. Para asegurar que nuestro programa reconoce bien los números, vamos a revisar los dtypes de nuestro marco de datos :

data.dtypes

Observamos que 'Caps' y 'Goals' son tipos int64 (un número entero)🔢 y 'Debut' y 'First Goal' son objetos (textos)🔤. Por dicha, no hay que convertir nada y podemos proseguir con nuestro análisis.


Ya tenemos nuestro marco de datos dentro del programa, ya podemos empezar aplicar diferentes técnicas exploratoria de data para sacar las respuestas de las siguientes preguntas :

  1. ¿Quién es la máxima goleadora ⚽ de La Sele Femenina 🇨🇷 de esta convocatoria?

  2. ¿Quién tiene los más partidos disputados 🥼 de La Sele Femenina 🇨🇷 de esta convocatoria?

  3. ¿Cuándo fue el debut de Gloriana Villalobos 👸🏼 en La Sele Femenina?

  4. ¿Quienes han disputado más de 50 partidos 💡 en La Sele Femenina 🇨🇷 ?

 

¿Quién es la máxima goleadora ⚽ de La Sele Femenina 🇨🇷 de esta convocatoria?

# Ordenar por la columna 'Goals'
data.sort_values(by=['Goals'], ascending=False).head(10)

Respuesta: Raquel Rodríguez con 54 goles en 96 partidos

 

¿Quién tiene los más partidos disputados 🥼 de La Sele Femenina 🇨🇷 de esta convocatoria?

# Ordenar por la columna 'Caps'
data.sort_values(by=['Caps'], ascending=False).head(10)

Respuesta: Katherine Alvarado 🚀 tiene la mayor cantidad de partidos 🥼 con La Sele Femenina 🇨🇷

 

¿Cuándo fue el debut de Gloriana Villalobos 👸🏼 en La Sele Femenina?

# Filtrar por 'Gloriana Villalobos'
data[data.index == 'Gloriana Villalobos']

Respuesta: Gloriana Villalobos 👸🏼 debutó con La Sele Femenina 🇨🇷 el 22 de mayo del 2014 vs El Salvador 🇸🇻

 

¿Quienes han disputado más de 50 partidos 💡 en La Sele Femenina 🇨🇷 ?

# Ordenar por la columna 'Caps'
experimentadas = data.sort_values(by=['Caps'], ascending=False)

# Identificar jugadoras con más de 50 partidos
experimentadas[(experimentadas['Caps'] > 50)]

Respuesta: 12 jugadoras tienen más de 50 partidos con La Sele Femenina 🇨🇷

 

Sumario


En este artículo explicamos lo que significa "Big Data" aplicado a fútbol. También explicamos cómo crear un programa para filtrar goles y partidos de La Selección Femenina de Costa Rica 🇨🇷.


Data :

crcwnt_caps
.csv
Download CSV • 1KB

Notebook :

filtrando_con_pandas
.ipynb
Download IPYNB • 23KB

Sigueme en Twitter : @theanatronfc

bottom of page