Ana De Souza
29 de abr de 20202 min.
En los tiempos modernos de nuestro hermoso juego, ha sido muy común utilizar programas estadísticos como Python y R para ser más productivos y simplificar la numerosa colección de datos o lo que se conoce como "Big Data" o grandes datos en español.
Big Data es un término evolutivo que describe cualquier cantidad voluminosa de datos estructurados, semi-estructurados y no estructurados que tienen potencial de ser extraídos para obtener información. Ojo, la clave del éxito de Big Data no es la cantidad de data, si no las conclusiones que uno saca con la data.
En fútbol, especialmente el lado administrativo de una selección nacional o un club, naturalmente uno acumula una cantidad enorme de datos. En el siguiente articulo, les mostraremos la mejor manera de filtrar creando un programa de python específicamente para el manejo administrativo de partidos con pandas.
Ante todo, tenemos que instalar y llamar a nuestro querido amigo, pandas:
import pandas as pd
Proseguimos con llamando nuestro marco de datos. Para este ejemplo, utilizaremos JAM_Data.csv, en otras palabras, los partidos de las Reggae Girlz durante el año 2019 y 2020. Es importante poner el indice la seccion de 'Rival' para utilizar data.loc en lugar de números. El método loc nos proporciona el acceso directo al marco de datos permitiendo la asignación a ubicaciones específicas.
data = pd.read_table('JAM_Data.csv', sep = ',' )
data.columns = ['Rival','Año','Fecha','Marcador','Resultado','Lugar','Estadio','Torneo']
data.set_index('Rival', inplace = True)
data
Ya tenemos nuestro marco de datos dentro del programa, ya podemos empezar a filtrar nuestras variables.
data.loc["MEX"]
filtro_año = data.Año == 2020
data[filtro_año]
filtro_lugar = data.Lugar == "Grenoble, France"
data[filtro_lugar]
filtro_estadio = data.Estadio == "National Stadium"
data[filtro_estadio]
En este artículo explicamos lo que significa "Big Data" aplicado a fútbol. También explicamos cómo crear un programa para el manejo de partidos haciendo una introducción a cómo filtrar y utilizar pandas con data de partidos.