Skip to content

Latest commit

 

History

History
45 lines (38 loc) · 3.5 KB

README.md

File metadata and controls

45 lines (38 loc) · 3.5 KB

Pandas_Bundesliga_Analisis 🔴⚫⚽🏆📉📊

Análisis de datos de la Bundesliga temporada 2005 hasta 2023 con Pandas y Numpy

Resumen 📖

En el proyecto realizado, se llevó a cabo un análisis exhaustivo de los datos de la Bundesliga desde la temporada 2005 hasta la temporada 2023. Para realizar este análisis, se utilizó el archivo de datos en formato CSV que contenía información detallada sobre los partidos, equipos y estadísticas de la liga. El primer paso fue importar las bibliotecas de pandas y numpy, que son herramientas esenciales en el análisis de datos en Python. Se cargó el archivo CSV en un DataFrame de pandas para facilitar la manipulación y exploración de los datos. A continuación, se procedió a explorar los datos mediante diversas técnicas. Se examinaron las dimensiones del DataFrame, las columnas disponibles y se inspeccionaron las primeras filas para obtener una visión general de la estructura y el formato de los datos. Se verificaron los tipos de datos de cada columna y se realizaron conversiones si fuera necesario. Una vez que los datos fueron preparados, se aplicaron diversas técnicas de análisis para obtener información significativa sobre la Bundesliga. Se calcularon estadísticas descriptivas, como la media, mediana en datos como goles marcados, partidos ganados y puntajes finales.

Construido con 🛠️

A continuación se muestran las herramientas utilizadas para crear el proyecto.

Documentación oficial de cada herramienta:

Algunas Características adicionales del proyecto:

  • El proyecto es compatible con la versión actual de Python 3.11.3, lo cual garantiza su compatibilidad con las últimas versiones de la herramienta.
  • Se confeccionó en un cuaderno Jupyter, por lo de querer utilizarlo debería tener preparado un entorno jupyter o google colab.
  • Se requiere tener instalado las librerías de numpy y pandas en el entorno de programación de su preferencia.
  • Se utilizó un dataset encontrado en kaggle para trabajar los conocimientos básicos de pandas y numpy. Archivo utilizando Football | Bundesliga Seasons 2005/06 - 2022/23
  • El proyecto aplica conocimientos de pandas como:
    • Crear un DataFrame y PandasSeries.
    • Funciones groupby.
    • loc, iloc,
    • PandasRead, columns, head, tails.
    • Condicionales, value_counts, append.
    • Combinando DataFrames con concat.
    • Funciones, funciones lambdas con apply.

Librerías utilizadas en el proyecto:

  • pandas: Es una herramienta de análisis y manipulación de datos de código abierto para el lenguaje de programación Python. Proporciona estructuras de datos eficientes y flexibles para trabajar con datos tabulares, como series temporales, datos numéricos y datos con etiquetas.
  • numpy: Es una librería de Python ampliamente utilizada para realizar cálculos numéricos y manipulación de matrices. Proporciona una estructura de datos de matriz multidimensional y funciones matemáticas para realizar operaciones eficientes en matrices.

Autor ✒️


⌨️ con ❤️ por Omar Flores 😊