Skip to content

W. 世界杯数据

PKUJohnson edited this page Jun 20, 2018 · 1 revision

OpenDataTools通过worldcup接口,支持对世界杯比赛结果数据的获取,要求版本0.3.5以上。

数据来源:kaggle

导入worldcup接口

from opendatatools import worldcup

详细接口

  1. 使用前,请加载数据
df = worldcup.load_data()

一共有836场比赛的数据。(截至到2014年世界杯)

  1. 夺冠次数排名
df = worldcup.get_champion_rank()

巴西目前获得5次世界杯冠军,德国和意大利各四届,阿根廷和乌拉圭各两届。

  1. 参加冠亚军决赛次数排名
df = worldcup.get_finalgame_rank()

德国参加冠亚军决赛的次数最多8次,然后是巴西、意大利各6次,阿根廷5次。

  1. 统计进入决赛获得冠军的几率
import pandas as pd
df = pd.concat([df_finalgame, df_chanpion], axis=1)
df.fillna(0, inplace=True)
df['number of champions'] = df['number of champions'].apply(lambda x: int(x))
df['champion rate'] = df['number of champions'] / df['number of final games']

  • 乌拉圭、英格兰、西班牙都是一次进决赛就夺冠。
  • 1950年的世界杯没有决赛,乌拉圭夺冠。
  • 巴西决赛的效率最高、其次是意大利、德国,阿根廷夺冠效率最低。
  1. 获胜场次排名
df = worldcup.get_wingame_rank()

巴西和德国获胜场次领先。

  1. 参加场次排名
df = worldcup.get_game_rank()

巴西和德国参赛场次领先。

  1. 参加届数排名
df = worldcup.get_year_rank()

世界杯巴西全勤,德国和意大利只缺席了两届,阿根廷缺席了四届。墨西哥是世界杯常客。

  1. 进球统计
df = worldcup.get_goal_stat()

场均进球数在2-3之间,比较稳定。

  1. 冠军进球统计
df = worldcup.get_champion_goal_stat()

不难发现:冠军球队的防守能力都很强,失球数都很少。要想夺冠,先做好防守。

  1. 冠军球队第一场比赛的情况统计
df_stat, df_detail = worldcup.get_champion_fistgame_stat()

  • 统计冠军球队的第一场表现,17次获胜,2次打平,1次告负(2010年西班牙负瑞士)。

  • 从这个统计数据上看,目前莫斯科21届世界杯,德国首轮告负,巴西、阿根廷、西班牙、葡萄牙都战平,传统强队只有英格兰获胜。

  • 难道欧洲中国队(英格兰)这次要夺冠了?(纯属胡猜)