-
Notifications
You must be signed in to change notification settings - Fork 331
W. 世界杯数据
PKUJohnson edited this page Jun 20, 2018
·
1 revision
OpenDataTools通过worldcup接口,支持对世界杯比赛结果数据的获取,要求版本0.3.5以上。
数据来源:kaggle
from opendatatools import worldcup
- 使用前,请加载数据
df = worldcup.load_data()
一共有836场比赛的数据。(截至到2014年世界杯)
- 夺冠次数排名
df = worldcup.get_champion_rank()
巴西目前获得5次世界杯冠军,德国和意大利各四届,阿根廷和乌拉圭各两届。
- 参加冠亚军决赛次数排名
df = worldcup.get_finalgame_rank()
德国参加冠亚军决赛的次数最多8次,然后是巴西、意大利各6次,阿根廷5次。
- 统计进入决赛获得冠军的几率
import pandas as pd
df = pd.concat([df_finalgame, df_chanpion], axis=1)
df.fillna(0, inplace=True)
df['number of champions'] = df['number of champions'].apply(lambda x: int(x))
df['champion rate'] = df['number of champions'] / df['number of final games']
- 乌拉圭、英格兰、西班牙都是一次进决赛就夺冠。
- 1950年的世界杯没有决赛,乌拉圭夺冠。
- 巴西决赛的效率最高、其次是意大利、德国,阿根廷夺冠效率最低。
- 获胜场次排名
df = worldcup.get_wingame_rank()
巴西和德国获胜场次领先。
- 参加场次排名
df = worldcup.get_game_rank()
巴西和德国参赛场次领先。
- 参加届数排名
df = worldcup.get_year_rank()
世界杯巴西全勤,德国和意大利只缺席了两届,阿根廷缺席了四届。墨西哥是世界杯常客。
- 进球统计
df = worldcup.get_goal_stat()
场均进球数在2-3之间,比较稳定。
- 冠军进球统计
df = worldcup.get_champion_goal_stat()
不难发现:冠军球队的防守能力都很强,失球数都很少。要想夺冠,先做好防守。
- 冠军球队第一场比赛的情况统计
df_stat, df_detail = worldcup.get_champion_fistgame_stat()
-
统计冠军球队的第一场表现,17次获胜,2次打平,1次告负(2010年西班牙负瑞士)。
-
从这个统计数据上看,目前莫斯科21届世界杯,德国首轮告负,巴西、阿根廷、西班牙、葡萄牙都战平,传统强队只有英格兰获胜。
-
难道欧洲中国队(英格兰)这次要夺冠了?(纯属胡猜)