四年一度的世界杯进行到7月2日,8强名额仅剩4席!
如果你和我一样是一名伪球迷,请先了解以下注意事项:
每到世界杯,一项保留节目就是预测当年冠军,各路大神啦、名嘴啦、章鱼啦、猫猫狗狗啦都少不了。这次我也来预测一把。但我不懂球啊怎么办?没关系,我可以用程序!(反正都是蒙呗)日本章鱼哥:生前准确率100%已经挂彩,为世界杯最惨预言帝默哀三秒
日本章鱼哥“拉比奥”
数据来源
这份数据来自 Kaggle,是从1872年到2018年共38929场比赛的结果。我们这次就用这份数据作为预测的基础。
另外介绍下 Kaggle,它一个数据科学竞赛平台,强烈建议研究数据分析、机器学习这方面的同学多上去玩耍。
建立模型
有了这么多历史比赛数据,要怎么来预测呢?我建立了如下几条规则:
赛程模拟
基于以上的规则模型,我们导入数据,通过 Python 程序模拟本届世界杯32支球队的64场比赛。
这样就“预测”了比赛的结果。
预测结果
所以,究竟这份代码 run 出怎样的结果?
因为不同的起始年限和平局阈值会得到不一样的结果。我尝试使用 2006~2016 11个不同年限,和4组N的取值,得到共44组比赛结果。最终夺冠的次数是:
巴西 23 次
西班牙 12 次
德国 6 次
英格兰 3 次
看来,巴西队还是毋庸置疑的夺冠热门。难怪各大菠菜网站都给他们开出最低的赔率。
梅西:我1打3
C罗:我1打11
内马尔:11个打我!
如果对编程感兴趣,想了解更多的编程知识,关注头条号一起玩转编程