fifa世界杯数学建模(谁将捧起世界杯?别猜了,我们数学老师已经算出了结果!)

你是喜欢严密的数据分析,还是球星的灵光闪现?当数学遇上足球,我的数学老师准备教体育了,会产生什么样的化学反应?

fifa世界杯数学建模(谁将捧起世界杯?别猜了,我们数学老师已经算出了结果!)

“要踢得漂亮还是要赢球?这是一个世纪以来所有足球人共同的难题。奥地利因斯布鲁克大学(University of Innsbruck)的Zeileis A, Leitner C, Hornik K 等人近期进行的研究表明,本届俄罗斯世界杯的冠军将从德国和巴西两支队伍中产生。(但是吧,从最近的比赛看来,这位老师可能.....emmm)

但我们关注的是:数学家究竟是基于什么样的数据和方法,得出了这一预测结果?

fifa世界杯数学建模(谁将捧起世界杯?别猜了,我们数学老师已经算出了结果!)

图1. 各个国家队夺冠的概率,巴西、德国和西班牙位列前三。

答案是,他们应用了数值分析模拟的方式进行预测。对于这种方式,重要(也是首要)的是,根据“输入-输出”建立一个反应本质的数学模型。对于球队间输赢的预测,最直观、有效的输入数据有两个来源,一个是FIFA(国际足联)等组织给出的排名评分,另一个便是各家公司给出的赔率。Zeileis等人使用的正是赔率数据。他们的思路是这样的:

  • 假设每个球队都有一个能力值,这个值可以抽象地完全代表这支球队;
  • 如果我们知道了能力值,那么我们就可以计算出两队胜负概率,从而进一步计算出赔率;
  • 那么我们也可以反过来,在已知球队赔率的情况下,算出各个球队的能力值;
  • 接下来可以通过这个能力值按概率进行大量模拟,考虑世界杯可能出现的各种情况,最后得出结果。
  • 用能力值来预测模拟获胜概率的公式,最初由美国弗吉尼亚理工学院的Bradley和Terry在1952年提出:

    fifa世界杯数学建模(谁将捧起世界杯?别猜了,我们数学老师已经算出了结果!)

    如果我们知道了这个胜负的概率,就可以进一步模拟比赛的过程,算出每场比赛进程的可能性,也就可以预测大力神杯最有可能会被哪支球队捧起了。但正如上面思路中所介绍的,该课题组反其道而行之,他们想通过公司给出的赔率,推算出各队获得冠军的概率,然后再反过来计算出各个球队的“能力值“。为此,他们用计算机模拟了一百万次,让各队的能力值都能给出与赔率相符的结果。

    根据计算结果,能力值前7位排名如下:

    fifa世界杯数学建模(谁将捧起世界杯?别猜了,我们数学老师已经算出了结果!)

    确定了各队的能力值,可以做的便更多了,比如说计算小组出线的概率。这个研究组经过计算得出:C组的法国、E组的巴西和F组的德国为该组大热门,有超过90%的机会出线;G组英格兰和比利时恐怕要为小组头名争个头破血流;竞争最激烈的莫过于有着哥伦比亚与波兰的H组,该小组最热门的哥伦比亚出线概率只有约65%,但最低的日本也有接近40%的出线希望,而且有趣的是,计算结果更看好的是哥伦比亚,而不是该组的种子队波兰。事实上,通过这种方式,我们可以计算出所有球队的“生存曲线“,来预测各支球队在淘汰赛中能走多远。

    fifa世界杯数学建模(谁将捧起世界杯?别猜了,我们数学老师已经算出了结果!)

    图2. 2018世界杯各球队的生存曲线。

    袋鼠军团夺冠概率:0.1%

    来自澳大利亚阿德莱德大学的Steve Begg教授也对本届世界杯进行了预测。他取材的数据来自FIFA过去四年给出的排名,以及过去三届世界杯的比赛结果,用到的核心方法是“蒙特卡洛方法“。这种在二战期间发展起来的数值模拟方法,使得我们可以不用计算出每一种情况,而是通过类似于随机取点的方式,更快速准确地计算出结果。

    Steve Begg教授在使用FIFA排名数据的时候,还对其作了一定修正。例如,东道主俄罗斯会有一定的主场优势,弱队对抗强队时会更加专注。同时,在这个数学模型中,他还引入了两个不确定量:这届世界杯球队的整体状态和每场比赛的意外因素影响。这些影响参考了最近三届世界杯的比赛数据。

    Steve Begg教授用他自己提出的模型进行了十万次的模拟计算,虽然数量上远小于所有的可能结果(要知道仅小组赛就有近4.3亿种不同情况),但这种方法也可以对结果有一个足够精确的预测。不过遗憾的是,根据他的计算,袋鼠军团获得世界杯冠军的概率只有0.1%。

    这种由排名进行的预测,与奥地利研究组用赔率进行的预测相比,结果上有什么差别?奥地利研究组已经进行了对比,结果如下:

    fifa世界杯数学建模(谁将捧起世界杯?别猜了,我们数学老师已经算出了结果!)

    图3. 赔率计算的能力值与Elo等级分的对比

    我们可以看出,由赔率计算出的能力值的对数与Elo等级分很接近,相关系数达到了0.89。Elo等级分制度由匈牙利裔美国物理学家Arpad Elo创建,用于衡量各类对弈活动水平,是当今对弈水平评估公认的权威方法。这个结果与FIFA给出的排名也很接近,相关系数为0.76。两者出入的很大一部分,缘于排名并没有考虑诸如主场优势(俄罗斯赔率高出应有的排名很多)、球星受伤(不久前在欧冠决赛中受伤的埃及新星萨拉内很有可能在世界杯期间复出)等场外因素。我们得到的最新消息是,本届世界杯开赛前1天,西班牙队临阵换帅,这无疑将对之前的预测结果产生影响。

    另一方面,球迷的心中期望和球队实际能力并不完全相符。例如拥有众多球星的法国、比利时及阿根廷,大牌球星的吸粉能力让球迷们对他们的球队抱有更多期望,而公司必须对这些情况进行考虑。

    霍金曾为英格兰队制定夺冠方案

    相比数学家的统计模拟,物理学家的思维方式全然不同。前不久去世的著名理论物理学家霍金在2014年巴西世界杯之前,曾经对于英格兰如何能夺冠进行了研究,并为祖国的球队提出了一套事无巨细的夺冠方案:

    • 最佳气温为27℃,如果提高5℃会降低59%的胜率
    • 要穿红色的球衣而不是白色,红色可以让球员更舒适且更具有侵略性
    • 4-3-3的阵型更适合英格兰,而不是更常用的4-4-2
    • 在下午当地时间下午3点开球
    • 等等

    真希望英格兰足协能好好看看这些建议,要不然也不会只踢了三场比赛就直接回家。

    这些计算与预测究竟有多么精准?“概率具有主观性,它取决于你对事物的了解程度,”Begg教授说道,“我们根据已有的信息进行判断和预测,因此信息的准确性及推理的严密性是十分重要的。”

    如果足够细心的话,我们也会发现,虽然这些预测考虑了很多条件的影响,但对于影响比赛的复杂性和随机性因素的认识显然远远不够。例如,球队打法的相克性,世界杯期间球员的状态保持,主教练战术的布置以及转变等等,这些因素都没能很好地放入数学模型当中。显然,直到今天,我们依然对这个职业化已经有一百五十多年的运动不够了解。但这种不确定性也正是足球运动的魅力所在。

    “最终的结果只有在7月15日的决赛结束后才能清楚……要知道,公司一般都会保持15.2%的盈利,” Zeileis在论文中总结道,“我们不会去下注,这样我们就会有一个确定的结果,那就是:将有100%的几率享受一场令人激动的足球盛宴!“

    #中国数学教育#温馨提示:赔率有风险,看球须尽兴。