世界杯球迷或成为最大输家(谁是世界杯最大输家?这群傲慢精英们的“毒毒毒奶”把世界强队坑惨了)

世界杯球迷或成为最大输家(谁是世界杯最大输家?这群傲慢精英们的“毒毒毒奶”把世界强队坑惨了)

世界杯球迷或成为最大输家(谁是世界杯最大输家?这群傲慢精英们的“毒毒毒奶”把世界强队坑惨了)

高盛公司(Goldman Sachs)用于预测世界杯的统计模型看上去相当优秀:这家投行挖掘了各个球队及球员的数据,利用人工智能预测了可能影响比分的因素,并模拟了100万种赛事的走向。模型随着赛事的进展持续更新,但其预测结果却错了一次又一次。它完全没料到决赛的对阵双方是法国和克罗地亚。

预测足球赛结果的失灵给了人们一个嘲笑傲慢的精英银行家们(他们也在投资决策中使用了类似的复杂模型)的好机会。对冲基金Upper Left Opportunities Fund的创始人汤姆·佩尔(Tom Pair)近日在Twitter上写道:

世界杯球迷或成为最大输家(谁是世界杯最大输家?这群傲慢精英们的“毒毒毒奶”把世界强队坑惨了)

瑞银进行了1万次模拟,预测德国将赢得世界杯。高盛进行了100万次模拟,并预测巴西将成为冠军。这两支球队都没有进入半决赛。这两家银行都使用相同的技术来进行市场预测。纸上谈兵而已!

当然,过往的数据并不总能预测未来;高盛也从未让客户完全基于其模型的发现来做决定。而且,模型只能生成获胜或晋级的概率,在它给出的对世界杯冠军的预测中,没有一支球队的概率高于18.5%。这个故事的寓意或许在于:大数据和人工智能等备受瞩目的科技未必能带来更准确的统计预测。

在2014年世界杯期间,高盛也给出了不那么野心勃勃的统计预测。它只使用了一些球队统计数据,比如此前10场官方国际赛事中的进球数,球队排名,以及一些计算球队离家距离的变量。其最初的模拟结果是:德国在半决赛中以1:2输给巴西,巴西在决赛中以3:1战胜阿根廷。它还预测出2010年的冠军西班牙会在半决赛中败给阿根廷。

实际结果则是,西班牙在小组赛中出局,德国7:1大胜巴西,并最终抱走了大力神杯。事后,高盛的经济学家扬·哈丘斯(Jan Hatzius)和斯文·雅里·施特恩(Sven Jari Stehn)认为模型失败的原因是足球的“内在无序性”,他们写道:模型的预测是巴西2:1战胜德国,结果却是德国7:1大胜巴西。我们对此感到遗憾。但作为德国人,我们也注意到有些事比正确更重要。

世界杯球迷或成为最大输家(谁是世界杯最大输家?这群傲慢精英们的“毒毒毒奶”把世界强队坑惨了)

高盛

为了在2018年再接再厉,高盛的经济学家们将关于球队和个人球员的海量数据灌输给了4种不同类型的机器学习模型,以检验统计学的预测能力。他们通过模拟赛程计算出了每场比赛最有可能的比分结果。加入球员水平变量(如球员在球队中的平均排名,以及防守和进攻能力的指标)后的最初结果看上去很令人鼓舞。此次的模型在AI的帮助下纳入了更加颗粒化的数据,因此理应优于2014年的模型。

但它的表现反而更差。

2014年的模型预测的半决赛球队中有3支命中,因此还不算太离谱。巴西的历史性惨败属于孤立事件,任何一个热爱足球的国家都不会忘记这场比赛。计算机绝无可能猜中这样的结果。

2018年,这家投行最初预测的半决赛名单是巴西、法国、德国和葡萄牙;决赛则会以巴西击败德国告终。结果,这些球队中只有法国进入了四强名单。

高盛在比赛过程中不断更新模型。其6月29日预测的决赛球队是巴西和西班牙,7月4日的预测则是巴西和法国。最近的一次预测又变成由英格兰和比利时争夺大力神杯。结果,这两支球队在半决赛中双双出局。

当然,这些预测并非百万美元的下注,甚至并非信誓旦旦。“这些预测仍是高度不确定的,虽然采用了最煞费苦心的统计技术,但足球实在是一项难以预料的运动,”施特恩和他的同事马那夫·乔杜里(Manav Chaudhary)和尼古拉斯·福塞特(Nicholas Fawcett)写道。“这当然也正是世界杯如此激动人心的原因所在。”

好在他们最后的预测没有失手。

世界杯球迷或成为最大输家(谁是世界杯最大输家?这群傲慢精英们的“毒毒毒奶”把世界强队坑惨了)

瑞银

公正地讲,高盛并非唯一一家未能用其先进的模型完成这项复杂任务的银行。例如,瑞银(UBS)给出的夺冠概率从高到低依次是:德国、巴西、西班牙和英格兰。根据这家银行的数据,克罗地亚打进半决赛的几率只有4.4%。另外,公司以及与公司合作的学者们的预测也是半斤八两。

但高盛的失灵或许是最有趣的。得益于现代科技,模型制作中可以纳入的细节程度已经非常之高,由此就带来了能够提升预测能力的错觉。但即便是最精心搭建的、AI驱动的、详尽数据挖掘的模型,在复杂度上也永远不及真实的生活。足球还只是一项几十个人参与的规则严明的运动,影响比赛结果的因素已经非常多:球员伤病、队内矛盾、裁判、天气、教练的失误以及神来一脚等等。相比之下,对于大的企业、行业以及国家的行为和表现,大概就更难基于过往的数据进行建模了。

我们不应被当今模型的技术先进性蒙蔽了判断。即使拼尽全力,我们也无法将生活锁进一个数据库中。

(本文内容不代表彭博编辑委员会、彭博有限合伙企业、《商业周刊/中文版》及其所有者的观点。)

撰文:Leonid Bershidsky 编辑:王越丁 翻译:程玺

◆ ◆ ◆ ◆ ◆

点击你感兴趣的关键词

立即获得关于TA的更多信息!

......

世界杯球迷或成为最大输家(谁是世界杯最大输家?这群傲慢精英们的“毒毒毒奶”把世界强队坑惨了)