世界杯数据分析(你不知道的足球大数据,让我们先回顾一下上届世界杯的大数据吧!)

要说到世界杯预测,曾经的“预言帝”是挺谁谁输的“乌鸦嘴”球王贝利和几乎百发百中的章鱼保罗。可如今贝利偶尔也能蒙对了,章鱼保罗也去了天堂,今年世界杯的“水晶球”掌握在大公司的手里——从互联网行业的谷歌、百度、微软、雅虎,到投资银行公司高盛和德意志银行,包括新闻业的彭博社,都成了章鱼保罗的传人,并且战果颇丰——谷歌预测中了首届世界杯的所有16强席位。

这些大佬手里的“水晶球”就是大数据:谷歌主要依赖Opta Sports的数据,评估了每个职业足球联盟过去多个赛季的情况,以及世界杯小组赛期间的统计数据;该系统还使用了由BigQuery工程师开发的实力排行榜系统,同时考虑了观众热情程度数据,以计算主队优势。而微软运用一个特别复杂的数据模型,赋予不同的参数不同的系数,得出最终的结论,当基础数据不足时,就会更多地依仗数据。

世界杯数据分析(你不知道的足球大数据,让我们先回顾一下上届世界杯的大数据吧!)

与微软类似,百度整合分析了过去5年内全世界987支球队的3.7万场比赛数据,再加上对469家欧赔公司的赔率数据分析等等,构建起最终的数据模型。据悉,该模型共涉及到19972名球员和1.12亿条相关数据,所参考的数据包括百度搜索数据、球队基础数据、球员基础数据、赔率市场数据等,所分析的球队不仅包括207支国家队,还囊括了欧洲、南美、亚洲等联赛俱乐部及低级别球队信息。有个东北85后女孩押宝正确率超过70%,在平台“宝”累计中奖人民币330多万元,她自称“制胜秘诀”除了对足球的热爱和冷静缜密的分析能力之外,还有百度的大数据分析。

世界杯数据分析(你不知道的足球大数据,让我们先回顾一下上届世界杯的大数据吧!)

事实上,上届世界杯夺冠的德国队也是大数据的得益者。他们与早在NBA数据统计领域取得丰富经验的SAP公司共同研发了球员数据采集和分析软件。在这套名为Match Insights的足球解决方案中,球员的运动轨迹、进球率、攻击范围等数据都会通过飞速运算而得以呈现,之后教练会针对球员的表现提出建议和改进方案,对手的情况也能被数据化地掌握。

经济界专业人士提醒大家,由于世界杯这种顶尖赛事,球员都是最顶级的球员,发挥失常的概率非常低,大数据才有可能派上用场。而如果模型选择不当,大数据预测也会成为“乌鸦嘴”——本来一向预测准确的雅虎,2014年为推广业务而乱用模型,导致预测结果错误大半。而高盛、德银和彭博三家传统的华尔街公司也栽了跟头。

世界杯数据分析(你不知道的足球大数据,让我们先回顾一下上届世界杯的大数据吧!)

高盛世界杯报告的出品人是经济学家凯文·戴利(Kevin Daly),他带领高盛的量化分析师建立了自1960年以来正式国际足球比赛数据的模型,对其进行回归分析。但高盛在上届世界杯的八强预测错了三个(哥斯达黎加、比利时和哥伦比亚),四强错了一个(西班牙),小组赛的赛果正确率只有37.5%。

彭博的方法与高盛类似,在各国国家队FIFA积分的基础上模拟了1万次比赛结果,结果认为西班牙会在和阿根廷打平后点球进入决赛,最终输给巴西,但实际情况则是西班牙早已回家。德意志银行的模型综合了FIFA排名、历史战绩、球员构成和球赔率等因素,计算结果是巴西无缘八强,英格兰将夺冠。

由此看来,大数据分析只是一种工具,使用不当反而坏了自家名声。

世界杯数据分析(你不知道的足球大数据,让我们先回顾一下上届世界杯的大数据吧!)

各大商家也在使出浑身解数,利用大数据赚球迷口袋里的钱。

根据大数据解决方案供应商Admaster(精硕科技)上届世界杯的数据,球迷在世界杯期间最想喝的是可乐和啤酒,零食选择则以水果和中式点心为主。事实也正是如此:来自淘宝天猫数据显示,上届世界杯的6月1日-7月13日,淘宝天猫啤酒共销售了超过3000万罐,与往年同期相比增长近3倍。而世界杯期间,淘宝上的跑腿生意也比往常多了1/3,尤其是热门球队比赛,给球迷代买零食送货上门的夜宵服务就特别火。

阿里研究院的数据表明,女性经济在世界杯特色产业中占据半壁江山。男性和女性,在世界杯期间展现出截然不同的消费行为。很多女球迷只会看有偶像球星出场的比赛,她们喜欢关注有关世界杯的体育节目,对偶像球星的关注热情非常高,所以梅西的10号背心才会在宠物圈成为潮服。这个年龄段的女性也最有消费能力,对一些品牌服装、化妆品的营销是个好机会。

世界杯数据分析(你不知道的足球大数据,让我们先回顾一下上届世界杯的大数据吧!)

社交网络在世界杯中打了漂亮一仗。在中国的微信、微博,还有视频、交友网站上,每天有超过1亿球迷吐露心声,社交媒体相关讨论每天都在10亿条上下。南非世界杯上,Facebook和Twitter的月平均活跃用户数量分别为5亿和2亿。巴西世界杯,这组数据已经上升到了12.8亿和2.55亿。此外,Instagram的图片日平均分享量为6000万张、月平均活跃用户数量超过了2亿。1.41亿的Facebook用户发生了4.59亿次关于世界杯的交流活动。

根据Admaster对世界杯关联的中国用户构成分析,世界杯这场盛宴中球迷只占14%的比重,余下的86%都是伪球迷。在 “边看比赛边吐槽”这个群体中,男性和女性比例为55.6%和44.4%。他们在社交媒体上的活跃时间也不同——经过分析判断,世界杯期间 00:00-08:00专业球迷出没;08:00-12:00专业球迷休息,半专业球迷、伪球迷关注赛事热点;12:00-00:00全体出没,关注点繁多。

世界杯数据分析(你不知道的足球大数据,让我们先回顾一下上届世界杯的大数据吧!)

以腾讯为例,企鹅帝国通过与AdMaster合作,全景扫描社交网络及移动活动网站的数据及实时分析支持,围绕世界杯赛场内外,在每个热点发生时用平均几分钟的时间制作出两百多幅打动人心的即时海报。根据对球迷、伪球迷、外围人士浏览时间、媒体接触及关心话题的精准分析,腾讯用实时赛事信息、衍生内容和热门话题内容对用户进行24小时、多渠道维度的营销,在世界杯一个月期间随时影响着用户。据悉,世界杯期间每天参与互动的腾讯用户接近1亿,而有比赛时QQ手机版消息量与没比赛时相比翻倍。世界杯期间QQ音乐用户与足球相关曲目累计播放次数也高达1.6亿次。

当越来越多的企业从大数据中尝到甜头之后,世界杯也无疑为大数据产业做了最好的广告。看看今年俄罗斯2018世界杯17个赞助商中,中国企业就占据7席:7家企业分别为万达、海信、蒙牛、vivo,雅迪、指点艺境和帝牌国际。海信和Vivo各花费了1亿左右美元,蒙牛花费5000万美元左右。央视主持人白岩松的言论在微博上火了。他在新闻报道中评论道:俄罗斯世界杯中国除了足球队没去,其他的基本上都去了。

世界杯数据分析(你不知道的足球大数据,让我们先回顾一下上届世界杯的大数据吧!)