自库尔图瓦和切尔西闹崩以来,至少中文网络环境中,此人就一直处于风口浪尖之上,盼他惨的比盼他好的人多得多。另一方面,纳瓦斯随队斩获欧冠三连冠,“纳爹”英名远播。两下对比之下,皇马的决策简直不可理喻。于是问题就来了:库尔图瓦到底差不差?纳瓦斯到底强不强?我们又该怎么去证明围绕这个命题得出的结论?
首先我们必须回答这样一个问题:门将,到底能不能评价?
一个合理的逻辑是:用球队战绩作为评价球员的标准,是长期以来因评价手段缺失而导致的重大错误——给梅西配10个我,这支球队连中甲水平都达不到,但你能因此说梅西是中甲级别的球员么?
然而传统的个人评价机制作用于门将身上,本就不小的偏差还会被进一步无限放大:一方面,录像对门将而言极其不公,因为你盯着常规的转播机位录像看90分钟,可能70分钟的时间里,门将都不会出现在 镜头里。另一方面,过去的数据机制,干扰因素也太多。比如以失球数计算,很显然忽略了一名门将所处的整体球队环境,这和拿球队战绩说事并无本质区别;而那种以“零封”场次为依据的评价体系,更是只能用“扯淡”来形容——门将A一场比赛因对手没射正做到零封,第二场被打成筛子狂丢8球,门将B两场比赛各丢1球,显然门将B表现更好,但门将A却因做到了一次“零封”而获得更高评价,试问“零封”数据有多大意义?
然而,这并不表示门将表现不能量化。大数据的应用带来了一项高阶数据——“预期失球数”(Ecpected Conceded Goals),英文简称XCG。尽管不同公司的算法存在差异,但其基本理念却是一致的——预期进球数是在射门发生前,量化一次射门的进球概率,你可以理解为“进球难度”;预期失球数,则是在射门发生后,量化进球概率,你可以理解为“扑救难度”。
于是,我们可以依据XCG和实际失球数,再结合对手射正次数,计算出一名门将的扑救能力,我将之定义为“阻止对手射门得分率”,算法为——“阻止对手射门得分率=(XCG-实际失球数)/对手射正次数*100%”。为什么是“射正”而不是“射门”?很简单,因为没打在球门范围内的射门,和门将没有半毛钱关系,偏偏大多数射门,其实都是偏离目标的干扰项。以西甲为例,上赛季所有球队,只有34.61%的射门命中目标。至于最后的乘以100%,则是为了让数据视觉效果更好,毕竟“XCG”本身就是对对手射正进球概率的量化,以百分比来显示处理后的结果也未为不可。
以这个数据为量化标准,我选择了5名和皇马算是有直接或间接关系的门将,尴尬的是,在wyscout数据库统计的范围内(也即15-16赛季至今),库尔图瓦,是5人中无可争议的最差……
库尔图瓦:双负值的尴尬……
这是库尔图瓦近4个赛季的“阻止对手射门得分率”,从2015-16赛季至今,他在英超与西甲联赛一共出场124次,欧冠则是16次,并且全部打满全场,样本已经不小了。打出两项皆为负数的“阻止对手射门得分率”,真的是一个相当相当糟糕的表现。获得FIFA最佳门将,除了样本极小的世界杯权重过高之外,就只能说明FIFA的评价机制是多么不靠谱。事实上我们今天选取的5名门将里,只有库尔图瓦的两项数据皆为负值……
此处对于皇马而言唯一的好消息是,从库尔图瓦联赛的“阻止对手射门得分率”变化趋势来看,此人在上赛季末到这赛季初,表现虽未有明显提高,但却变得稳定了不少:
那么,为什么说纳瓦斯比库尔图瓦好得多?
纳瓦斯:实力 运气,那就比库尔图瓦好看太多了
纳瓦斯的数据简直比库尔图瓦好的不要太多……
此处需要注意的是,纳瓦斯在皇马其实算得上运气不错——4个赛季里尽管不可避免的会出现状态下滑的情况,但纳瓦斯状态不好的时候,刚好赶上了球队进攻火力爆棚阶段,所以那段时间过多的丢球给外界留下的印象不深。下图是纳瓦斯近4季联赛的阻止对手射门变化图:
圆圈圈住的是纳瓦斯表现不好的一段时间,那是16-17赛季前半段的比赛。那段时间什么情况?皇马几乎场场丢球,但进攻火力猛的一批,而且动不动只赢对手一个球。于是,纳瓦斯相对糟糕的表现,并未导致太过严重的结果。
而偏偏全队联赛中凉凉的时候,纳瓦斯还在样本相对较小的欧冠里,动不动来一出“超神”演出,皇马欧冠三连战绩加持下,纳瓦斯得到的评价,也自然会高于其大样本下呈现出的真实情况。纳瓦斯在欧冠中打出了一个非常特殊的现象——此人往往一场比赛表现不佳后,下一场欧冠必然高接抵挡不可突破,这也相当符合大众“后面比前面更重要”的偏颇价值标准——实际上,决定最终结果的是两回合累积比分,欧冠历史上次回合奋起直追最终差一口气的案例,丝毫不比惊天逆转少。
注意上图的几个过山车……纳瓦斯能做到这点,也真是让人不得不服。
阿雷奥拉:目前来看并不比库尔图瓦强到哪里去
只看这个图的话,其实阿雷奥拉还不如库尔图瓦:联赛层面他必库尔图瓦略好,好歹保持在了一个微弱的正值;但欧战-7.8%的数据简直糟糕透顶。问题是,阿雷奥拉22场欧战的样本多少有些偏小;而且以其年龄来看,完全不排除前期年轻交学费的因素。因此,目前来看只能说他不比库尔图瓦强多少,倒不能说他真的就很差。
事实上,以折线图来看,阿雷奥拉的扑救功力总体而言是在上升的,而且其具体走势,也颇为符合“比利亚雷亚尔惊艳-被巴黎看上后撞墙-度过适应其后回升”的年轻球员经典路径。大样本的联赛来看,阿雷奥拉其实是受加盟巴黎之初糟糕表现的拖累,总体而言未来倒还值得期待:
蓝色圆圈圈住的区域内,阿雷奥拉的阻止对手射门得分率暴跌,正是这段时间的惨淡表现,导致其总体数据看上去不太好。但实际上距离目前更近的一段时间内,此人表现有了明显的回升。尽管法甲竞争力弱于英超、西甲,但至少近期履历看,阿雷奥拉比起库尔图瓦y一点也不吃亏。
特尔施特根:皇马最大竞争对手,无限接近顶级门将
只看数据,其实特尔施特根不如纳瓦斯,但问题是,这是4个赛季的数据。由于两人年龄上存在差异,特尔施特根实际上处于上升期,而纳瓦斯则是下滑期——其实如果是考虑和巴萨在同位置上的对比,皇马想换门将是可以理解的,只不过换来的那位太坑了而已。
其实整个15-16赛季,特尔施特根在巴萨仅仅出场了5次;16-17赛季他才正式成为球队主力。因此严格来说取特尔施特根4个赛季的数据同纳瓦斯作对比是不公平的。事实上如果看两人都作为西甲球队主力的16-17和17-18赛季,特尔施特根的阻止对手射门得分率以2.9%比1.5%略微领先。
这还是16-17赛季积攒一年之后的结果,自17-18赛季开始,特尔施特根连着两年联赛的阻止对手射门得分率都在6%以上,已经是顶级表现了。他的折线图看起来确实有厚积薄发的感觉:
很明显,上赛季除了偶有一两场较差表现之外,特尔施特根基本都维持了比较高的阻止对手射门得分率。实际上他对巴萨的影响,比梅西小不了太多。
奥布拉克:最让皇马眼馋的人
看看上面这张图——在4个赛季的长度里,把两个统计项目中的阻止对手射门得分率,都保持在6%以上,这才是真正的顶级门神!
昨天在直播吧新闻里看到了一条回复:皇马把比利时一门和法国一门(其实法国一门是洛里)集中到一块,还是干不过斯洛文尼亚国门。我只能说这既是大实话,又是废话——能和斯洛文尼亚一门比的,可能只有目前的巴西一门,难不成让皇马强撸阿利松么……
仅仅经过极短适应期后,奥布拉克就表现出令人咋舌的稳定性,此人联赛的阻止对手射门得分率折线图自16-17赛季后半段开始,看上去就和前面几位呈现出天壤之别:
对比之前那几位动辄过山车一般的走势,奥布拉克中间这段(黄色圆圈区域)的表现,是不是太稳定了?
这里需要指出的是:在我做逼抢风格解析的专题(详情点击深度解析:同样是高位逼抢,他们和他们,不一样)时,评论区有声音让我做一期马竞的回顾,其实真做出来的话,可能情怀要比实质意义更大——上赛季开始,马竞的防守能力出现了极大滑坡,其对手的预期进球数其实只是西甲第3低的,最终失球数之少吊打其他所有球队,很大程度上靠的就是奥布拉克在门线上兜底。
这也造成了球队防守乃至战绩,都对奥布拉克依赖严重。上图其实可以显示,在上赛季西甲开局后的一段时间里(红色圆圈区域),奥布拉克的阻止对手射门得分率出现了下滑,这段时间,恰恰是欧冠小组赛比较集中的时段,当时马竞在那个死亡小组中的表现可谓跌宕起伏,最终出现碰尤文,也就是那个时段不稳定表现留下的伏笔。
就我目前看录像的经验来看,用这套算法量化门将的扑救能力,基本上是比较靠谱的。当然,XCG建模本身在不断发展,样本选择也是不断变化的,所以,这个数据其实是动态的,未来肯定会出现更靠谱的XCG评估,所以,“阻止对手射门得分率”也一定会越来越接近真实情况。这也是所有数据分析的终极走向:它永远不可能完全反映客观真实,但却一定会距离客观真实越来越接近。
对皇马而言,最蛋疼的事情是:折腾了一圈,怎么看库尔图瓦都不如纳瓦斯,尽管纳瓦斯也只是优秀而非顶级;而比蛋疼更蛋疼的事是:你费了这么大劲更新门将,最后西甲最好的两名门将,一个在巴萨,一个在马竞……
(花花午夜嚎叫)