解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

昨天,发了一篇《数据可视化|从C罗到吉鲁,头球手都有哪些类型?

在文章的最后让大家试着猜一猜这张图中的26个形状分别对应了哪些球员。

回复中其实有人已经猜到了拉莫斯是哪一个,我觉得非常厉害。现在是时候来公布完整的答案了。

不过鉴于我在图表构建的细节上做了一些小修改,以及方便新读者阅读,在公布答案之前,我还是先过一遍读图的教程(不想看的朋友们可以直接跳到后面的球员部分):

整个项目我都在尝试雷达图的新玩法——如何将精准的图表与创意的视觉设计进行结合,来解读一些有意思的数据,讲述与众不同的球员故事。这一章节里,我将会借助不同球员雷达图的「形状」特点不同,来直观地对他们的场上表现进行分类。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

构建视觉空间

首先,这是八边形上的八个参数,按照位置分成三组:

1 左边三个是 「头球攻门」 相关的数据

2 右边三个是 「用脚射门」 相关的数据

3 上下两个是 「空中对抗」 相关的数据,如下图:

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

选择有效样本

我选择了14/15赛季以来,五大联赛打进头球最多的30名球员(超过10球)来作为 「所有优秀头球手总体」 的一个 「样本」。具体名单如下(按头球进球数排序,更新至2018.5.15):

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

设置均值参考

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

现在想象一下,如果一个球员在每一个参数上都是我选出的这30个人的平均水平(如上图),那么这个人就代表者 「优秀头球手的平均水准线(优秀头球手之壁,txtx)」,是吧?

NO!!然而事情并没有这么简单。我们的这30个人,显然只是历史上众多优秀头球手的一个样本,所以这30个人 「样本的均值」 并不一定是所有优秀头球手 「总体的均值」 ,我们的样本很可能有偏差(比如有人倾向于厚古薄今,有人倾向于厚今薄古,所以过去4年里头球最厉害的30个人,历史上是什么水准真不好说)。然而我们可以借助统计手段——置信区间,解决这个问题,如下图:

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

灰色区域代表着95%的置信区间,也就是说,如果我们随机抽100次样本,95次 「总体的均值」 会落在这个范围内——所以我们可以说,这整个灰色区域,代表者 「优秀头球手的平均水准」。只有超出这个区域,才能叫统计意义上的高于平均,比如下面四种不同的情况:

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

0°/180°对角线:进球效率。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

45°/225°对角线:射门频率。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

90°/270°对角线:空中对抗,总数(上),成功数(下)。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

135°/315°对角线:预期进球(xG),进攻跑位和射门难度的估计。

划分球员类型

那么下面问题来了。这些参数组合,理论上存在多少种不同的类型?

回想一下,我们之前把这八个数据按照区域位置分了成三类:1 「头球攻门」,2 「用脚射门」,3「空中对抗」。一个球员至少擅长其中一种,最多三种,所以,排列组合得到:擅长1,擅长2,擅长3,擅长1和2,擅长1和 3,擅长2和3,擅长全部,一共7种不同情况(当然,不考虑都不擅长的情况,这种人大概是进不了这30人名单的):

I 只擅长1 「头球攻门」,纯头球手,射门渣渣。这类人的图像是一个 「开口向左的扇形」,具体的定义标准是左三项显著高于其余五项。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

II只擅长2「用脚射门」,真射门员,头球只是附带。这类人的图像是一个「开口向右的扇形」,定义标准是右三项数据显著高于其余五项。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

III只擅长3「空中对抗」,支点型高中锋。这类人的图像是一个 纵向发展的「尖锥形」,上下二项显著高于其余六项。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

IV擅长1「头球攻门」和2「用脚射门」,不擅3「空中对抗」。全能型得分手,然而做支点能力不行。这类人的形状是一个左右对称的「蝴蝶型」,左右六项显著高于其他两项。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

V擅长1「头球攻门」和3「空中对抗」,全能型头球手,可回撤当支点,可前插抢头球,脚下的技术成为唯一的制约。这类人的形状是一个「面向左边的半圆」,左三项和上下二项显著高于其他三项。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

VI擅长2「用脚射门」和2「空中对抗」,不擅1「头球攻门」,支点型射手??(我自己造的词……)看似非常奇怪的组合,现实中并不常见,这类人的形状是一个「面向右边的半圆」,右三项和上下二项显著高于左三项。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

VII擅长全部。超级全能前锋,真·八边形战士,现实中几乎不存在。这类人的形状是「近圆形」,定义的标准是八项数据没有一项显著高于其他。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

至此所有的铺垫完毕。


30人雷达图详细盘点

按匹配度分档——谁才是各自类型的典型球员?

首先,常识告诉我们,并不是所以球员都可以完美定义类型——总会有一些比另一些更典型。因此,根据球员雷达图和上述七大类型的匹配程度,可以大致分成三个档次:

第一档:完美匹配。

这些人简直就是各自类别的模板,不仅看上去像,而且严格符合类型定义中的标准。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

头球射术皆顶级,单凭印象流都可以判断,C罗毫无疑问是第四类 「蝴蝶型」 全能得分手,而他的雷达图形状恰恰说明了这一点。这个 「蝴蝶型」 标准的可怕——定义中要求的六项攻门数据全都超出了灰色均值区域,和他同类型的再无人能做到;两项争顶数据也同时低于均值,说明C罗这几年在场上完全不是支点中锋的打法。留意一下,C罗是所有30人里面,超出灰色均值参数最多的(6项)!!

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

天王盖地虎,标准如吉鲁!第一类 「左扇形」 纯头球手的代表,3项头球攻门的数据已经强到快要突破天际。至于用脚射门,自然不是很强,但也压在均值的灰色区域内。同时大家留意一下,吉鲁是所有30人里面,唯一的八项数据都不低于均值的(至少都达到灰色区域)!!

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

中超强行抢戏系列。这个数据还是在莫得斯特来中超之前,在德甲刷出来的。我看中超比赛比较少,有了解的JRs可以说一说莫得斯特在权健的表现如何。不过,单从这张图还是能很清楚地看出权健买人的用意:这是一个标准的第三类 「尖锥形」 支点前锋,空中优势强大,射门也不差。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

北伦敦的两位当家前锋,凯恩和奥巴梅杨,俩人几乎是一个模子里刻出来的,都是非常完美的第二类 「右扇形」 真·射门员(伪·头球手)。让人好奇,这究竟是历史的巧合,还是……

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

阿圭罗能进这个榜单,真的是一个谜。首先,他的类型和前面北伦敦的俩一样,是 「右扇形」 射手,这个本身就很迷了:如果你说,他这个身高争头球肯定不行,所以是这种类型不意外,但是你想想,前面那俩大兄弟那身高足够了吧,怎么也是和阿圭罗一样这种类型?迷。换个思路,有人会说,阿圭罗进的头球很可能是得益于风骚的走位和稳定的吃饼。然而你看仔细了,头球xG的那项数据,远远低于均值,比前面那俩大兄弟也都低,说明难度是极高的。都是吃饼,怎么会难度高?迷。总之,阿圭罗的头球就是个迷。


第二档:略有瑕疵。

这些人基本符合各自的模板,在一两个地方会有细微的出入。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

大圣。首先,贝尔是比目鱼,哦不,是蝴蝶型,和C罗一样——这个很有意思。传统的观念来说,锋线搭档通常要 「互补」才能有好的效果,比如欧文-赫斯基组合。然而另一种思路是,锋线球员类型「同质化」才能达到最佳效果,比如巴萨的MSN就是,每个人都有很强的持球过人射门的能力。而从本文的雷达图来看,C罗和贝尔都是蝴蝶型,也很 「同质化」,兼具头顶脚踢,让人猜想皇马的锋线选择也应当是走的 「同质化」 这个思路——这大概就是为什么很多人觉得,莱万会很适合皇马,因为莱万的模板也是 「蝴蝶型」 (后面会讲到)。然而这样一想,本泽马就很尴尬了,难道本泽马也是 「蝴蝶型」 ?我看球少不要骗我……

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

法尔考。法尔考是 「蝴蝶型」 也不让人意外。毕竟巅峰时期的法尔考也是以头顶脚踢全能而著称。现在即便不再巅峰,然而球员踢法并没有改变。这个就是雷达图妙的地方——形状代表球员风格和打法,所以当球员因为表现起伏数据上下波动时,雷达图的形状并不会改变,改变的是面积大小。所以相信巅峰的法尔考应该是比现在更大一号,更标准的蝴蝶型。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

卢卡库。被诟病喜欢拉边不喜欢当支点、争顶能力差,已经是历史遗留问题了。这张图来看,不喜欢当支点这一说法,应该可以洗洗睡了。卢卡库的形状是一个标准的 「尖锥形」,也就是第三类,支点中锋。然而这个尖锥形的瑕疵在于,相比顶端,底端不够尖——而底端恰恰是成功争顶的数据。所以说,争顶成功率低,这个还是名副其实的。不过卢卡库这个赛季的成功争顶已经有了明显进步(去除这个赛季的数据,正下方的成功争顶都达不到灰色均值区域),因此我们可以预测,他的 「尖锥形」 在未来几年应当会变得越来越标准。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

西甲老妖阿杜里斯。其实已经很接近一个完美模板了,头球射门数稍多,进球效率稍低影响了整体的形状。然而考虑到他今年37岁了……很好奇,年轻几年的阿杜里斯是什么形状。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

又是一位老妖,略伦特。略伦特的这个图的形状也是相当诡异。乍一看四不像,如果把正下方突出来的角去掉,是一个标准的 「左扇形」。然而如果把上方 「总争顶数」 的角向上挪,又像是一个 「左半圆」。个人倾向于前者。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

瓦格纳。瓦格纳的图形基本上是一个完美的 「尖锥形」 支点中锋。而他左边和左上凸起来的部分,是头球的进球效率和xG,也就是说,他不仅有支点能力,还是一个效率较高、跑位精湛的头球杀手。刚刚看到他落选了世界杯德国的大名单,怎么说呢,有点可惜了。


第三档:勉强能算。

这类人的形状乍一看和模板相去甚远,只能通过定义来判断。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

红贝贝。和之前的略伦特类似,贝洛蒂的图像也有两种可能的读法。把上下两个代表 「头球争顶」 的两个角削掉一些,就是一个 「右扇形」 了;而把下方的的 「成功争顶数」 的角向下挪,又会是符合 「右半圆」 的定义。然而无论是哪一种,贝洛蒂始终没有一项真正超出均值区域的——也就是说,想成为各自类型的顶级,还有一段很长的路要走。值得一提的是,贝洛蒂是30人里面唯一一个真正意义的接近 「右半圆」 这种稀有类型的。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

来了!见识一下!这才是真正的前锋!惊不惊喜,意不意外?不多说了。水爷的图,论形状,其实挺好判断的,不该出现在这一类。他放在这一类,是因为形状虽标准,尺寸不到位。「尖锥形」 是要求上下两端超出均值的灰色区域的,水爷的暂时不够——但是大家也都知道水爷这是什么情况,哈哈。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

西布朗的隆东。英超球迷应该会比较熟悉,冲击力很强的锋线球员。从图中看,尖锥形还是比较明显的,然而左下角突出的射门频率,两侧凹陷的进球效率,严重影响了这一类型中间宽,上下窄的整体形状。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

效力于马赛,前摩纳哥的前锋热尔曼。外形几乎无法判断类型,只能通过定义——争顶两项数据有一项达到均值而其余都没有达到,因此总体上,上下两项高于左右六项,符合第三类 「尖锥形」 的定义。

可以明显感觉的到,到他这里,球员形状的诡异程度已经上升到完全不能通过肉眼的形状感知来判断其类型了——也就是说,已经达到我们这一套可视化系统的极限了。不过值得庆幸的是,比这还糟糕的也就只剩楼下西汉姆的安东尼奥了。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

最后,西汉姆的安东尼奥。这个可能是所有人里面最最诡异的图形了。因为头球效率高我勉强划分到第一类 「左扇形」 纯头球手,然而其实并不是很理想。这个说明一个问题,要么是因为球员本身是真奇葩,要么则是因为已有的三个参数(头球攻门,用脚射门,空中对抗)组合成的七种类型,还不足以准确地定义这种类型的球员。或许需要引入一个新的维度才可以。


「缺了一角」 球员——可能是本期最精彩的部分!

这一类球员的图形很有欺骗性。他们和模板的匹配度看似很低,但仅仅只是因为缺了一个关键的角——只要把这个角补上,他们的匹配度立刻上升一到两个档次。换句话说,他们距离各自的理想模板仅仅是差在一项关键数据上——然而这一 「角」 之差,却是天壤之别。来看看都有哪些人!

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

如图,这是一个莫拉塔细胞减数分裂成莫拉头和莫拉脚的图(大雾):左半边是莫拉头,右半边是莫拉脚。和莫拉头相比,莫拉脚的 「进球效率」 那个角就像被砍了一半一样,真的尴尬。补上这个角,左右才能平衡,才是理想的 「蝴蝶型」 莫拉塔。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

格子出现在这个榜单上我不意外。格子本身就是一个很难定位的球员。大部分人认为是二前锋,然而二前锋本身就很难定义,不同的二前锋踢法上的区别,可能比二前锋和其他位置之间的差别都大。这张图上来看,格子的形状最接近向右的扇形——不过要补上射门频率的角之后。也就是说,格子在进球效率上的优势,远远大于他在射门频率和进攻跑位上的优势。因此某种意义上说,这个角的锋利程度,就是球员纯粹的「终结能力」的具象化,是一个机会主义前锋的标志。不用担心,我在下一期的内容会专门来分析雷达图上的这些「尖角」都有哪些有趣的解读方式。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

铍皇。伊卡尔迪这个形状,和前面格里兹曼的颇有异曲同工之妙,都要补上「射门频率」这一角之后,才能看上去像是一个「向右开口的扇形」,这也侧面说明,伊卡尔迪和格里兹曼在风格上的相似之处——都具有很强的机会主义属性。更有意思的是,伊卡尔迪左下角有一块明显的凸起,是头球的攻门频率。很多人认为,阿根廷应该带上伊卡尔迪来提供战术上的变化,我觉得这个就是一个很直接的证据。无论是机会主义,还是头球属性,都是其他人所不具备的。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

查理奥斯汀。南安普敦射手。这位老哥的形状也是骚的不行,在补上这个角之前,几乎已经到了定义层面也无法区分类型的地步;然而补上之后,瞬间摇身一变,几乎成了一个完美的「右扇形」。有时候你不得不说,雷达图真的是非常精密的工具,牵一发而动全身——一个角上的数据稍微增加或减少,你对整个图像的解读都会完全不一样。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

斯图亚尼。辗转效力西甲几家小球会,前两年到英超米堡转过,早年还打过意甲,而今年31岁的他本赛季在赫罗纳打出最精彩的一个赛季(33场21球)。从这张图来看,他的个人风格还是相当明显的——即使不补角,也满足「左扇形」 头球得分手的定义。而补上射门次数之后,就很很完美了。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

威廉·若泽。皇社中锋。这个赛季踢得相当不错,对阵巴萨时的发挥让我一度以为,今年世界杯他应当有希望进入巴西最后的大名单。我这么说原因很简单,如图,威廉·若泽的模板明显是 「左扇形」,头球的分手,巴西阵容里不乏好的传中手,然而锋线上并没有这种类型。很可惜最后还是落选了。换个角度,图中威廉·若泽缺的那一角是 「进攻跑位」,而参照巴西队内中锋人选,菲儿米诺和热苏斯,两人都是很擅长跑位的球员。这样一想,威廉·若泽的落选似乎也是情理之中。


一类最特殊的 「缺角球员」

如果说,上面这些人,补上缺失的一角之后仅仅是提升匹配度,不会改变他们的类型,那么下面这些人就是真的很神奇了——补角前和补角后,他们根本是两类球员!!换句话说,他们缺的这个角,不是用来改变他们同一种类型上能力高低的量变(quantitative)因素,而是用来定义不同类型的质变(qualitative)因素!因此,我对这些角加以红色高亮,用以区分。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

莱万。首先莱万进入这个特殊的 「缺角球员榜单」上也是让人意外,因为这可是多年位居现役第一档的中锋,震惊足坛的「九五至尊」,竟然还只是一个「缺了一角」的残缺版,细思极恐啊。大胆想象一下,补上这个角后的莱万,将会从真正从「右扇形」 一跃进化为更全面的「蝴蝶型」,如此大概就可以甩开竞争对手,真正成为当世中锋上的第一人了。然而,没有如果啊

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

卡大佐。卡大佐这张图和前面莱万一样的毛病——既可以看作是多了一小块的「右扇形」,也可以认为这是缺了一角的「蝴蝶型」。俩人可以说,是同样受为头球所制的难兄难弟了。只是,卡大佐即使补上这个角,头球这边的面积大小也赶不上没补角的莱万——这TM就很尴尬了啊。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

「残缺的左半圆」 三兄弟,本特克,卡罗尔,克劳奇。

如图,不补这一角,这三兄弟原本的形状都只是还算不错的 「尖锥形」,和大众对他们的印象(偏见)也比较符合:强力高中锋,不过也仅此而已。然而,从他们三人补上一角后的的图像上,我看到了一种完全不同的观点——他们绝非寻常的高中锋,他们是真的已经达到了距离 「左半圆」 只差了一步的境界。可惜了。假使本特克补上进球效率,卡罗尔和克劳奇补上进攻跑位,三人就是真正的 「左半圆」。而自他们之后,现役球员里再没有出一位更接近 「左半圆」。而如今,大师兄克劳奇即将退役,二师兄卡罗尔也近而立之年,只有三师弟本特克还正值当打。也不知道待他们退役之后,「左半圆」 会不会就此成为历史?

说句题外话,三人分别先后效力过红军利物浦……这利物浦前几年的锋线的引援思路也是十分新奇呀。

其实从上面这些,可以看出各家俱乐部锋线引援的思路都挺有规律的:北伦敦偏爱右扇形,皇马钟情于蝴蝶型,而利物浦是奔着左半圆去的。然而思路都很美好,结果却天差地别:北伦敦得到了两个标准的(其实是三个,拉卡泽特也是,这篇文章里没有提到),皇马也拿到了一个标准,一个近似,一个残缺(莫拉塔),然而利物浦……一个标准的都没搞到,只弄到三个残缺版,感觉蛮可怜的,是不是要艾特一下保护协会?txtx。

解说世界杯减数是三十(数据可视化|现役最强30位头球得分手,每人一张雷达图!)

最后,曼朱基齐。实话说,曼朱的形状发生任何异常我都不会感到很奇怪,毕竟本来一个高中锋的模板,改去打了左边路,而且战术效果明显,说明数据肯定不再是一个高中锋的数据了——这张图中,曼朱左边缺的这一个角,恰恰是头球的 「进球效率」,这也从数据的角度,映证了曼朱改打边路后,自身打法上发生的改变。所以很有意思的是,前面的人缺的角,我们解读为某项技术能力不足(或者是还有提升空间);而曼朱缺的这一角,反映出的,是一名优秀的球员,积极适应战术而改变自身打法的历程——同样的图像,背后却蕴藏着两种完全不同的故事,两类不同的人生。

不得不说,足球是一个复杂的世界。我们赞叹数据之美的同时,也为深藏于表象之下的真相所惊叹。


本文回顾

空间构建:

1 八角雷达图,构建一个八个维度的空间;

2 定义八项参数,分成三种能力,按空间位置排布。

设置对照:

3 选取26人的样本,代表所有优秀头球手的总体;

4 利用置信区间,锁定总体均值所在的范围。

探索类型:

5 三种能力排列组合,形成七种理论可能的不同类型。

6 球员和各自类型并不总是完美match,有些略有瑕疵,有些只是定义上符合,有些必须补上一角才能看上去相似。

7 七种可能的类型,两种完全找不到实际例子,一种只有缺角版。剩下四种比较常见。

8 C罗,吉鲁,凯恩等,都是各自类型的完美代表。