《从数据层层剥开NBA球员历史排名》长篇连载之六
相对于简单、直接、暴力的直观数据,NBA各类合成技术统计数据,主要包括效率值(per),进攻效率、防守效率、胜利贡献值、进攻胜利贡献值、防守胜利贡献值。会充分考虑球员在场上的各种因素,有的甚至会考虑到不同时期球风对球员和球队的影响,尽可能将不同历史时期的球员放在同一个大环境下比较,这似乎更能体现出一名球员在场上的真实水平。
这些数据的组合和计算方式复杂无比。
效率值(Per)
目前NBA各类合成数据或修正数据中,最能体现球员真实水平、被联盟随手就能利用的,就是效率值,英文全称Player Efficiency Rating,简称per。
这是ESPN大拿约翰·霍林格设计的球员价值评估数据体系。计算公式如下:
/球员比赛场次
听上去不复杂,看着也高大上,似乎没什么问题,具体的数据解读我们就不去做他了。我们拿两组存在问题的数据来演练一下就清楚了。
下面我们和法外狂徒张三一起来做一道数学题:
李四:30分10篮板5助攻3抢断2封盖,出手次数15次命中10球,罚球12次命中10球,失误3次。
王二麻子:20分15板5助攻5抢断5封盖,出手次数15次命中8球,罚球8次命中4球,失误3次。
基本数据一样,根据球员效率值的计算公式计算,或者目测,哪个球员的效率值可能会更高?
李四!
恭喜你,答对了!
李四的效率值是40。王二麻子名字不好听就算了,效率值还低,36。
但撇开效率值来评价这两名球员,我们纯粹分析二人的数据,大多数教练都会更愿意选择王二麻子。李四这种类型的球员虽然是内线好手、全能,但这样的角色并不罕见。但王二麻子完全是小编我杜撰出来的一头防守怪兽,历史上你也找不出原型,没有任何一名球员的场均盖帽和抢断能达到双五的,还有15个篮板。有这样一个人,场上就相当于可以抵两个人用:皮蓬和罗德曼。
造成这种反差的原因在数据构成上,得分、助攻、篮板数据得来相对容易,抢断和封盖的数据获取则要难上许多。
看上去,这是效率值设计上一个明显的缺陷,它对防守球员并不友好。但NBA官方一直非常推崇这项数据。理由简单明了,作为篮球这项运动,只有推崇进攻,比赛才会变得好看,只有更多的人关注,NBA才会有奔头。而per值的设计基准就是既能保证一定的公正性,又能适度保护和偏袒进攻,从而让比赛变得更好看。
看到大咖们设计数据的美妙之处没?通过per值的设计我们可以发现,任何工学设计都可以融入美学和博弈。
从作用和价值来说,per值是最公正的综合合成数据。
效率值(per) 一级数据 ★★★★★
进攻效率值和防守效率值
进攻效率值和防守效率值和效率值听上去差不多,但可不是一种算法,它不是单纯地将效率值一劈两爿,一半是进攻,一半是防守,然后带入效率值仨字,就是进攻效率值和防守效率值。
进攻效率值是球员在场上每100回合的得分产出。球员整场的得分产出以每百回合计得出的数据就是进攻效率值。
进攻效率值公式需要采用四个数据:得分回合、投失球回合、投失罚球回合、失误。
数据中会运用到投篮、助攻、罚球数,球队进攻篮板、球队得分回合、球队战术权重等一大批数据,最后得出个人得分产出和回合数,再运用到百回合,得出个人进攻效率值。公式:
个人进攻效率值=100*(个人得分产出/回合数)
相对应的,防守效率值是球员在场上每100回合让对手得了多少分。
防守效率值一个重要的指标是防守终止。
什么是防守终止?一名防守球员通过盖帽、抢断、犯规等方式,终结对手当回合的进攻,就叫防守终止。
从进攻效率值和防守效率值的分析看,进攻效率值和防守效率值只有在对比位置相近的球员时才会显得较准。从结果得出的现象是,大个子球员进攻效率值通常不会高,但在防守效率值上相对会获得高分。
进攻效率值 二级数据 ★★★★☆
防守效率值 二级数据 ★★★★☆
胜利贡献值(WS)、进攻胜利贡献值、防守胜利贡献值
胜利贡献值,Win share ,简称WS。是一名球员对比赛胜利贡献的比重。
一场比赛,球队总体的胜利贡献值是1。如果张三这场比赛的胜利贡献值是0.5,说明这场比赛胜利有一半的功劳都是张三的。
胜利贡献值是可以累加的。如果张三在10场胜利中的胜利贡献值累加为4,说明张三在这10场比赛的胜利中的贡献就占球队的40%。
和效率值不同,WS=进攻WS 防守WS。
胜利贡献值(WS) 一级数据 ★★★★★
进攻胜利贡献值 二级数据 ★★★★☆
防守胜利贡献值 二级数据 ★★★★☆
NBA以上六大类重要的合成统计数据中,均将失误数据作为单项负面数据计入公式。
失误是否作为负面数据纳入球员历史排名等级数据库反向数据,我说了也不算,还是请诸位到微头条投票决定。