http://www.yyzhibo.cc

数据总结之球员篇(上):过去一个赛季谁的射

前言:再次科普一下xg与“真实射门得分率”

球队数据总结系列已经更新了6篇。每一篇里我都会用到一个概念:“真实射门得分率”。读者们对此有疑问也不是一两次了。实际上上赛季初我就已经介绍过这个自创的算法。这是一个基于高阶数据“预期进球数(expected goals,简称xg)”基础之上的算法,其目的是量化前锋修正射门难度的能力。这里我们先科普一下什么是“预期进球数”。

其实最近两年,国内网络上对这一数据的介绍已经非常多(大多会翻译成“进球预期值”),其中不乏一些持证教练和解说给出完全错误的科普……据我所知,这个数据最早应该是由OPTA公司提出的,后来很多公司也都投身其中,这也导致目前的xg数据源非常多,好在各家公司的核心思路都差不多,只不过系数和算法存在微小差异。这里我们先介绍一下思路。首先给大家看一个opta官网上的xg数据介绍视频里截下的动图:

这个视频很多博主在科普xg数据时都会使用,它揭示出了xg数据的本质——在射门发生之前一瞬间,不考虑射门质量,只根据射门环境,量化这次射门的进球概率。换言之,你可以理解为,它量化的是“射门的难度”。

当然,上面这个视频所参考的因素非常少。但是在过去两年里,xg算法所考虑的元素是不断增加,比如微博上一些博主在每场比赛后更新的球队xg数据,用的就是荷兰足球网站between the post的数据,而根据其兄弟网站(就是同一个老板创立的专门讨论足球理论的网站)11tegen11的介绍,他们在计算xg时参考了很多元素,包括射门位置(包括距离和角度)、射门前的传球情况(是否为传中、经过了多少脚传球、是否是断球后立即发起的进攻)、持球操作情况(是否经历了过人、是否过掉了守门员、是否属于OPTA界定的“绝佳机会”)等等。此外,各家数据源所用的样本库也不同。opta是过去30万次射门,而我常用的wyscout则用的是过去5年的所有射门。这些都会对xg量化造成一定的差异,但这个差异非常小。

如果我们认清了xg的本质是“射门难度”,那么,下一个推论就产生了:我们可以利用它,来量化“球员修正射门难度的能力”。说白了,打进一个进球概率为35%的射门,肯定比打进一个进球概率为65%的射门更难。这就有了我所提出的这个“真实射门得分率”的算法,公式是(实际进球数的总和-预期进球数的总和)/射门次数*100%,其内涵是:球员(或者球队)在平均每次射门中,对进球概率的修正值。当然,当预期进球多于实际进球时,计算结果会出现负数。

  • 版权声明:本文版权归原作者YY直播吧所有,如转载标记有误,请第一时间联系我们修改或删除
  • 转载请注明:数据总结之球员篇(上):过去一个赛季谁的射 +复制链接