史一丹 蔡雨琦 于华 张怡 姚辉波*
(1.南京理工大学体育部 江苏南京 210094;2.中国电子科技集团公司第二十八研究所 江苏南京 210007;3.南京市第九中学 江苏南京 210018)
随着多种科学技术手段的融入,篮球比赛数据分析的先进性得到了长足的提升。首先是体育相关设备的智能化水平提高,为数据采集与数据分析提供了更加坚实的硬件支持。其次,各种先进的技术与算法的研发,为解决篮球相关技术问题提供了理论支撑。例如,数据库技术的应用为篮球相关数据的保存与应用提供了基础[1],先进的数据分析算法的应用为找到篮球数据反映的内部规律提供更加快速、高效的手 段[2]。此外,各种篮球相关新媒体与数据分析团队的崛起也为篮球数据分析行业注入了加速剂。相关媒体的介入,使更多的实体参与比赛的技术统计,数据分析团队的加入也为球队的进步与发展提供了专业化的参考意见。
然而,目前的篮球数据分析仍然存在许多不足之处。首先,篮球比赛以及篮球相关新媒体的种类复杂多样且相对独立,现有的篮球数据库都是中心化的,如新浪体育、腾讯体育等,中心化数据库会造成数据垄断,导致数据无法共享和流通,“信息孤岛”现象十分明显,导致大、中、小型的篮球相关组织缺乏获得数据的渠道,大量的数据需求只能诉诸数据黑产、数据寡头、数据联盟,没有形成完善的数据流通机制[3]。其次,篮球数据分析实时性差且存在主观误差[4],教练员及其团队需要根据相关理论和经验,结合篮球运动员的技能水平数据,分析对手以及自身的技战术水平。这种模式的主观性很强,教练员需要花费大量的时间去分析技战术与运动员技术动作,这就产生了大量的时间浪费以及主观判断误差。
区块链是一种全新的分布式数据库技术,其核心功能在于分布式数据存储、点对点传输、共识机制等[5]。分布式存储和点对点传输在一个去中心化的分布式系统中实现数据的安全可靠存储与共享,共识机制则决定了在去中心化的网络中如何记录和存储数据。首先,区块链网络中不存在一个绝对的核心。也就是说,没有人可以控制整个网络的数据并且制定网络规则。这就使区块链网络中的节点具有相对的公平性,主要体现在网络中的每个节点都用于网络数据的备份及网络中的节点都可以通过参与共识机制来管理区块链网络两个方面。其次,区块链网络中的数据具有更高的安全性,这得益于区块链中的数据都运用了密码学的加密方法。最后,区块链网络中的数据具有追根溯源性,每一组数据都具有明显的身份标识,可以快速查询到数据的来源出处。
移动边缘计算技术近年来引起了人们的关注。移动边缘计算的概念是由欧洲电信标准协会提出的,将计算资源部署在靠近终端设备的区域,旨在将计算资源引入无线接入网,为终端提供强大的计算能力扩展,同时缩短通信距离,减小计算时延[6]。目前,对于边缘计算的研究处于起步阶段,如在车联网中,大量有关车辆的计算任务需要将大量的数据上传至数据中心(数据计算中心是数据服务提供商所拥有的,如亚马逊云计算中心、谷歌云计算中心等),然而这些计算任务往往实时性要求比较高,卫星通信产生的大量数据传输会产生较大的时延,尤其在数据高峰期,数据中心计算资源的短缺会产生较大计算时延,影响网络性能。而在边缘计算网络中,数据服务提供商通过在蜂窝网络中设置边缘计算节点,使计算资源更贴近用户终端,将会减小因为卫星通信产生的时延,并且边缘计算节点密度较大,会对终端的计算资源形成良好的补充。
机器学习作为最强大的人工智能工具之一,已被广泛应用于计算机视觉、信号/语言处理、社会行为分析、无人机路径规划等[7]。明确地说,它运用统计技术来识别模式和底层结构,继而分析观测到的数据以形成经验。这就使智能设备能够自动“学习”做出预测,而无需人工干预来相应地调整机器的行为。机器学习主要包括3类:监督学习、无监督学习和强化学习。监督学习根据已有的数据集,知道智能设备数据输入和输出结果之间的关系。根据这种已知的关系,训练得到一个最优的数据处理模型。也就是说,在监督学习中,训练数据既有特征又有标签,通过训练,让机器可以自己找到特征和标签之间的联系。相反,在无监督学习中,机器不知道数据之间的关系,而是要根据聚类或一定的模型得到数据之间的关系。可以这么说,比起监督学习,无监督学习更像是自学,让机器学会自己做事情。强化学习算法则是让机器学习如何将环境变化情况映射到动作,以通过与环境互动来最大化奖励。也就是说,让机器能够根据环境的变化做出相应的变化以更好地适应环境。
基于以上前言中对篮球数据分析局限性的分析,结合了区块链、边缘计算以及机器学习在如今数据分析方面的突出优势,该文提出了基于以上3种技术的新型篮球比赛数据分析平台(见图1)。其主要的思路如下:首先,基于先进的区块链技术组建分布式的数据库用于存储篮球比赛相关数据,实现数据共享;其次,就近(篮球比赛场地周围)部署高性能的边缘计算服务器,将先进的机器学习算法装载于边缘计算平台;最后,边缘计算平台运用先进的机器算法分析数据库数据后,将结果反馈至数据分析服务需求方。
图1 新型篮球比赛数据分析平台架构示意图
下面该文将具体描述三大板块的运行机制与意义。
在区块链架构上构建篮球数据库,以区块链来构建篮球比赛相关数据库是整个平台运行的基础。在传统的集中式数据库中,数据被几个实力雄厚的篮球实体(篮协、新浪体育、各大篮球俱乐部等)所拥有,这就导致数据的流通性差,数据的获取困难重重。而且容易发生“单点失效”问题,也就是数据拥有方服务器故障,则所有的数据将不复存在。而区块链数据库是一个全新的分布式数据库技术,其自身的技术特点能够非常好地克服以上几点问题。有文献提出运用区块链进行体育大数据的存储与共享[8]。借鉴此思路,该研究将区块链技术应用于篮球比赛数据库。首先,所有篮球相关的实体(观众、媒体、篮协以及俱乐部等)会在区块链的网络中注册成为合法的节点,享受区块链网络中的数据服务。然后,随着多种篮球比赛的进行,会产生大量的数据。由于区块链是一种去中心化的数据库技术,不存在可信的第三方实体来记录数据。此时,区块链系统将按照特定的规则(共识机制)选择一个节点来记录数据并上传到区块链网络中,当某个节点上传到网络中的数据被其他节点验证(也就是验证数据真实可靠)之后,该数据将出现在网络中所有节点的内存中。而负责上传数据和验证数据的节点也将受到一定的物质激励。在区块链数据库中,每一个区块链中的实体将拥有一个所有数据的完整备份,这就解决了篮球数据的流通性与共享问题。另外,就算某个节点的数据库发生故障,也可以从其他节点处拷贝从而得到恢复,这也就很好地解决了“单点失效”问题。
在篮球比赛过程中,对于对手篮球战术的分析仅靠肉眼往往难以快速作出判断,这就需要借助计算能力较强的智能计算机来辅助分析。虽然智能手机计算能力有所加强,但是想要做到快速准确分析还是天方夜谭。因此,现有的技术手段需要将大量图像数据上传至云服务器(计算能力强大的计算机一般较比赛场地较远),如果利用卫星通信传输大量数据,较长的传输距离会产生较大计算时延,也无法快速对比赛做出分析。因此,将云服务器拉近用户是非常有必要的。边缘计算平台的架设就是遵循了这一思路,将拥有强大计算能力的边缘计算服务器部署在靠近篮球比赛场地的区域,并将其接入无线局域网,这样篮球数据分析的需求方可以直接通过无线局域网上传数据至边缘计算服务器分析,避开云服务器的冗长传输距离,就近处理,对篮球比赛中的数据分析快速作出反应。
在数据库与边缘计算平台这些硬件准备完成之后,数据处理算法将成为整个数据分析平台的核心竞争力。一方面,数据分析算法较为简单,只能对于篮球分析数据做简单分类,而后续的分析工作大多是借助人工分析才能得到结论。另一方面,现有的数据分析算法是静态的,只能判断“是与否”的问题,也就是只能判断出对手的战术是否是现有的某种战术,对于对手运用的新型战术,做不到识别与判断。此时,机器学习算法便可以良好地适配该问题。例如,有研究设计了一种机器学习框架来对体育运动结果预测进行预测[9]。此外,还有研究汇总了人工智能在体育行业的应用前景,指出体育数据分析前景广阔[10]。由此可见,机器学习算法应用到篮球数据分析也是大有裨益的。机器学习算法是自适应与自演化算法的集合,能够自主提取数据中的特征数据,并对数据做到更加智能的分析,并且随着对手战术的变化,算法本身也可以进行动态的演进,不断识别新的战术,丰富关于对手的战术库,为更好地应对对手的战术提出对策。
新型的数据分析平台将克服现有篮球数据分析平台的几大问题。利用区块链构建篮球数据库,将更好地实现篮球数据的共享,为各单位实现篮球数据的分析提供便利。利用边缘计算技术就近解决篮球数据分析问题提高数据分析的实时性,便于快速做出应对。利用先进的机器学习算法进行数据分析,将提高数据分析的准确性,提高比赛的胜率。