王 杰
(1. 上海体育学院 体育教育训练学院,上海 200438;2. 国家体育总局运动技战术诊断与分析重点实验室,上海 200438)
从开展对抗性项目技战术研究至今,在训练和比赛实践以及运动技战术研究中形成了海量的数据资源。随着数据量的快速增长,出现种类繁多、格式复杂、多源异构、分布离散等问题。运动项目技战术研究中形成的大量数据多被用于训练和比赛,在教学方面的挖掘还远远不够。部分研究通过建立视频库和信息平台的方式来整合技战术研究资源,尚未上升到知识的层次,对数据的深度挖掘较少。基于此,本文依托知识管理理论,系统梳理运动技战术资源类型,论述技战术资源结构化存储、知识表示的方法,搭建训学研一体的网络平台,为国家队训练和备战提供数据支撑,为对抗性项目技战术教学提供实验平台,为开展技战术研究提供数据保障。训学研平台的搭建和知识表示的实现可为开发比赛决策支持系统和专家系统奠定基础。
技战术是对抗性运动项目的制胜因素,运动技战术资源的积累有益于项目研究、运动技战术教学、辅助训练和比赛决策。运动技战术训学研平台以运动技战术资源库为支撑,在解决领域知识表示与推理机制的前提下,通过平台接口与高校师生、运动员、教练员及科研人员进行信息交互,提供技战术信息查询与知识获取、运动技战术资源提取、运动技战术分析等服务。运动技战术资源库集运动技战术动态、运动技战术资源、运动技战术软件三位一体,为运动技战术教学、对抗性项目技战术训练和运动技战术科研提供平台支撑。
运动技战术训学研平台构建主要解决3个方面的问题:运动项目技战术资源库构建、运动项目技战术知识表示与推理、网络信息平台的开发(图1)。
图1 基于资源库的运动技战术训学研平台
知识表示是指把知识客体中的知识因子和知识关联表示出来,以便于人们识别和理解。知识表示是人工智能领域的重要分支,对实现知识的计算机存储、知识推理、数据挖掘和决策支持具有重要意义。知识表示方法的选择决定了存储知识的方式和机器运算的智慧程度。在人工智能领域,知识表示的方法有产生式规则、谓词逻辑、语义网络、框架法、Petri网、面向对象知识表示方法、人工神经网络(Artificial Neural Network,ANN)等[1]。知识工程论认为知识表示是采用计算机模型对现实世界进行的描述和表达的[2]。
知识表示的作用在于实现比赛关键技术、战术特征的存储重现,以及实现由比赛数据向知识元的过渡,在此基础上建立比赛知识库进行数据挖掘和专家系统的研究。由于对抗性项目的项群共性特征,尤其是技术和战术特征的相似性,对乒乓球知识表示方法的研究将会对其他对抗性项目(羽毛球、排球、击剑)的知识研究起到借鉴作用,因此,本文以乒乓球为例进行论述。
乒乓球比赛能否获胜受多种因素的共同制约,如心理因素、身体因素、环境因素、技战术因素等,其中,技战术是比赛致胜的主要因素[3-6]。乒乓球比赛技战术知识表示即寻求适合乒乓球比赛技术和战术知识描述的方法,通过该方法实现每场比赛中运动员所采用技术的数据库存储和比赛中关键信息的数字化,在此基础上进行推理和演绎,从不同角度实现比赛知识的获取,为构建乒乓球专家系统提供基础。知识表示的意义在于使乒乓球比赛的技术特征成为便于计算机存储和利用的结构,使比赛特征以知识元的形式在数据库中保存下来,这样不仅实现了单场比赛的关键特征重现,而且在进行数据累积后,还便于进行数据挖掘和知识发现的研究。
2.1乒乓球比赛技战术评价指标体系的构建发球技术、弧圈球技术、挑打技术、劈长技术、摆短技术和推(挡)球技术是比赛中经常采用的技术,乒乓球比赛中的战术行为可分为进攻、防御、控制和均势4类,基于以上内容最终确定乒乓球比赛的技战术指标体系。
2.2乒乓球比赛技战术的知识表示乒乓球比赛中的知识可以分为事实性知识、技能性知识和原理性知识;根据知识的层次又可将其分为显性知识和隐性知识。事实性知识包括比赛的场次、比分、球数、击球板数、比赛时间等;技能型知识包括击球的技术、所采用的战术等;原理性知识是在这些客观事实背后隐藏的原理,包括使用不同技术的原因、采用类似战术的情境等。显性知识为通过观察直接得到的认识,包括比分、击球技术、击球位置、击球落点、战术势态等;隐性知识为通过数据分析和加工才能获取的知识,包括各项技术和战术的得分率、使用率以及不同技术行为、战术行为、击球落点之间的联系等。针对不同的知识特征,采用不同的知识表示方法。
(1) 显性知识表示。显性知识表示采用面向对象的知识表示方法,面向对象的知识表示按照客观世界事物的特点,将描述对象进行封装,具有模块性、继承性等特点。一个对象可以定义为四元组,包括对象标志符、数据结构、方法集合和消息接口[7]。乒乓球比赛技战术显性知识包括比赛编号、局数、回合数、击球板数、比分、击球技术、击球位置、战术势态、击球效果等。采用面向对象的知识表示方法主要对击球对象进行标示,对数据结构进行描述。以STROKE表示某次击球,其对象可以表示为,STROKE∷=(Number, DS, Methods, Message),其中Number为击球序号,DS为数据结构,Methods为属性方法集,Message为消息。Number由比赛编号、局数、回合数、击球板数排序得到;属性方法包括击球技术、击球位置、战术势态、击球效果等;消息表示是否进入下一步,数据结构描述如下。图2为节点示意图,箭头所示方向根据击球效果进行判断,如果得分或者失分,本节点就是尾节点,否则链接到下一个节点。
图2 击球对象节点
图3为击球链表实例,为击球板数为4拍的1个击球回合,1.1.1表示第1局第1个回合的第1板击球,第1、第2、第3拍均收到了击球效果的消息(未得分或失分),在第4拍时得分,链表结束。
图3 击球链表
面向对象的知识表示方法将每个击球对象进行封装,将其不同的属性、序号和消息封装在每个结点中,并相互连接组成链表,这样的表示便于按照击球效果进行数据挖掘和知识发现。知识发现的过程与上述过程相反。首先判断链表尾节点的结果是得分还是失分,然后回溯,依次判断上一板的击球技术、击球位置和战术姿态等,并对得失分数进行累加。可以计算不同击球技术和战术行为对比赛结果的影响,进而对比赛进行诊断和分析。
(2) 隐性知识表示。乒乓球比赛中的隐性技战术知识隐藏在可以观察到的事实性知识的背后,需要对观察和统计到的数据进行统计分析才能得到。采用数理建模的方法对隐性技战术知识进行表示,通过ANN对比赛技战术指标和比赛结果进行建模,建立比赛技战术与比赛结果的拟合关系。
ANN是一种采用机器学习的计算机拟合算法,由于其可以充分逼近任何复杂的非线性关系,拟合精度高,建模速度快,因此在各个领域得到了广泛应用。在体育领域的应用包括比赛建模、技术诊断和成绩预测等。相关研究表明,在赛马名次预测、赛狗比赛获胜者预测等方面取得了很好的效果[3]。
基于输入自变量xi为技战术数据,输出因变量y为比赛获胜的概率,建立3层BP ANN模型[8]。该ANN对比赛技战术行为和比赛结果(获胜概率)建立了隐含关系,对比赛行为和比赛结果的联系进行了知识表示。比赛中击球技术、击球战术对比赛结果的影响隐含在ANN中。基于上述知识表示方法,可以方便地进行比赛数据的挖掘。
基于ANN的乒乓球比赛技战术知识表示为f(x1,x2, …,xi) =y。x与y之间建立了非线性的函数关系。基于该知识表示可以对乒乓球比赛进行诊断、评估和预测研究。
2.3乒乓球比赛技战术的推理机制训学研平台构建了包括运动员数据、比赛基本数据、比赛技战术数据等的多种数据,通过知识表示实现了数据存储后,就可以对这些数据进行推理,获得对训练、比赛和教学都有意义的信息和知识。知识表示方法决定了推理方式。资源库中采用面向对象的显性知识表示和基于ANN的隐性知识表示方法,因此,对显性知识采用关联规则的推理和逆向推理,对隐性知识采用基于ANN的推理。
(1) 关联推理。面向对象的知识表示方式实现了运动员信息、比赛信息、比赛时序信息的封装。关联推理通过主要和次要关键字匹配实现信息之间的关联。在资源库方面分析,在运动技战术动态、比赛信息资源、运动技战术分析、运动技战术文献、运动员信息资源和运动技战术软件等模块中均包含了运动员关键字,通过该关键字可实现各个数据表资源的关联,建立起一个信息串。关联推理可以以运动员为主体建立涵盖其个人信息、比赛、近期动态及其技战术状态的关联知识。知识表示实现了计算机识别,推理实现了数据间的关联,最终形成关于运动员或者比赛的一系列认识,为教练员、运动员和科研人员提供决策支持。
(2) 逆向推理。从结论出发去寻找造成该问题的原因。在比赛决策过程中,往往需要根据比赛的结果分析造成得失分的原因,获得致胜要素,这里主要采用逆向推理的方式。乒乓球比赛知识表示采用面向对象的方式进行封装,然后以链表的形式进行存储,这种方式为进行逆向推理提供了数据基础。在乒乓球比赛中,经常需要分析比赛得失分的特征,还要寻找形成比赛结果的技战术行为。在基于链表的数据存储方式中,链表的结尾为比赛结果(得分或失分),倒数第2个节点为得失分的上一板,在节点中存储了击球技术、击球战术、击球位置、击球落点以及击球效果,这是造成比赛得失分的最重要原因。通过逆向推理结合频次分析可以推断出得失分的主要技术、主要战术、主要位置和落点等。依据此方法可以继续回溯,直至回到发球起点,从而找到得失分的击球技术和战术规则的集合。
(3) ANN的推理。资源库中存储了运动员的个人基本信息、周边动态信息、个人比赛信息、个人技战术数据及其技战术分析等。基于上述的知识表示形式,以运动员竞技状态为因变量、上述数据信息为自变量训练ANN,建立各项资源信息与运动员竞技状态之间的关联。基于上述关联,通过球类比赛计算机模拟诊断的方法获取运动员技战术知识。
(4) 决策树推理。以资源库中提供的运动员数据信息构建条件集,以运动员竞技状态(比赛结果)构建决策集,从而构建条件集与决策集组成的决策表。通过决策树算法建立技战术—运动员竞技状态决策树,生成运动员技战术规则集;也可以建立技战术—比赛结果决策树,生成致胜技战术规则集,为比赛提供决策支持。
3.1资源库概述在对抗性项目技战术研究中产生了海量的技战术资源,这些资源种类繁多,有视频、图片、音频文档等。技战术资源的积累对深入挖掘技战术特征,开展后续技战术研究具有重要意义。因此,技战术资源库构建的目的在于系统梳理技战术资源,便捷管理检索,为辅助教学和训练搭建平台。运动项目技战术资源库的搭建解决了不同数据源的结构化,构建了后台技战术资源库,并建立了前台的检索模块,方便教学、科研和训练比赛。资源库采用VB语言开发设计,后台为SQL SERVER 2000数据库。
3.2资源库的构成资源库基于结构化数据库软件SQL SERVER 2000 设计,该平台支持结构化查询语言,具有良好的可扩充性,支持多用户并发访问,适用于在网络端运行。资源库由运动技战术动态库、比赛信息资源库、运动员信息资源库、运动技战术分析库、运动技战术文献库和运动技战术软件构成。运动技战术动态库用于查询和存储运动技战术的前言动态、运动员与比赛的相关新闻等。比赛信息资源库用于存储乒乓球、羽毛球、网球、击剑等项目的各种比赛录像和比赛信息。运动员信息资源库用于存储和查询各项目运动员的基本信息。运动技战术分析库用于存储各项比赛的技术和战术分析文档,供教练员和运动员查询和参考。运动技战术文献库用于存储和查询各学术数据库技战术研究文献。
3.3资源库功能模块根据资源库的上述分类,运动技战术资源库前台分为运动技战术动态、比赛信息资源、运动技战术分析、运动技战术文献、运动员信息资源和运动技战术软件6个模块。
3.3.1 运动技战术动态模块 运动技战术动态模块从国内外相关网站中提取关于技战术研究的最新动态,对抗性项目的赛事训练动态,运动员比赛、训练等方面的信息。
3.3.2 比赛信息资源模块 海量的比赛视频是进行比赛观察、技战术学习和研究的重要资源。视频资源的格式比较丰富,有本地媒体和流媒体等。比赛信息资源库统一对视频的格式进行了限定,统一为WMV格式,方便视频的点播、剪切和合并操作。赛事信息资源囊括了乒乓球、羽毛球、网球、击剑等项目的技战术视频,后台按照赛事名称、运动员姓名、比赛项目、比赛级别等关键词进行存储,前台支持模糊智能检索。
3.3.3 运动技战术分析模块 运动技战术分析模块是历次训练和备战中所做的关于运动员、对手或者某场比赛的技术和战术分析文档,是技战术专家对运动员和比赛的科学认识和总结。运动技战术分析对辅助训练和比赛、运动技战术教学具有重要的指导价值。与赛事检索类似,支持按照关键字模糊智能检索,查询结果以列表的形式显示,双击列表项即可打开运动技战术分析文档。
3.3.4 运动技战术文献模块 在长期的运动技战术研究中形成了大量有价值的研究文献,这些文献包括研究报告、书籍、期刊和论文等。文献散落在各种数据库和书籍中,将这些文献资料整合起来,统一数据格式和存储方式,便于教学、科研使用。在运动技战术文献检索界面,可以按照文献名称、文献作者和文献类型进行检索,右侧为检索结果预览框,单击列表框中的文献就可以显示文献的详细信息,包括文献名称、文献作者、文献来源和文献的摘要信息等。
3.3.5 运动员信息资源模块 运动员信息资源模块用于查询和存储乒乓球、羽毛球、网球、击剑等项目运动员的信息,包括姓名、性别、年龄、国籍、国际排名等。
3.3.6 运动技战术软件模块 运动技战术软件模块将技战术分析和研究中使用的PowerPoint软件、数据采集软件、技战术分析软件、数据挖掘软件集成起来,供技战术分析和研究使用。
在对抗性运动项目技战术研究中产生了海量的技战术资源,技战术资源的积累对于深入挖掘技战术特征,开展后续技战术研究具有重要意义。本文在解析运动项目技战术知识表示与推理机制、构建运动项目技战术资源库、研发平台接口的基础上搭建了运动技战术训学研平台。提出了运动项目技战术知识分类(以乒乓球为例):显性知识和隐性知识。显性知识基于面向对象的知识表示方法;隐性知识采用ANN的知识表示方法,采用关联推理、逆向推理、基于神经网络的推理和决策树推理的机制。本文构建了运动项目技战术资源库,探讨了运动项目技战术知识库在教学、训练和科研中的应用方式。资源库由运动技战术动态模块、比赛信息资源模块、运动员信息资源模块、运动技战术分析模块、运动技战术文献模块和运动技战术软件模块构成。运动技战术平台在乒乓球、网球、击剑、拳击等项目训学研中的应用表明,其综合了多媒体信息资源和多种软件资源,依靠网络平台进行交互,能够有效地为教学、训练和科研提供决策支持。
[1] 方平.基于Petri网的知识表示方法研究[D].武汉:武汉理工大学,2013:2-7
[2] 孙丽君.物流配送干扰管理问题的知识表示与建模方法[D].大连:大连理工大学,2011:14
[3] 王杰.基于人工智能的乒乓球比赛技战术诊断与评估研究[D].上海:上海体育学院,2010:1-26
[4] 王清.我国优秀运动员竞技能力状态诊断和监测系统的研究与建立[M].北京:人民体育出版社,2004:359-394
[5] 田麦久,麻雪田,黄新河,等.项群训练理论及其应用[J].体育科学,1990,10(6):29-35
[6] 虞丽娟,张辉,凌培亮,等.隔网对抗项目制胜因素的研究与实施研究成果报告[R].2008:1-21
[7] 年志刚,梁式, 麻芳兰,等.知识表示方法研究与应用[J].计算机应用研究,2007,24(5):235-236
[8] 肖毅,张辉.中国乒乓球队奥运攻关研究报告:基于人工神经网络的乒乓球比赛诊断模型研究[J].体育科研,2008,29(6):19-22