刘书楷
(北京体育大学中国足球运动学院 北京 100091)
随着足球运动的快速发展,不仅是场上技战术发展迅速,赛场之外的领域也在日新月异地发展着。我国足球水平在世界范围排名较为落后,因此如何发展足球事业成为亟须解决的问题。科学技术飞速发展,体育科技助力足球产业发展的思考备受关注。“大数据时代”的到来,为足球训练、比赛、赛事传播等方面的发展带来了前所未有的便利,海量数据的快速处理符合当今足球运动快速发展的需求,如何使大数据更好地应用于我国足球运动领域,是需要继续研究的内容。
早在20世纪50年代,“数据”一词就随着计算机的发明被正式使用,信息系统的应用使数据可以通过计算机,产生价值转换的功能。随着大数据时代的到来,人们对数据的看法在定义上有了不同的观点。数据是信息数字化的记录,是人通过事物观察、实验或计算得出的结果,本身除了记录信息并无意义。维克托·迈尔-舍恩伯格在其著作《大数据时代》中表示,数据代表着对某件事物的描述,可以用来记录、分析和重组[1]。自此,任何可以在计算机上储存的信息(如数字、文字、图像、声音等),都被称为数据。数据的最根本意义是记录,千百年来人类社会上记录信息的方式表明了社会进步程度,随着不同计量工具的产生,数据在人类的日常生活中随处可见。数据的增长速度是爆炸性的,Gartner 公司在其研究报告中指出,数据的爆炸速度是三维的[2]。数据的功能在于让人类日常生活的现象可视化,转换为表格或趋势图等形式进行分析。维克托·迈尔-舍恩伯格指出,文字是人类文明传递的载体,人类将文字以数据的方式统计后,加以利用,使其用途更加便捷、多元,如电子图书的产生,使阅读更便利,并且记录阅读行为。
随着信息化浪潮的开始,“大数据”一词也映入人们视线中。早在20 世纪90 年代,该概念已在美国出现,当时的大数据更偏向于计算机领域。互联网时代的到来,标志着新一轮的信息化浪潮的出现,云计算、物联网、人工智能等词汇层出不穷,大数据则是这些技术的基础。2011 年,学者维克托·迈尔-舍恩伯格出版了权威性专注《大数据时代》,将大数据的定义、特点和发展前景进行了解释。同年,麦肯锡全球研究院发表文章进行概念定义,并提出大数据时代的到来。随后几年,世界各国纷纷对大数据的应用进行探索,在各行各业中结合大数据思维进行变革,极大地提高了生产力和科技水平。
第七版《现代汉语词典》中将大数据定义为“大规模数据的集合,具有数据巨大、类型多样、收集处理及时、数据来源可靠性低等特点”。《牛津高阶英汉双解》词典中将大数据解释为“无法使用标准方法处理、分析或使用的过大或过复杂的信息集合”。麦肯锡全球研究院将大数据定义为“一种规模远远超出传统数据库软件获取、储存、管理和分析能力的数据集合,具有集合规模巨大、数据传输速度极快、类型众多和价值密度较低的特征”。我国颁发的关于《促进大数据发展行动纲要》中,根据大数据的特征,将大数据定义为“以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态”[3]。
通过对文献的归纳与总结,分析得出大数据具有以下4点特征,即4V特征:第一,体量极大(Volume),日常网络软件的使用,用户行为会产生巨大的数据;第二,来源极广(Variety),无论是文字数据,还是图片、视频以及任何可量化的内容;第三,高效快速(Velocity),随着科技水平的提高,如人工智能的出现,数据的收集、处理和分析更加快速;第四,低价值密度(Value),数据价值密度与数据体量成反比例关系,数据通过海量的基础数据体现其价值。
随着体育科技的发展,大数据在足球行业的应用越来越重要,在竞技体育中存在海量的信息需要工作人员进行分析处理,效率的高低往往可以反映出一支球队的整体实力。大数据在足球领域中的应用,首先是对于日常训练与比赛的使用,包括足球技战术分析、足球运动表现分析、人才选拔与培养等方面。其次对足球事业和产业的发展也有重要的推动作用,如足球赛事传播、足球发展政策制定、足球产品营销等。
在职业足球中,涉及战术行为分析的大量数据被收集,由于大数据对体育领域常用的数据管理和分析方法提出了新的思路,因此,与计算机科学的合作,可以使足球技战术发展得更为迅速。近年来,足球表现数据收集的设备日新月异(如GPSports、Catapult、STATSports、Polar Team Pro、MT-Sports等设备),数据质量和数量都有了快速增长,导致球队每日都有大量的数据需要处理。人为统计与分析的形式早已无法匹配现今足球运动的高速发展,大数据处理的高效快速性体现得淋漓尽致。结合大数据的应用,技术、战术表现此类较为抽象并且通常以质性评价为主的内容,可以得出量化分析的结果,为运动员日常训练与比赛提供更具科学性的建议。
在战术表现分析中,传球作为一项最为常见且最为频繁出现的元素,值得教练员与球员去关注。如何界定、区分有效传球与无效传球的区别,并不能完全以主观判断下定论,这时需要数据导向的内容作为支撑。外国学者弗洛里斯等人[4]通过建立模型,对传球的有效与否进行评估,将传球有效性与持续的进攻表现(对防守的破坏性)进行结合,而不是依赖不频繁概率事件(如进球或进球机会)的发生。该模型的建立有助于评估任何位置、个人战术、效率、球员比较以及球队能力,同时该方法适用于比赛中,还可以帮助团队确定球队的重要角色。跟踪数据分析技术应用于足球技战术,体现出大数据的高效快速。以往的技战术分析对比赛表现的作用,仅仅在表层体现,如今数据分析过程的进步极大提高了运动表现的合理性。通过多学科协作解决关于表现特征构建、空间与时间的聚合,对于释放足球位置跟踪数据的潜力至关重要[5]。
我国足球联赛自1994 年开始走向职业化道路,联赛发展离不开赛事传播,大数据在足球赛事传播中的作用十分显著。我国足球赛事的参与主体主要有运作主体(主办方)、传播开端(参与方)、传播媒介(媒体)、传播归宿(观众)、商业化推动力(赞助商)和赛事管理者(政府),这些主体都会产生海量的数据,大数据可以快速处理分析这些数据,让足球赛事传播始终在正确的轨道上进行。足球赛事传播的内容包括常规内容、体验内容和衍生内容,其中常规内容包括比赛直播、视频、音频、图片等内容;体验内容指以球迷需求为依据,打造多方位的传播内容和形式,如电视、网络、新媒体平台的足球赛事直播、录像、集锦等;衍生内容指对于足球运动、球队、球员以及赛事附加产品,利用大数据统计分析,实现精准定位,带动各种产业发展,如根据球迷喜好,推出球星的专属装备等。
目前,足球赛事预期产品传播较为热门。互联网、大数据技术的应用,可以收集各个球队、球员的大量数据,并通过不同指标进行展示与总结,对球队、球员的比赛表现进行预测,为球迷呈现更为直观的数据,优化球迷的体验。许多赛事传播公司会使用信息化交互模式,实现解说与球迷的互动、球迷与球迷的互动等,丰富受众的观赛体验,同时后台可以通过用户反馈信息的收集,及时做出调整。大数据的应用还体现在体育博彩方面。赛事传播公司通过收集海量数据,向球迷提供参考结果,球迷可以根据数据进行比赛结果的分析,并吸引更多人观看足球赛事。赛事传播公司可以提高用户量,收集更多数据,实现良性循环。2014年世界杯,腾讯和IBM 公司合作针对用户需求进行数据挖掘,抓取实时的用户社交行为信息进行数据化分析,包括球迷话题球迷类型、个性分析等。信息从用户中收集,通过大数据分析,最终又以新的内容形式呈现在用户面前,同时提高了用户的互动率。通过后台的数据调查,此类方式的浏览访问量远超同期其他内容,体现出大数据在职业足球赛事传播中具有重要意义。
放眼世界足坛的发展过程,如何提高转会决策的科学性是亟须解决的问题。许多俱乐部花费高昂价格引入明星球员的转会,然而球员却因无法适应比赛节奏、球队风格或生活环境等问题,导致无法发挥匹配高额转会费用的实力,对于俱乐部造成损失。外国学者运用数据驱动的数学模型建立了一种为俱乐部提供最优球员转会的优化模型,为俱乐部如何做出合理决定,如何最优分配转会预算提出建议[6]。该模型预测了世界各地球员的特性、身价和工资,将预测值输入到一个整体规划模型中,以俱乐部最大效能为目标,求解最佳转会决策。这种模型是预测价值的函数,主要关注于英格兰足球超级联赛,结果表明该模型推荐的转会信息有助于俱乐部做出更好的转会决策。
我国职业联赛的发展进程中,经常出现引入世界明星球员,但实际比赛效果却不如人意的现象。因此,如何利用大数据技术提高转会决策的科学性是我国职业足球俱乐部需要考虑的问题,要通过建立数学模型,将目标地区或所需位置的球员数据与俱乐部需求进行匹配,得出最优方案,以提高俱乐部运作效益。
2019 年,《全国青少年校园足球工作报告(2015—2019)》中提出鼓励和支持学校引入先进训练方法和高新科学技术,建设智慧球场和应用智能训练设施和装备,强化科学训练。我国已有2.7万所校园足球特色学校,参与足球训练的学生数量众多,利用“大数据+校园足球”的发展模式有助于提高足球训练科学化,推动我国校园足球事业的发展。然而目前大数据分析在该领域的应用仍处于试点阶段,2019年同期,河南大学成立河南省青少年足球数据应用指导中心,对当地的青少年足球发展具有重要意义。何为大数据、如何进行分析、如何将大数据分析结合到实际训练和比赛中成了基层教师、教练员亟须解决的问题。
注重全国范围的校园足球智能平台建设,由政府、教育部门牵头,各校联合打造一站式“互联网+”足球智能平台,将全国各年龄段的校园球队、学生信息统一管理。平台功能可分为五大模块,包括队伍信息模块、训练教学模块、比赛数据模块、数据分析模块和人才培养模块。智能平台有助于校园足球信息查询和管理;有助于赛事推广,增加比赛锻炼机会;有助于线上的师资培训业务、学生网络教学业务的开展;有助于训练、比赛数据更简易化、可视化地呈现给教练员;有助于全国范围选拔校园足球精英人才,给予学生更多的发展路径;有助于校园足球文化的交流,增加学校间、师生间和生生之间的交流机会。
目前,表现评估在我国已经有了许多研究,信息飞速发展以及足球运动灵活多变的特点需要大数据为球队提供更多支持。在足球比赛中会产生许多事件(如传球、拦截、射门等)都可以获得大量数据,但没有一个被广泛接受的衡量标准去评估运动表现的所有方面。表现评估的方式量化评价、质性评价以及视频捕捉形式等。进行表现评估的前提是,需要进行评估指标体系的建立。在后续的研究中可以通过常用的方法进行指标确定,如专家访谈法、Ahp层次分析法和特尔菲法进行指标的确定和权重计算,从而得出评估体系。大数据分析的出现,可以帮助建立比赛数据库,在所有事件的相同指标中,选取影响比赛表现中有价值、常出现的评价指标,更便于人们日常理解,从而着重对此类指标进行评估分析,使评估更加便捷。
外国学者设计了一个数据驱动框架(PlayeRank)进行多维度评价足球运动员表现[7]。通过部署大量足球日志数据集构建框架,包含了18个主要足球赛事,4个赛季总共上百万个比赛事件,通过与其他评估的数据对比,发现该框架更为科学合理,值得设计一个可拓展的足球分析平台。我国学者使用广义线性模型与数据级数推断法对于足球技战术表现进行分析,以数学建模的方式将480 组技战术表现指标以及240 场比赛结果进行分析,进而判断足球比赛的制胜因素,为表现评估、比赛信息分析以及备战计划制订提供参考[8]。运动表现分析同样可以高效应用于我国足球联赛。学者使用混合线性模型对7个赛季的中国足球协会超级联赛的1406场比赛进行表现分析,得出不同比赛结果下,足球运动表现所具备的不同特征[9]。
随着越来越多的数据可以进行更为精确的收集与分析,“大数据+足球”的时代正在到来。足球领域有庞大的分支,因此大数据技术应用于足球研究,需要更多的思路和解决方案,这意味着需要更多学科方法进行协作,不同行业的从业者需共同努力,以理解并处理复杂的数据集合。科学技术的结合为足球发展带来驱动力,“大数据+足球”的发展,仍需要讨论技术与数据共享的可行性,注重计算机科学与体育科学交叉学科人才的培养,提高大数据概念与应用在足球人口的普及。