何敬堂,程 松
随着互联网的高速发展、数据库技术的成熟和普及,以移动互联网、物联网、云计算等网络渠道广泛普及以及QQ、博客、微信、Facebook等网络交流方式成为大众化,时下已进入大数据时代。大数据技术具有“4V”[1]特点:(1)数据体量(Volumes) 巨大;(2)数据类别(Variety)繁多;(3)价值(Value)密度低;(4)处理速度(Velocity)快。经济、医疗、交通领域中存在的一些棘手问题可以通过大数据基数得到较好的解决,大数据在体育领域的成功运用同样得到广泛的认可。如以数据为驱动的体育数据新闻凭借其独特的可视化优势创造出新闻发展的新模式。大数据平台为体育消费者提供私人订制,促进多种体育情报服务模式的出现,加深了竞技体育系统科研团队的深度协作。2012年,大数据一词被频繁提及,并命名与之相关的技术发展与创新。为此,笔者以此年份为节点对学术期刊发表的关于“大数据”并含“体育”等主题进行检索,通过对相关成果进行整理与分析,厘清目前国内体育领域对大数据的研究现状。针对大数据的特点对其在体育领域的应用前景进行了展望,并提出大数据在体育领域运用中应该注意和反思的若干问题。
借助中国知网论文数据库对“大数据在我国体育领域的研究”相关文献进行了收集。选择“高级检索”,检索条件中选择“主题”检索,输入“大数据”并含“体育”“运动”“竞技”“群体”“体育产业”“体育传媒”等。结果:截止2016年10月14日,共检索出286条相关文献,其中会议论文35篇、博硕士论文31篇、期刊180篇。剔除与本主题无关文献,对相关期刊进行梳理、分析,并按照时间排序发现:2012年之前大数据与体育相关的研究较少;自2012年开始,相关研究随之增多;2016年度,在中国知网检索到的相关结果已达到70余篇。近五年相关期刊数量的变化趋势如图1所示:
图1 近五年“大数据”并含“体育”期刊发文量变化趋势
这一趋势基本与世界上其他领域对于大数据的研究趋势基本吻合[2]。2011年,美国著名咨询公司麦肯锡首次提出了“大数据”的概念。同年6月IDC研究报告《从混沌中提取价值》构建了大数据的理论基础[3]。据统计,Google“大数据”搜索量自2011年6月起呈直线上升趋势[4]。与此对应的是,我国体育领域对大数据研究的相关论文期刊数量也正是在这一时间段激增。
我国体育领域对大数据的研究方向如图2所示:主要集中于竞技体育、体育教育、体育传播等领域,产出的成果(期刊)也相对较多。
图2 大数据相关研究方向的期刊数量
相关研究认为:对大数据这一新科学技术的合理使用,不仅有助于解决运动训练中的难题,也将为现代运动训练科学研究提供新的认识论与方法论,促使运动训练科学研究走向新范式[5]。辩证地看待大数据时代的三大思维变革,对竞技体育发展有着重要的实践指导价值[6]。此类观点主要源于大数据在解决竞技体育领域问题的过程中所展现出来的优势。在选材方面,美式橄榄球联盟(NFL)在NFL Combine的评估会中,运用生物传感、数据挖掘技术对参加选秀的大学球员进行评估,以选拔出有潜力的运动员[7];训练方面,将GPS卫星定位系统运用于运动员的日常训练监控中[8]。如2014年世界杯上德国队采用 SAP大数据解决方案,通过传感器捕捉球员的动作与位置变化等重要而细致的信息,借助SAPHANA平台在短时间内完成处理,帮助教练做出决断[9]。NBA比赛中,Free D技术通过360度的真实情景重现提高了观众的观赏体验。此类案例说明大数据技术在选材、训练、比赛中得到了广泛的应用,几乎出现在了竞技体育的各个领域,甚至有的研究者论断,“大数据分析正席卷整个竞技运动世界[5]”。这种观点主要受到大数据强大预测功能的影响。预测之所以成功,就是因为它们是建立于海量数据基础之上的[1]。选材、训练、比赛基本组成了竞技体育的纵向序列。在这一系列过程中,海量数据的产生随之而来,通过对“总体”而不是“样本”的分析,以及各种相关关系的分析,可以较为准确地预测到运动员的发展前景、比赛的胜负态势等。据此教练员或管理者就可以制定相关措施和政策来修正现时竞技体育系统中存在的相应问题。
大数据技术在竞技体育领域中的成功应用激发了国内研究者对其使用的探索。周艳晨[10]应用多种数学专业编程软件Matlab、R以及统计学专业软件SPSS、Eviews和数据挖掘软件Clementine,对球队球员能力、球队总身价、俱乐部排名等十大因素进行研究,尽可能准确地得出欧冠各球队实力走势曲线;蒋婷[11]根据MEMS传感器目前可实现的功能,结合网球项目的特点与需求,分析讨论其在网球训练的应用方式和发展前景。此类研究对解决国内竞技体育领域中的实际问题有很大的帮助,但类似研究偏少。这可能与目前具有大数据技术的体育人才队伍数量偏少有关。
在认识到大数据给竞技体育领域带来实效的同时,研究者对于大数据的应用前景给出了各自的建议。刘奇[12]认为,要使竞技体育系统顺应大数据时代特征,应建立竞技体育大数据公共平台,构建竞技体育大数据协同运行机制,培养竞技体育大数据人才队伍;仇乃民[13]预测大数据技术的使用,必将在优化运动训练手段和方法,提高运动员训练、比赛能力,促进运动员选材、运动训练与比赛的监控与预测能力等方面取得突破性的进展。大数据的使用对近年国内、外竞技体育热点问题的研究进展也将会产生一定的推动作用。这些热点问题主要集中于:运动心理、运动损伤、优秀运动员的个体训练等方面。
通过对上述相关研究进行整理发现,大数据较好的预测功能在竞技体育领域发挥着积极的作用。但需要注意的是,它的预测并非万能,一味地依赖大数据技术可能会带来负面效果。
不容忽视的是大数据的预测功能往往会引诱我们趋利避害,远离那些将会被言中的不好局面或趋势。假如一少年运动员对某一运动项目有着浓厚的兴趣,并表现出一定的天赋,但相关数据却预测该少年在此项目上不会有太高的成就,教练员在数据面前可能会先入为主,在每次的训练中对该运动员不是谆谆教导,而是喋喋不休地劝其放弃。这样,无疑会对该运动员形成一种“惩罚”,造成的后果也就可想而知了。此外,也应注意到数据有时也会说谎,数据只会帮你排除一些明显的错误,但最终的决定必须依赖人的判断[14]。这使我们看到大数据在科学训练、比赛预测及决策方面强大功能的同时,也不应忽视传统的体育训练规律和原则。因此,在竞技体育领域对于大数据的使用要与竞技体育领域中一些现象所固有的规律、原则区别对待,并能优势互补。
当数据洪流席卷世界之后,新媒体行业的崛起给传统媒体带来了强烈冲击[15]。在此背景下,大数据研究开始走入新闻传播领域学者的视野。其研究的问题主要包括:大数据时代对体育传播的影响[18]、大数据时代体育传播所面临的机遇与挑战、大数据时代的体育传播的特征、主体定位与发展方向[17]、大数据背景下大型体育赛事新媒体的传播研究[18]等。此类研究对大数据在体育传播领域的应用,尤其是在大型赛事传播方面起到了巨大推动作用。其文献所源引的大数据案例几乎涵盖了近几年的大型体育赛事,如“IBM为网球大满贯赛事提供技术支持”[19];“2014巴西世界杯期间,腾讯与IBM合作设置热议话题”[20];俄罗斯2018足球世界杯申办委员会运用大数据分析、筛选、确定一对双胞胎为宣传片主人公[18];大数据技术在近三届奥运会中的应用等。这些案例从多个方面让我们看到了大数据的应用带给体育传播领域的冲击,激发了体育传播领域学者和从业者对其研究的兴趣。多数研究者认为随着大数据时代的来临,大型体育赛事新媒体传播模式将会得到彻底改变。但无论如何,这是媒体必须面对的一个新的时代[21]。因此,体育媒介传播应该挥别多年的“跟着感觉走”,去践行数据变革的亲身体验[18]。
目前,体育传播领域对于大数据的研究多注重于把其引入该领域,以迎合这个新的时代。但从新闻传播与大数据特点的拟合方面来看,这些研究还远远不够。从某种意义上说,传媒业是信息产业的一部分[22],大数据是推动新一代信息技术产业发展的强劲动力。本质上,新一代信息技术产业是构建在第三代平台上的信息产业,主要包括大数据、云计算、移动互联网(社交网络)等[23]。这些无一不是大数据的重要来源。在互联网领域,批量数据处理的典型应用场景之一就是诸如Facebook、新浪微博、微信等以人为核心的各类社交网络。以上社交网络是当前信息传播的主要渠道,大数据技术又恰恰是当前处理海量数据的理想工具,由此我们有理由期待大数据在传播领域中会发挥出更大的作用。在此方面,Hoeber,Meseery等研究发现,自动数据处理与交互式可视化软件相结合,能够减轻研究人员繁琐的数据处理任务。Park,Eun-Mi通过使用文本挖掘技术应用于NAVER新闻的分析,认为韩国国家足球队教练成功的重要领导因素有沟通、信任和信念等[25]。国内相关学者也进行了类似的探索。唐建军[26]通过对新闻类、视频直播类、专项教学类三种手机体育类APP内容的研究,解读三类手机体育APP的发展现状及体育传播的影响力;李芳[27]深入分析微博大型体育赛事的裂变式传播模式、以赛事为核心的碎片化内容、以“弱关系”为核心的圈层社交结构。在分析其传播面临诸多困境的基础上,探求微博赛事的传播变革路径。
体育产业随着社会分工和生产力的不断发展,呈现出“绿色”“朝阳”关联面广等多个国际化产业特点[29]。如何实现“2025年体育产业总规模将超过5万亿元”的远景规划,是摆在政府、企业、学者群体面前的一个问题。在大数据时代,能否利用大数据技术解决体育产业领域中存在的问题,已引起业界人士的关注。国家体育总局体科所研究员李东健认为:“在新一轮体育创投热潮中,体育大数据值得重视[30]”。国际奥委会市场部负责人海博格曾表示:“智能化的数据会改变体育的一切。”通过对相关研究文献整理、归纳,大数据在体育产业领域中的作用主要体现在以下几个方面:(1)大数据的应用可以提升我国体育产业科技含量,促进体育产业的跨越式发展;(2)通过科技公司与体育企业之间的合作、资源共享促进体育产业协同发展创新,通过建立完整的“模块”营销策略,将最大限度提升体育产业的价值[31];(3)通过对大数据的深度挖掘,提供“私人定制”的体育产品给消费者将成为可能;(4)应结合我国实际,主动迎接大数据时代给体育产业带来的人才、技术、信息安全的挑战[32]。
通过对相关研究整理发现,多数研究已经预见了大数据的使用将会对体育产业领域产生积极、有效的影响,但真正借助大数据在体育产业领域做出相应决策的实用案例相对较少。因此,如何借助大数据实现体育产业的蓬勃发展将会是今后研究的一个方向。
宏观方面,大数据分析框架的引入有利于消费政策的制定,引导消费发展趋于合理化;微观角度,可以降低信息不对称,突破时空限制,提高消费便利化程度。“亚马逊可以帮我们推荐想要的书,谷歌可以为关联网站排序,Facebook知道我们的喜好,而 LinKedIn可以猜出我们认识谁”[1],这些个性化的服务给消费者带来巨大便利的同时,也为大数据在体育产业领域中的相关研究提供了方向。体育产业领域中的经济增长点如“体育竞赛表演以及高、中、低档并存的体育健身娱乐服务体系、体育产业链的构筑和培育、多元化的投融资体制”[33]等在大数据时代也将会有新的进展。我们可以预见的是,大数据以其强大的预测功能将会为解决体育产业领域中存在的一些复杂性问题提供帮助,也将会吸引更多的人关注其在体育领域中的应用研究。
我们应该看到的是,大数据体育专业人才的欠缺是体育产业领域运用大数据解决问题的重要影响因素,这在一定程度上也影响了学术界对两者结合的研究。目前在我国,已有相当一部分公司或企业看到大数据与体育产业融合的良好前景,如维宁体育和易观公司创办“体育产业大数据研究中心”,旨在打造体育产业大数据研究平台;魔方元科技还成立了“中国数据体育联盟大数据”,旨在将成员机构的优势资源进行有效整合,打造数据体育增值服务产品,创造体育产业全新商业模式,使数据体育实现“多元应用”。在此背景下,建议体育产业领域的相关研究人员应该走出学术界所固有的圈子,有意识地与相关企业和公司进行协同研究。只有这样,才能最大程度地实现大数据特征与解决体育产业领域问题的良好拟合。
检索相关主题,大数据与体育教育(学)研究的论文仅有23篇,且研究内容主要集中于大数据对体育教育(学)的冲击[34]、影响[35]、挑战[36]、在教学中的应用[37]等。上述研究形成的观点可归纳如下:第一、大数据冲击将会颠覆传统的体育教学模式;第二、有利于掌握学生的体质健康状况;第三、对高校学生选课及理论教学方面有着积极的影响。以上研究大多数表现为对大数据的“拥护”,缺乏冷静的思考,研究内容过于泛化,缺乏深度。
5.2.1 大数据应用对体育理论教学的影响大数据对于教学的影响在于它对“班级授课制”类同质化教学形式的冲击,通过“双回路学习”使学生自我纠错。这一过程中存在着对上述数据信息的挖掘,从而成就“一个尺寸适合一个人”的个性化教学。发展完善网络教学平台可以为学生提供个性化服务。因此,如何有效地利用相关平台进行体育理论教学应该是今后需要努力的方向,也是体育教育工作者今后需要研究的课题。建议相关网络平台(慕课等)增加体育课程资源的多元化,在技能教学课程资源中,增设技能要求低、且学生感兴趣的一些休闲、健身项目,同时邀请知名的体育专家和学者来担任授课教师。
5.2.2 大数据应用对促进学生体质健康的影响MIT媒体实验室创办者阿莱克斯·彭特兰和其团队,为了能使社区的人在寒冷的冬天走出去锻炼,使用FunFfit(“朋友和家庭”社会网络激励系统),将每个人都被指派两个伙伴作为“目标人”进行实验。在开始的三天里,根据中心目标人的行为,为与目标对象互动最多的伙伴发放小额现金奖励,来产生令目标对象更加活跃的社会压力。该网络激励使团队成员之间重复的合作性互动得到了提升。在此过程中,他们收集了几十万个小时和几百GB的情景化数据[38]。该研究主要是借助“社会计量标牌”对佩戴者表达的常见社会信号来收集和分析社会行为。这提示我们,借助“社会计量标牌”类可穿戴设备,研究促进大学生体育锻炼的积极性,进而提升体质健康状况或许会产生不错的效果。这类研究关键技术的处理就在于对人群相关活动信号的采集。这些信号的采集既需要参与者的配合(涉及个人隐私的安全),又需要先进的工具、分析软件等,实现起来难度较大。但随着可穿戴设备的普及,科技的进步,此类研究必将成为未来体育研究领域中不可或缺的一个方向。借助web of science,键入“big data”并含“sports”“physical education”“sports industry”“sports media”进行主题检索,借助EBSCOHOST体育运动全文数据库检索“sports”,对搜索相关文章进行整理和分析发现,大数据技术在健康和运动损伤方面应用的相关研究较多,如借助相关设备对身体健康的追踪监测;通过大数据技术和设计思维的支持,利用、整合数据,创建在医疗保健系统中的解决方案[39];利用无标记运动捕捉技术用于运动性能分析和伤害预防[40];利用加速度计数据估计活动相关能量消耗(AEE)[41]等。针对大规模无线人体局域网(WBAN)生成的数据,提出构建高效和可扩展的社区健康意识模型的需求[42]。这些研究所采用的方法为促进大学生体质健康提供了一个新的视角。目前国内已有此类相关研究。如刘智慧运用现代通信方式(如微信、短消息、QQ、MSN等)就学生体质状况、活动内容、效果等与学生家长沟通,提高了学生的活动量及练习强度[43]。近几年来通过对学校、家庭、社会三者之间的联动机制进行分析,进而促进学生体质健康状况的研究是体育界比较关心的话题。大数据的使用或许会为这方面的研究增加新的视角和工具。
关于学习方式转变的新思想和新方法,大都能够在文化课的教学中对号入座,直接转化为具体的教学实践行为。但在运动技能教学方面,大数据的使用或许值得借鉴。因为教学理论较少关涉体育学科的“个性”,导致许多体育教师对新的体育学习方式在认识上产生迷茫,进而出现教学实践中的拒斥倾向[44]。这不由得使我们去思考,把大数据这一技术工具引入体育教学中是否也会产生上面类似问题?运动技能学习相关心理学研究认为,运动技能学习过程中,对于运动性的认知是体育技能学习主要的认知形式,由此决定了体育学习方式具有体验性、自主性、探究性和合作性特征[48]。其中,“顿悟”作为一种学习现象,在运动技能学习中同样存在[45]。学习反馈对于顿悟的发生,也会起到重要的作用。就学习的效率而言,它们是一个互动的关系[46]。顿悟与学生学习的主观努力状态是息息相关的。是否会因为预测到学生在某项技能学习不合格的前景而剥夺其受到公平教育的机会,进而打击其学习的主观努力程度?这些现象是否也能借助大数据进行分析或解决?维克托·迈尔-舍恩伯格,肯尼斯·库克耶在《与大数据同行:学习和教育的未来》一书中,认为数据驱动教育在未来将大有可为,并指出大数据改善学习的三大要素:反馈、个性化和概率预测。这三大要素让我们似乎看到了大数据在体育教学方面的应用前途。但需要注意的是,无论是数据挖掘还是学习分析,大数据对于教育的作用和影响都是建立在数据收集获得和处理分析基础之上的[47]。美国《通过教育数据挖掘和学习分析促进教与学》报告中受访专家表示:“假如有100人投入到教育大数据的应用工作中,就需要其中的99人投入到数据采集技术和问题解决分析技术的研究工作之中[48]。显然,这需要教师或学校管理者首先应该成为“数据的脱盲者”。就我国目前的情况看来,体育教师在此方面还无法胜任。相关调查显示:多数体育教师对大数据的概念比较模糊;能主动利用数据,并且能获得和交叉分析大量详实的体育数据的教育教师较少;海量的数据信息筛选对体育教育工作者而言,难度太大[49]。
作为“在体育教师与普通学生之间展开的运动技术传习活动”[50]的体育教学来讲,就目前的教学现状,结合运动技能教学自身所固有的规律和特点,“私人定制”的教学方式很难实现。此外,在学习信息传递媒介方面,“人”也是一个不容忽视的重要因素。不同个体对同一信息的认知程度有所差异,需求相应的也会有所不同。运动技能学习过程中,体育教师与学生进行互动,对出现的问题即时反馈并进行纠错也是大数据平台不能取代的。由此可见,我们应该审视大数据带给体育教学的冲击,不能只是因为大数据所具有的一些强大功能而对其全盘接纳。
通过对以上相关研究进行整理和分析,我们看到了大数据在体育传播、体育产业、竞技体育中良好的应用前景,也提出大数据相关研究中应该注意的问题。多数研究虽然对大数据的概念及特征进行了阐释,但具体到体育领域的各个研究方向,还存在着理论研究偏多、深度不够、应用探索类研究偏少的现象。针对当前大数据人才资源匮乏的问题,我们在进行相关研究时需要整合资源,进行跨学科协同研究。需要补充的是,大数据不仅仅影响着笔者所述的体育领域,大数据思维对当前体育科学思维的丰富,大数据技术对传统体育统计方法的冲击也吸引着相关研究者的关注。由于大数据在相关关系研究中所具备的优势,在应用其进行研究时,我们的研究视角也应由以前对于单一变量、两变量之间关系的关注转向多变量关系的关注,如体育传播—竞技体育—体育产业的联动机制研究,家庭—学校—社会联动对于学生体质健康的影响等。随着科研界更加成熟,冷静和理性地来看待和分析大数据,体育科研领域在对大数据的“落地”和实际应用方面也应做好研究和规划。尽管大数据的应用将会为体育相关领域带来可期的效益,为体育科研带来新的研究视角,但大数据的分析,仍然需要因果关系的构建。再精巧的分析工具也不能代替人的理性思考,大数据时代也理应如此。