肖汉生,赵鲁南
当今世界科技高速发展,每天产生的数据量呈爆炸式增长,随着数据量越来越多,堆积起来的数据里蕴含着丰富的信息,大数据技术的产生让大量数据的挖掘和分析成为可能,数据也成了一种战略资源。2016年国家实施了国家大数据战略,可以看出国家在鼓励各行各业与大数据进行融合,这种融合是一种机遇,但同样也会带来风险。
大数据顾名思义就是数据量很大,这里的数据量可以是各个领域的,随着行业的发展,每一种职业都趋于规范化,管理上更加规范,有条理。这样做的好处是,工作的每个过程都有据可寻,但带来的麻烦是产生的数据量很庞大,如果不进行有序的管理,那么日后的查找就会变得十分困难。所以为了更好地处理繁杂的数据,大数据技术应运而生。1980年阿尔文·托夫勒在《第三次浪潮》中将大数据称为“第三次浪潮的华彩乐章”,2009年“大数据”一词就已经成为网络流行语,仅仅几年的时间“大数据”便由专业术语演变成为数字生活方式的重大革命,2011年美国麦肯锡咨询公司发布报告称“大数据的时代已经到来”[1]。由此之后,大数据一词开始被广泛应用,变得越来越流行。那么什么是大数据(Big Data)?我国学者研究认为“大数据具有广义和狭义上的概念指向,广义上的大数据应该由大数据技术及其应用,大数据工程和大数据科学三个部分组成,而狭义上的大数据则主要包括大数据技术及其应用”[2]。
大数据不是凭空产生的,它有自己的发展过程,将其大致分为三个阶段:
1.2.1 萌芽时期
大数据这一概念首次被使用是20世纪七十年代美国国家航天局武器研究中心的研究员在研究数据的可视化时使用的。之后,美国的《Science》杂志发表了一篇题为《为大数据科学的可视化》的文章,大数据一词第一次出现在文章期刊上。
大数据的萌芽时期,人们对它的关注度并不高,只有极少数的专家学者对其进行了研究和讨论,此时大数据对于人们所产生的作用很小,仅仅是数据量的巨大。
1.2.2 发展时期
2001~2010年是互联网的飞速发展时期,大数据想要发展的快速,其必须依靠于互联网,所以这一时期也是大数据的爆炸发展期。2001年,先是美国Gartner公司开发出了大型数据模型。之后,大数据的3V特征也被DougLenny提出。接下来的几年,Hadoop数据分析技术、数据密集型科学等技术的出现,为大数据技术的发展提供了技术支撑。
在这个快速发展时期,作为一个新名词出现在人们面前,大数据吸引了人们的目光,各行业的专家学者开始深入的研究,不断丰富大数据技术的内容。
1.2.3 兴盛时期
2011年之后,大数据在前几年技术的支持下迅速发展,达到兴盛时期,沃森超级计算机用每秒扫描和分析4TB数据的惊人成绩打破了世界纪录。2012年在瑞士举行的世界经济论坛讨论了大数据所带来的机遇与挑战,并在论坛后发表了题为《大数据,大影响》的报告,正式宣布了大数据时代的到来。
2011年之后大数据的发展可以说进入了全面兴盛的时期,越来越多的学者对大数据的研究从基本的概念、特性转移到数据资产、思维变革等多个角度。在此时期,大数据已经开始了与各行各业的融合,各行业都在利用大数据技术创新工作模式和行业技术,借助大数据得到更好的发展。
大数据虽然是近期发展起来的技术,但是它却在各个行业中都有应用。在农业领域,美国的气象部门会运用大数据分析,来根据天气变化的数据预测农产品的产量,从而向农场主推销各种个性化的农产品保险服务。各种的网购平台app,技术人员可以通过后台获取用户浏览的商品历史记录,运用数据统计分析,向用户推送浏览量多的商品信息,既迎合了用户需求又提高了产品销量。在医疗方面,大数据技术已经被用于为患者建立电子病历档案、防控慢性疾病、临床医学诊断等多个医疗场景。大数据技术的运用,在一定程度上改变了医疗信息采集、运用的方式,并为医务工作者针对不同患者的实际情况制定手术治疗方案提供了相应的参考依据。除了上面提到的行业领域,体育领域也因大数据技术的发展正在经历一场变革,大数据给体育带来机遇的同时也带来了挑战。
大数据技术的到来可以说是给竞技体育的发展增添了新的动力,竞技体育中人们始终关注的问题是如何通过训练提高运动员的竞赛成绩,哪怕是提高0.1秒也是一个巨大的突破。
2.1.1 大数据技术改变了传统运动选材的模式
竞技体育的主体是人,其中主要包括教练员和运动员,这两者中最重要的是运动员,所以说一名优秀的运动员对于比赛的取胜至关重要。运动选材是培养优秀运动员的根基,虽说后天的努力也可以获得伟大的成就,但先天的天赋却是必不可少的。“选材”释义为(1)挑选合适的人才;(2)选择适用的材料或素材。“运动选材”释义为依据科学的原理和方法,将具有良好运动天赋和竞技潜力的儿童青少年或后备人才(简称优秀运动苗子)挑选出来,并在训练中不断监测筛选的过程[3]。传统的运动选材主要依靠的是教练员常年执教和参加比赛的经验,这种方法很难做到十分精确,掺杂着太多的偶然性,选材时的比赛场地、环境、人员等都会对运动员产生影响,所以说传统运动选材方法存在缺陷。
大数据的最大价值在于“预测”,具体到竞技体育中体现在“选材预测”,例如美式橄榄球联盟(NFL),在NFLCombine的评估会,运用生物传感技术、数据挖掘技术对参加选秀的大学生进行评估,以选拔出具有潜力的运动员[4]。这样通过大量的数据收集,再经过软件的系统分析,会对运动员生成一份比较综合的评估报告,在很大程度上避免了个人主观臆断所带来的偶然性。
2.1.2 大数据技术为运动训练提供了新的训练方法
运动训练方法指的是在运动训练活动中,为提高运动员竞技能力、完成训练任务的途径与办法,是提高竞运动员技运动成绩的主要手段。由于运动项目的种类繁多,所以针对不同赛事、不同项目所衍生出来的训练方法也是各有不同。训练方法是训练计划中的核心,这就要求教练员要根据不同运动项目的技术特征和动作结构特征,并结合运动员的身体实际制定出高效、有针对性的运动训练方法。
在训练方法上又可分为一般素质训练和专项素质训练。一般素质训练主要包括运动员的力量、速度、耐力、灵敏、柔韧、协调等基本素质。一般素质训练是进行专项素质训练的基础,是所有运动项目所必须进行的训练内容。相比于一般素质训练,专项素质训练就是根据运动项目的技术特点、结构特征、比赛环境等进行的专项训练,从而保证运动员能够在赛场上发挥出自己的真实实力,创造出优异比赛成绩[5]。从一般素质训练和专项素质训练的制定上来说,因为一般素质训练是进行所有运动项目的基础,所以其训练模式和训练方法已经趋于稳定,但对于专项素质训练,设置此训练的目的就是为了依据运动员所从事比赛项目的技术特征、结构特征、比赛环境制定的训练方法,从而提高比赛成绩。专项素质训练的制定要依靠大量的数据作为支撑,这其中包含运动员的场上比赛数据、比赛环境数据、对手比赛数据等。这些数据的获取以现在的科学技术来说相对容易,现代体育场馆都在向物联网、云计算、大数据等前沿科技靠拢,一场比赛过后,场馆的后台数据库中都会存有相关运动员的比赛数据信息,所以,场上比赛数据、比赛环境数据、对手比赛数据等都可以从数据库中获取。有了这些数据之后,教练员就能够在赛后根据大数据技术的分析结果找到运动员的短板,而且还能分析对手的比赛打法、战术等,从而制定出有针对性的专项素质训练方法。比较常用的是模拟训练方法,模拟比赛环境、比赛对手,这样在比赛前进行训练对竞赛成绩有很大的提升。
例如金州勇士队,2009年勇士队在联盟的排名是倒数第二,但几年之后,在2015~2016赛季却获得了赛季冠军,取得了54连胜的战绩,让很多人大跌眼镜。其能在如此短的时间内取得这样卓越的成就,除了日常训练的辛苦付出外,最重要的一个原因是勇士地处美国硅谷,硅谷是当今电子工业和计算机业的王国,是计算机等科技高度发达的地区,所谓近水楼台先得月,球队把大量比赛数据和训练数据汇总起来,运用大数据和计算机分析技术制定球队比赛战略,因而取得了赛季冠军[6]。
再有,IBM公司制定的Slam Tracker系统于2005年应用于网球比赛中,它可以通过大数据为球队制定赢球战略[6]。在排球赛场,最出名的数据统计就是VOLLEY DATA,无论是国际赛场还是各支国家队,都在利用它对比赛进行分析。除了可以分析比赛的表现,数据分析还可以帮助球队进行打法模式和风格的分析,进而找出比赛制胜的关键因素,帮助球队获得胜利[6]。
2.1.3 大数据技术有利于预防运动损伤
运动损伤是指运动过程中发生的各种损伤。参加运动训练的目的就是为了最大限度地激发运动员的身体潜能,提高运动成绩和运动员的身体素质。如果在平时训练中超过了运动员所能承受的训练负荷,极易造成运动损伤,这样就失去了运动训练的意义,得不偿失。运动负荷指的是运动员在进行运动训练时机体所承受的负担量,从生理和心理两方面来表现。适宜负荷原则指的是在训练过程中最适合提高运动员训练成绩的负荷,既不会对运动员造成伤害,还能取得最好的训练效果。如何找到适宜负荷的标准是一件比较困难的事情,因为现有的运动项目种类多,每种运动项目在训练过程中对负荷的要求是不同的,再加上不同运动员的身体承受能力的差异,所以很难形成一个统一的标准。
大数据技术的出现可能会对这种现象有所改善。利用现有的一些可穿戴设备可以获取到运动员在训练过程中心率、加速度、力量变化等数据,通过这些数据,再加上相应的软件分析,就可以大体得知运动员在训练过程中身体状态的变化,从而找到运动员机能疲惫的临界点,找到适宜负荷的量度。现有的运动负荷监测主要依赖的是生理生化指标,但是生理生化指标采集过程烦琐,时效性低,如果在训练后采集不及时会引起很大的误差,所以存在很多缺陷。
通过大数据技术可以相对容易地找到适合运动员训练的负荷,从而在很大程度上避免了因为在训练中把握不好训练强度所造成的运动损伤。适宜的运动负荷不仅可以帮助运动员实现最理想的训练效果,还可以最大限度地挖掘身体潜能,提高竞技成绩。
任何事物都有两面性,大数据也不例外,它也是一把双刃剑。大数据技术不仅给竞技体育带来了很多便捷之处,同时也带来了挑战。
2.2.1 数据的安全性
在进行数据分析时会产生大量的数据,那么数据的安全性方面是一大挑战。随着科技的发展,各国高水平竞技体育之间的差距越来越小,运动员的技术水平差异都在毫厘之间,在赛场上任何微小的因素都有可能改变最后的走势,所以说数据的保密工作就显得尤为重要。现在缺少对数据隐私性、安全性等相关的法律文件,一些数据是共享的,但却没有相应的共享标准,缺乏对技术的管理能力。数据一旦出现泄漏,将出现难以预料的结果。所以需要建立相应的保障体系,保证数据可以安全放心的应用,发挥大数据技术应有的功效。
2.2.2 人才的稀有性
全面掌握数学,统计学,计算机等相关学科和应用领域知识的综合数据科学人才匮乏,特别是缺乏熟悉行业业务需求,掌握大数据技术和管理的综合人才[7]。这里的行业业务需求主要就是指是否具有专业的体育知识,因为从事体育方面的数据统计和分析,最起码要具备基本的体育常识,如各种比赛的比赛规则、热点赛事、热门体育明星等,这样对于数据的收集和整理更有帮助。所以怎样培养出熟知大数据领域和体育领域的复合型人才也是当前急需解决的问题。
大数据为竞技体育的进一步发展提供了新的机遇,它改变了传统运动选材的模式,使运动选材变得更加准确;为运动训练提供了新的训练方法,使运动训练更加具有针对性,提高了运动员竞技比赛的成绩;更有利于预防运动损伤防护,使运动员在训练中接受适宜负荷的训练,极大限度地挖掘运动员的身体潜能。我们处在一个不断进步的时代,世界逐步科技化是大势所趋,如果不能适应时代的发展,那么必将被它所抛弃。体育是展示一个国家综合实力的手段之一,也是与他国外交的重要方式。我国的大数据技术正处于起步阶段,数据的安全性、相关人才的培养等是现在面临的挑战,但大数据已在竞技体育领域彰显了它的独特优势,针对大数据,国家也已经出台了相应的政策,如何在政策指引下将大数据与体育完美的融合是以后我们所要研究的问题。