基于Cite Space的国内体育大数据研究热点嬗变及主题分析

2021-10-30 06:47林剑峰
黑龙江科学 2021年20期
关键词:体育产业竞技体育

高 蕾,林剑峰,宋 亮

(厦门理工学院,福建 厦门 361024)

大数据(Big Data)首次出现于20世纪80年代,随着各领域数据的迅猛增长,企业界、学术界的相关研究不断深入,大数据逐渐成为一个热词,并纳入了国家发展规划[1]。随着市场经济的不断完善,生活逐步趋于智能化、信息化、大众化、现代化,这意味着大数据时代的到来。大数据初期是指信息时代数据量的爆炸,但随着处理数据工具的进步发展,大数据成为信息时代数据的爆炸及与之相关技术工具的总称[2]。大数据对社会生产和生活的影响在许多领域都非常明显。体育大数据是大数据的一个子集,特指体育领域的大数据,根据现有研究总结出体育大数据是整个体育活动过程中产生的及需要采集到的,一切用于体育领域的发展并可创造巨大潜在价值的数据集合。基于大数据的决策已成为现代社会各行业发展的基础。体育领域更是与大数据密不可分,数据获取、储存、挖掘、运用和分析的持续进步正在积极影响着体育领域的方方面面。体育发展需要适应大数据时代的发展趋势和要求,最大限度地发挥信息网络技术和大数据技术的积极作用,因此研究体育大数据具有积极的社会意义。

Cite Space是陈超美团队基于科学计量学和数据可视化研发的一款可视化分析软件,它能将科学知识的发展规律、结构及分布情况以可视化手段呈现出来,也被称为科学知识图谱[3]。知识图谱既能显示成可视化知识图形,也能反映出序列化知识谱系[4],目前已被广泛应用。基于Cite Space可视化工具,采用文献计量学方法和知识图谱绘制方法,对国内体育领域大数据研究的相关文献进行梳理,对体育大数据的发文量、作者分布、研究机构、热点主题等进行深入分析,以期找出有关体育大数据主题的研究热点与趋势,为大数据在体育领域的实践探索与发展推进提供参考。

1 数据来源与研究方法

对中国知网(CNKI)数据库平台进行检索,在高级检索类型中选择中文学术期刊,来源类别不限,主题为“体育”&“大数据”,检索时间范围不限。检索时间2021年3月6号,共检索出相关索引文献824篇,其中北大核心228篇,CSSCI文献155篇,其他文献441篇。将检索结保存为download_txt格式并导入Cite Space5.7.R2分析工具,进行格式转换,并进行研究分析。

2 研究方法

对作者、机构、关键词分别进行聚类分析呈现,通过Cite Space.V.5.7.R2内置功能,将从中国知网上导出的Refworks格式文献进行格式转化后导入Cite Space.V.5.7.R2。参数设置中,时间跨度从2002年1月-2021年3月,每1年为一个时间切片,每个切片阈值Top N设为50,每个切片阈值(c,cc,ccv)选择默认值,图谱修剪方式选择不修剪。使用Excel,对发文量、作者、机构关键词的相关数据进行数理统计。

3 研究结果与分析

借助 Cite Space.V.5.7.R2 可视化分析工具来探测体育大数据研究的主题、热点及趋势等,分别从年发文量、作者共现研究、机构共现研究、关键词的共现、突现研究、主题聚类研究5个维度进行分析。

3.1 体育大数据研究的年发文量

发文量及发表时间是判断某研究领域受到关注度的依据之一[5]。图1显示,体育大数据研究最早出现在2002年,且仅有1篇,2003-2012年没有该领域的文献出现,直到2013年体育大数据研究突现8篇,原因可能是2013年被誉为大数据元年[6],往后的每年连续相继出现大量的文献,到2020年已达204篇,增长近25倍,发文量呈现波浪式向上递进的趋势,说明随着时间的增长,体育大数据的研究越来越受到该领域学者的关注和重视。

3.2 体育大数据研究作者共现分析

挖掘国内体育大数据领域中研究学者的社会网络关系,以共现的形式变为可视化,聚类分析可直观反映出该领域的领军人物[7]。

应用Cite Space.V.5.7.R2软件对824篇体育大数据文献作者进行可视化共现分析,结果如图2所示,其中节点数308个,连线数189条,网络密度0.004,显示体育大数据研究领域的作者整体比较分散,并未形成广泛联系的作者合作网络。独立的节点显示的是独立作者,≥13个的2个或3个节点显示两两合作或三人合作。在现有的研究者中,呈现合作关系的有何申杰、刘泳庆、孙奕、陈骐、苑廷刚、肖书明、甄庆凯、胡齐,发文量均在12篇以上。

图1 本研究2002-2020年体育大数据研究年发文量柱状图Fig.1 Histogram of quantity of sports big data research domain in the research from 2002 to 2020

图2 体育大数据研究的作者共现图Fig.2 Author co-occurrence of sports big data research

表1 体育大数据研究高产作者列表Tab.1 List of high yield authors of sports big data research

3.3 体育大数据研究机构共现网络分析

科研机构在提升科研创新性方面具有至关重要的作用,通过对不同科研机构所发表的论文进行分析,可以了解体育大数据研究领域中研究力量的分布情况。应用Cite Space.V.5.7.R2软件对824篇体育大数据研究中出现的机构进行可视化共现分析,结果如图3所示,其中节点数264个,连线数81条,网络密度0.023,显示从事体育大数据研究的机构非常多,但研究机构之间并没有形成有广度、有深度的合作关系。从体育大数据研究机构共现图(图3)看出,已经形成比较明显的机构合作网络只有3个,分别是网络1:国家体育总局体育科学研究所、北京体育大学、沈阳体育学院、武汉体育学院、山东体育学院、沈阳五人足球发展研究中心、北京师范大学珠海分校。网络2:武汉体育学院经济与管理学院、武汉体育学院体育社会科学研究中心、武汉体育学院研究生院、河南大学体育学院、武汉体育学院期刊社、华中师范大学体育学院。网络3:桂林电子科技大学广西高校云计算与复杂系统重点实验室、贵州大学体育学院、贵州大学管理学院。

图3 体育大数据研究机构共现图Fig.3 Co-occurrence of sports big data research institutions

对体育大数据研究机构情况进一步挖掘,列出体育大数据研究高产机构如表2所示,发表文献数量前十名的机构发文量均≥5篇,其中发文量最大的机构是国家体育总局体育科学研究所,共发表20篇,其次是北京体育大学19篇,之后依次为广州体育学院、成都体育学院、武汉体育学院研究生院、武汉体育学院新闻传播学院等。

进一步对体育大数据研究机构突现进行分析,结果如图4所示,可以清晰地看出,2002年首次进行体育大数据研究的是国家体育总局体育科学研究所,研究持续到2013年,突现强度8.07。武汉体育学院新闻传播学院紧随其后,首次出现在2015年,但到2016年就不再是主要研究机构,2016年出现了两个主要的研究机构,分别是成都体育学院和广州体育学院。

表2 体育大数据研究高产机构Tab.2 List of high yield institutions of sports big data research

3.4 体育大数据研究的关键词共现、聚类、突现分析

关键词是一篇文章内容的提炼,如果将某一时间段内所有文献的关键词都提取出来,这些关键词将代表该研究领域的重点研究方向[9]。

3.4.1 关键词共现网络分析

应用Cite Space.V.5.7.R2软件对体育大数据研究的关键词进行可视化共现分析。结果如图5所示,其中节点数366个,连线数735条,网络密度0.011,聚类模块值(Q值)为0.61,一般认为Q值>0.3说明聚类结构显著,聚类平均轮廓值(S值)为0.8609,一般认为S值>0.7说明聚类结果令人信服。聚类排名前十的关键词有:大数据、大数据时代、互联网+、体育产业、体育赛事、数据可视化、支持向量机、培养模式、云平台、ceo。

图4 体育大数据研究机构突现图Fig.4 Institutions with the strongest citation bursts of sports big data

图5 体育大数据研究关键词共现网络图Fig.5 Research on keywords co-occurrence network of sports big data

关键词出现的频次和中心性是判断该领域研究热点的重要指标,也是判断学者关注焦点的重要依据[10]。应用Cite Space.V.5.7.R2软件得出频次≥15的关键词有11个(见表3)。其中大数据出现频次最高为266次;其次是体育产业,频次为68次;之后是大数据时代,频次为50。除此之外的关键词分别集中在体育教学、全民健身、体育新闻中的研究。

表3 体育大数据研究高频关键词(频次≥15)Tab.3 High frequency keywords of sports big data research (frequency≥15)

3.4.2 关键词聚类分析

对体育大数据关键词在共现的基础上进行关键词聚类,可以进一步分析体育大数据的研究情况。

根据图 6 中关键词节点的分布特征,可将 2000-2021 年的体育大数据研究热点演化进程分成 3 个阶段:第1 阶段,初始期(2002-2015 年)。该阶段体育大数据的研究主体不突出,文献量少,研究热点分散。第 2 阶段,发展期(2016-2018 年)。该阶段体育大数据的研究开始与体育领域各个系统相结合,各个主题的研究广度和深度得到极大提升,出现互联网+、体育产业、体育赛事、数据可视化、体育旅游的热点研究。第 3 阶段,趋稳期(2019-2021 年)。这一时期的研究热点在上个阶段的基础上更加深入,以时代大数据大事件为背景,互联网+、体育产业、培养模式的大数据研究是该阶段的研究热点。总之,近20年体育大数据的研究热点不断拓展和深入,紧跟时代发展。

图6 关键词共现聚类时间趋势图 (Timeline)——演化路径Fig.6 Timeline of keyword co-occurrence clustering—evolution path说明:图谱的时间范围为2012~2021年,以1年为时间切片,阈值为Top50。图中的节点对应关键词,且表示其第一次出现时间;节点间的连线表示关键词间的共线关系,连接线的粗细与共现强度成正比;节点大小与关键词频次成正比,即节点越大,关键词出现频数越高;右侧(“数字”形式)列示的为Cite Space自动聚类的结果。

表4 体育大数据研究关键词聚类情况Tab.4 Keywords clustering of sports big data research

聚类号文献量轮廓值平均时间研究主题5220.8972017群众体育;精准治理;农村体育;治理模式;户外体育;生态体育公园;山地户外运动;线上线下;体育产业;体育实体6200.9842013大数据;体育产业;体育教学;互联网+;大学生;体质健康;大数据时代;智慧体育;人工智能;高校;体育赛事7130.9542018体育素养;发展路径;培养模式;保障体系;国外青少年;教学管理;体育课程8110.9462016信息传播;决策咨询;高校体育智库;云计算环境;审计数据;联网审计;联网审计系统;智慧体育项目;花样滑冰9100.9922016大健康;健身人群;全民运动;ceo10100.9552018体育旅游;旅游目的地;旅游方式;品牌运营;公司化运营;决策信息;旅游攻略;战略升级

在体育大数据关键词聚类列表的基础上,进一步梳理相关文献,总结体育大数据研究主要呈现的五大核心主题即:其一,大数据与体育产业;其二,大数据与学校体育;其三,大数据与社会体育;其四,大数据与竞技体育;其五,大数据在其他体育领域的应用。

A.大数据与体育产业。

体育产业作为绿色产业、朝阳产业,对国民经济的增长和社会的发展具有重要的促进作用。大数据与体育产业这一主题主要围绕着大数据背景下推进体育产业的高质量发展展开研究,主要包含大数据背景下促进体育产业发展的路径、体育产业可持续发展的动能及大数据对体育产业产生的影响等三个方面。大数据促进体育产业发展的路径是通过加快体育产业数字化转型、完善相关法律法规、提升数据处理能力等方面,来加快体育产业发展。王戬勋等人研究[11]认为,应通过加速体育产业数字化转型,加速形成体育产业全领域的数字链条,建立专项数字经济政策法规等来实现我国体育产业的高质量发展;殷文明研究[12]认为,通过完善金融法等相关法律法规,坚持以金融市场安全和最小损害为原则,推动体育产业的可持续发展;王雪莉等人研究[13]认为,通过深化体育与科技的融合,促进我国体育产业高质量发展。大数据背景下,体育产业可持续发展的动能研究主要集中在区块链技术、5G技术和“互联网+”、人工智能(AI)。杨麟等人研究[14]认为,应用区块链技术可以为体育产业高质量发展提供新动能;朱梦雨等人的研究[15]发现,体育场馆智慧化转型升级离不开5G技术;陈脉等人研究[16]认为,“互联网+”使体育产业的思维模式、经营模式、技术模式发生了重构。大数据对体育产业产生的影响方面,研究主要体现在体育消费、产品营销、市场拓展等方面。刘佳昊研究[17]认为,扩大网络和数字技术是推动体育产业转型升级、体育消费增长的重要途径;杨品臣等人研究[18]认为,大数据形势下,体育产品供给过程、生产端及供给职责分配之间需构建数据平台,以更好地进行产品营销;段明会研究[19]发现,利用大数据开拓体育场馆市场,不仅比传统的拓展方式更有创新性,还能充分挖掘场馆服务项目。

大数据背景下,无论是区块链技术、5G技术,还是“互联网+”都为体育产业的发展提供了动能。随着时间的推移,大数据背景下体育产业的持续性高质量发展拥有了更多的时代特点,因此仍需要进行深入研究。

B.大数据与学校体育。

体育强则中国强,发展好学校体育是体育强国建设的重要力量之一。大数据与学校体育这一主题包含了高校体育教学、中小学体育教学、青少年、教学管理、体育课程、慕课、培养模式、教学管理、高校体育智库、公共体育教学等。具体包括以下五个方面,即大数据在体育课程、体育教学管理、教学模式和方法、教学评价、体质健康测试中的应用。大数据对体育课程的影响包括对中小学体育课程和高校体育课程的影响两部分,杨伊[20]从我国中小学体育课程改革的四个阶段出发,认为人工智能和教育现代化将全面推动学校体育课程改革,并对教学影响进行了多方面分析。在体育教学管理应用大数据的研究方面,彭李明[21]开发出了一套适用于体育院系学籍管理需求的、简便易用的管理信息系统;高天运用大数据思维提出体育课程教学案例库建设的策略[22]。教学模式和方法应用大数据的研究方面,集中在慕课上的研究较多,刘东等人研究[23]认为,MOOC为大学生提供了更为自由化的学习空间,在一定程度上促进了教学资源的合理配置;韩杭康[24]研究认为,大数据时代不能过分追求慕课体育教学带来的优势,也不能一成不变地采用传统教学方法,建议将两者融合发展。大数据在教学评价上的应用包含了教师的教学评价、学生的评教,周玉庆研究[25]认为,大数据时代背景下,应完善高校的体育教学评价体系;杨安康的研究[26]认为,学生评教的可信度不仅取决于原始数据,更取决于数据分析技术。

无论是体育课程本身,体育教学模式方法、教学评价,还是教学相关的智慧信息库的建立,都离不开大数据。大数据已经使学校体育教育的传统模式转变为数据驱动模式。尽管如此,从研究结果来看,大数据背景下学校体育仍然面临着诸如隐私保护、技术人才匮乏、观念固化等问题[27]。

C.大数据与社会体育。

社会体育是体育主题的组成部分,是一个国家体育发展水平高低的重要标志之一,社会体育不仅是学校体育的必然延续,还与竞技体育有着密切的联系。大数据与社会体育这一主题围绕着如何更好地服务全民健身展开研究,主要包括四个方面的内容,即以大数据为背景的社会体育服务供给、资源配置、体育参与及公共服务信息建设的研究。在社会体育服务供给研究方面,集中在提供精准服务与提高服务效率。戴志鹏[28]研究建议,利用“大社会”格局和“赛博空间”,推进体养结合的大数据应用,以干预老年健康服务;王永平[29]研究认为,结合大数据进行体育公共服务的供给侧改革,有利于解决供给主体单一、供给结构失衡等供需错位现象;鲁丽[30]研究认为,大数据对社区体育的发展具有创新资源配置结构、提高社区体育动态管理的精准服务与供给效率、推进社区体医结合等积极作用。大数据与资源配置方面的研究,均以优化资源配置为主,田学礼[31]在“互联网+”思维和技术的指导下,对社区体育资源的配置进行了研究,提出了创新路径;潘玄烨等[32]在2019年全国体育场地统计调查中,结合大数据发展,建立了全国体育场地大数据库,建议利用大数据建立体育场地单位名录库,推动全民健身网络信息平台建设。大数据与体育参与方面的研究,目前文献资料仅有一篇,即倪京帅[33]以上海市民为研究对象,运用数据挖掘法挖掘市民体育参与特征与优化策略,提出优化上海市民体育参与的策略。大数据与公共服务信息建设的研究,目前可以查阅的文献显示也仅有一篇,即王恒研究[34]认为,体育公共服务信息平台的建设,能有效推进全民健身向科学化、智能化、掌上化发展。

大数据与社会体育的研究有一定的广度,但每一方面的研究深度还有待加强,特别是大数据对资源配置、体育参与及公共服务信息建设的文献资料,而这些方面正是目前大数据背景下,社会体育发展急需解决的问题。

D.大数据与竞技体育。

大数据时代为竞技体育带来了新的发展思路,在竞技体育领域中,数据对运动训练监控、竞赛特征分析等都产生了较高的价值。大数据与竞技体育研究主要包括竞技体育的训练与比赛、运动项目、运动员及竞技体育管理与大数据结合四个方面。竞技体育训练与比赛的大数据应用研究显示,随着创新发展也出现了诸多问题,肖汉生研究[35]认为,大数据帮助竞技体育在运动训练、运动选材、运动损伤等方面实现了创新,但大数据技术也在数据安全、技术完善等方面存在问题。运动项目的大数据应用研究主要有:游泳、啦啦操、冰雪运动等与大数据相结合的研究,是契机但也存在困境。杨雨[36]根据中国游泳与大数据技术结合的现状,论述了青少年游泳阶段引入大数据技术的必要性,并对其引入困难做了分析;张慧婕[37]从大数据的视角出发,借助python爬虫工具、盘古分词软件、ArcGIS等工具,对我国冰雪运动网络关注度进行了探究。运动员自身与大数据的结合方面,已有研究发现,利用大数据的挖掘技术,科学有效分析运动员的自身数据,能有效提高运动成绩。竞技体育管理与大数据的结合方面,已有研究[38]发现,建立竞技体育大数据公共平台,构建竞技体育大数据协同运行机制,培养竞技体育大数据人才队伍,能够促进大数据时代竞技体育系统的发展。

大数据在竞技体育方面的研究取得了较高的价值,但存在数据安全和技术不完善的情况,竞技体育与大数据的研究明显少于体育产业和学校体育,究其原因,可能是因为竞技体育属于体育运动的高水平阶段,参与人员相对少,特别是国家队运动员的训练和比赛,部分数据也有其保密性特征,因此加强高校科研人员与竞技体育单位的合作交流,是促进竞技体育发展的主要路径之一。

E.大数据在其他体育领域的应用。

大数据在其他体育领域的应用,主要包括大数据与军事体育的研究,大数据与民族民俗体育的研究。大数据与军事体育的研究仅有2篇文献,主要集中在大数据技术应用于军事体育训练上;民族民俗体育与大数据的研究发现,大数据的应用可以提高民族体育文化自信,利于民族民俗体育文化的传承和发展。孙群群[39]认为,在大数据时代,对水族民俗体育文化特色资源进行数字化处理,有助于水族民俗体育文化特色资源的可持续传承及水族民族体育文化自信;杨频[40]以大数据为背景,探讨了如何建设民族传统体育文化遗产数字博物馆。大数据与军事体育、民族民俗体育的研究文献较少,研究深度不足,这是此主题的一大特征,建议加强大数据与军事体育、民族民俗体育的研究,以推进大数据在体育领域的全方位发展。

3.4.3 关键词的突现分析

关键词的突现分析有关键词突现的强度、突现开始时间与结束时间,其中突现强度是表示一点时间内引用量的大小,代表了该领域的研究热点。由图6可以看出,突现强度最大的三个词也是最早出现的三个词,即体育工程、研发、需求,最早出现在2002年,突现强度分别是7.79、7.43、7.43,分别于2014年、2012、2012年突现结束,突现结束说明不再是研究热点。2013年,出现的研究热点是体育赛事和新浪体育,又并分别于2014年和2015年结束。2014年的研究热点是巴西世界杯和竞技体育。2016-2017年的热点是可视化研究、数据挖掘、互联网。大数据与体育消费的研究是2019年至今的研究热点。

图7 体育大数据研究关键词突现图Fig.7 Keywords with the strongest citation bursts of sports big data

4 研究结论

基于中国知网(CNKI)数据库平台,借助Cite Space.V.5.7.R2功能,采用文献分析与文献计量法,对大数据在体育领域的研究进行全方位的审视与梳理,找出大数据在体育领域研究的主要作者、研究机构、取得成果及研究热点,为弥补研究不足与今后研究的趋势指明了方向。

从大数据在体育领域研究的作者来看,并没有形成广泛联系的作者合作网络,也没有核心作者的出现,现有的研究者中,呈现合作关系的仅有8人,发文量均在12篇以上,发文≥4篇的作者共15人。建议学者之间加强合作交流,建立学习团队,促进大数据在体育领域的深度研究。从体育大数据研究机构分析中得到了3个较明显的机构合作网络,以国家体育总局体育科学研究所和北京体育大学为首的网络团队之间合作较密切,合作单位数量最多,发文量也最多。建议不同研究机构间应加强合作学习,相互分享研究经验,促进大数据跨地区交流。从关键词演化路径来看,体育大数据研究热点从互联网+、体育产业、体育赛事、数据可视化、体育旅游,演化成互联网+、体育产业、培养模式的大数据研究。从取得的成果来看,集中在大数据与体育产业、大数据与学校体育、大数据与社会体育、大数据与竞技体育、大数据与军事体育和民族民俗体育的研究,每个领域都有不同的研究深度和广度,其中,大数据与竞技体育领域,大数据与军事体育、民族民俗体育领域研究的文献数量较少,应成为未来研究的侧重点。

近20年的体育大数据研究可以分为初始期、发展期、趋稳期3个阶段,研究议题不断拓展,研究的精细化程度逐步提升。5G与人工智能实现了跨越发展,未来,体育大数据研究将会继续关注大数据与“互联网+”的结合,即智慧体育研究、大数据与体育消费的研究,以增加市场的主体活力,促进国民经济的稳步增长。应顺应时代发展要求,积极为建设体育强国、发展全民健身、增强体育文化自信、提供体育领域与大数据结合的方案和建议,通过大数据,促进体育领域的高质量可持续发展,结合大数据的时代特征,加强大数据在不同领域中的运用,更好地为体育产业、全民健身、竞技体育、军事体育与民族民俗体育等领域提供服务。

猜你喜欢
体育产业竞技体育
TSA在重竞技运动员体能测试中的应用
第1-3届冬季青年奥运会竞技格局分析
从上市公司股票走势看我国体育产业发展现状
提倡体育100分 也需未雨绸缪
体育产业之篮球
关于《国家体育产业统计分类》的几点思考
我们的“体育梦”
新形势下湖北省体育产业突破性发展思考
花与竞技少女
同台竞技