杨晓峰,王鹏飞,主成懿
(1.新疆博尔塔拉职业技术学院 体育教学部,新疆 博乐 833400;2.三门峡社会管理职业学院 公共教学部,河南 三门峡 452000;3.广东技术师范大学 体育学院,广东 广州 510665)
随着社会科学技术不断进步,运用于各行各业的科技成果成为行业发展的领头羊。近年来,大数据技术应用受到广泛关注,在十四五规划中,工业化、信息化和大数据中心建设将成为国家战略中重要的衡量指标。体育大数据作为近年来体育研究领域被提及的重要话题之一,对体育行业发展有较大影响。为探寻我国学者对体育大数据应用的研究近况,文章运用Cite Space 软件对研究热点及趋势逐一分析,为后期发展提供理论与实证基础。
为全面、完整收集资料,以“体育大数据”为主题词,通过CNKI(中国知网)数据库平台检索关联文献,获取原始数据,考虑到大数据包含内容较为广泛,同时选取“互联网+”+“体育”“人工智能”+“体育”“云计算”+“体育”进行布尔检索。选取时间截至2020 年12 月31 日,检索内容为期刊、会议、博士、硕士论文等文献数据。检索日期为2021 年9 月14 日,共计检索文献1397 篇,由于搜索主题检索得到的文献存在冗余记录,为保证所获数据质量,逐条筛选并删除不符合要求的文献,最终获取所需文献551篇,其中期刊文献460篇,会议论文57篇,硕博士论文30篇,其他类型文献4篇。导出文件为Refworks格式便于Cite Space进行处理。
1.2.1 词频分析法
TF-IDF(Term Frequency-Inverse Document Frequency)在信息检索中是一种数值统计,通常用作信息检索、文本挖掘和用户建模检索中的加权因子[1]。在科学文献计量中,词频分析法常用于文献中关键词或者主题词的相关性分析,并对该领域现状以及热点进行研究。
1.2.2 文献计量法
运用统计方法分析书籍、期刊和其他出版物的方法,在图书馆和信息科学等领域经常被使用[2]。文献计量法一直被用来追踪学术期刊引文之间的相互关系,现在利用文献计量法不仅可以分析引文,还可以对作者合作网络、研究机构、关键词共现网络以及期刊来源分布等进行分析。
2.1.1 我国体育大数据年度分布
对我国体育大数据研究文献变化趋势进行分析,从总体上把握该领域纵向发展情况。具体变化趋势如图1所示,2013—2020年关于体育大数据研究内容总体呈上升趋势,于2020年达到峰值,总计120篇,较初始增加30 倍,仅2016—2017 年略有下降。这表明,从2013 年起,研究人员和研究机构开始重视对体育大数据相关性的研究,同时折射出体育学科发展欣欣向荣的景象。
图1 体育大数据发文年度变化趋势图
2.1.2 我国体育大数据文献来源分析
分析体育大数据文献来源,便于了解体育大数据研究成果空间分布及特点,有利于对分析成果进行高效利用和借鉴。考虑关联期刊众多,按发文数量从多到少选取部分期刊进行分析,具体文献来源分布如图2所示。在所整理的期刊中,关于体育大数据相关研究文献存在明显的分布不平衡现象,其中《当代体育科技》发文数量最高,共计39 篇,占总发文量的7.1%.以《上海体育学院学报》《体育文化导刊》《武汉体育学院学报》《广州体育学院学报》等为主的核心期刊,共计发文总量为51篇,占总发文量的9.3%,发表总量远低于非核心期刊。由此可见,我国体育大数据研究文献数量偏少,不论是主流期刊还是文献总数,仍有进一步发展空间。
图2 体育大数据期刊文献来源分布图
院校发刊及论文数量分布如图3所示,其中以北京体育大学为单位发表的论文最多,发文总数为28篇,成都体育学院等五所体育院校发文10篇以上,其余均在10篇以内。其中以北京高校发文最多,由此可以看出,北京市作为全国政治、文化、交通中心以及技术的重要枢纽之地,对于促进体育大数据发展有重要意义,成都、武汉、西安、广州等经济发展较快的城市对体育大数据前沿研究也在前列。在以高校为单位的研究中,排名前十发文单位中90%为体育类高校,由此可见,体育类院校在体育大数据方面的研究也走在其他高校前列。
图3 体育大数据院校发刊及论文数量分布图
2.2.1 我国体育大数据发文机构分析
通过分析我国体育大数据发文机构,了解体育大数据核心研究机构,从中观层面观察体育大数据研究空间分布情况,助力体育领域研究,针对不足方面提出完善措施,推动体育行业进一步发展。在Cite Space软件中,将网络节点(Node Type)选择为机构(Institution),设置Time slicing值为1,以2013-2020年为区间,每年划分为一个时间段进行处理,生成体育大数据研究机构共现图谱(图4)。圆形节点表示研究机构,节点大小表示机构发文数量多少,机构之间的合作用连线来表示,合作数量用线的粗细表示,由于仅有的机构间合作次数较少,线段粗细不明显。
图4 体育大数据机构共现图谱
由图4 可见,机构与学校发文较零散,尚未形成合作网络,为数不多的几条线表示机构之间合作范围较窄,机构之间合作的网络密度为0.0018.由此可见,体育大数据研究机构目前还存在很大合作空间,机构之间想要突破当前瓶颈,需要加大合作力度,形成合作网络。
2.2.2 我国体育大数据作者合著关系分析
通过作者合作关系知识图谱研究,分析不同研究方向中体育大数据研究人员的影响程度,以发掘各研究人员对该领域的贡献。设置Time Slicing 值为1,网络节点选取作者(Author),生成体育大数据研究人员合作关系知识图谱(图5)。其中,节点(Nodes)=202,连线(Links)=53.节点连线表示研究人员之间的合作关系,线的粗细表示研究人员之间的合作次数,仅有线段的连线可以看到作者之间的合作次数较少,基本在3次及以下。从图5可见,研究人员之间的合作开始产生,以赵珉、孙晋海和赵培军团队较为突出,但是论文成果较少。由此可得出,体育大数据领域有明显影响力的作者较少,作者之间合作较少,基本上以独立研究为主,有很大合作空间,特别是交叉学科合作研究。
图5 体育大数据作者合作知识图谱
为了解我国体育大数据领域当前研究内容发展程度,文章分析该领域研究主题。设置聚类词类型(Term type)为名词性术语(Noun Phrases),网络节点类型设置为关键词(Keyword),得到我国体育大数据研究主题与热点知识图谱(图6)。
图6 体育大数据领域研究关键词共现图谱
图6中每个十字代表一个节点,每一个节点大小意为词组出现频次,两个节点之间用线连接表示相连的两个节点在同一篇文章出现,线条显示的粗细程度与其联系紧密度成正比。由图6分析结果可知,共有节点218 个,489 个连接,网络密度为0.0207.关键词表示体育大数据研究领域重要节点,关键词是文章核心内容的简化提取,也是文献计量重要指标之一,可以较好地反映我国体育大数据领域主要研究内容,聚类后的关键领域主要集中在大数据与体育、高校体育、体育传播、教学改革、体育比赛、体育旅游等方面。由此可见,进入大数据时代,体育的发展体现在多个方面。
在Cite Space软件中导出聚类后的分析表(表1),基于该统计结果和关键词共现图谱(图6)可以看出,关于体育大数据的研究热点主要集中在学校体育、体育产业、竞技体育、全民健身等四方面。
表1 体育大数据聚类分析表
以高校体育、体育教学改革、学生体质健康、青少年体育、体育科研等为主的学校体育研究热点,从学生体质健康提升到如何实现学校体育智能化,以及大数据在体育课内课外的应用,探索大数据时代对学校体育的影响。
以体育传播、体育旅游、体育经济、体育品牌、体育产品、体医融合为主的体育产业研究热点,从产业体系结构分析、发展路径、营销模式及价值研究思索,探析大数据时代体育产业的良性发展道路,特别是体育旅游的发展,已经形成高等学校本科专业,在上海体育学院、首都体育学院、郑州大学体育学院、山西师范大学等多所大学开设。
以体育比赛、中超联赛、世界杯、网球、新闻、马拉松为主的竞技体育研究热点,从大数据在体育赛事中的应用、新闻媒体传播,到提升体育赛事质量,为赛事发展提供有力数据支撑,一些国际大型比赛的传播,通过大数据视角更为直观了解赛事情况。
以智慧体育、运动APP、体育信息化、体育健身大数据、户外运动、体育活动为主的全民健身研究热点,从体育信息化应用覆盖到各类全民健身活动中,体育智能产品和体育智能穿戴设备销售量逐年增加,以及人民生活水平不断提升,为全民健身的发展带来了前所未有的契机。
综上所述,我国研究者在体育大数据研究主题紧贴时代发展需求,结合教育教学现状与市场走向,多方齐头并进,对体育教育、体育产业等多个行业进行探索。学校体育、体育产业、竞技体育、全民健身等是体育大数据研究领域关注的热点问题,信息化进步推动大数据技术蓬勃发展,城市化发展以及人们生活方式改变,体育强国概念不断深入,体育大数据给体育教学、体育产业、体育传播以及公共服务等领域带来很大发展空间。
为清晰、简明观测聚类热点,直观了解体育大数据研究热点演变过程,运用Cite Space 软件生成体育大数据研究热点时间线图(图7)。一共聚成10 类,顺序从0 到9,数字越小,聚类中包含关键词越多,每个聚类均由多个紧密相关词组成。聚类模块值(Modularity)Q=0.5991,Q>0.3,聚类结构显著;聚类平均轮廓值(Mean Silhouette)S=0.3909,S<0.5,因此聚类不合理。分析聚类后关键词,可以看出体育大数据研究主题主要集中在大数据与体育、体育教学、学校体育、全民健身和体育传播五个方面。按不同时段划分研究热点,可以将2013-2020 年体育大数据研究分为三个阶段:第一阶段2013-2014 年,是体育大数据起步阶段,研究主要集中在大数据与体育竞技;第二阶段2015-2018年,发展阶段,主要研究体育健身、体育经济、学校体育、体育教学、体育人才以及体质健康等问题;第三阶段2019年至今,稳定发展阶段,研究方向也逐渐多样化,体育旅游、高校体育、教学改革、运动APP、智慧体育以及体医融合等内容不断被提出。
图7 体育大数据领域研究热点时间线图
由图7可知,第一阶段,我国体育大数据领域研究的关键词主要有“世界杯、体育赛事”和“大数据”等,但通过对近两年文献分析,发现多数研究均是基于大数据时代体育的思考,这一阶段人们逐渐对大数据与体育结合的相关研究产生兴趣,学者对大数据与体育之间联系方面的研究奠定了体育大数据发展的基础。贺鑫森就大数据这一背景与体育科研之间的关联做出了详细分析[3]。
第二阶段,该领域文献的关键词有“大数据、人才培养、体育教学、全民健身”,这一阶段产生大量体育大数据领域的研究,出现多元化综合发展趋势,主要集中在大数据时代体育科研教育、全民健身、体育人才培养、体育赛事以及体育经济等方面,在体育科研教育方面的研究,包括大数据与体育教学的关系[4]、开设体育公共课的价值[5]以及对增强青少年体质的课程改革[6];全民健身方面主要探究全民健身对体育发展的促进作用以及全民健身服务体系的构建[7];体育人才培养方面主要探讨我国院校的体育人才培养新路径[8];体育赛事方面的研究主要包括体育赛事的价值、转型与前景以及竞技体育与高校之间的深层次分析[9];体育经济方面主要集中在以体育经济为背景分析体育产业、体育经济的地位以及发展前景[10]。
第三阶段,关于体育大数据领域的文献数量仍在增长,主要关键词集中在“体育旅游、体医融合、高校体育教学、智慧体育”等方面。这一阶段,主要集中研究技术与体育相结合的相关主题,大数据时代MOOC 和体育教学相结合的方式越来越普及[11],智慧体育概念被进一步推进,智慧体育平台构建以及与传统体育教学融合不断被论述,提出智慧体育背景下体育旅游可行性分析与建议。此外,大数据时代体医融合[12]也不断被重视起来,通过分析体医融合优势,提出切实可行发展建议。这一时期的研究开始呈现多元化及交叉化发展趋势,与体育领域结合的研究也将更丰富。
文章运用陈超美教授开发的Cite Space(5.6.R2版本)软件作为可视化分析工具,对我国体育大数据相关文献进行分析,以探寻该领域的研究历史、现状和发展趋势。分析发现:
(1)以体育大数据为主题的研究文献偏少,发表核心期刊论文及其他研究成果占总文献比例较低,主流研究文献集中于非核心期刊,不论是主流期刊的突破还是研究文献总数递增,仍有较大提升空间。
(2)体育大数据领域有明显影响力的作者较少,基本以独立研究为主,研究机构之间缺乏互相交流,以及同其他学科交叉研究,且研究机构与院校发文较零散,机构之间合作网络尚未形成,有很大合作空间,特别是交叉学科研究。
(3)体育大数据研究主题主要集中于大数据与体育、教学改革、高校体育、体育旅游和体育传播等方面。2013—2014年人们逐渐对大数据与体育结合产生兴趣,学者对大数据与体育之间联系方面的研究奠定了体育大数据发展的基础;2015—2018年产生大量体育大数据领域研究,出现多元化综合发展趋势;2019—2020年底的研究开始呈现多元化及交叉发展趋势。
未来应扩大体育大数据领域研究范围,加强核心期刊发文数量,与邻近学科合力研究,开拓体育大数据领域交叉学科研究路径。目前,研究机构之间还存在很大合作空间,需要加大合作力度,形成合作网络,促进多方共同发力,形成体育多元化发展趋势。
大数据技术的应用必将影响到生活多个方面,重视体育大数据研究,能够推动大数据技术运用于体育领域,使其渗透到学校体育、全民健身、竞技体育以及体育公共服务等领域,融入人民日常体育生活。推动全民体育大数据应用,实现体育科技应用现代化,加速我国体育事业发展,为建设现代化体育强国助力。