基于科学知识图谱的国内体育旅游领域研究态势可视化分析

2018-01-19 09:09赵东辉唐照华
吉林体育学院学报 2017年6期
关键词:发文图谱节点

赵东辉 唐照华

(成都体育学院研究生院,四川 成都 610041)

伴随社会经济快速发展和人们生活水平普遍提高的社会大环境变革,体育旅游作为一种新颖的休闲生活方式逐渐走进人们的生活视野,成为拉动内需的一个新的热点。特别是在国家和地方陆续推出《健康中国2030规划纲要》《体育产业发展“十三五”规划》《关于推进体育旅游融合发展的合作协议》等一系列政策法规后,国内各省市地区纷纷将发展体育旅游纳入到了各自发展规划当中,推出了结合本地优势特质的体育旅游项目。在国家和地方政策的推动下,体育休闲旅游进入了高速上升期,其辐射的体育用品、文娱消费、康体养生、户外运动等相关领域也步入黄金发展期,体育旅游作为体育和旅游交互融合的新兴产业形式,覆盖面广、交互性强,但因所受制约因素影响,又具有很大的变动性、不可预性。如何深入剖析体育旅游发展脉络,为快速推进和科学决策体育旅游事业发展,成为一个重要课题。科学知识图谱是以科学知识为计量研究对象,显示科学知识的发展进程与结构关系,用数学方程式表达科学发展规律,采用引文分析方法与信息可视化技术,运用曲线、图谱等方式,将科学发展规律绘制成知识图谱,可以寻找某一学科领域研究进展、前沿动态,及其与其相对应的知识基础,有助于了解和预测科学前沿与动态,挖掘开辟新的未知领域[1]。本文通过运用cite spaceⅢ引文分析软件结合二次文献资料分析方法,对国内体育旅游领域研究热点和发展趋势进行归纳解读,以期把握其发展关键点,推进新时期体育旅游事业全面发展,发展体育产业是顺应时代需求,响应国家政策号召,同时也是推动全民健康事业发展的有效手段。

1 数据来源与研究方法

1.1 数据来源

本研究的文献数据来源于中国国家知识基础设施工程,其英文全称为“Chinese National Knowledge Infrastructure”,英文简称“CNKI”。该学术期刊数据库收录科研文献类别之多、涉及学科领域之广居国内之最,所收录的科研文献具有较高的学术权威和研究价值,因此本文选取CNKI数据库作为数据采集源,通过对1991—2017年我国体育旅游研究主题文献采取高级检索,输入检索条件:主题词为“体育旅游”、“精确”,时间跨度为1991—2017年,数据库检索文献下载时间为2017年10月1日,根据相关主题研究需求,进行纳入排除标准择取,选取数据样本文献4532篇。

Cite space又称为“引文空间”,是美国德雷塞尔大学(Drexel)信息科学与技术学院的陈超美教授开发研究的适用于多元性、动态的网络分析,能够绘制共词聚类图谱和时区视图的可视化应用软件[2]。 科学知识图谱工作原理是分析信息知识单位(科学文献、作者、关键词等)的相似性及测度,采用不同技术和算法绘制不同类型的知识图谱,通过图谱分析探索研究领域前沿热点和主题演化过程,直观地辨识出学科前沿的演化路径[3],并且可以利用cite space寻找学科领域的研究现状、进展、前沿及其对应的知识基础,从中获取该领域的发展新趋势和新动态。

1.2 研究方法

1.2.1 文献计量法

运用文献统计分析,采取统计学知识与方法对研究文献特征进行统计分析,利用数据表达方式描述其变化规律,进而阐述文献特征与存在的内部规律。

1.2.2 数理统计法

运用Excel等办公软件对可视化分析中得出的发文量、研究机构、作者等数据结果进行整理和分析。

1.2.3 逻辑分析法

对cite spaceⅢ软件运算呈现的科研机构分布、高产作者、文献贡献量、高频词汇等进行逻辑分析,以揭示其存在特征和内部规律。

1.2.4 可视化分析

通过cite spaceⅢ软件进行科学知识图谱生成绘制,采取高产作者分析、核心关键词分析、共被引分析、共现网络分析等计量和可视化分析方法,获悉国内体育旅游研究热点及演化特征。 通过纳入排除标准选取的4532篇文献数据,导出为题录,保存为ref works格式,输入data进行文本转换,将时间跨度选定为1991—2017年,时区切片设定为1年,主题词来源选中 Title 、Abstract、Author Keywords( DE) ,Keywords Plus( ID) ,Node types选取要进行分析的作者、科研机构、国家地区、关键词、共被引作者、共被引文献等,阈值设定为(2,2,20)、(2,2,20)、(3,3,20),选定路径检索为修剪片网络(pruning sliced networks)、最小生成树( Minimum Spanning Tree),科研机构和作者共现分析选取寻径(pathfinder)的算法。根据所要进行的不同分析主题内容,进行相关网络节点设置。

2 研究结果与分析

2.1 国内体育旅游研究发文量时间分布

国内体育旅游领域科研文献的发文量在一定程度上反映了体育旅游学术研究的发展现状和总体变化趋势,通过纳入排除标准选取的数据文献,生成发文量时间分布图。由图1可知体育旅游学术研究开始较晚,始于1991年,在1991—1999年间处于发展起步阶段,在这一时间段内,发文量较低且分散。自1999年开始进入发展上升期,该时间段内文献发文量虽有波折,但总体趋势向上,且伴有两次发文高峰期,仅2011年体育旅游科研文献就达到了441篇。国内体育旅游相关科学研究呈现发展趋势是整体向上,局部略有起伏的波浪式发展。

图1 1991-2017年体育旅游科研文献时间分布图

2.2 国内体育旅游科研机构分布

科研机构作为国内各学科研究领域的主要力量,进行科研机构的共现分析,可以很直观地显示国内各科研机构体育旅游学术研究实力及其影响力分布。运用cite spaceⅢ软件,Node Types 选取机构(institution),设定合适阈值,绘制国内体育旅游科研机构共现知识图谱,如下图2。

通过对近20多年来国内体育旅游科研机构的梳理分析,可以反映体育旅游学术研究机构发展现状和分布情况。如图2所示,图中的圆圈称为节点,每一节点代表一个研究机构,节点的大小与科研机构在某一领域的科研地位和影响力成比例关系,节点越大,表示出现频次越高,文献占比和科研地位越高,反之亦然,节点间的连线代表研究机构的合作关系,连线越粗表示合作关系越紧密。节点表示类型选择,就是节点词的表现形式,分为名词词组和突显次组,名词词组—从引用文献的题录中抽取;突显次组—从关键词中抽取某一时间段内高频专业词组,同时可以选择节点单一节点,生成单一网络,也可选择多个节点,生成混合网络[4]。由图2显示可知Node(节点)=560,links(连线)=74,density(网络密度)=0.0005。其中节点最大是广西师范大学体育学院,表明该机构在体育旅游研究领域发文量占比最高,其次是吉首大学体育科学学院,海南师范大学体育学院等。同时,运用cite space选择 Clusters/ Cluster Explorer 命令,对科研机构共现网络进一步分析,统计体育旅游发文量排名前 10 位的机构。

图2 1991-2017年国内体育旅游科研机构共现知识图谱

排名发文量(篇)机构名称地域136广西师范大学体育学院华南地区西部235吉首大学体育科学学院中南地区333海南师范大学体育学院华南地区427贵州师范大学体育学院西南地区526齐齐哈尔大学体育学院东北地区626河南大学体育学院华中地区725成都体育学院西南地区822安徽师范大学体育学院华东地区921西北师范大学体育学院西北地区1021郑州大学体育学院华中地区

节点的不同颜色代表年环,引文年环代表了这篇文章的引文历史。引文年环的颜色代表相应的引文时间,一个年轮的厚度与某个时间分区内的引文数量成比例,节点旁边的数字代表整个时间跨度内的被引次数[5]。由图2和表1可知,国内体育旅游研究机构之间的合作较少,多为独立研发,研究力量主要分布在各大高校,发文量前十的研究机构师范类院校占比较高,另外研究机构跨地域的合作网络很少,网络密度较低,有待加强。广西师范大学体育学院节点最大,发文量36篇,其次是吉首大学体育科学学院35篇、海南师范大学体育学院33篇,其中发文量排名前十的研究机构中,专业性体育院校1所,发文量25篇,占比0.9%;师范类体育院校5所,发文量139篇,占比51%;综合类大学4所,发文量108篇,占比40%,表明在体育旅游研究领域师范类大学体育学院具有较强的科研实力和影响力,各综合性大学是国内体育旅游研究的中坚力量。

2.3 国内体育旅游发文作者分布

一个学科领域中,科研文献可以在一定程度上反映该学科的科研发展水平和发展趋势,作者的文献数量反映其知识的产出能力,是作者劳动效率的客观标准之一。作者的成就与其在重要刊物上发表的论文数量高度相关,其高质量论文数量与科技成果成正比,通过样本数据文献的导入输出,网络节点类型选择author,选择合适阈值,绘制国内体育旅游科研人员情况的知识图谱。

图3 1991-2017年国内体育旅游发文作者共现知识图谱

图3是1991—2017年国内体育旅游领域研究人员的共现知识图谱,其中Node(节点)=769,Links(连线)=261,Density(网络密度)=0.0009,图中节点代表发文作者,节点越大,名字越凸显,表明该作者的发文量越多、该领域影响力越大,连线的数量和粗细代表作者间合作的量度和次数。由上图可知,现阶段国内体育旅游领域研究人员数量激增,高产作者分布相对分散,文献贡献多为独立研发,合作网络组成较少,而产生合作的也多为师生或同事关系,再者多学科间的交叉互动较少,跨地域、跨领域的协同研究有待加强。

表2 1991-2017年国内体育旅游高产作者排名前十

根据上图表分析可知,在1991—2017年间,吉首大学体育科学学院的刘少英发文量最高(19篇),曲阜师范大学体育学院姜付高(18篇),河南大学体育学院于素梅(18篇),位居前三,其余作者文献贡献相对较少,但也对国内体育旅游研究事业作出了贡献。从职称来看,多是来源于各大高校的教授、副教授、讲师等,其中副教授和讲师占比较高,教授次之;从发文起始年份来看,各高产作者进行体育旅游学术研究起步较晚,主要集中在2000年以后;从年龄来看,高产作者年龄分布主要集中在30岁—50岁之间,多为中青年学者;从研究人员层次来看,主要集中在教授、科研机构研究员、博士或硕士研究生、本科生。

2.4 国内体育旅游科研文献被引次数分布

运用cite spaceⅢ软件进行样本数据文献分析,通过筛选4532篇相关体育旅游科研文献,选取其被引次数排名前十的文献。

表3 1991-2017年国内体育旅游被引文献排名前十分布

被引文献在一定程度上可以反映某一时间段该学术研究领域的关注的热点问题,文献被引次数越高,下载次数越多,说明这篇科研文献的含金量越高,学术价值越大。本文列举了1991-2017年间被引次数排名前十的体育旅游研究领域科研文献。从引用次数来看,体育旅游研究领域文献被引次数最高的是汪德根的《体育旅游市场特征及产品开发》被引次数为353次,其次文献被引次数为301次、216次,排名前十被引次数最低也有142次;从刊载期刊来看,旅游学刊、体育学刊、天津体育学院学报各出现次数两次,说明这三个期刊对体育旅游研究领域的关注度较高;从期刊发表时间来看,体育旅游研究领域的学术研究起步较晚,2000—2003年是体育旅游学术研究高速发展期,被引用次数排名前十文献在这一时期占比高达80%。

2.5 国内体育旅游研究热点分布

一篇文献的关键词是对论文主题的高度概括,显示了科研论文研究的主体方向,在一定程度上表明该研究领域的热点,论文关键词出现频次越高,可以反映在某一时间区内,关注度越高,其演进过程一定程度上反映了该领域科研发展历程。运用cite spaceⅢ软件,Node types选择keyword,设置合适阈值,绘制国内体育旅游研究领域关键词共现知识图谱。

图4为高频词关键词聚类共现知识图谱,节点个数426,连线个数1202,网络密度为0.0133,图中网络节点的中心度显示了与该点联系的个体数目,网络节点越大,表明了该主题词影响力越大,关注度越高。

图4 1991-2017年国内体育旅游关键词聚类共现知识图谱

排名高频关键词频次中心性1体育旅游23380.172对策3140.023开发2990.064体育旅游资源2170.095发展2080.116现状1860.087旅游1820.078旅游资源1710.129体育产业1430.0710体育旅游产业1330.12

表4列出了国内体育旅游研究领域高频前十的关键词,其中体育旅游作为本研究的主题词出现频次最高,达到了2338次,关键词中心性为0.17;其次是对策,出现频次达到了314次,关键词中心性为0.02、关键词开发出现频次数为299次,关键词中心性0.06。从上图表中说明了,体育旅游、对策、开发是国内体育旅游研究的中心,占比较高,其余关键词也有较高的出现频次“体育旅游资源”、“现状”、“旅游资源”、“体育产业”等。

2.6 体育旅游研究领域的时区演进分布

一个学科领域的学术研究是一个动态发展的过程,随着时间的发展而演进。本文基于cite spaceⅢ软件,Node Type(网络节点)选择关键词(Key word),年份选择1991-2017年,年份以1年为切点分割,生成体育旅游主题研究的时区知识图谱。主题时区知识图谱是将单个时间段内引文网络独立成图,再按照时间序列的编排进行合并,进而可以在图谱中探寻该领域学术研究发展历程中的关键点、中心点,从而清晰梳理出国内体育旅游发展的演变路径、发展脉络,以期把握学科知识领域发展过程中的动力因素和背景。国内体育旅游研究主题演进绘制时区知识图谱,从中直观地反映出自1991-2017年间国内关于高校体育旅游研究主题的演进趋势,有助于科研工作者从中寻找其研究热点的前沿动态。从上图5分析可知:国内关于高校体育旅游的学术研究在1991-2000年处于起步发展阶段,其研究的热点多集中于体育旅游、发展对策、资源开发、旅游资源等方面,这一时期是国内体育旅游兴起发展阶段,各方面尚处于起步阶段,研究的方向多趋向于理论研究和发展前景预测等方面;2000—2008年处于高速上升期,期间出现两次学术高发期,其研究热点多集中在民族体育旅游、体育产业、开发策略、体育旅游产品、地区体育旅游发展等方面,这一时期由于社会经济发展、国家和地方政策利导,国内体育旅游处于稳步发展阶段,研究方向趋向多元化;2008年至今国内关于体育旅游学术科研趋向相对平稳发展,研究热点多集中在生态体育旅游、民俗体育、旅游产业、政策解读、特征、体育赛事等方面。由于体育旅游基础理论研究逐渐完善,研究热点转向多样性。从上述国内体育旅游发展的各个时期来看,可以看出关于体育旅游领域基础理论研究趋向成熟化,学科理论体系趋向于完善,但同时由于基础理论的逐渐成熟化,创新性研究出现一定程度上的停滞,以至于国内体育旅游学术研究创新力度不足、研究的深度和广度欠缺、时代化和国际化理念尚有不成熟地方。

图5 1991-2017年国内体育旅游研究进展时区分布共现知识图谱

3 结论

1) 国内体育旅游研究自1991年发展起步以来,呈现整体上升、局部波折的波浪式发展态势,其发展大致可分为三个阶段:发展起步期、快速上升期、稳步发展期。科研文献贡献大幅度增加,其发文量变化是与所处时代的社会经济、体育事业发展紧密相连,紧紧贴合时代的发展需要。

2) 当前国内体育旅游领域科研人员、科研机构多是集中在各大高校和研究所,力量较为雄厚,但彼此之间相对封闭,多为独立研发,合作交流较少,故而迫切需要打破观念束缚,加强学术合作集聚,优化智力资源利用。发展新阶段,积极构建大型交流平台,加强各研究机构的交流互动,实现信息资源交流共享,扩大研究成果,破除过往闭门造车的陈旧科研观念。实现多学科的交叉互动,采取多元化视角,实现跨学科、跨领域的深度融合。

3) 现阶段体育旅游科研工作应积极推进研究视角的多元化、多样性,树立发展的大局观。借助于互联网科技支持,准确把握体育旅游研究领域、科研机构、研究热点等关键节点的内部联系,顺应科研发展的增长速度、多样性的动态变化,坚持理论与实践的相结合,加大资金投入和政策扶持,提升科研成果的转换率,推进实践应用。

[1] 陈悦,陈超美,刘则渊,等. Cite Space 知识图谱的方法论功能[J].科学学研究,2015,33( 2) : 242-253.

[2] 张毅恒,柳鸣毅.基于知识图谱的中国体育产业研究可视化分析[J].中国体育科技.2016(1):24-29.

[3] 何秋鸿.基于知识图谱的我国体育教育研究领域可视化分析[J].北京体育大学学报.2016,39(2):98-103.

[4] 秦长江,侯汉清.知识图谱——信息管理与知识管理的新领域[J].大学图书馆学报.2009(1):30-37.

[5] 何秋鸿.基于知识图谱的我国体育教育研究领域可视化分析[J].北京体育大学学报.2016,39(2):98-103.

[6] 杨强.中国体育旅游研究20年:述评与展望[J].中国体育科技.2011(5):90-100.

[7] 刘庆余.国内外体育旅游研究比较[J].上海体育学院学报.2012,36(4):39-43.

[8] 卢长宝,郭晓芳,王传声.价值共创视角下的体育旅游创新研究[J].体育科学.2015,35(6):25-33.

猜你喜欢
发文图谱节点
七部门联合发文 进一步完善和落实积极生育支持措施
基于图对比注意力网络的知识图谱补全
基于图连通支配集的子图匹配优化算法
一种基于链路稳定性的最小MPR选择算法
结合概率路由的机会网络自私节点检测算法
基于点权的混合K-shell关键节点识别方法
图表
校园拾趣
爷孙趣事
以牙还牙