科学知识图谱在我国体育学科研究中的应用

2018-09-11 03:48李雪宁
体育科研 2018年4期
关键词:科学知识图谱可视化

李雪宁,王 晶,谷 岩

体育科学研究方法选择和应用的科学性与体育科学研究方法本身的科学性同等重要。体育科学研究中量化研究范式的扩展,缩小了质性研究的空间[1]。尤其是进入21世纪,随着互联网技术的快速传播,科学知识在短时间内迅猛发展。一味依靠遍览群书、经验等已经无法及时解释涌现出来新的、复杂的问题以及社会现象等。面对科技文献的爆炸性增长,一种立体、直观的可视化技术出现在研究者的视野中,这就是科学知识图谱。科学知识图谱以科学知识为研究对象,以引文分析和可视化技术为基础,涉及应用数学、计算机科学、信息科学及认知科学等诸多学科交叉的领域,是科学计量学和信息计量学的新发展[2],是从科学文献中探索并显示科学发展的新趋势和新动态的一种通用方法。

时至今日,科学知识图谱在体育学科领域得到广泛的推广与应用,让人们从海量文献中及时有效地掌握关键性文献,进入学科前沿领域。虽然已有诸多学者运用科学知识图谱的理论与方法对我国体育学科的不同领域进行了多方面的研究,但是缺少系统性的梳理,如对研究工具的选择、研究方法的应用以及研究内容的归纳与整理。本文旨在对体育学科领域应用科学知识图谱的研究进行分析,揭示科学知识图谱在我国体育学科中的应用进展,为其他研究者了解科学知识图谱在体育学科应用的现状和发展提供参考。

1 科学知识图谱在我国体育学科中的应用现状

信息计量学和科学计量学等领域的主要代表学者,很早就已经开始利用图形来表达某一学科领域的研究进展、研究热点以及预测研究趋势等。然而传统科学计量图谱只是以简单的二维图、三维图的形式来表达知识信息,而后出现的三维构型图谱、多维尺度图谱、社会网络图谱等,被广泛应用到很多学科领域中,但在体育学科领域中较少被应用。虽然老一代的学者们也通过图谱的形式表达学科之间的信息和结构,但并没有应用“科学知识图谱”这一概念。直到2005年陈悦、刘则渊介绍有关科学知识图谱的概念,阐述科学知识图谱绘制的最新进展,并展望了其应用前景,标志着“科学知识图谱”这一概念的正式确立[3]。

通过对文献的搜索,本文发现我国体育学科领域中应用科学知识图谱的研究,更多依据陈超美绘制科学知识图谱的理论和方法。杨佳宁于2010年首次采用科学知识图谱进行可视化分析,利用CiteS-pace可视化工具探索了体育管理与经营的前沿和热点[4];同年,王琪应用科学知识图谱在中文社会科学引文索引 (Chinese Social Sciences Citation Index,CSSCI)期刊上发表4篇体育相关领域的文章[5-8],其研究成果侧重于对国内外体育科学研究现状、发展路径和研究前沿的探讨。经统计发表在核心期刊上的应用科学知识图谱的体育学科文章有69篇,尤其在2017年达到20篇,可见科学知识图谱在体育学科中的应用已经得到了体育学者们的关注,其应用的现状涵盖以下几个方面。

(1)竞技体育领域。于红研等利用CiteSpace可视化软件,对Web Of Science数据库1997—2014年以体能训练为主题的文献进行可视化分析,梳理了国际体能训练领域的国家、研究机构、期刊分布以及关键性文献,分析了当前的研究热点领域和前沿[9];张承毅、王毅探索了篮球训练已有研究成果的现状、热点领域和聚类视图[10];夏培玲以科学知识图谱的形式展示了国外高原训练的研究热点、核心作者、研究机构以及研究前沿[11];王琪、胡志刚以来自科学引文索引(Science Citation Index,SCI)和社会科学引文索数据库 (Social Sciences Citation Index,SSCI)的

1 196 篇奥林匹克运动相关文献为研究对象,绘制出了国际奥林匹克运动的高频关键词共现图谱[12]。

(2)学校体育领域。陈昌盛等应用科学知识图谱从研究热点、学术共同体、学科基础理论和学术平台4个方面揭示了推动我国学校体育理论发展的力量[13];李贵庆、胡雪晴等探索国内外高校健美操研究的作者、研究主题、热点和前沿,通过对比分析阐述了高校健美操研究进展的演化规律[14];姚宪国采用文献计量学方法对我国体育教育训练学的研究基础和前沿进行可视化分析,并确定了该领域的研究热点[15]。

(3)大众体育领域。张丹运用内容分析法、科学知识图谱等方法,客观全面地对1982—2015年中国知网中国学术期刊网络出版总库(CAJD)数据库收录的有关农村体育的文献进行分析,发现我国农村体育研究发展经历了3个阶段,并探索了不同阶段的研究主题,提出农村体育研究的发展战略[16];李立峰借助CiteSpaceⅢ软件对我国体育公共服务的

1 634 篇相关文献进行共现分析和聚类分析,梳理该领域的研究热点、研究前沿及其发展趋势[17];张欣和赵亮通过对比分析国际和我国排球领域的相关研究,发现我国该领域研究的不足之处,并提供建设性指导意见,认为借鉴国外成熟的研究范式,可更好地完善我国排球领域的相关研究[18]。

总之,作为一种新兴的研究手段,我国体育学科中应用科学知识图谱的研究已取得一定的研究成果,不仅丰富了体育学科的研究方法,也完善了我国竞技体育、学校体育和大众体育领域的理论性研究。但应用科学知识图谱的文献中,也不可避免地出现低质量和重复性的文章,客观、全面地探讨科学知识图谱在我国体育学科研究中应用的发展过程、研究主题等方面的研究,则相对缺乏。

2 应用科学知识图谱的文章的发文量分析

统计体育学科中应用科学知识图谱的文章的发文量,能够展示当前科学知识图谱在我国体育科学领域中的应用现状。本文通过SATI3.2软件对从中国知网检索的219篇应用科学知识图谱的文献分别进行全部期刊类别和CSSCI期刊类别的年度划分,经统计得到图1所示的结果。科学知识图谱在体育学科中的应用从2010年开始,第一年就有7篇相关文献,其中CSSCI期刊中有5篇。另外,图1显示,从2013年开始科学知识图谱在体育学科领域的应用越来越广泛,尤其在2017年相关文献数量达到最多的76篇,其中CSSCI期刊中有24篇。显而易见,应用科学知识图谱的体育学科领域文章的发文量,无论是全部期刊的文献数量还是CSSCI期刊中的文献数量整体都呈现出增长的趋势,而且变化幅度基本一致。体育学科领域中应用科学知识图谱的研究虽然起步晚,但研究者对科学知识图谱的关注度却与日俱增,主要是因为借助科学知识图谱的理论与方法来研究体育学科某一领域,可及时看到成果,了解该领域的发展现状、热点、趋势等内容。体育学科中有关文章在发文量上的变化已经明确地认可了科学知识图谱在体育学科中的应用价值。

图1 我国体育科学领域中应用科学知识图谱的有关文章的年度发文量统计Figure 1 Amount of the Annually Published Documents on the Application of Scientific Knowledge Map in China’s Sports Scientific Researches

3 我国体育学科研究中科学知识图谱绘制的主要软件与基本方法

3.1 主要软件

根据国内文献调研发现,20世纪80年代初,体育学者开始利用科学计量学的方法进行计量分析[8],但是体育学科领域内应用科学知识图谱的研究的兴起是在2011年之后。在国内体育学科领域的可视化研究主要应用的软件是陈超美博士研发的CiteS-pace可视化软件,该软件还可以对数据进行预处理和去重。邓晓琴和郑松波借助CiteSpaceⅤ软件对Web of Science数据库所收录的2001—2017年运动与骨密度领域相关研究文献进行计量分析[19];钟飞等利用统计工具SATI3.2对国内外乒乓球研究文献年发文量、第一作者发文量、关键词词频进行统计,并利用CiteSpaceⅢ软件绘制相关的可视化图谱[20];佟岗运用CiteSpaceⅢ软件绘制了我国运动训练理论的热点和时区科学知识图谱,同时还借助SPSS软件进行了关键词多维尺度分析,归纳了该领域的知识群[21]。另外,任常胜利用Pajek软件也实现了国内外体育公共服务比较研究的可视化[22];王冬慧和刘兵借助了Bicomb和SPSS软件对校园足球相关研究进行文献计量学的分析[23];杨红英采用社会网络分析工具的Ucinet6、Netdraw软件构建了合作网络科学知识图谱,从多个角度分析、评价以及探讨我国学术论文机构的地位、核心团体和机构合作形成的机制[24]。

虽然体育学科领域的研究应用了多种软件,但对部分软件的应用效率较低。如统计分析软件SPSS在体育学科领域的研究中一直被应用,但多是被用来对数据进行统计和分析(如方差分析、因子分析和T检验等),而被用来进行聚类分析和多维尺度分析的情况则较少;针对社会网络分析的Ucinet6、Netdraw、Pajek软件,以及针对词频分析的 Bibexcel、SATI3.2、Bicomb统计软件等,被使用的频率则更低。一方面我们了解科学知识图谱的用途,但对绘制科学知识图谱的可视化软件并不完全掌握;另一方面有些体育学科领域的研究者在应用科学知识图谱进行研究时,总是参考已有文献,缺少新意,这是造成应用科学知识图谱的文章出现“千篇一律”现象的主要原因。

3.2 基本方法

我国体育学科领域的有关论文结构和内容的研究,主要使用的方法包括两大类:共现分析和共被引分析。共现分析属于内容分析方法的一种,主要是聚类和数据可视化[25],包括关键词共现分析、机构共现分析、期刊共现分析、作者共现分析,其中关键词共现分析又称共词分析[26]。张丹和王健对我国农村体育研究的文献进行关键词共现分析后,发现了不同阶段研究主题的特征及变化[16];王克阳等对我国体育仲裁研究的作者、期刊和机构等外部特征进行分析,发现当前该领域的研究人员主要集中在综合院校的法学院,而且高产作者之间、机构间的联系不紧密[27];李克敏等以 1991—2015年 CNKI的 159篇与体育创业相关的文献为文本,通过对其关键词、期刊、作者和机构间的共现分析,了解到我国体育创业相关研究的时空分布特征及研究热点领域[28]。综上所述,通过关键词分析,可了解体育学科某一领域的研究主题、研究热点以及研究趋势等内容;对研究机构的共现分析,可显现出高产机构、机构的分布以及机构之间的合作情况;对文献来源期刊的共现分析,可以展现出相关文献发文量多的期刊,以及不同期刊对某一学科领域的关注度。

共被引分析又称共引分析、同引,包括文献共被引分析、作者共被引分析和期刊共被引分析。韩永君通过对国外体育政策相关研究进行共被引分析,梳理出6篇经典文献,并发现这6篇经典文献在研究边界、对象、内容和途径方面存在一定的共性特征[29];傅鸿浩等通过对发表足球运动研究的英文期刊的共被引网络分析,发现《运动医学》和《运动科学杂志》是中心性值最高的两个期刊,二者构成了足球运动科学研究领域的绝对核心期刊[30]。基于此,可认为文献共被引分析,就是要通过分析文献同时被其他文献引用的频次高低,显示出研究领域中有影响力的文献,即经典文献;同理,共被引作者分析和共被引期刊分析,也是通过被引频次的高低来进一步分析该领域的有影响力的核心作者 (如提出新的观点的作者)和核心期刊(某一研究领域的主要期刊等)。

4 科学知识图谱在我国体育学科领域研究中的应用

为了进一步了解科学知识图谱在我国体育学科领域研究中的应用,本研究对该领域的相关研究文献进行了可视化分析。数据文本来源于CNKI,主题词为“科学知识图谱”或“知识图谱”或“可视化”,学科领域限制为体育科学,时间截止到2018年1月12日。通过检索,本研究得到275篇文献,剔除与主题无关或相关度低的文章,最终得到219篇有关文献。

本文对最终检索到的219篇文章的353个关键词,截取频次3次及以上的高频关键词进行共词网络分析,设定“Time Slicing”值为“1”,节点类型“keywords”,阈值设定为“Top70”,算 法选 择 “Minimum Spanning Tree”(最小生成树计算法),并选取“Pruning the merged network”(综合网络)裁剪方法,初步得到图谱。而后本研究将表达意义相近或相同的词语进行合并,如“知识图谱”和“科学知识图谱”合并为“知识图谱”,“研究热点”“热点”“热点领域”合并为“研究热点”,“CiteSpace”“CiteSpaceⅡ”“CiteSpaceⅢ”合并为“CiteSpace”等,规范合并后得到高频关键词的共现分析图谱(图2)。图2中每个节点代表一个关键词,节点的大小反映的是该关键词频次的高低,连线表示关键词之间的共现关系,紫色光圈表示具有中心度,直接反映了对应关键词在整个研究网络中的媒介能力以及资源调控的支点作用。

图2 高频关键词的共现分析图谱Figure 2 Co-occurrence Analysis Map of the High-frequency Keywords

根据高频关键词之间的共现情况可以看出,科学知识图谱在体育学科领域的研究中具有广泛的应用功能,在探讨学科某一领域的研究主体、知识基础和研究进展等方面有重要作用。本文通过现有研究文献集中地简要阐述科学知识图谱在体育学科领域的应用情况。

4.1 探索体育学科某一领域的研究主体

某一领域的研究主体是指从事该领域的研究者,而相对文章而言,研究主体就是作者、作者所在的机构、作者所在的国家或地区等。对体育学科某一领域研究主体的基本信息的把握,可令人认识到研究领域的发展方向,以便及时了解最新的发展动态。陈栋等以Web of Science中的SCI-E、SSCI数据库为数据来源,绘制了体育教育研究领域的高产国家、高产作者和研究机构的知识网络图谱[31]。焦喜便等学者通过对国内外数据库的研究,发现中外体育学动作发展研究中,美国、荷兰是主要研究国家,高等院校是研究主体,研究机构之间的合作度较低等特征[32]。田烈对CNKI收录的453篇文献进行文献计量分析,其结果表明体育信息化研究缺少核心作者和研究群体[33]。上述研究都是从科学计量学的角度对体育学科某一领域的科研人才、机构、地区等进行定量分析与评价。借助科学知识图谱,这些研究形象立体化地展示了作者、作者合著、机构分布图谱等。

4.2 探索体育科学某一领域的知识基础

学科的知识基础一般包含文献内容及相关文献发表的期刊两个部分[8,19]。知识基础由引文文献的被引文献组成,因此对被引文献进行共被引分析,可以获得高被引文献,进而发现该研究领域的知识基础,从而探求研究领域的研究热点、理论脉络与发展趋势。石岩通过绘制体育运动风险研究的知识基础的被引网络图谱,揭示了体育运动风险研究的整体演进过程是由理论研究逐渐过渡到应用研究,并深入剖析了不同阶段的研究热点和侧重点的差异[34]。王琪运用科学知识图谱和可视化技术对中、美、英3个国家体育科学的权威综合期刊进行分析,总结归纳出21世纪以来3个国家的体育科学发展的特征及异同点,梳理出不同国家关注的重点和研究方向[35],为我国体育科学研究者提供理论依据,引发新思考。通过以上的分析,可以看出,科学知识图谱对于挖掘体育科学不同领域的知识基础有很大的帮助,它不只是提升了工作效率,更重要的是具有科学性和合理性,让研究者可以很清晰地观察到相关研究领域的核心内容。此外,CSSCI也有引文分析的功能,可以更好地挖掘研究领域的知识基础,在日后的研究中应更多地对此加以应用。

4.3 探索体育学科某一领域的研究进展

研究进展是对于某一研究领域的宏观把握,可以将其归纳为研究热点、研究前沿和研究趋势[22,23]。研究热点展现某一研究领域的关注点,研究前沿阐述某一领域的发展动态,研究趋势是在研究热点和研究前沿的基础之上,结合对当前研究的掌握情况,对研究日后发展方向进行预测。近年来,有关体育学科研究进展的探讨受到体育学者的广泛关注,出现的研究成果也日渐增多。张承毅对1990—2016年国外核心期刊刊载的篮球训练相关的文献进行可视化分析,发现此阶段中篮球训练的研究热点在于运动表现、训练和运动员的力量训练、损伤预防、少儿篮球、比赛和疲劳等几个方面[10]。李立峰通过分析高频关键词的共现网络和时区图谱,了解到公共体育服务研究的热点已由对体系和概念的辨析转变到对公共服务体系评价的研究,并发现该领域的研究主题多样,研究内容不断深入,横向、纵向研究齐头并进的特征[17]。朱昆、赵丙军等利用CiteSpace绘制出我国竞技体育后备人才培养发展演进的科学知识图谱,揭示了该领域研究的时空分布特征、研究热点及演进路径[36];石岩以142篇文献为数据来源,对我国体育暴力相关研究的热点、演进脉络和发展趋势进行了探讨,提出了未来我国体育暴力相关研究的方向[37]。综上所述,运用科学计量学方法对体育学科不同领域的研究进展进行分析,可以让学者明确掌握研究的发展动态,理清当前学者们关注的焦点以及研究趋势,这对科研工作者来说具有价值。科学知识图谱的出现与应用,还突破了体育学科领域中传统定性分析以思辨为主的研究范式,研究者开始运用科学计量学中定性定量相结合的方法来探索体育学科的发展。

5 体育学科领域中科学知识图谱应用的不足

综上所述,体育学科领域的研究应用科学知识图谱,主要目的是探讨某一领域的研究主体、知识基础以及研究进展,这符合科学知识图谱的功能。但是从现有研究来看,科学知识图谱在体育学科领域中的应用还存在不足,主要表现在以下三个方面。

(1)统计方法过于传统。绝大多数应用科学知识图谱的研究聚焦于关键词、作者、期刊等频数的统计,对因子分析、聚类分析、多维尺度分析等多元统计方法的应用较少,而后述的这些方法早已成为辅助科学计量学研究的常用方法。

(2)文献计量学方法的应用较为简单。通过在上文中对体育学科领域应用科学知识图谱的研究方法的梳理可以发现,学者过多关注关键词、期刊、机构等共现分析、聚类分析、共被引分析,却忽视了科学计量学中较为典型的引文分析、耦合分析和社会网络分析。

(3)可视化和统计软件的应用略显单薄。科学知识图谱的应用在情报学、管理学、计算机等学科已形成成熟的体系,它之所以能在其他学科中得到推广与普及,很大因素缘于应用软件的科学性、合理性与有效性,可以实现文献的计量分析。但体育学科领域中对科学知识图谱的实际应用并未很好地借鉴其他学科的应用实践,如未能很好借鉴SATI3.2文献数量统计软件、Netdraw和Ucinet社会网络分析软件的应用等。

科学知识图谱在科学计量学、文献计量学等领域已经形成了成熟的体系,相应的绘制软件和分析方法都有了很大的发展,但体育学科领域的学者们更多地只是关注陈超美开发的CiteSpace软件所绘制的引文数量科学知识图谱,忽视了对早前科学计量学中的耦合分析、链接分析方法、共引分析方法、社会网络分析方法等的应用,而后述的方法也是揭示学科发展与联系以及学科结构的有效方法。

6 小结

本研究总结了体育学科领域中科学知识图谱的应用,发现:科学知识图谱的应用领域广泛,涵盖了大众体育、竞技体育和学校体育等;应用科学知识图谱的相关文章的发文量呈现逐年递增的趋势。经对已有研究进行多元分析后发现,科学知识图谱方法在体育学科领域中的应用主要聚焦于探索某一领域的研究主体、研究基础和研究进展。科学知识图谱方法进一步完善了体育学科的研究范式,扩宽了学者的研究思路,但实际应用中也有其不足之处,统计方法、研究方法以及软件等的使用较为简单。在日后的研究中,学者们要避免重复性、低质量的研究,要在科学知识图谱的方法、内容、软件的应用上有所创新和突破。

猜你喜欢
科学知识图谱可视化
基于图对比注意力网络的知识图谱补全
自然资源可视化决策系统
思维可视化
蜗牛看牙医
基于知识图谱的我国短道速滑研究可视化分析
复变函数级数展开的可视化实验教学
复变函数级数展开的可视化实验教学
图表
饮料瓶中的云
探析小学科学游戏化教学