陈晓玲 王戴尊 姜丹 刘东亮
(1.吉林省科学技术信息研究所,吉林长春 130033;2.吉林大学自然科学学报编辑部,吉林长春 130012)
本研究数据来源于Web of Science核心数据库中的科学引言索引扩展版(SCI-E)、社会科学索引(SSCI)和科技会议录索引(CPCI-S)。SCIE、SSCI和CPCI-S收录了全世界各学科领域的最具有代表性的科技文献,在一定程度上及时、快速地反映了科学研究前沿和发展趋势[1-4]。本研究数据检索与下载日期为2016年12月9日,在Web of Science数据库中按以下检索策略:地区=Heilongjiang AND 语种=English AND 文献类型=Article, 数 据 库=(SCI-E,SSCI,CPCI-S),时间跨度=2012—2016,共检索并下载了6492篇文献,下载的每条文献的题录包括作者、机构、摘要、关键词、年份及参考文献等。
以2012—2016年Web of Science收录黑龙江省的6492篇文献为数据基础,采用科学知识图谱方法中美国德雷赛尔大学计算与信息学院陈超美博士开发的可视化分析软件CiteSpace[5-7],从机构合作的角度找到机构合作关系网络和核心机构,从关键词的共词分析角度绘制科学知识图谱,直观展示黑龙江省的研究热点,最后从学科的共现分析挖掘出黑龙江省的优势学科领域。CiteSpace软件是一款基于Java平台开发的多元化、聚类化、动态化的分析工具,并融入数据挖掘、计算机图形学和先进算法,进行多维度、分时、动态网络分析的创新工具[8-10]。
据统计,2012年至2016年黑龙江省的发文量如图1所示。从2012年起发文量呈持续稳定的增长趋势,每年的发文量一直保持在800篇以上,并且在2015年达到峰值1702篇,显示出黑龙江省的论文产出随时间稳步增长。
在6492篇论文中高被引文献共28篇,按被引频次分布且排名前10 的高被引文献列表见表1。从表1可知,哈尔滨工业大学发表6篇论文,哈尔滨工程大学2篇,哈尔滨医科大学1篇;前6篇高被引文献的被引频次在100次以上,其他文献的被引频次在60~100次;主要研究学科领域是自动化控制、纳米科学、光学等多学科交叉领域。
CiteSpace软件描绘出的黑龙江省机构合作网络图谱如图2所示。图2中节点的大小代表机构发文量,节点间的连线反映机构合作关系和强度,体现了黑龙江省科研机构与其他机构的合作网络关系,形成了4个主要的机构合作群体。
其中,最大的机构合作群体是机构合作群体1,以哈尔滨医科大学为核心,与广州医科大学、黑龙江省医学科学院、黑龙江省医院和中山大学合作,相对合作关系比较复杂和密集,从图2中可以得出黑龙江省的核心机构都与邻近的其他国家、省份的机构开展跨学科、跨领域的科研合作。
图1 2012—2016年黑龙江省论文年度分布情况
表1 2012—2016年黑龙江省的高被引文献列表的前10名
对机构合作网络图谱中的节点信息进行指标统计分析,按机构频次排序,列出频次排名在前10位的机构(表2),频次最高的是哈尔滨医科大学,第二是哈尔滨工业大学,两者的频次都在1500次以上,其他机构的频次都在100~500次,体现出哈尔滨医科大学、哈尔滨工业大学是黑龙江省非常具有代表性的核心机构;中介性和Sigma是CiteSpace软件中的重要指标参数,中介性大于0.1的节点为关键节点;Sigma是对网络节点新颖性的一个综合量度指标,用来挖掘同时拥有强引文突变性和中心性的科学文献的节点。在表2中,黑龙江八一农垦大学和齐齐哈尔大学的中介性大于0.1相对较高,体现了这些机构的合作网络关系的复杂性、频繁性。黑龙江省机构之间的合作主要是以工业、农业、医学等领域的高等院校和科研机构之间校际合作为主,并且同一省份、地域相邻省份、同一研究领域之间的机构合作也较为密切。
图2 2012—2016年黑龙江省机构合作网络图谱
表2 2012—2016年黑龙江省机构合作按频次分布的前10名
CiteSpace软件进行关键词共词分析的时间切片为1年,节点类型选择Keyword,每个时间切片选择Top50,连线强度选择Cosine,网络裁剪使用Minimum Spanning Tree。得到的关键词共词分析知识图谱如图3所示,
图3中节点表示关键词,这些关键词来源于文献的标题、摘要、作者关键词(DE)、WOS提供的关键词(ID),节点的大小表关键词出现的频次的高低,以年轮的形式表示关键词在不同时间段内的出现频次,由内而外依次为2012年至2016年;节点间的连线反映关键词共现的强度和关系。节点越大,表示关键词出现的频次越高;文献的半衰期越长则代表文献越经典。其中高频关键词有表达、细胞凋亡、活性、细胞、模型等共词分析图谱中出现的高频次关键词。此外,系统、增生、生长、疾病、癌症等频次也相对比较高。这些关键词出现频次都在100次以上,反映了黑龙江省区域的研究热点都是关于医学学科领域。
在关键词共词分析知识图谱的基础上,对文献数据进行关键词共词知识图谱聚类分析,使用LLR算法抽取标签词,合并相似聚类,以展现黑龙江省区域研究的知识结构和研究热点(图4),共词知识图谱聚类分析结果见表3。
图3 2012—2016年黑龙江省文献的关键词共词分析知识图谱
图4 2012—2016年黑龙江省文献的关键词共词知识图谱聚类结果
表3 2012—2016年黑龙江省文献的关键词共词聚类分析结果
尺度是聚类中所含有的关键词的数量;轮廓值为衡量整个聚类成员同质性的指标,该数值越大,则代表该聚类成员的相似性越高。年份代表的是该聚类中文献的平均年份,能够用来判断聚类中引用文献的远近,并列出了使用tf*idf和LLR算法得到的排名靠前的关键词。从表3的聚类结果分析,结合每个聚类内文献进行内容分析,近5年黑龙江省的研究热点主要有以下几个方面:(1)关于控制糖尿病的血糖的药物和小鼠实验的医学研究;(2)关于农药制剂的研究,保持农作物的无毒害;(3)关于纳米材料的微观结构的应用研究;(4)关于抑制前列腺癌细胞增殖的药物治疗研究;(5)关于新型燃料石墨烯的应用研究。
图5 2012—2016年黑龙江省文献涉及的主要交叉学科领域共现知识图谱
学科领域共现图谱(图5)表明,黑龙江省的基本学科结构为11大交叉学科群体。其中,最为核心的学科群体2是以工程学为核心的动力学实践研究群体。工程学、电气和电子学也是最为核心的基础学科,它的中介性高达0.55,是连接学科群体4和其他学科群体之间的桥梁性学科,同时说明化学领域研究在黑龙江省作为代表性学科的地位和作用;学科群体0是以基因表达为核心的肿瘤学和生物医学领域的知识结构研究群体;学科群体1是以固体燃料电池为核心的化学和物理学领域的知识结构研究群体;学科群体2是以动力学为核心的工程学和数学领域的知识结构研究群体;学科群体3是以微观结构为核心的材料学领域的知识结构研究群体;学科群体4是以设计为核心的工程、电气与电子领域的研究群体;学科群体5主要是沉淀物的药理学和环境科学领域的研究群体;学科群体6是关于神经细胞的研究群体;学科群体7是关于多态型的心脏及心血管系统的研究群体;学科群体8是关于纤维化的研究群体;学科群体9是关于畜牧的兽医学领域研究群体;学科群体10是关于复合高分子材料的应用研究群体;学科群体11是关于脂肪性肝炎的肝病学研究群体。
本文采用科学知识图谱方法对近5年(2012—2016)黑龙江省科学研究热点和学科趋势进行了分析,结果表明:(1)黑龙江省在Web of Science数据库的研究论文发文数量稳步增长,显示其科研地位在逐渐提高;(2)黑龙江省的科学研究热点主要集中在11个学科领域,其中工程学、电气、电子学的研究是最活跃的、影响力最大的前沿学科领域;(3)在机构合作中,较为紧密的大多是高校,最有代表性的是哈尔滨医科大学、哈尔滨工业大学和哈尔滨工程大学,这与黑龙江省的前沿学科领域是相契合的;(4)今后应加强科研机构之间及其与国外高水平科研机构之间的学术合作与交流。