,
在信息爆炸的时代,如何为读者提供便捷有效的学科信息服务和支持,是图书馆员面临的重要课题[1]。近年来可视化分析技术逐步应用到医学领域,可视化分析能够较好地揭示医学领域的研究内容、研究热点、研究趋势等问题[2-4]。
类风湿关节炎(Rheumatoid Arthritis,RA)是一种常见的以慢性骨关节滑膜炎、骨及软骨破坏为主要特征的系统性自身免疫性疾病。关节滑膜的慢性炎症、增生形成血管翳,侵犯关节软骨、软骨下骨、韧带和肌腱等,造成关节结构破坏,最终导致关节畸形和功能丧失[5-6]。流行病学调查显示,类风湿类关节炎在全世界的成人患病率约为0.5%~1.0%,我国的成人患病率约为0.3%~0.4%[7]。由于类风湿关节炎发病机制涉及复杂的细胞免疫及体液免疫反应,具体致病机制尚不清楚,目前还缺乏有效的预防和治疗药物,素有“不死的癌症”之说。因此类风湿关节炎研究仍然是医学领域广大研究者关注的热点与难点问题。
经过文献调研发现,针对类风湿关节炎研究进行文献计量分析的文献较少,仅有几篇是从类风湿关节炎的治疗方法研究分析的[8-11],缺乏对类风湿关节炎研究的整体把握。在研究文献中,硕博士论文的研究过程比较系统,跟进时间长,研究脉络清晰,研究范式规范,能较好地反映出一个领域的关注点[12]。本文通过分析类风湿关节炎研究的博硕论文的内外部特征,揭示我国类风湿关节炎研究的热点与前沿,为类风湿关节炎研究提供参考。
本文选取万方学位论文数据库、中国优秀硕士学位论文全文数据库、中国博士学位论文全文数据库为数据来源数据库。
检索字段为篇名或者关键词,检索词为“类风湿性关节炎OR类风湿关节炎OR类风关”,检索时段不限,检索时间为2016年8月10日。
初步检索获得4 002 篇文献,其中万方学位论文数据库2 085篇,中国博士学位论文全文数据库325篇,中国优秀硕士学位论文全文数据库1 592篇,去重后得到2 690篇有效文献。利用文献题录信息统计分析工具SATI、Excel、Ucinet、SPSS等软件对2 690篇文献进行年代分布、研究机构分布、高被引论文、高频关键词统计和因子、聚类、多维尺度、知识图谱等,以揭示类风湿关节炎硕博论文研究的视角、热点问题与发展方向。
2.1.1 年代分布
检索结果显示,我国类风湿关节炎硕博论文最早被来源数据库收录的年份是1984年,但是早期论文的数量非常有限,到1998年才显著增加,并在后续年度中保持稳中有升的趋势,直到2015年才有一个比较大的数量降幅,这可能和硕博论文从完成答辩到公开之间有较长的时滞有关。总的来说,近10年类风湿关节炎硕博论文数量呈增长趋势,该领域还处在研究的上升期。
2.1.2 研究机构分布
对论文所列的第一机构进行分析,共有176个研究机构参与了类风湿关节炎的科学研究,其中27个机构(15.34%)参与了1篇论文研究,论文数量为27篇(1%);48个机构(27.27%)参与了2-4篇论文研究,论文数量为139篇(5.17%);48个机构(27.27%)参与了10-19篇论文研究,论文数量为311篇(11.56%);22个机构(12.5%)参与了20-49篇论文研究,论文数量为670篇(24.91%);17个机构(9.66%)参与了50篇以上的论文研究,论文数量为1 361篇(50.59%),可以说这些机构是类风湿关节炎研究的核心机构。发文量居于前10的机构分别是辽宁中医药大学(70篇)、吉林大学(80篇)、中南大学(84篇)、安徽医科大学(87篇)、山东中医药大学(88篇)、河北医科大学(88篇)、北京中医药大学(92篇)、南京中医药大学(93篇)、山西医科大学(95篇)、广州中医药大学(105篇),共发表论文882篇,占论文总量的32.79%。
2.1.3 高被引论文分析
从检索结果中选取被引次数排名前20的论文并去重,然后按照被引次数排序(两个数据库中被引次数不同的取频次高的),最后得到被引次数大于10次的高被引论文11篇(表1)。
表1 类风湿关节炎硕博论文被引次数大于10次的高被引论文
从表1可以看出,论文被引次数总体偏低,论文发表年度也较久远,这和学位论文本身的时滞有关,同时也说明该领域的文献时效较长。从学位授予单位来看,高被引论文的前6篇中有4篇出自发文量居于前10的机构,说明这些机构不仅高产,而且学术研究的质量较高。
关键词是文献的内部特征,是文献核心内容的体现,关键词分析可以反映一个学科在一段时间内的研究热点与趋势。
2.2.1 词频统计分析
使用文献题录信息统计分析工具SATI 3.2[13]进行关键词词频统计。在导入下载题录之前,先对题录中的关键词进行归并与规范化处理,合并处理同义、近义词,如中医药治疗与中药治疗、类风湿关节炎与类风湿性关节炎等,并规范关键词中的标点符号。本次统计的2 690篇论文中有关键词的文献为2 522篇,共有关键词4 479个,总频次为12 407次,平均词频2.77次。取词频排名前30的关键词作为后续分析对象,按照降序排列高频关键词(表2)。
表2 我国类风湿关节炎硕博论文排名前30高频关键词
从高频关键词的分布情况来看,类风湿关节炎硕博论文的研究主要集中在类风湿关节炎的临床疗效、临床研究、发病机制、中医药治疗、中西结合治疗等方面,从细胞分子层面研究类风湿关节炎的论文也较多,如高频关键词细胞因子、肿瘤坏死因子、滑膜成纤维细胞、滑膜细胞、细胞凋亡等。另外和类风湿关节炎紧密联系的佐剂性关节炎、胶原诱导性关节炎、系统性红斑狼疮、强直性脊柱炎等也是类风湿关节炎研究中的热点问题。
2.2.2 多元统计分析
因子分析是就用少数几个因子去描述指标或因素之间的联系,用较少的变量反映原始资料的大部分信息[14]。聚类分析是通过聚类算法将关联密切的主题聚集在一起形成类团(研究领域)的过程,用于揭示某学科领域的研究主题结构[15]。多维尺度分析则可以通过测定主题词之间的距离发现主题结构[16]。因此可以通过因子分析、聚类分析以及多维尺度分析揭示类风湿关节炎研究的主题结构。
通过文献题录信息统计分析工具设定知识单元数为30 ,从软件中导出高频关键词共现矩阵、共现相似矩阵和共现相异矩阵分别用于因子分析、聚类分析和多维尺度分析。将共词矩阵导入SPSS软件进行因子分析,选用主成分分析法,在提取6个公因子时累积方差贡献率达到61.1%,因此考虑将高频关键词分为6个类别。将相似矩阵导入Ucinet软件进行层次聚类分析得到图1所示的聚类树状图,将相异矩阵导入SPSS软件中进行多维尺度分析得到图2所示的多维尺度图谱。
图1 类风湿关节炎的硕博论文高频关键词聚类树状图
图2 类风湿关节炎硕博论文高频关键词多维尺度图谱
结合因子分析、层次聚类分析和多维尺度分析的结果,将具有高度相似性的点聚集在一起形成科学共同体,再结合关键词本身的内涵与性质将高频关键词分为6个主题群(图2)。主题群1包括类风湿关节炎、强直性脊柱炎、系统性红斑狼疮、基因多态性4个关键词,主要从基因的多态性角度研究类风湿关节炎类似疾病;主题群2包括中医药治疗、中西医结合、临床研究、临床观察、临床疗效、疗效评价6个关键词,主要集中在类风湿关节炎治疗的中西医临床研究方面;主题群3包括甲氨蝶呤、来氟米特2个关键词,是两种治疗类风湿关节炎的重点研究药物;主题群4包括动物模型、佐剂性关节炎、胶原诱导性关节炎、肿瘤坏死因子、血管内皮生长因子、免疫调节6个关键词,主要从动物实验对关节炎免疫因子调控紊乱进行研究,通过聚类树状图还可以发现佐剂性关节炎与肿瘤坏死因子、胶原诱导性关节炎和血管内皮生长因子之间的联系最为紧密;主题群5包括滑膜成纤维细胞、细胞增殖、基因表达、滑膜细胞、细胞凋亡、关节炎、类风湿、基质金属蛋白酶8个关键词,主要从细胞水平分析类风湿关节发生发展的机理研究;主题群6包括青藤碱、类风湿因子、细胞因子、发病机制4个关键词,主要聚焦于青藤碱对类风湿关节炎的治疗影响研究。
2.2.3 共现网络知识图谱分析
社会网络分析(SNA)是 20 世纪 70 年代开始在社会学、人类学、数学、心理学、通讯科学等领域发展起来的一个研究分支[17]。将社会网络分析方法应用到共词分析,可以探讨一个学科或主题的研究结构(核心与边缘)[15]。用Ucinet软件分析本文的高频关键词知识网络,将相似矩阵导入到Ucinet,以中心度为属性控制网络结点大小,形状统一选择Circle,生成如图3所示的关键词共现网络知识图谱。
图3 类风湿关节炎硕博论文高频关键词共现网络知识图谱
进一步解释该知识图谱,对其节点中心度进行分析,节点中心度数据见表3,其中粗体表示的数据为大于平均值的数据。如果某点具有高度数,则说明该点具有一个重要的位置,接近网络的核心[18]。表3中共有14个关键词大于平均节点中心度,说明这14个关键词具有较高的影响力,是类风湿关节炎研究中的重点与热点问题。接近中心度是指该关键词在多大程度上不受网络中其他关键词控制的能力[19],关键词的接近中心度越大稳定性就越好。
表3中共有13个关键词的接近中心度大于平均接近中心度,表明这13个关键词不易受到其他关键词的影响,具有较强的稳定性。
中间中心度是对关键词在知识网络中的连接能力的度量,较高的中间中心度说明该关键词是该知识网络中的重要联结。表3中共有8个关键词的中间中心度高于平均中间中心度,说明这8个关键词是类风湿关节炎研究各主题中的重要桥梁,具有较强的连接作用。
表3 类风湿关节炎硕博论文高频关键词的节点中心度数据
续表3
本文运用文献计量学可视化分析方法,对我国类风湿关节炎研究硕博论文的外部特征和内容特征进行分析,揭示了我国硕博论文类风湿关节炎研究趋势、研究热点与结构关系等。
从外部特征来看,我国类风湿关节炎研究博硕论文数量稳步上升,说明该学科还处在一个逐步的发展过程中,还有很多问题需要广大研究者去解决。目前很多医学院校都在关注类风湿关节炎的研究,但半数(50.59%)以上论文出自9.66%的机构,说明目前对于类风湿关节炎的研究机构核心态势明显。而高被引论文多数出自这些核心机构,也说明这些机构对于类风湿关节炎的研究具有较强的引领作用,广大研究者可以更多地关注这些机构的研究近况。
在研究内容上,对于高频关键词的统计一定程度上反映了类风湿关节炎的研究重点,根据因子分析结果初步将高频关键词分为6个类别。为了避免单个主题结构分析方法的结果过于片面,本文综合层次聚类分析与多维尺度分析的结果,将类风湿关节炎研究的高频关键词分为6个主题领域,包括基因的多态性研究、中西医临床研究、重点药物研究、动物实验相关研究、细胞层面相关研究以及青藤碱治疗相关研究,明确了类风湿关节炎研究的主题结构。共现网络知识图谱分析则将高频关键词之间的网络关系可视化,并通过各节点中心度数据进一步挖掘各关键词在网络结构中的作用,通过分析发现临床疗效、发病机制、细胞因子、甲氨蝶呤、胶原诱导性关节炎、细胞凋亡、血管内皮生长因子等词的各节点中心度数据均高于平均值,处于网络的核心位置,具有较强的稳定性、控制性与连接作用,是类风湿关节炎研究领域的热点与前沿问题。
本文对我国博硕论文类风湿关节炎研究领域的研究重点、研究热点与前沿等问题进行分析,旨在为广大科研工作者提供较为科学的参考,同时丰富医学信息资源建设的内涵,从医学情报分析的角度为类风湿关节炎研究贡献微薄之力。由于本文选取的分析样本仅为我国类风湿关节炎研究的博硕论文,其结果可能具有一定的局限性,后续可以进一步对期刊文献、会议文献以及国外的研究情况等进行分析,得到更加科学、全面、综合的结论。