基于CiteSpace 对我国2010—2019 年法医学研究的可视化分析

2022-11-21 11:24朱海标刘鸿霞王宇聪马翊迅赵东王旭杨天潼
法医学杂志 2022年4期

朱海标,刘鸿霞,王宇聪,马翊迅,赵东,王旭,杨天潼

1.中国政法大学 证据科学教育部重点实验室,北京 100088;2.司法文明协同创新中心,北京 100088;3.中国政法大学法治科学计量与评价中心,北京 100088

在我国,法医科学技术发挥着越来越重要的社会职能作用。通过法医学理论和技术可以为侦查犯罪提供线索,为审理民事、刑事及行政诉讼案件提供证据,为法律法规的制定提供医学资料[1]。在灾难事故、民事案件、刑事案件、行政案件、暴恐案件、立法等领域均需要法医科学技术提供必要的支撑[2]。伴随着社会的需求和科学的发展,法医学由原来单一的学科逐渐发展为多分支学科,包括法医病理学、法医毒物与毒理学、法医物证学、法医临床学、法医精神病学等。国内的专家学者们在法医学领域进行了大量基础和应用研究,每年都有较多高质量的文献发表。本研究借助信息可视化分析软件CiteSpace 整理和分析中国知网(CNKI)数据库中2010—2019 年我国法医学领域发表的学术论文,揭示近十年间作者和机构的发文量及相互之间的合作关系,有助于相关学者了解我国法医学领域的重要研究内容、研究热点和创新点,以期为学科未来的研究方向提供借鉴[3]。

1 材料与方法

1.1 数据采集

数据来源于CNKI 数据库。检索日期为2020 年5 月25 日,在“文献分类目录”中选取“医药卫生科技-特种医学-法医学”和“社会科学Ⅰ辑-公安-法医学”,时间设定为2010 年1 月1 日—2019 年12 月31 日,选择“中文文献”,采用人工初筛和CiteSpace 软件数据除重功能,去除报刊简评、会议纪要、会议论文、期刊文题索引以及与法医学无关联的干扰文献,保留法医学相关研究的论著、案例报道、综述等内容,并用CiteSpace 软件进行数据转换和去重处理,最终得到法医学领域相关文献9 237 篇,用于本研究的数据分析。

1.2 数据处理和清洗

利用CiteSpace 软件对1.1节获得的中文文献数据中的机构、关键词进行数据处理和清洗,如必要的替换、修改或补全等。

机构数据清洗原则:将曾用名替换为现用名,如将“司法部司法鉴定科学技术研究所”替换为“司法鉴定科学研究院”。如果一级、二级机构同时存在,则只保留一级机构名称,如将“公安部物证鉴定中心法医遗传学公安部重点实验室”替换为“公安部物证鉴定中心”。如果一个机构同时使用多个名称,则只保留使用频次最高的名称,如将“中国政法大学‘2011’司法文明协同创新中心”替换为“中国政法大学证据科学教育部重点实验室”。如果导出数据中存在机构缺失的记录,通过手工查找原文补全缺失信息。

关键词数据清洗原则:不合并上位词和下位词,这样有助于更细致地发掘该研究方向的发展情况和趋势,如“司法鉴定”包括“致伤方式”“损伤程度”“伤残等级”等内容,不应将下位词与上位词合并;同义词统一为使用频次最高的词,如“法医学鉴定”“法医鉴定”“法医鉴定学”等统一为“法医学鉴定”。

1.3 研究方法

使用CiteSpace 5.7.R1 软件对文献的作者、机构进行合作网络分析,了解作者和机构的发文量、研究内容以及合作关系;对文献进行关键词共现和聚类分析,了解学科研究的热点内容;分析关键词中介中心性[4],揭示法医学领域的重要研究方向和内容;进行关键词突现性检测[5],并根据发表年份绘制关键词时间线图谱,发现学术领域的热点问题;对关键词sigma值[6]排名前10 的关键词进行汇总,了解学术领域的创新性研究。

在合作网络图中,节点表示作者、机构要素,节点的大小表示作者、机构的发文量,节点之间的连线表示协作关系。在关键词共现网络图中,节点表示不同的关键词,节点的大小表示每个关键词出现的频次,连线表示共现关系,节点年轮的颜色表示文章的发表时间。关键词聚类中,每个聚类由多个紧密相关的关键词组成。聚类时应计算模块值(Q值)和轮廓值(silhouette 值)。Q值>0.3 时意味着聚类结构是显著的,即网络得到的聚类较好[7];silhouette 值>0.7 时,得到的聚类被认为具有高信度[8]。

1.4 CiteSpace 软件参数

时间跨度设置为2010 年1 月1 日—2019 年12 月31 日;切片数设置为每1 年;对于节点类型,每次只从作者、机构、关键词中选择一个选项;阈值参数选择“Top50”;对于裁剪参数,选择“Pathfinder”“Pruning sliced networks”“Pruning the merged network”。其他参数选择CiteSpace 的默认选项[9]。

2 结果

2.1 作者分析

10 年间,有364 位作者发表了法医学相关文章,其中发文量靠前的有李彩霞、赵兴春、叶健、夏文涛、刘超、王旭、朱广友、陈忆九、范利华、周亦武、刘良、官大威等。作者合作群共得到12 个聚类(图1),聚类标签分别为“死后经历时间”“标准”“遗传多态性”“医疗差错”“法医损伤学”“法医病理学”“小鼠”“法医遗传学”“多器官功能衰竭”“法医物证学”“亲子鉴定”“年龄推断”。聚类标签揭示了作者10 年间的主要研究方向,如赵兴春、叶健主要涉及遗传多态性的研究,夏文涛、朱广友等主要涉及标准的研究。

图1 2010—2019 年国内法医学研究文献作者合作网络及聚类图谱Fig.1 Cooperative network and clustering diagram of authors in forensic research literatures in China from 2010 to 2019

2.2 机构分析

发文机构合作网络分析结果(图2)显示,共有300 多家发文机构。发文量排名前10 的机构中有8 家为高校,其余2 家为司法部、公安部直属的科研、鉴定机构(表1)。其中,公安部物证鉴定中心(472 篇)和司法鉴定科学研究院(原司法部司法鉴定科学技术研究所,463 篇)居发文量前两位,中国人民公安大学、中国政法大学证据科学教育部重点实验室、华中科技大学同济医学院法医学系等8 所高校及院系的发文量位列第3~10 位。排名前10 的机构共发文2 349 篇,约占10 年间发文总量的四分之一。

表1 2010—2019 年国内法医学研究文献发文量排名前10 的机构Tab.1 Top 10 institutions with the highest number of papers published in forensic research literatures in China from 2010 to 2019

2.3 关键词分析

2.3.1 关键词共现和聚类

关键词共现聚类图谱(图3)提示,10 年间法医病理学出现的频次最高,主要涉及死亡时间、死亡原因、猝死等方面的研究,实验方法主要为免疫组织化学法。法医遗传学和法医物证学的研究领域涉及短串联重复序列、遗传多态性、个体识别、Y 染色体等方面,主要研究的种族为汉族。法医临床学主要涉及损伤程度、伤残等级、伤病关系方面的研究,涉及损伤的部位和性质主要为颅脑损伤和骨折。法医毒理学主要研究乙醇、甲基苯丙胺和氯胺酮,研究方法主要涉及气相色谱和固相萃取。法医人类学主要研究年龄推断,主要技术手段为CT。法医精神病学主要研究刑事责任能力和因果关系。

图3 2010—2019 年国内法医学研究文献关键词共现聚类图谱Fig.3 Co-occurrence network clustering diagram of keywords in forensic research literatures in China from 2010 to 2019

关键词共现图谱聚类分析结果(表2)显示,共有12 个聚类,Q值为0.821 6,说明聚类结构显著。所有聚类的轮廓值(silhouette 值)均>0.7,提示得到的聚类是可信的。聚类标签分别为“法医损伤学”“法医病理学”“法医毒物分析”“司法鉴定”“事故”“遗传多态性”“法医遗传学”“法医临床学”“法医学检验”“法医学”“刑事责任能力”“交通事故”。

表2 2010—2019 年国内法医学研究文献关键词共现聚类结果Tab.2 Co-occurrence network clustering results of keywords in forensic research literatures in China from 2010 to 2019

2.3.2 关键词中介中心性

关键词中介中心性分析结果(表3)显示,排名前10 的关键词分别为“司法鉴定”“创伤和损伤”“标准”“法医临床学”“大鼠”“医疗损害”“鉴定”“致伤方式”“损伤程度”和“体层摄影术”。

表3 2010—2019 年国内法医学研究文献中介中心性排名前10 的关键词Tab.3 Top 10 keywords with the highest betweenness centrality in forensic research literatures in China from 2010 to 2019

2.3.3 关键词突现

通过关键词突现性检测,计算出在一段时间内频次变化率高、增长速度快的关键词,得到排名前20 的关键词突现图谱,结果(图4)显示,2010 年开始出现的研究热点主要为“法医学检验”“尸体”“氯胺酮”“复合扩增”“司法精神病学”。随后,“法医昆虫学”“外伤”“甲基苯丙胺”“精神障碍”“溺死”“损伤程度鉴定”“现场勘查”“突变”等关键词均有不同程度的突现。近几年的研究热点主要集中在法医物证学、法医临床学和法医病理学,其中法医临床学涉及“肋骨骨折”“损伤程度”等研究热点,而法医物证学的“多态现象”和“Y 染色体”突现时间分别持续了6 年和5 年。

图4 2010—2019 年国内法医学研究文献突现词图谱Fig.4 Diagram of keywords with the strongest citation bursts in forensic research literatures in China from 2010 to 2019

根据发表年份建立关键词时间线图谱(图5)。基于关键词频次、所含关键词数量和时间获得右侧聚类标签排序。2013年前后,“多态现象”“Y 染色体”“医疗损害”“伤病关系”等关键词高频出现且突现。2016年,关键词“综述”高频出现且突现。法医毒物分析、事故、遗传多态性和法医遗传学方向研究10 年来一直处于活跃状态,其中2019 年出现的高频关键词为“毛发”“伤残鉴定”“SNP”“短串联重复”和“DNA 甲基化”。

图5 2010—2019 年国内法医学研究文献关键词时间线图谱Fig.5 Time-line diagram of keywords in forensic research literatures in China from 2010 to 2019

2.3.4 关键词sigma 值

对关键词sigma 值排名前10 的关键词进行汇总,结果(表4)显示,“医疗损害”的sigma 值为828.11,高居第一位,之后为“标准”“创伤和损伤”“法医学检验”“Y 染色体”“脑损伤”“损伤程度”“多态现象”“司法精神病学”“综述[文献类型]”。

表4 2010—2019 年国内法医学研究文献sigma 值排名前10 的关键词Tab.4 Top 10 keywords with the highest sigma value in forensic research literatures in China from 2010 to 2019

3 讨论

CiteSpace 是一款着眼于分析科学文献中蕴含的潜在知识,并在科学计量学、数据和信息可视化背景下逐渐发展起来的一款多元、分时、动态的可视化软件[10]。CiteSpace 诞生于2004 年,与传统的综述相比,这种文献计量学分析方法提供了一种及时、直观和公正的方法来跟踪特定知识领域的发展并探索其知识结构。应用该方法,可以了解作者、机构的发文量和协作关系情况,了解关键词出现的频次和协同关系,从而凝练出研究方向和学科研究热点。

3.1 合作网络

2010—2019 年法医学研究主要集中在高校和省部级科研、鉴定机构中。作者之间的合作关系主要为机构内部合作,机构之间的协作不多,尤其是发文量排名靠前的机构之间协作不紧密甚至没有协作。提示在法医学研究中,应该借鉴国际上多区域甚至多国家协作研究的经验,打破机构和地域的限制,加强学科交流和合作,开拓多中心、学科交叉的合作研究。部分机构(如司法鉴定科学研究院)有多名作者发文量排名靠前,其学科建设和人才培养模式值得借鉴学习。作者聚类分析揭示了作者的主要研究方向,如发文量排名靠前的作者中,赵兴春、叶健主要涉及遗传多态性的研究,夏文涛、朱广友、范利华和王旭等主要涉及标准的研究。

3.2 学科发展及关联

关键词共现分析结果提示,2010—2019 年法医病理学仍然是法医学研究的重要分支学科及研究热点。聚类标签包括了法医病理学、法医毒物分析、法医临床学等法医学的传统分支学科。法医物证学被拆分成了遗传多态性和法医遗传学两个聚类。排名最靠前的聚类“法医损伤学”实际涉及法医临床学和法医病理学等与人体损伤直接相关的分支学科。结果显示,“交通事故”进行了单独的聚类,表明交通事故相关研究的重要性,受到了学者们比较多的关注。

3.3 重要性研究内容

高中介中心性关键词揭示了法医学领域的重要研究方向。其中“体层摄影术”涉及使用CT、光学相干断层扫描(optical coherence tomography,OCT)、超声等成像技术,研究内容涉及虚拟解剖确定死亡原因[11]、损伤机制推断[12]、法医人类学个体识别及年龄推断[13]、法医临床学损伤测量[14]等,属于近年来比较重要的研究方向;“大鼠”属于法医学重要的实验动物;其他高中介中心性的关键词也涉及法医学比较重要的研究内容。

3.4 研究热点

法医物证学的“多态现象”和“Y 染色体”作为近年来的研究热点,突现时间分别持续了6 年和5 年。查阅相关文献发现,关于“多态现象”的研究,主要涉及我国不同省份(黑龙江、山东、甘肃等)、不同民族(汉族、藏族、苗族等)的遗传多态性研究[15-18]。由于Y-STR 在家系排查中具有重要作用,可以作为特异性遗传标记有效缩小犯罪嫌疑人的范围[19],因此“Y染色体”成为研究热点,目前全国各地正在大规模地建设Y-STR 数据库,为案件侦破提供了较大的帮助。“Y 染色体”的研究内容主要涉及Y-SNP 和Y-STR 遗传标记在不同地区、不同民族中的遗传多态性分布及法医学应用[20],Y-STR 突变性的研究[21],Y 染色体检测方法的研究[22]等。关键词时间线图谱提示,法医毒物分析、事故、遗传多态性和法医遗传学研究10 年来一直处于活跃状态。2016 年关键词“综述”的高频出现且突现,提示综述文章开始受到重视且集中爆发。

3.5 研究创新点

本研究对sigma 值排名前10 的关键词进行汇总,“医疗损害”“标准”和“创伤和损伤”的sigma 值明显高于其他关键词,提示这3 个关键词的研究最具有新颖性。其中“医疗损害”相关文献,主要研究医疗过错判定[23]、因果关系分析[24]、损害后果评价[25]等方面,主要涉及法医病理学和法医临床学两个分支学科。关于“标准”的相关文献,主要涉及法医临床学中的《人体损伤程度鉴定标准》[26]和《人体损伤致残程度分级》[27]两个标准,主要研究标准的理解与适用、鉴定要点、伤病关系、鉴定时机等[28]。关于“创伤和损伤”的相关文献,主要研究损伤时间推断[29]、《人体损伤程度鉴定标准》的理解与适用[30]、《人体损伤致残程度分级》相关问题的探讨[31]等方面,主要涉及法医病理学和法医临床学两个分支学科。“综述”的sigma 值排名第10 位,提示综述文章的重要性已得到学术界的广泛认同,综述文章可以帮助研究人员紧跟知识的发展和研究前沿[32]。

我国法医学研究具有悠久的历史,本研究利用CiteSpace[33]软件对CNKI 数据库2010—2019 年的法医学研究文献进行计量学可视化分析,回顾了近年来法医学科的发展脉络,总结研究热点和前沿,探究科研创新需求和学科发展方向,可为法医工作者们未来的科研及实践提供参考。