基于期刊与专利文献计量分析的慢性粒细胞白血病热点判断

2018-11-22 07:28张英杰
中国科技资源导刊 2018年5期
关键词:热点白血病粒细胞

曲 红 张英杰

(1.广州番禺区中心医院,广东广州 510530;2.中国科学技术信息研究所,北京 100038)

科技期刊作为最新科技成果的传播媒体,是科技人员发表论文、开展学术交流的重要通道,在很多情况下,科技期刊是科研人员科技成果的首发选择。据统计,我国自然科学类科技期刊约占全部期刊的49.5%,这些期刊极大地促进了各类新科技的传播、共享[1]。

据WIPO统计,专利信息包含了世界科技信息的90%~95%,在科学研究中利用专利信息不仅可以减少60%的研发时间和40%的研发费用[2],而且相对于其他文献形式,专利更具有新颖、实用的特征。世界各国对技术的保护意识越来越强烈,纷纷对已有技术成果申请专利,进行关键技术保护。

近年来,随着医学科技水平的大幅提高,人们已经研发出各种治疗慢性粒细胞白血病(Chronic Myeloid Leukemia,CML)的药物,慢性粒细胞白血病已从不治之症转变为有正常生存期的疾病,治疗目标已从延长生存期转向维持生活质量。传统化疗药物见效快,研究者正在把目光集中在靶向BCR-ABL融合蛋白上,酪氨酸激酶抑制剂针对性强,副作用小,被越来越多的人们所青睐。为此,本文围绕慢性粒细胞白血病的热点研判,分别选择该主题的中文期刊数据和德温特专利数据,在探究其发展状况和趋势的基础上,深入地对慢性粒细胞白血病技术进行挖掘,试图通过分析期刊、专利两类数据在热点发现揭示方面的差异,找出慢性粒细胞白血病未来的重点发展方向。

1 数据来源与研究方法

1.1 数据集构建

本文选择“慢性粒细胞白血病”or“Chronic Myeloid Leukemia”作为检索词,分别抽取了两部分数据形成分析用数据集,其中的专利数据来源于德温特专利数据库(Derwent Innovations Index),期刊数据来源于中外文科技文献元数据仓储知识库。上述数据经过检索清洗后,形成论文数据5514条(1973—2017年),专利数据539条(1955—2017年)。

德温特专利数据库支持快速而精确的专利和引文检索,内容涵盖化学、电气、电子和机械工程等领域。借助附加的描述信息和编码以及可追溯到1963年的专利收录内容,使用者能够快速了解某一专利的重要性及其与其他专利的关系。

中外文科技文献元数据仓储知识库的建设,得到了国家863计划的资助和支持,覆盖10种资源类型,涵盖260余个中外文主流数据厂商数据库,累计收录7.3亿条科技文献元数据[3]。数据仓储知识库为海量科技文献资源整合及学术搜索提供了可能,基于中外文元数据仓储知识库,实现了学术搜索与全文资源调度、作者科研协作关系分析、机构科研协作关系分析、学科主题知识脉络与学术发展趋势分析。

1.2 研究方法

目前,围绕研究热点发现和研判,国内外学者利用的数据类型包含有期刊、专利、网络文献、科技规划、基金项目等。用于开展热点发现的方法有基于文献引用的文献计量法,采用Histcite软件构建引用关系研究数据,在对热点文献进行解读的基础上形成对研究热点的研判;基于关键词/主题词的共词分析法,基本原理是对文献中的关键词进行共现统计,进而利用不同的聚类算法,分析关键词所代表的学科和主题变化;基于数据挖掘的知识图谱法,比较典型的是采用CiteSpace等软件,结合Web of Science数据库,形成相关领域知识图谱,揭示热点主题演变。

在具体实践方面,孟凡赛[4]使用有序聚类方法,利用期刊主题词集合,进行学科领域主题演化研究;刘彤[5]从专利的角度对电力产业技术领域进行分析,揭示该领域的技术热点和区域竞争格局;周群[6]等将最新论文文献与基于科技媒体的新闻报道、评论和观点文章进行结合,提出一种基于科技媒体视角的研究前沿识别与探测方法,有效揭示研究前沿的重大研究突破;司林波等[7]运用CiteSpace文献计量可视化软件,选择8种公共管理研究期,构建文献关键词的知识图谱,探测到近十年国内公共管理研究的热点;李侗桐等[8]也对网络文献和期刊文献在揭示研究热点方面的差异进行了比对分析。

围绕“慢性粒细胞白血病”主题,景晓宇等[9]以CNKI论文数据为基础,采用共词分析的方法,对我国近年来慢性粒细胞白血病的研究进展进行探讨。仓顺东等[10]依据第50届美国血液病学年会(ASH)的会议论文,对伊马替尼(Imatinib)的出现及其对慢性粒细胞白血病(CML)患者的治疗效果进行了探讨。经过文献梳理,发现围绕该主题领域的的热点探讨更多的是采用综述或案例研究的方式,基于某种药物或治疗方案,开展最新进展或方案效果研究。如段丽芳等[11]通过分析浆细胞样树突状细胞这一免疫佐剂,分析了其与慢性粒细胞白血病免疫治疗进展。

本文拟在医学领域常规案例研究的基础上,结合科技期刊和专利的科技创新传播特征,通过大量的慢性粒细胞白血病相关文献的分析充分了解慢性粒细胞白血病发展状况。在此基础上,采用知识图谱的方式,对专利和期刊文献耦合,形成对该主题的热点研判,进而比较期刊和专利两种文献类型在揭示热点主题方面的应用差异。

2 研究趋势与主要研究参与者

2.1 研究趋势

对慢性粒细胞白血病1955—2017年期刊文献与专利文献年增长趋势的对比进行分析,结果如图1所示。从总体上看,慢性粒细胞白血病期刊文献和专利文献数量都呈上升发展趋势,但期刊文献年增长速度较快,专利文献年增长速度较慢。其中,1995—2000年,期刊文献与专利文献年增长数量均较少,这说明慢性粒细胞白血病相关技术研究水平较低,处于技术发展起步期与瓶颈期。2001—2014年期刊文献和专利文献数量均出现了较快的增长,且增长速度较快,在一定程度上可以说明这一时间段技术发展较为迅速。2015年之后期刊文献和专利文献年增长数量有所下降,说明慢性粒细胞白血病相关基础研究趋于成熟和完善,基础技术不断提高。

图2、图3分别对慢性粒细胞白血病1955—2017年期刊论文作者与专利发明人年增长数量及论文作者单位与专利权人机构年增长数量进行对比分析,结果发现,同期刊文献与专利文献年增长数量对比的结果基本一致,但专利发明人在2002—2008年快速增长,与同期期刊作者数量反而缓慢下降表现出截然不同的特征。

2.2 主要研究参与者

图1 期刊文献与专利文献年增长数量对比图

2.2.1 主要研究人员

通过对期刊、专利进行统计,分别取期刊论文发表量超过4篇的作者和专利申请量超过2件的发明人,如表1所示,可以发现,期刊文献作者排在前面的有林伟、姚尔固、李百泉、薛永泉、彭光斌、杨清明、孟凡义、宁辉等,专利文献中的专利发明人排在前面的有KEITH C、DEMIN P、ROUNOVA O、GRUNBERGER T、GAUDINO J J、FOLEY M A、LEE M S等。可以发现,在慢性粒细胞白血病领域中,期刊文献作者与专利文献中的专利发明人并没有对应,说明发表期刊论文的作者并没有转化为专利的发明人。

图2 期刊作者与专利发明人年增长数量对比图

图3 论文作者单位与专利权人机构年增长数量对比图

表1 期刊文献作者与专利发明人对应表

2.2.2 主要研究机构

通过统计,分别取期刊论文发表量超过4篇的作者单位和专利申请量超过2件的专利权人,如表2所示。可以发现,期刊所属机构排在前面的有中国医学科学院、中国协和医科大学血液学研究所、血液病医院,沈阳军区总医院血液科,同济医科大学附属同济医院,解放军总医院血液科等机构,专利所属机构排在前面的有ICOS CORP (ELIL-C)、COMBINATORX INC (COMBNon-standard)、OHNO T (OHNO-Individual)、LI Y (LIYY-Individual)、AB SCI (ABSCNon-standard)、KEITH C (KEIT-Individual)、HOSPITAL FOR SICK CHILDREN (HOSP-Nonstandard)、JANSSEN PHARM NV (JANC-C)等机构。与期刊文献作者与专利发明人对应表结构相似,在表2中,论文作者所属机构与专利的专利权人机构也没有相同的机构对应,在慢性粒细胞白血病领域中,发表的专利并不属于期刊所属的机构。同时,通过分析相关专利表现,主要专利还是在发达国家中。与发达国家相比,我国在慢性粒细胞白血病领域的研究中还存在一定差距。

3 研究热点对比分析

慢粒起病缓慢,病程长,传统治疗不能改变大多数患者存活期。异基因造血干细胞移植(Allo-SCT)则一般考虑应用于靶向药物治疗失败者。涉及的基础药物有羟基脲[12]、白消安(马利兰)[13]、甲异靛[13]、格列卫(伊马替尼)[14];代表方案有化疗和基因干扰素工程治疗。联合用药是慢粒治疗的趋势。合理的组合能提高疗效,减少副作用,延长生存期。为此,本文通过对期刊论文、专利文本进行主题抽取,形成了若干热点主题,表3列出了慢性粒细胞性白血病的主要研究高频关键词。图4和图5分别是慢性粒细胞性白血病期刊和专利的热力图。热力图显示了离散数据(事件或事物)的分布及其相互关系,通常以一张具有显著颜色差异图片的方式呈现最终结果,颜色的深浅代表了该主题的发生频率或分布的密度大小[15]。

表2 论文作者所属机构与专利权人机构对应表

表3 慢性粒细胞性白血病的主要研究热点关键词统计

图4 期刊论文热力图

图5 专利文献热力图

通过比较两者的高频关键词可以看出,期刊热点词主要集中在白血病、粒细胞、细胞、基因、患者、骨髓、干细胞、疗效、急性等方面。专利热点词主要集中在1-6C烷基、多发性骨髓瘤、慢性淋巴细胞白血病、急性髓细胞性白血病、胰腺癌、慢性粒细胞白血病、乳腺癌、前列腺癌、急性淋巴细胞白血病等方面。而期刊、专刊两种文献相同的热点词主要集中在慢性粒细胞白血病、急性、骨髓等主题上。

通过高频词与两者的热力图进行对比发现,期刊热力图大致可以划分为3个热点区域:一是围绕慢性期,主要聚焦慢性粒细胞性白血病主题的细胞遗传学领域,开展了基于不同型慢性粒细胞性白血病的治疗,涉及骨髓增值性疾病、血液病等不同概念,也涉及马里兰等药物;二是围绕加速期和急变期,涉及干扰素、络氨酸激酶抑制剂,突出了伊马替尼、达沙替尼等药物;三是涉及造血干细胞移植主题,有聚合酶链式反应、三氧化二砷等相关主题。而专利热力图则主要划分为两个热点区域:一是慢性粒细胞性白血病并发的病毒性感染、皮肤癌、胃癌、丸肿瘤、结肠癌等各类癌症;二是围绕糖尿病性视网膜炎、多发性骨髓瘤等。

4 结论

本文基于1955—2017年慢性粒细胞白血病专利文献数据和1973—2017年慢性粒细胞白血病期刊文献数据,运用文献分析方法和知识图谱方法,从专利文献增长数量、机构增长数量、技术热点主题等进行多角度研究。围绕慢性粒细胞白血病主题,分析专利申请数量的增长趋势发现,该主题目前基本处于成熟期;期刊发表则在2014年前后达到峰值,之后呈现缓慢下降的趋势。

总体来说,期刊和专利都具有科学性、专业性、连续性特点,但期刊在新主题传播方面更为及时,这取决于二者不同的发布机制,决定了二者在时效性的差异。期刊在慢性粒细胞性白血病这一主题传播方面,比专利文献表现得更为连续、更为及时。而从上述两类文献揭示的热点主题来看,期刊在热点主题的揭示方面,更接近临床应用,如各类治疗药物名称都出现在了期刊论文中,而专利更侧重于各类并发症、各类相关肿瘤治疗方案。

猜你喜欢
热点白血病粒细胞
热点
儿童嗜酸性粒细胞增多相关疾病研究
热点
嗜碱粒细胞白血病诊断进展
结合热点做演讲
达托霉素相关急性嗜酸性粒细胞性肺炎
白血病外周血体外诊断技术及产品
白血病外周血体外诊断技术及产品
误诊为嗜酸粒细胞增多症1例分析
阅读理解Ⅰ