专利研究的可视化引文分析*——基于图书情报的视角

2014-01-01 02:54吴明智毕玉侠
图书馆学刊 2014年11期
关键词:情报专利数量

吴明智 姜 洋 毕玉侠

(沈阳药科大学图书馆,辽宁 沈阳 110016)

1 引言

专利是受法律规范保护的发明创造,它是指一项发明创造向国家审批机关提出专利申请,经依法审查合格后向专利申请人授予的在规定时间内对该项发明创造享有的专有权。专利是世界上最大的技术信息源,据实证统计分析,专利包含了世界科技技术信息的90%~95%[1],因此对专利文献的研究是跟踪技术创新最新进展的重要方法。

高校图书馆作为文献资源的收藏单位,保存有大量的专利文献资源,同时图书馆作为全校的信息服务中心,担负着为教学和科研服务的使命,应该发挥图书馆的人员优势和资源优势,充分利用丰富的馆藏专利文献资源,研究并运用专利文献,为科研工作者提供专利信息咨询服务。

为了清晰地把握图书情报科学领域对专利研究的历史和现状,笔者尝试用Web of Science核心合集的科学引文索引数据库扩展版(Science Citation Index-Expanded,SCI-E),综合运用文献计量分析、引文分析和可视化技术,分析图书情报科学领域专利研究文献的特点和规律,并用可视化方法展示研究的发展历史,以期为相关学者的研究提供参考。

2 材料与方法

2.1 数据来源

数据来源于SCI-E。检索策略设定为:主题=patent*,检索时间为2014年7月1日,检索时段限定为2002~2013年,为精炼检索到的文献,限定研究方向为“Iinformation Science Library Science”,共检索到相关文献364篇,下载包含参考文献的全纪录题录到文本文档。

2.2 分析工具和方法

笔者主要使用由科学引文索引的创始人Grafield博士开发的一款文献分析软件HistCite[2],对图书情报科学领域专利研究文献的年代、国家地区和机构、核心作者、核心出版物、单词频率等进行文献计量分析和引文分析,进而生成引文编年图,从而展现该领域的发展历史、研究现状和成熟情况,帮助研究人员追踪最新的研究趋势,判断研究方向。

3 结果与分析

3.1 文献数量和年代分布

一个研究领域学术论文的数量可以在一定程度上代表该领域的发展状况和成熟程度,而文献之间的引用情况则可反映领域内部学术交流的程度。

图1 图书情报科学领域专利研究文献数量

图1是图书情报科学领域专利研究2002~2013年逐年的文献数量统计,从图1中的文献数量及趋势线可以看出,2002~2008年,研究文献的数量呈现出较大的波动,在2007年达到第一次高峰38篇,次年即减少到17篇,为研究时间段内的最低值;从2008年开始,文献数量又逐渐恢复逐年上升的趋势。

在HistCite软件中,LCS(Local Citation Score)表示某一文献在当前检索到的文献集内被引用的频次,也表示该文献在研究领域内部的重要程度;GCS(Global Citation Score)表示某一文献在整个科学引文索引中被引用的频次,两者的总和分别用TLCS和TGCS表示。表1为2002~2013年各年的文献数量、TLCS和TGCS值。从表1中可以看出,2002~2007年间的文献数量虽然不多,但引用比较集中,特别是2007年,TLCS和TGCS均达到了引用的高峰,说明这一年很可能产生了比较重要的研究成果。通过进一步分析2007年的文献发现,158号文献《专利分析中的文本挖掘技术》[3]在全数据库中总共被引用了95次,排在全部364篇文献的第一位。文中对专利分析过程中常用的文本分割、摘要提取、特征提取、术语关联、类团生成、主题识别和信息映射等文本挖掘技术,在设计、效率和效果等方面进行了系统的分析和比较,该文的研究结果也成为其他研究人员进行后续研究的基础和铺垫。

表1 图书情报科学领域专利研究文献数量及年代分布

3.2 国家地区和研究机构分布

从科研文献的国家地区以及机构的分布情况,可以看出研究的活跃地理区域和科研机构。通过对364篇文献的地理位置分布发现,图书情报科学领域专利研究涉及35个国家和地区,其中56%的文献分布在前5个国家和地区当中(如图2),这当中又以我国台湾地区的研究文献最多,达到58篇,占全部文献的15.9%。

图2 图书情报科学领域专利研究文献的国家地区分布

研究文献数量排名前10位的科研机构见图3,从中可以看出,图书情报科学领域专利研究的主要科研机构为大学,分布于欧洲和亚洲。欧洲主要的研究机构为比利时的鲁汶天主大学、荷兰的阿姆斯特丹大学、英国的塞萨克斯大学、芬兰的赫尔辛基理工大学和西班牙科学研究理事会;亚洲的主要研究机构分布在我国台湾地区的国立台湾大学、国立云林科技大学、内地的复旦大学以及韩国的浦项科技大学和首尔大学。

图3 图书情报科学领域专利研究文献主要机构分布

3.3 核心作者

一个作者的活跃程度可以通过其发文数量来表示,该作者在本研究领域中的影响力则可通过发表文章被引用的频次来评定,影响力高的作者即可认为是其领域中的核心作者。追踪核心作者的研究课题和方向,可以指导我们快速掌握该领域的研究状态、热门主题和发展趋势。在HistCite中,对作者字段分别根据发文数量和全数据库被引频次TGCS排序,可以得到表2中的核心作者群。

表2 图书情报科学领域专利研究的核心作者(前10位,分别根据发文数量和TGCS排序)

单从发文数量来看,排名第10位的Agres T,共参与到7篇文献的撰写中,但其文献集内总被引频次TLCS为0,全数据库总被引频次TGCS也仅为3,说明无论是在本领域内还是在其他领域中受到的关注度都很小,也说明单从发文数量不足以对核心作者进行客观的评价。通过TGCS排序后,得到的结果更加合理,如排在第7、8和9位的作者Lin CJ、Lin YI和Tseng YH共同参与了两篇文献的撰写,其中第158号文献LCS为9,GCS为95,说明这篇文章在研究领域内外均受到了较广泛的关注,被引用频次较高。从引文角度可以对不同作者在研究领域的影响力有更客观公正的评价,从而帮助我们更准确地识别核心作者群。

3.4 核心期刊

通过对刊载图书情报科学领域专利研究文献的期刊进行分析,可以确定该领域的核心期刊,从而使科研人员可以通过关注较少数量的期刊来跟踪本领域的最新研究成果。与核心作者的评价方法相似,从发文数量和文献被引频次两个指标进行评价,能够更加准确地判断核心期刊的分布。

364篇文献共分布于12种期刊当中(见表3),以全数据库总被引频次TGCS进行排序,可以看出,SCIENTOMETRICS共载文263篇,占全部文献的72.25%,其全数据库总被引频次达到2085次,远远超出其他11种期刊,因此可以认为SCIENTOMETRICS是信息学和图书馆学专利研究的核心期刊,紧随其后的INFORMATION PROCESSING&MANAGEMENT和JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY两种期刊虽然载文数量较少,但TGCS较高,说明其载文质量较高,同样应该受到科研人员的关注。

表3 图书情报科学领域专利研究的核心期刊

3.5 关键词分析

文献中,尤其是标题中的词汇是对研究成果核心内容的精炼概括,同时也能提供重要的检索途径。笔者利用Hist-Cite中Words分析字段对标题中出现的词进行统计分析,以了解图书情报科学领域专利研究的热门主题。

从前20个高频关键词可以看出(见表4),除检索策略中使用的Patent外,“Analysis”的出现频率较高,回顾标题中出现Analysis的文献,与专利分析相关的研究,如“专利分析的应用”“专利分析的方法学研究”“某一具体学科的专利分析”等受到了研究人员的关注;同样,与专利研究相关的科学(Science)和技术(Technology),以及基于专利研究的知识发现(Knowledge、Based)和引文分析(Citation)等方面也是图书情报科学领域专利研究的热点主题。

表4 信息学和图书馆学专利研究高频关键词

3.6 图书情报科学领域专利研究的引文编年图

文献集内被引用次数代表了文献在研究领域内被关注的程度。利用HistCite对文献集内被引用次数最高的30篇文献生成可视化引文编年图。引文编年图共有节点30个,连接数为36,最小被引用频次为6,最大被引用频次为19(见图4)。图中圆圈内的数字表示当前节点在文献集内的序号,圆圈的大小代表文献集内被引用次数的高低,箭头指向的文献是被引用的文献。

从图4中可见,在研究的初始阶段就出现了文献集内被引用次数最高的6号文献,即芬兰赫尔辛基理工大学的Meyer M于2002年发表在Scientometrics上的文章《在创新系统中追踪知识流动》。文中,作者回顾了大量创新系统中研究科学-技术联动的文献,总结了研究科学-技术联动的定量方法,并提出了一个基于专利引文、产业科学和高校专利登记的类型学方法[4]。

图4 图书情报科学领域专利研究引文编年图

同年,比利时鲁汶天主大学的Verbeek A等人撰写的《科学与技术的联动:利用专利文献著录建立联动方案》一文也发表于Scientometrics。Verbeek A等人利用专利引文数据开发了一个科学和技术系统的联动方案,随后该方法被用于测试USPTO专利,结果表明USPTO专利文献呈现大倾斜分布态势,研究人员能够从依赖科技文献发展出的技术领域当中,区分出那些与科学领域具有高度互动性的技术领域[5]。

根据引用关系可知,这两篇文献对图书情报科学领域专利研究的发展有着非常重要的作用。2003年,文章节点的数量较2002年有明显增加,同时也出现了文献36、47和46这样被引用频次较高的文章,可见图书情报科学领域专利研究日渐增多,大量有价值的研究成果出现,也为后续的研究奠定了坚实的理论基础。

通过引文编年图,可以让我们直观地了解图书情报科学领域专利研究的发展历史和阶段,从而更加快速地确定关键文献和热点研究主题。

4 结语

笔者通过基于可视化引文分析的方法,对收录于SCI-E中2002~2013年图书情报科学领域专利研究文献进行了分析,总结了研究文献的年代分布特征、国家地区以及研究机构分布、核心作者、核心期刊、当前研究的热点和发展历史。

HistCite基于可视化引文分析的方法能够快速、直观地揭示图书情报科学领域专利研究中经典的研究文献和重要的研究发现,能够展现研究的发展轨迹,同时也为进一步的科学研究提供了参考。

[1]郭春玲.香港专利制度及网上检索[J].图书馆学刊,2011(11):39-40.

[2]Garfield E,Paris S,Stock WG.A Software Tool for Informetric Analysis of Citation Linkage[J].Information-Wissenschaft und Praxis,2006(8):391-400.

[3]Tseng YH,Lin CJ,Lin YI.Text mining techniques for patent analysis[J].Information Processing& Management,2007(5):1216-1247.

[4]Meyer M.Tracing knowledge flows in innovation systems[J].Scientometrics,2002(2):193-212.

[5]Verbeek A,Debackere K,Luwel M.et al.Linking science to technology:Using bibliographic references in patents to build linkage schemes[J].Scientometrics,2002(3):399-420.

猜你喜欢
情报专利数量
情报
专利
情报
情报
芳芳猜童话书的数量
专利文摘
统一数量再比较
头发的数量
交接情报