H指数及其衍生指数用于机构专利评价实证研究

2010-07-12 06:04刘合艳房俊民黄筱瑾
图书馆理论与实践 2010年3期
关键词:指数值总数排序

●刘合艳,房俊民,黄筱瑾

(1.中国科学院 国家科学图书馆成都分馆,成都 610041;2.中国科学院 研究生院,北京 100080)

1 引言

在知识经济时代,创新对于机构的重要性日益凸显。专利作为技术发展和创新活动的载体,提供了最新研发出的技术与产品的信息,利用专利数据可以分析出机构间科技实力和技术创新能力的强弱。用于评价机构整体研发能力的指标主要有专利总数、专利的逐年数量、逐年增长百分率、专利总被引数、平均被引数、技术强度、专利平均年龄、专利平均年龄修正指标等。

2005年,美国物理学家J.E.Hirsch提出了一个测度科学家个人科研成绩的新指标——H指数,他将H指数定义为:“在一个科学家发表的Np篇文章中,如果有h篇的被引次数都大于等于h,而其他(Np-h)篇被引频次都小于等于h,那么他(她)的指数值为h。”[1]H指数一经提出便引起了科研工作者特别是文献计量学家的广泛关注,人们对H指数及其实证分析进行了深入研究。2008年,官建成和高霞[2]首次尝试将H指数引入到专利分析中,发现基于专利的H指数在评价技术重要性和质量方面很有效。此后,他们又利用H指数对世界500强中的信息通讯技术领域的典型公司的专利进行了评价,[3]结果显示,H-index值的大小主要是由专利总被引频次决定;专利H-index确实可以反映出专利的重要性或其“社会价值”。

同时,H指数提出以后,在文献计量领域,学者们针对H指数存在的一个或多个问题,提出了许多衍生指数,在H指数用于专利分析的同时,也存在相似的问题,因而本文选择H指数及其5种主要的衍生指数对其在机构专利分析中应用的有效性、指数间的相关性等进行实证分析。

2 数据和指标描述

2.1 指标描述

本文选择了H指数及其5个衍生指数来进行实证分析,衍生指数分别是G指数、W指数、H(2)指数、A指数、R指数。

(1) G指数

Egghe针对H指数对很高被引文章不敏感这一问题,提出了G指数,[4]定义为:论文按被引次数排序后相对排前的累积被引至少g2次的最大论文序次g,亦即第(g+1) 序次论文对应的累积引文数将小于(g+1)2。从定义可以看出,G≥H,而按被引量排序靠前的文章的被引次数越大,G指数越大。

(2) W指数

2008年,中国科技大学管理学院副教授吴强博士提出W指数,[5]对H指数进行了重要改进。定义为:一个科学家的w值,等于当且仅当在他/她发表的论文中有w篇论文每篇获得了不少于10w次的引文数,而其余每篇论文的引文数都小于10(w+1)。W指数在继承H指数简洁易懂特点的同时,更关注高引用次数的论文,能更准确地反映出一个科学家代表作的综合影响力,而且减少了一定量的信息挖掘时间。

(3) H(2)指数

2006 年,Marek Kosmuls ki提出了 H(2)指数,[6]定义为:使得被引频次最高的H(2)篇文章每篇被引次数至少为[H(2)]2次的最大的自然数。与G指数和W指数一样,它给高被引文章以更大权重。

(4) R指数和A指数

金碧辉、Rousseau Ronald等引入“H核(Hirsch core)”[7]的概念,即被引量排序前H的论文形成H核。在此基础上提出了A指数和R指数[8]等。

2.2 数据来源和机构选取

2.2.1 数据来源

本文选择德温特公司开发的Derwent Innovations Index(DII) 数据库作为统计数据来源。

德温特公司是一个颇具规模的跨国性专利信息出版机构。其推出的DII使得德温特具有附加值的专利数据进入了科技网(Webof Science,WoS)平台。DII将Der went World Patents Index(DWPI) 和 Patents Citation Index(DPCI)有机地整合在一起,用户不仅可以通过它检索专利信息,而且可以通过这个数据库检索到专利的引用情况。DII收录了来自40多个专利机构授权的1460多万项基本发明,3000多万条专利,数据每周更新并回溯至1963年,为研究人员提供世界范围内的化学、电子与电气以及工程技术领域内综合全面的发明信息,是检索全球专利的最权威的数据库。[9]

2.2.2 机构选取

本文选择1990年—2009年20年间德温特分类中电子和电气部分的W大类(通讯)领域内专利总数排序前25名的机构作为研究对象。数据采集时间为2009年5月27日和28日。选取的25家机构如表1所示(按专利数量排序)。

可以看到,这25个机构中日本企业占了17个,可见日本在通讯领域的研发成果较为突出。美国企业占了2个,分别为MOTOROLA和IBM。

表1 25家机构名录

3 结论分析

通过对检索结果进行处理,分别计算得到每个机构的专利总数、专利总被引量以及H指数、G指数、W指数、H(2)指数、A指数、R指数这6个指数的数值。详细数据见表2和表4。

3.1 6个指数与专利总数间的相关性

表2给出了按照专利总数排序的25个机构的专利总数量和各个指数值。

从表2可以看出,IBM6个指数值均排名第一,但其专利总数却排在第22位。相似地,MOTOROLA的6个指数值均排名第2,其专利总数排名却在21位。而专利总数排名前5的机构中,除排名第4的SONY外,其他4个机构的6个指数排名均在第5以后,其中,CANON和SUMSUNG的各指数排名都在10位以后。另外,按专利总数排名第7的韩国LG的6个指数排名都在20位以后。

从上面分析不难看出,按照专利总数和指数值排序的结果差异较大。本文采用SPSS软件对专利总数与6个指数间的相关性进行了分析。结果如表3所示。可以发现,专利总数与6个指数的Pearson相关系数都较小,与H(2)指数的相关系数仅为0.093。这充分说明,专利数量与H指数、G指数、W指数、H(2)指数、A指数、R指数均非显著相关的。

表2 25个机构按专利总数的排序结果

3.2 6个指数与专利总被引量间的相关性

表3给出了按照专利总被引量排序的25个机构的专利总被引量和各指数值。

从表4可以看到,中国华为和日本Konica两个企业按专利被引总量的排名和按照6个指数的排名结果完全一致。此外,所有机构的被引总量排名和各个指数排名的结果差异均在8以内,特别是对于按专利总被引量排名第18—25位的机构,这一差异更小。

表3 专利总数与各个指数间相关性

由上面的分析可知,按照专利被引总量和指数值排序的结果有所差异,但是差异不是很大。同样,本文采用SPSS软件对专利总被引量与6个指数间的相关性进行了分析。结果如表5所示。可以发现,专利被引总量与6个指数的Pearson相关系数都较大。这说明,专利被引总量与H指数、G指数、W指数、H(2)指数、A指数、R指数均是显著相关的,也即这6个指数与专利被引总量相似,都能很好地反映专利的重要性和影响。

表5 专利被引总量与各个指数间相关性

3.3 6个指数间的相关性

从表4可以看到,IBM、MOTOROLA、华为、Konica、Epson和Fuji Xerox等6家企业分别按照6个指数的排序结果完全一致。并且,从整体上看,各个指数排序差异不是很大。采用SPSS软件对6个指数之间的相关性进行分析发现(见表6),6个指数相互间的相关系数非常高,任意两个指数间的相关系数都在0.9以上,这充分说明,H指数、G指数、W指数、H(2)指数、A指数、R指数6个指数在用于机构专利评价时是有效且一致的。

表6 各指数之间的相关性

4 总结

通过以上实证分析可见,在机构专利评价过程中,H指数、G指数、W指数、H(2)指数、A指数、R指数与传统引文评价关系密切,能很好地反映机构专利的重要性和影响,且任意两个指数间均是强相关的,所有指数评价结果呈现较强的一致性。但是同时,H指数及其衍生指数用于机构专利评价时也存在一些问题,如有些机构的指数值相同从而无法达到评价目的,特别是W指数和H(2)指数进行评价时尤为明显;A指数和R指数值的重复很少,但是它们的计算较其他指数繁琐。此外,本文仅选择了通讯领域的25家机构作为研究对象进行分析,未来,针对H指数及其衍生指数在机构专利评价方面的应用,尚需进行更多的实证研究和理论探讨,同时专利引文数据库也有待进一步发展与完善。

[1] HirschJE.An Indexto Quantif yan Individual's Scientific Research Output[A]//Proceedings of the National Academy of Sciences,2005,102 (46):16569-16572.

[2] Jian Cheng Guan,Xia Gao.Exploring the H-index at patentlevel[J].Journalofthe American Society for Informa tionand Technology,2008,59 (13):1-6.

[3]官建成,等.运用H_指数评价专利质量与国际比较 [J].科学学研究,2008,26(5):932-937.

[4] EggheL.The ory and pra ctiseof theg-index[J].Scien tometrics,2006,69 (1):131-152.

[5]Qiang Wu.Thew-index——Asignifi cantim provement ofthe H-index[EB/OL].[2009-02-10].http://arxiv.org/abs/0805.4650.

[6] Kosmulski M.Anew Hirsch-type ind exsaves time and works equally well as the original H-index[J].ISSI Newsletter,2006,2 (3):4-6.

[7] Rousseau R.New Develo pments Related to The Hirsch Index[J].科学观察,2006,1(4):23-25.

[8] Jin B H,et al.The R-and AR- indices:Complementing the h-index[J].Chinese Science Bulletin,2007,52(6):855-863.

[9] Der went Innovations Index[EB/OL].[2009-06-10].http://www.Thomsonscientific.com.cn/products/patent/dii.htm.

猜你喜欢
指数值总数排序
排序不等式
恐怖排序
◆我国“三品一标”产品总数超12万个
节日排序
要控血糖,怎么吃水果才对对?
要控血糖,怎么吃水果才对
哈哈王国来了个小怪物
“一半”与“总数”
我国各地区官方微博综合绩效的指数法测评
——兼析少数民族地区官方微博综合绩效现状
测试小儿智力简法