贡金涛 陈利东
〔摘 要〕在图书情报学中,引用分析是一种重要的研究方法。在介绍作者引用认同和作者引用形象的基础上,文章以清华大学陈劲教授为研究对象,以读秀图书数据和万方图书数据为样本,分析了该学者的作者引用认同和作者引用形象。结果表明:作者引用认同和作者引用形象符合集中离散规律,与学者写作风格、学者学术研究经历有一定关系。不同文献载体引用数据的引用认同和引用形象可以进一步完善引用分析。
〔关键词〕引用认同;引用形象;引用分析;实证分析;引用者;图书引用
DOI:10.3969/j.issn.1008-0821.2016.04.004
〔中图分类号〕G250.252 〔文献标识码〕A 〔文章编号〕1008-0821(2016)04-0020-06
〔Abstract〕Citation analysis is an important research field in LIS discipline.Based on the concept of citation identity and citation image with an individual author.Taking the Duxiu book data as the research sample,the paper selected the Chen Jin as the research object to analyze his author citation identity and author citation image.The result showed the author citation identity and author citation image is accord with the concentrate and discrete distribution.authors social structure writing styles,process of academic activities.Citation analysis might be further improved by the study of author citation identity and author citation image from different style cited data.
〔Key words〕citation identity;citation image;citation analysis;empirical analysis;citer;book citation
图书作为人类成就的记录,知识文化传播的载体,其使用价值为“传播科学知识,积累文化,丰富人们的精神生活”[1]。2013年,中国出版的图书为22.7万种,图书成为科研成果的重要载体,其记录了学者们的系统科研思考成果。引文分析是利用各种数学及统计学的方法和逻辑方法,对文献对象的引证与被引证现象进行分析,以便揭示其数量特征和内在规律的一种文献计量方法[2]。引文方法被广泛应用在期刊论文、专利文献等方面,学界对图书引文的研究比较少。在引文方面,图书与期刊论文具有相似性,图书被其它文献所引用,分析引文的数量特征,也能揭示图书、著者、著者机构等图书特征的很多内在规律。在图书引用方面的研究,Kayvan Kousha和Mike Thelwall介绍了Google Book Search的内容和功用,其中包括对图书的评价[3]。苏新宁利用《中文社会科学引文索引》(CSSCI)对我国人文社会科学图书进行被引用概况分析,阐述了对被引图书的处理方法,探讨了图书在CSSCI中的被引用状况[4]。汪跃春和胡敏认为读者发文的图书引文是读者在研究过程中利用文献的体现,利用读者引文作为标准书目对馆藏进行评价[5]。杨思洛等对我国图书情报领域高影响力图书同被引情况进行了统计和分析,发现可以作为图书评价的一个方面来应用[6]。Juan Gorraiz等探究了Book Citation Index(BKCI)可以作为评估的起点,随着图书引文数量的增多,猜想将来或许可以作为图书评价的一个很好的方法[7]。杜娟等系统地对比分析了科技图书样本在国内相关数据库或检索工具中的被引频次分布,提出了图书被引查证工作中的相关问题[8]。徐贵水则基于读秀中文图书被引用报告,总结和探析学术发展的一些特点和规律[9]。
1 引用认同和引用形象的概念和意义
“引用认同”是美国计量学家H.D.White于2001年提出的一个文献计量学新概念,在所写论文中定义为“某作者引用的全体作者的集合”[10]。“引用形象”是与其相对的文献计量概念,被定义为“引用过某一作者的全体作者的集合”[11]。这两个文献计量概念都是基于特定主体(著者、机构、期刊等)引用情况的微观描述,是对原有引证分析的深化和拓展。2002年,B.Cronin和D.Shaw通过实际例子构建了作者引用认同和作者引用形象分析的详细分析步骤及解释,其用来揭示特定作者的学术产出状况[12]。马凤和武夷山实例分析了王崇德教授的作者引用认同情况,引起了国内图书情报学者对“引用认同”这一概念的普遍关注[13]。紧接着,白青和董文华分析了武汉大学冯天瑜教授作者引用认同情况,认为引用认同分析方法是完善引文分析的一种科学的尝试[14]。鲁晶晶等提出了“机构引用认同”这一概念,将其定义为“某机构所引用的所有机构的集合”,将印第安纳大学图书情报学院引用的机构引用认同进行实证分析,认为引用认同可以揭示特定研究机构的引用情况及潜在的合作机构[15]。贡金涛等利用专利引用数据,分析了美国铁姆肯公司的专利权人引用认同与专利权人引证形象,认为专利权人引用认同可以用于企业竞争情报分析[16]。
由于图书也有参考文献,也存在图书与文献之间的引用关系,因此理论上可以利用图书的参考文献和引用数据,分析出作者引用认同和作者引用形象,本文尝试用图书的参考文献和被引引文来开展作者引用认同和作者引用形象分析,可以将结果与期刊、专利之间得出的引用认同分析结论进行对比,从而为图书引文在图书评价中的应用提供借鉴,为图书引用认同和图书引用形象分析方法的应用提供案例支撑。
2 实证分析
2.1 数据来源与方法
引用认同和引用形象适于“知名作者”作为研究对象,便于提取大量引用数据,从而得出分析的结果。本文选取创新管理研究方面国内著名专家陈劲教授为研究对象。
陈劲,浙江余姚人,现为清华大学经济管理学院创新创业与战略系教授,清华大学技术创新研究中心主任。曾任教于浙江大学,浙江大学求是特聘教授,博士生导师。其研究领域主要为科学学、技术与创新管理、科教发展战略等。陈劲教授是“自主创新”概念的最早提出者之一,对“国家创新系统”的研究也起到过引领的作用,是我国创新领域最主要的学者之一[17]。
陈劲教授作为“科技创新管理”研究的领军人物,对他撰写的图书进行引用认同和引用形象统计与分析,可以了解其学术发展的知识来源,对“科技创新管理”方面的研究和发展也许有一定的启示意义。陈劲教授著述颇丰,撰写的著作主要包括3类:一是翻译国外创新管理类著作,比如加拿大约翰·索普(John Thorp)教授的《信息悖论:信息技术的商业利益》、英国萨塞克斯大学玖·笛德(Joe Tidd)教授的《创新管理:技术、市场与组织变革的集成》、美国战略大师加里·哈默尔(Gary Hamel)的《管理大未来》、美国经济学家亚力克·福奇《工匠精神:缔造伟大传奇的重要力量》等;二是主编专业论文集,比如《高校创新体系建设研究报告文集》、《演化与创新经济学评论》专辑、《中国创新发展报告》系列等;三是撰写的创新管理学著作,比如《正在爆炸R&V:一个整合全球资源的中国自主创新案例》、《研究与开发管理》、《突破型复杂产品系统的创新模式》等。考虑到引用认同的严谨性,两人以上的合著作品不能保证引文的作者对被所有合著作者一致认同,因此引用认同研究的对象一般只包括著者的独著图书。在本文中,分别列出了陈教授作为独著作者的引用认同,从读秀数据库中,按“作者=陈劲,单位=浙江大学 OR 单位=清华大学”搜集到陈劲教授到现在已经撰写的102本“图书”,对其进行查重和除去“演化与创新经济学评论”专辑等连续出版物,获得79本图书,其中陈劲教授独著的图书共24本,陈劲教授翻译外国专业图书或与其他学者合著图书共55本,检索时间为2015年4月12日。
2.2 引用认同分析
获得陈教授独著的24本图书,来获得每本书后面的参考文献著录数据,图书间参考的文献数量差距很大,4本图书后面没有参考文献,它们是《〈管理学〉学习指导与案例》每一篇章后有推荐书目,我们按参考文献对待;《超智孵化:大学科技园研究》等3本图书后面没有参考文献和脚注说明,我们按参考文献为0对待。
经过数据清理,陈劲教授作为独著作者发表的24本图书共有3 861篇参考文献,其中有图书、期刊论文、网址。经过数据清理,除去没有作者的引文数据,共得到陈劲教授图书引用的3 347位作者,其中外国作者2 025位(对引用的中文外国人名与外文外国人名进行合并),中国作者1 321位。这3 347位作者就成为陈劲教授以前著作中体现出来的作者引用认同。
按照H.D.White引用认同的计算方法,著者A的引用认同这样计算:A在一篇文章中引用了B,那么不管引用了几篇B的文献,都记B在A的引用认同中增加了1次。利用这种方法其中将引用次数最高的40位列出,见表1。
引用认同计数方法为H.D.White方法
本文觉得图书相对于论文篇幅更加长,多次引用其引用者的不同文章,引用的文章越多就说明对B的认同更强。因此,本文除了按照H.D.White方法进行引用认同的计算外,因为分析到图书的文字比较多,在图书两章不同地方引用了两篇同一作者不同的文献,应该记为2次,更能体现对待被引者的公平。所以照下列方法进行了计算和分析:A在一篇文章中引用了B,那么引用了几篇B的文献,就记B在A的引用认同中增加了几次。结果见表2。
引用认同计数方法为本文方法
从上述表1与表2,我们可以得到以下结论:
(1)在数量上,陈劲教授的作者引用认同中被引者出现次数呈集中离散分布,在3 347位被引者中,仅仅被陈劲教授的一本图书引用过的有2 167位,多次引用过的被引者居于少数。表1所示,除了作者外,还有许庆瑞、克里斯托弗·弗里曼(Christopher Freeman)、野中郁次郎(Ikujiro Nonaka)、玖·笛德(Joe Tidd)、大卫·J·蒂斯(David John Teece)等引用次数在10次以上。这些学者是陈劲教授以前研究的关注核心,其知识来源于引用过学者的已有知识理论。
(2)引用认同中的作者大多数是国内外创新管理领域的专家学者,许庆瑞于2007年当选中国工程院院士,是技术创新与管理学方面的专家;英国经济学家克里斯托弗·弗里曼(Christopher Freeman)最早提出了“国家创新系统”的概念;日本学者野中郁次郎(Ikujiro Nonaka)和竹内弘高(Hirotaka Takeuchi)提出著名的创新SECI模型。引用认同名单中除了与创新和管理学相关的著名学者外,还有经济学、心理学、科学计量学等方面的专家学者。此外还有一些统计组织也进入了引用名单,比如OECD和中华人民共和国国家统计局,说明宏观的创新研究建立于统计分析基础上,这些数据来自于权威的统计机构。
(3)在表1中表现出相同频次的引用者,其引用影响力也不尽相同,比如克里斯托弗·弗里曼(Christopher Freeman)和野中郁次郎(Ikujiro Nonaka)在表1中的引用认同是11,但野中郁次郎被陈劲教授引用更加频繁,在陈劲教授所写的著作中有野中郁次郎的更多不同的文章作为参考文献。
(4)自引是引用认同的核心。在作者的引用认同中,引用自己的次数为19次,排名第一,说明作者研究具有连贯性,在自己的研究领域内长期不断地进行了知识积累和知识创新。从陈劲教授出版的图书可以看出他一直从事管理学、创新管理、公司治理等方面的研究。
(5)引用认同反映了作者的学习、工作背景,作者会引用那些与自己地理位置接近的作者或与自己合作的作者。陈劲教授现在清华大学工作,原来在浙江大学工作,因此高引用认同中的许庆瑞院士、郭斌教授、魏江教授为浙江大学管理学院的教师,童亮、陈钰芬曾为浙江大学管理学院的博士生,刘常勇教授为浙大创新基地的访问教授。谢伟教授为清华大学教师,与陈教授现在的工作单位相同。陈劲教授1998年在美国麻省理工学院斯隆管理学院做访问学者、2000年在英国苏塞克斯大学科技政策研究中心做访问研究员,此外陈劲教授还是英国Manchester大学PREST研究中心访问教授,这些访学背景使他的引用认同中包括很多欧美的创新管理专家学者,比如现代管理学之父彼得·德鲁克(Peter F.Drucker)、竞争战略之父哈佛大学教授迈克尔·波特(Michael E.Porter)、美国经济学家大卫·J·蒂斯(David John Teece)、哈佛商学院教授亨利·切斯布罗(Henry Chesbrough),美国哥伦比亚大学教授理查德·R·纳尔逊(Richard.R.Nelson)、英国萨塞克斯大学教授玖·笛德(Joe Tidd)等等。
(6)表1和表2中引用认同次数多的作者名字大多数重复,可能是引用的文献数量多,暗含着与被引用作者的研究方向一致,所以会倾向于更多地引用这些作者的文献,也说明一个人研究范围有一个界限,学术界全才出现在这个知识大爆炸的时代是不太现实的。
2.3 引用形象分析
从读秀、万方数据库和谷歌学术中,对陈劲教授独著的24篇图书进行查找,选择读秀数据库获得图书类引文,选择万方和谷歌学术获得期刊类引文。得到引用这24篇图书的引文,共获得引文531篇,被707位作者引用,人均引用次数为0.751。其中引文最高的一篇文章是《永续发展企业技术创新透析》,被引次数为69次,《突破型复杂产品系统的创新模式》等6篇文章则没有被引用。照H.D.White引用形象的计算方法,将引用形象中引用次数最高的40位作者列出,见表3。
引用认同计数方法为H.D.White方法
从上述表3,我们可以得出以下结论:
(1)自引是引用形象的主要部分,陈劲教授自引次数为13,位于第1位,且远远高于第2位王黎萤的5次,与基于论文被引数据的著者引用形象情况相一致。由于自身研究的延续性、自我思想的易获取性,学者们都倾向于更多地引用自己原有的学术成果。
(2)图书被引的作者引用形象也体现一定的离散分布规律,大多数作者只引用过陈劲教授1次,引用过1次的作者人数为655位,占总引用人数的92.6%。只有极少数作者重复引用陈劲教授,中国计量学院王黎萤教授引用了5次,大连理工大学刘则渊教授引用了4次。
(3)引用形象中的引用者,表现出引用行为与其社会网络相关。王黎萤教授曾在浙江大学管理学院读博士,他与陈劲教授合著有《专业技术人员创新能力培养与提高》、《共享创造:提升研发团队创造力的过程机制》等专业图书。刘则渊教授是大连理工大学科学计量学研究的开拓者,两人都是中国科学学与科技政策研究会成员,陈劲教授为副理事长,刘则渊教授为科学学理论与学科建设专业委员会主任。此外浙江工商大学伍蓓教授、福州大学何郁冰副教授、北京理工大学刘云教授等也多次引用了作者。总体来说师生、同事、专业学会组织、合著、地域等相互关系都会对引用产生一定的影响,这些社会网络关系有利于汇集相关的研究主题,综合出现领域创新的态势。
(4)在引用认同中,都是中国的作者,可能是把中文图书作为研究对象的原因,即使这些图书学术创新价值很高,由于没有获得的途径及对汉语的不熟悉,外国学者很少关注中国学术图书。在中国,很多学者专家开始向国外重要专业期刊投稿,但图书翻译成外文,在外国发表的现象还比较少。
3 讨论与思考
引用认同和引用形象是学者固化的学术研究印记,随着其时间的推移而变化。某个学科领域核心的几个学者的引用认同和引用形象,可以帮助了解此学科领域的发展动态。
对引用认同和引用形象的实证研究,包括作者引用认同和作者引用形象、机构引用认同和机构引用形象、期刊引用认同和期刊引用形象、专利权人引用认同和专利权人引用形象。以前用期刊论文的参考文献构建作者引用认同和作者引用形象分析框架,本文尝试用学术图书参考文献和被引文献为数据来源,将引文分析构建为作者引用认同和作者引用形象分析框架,以清华大学陈劲教授独著的学术图书为研究对象进行实证分析。以陈劲教授学术图书的参考文献为基础,进行引用认同分析,获得了解学者的学术构建脉络和学术创作风格;以陈劲教授学术图书被引为基础,进行引用形象分析,获得学者学科研究影响力和学术延续情况。不管是引用认同还是引用形象,自引和自被引是其核心,作者本身在引用认同和引用形象中的频次是最高的。引用认同和引用形象反映出该作者学术研究历史和社会网络关系,陈劲教授频频引用的作者或频频引用陈劲教授的作者一定程度上与其为师生、同事、专业学会组织成员、合著关系、相近地域等关系。引用认同与引用形象明显地呈离散分布规律,仅仅被陈劲教授一本图书引用或引用过陈劲教授一本图书的作者占大多数,是一种弱相关联的关系。陈劲教授引用认同中国外作者比较多,包括熊彼特(Joseph Alois Schumpeter)、彼得·德鲁克(Peter F.Drucker)、迈克尔·波特(Michael E.Porter)、大卫·J.蒂斯(David John Teece)、亨利·切斯布罗(Henry Chesbrough)、查德·R·纳尔逊(Richard.R.Nelson)等有名的经济学家和管理学家,但反向引用形象的概率比较低,一是说明汉语图书相对于期刊论文来说,翻译比较困难,不利于被外国学者所阅读认识;二是说明我国刚刚从制造大国到创造大国转型之中,创新管理研究学术前沿仍掌握在欧美国家手中,我国的学者在国外创新管理研究领域仍然缺乏一定影响力,不易被国外学者借鉴。
要研究某位作者的学术历史情况,研究领域和学术社会网络情况,应该结合引用认同和引用形象来进行,通过学术期刊论文和学术图书两种不同的引用数据来源进行分析,可以进行不同类型学术成果的评价。对于自然科学、社会科学学术图书出产比较多的学者,可以用图书来进行引用认同和引用形象分析。图书之间的引用可以进行引用认同和引用形象分析,这种图书引文分析可以分析作者之间的学术情况,尤其对一些传统学科,比如一些国学大师,他们一般不写期刊论文,撰写的图书反而较多,研究基于学术图书引用认同的数据更具有可行性。
进一步研究方向:整合一位学者图书和其它文献类型的引文,从整体分析他的引用认同和引用形象,有利于从全面分析其整体科研情况。仔细对引用认同和引用形象的高频作者进行详细分析,比如创新的主要内容,可以看出研究者的学术创新点。整合各个数据库的各类型引用数据,构建更加准确的数据和分析统计工具,可以让引用认同分析和引用形象分析更加具有客观性,在客观数据分析结果的基础上进行诠释性分析。
参考文献
[1]中国现代编辑学辞典[M].哈尔滨:黑龙江人民出版社,1991:2.
[2]杨思洛,王皓,文庭孝.基于引文分析的图书影响力研究——以图书情报领域为例[J].情报资料工作,2010,31(1):89-92.
[3]Kousha K,Thelwall M.Google book search:Citation analysis for social science and the humanities[J].Journal of the American Society for Information Science and Technology,2009,60(8):1537-1549.
[4]苏新宁.我国人文社会科学图书被引概况分析——基于CSSCI数据库[J].东岳论丛,2009,30(7):5-13.
[5]汪跃春,胡敏.基于读者发文引文统计的馆藏图书评价与分析——以金陵科技学院图书馆为例[J].图书馆建设,2010,33(5):18-21.
[6]杨思洛,王皓,文庭孝.基于引文分析的图书影响力研究——以图书情报领域为例[J].情报资料工作,2010,31(1):89-92.
[7]Gorraiz J,Purnell P J,Glnzel W.Opportunities for and limitations of the Book Citation Index[J].Journal of the American Society for Information Science and Technology,2013,64(7):1388-1398.
[8]杜娟,胡天天,潘杏梅.国内科技图书被引查证研究[J].图书与情报,2012,31(3):26.
[9]徐贵水,孙莹莹.我国百年学术发展特点初探:基于读秀中文图书被引用报告的分析[J].情报杂志,2011,30(11):47-51.
[10]White HD.Authors as citers over time[J].Journal of the American Society for Information Science and Technology,2001,52(2):87-108.
[11]White HD,McCain KW.Visualizing a discipline:An author co-citation analysis of information science,1972-1995[J].Journal of the American Society for Information Science,1998,49(4):327-355.
[12]Cronin B,Shaw D.Identity-creators and image-makers:Using citation analysis and thick description to put authors in their place[J].Scientometrics,2002,54(1):31-49.
[13]马凤,武夷山.引用认同——一个值得注意的概念[J].图书情报工作,2009,53(16):27-30.
[14]白青,董文华.引用认同在科学计量分析中的应用研究[J].情报杂志,2010,29(9):38-40.
[15]鲁晶晶,邓勇,陈云伟.引用认同用于科研机构分析的探讨[J].图书情报工作,2011,55(6):53-56.
[16]贡金涛,陈利东,贾征.基于引用认同与引用形象的专利权人竞争情报分析[J].情报理论与实践,2014,37(10):65-71.
[17]陈劲.个人简介[EB/OL].http:∥www.sem.tsinghua.edu.cn/zh/chenjin,2014-12-15.
(本文责任编辑:孙国雷)