崔丽华
(北京师范大学图书馆,北京 100875)
SCI(science citation index)是美国《科学引文索引》的简称,由 ISI(Institute for Scientific Information)美国科学情报所编辑出版。SCI数据库因收录了世界上一流的优秀期刊,被全球学术界公认为最权威的科技文献检索工具。对于SCI这样一个著名的数据库,大多数人只是利用了它的收录和引用功能,而它的分析功能利用率却不高。SCI具有强大的结果分析功能,可以对检索到的论文作者、作者机构、来源期刊、学科分类、文献类型、出版年限等进行统计分析,解决科研人员非常关注的诸多问题,如:本研究领域发表论文最多的核心作者是谁;论文主要发表在哪些期刊上;发表论文最多的机构在哪里;哪一年发表论文最多;论文主要涉及了哪些学科等等。
笔者以生命科学领域的研究热点“蛋白质组学”这一案例来说明如何利用SCI的结果分析功能,追踪学术研究的发展轨迹,在避免重复研究、节省时间和精力的同时,把握学科发展前沿,了解我国在此领域所处的国际地位,为科研提供精准服务。
蛋白质组学的英文名称为proteomics。以“proteomics”为检索词,选定年限为2000~2009(检索日期为2010年1月12日)。检索出题名中含有该检索词的文献,共命中记录5896条。
对5896篇论文作者的发表篇数进行统计,选择项为分析全部命中条数,最多10000条记录,最少记录设定为20,表示只统计论文数量大于20的作者,按照作者发表论文的数量排序,结果显示发表论文数量在20篇以上的作者有27名,选出前10名的作者(见表1)。
表1 发文量居前10名的作者
从表1中可以看出,前10名作者共发表了552篇文章,占总发文量的9.36%,这些作者的发表文章篇数都在31篇以上。还可对获得的这些数据做进一步的分析,如继续使用分析功能对其中某位作者的论文进行分析,了解发表在哪些期刊上,文献类型有哪些,是研究论文还是综述等。因为只有研究论文(ARTICLE)对指导研究更有意义,所以,对前3名作者的文章又进行了文献类型分析,发现文章总数(134篇)排名第一的ANON,研究论文只有13篇,而NEWS ITEM 55篇,MEETING ABSTRACT 46篇,其他20篇。总数排名第二的AEBERSOLD,R(72篇)研究论文为34篇,比第一名ANON多21篇。第三名的MANN,M(57篇)研究论文为31篇。
由此可见,运用SCI的作者分析功能,可方便地发现研究领域发表文章最多的专家、领军人物及核心作者群,跟踪他们的论文可以了解学术研究的发展前沿。
对5896篇文章的来源期刊进行统计,选择项仍为分析全部命中条数,最多10000条记录,最少记录设定为10,按照来源期刊中论文数量的多少进行统计排序,结果显示发表蛋白质组学论文数量超过10篇的来源期刊有91种。如表2所示,前10名期刊收录文献2118篇,占总量的35.92%,可以视为该领域的核心出版物。这些期刊大量登载了蛋白质组学方面的论文,对于科研人员来说,是要重点阅读的,是科研人员互相学习、交流、探索的最主要期刊。但是这一结果同时也显示了来源期刊比较分散。科研人员如果掌握这些期刊分布状况,对于指导投稿有重大意义,即选择收录相关论文量大的期刊进行投稿,有利于提高命中率。
表2 载文量居前10名的期刊
对5896篇文章考察作者所在机构,选择项仍为分析全部命中条数,最多10000条记录,最少记录设定为10,表示统计发表文章数量大于10的机构。结果显示发表文章数量在10篇以上的机构有208个。表3列出发表文章数量前10名的机构。前10名机构共发表文章743篇,占总发文量的12.6%。在前10名机构中,高校和科研机构占有绝对优势。其中哈佛大学位居第一,发表文章102篇。其次,华盛顿大学发表88篇。中国科学院(CHINESE ACAD SCI)发表文章44篇,排名21位(表3未列出)。了解此领域发文机构,对加强学术研究与交流,寻找合适的合作伙伴有重要作用。
表3 发文量居前10名的研究机构
一个国家发文量的多少,可以考察这个国家在该领域内的科研水平及国际影响力。对5896篇文章进行国家统计分析,选择项同机构分析。发文量较多的前10位国家如表4所示,依次为美国、德国、英国、中国、日本、加拿大、法国、瑞士、意大利和瑞典。前10位国家共发表文章4964篇,占总发文量的84.19%。其中美国遥遥领先,发表文章2292篇,占总发文量的38.87%。中国发文量位于第四,发文302篇。对这302篇文章又进行了出版年限分析,2000年与2001年各两篇,2002年 1篇,2003年 11篇,2004年 52篇,2005年 18篇,2006年47篇,2007年44篇,2008年58篇,2009年67篇。可见2000~2002年为萌芽阶段,2003年快速发展,2004~2009年发文量迅猛增长,但2005年有点例外。我国的发文量与蛋白质组学研究的发展进程基本吻合。
国际上蛋白质组学研究进展十分迅速,不论基础理论还是技术方法,都在不断进步和完善。多种细胞的蛋白质组学数据库已经建立,相应的国际互联网站也层出不穷。1996年,澳大利亚建立了世界上第一个蛋白质组学研究中心Australia Proteome Analysis Facility。丹麦、加拿大、日本也先后成立了蛋白质组学研究中心。在美国,各大药厂和公司在巨大财力的支持下,纷纷加入蛋白质组学的研究阵容。瑞士成立的GeneProt公司,是由以蛋白质组学数据库“SWIS.SPROT”著称的蛋白质组学研究人员成立的,以应用蛋白质组学技术开发新药物靶标为目的,建立了配备有上百台质谱仪的高通量技术平台。而当年提出Human Protein Index的美国科学家Normsn G.Anderson也成立了类似的蛋白质组学公司。2001年4月,在美国成立了国际人类蛋白质组学研究组织(Human Proteome Organization,HUPO),随后欧洲、亚太地区都成立了区域性蛋白质组学研究组织,试图通过合作的方式,融合各方面的力量,完成人类蛋白质组学计划(Human Proteome Project)。2003年9月,国内正式成立了中国人类蛋白质组学组织(CNHUPO);2005年10月,第一家从事蛋白质组学研究的专业研究机构——北京蛋白质组学研究中心成立[1]。目前我国已拥有具有国际先进水平的高通量、高灵敏的蛋白质组学研究技术平台,并且成功开展了有关人类重要生理及病理的蛋白质组学研究,如人胎肝的蛋白质表达谱和磷酸化修饰谱、肺癌和肝癌差异蛋白质组等研究[2]。
表4 发文量居前10位的国家
利用SCI提供的分析功能对检索到的5896篇蛋白质组学文章进行了统计分析,通过这些分析,全方位地了解了蛋白质组学领域的研究状况及发展前沿,解决了科研人员关心的诸多问题。
①蛋白质组学研究领域发表文章数量最多的是ANON,2000~2009年10年间共发表文章134篇,但如果以研究论文(ARTICLE)排名,AEBERSOLD,R排名第一,研究论文为34篇,而ANON只有13篇。利用SCI提供的作者分析功能,可方便地发现研究领域发表文章最多的专家、领军人物及核心著者群。跟踪他们的论文可以了解研究课题的发展前沿。
②收录蛋白质组学论文数量超过10篇的期刊有91种。掌握与研究课题相关的期刊分布状况,对指导科研人员进行科研交流探索及投稿有重大意义。
③通过考察蛋白质组学研究作者的所在机构,发现高校和科研机构占有绝对优势,其中哈佛大学发文量位居第一,发表文章102篇。利用SCI提供的机构分析功能,可以了解研究领域的核心研究机构,对加强学术研究与交流,寻找合适的研究合作伙伴有重要作用。
④利用SCI提供的国家分析功能,了解一个国家发文量的多少,可以考察这个国家在该领域内的科研水平及国际影响力。对于蛋白质组学研究领域,美国是该研究的核心国家,发表文章2292篇,占总发文量5896篇的38.87%,说明其国内汇集了一批该领域的专家。中国发文量位居第四,发表文章302篇,表明我国的科学家在这一领域一直在努力向世界前沿迈进。
[1] 张丽霞,张国强,陈瑞丽.蛋白质组学研究的新进展.安阳工学院学报,2006(3).
[2] 蒋英芝,贺连华,刘建军.蛋白质功能研究方法及技术.生物技术通报,2009(9).
[3] 庞景安.科学计量研究方法论[M].北京:科学技术文献出版社,2002.
[4] 徐慧芳,仲维科.SCI在科学研究中的应用.情报学报,2005(5).崔丽华 女,1964年生。博士,副研究馆员。