秦东方 陈必坤
(郑州大学信息管理系,河南 郑州 450001)
趋势分析是指在海量资源以及大量用户使用记录的基础上,针对某一主题或关键词进行的时间序列统计[1]。趋势分析的关键点在于时间序列统计,事物是随着时间的推移进行演变。趋势分析的内涵可以从形式和内容两方面理解:形式上是主题的时间轨迹,内容上是通过主题相关知识点之间的时间演化关系预测未来动向。趋势分析工具指实现趋势分析功能的工具,通常以软件形式出现。根据其数据源及用户群体的不同,可分为学术趋势分析工具和大众趋势分析工具。学术趋势分析工具基于学术文献及研究人员使用记录且目标用户主要是研究人员,大众趋势分析工具主要基于社会信息和大众用户使用记录且目标用户是大众。
目前已经有成型的专业型学术趋势分析工具,用户通过简单输入关键词就能实现相应的趋势分析功能。此外,对于综合性的学术分析工具,用户对初步的分析结果再次进行时间序列统计后也能实现趋势演变功能,故称其为辅助型学术趋势分析工具。
1.1.1 专业型
1.1.1.1 CNKI学术趋势
CNKI学术趋势是依托于CNKI中国知识资源总库中的海量文献和千万用户的使用情况提供的学术趋势分析服务。通过“学术关注指数”和“用户关注指数”进行分析。学术关注度是以CNKI知识资源总库中与关键词最相关的文献数量为基础,统计关键词做为文献主题出现的次数,形成的学术界对某一学术领域关注度的量化表示。用户关注指数是以用户在CNKI系列数据库中所下载文章的数量为基础,统计关键词做为主题的文章被下载的次数,形成的用户对某一学术领域关注度的量化表示[2]。
1.1.1.2 万方数据知识服务平台知识脉络beta
为某一知识点在不同年代画出一张知识网络图,不同年代的网络图按顺序链接起来,形成某一知识点在不同年代的知识网络形状演变脉络图,简称为知识脉络。该系统基于万方数据知识服务平台收录的海量文献资源,通过基于共词网络和引文网络的分析方法,对知识脉络服务进行了完整实现[3]。
1.1.2 辅助型
1.1.2.1 ThomsonReuters的ResultsAnalysis和ESI(v2.3)
Results Analysis工具基于Thomson Reuters公司的Web of Science平台,用户只要进入检索结果页面,点击右边操作栏中“分析检索结果”或“创建引文报告”便可进入相应的分析系统[4]。“分析检索结果”中的“出版年代分析”以及“创建引文报告”中的引文报告便是简单形式的趋势分析。
ESI基于ISI Web of Knowledge平台,由引文排位 (Citation Rankings)、高被引论文 (Most Cited Papers)、引文分析 (Citation Analysis)和评论报道(Commentary)四部分构成[5]。其趋势分析内容主要包括两个方面:一是ESI时间演变图,二是研究前沿(Research Fronts)。
1.1.2.2 Elsevier的Refine Results和Scival Spotlight
Refine Results基于Engineering Village平台,其原理与Web of Science平台的Results Analysis相同,细化分析项目有:作者、机构、受控词、分类、出版年等[6]。与Results Analysis不同,Refine Results列表中的各项内容均可实现跨项组合浏览,比如要了解检索结果中的某位作者某年文献情况时,可以在作者和年代项中同时选择,该记录会在显示页面中出现[7]。通过跨项组合“出版年”和其他任一项目,均可实现简单的趋势分析。
SciVal Spotlight基于庞大的科学文献数据库Scopus,使用共引分析和创新的可视化分析技术,从不同角度分析某个机构内部相互关联的科研工作,这些工作体现了机构独特并且核心的竞争力,或者可以说是该机构占领先地位的 “独特竞争优势”[8]。SciVal Spotlight工具的 “TABLE”,“MAP”,“MATRIX”和“DETAILS”四个项目均可实现趋势分析功能。
1.2.1 Google趋势
Google趋势是Google实验室推出的一种产品。通过Google趋势,可以看到全世界对所选择主题的关注度,还可显示主题在Google新闻报道中出现的频率,以及最经常搜索它们的地理区域[9]。
1.2.2 百度指数
百度指数是以百度网页搜索和百度新闻搜索为基础的免费海量数据分析服务,用以反映不同关键词在过去一段时间里的“用户关注度”和“媒体关注度”。可以发现、共享和挖掘互联网上最有价值的信息和资讯,直接、客观地反映社会热点、网民的兴趣和需求[10]。
学术趋势分析工具包括3个子系统:数据采集子系统,统计分析子系统、结果显示子系统[1]。大众趋势分析工具的结构与其相近,主要区别在于数据源的不同。笔者则主要从以上三点出发对常见趋势分析工具进行比较研究(见表1)。
ESI(v2.3)和Scival Spotlight的趋势分析范围仅限于机构、国家、著者、期刊四方面;其他分析工具能够分析任意有效关键词,范围广泛,其中CNKI学术趋势和万方数据知识服务平台知识脉络beta学术趋势分析功能较强,Web of Science平台的Results Analysis和Engineering Village平台的Refine Results的学术趋势分析功能简单,而Google趋势和百度指数大众趋势分析功能强但是在学术性方面只具有有限参考性。
笔者选取“数字图书馆”、“Digital Library”两个关键词对以上趋势分析工具进行测试(时间为2010年9月13日凌晨),比较其不同功能特点。为了使测试过程富有条理性,笔者根据工具的特征将其分为三组。
选取关键词“数字图书馆”。前者的学术关注度折线图展现了1996—2008年以来数字图书馆的研究轨迹,其中2002—2008文章数量最多;用户关注度折线图展现了2007年8月—2008年12月以来用户对数字图书馆的关注轨迹,其中2007年10月、2008年1月和4月关注最多;另外该分析工具还列出了数字图书馆的高频文章、历史事件、相关作者、相关期刊等。后者的折线图展示了1998到2010年以来数字图书馆的研究轨迹,其中2002—2006命中文献数量最多;其中“数字图书馆”的相关关键词在不同年份的频次不同,比如“传统图书馆”、“元数据”频次逐步减少,“信息服务”频次逐渐增加,“知识产权”频次保持平衡,通过这些频次变化规律可以推断数字图书馆的研究热点变化状况。
二者均显示在2002—2006之间有关数字图书馆的文章数量最多,学术关注度高;不同的是前者显示了一年多中用户的使用情况,后者从深层次揭示了数字图书馆的研究热点变化情况。
前者输入“主题=digital library”And“入库时间= 1985-2010”And“数据库=SCI-Expanded,CPCI-S”,在检索结果列表中选择“分析检索结果”和“创建引文报告”项,便可得到不同年份的文献出版数趋势图和引文次数趋势图;文献出版数趋势图揭示相关外文文献从1999至2010年的研究轨迹,其中2004—2009年文献数量最多;引文次数趋势图揭示相关外文文献从2001至2010年的被引次数轨迹,呈逐年上升趋势。后者输入“((digital library)WN TI)”,在检索结果列表的“Refine Results”中选择任一项与“Year”组合便可得到相应的趋势图,最简单的文献出版数趋势图揭示了有关digital library的研究文献自1973至2010
年的研究轨迹,其中2002—2009年文献数量最多。
表1 常见趋势分析工具比较分析
二者均显示在 2004—2009年间有关 digital library的文章数量最多,学术关注度高;不同的是前者有关于引文次数的趋势图,后者在“Refine Results”中可以组合任意选项的趋势图。
首先选取关键词“数字图书馆”。前者的搜索量指数从2004到2010年缓缓减少,只是在2009年搜索量在某段时间里出现异常上升。后者的用户关注度折线图展示2006年6月到2010年来用户对数字图书馆的关注轨迹,折线总体起伏很小,只是在2009年某一点出现异常高峰;媒体关注度折线图展示2006年6月到2010年来媒体对数字图书馆的关注轨迹,2006到2008年关注最多,从2009年至今关注度缓慢减少;另外,分析工具还给出了相关新闻、相关检索词、地区分布、人群属性分布等信息。然后选取关键词 “digital library”。前者的搜索量指数从2004年至今逐步减少,只是在2007年、2009年搜索量在某段时间里出现异常上升;新闻引用量除了2005年、2009年、2010年初数量异常高以外,其余整体保持平衡;另外,分析工具还列出了关键词所在的国家、城市以及语种。后者显示找不到相关信息。
二者均显示大众用户在2009年某段时间里对数字图书馆的关注很高,其余时间比较平衡,与上述四种趋势分析工具的分析结果相似。不同的是前者的附属功能比后者简单。
总之,以上六种分析工具共同确认数字图书馆的研究高峰集中在2004至2009年。不同的是第一组专业易操作且分析功能较强,第二组需要选定检索结果才能进行分析,第三组学术性弱仅供有限参考。因此,不同研究人员可以根据其不同特点进行选择使用或者结合使用以上工具。
[1]景民昌,杨波.基于SRW信息源的学术趋势分析系统构建[J].现代情报.2008(3):55-57.
[2]CNKI学术趋势帮助.http://trend.cnki.net/cnkihelp.htm.
[3]王胜海.知识脉络分析服务的研究与实现.http://editors.wanfangdata.com.cn/.openaccessperiodical/Details/382a6d30-dc34-4d95-905c-00851a46dce5).
[4]Web of Science http://apps.isiknowledge.com/WOS_GeneralSearch_input.do?highlighted_tab= WOS&product=WOS&last_prod=WOS&SID= 4CFdBBO2oJiJkBeodDN&search_mode=GeneralSearch.
[5]Essential Science Indicators v2.3 Tutorial.http://science.thomsonreuters.com/tutorials/esi2/index.html.
[6]Engineering Village.http://www.engineeringvillage2.org/controller/servlet/Controller?CID=quickSearch&database=1.
[7]李志勤,丛玲.试析ISI及EI数据库中分析工具的功能.图书馆工作与研究.2008(12):41-43.
[8]SciVal Spotlight手册.http://china.elsevier.com/ElsevierDNN/Portals/7/SciVal-Spotlight% 208PP.pdf.
[9]关于 Google趋势.http://www.google.com/intl/zh-CN/trends/about.html.
[10]百度指数帮助.http://www.baidu.com/search/index_help.html.
[11]万方数据使用帮助.http://www.wanfangdata.com.cn/Help/index.html.
[12]WebofScie帮助.http://images.isiknowledge.com/WOKRS410B4/help/zh_CN/WOS/h_database.html.
[13]Essential Facts & Update Schedule http://www.in-cites.com/essential-facts.html.
[14] Engineering Village Updates http://www.engineeringvillage2.org/EngineeringVillageHelp/Webhelp/Engineering_Village_Help.htm#Date_Limits.htm.