信息检索在期刊评价指标分析中的应用

2012-11-21 10:47谢文亮
韩山师范学院学报 2012年6期
关键词:运算符商学院发文

谢文亮

(广东商学院学报编辑部,广东广州 510320)

1 信息检索的重要性

信息检索亦称为情报检索,是指将信息按一定的方式组织和储存起来,并根据信息用户的需要找出有关信息的过程[1].信息检索对期刊的办刊方向十分重要,通过对期刊信息的挖掘获得信息,对信息进行分析,了解刊物在一定时间内期刊关键评价指标的客观情况,如被引频次、影响因子、被引广度以及Web下载量等,并将分析结果应用于期刊的战略决策上,可以增强决策的科学性和准确性.

在信息时代,文献数量呈几何指数增长,以中国知网数据库为例,截至2012年10月,收录国内学术期刊7 900多种,全文文献总量3 500多万篇.面对如此庞大的文献信息,要获得期刊评价指标所需的数据,需要对信息检索作深入研究[2].一个有效的信息检索办法是对数据库进行联机检索[3].当前,最大的期刊联机数据库是中国知网,其数据库中收录了当前国内最齐全并且相对客观的期刊数据,并提供了简单检索、标准检索、高级检索、专业检索等检索方法,还配备相应的数据库查询语言.如何从中国知网中获取数据信息,做到知己知彼,是期刊管理者关注的焦点.

2 中国知网数据库检索工具

中国知网提供如简单检索、标准检索、高级检索、专业检索等几种检索方法,前3种检索方法不需要太多的技巧,只需按要求在相关的检索项中输入检索项关键词,就能得到结果.专业检索使用检索语言,即符号运算符、逻辑运算符、括号运算符和检索项相结合构造检索表达式,达到快速搜索、精确定位的目的.专业检索用于图书情报专业人员查新、信息分析等工作,使用构造检索式进行检索[2],要求检索人员要熟悉检索语言.

2.1 检索项变量名称

检索项变量的名称表达式是该检索项的英文缩写,如检索项“主题”的变量SU,是英文单词SUbject的缩写;题名TI是英文单词TItle的缩写等.这样定义让检索人员容易记住该检索项的表达方式.中国知网提供20个检索项:SU=主题,TI=题名,KY=关键词,AB=摘要,FT=全文,AU=作者,FI=第一责任人,AF=机构,JN=中文刊名&英文刊名,RF=引文,RT=更新时间,YE=年,FU=基金,CLC=中图分类号,SN=ISSN,CN=统一刊号,IB=ISBN,CF=被引频次,SI=SCI收录刊,EI=EI收录刊,HX=核心期刊.

在使用检索项变量时,要与检索运算表达式相结合.如:“JN=广东商学院学报中”,JN为中文刊名,=为运算符,表示“包括”,表达式中“广东商学院学报”是检索词.整个表达式的含义是:中文刊名为“广东商学院学报”.

2.2 检索运算表达式

中国知网专业检索中一共有13种符号运算符和3个逻辑运算符(AND、OR和NOT)以及一个括号运算符[3].其中,符号运算符如表1所示.

表1 符号运算符及其检索功能

这些运算符之间定下了优先级:括号运算符>符号运算符>逻辑运算符.优先级高的运算符在优先级低的运算符前先进行运算,“AND”、“OR”、“NOT”三种逻辑运算符的优先级相同;如果需要改变组合运算的顺序,必须使用圆括号“()”将条件括起.

2.3 复合运算

单个表达式检索效果比不上简单检索、标准检索或高级检索.但是,如果将多个检索项通过运算符号连接,并按照所定义的优先级进行复合运算,专业检索就显示出强大的威力,这是其它三种检索方法无法达到的.

2.4 手工检索与专业检索配合

截止到2012年11月,中国知网仅开发出20个检索项变量,由于检索项的变量有限,无法在检索时更进一步限制检索的范围,中国知网提供了结合手工的专业检索.如检索过程中,默认的数据库是“各类文献数据库”,包括中国学术期刊网络出版总库、中国学术辑刊全文数据库、中国博士学位论文全文数据库、中国优秀硕士学位论文全文数据库等35个数据库.对于每一条检索,都要在这35个数据库中进行对比检索,消耗了大量的检索时间;另一方面,在某些应用中,如检索某期刊刊发的文章被学术期刊引用的次数,按要求只需要将检索数据库局限在“中国学术期刊网络出版总库”即可,没必要将时间消耗在其他34个数据库上检索,并且检索出的结果也是严重失真.又如,在检索转引时,完全不相干学科期刊的转引,99%以上是偶然转引,这些转引可以忽略不计.因此,在检索界面左边的“请逐级选择您调研的学科领域”中,将检索限定在所选学科内,这样可以提高所搜集数据的准确性.例如,在研究《广东商学院学报》(以下简称《学报》)总转引频数时,一般不选“自然科学与工程技术文献”数据库存,在“人文与社会科学文献”数据库中,只留“经济与管理科学”学科.

3 信息检索应用实例

3.1 期刊的评价指标

要提高期刊的影响力必须研究期刊评价指标,以及研究如何利用这些评价指标作为信息化的指导思想对期刊进行制度创新.在各种评价指标中,比较重要的有:总被引频次、他引频次、他引总引比、基金文章占比等[4-5].在研究期刊栏目设置的合理性时,要考虑到许多因素,如期刊发表文章的学科分类、数量及排名,引用《学报》文章的学科分类、数量及排名,由此作对比,可以比较科学地设置栏目.

3.2 检索总被引频次

总被引频次是指在某个统计周期里期刊被引用的次数,可以是他刊引用,也可以是自我引用.该指标表示期刊所发表文章的影响力.如:检索“广东商学院学报”2009~2011年在“经济与管理科学”学科里总被转引篇数.

检索命令为:

RF=广东商学院学报and YE=2009(注:2009年当年《学报》被转引的次数,检索界面如图1所示,下同)

图1 中国知网专业检索查询示意图

RF=广东商学院学报and YE=2010 (注:2010年当年《学报》被转引的次数)

RF=广东商学院学报and YE=2011 (注:2011年当年《学报》被转引的次数)

检索得到的结果见表2.

表2 2009~2011年《学报》各项评价指标

3.3 检索他引总引比

他引总引比是指在某个统计周期里其他期刊引用《学报》的次数/总被引次数,该指标表明《学报》发表的文章在其他刊物的影响力.

如果要分析他引的频数,则在前面检索的基础上,检索《学报》自引频次,检索命令为:

RF=广东商学院学报and YE=2009 and JN=广东商学院学报(注:2009年当年《学报》自引的次数)

RF=广东商学院学报and YE=2010 and JN=广东商学院学报(注:2010年当年《学报》自引的次数)

RF=广东商学院学报and YE=2011 and JN=广东商学院学报(注:2011年当年《学报》自引的次数)检索结果如表2所示.

将总被引频次和自引频次的篇数作减法运算,则得到近三年来《学报》他引的频次,见表2.

他引频次/总被引频次,可以得到期刊评价指标中极其重要的一个指标:他引总引比,结果如表2所示.

从《学报》的总被引频次、自引频次和他引频次可以得到结论:

(1)总被引频次和他引频次稳步上升,这表明《学报》办刊质量逐步提高,发表的文章得到本学科作者的认可.

(2)自引频次比较少,他引总引比保持在96%以上,排除为了提高总被引频次,人为因素添加引文.

(3)由总被引频次、他引频次以及发文总量能计算期刊影响因子等重要评价指标.

3.4 发文总量

检索命令为:

YE=2009 and JN=广东商学院学报 (注:2009年当年《学报》总发文量)

YE=2011 and JN=广东商学院学报 (注:2010年当年《学报》总发文量)

YE=2010 and JN=广东商学院学报 (注:2011年当年《学报》总发文量)

检索结果包括了一些如“声明”、“主编的话”、“××××年总目录”等条目,不能算在发文量中,因此应该减去.检索结果如表2所示.

3.5 基金资助项目占全部发文总数的比例

3.5.1 《学报》发文的基金资助情况

基金资助项目文章占全部发文总数的比例,是为了统计期刊发表文章的档次.统计时分成三步走:第一步,检索近三年来发文总量;第二步,检索每年发文的基金数,计算三年总和;第三步,计算基金资助项目占全部发文总数的比例.

在表2中,已经完成第一步的检索.在检索各年度发文量的时候,由“YE=2009 and JN=广东商学院学报”得到2009年总发文量后,结合手工方法,点击“研究获得资助”栏目,在页面左方就显示了2009年度基金资助的名称和文章数目,2010、2011年以此类推,表3显示了2009~2011年广东商学院学报所刊发文章的基金资助情况.

表3 2009~2011年《学报》发文的基金资助情况

3.5.2 基金资助项目比

基金资助项目比=本年度发文中有基金资助项目的文章数/本年度发文总量.《学报》近3年基金资助项目比如表4所示.

表4 近三年《学报》基金资助项目比

分析:

(1)基金资助项目占比情况:有基金资助的文章比例还较低,2010年稍好点,达到32.4%.为了提高文章的档次,应进一步提高基金资助项目的文章所占的比例.

(2)国家级基金资助项目占比情况:2010年和2011年国家级基金项目较多,分别占了23.3%和20%.

3.6 所发表文章的学科类别及其被引用分析

在检索各年度的发文量的时候,由“YE=2009 and JN=广东商学院学报”得到2009年总发文量后,结合手工方法,点击“学科类别”,按中国知网的分类,2009年广东商学院学报发文量前9名学科类别如表5所示.2010年和2011年的排名也可按同样的办法得到.

表5 2009~2011年《学报》发表文章的学科类别排名(前9名)

从表5可以看出,《广东商学院学报》近几年来的栏目稳中有变,选题策划向宏观经济管理、企业经济、贸易经济和金融方向发展,更突出其“商”的定义.

在检索各年度引文量的时候,由“YE=2009 and RF=广东商学院学报”得到2009年总引文量后,结合手工方法,点击“学科类别”,按中国知网的分类,2009年广东商学院学报引文量前9名学科类别如表6所示.2010年和2011年的排名也按同样的办法得到.

表6 2009-2011年引用《学报》的文章所属的学科类别排名(前9名)

从表6中看到,“经济体制改革”学科引用《学报》的篇数近2年来稳排第2名(2011)、第3名(2010),与《学报》刊发文章的篇数名次不同,应该增加“经济体制改革”的发文量.“贸易经济”的发文量排名与其所引用的篇数排名有差距,应该适当减少“贸易经济”发文量的比重.可适当增加“金融”和“企业经济”栏目发文量比重,并且将“宏观经济管理”、“经济体制改革”、“金融”和“企业经济”作为主打栏目.

4 结论

对《学报》从2009~2011年的各项评价指标分析结果表明:

(1)三年来《学报》在“经济与管理科学”学科里总被引和他引总篇数稳中有升,并且他引占总被引比例为分别为97.7%、96%、97.3%,这表明《学报》在同行刊物中有一定的影响力;

(2)《学报》的基金资助项目占比分别是18.8%、32.4%、28.5%,虽然基金资助项目占比不能完全反映发表文章的质量,但在一定程度上能反映作者的科研情况和文章档次,因此《学报》的基金资助项目占比有待提高;

(3)栏目建设要与学科引文排名相结合,与学科引文排名相比,《学报》可适当增加“经济体制改革”、“金融”和“企业经济”相关栏目发文量,减少“贸易经济”栏目的发文量.

[1]卢小宾,李景峰.信息检索[M].北京:科学出版社,2003:1-5.

[2]中国知网.专业检索表达式语法[EB/OL].[2012-09-07].http://epub.cnki.net/grid2008/help/jiansuoyufa/help_yufa.htm.

[3]张莉.文献检索方式的发展与提高期刊影响力[J].编辑学报,2005(2):124-125.

[4]万锦堃,刘学东,杨毅,等.中国学术期刊综合引证报告[M].北京:科学出版社.2008:5-6.

[5]苏新宁,邓三鸿,韩新民,等.中国人文社会科学期刊学术影响力报告[M].2009版.北京:中国社会科学出版社,2009:1-8.

猜你喜欢
运算符商学院发文
老祖传授基本运算符
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
巴黎高等商学院荣登《金融时报》欧洲商学院排名榜首
用手机插头的思路学习布尔运算符
商学院撞上新媒体
湖南商学院学人简介八十二
“互联网+”与商学院教育
表达式求值及符号推导
C++中运算符的重载应用