王旭 柯凯艳
摘 要 论文选取CNKI期刊收录的近15年我国图书情报领域信息检索相关性研究的论文,基于文献计量学对收集的数据进行了量化分析,并运用CiteSpace软件和Ucinet软件绘制了科学知识图谱。同时,论文分别从发文时间、作者、机构和研究热点(关键词)四个方面对该领域研究进展进行了详细分析和总结,进一步介绍了其知识结构与发展趋势,并为今后该领域研究提出了建议。
关键词 图书馆学 情报学 信息检索相关性
分类号 G250.252
DOI 10.16810/j.cnki.1672-514X.2016.08.020
Analysis on Recent 15 Years Researches of Information Retrieval Relevance in Library and Information Science in China
Wang Xu,Ke Kaiyan
Abstract This paper selects 15 years articles related to information retrieval relevance in library and information science of China from CNKI database. It analyzes the collected data quantitatively based on bibliometrics and uses the visualization software (CiteSpace and Ucinet) to draw scientific knowledge mapping. Meanwhile, it makes a detailed analysis and summary of research progress in this field from four aspects including dispatch time, the author, institution distribution and research focuses, then introduces its' knowledge structure and development trend. Lastly, it proposes advice for future study in this field.
Keywords Library science. Information science. Information retrieval relevance.
信息检索相关性研究距今已有80多年历史,关于“相关性既是信息检索的基本问题,也是情报学的基础性概念”,国内外图书情报领域主流学者已达成共识[1-2],且在相关性研究上取得了一定的成果。考虑到目前图书情报领域关于信息检索相关性研究的内容较少,同时也为了解国内图书情报领域信息检索相关性研究的历史、进展,本文选用中国知网数据库,利用CiteSpace、Ucinet等软件绘制图书情报领域信息检索相关性主题词文献的科学知识图谱,并对近15年国内该领域的研究现状进行了系统的梳理和分析,试图发现现有研究的不足以及未来研究趋势,期望为该领域进一步研究提供借鉴。
1 研究方法
本文采用文献计量方法分析与解读图书情报领域信息检索相关性研究论文,借助文献的内、外部特征,采用统计学方法,通过绘制科学知识图谱来揭示该领域的知识结构和知识特征,以及研究的前沿领域。
1.1 数据收集
在中国知网(CNKI)检索界面,运用检索式主题=(信息检索and相关性)or(检索and相关性)(精确匹配)检索2001年至2015年我国图书情报领域信息检索相关性研究论文,共得到191篇文献,经去重、整理后为190篇。
1.2 可视化及统计工具
本文进行可视化分析的工具是CiteSpace3.8R5版本和Ucinet6.212版本。CiteSpace 在Java语言环境下运行,由陈超美教授开发,在文献引文网络分析研究领域被广泛应用;Ucinet软件由Linton Freeman编写,在社会网络分析中被广泛应用。为了呈现图书情报领域信息检索相关性研究的时间分布趋势,本文利用Excel统计2001—2015年的发文数量并绘制了文献年代分布趋势图谱。同时,借助CiteSpace、Ucinet绘制科学知识图谱,以可视化效果对图书情报领域信息检索相关性研究的分布机构以及关键词等进行分析。
2 我国图书情报领域信息检索相关性研究的时空知识图谱及其分析
2.1 年代分布分析
运用文献计量分析方法,从文献历时性上可以分析出学科的发展趋势,发文量的多少代表了在一定时期内该领域研究的冷热程度。利用Excel绘制年代分布情况(见图1),发现关于信息检索相关性的研究在2003年后呈现明显的上升趋势,2011年达到研究的高峰期,2012~2013年发文量有所下降,2014年和2015年稍有回升。近几年图情领域有关信息检索相关性研究热度下降的原因可能是在信息检索技术突破方面遇到了瓶颈。目前该领域研究已积累了大量的理论观点,今后在实证和技术方面的研究有待提高。
2.2 高产作者知识图谱
发文量可以用来衡量研究者学术水平和科研能力,高产作者一定程度上影响着某一学科的发展、演变方向,对高产作者的研究具有重要意义。根据普莱斯高产作者计算公式: (其中Nmax为最高产作者论文数)统计得知,成颖为最高产作者(8篇),则计算M值为2.11,M取邻近最大整数为3,发文≥3篇的作者称为高产作者(见表1)。
由表1可知,高产作者中有南京大学信息管理系的成颖(8篇),南开大学信息管理系的王知津(6篇),南京大学信息管理系的孙建军(6篇)等。由此可知,我国图书情报领域信息检索相关性研究的核心群体仍是高校专业教师和图书馆员,他们拥有较强的科研实力和科研队伍以及本专业深厚的研究底蕴,是国内图情领域信息检索相关性研究的核心力量。而公共图书馆研究人员较少,应鼓励专业人员加入公共图书馆,进行更好的理论分析及实践研究[3]。
2.3 研究机构知识图谱
研究机构是从事一项或者多项研究的专门性组织,在一定程度上可以理解为学术群体的代名词。机构合作有助于实现科研资源的优化配置,提高科研生产力。运用SPSS软件统计国内图书情报领域信息检索相关性研究2001年到2015年期间载文的机构分布,共计有160家国内学术机构(包括一级单位和二级单位)参与论文的创作,其中25家机构发文≥2篇(由于篇幅有限,统计图示结果未列出),排名前25位的核心机构累计发文91篇,约占全部发文的48%,是该领域研究的主要阵地。
采用CiteSpaceIII软件,时间选择为2001~2015年,时间分段单位(Slice Length)为1年,选择网络节点为机构(Institution),采用最小生成树算法,经调试得到发文机构知识图谱(见图2)。图谱中有33个节点,161条连线,网络密度为0.0026,可知各机构合作力度不大,跨地域、跨机构科研合作较少,有待加强。图谱显示,高校图书馆和高校信息管理院系是图书情报领域信息检索相关性研究的主要阵地,是最活跃的系统,贡献最大。这与高校具有浓厚的学术氛围,有一批较高水平和较高科研能力的研究者有关。
2.4 关键词知识图谱
根据文献计量学中的齐普夫定律可知:通过统计分析某一学科中关键词出现频次及其相互关系,可以对该领域的知识结构演变状况、研究热点分布情况做出清晰的揭示。
利用CiteSpaceIII软件,通过设定适当阈值,以一年为年限(Year Per Slice=1),节点选择关键词(Keyword),采用寻径网络算法剪枝修理后,可得到国内图书情报领域信息检索相关性研究关键词时序知识图谱(见图3),其下方年代对应节点年代环,在修枝后仅显示部分热点关键词。同时,利用Ucinet软件绘制出图书情报领域信息检索相关性研究关键词共现知识图谱(见图4)。
在国外,有关信息检索相关性研究起步远远早于国内,研究成果较国内丰富,研究体系较为完整。计算机科学界和图书情报学界构成国外信息检索相关性研究的两大学派,在计算机科学界,相关研究者被称为系统中心派,即重点在于检索系统自身的内部运行机制研究[4];在图书情报学界,相关研究者被称为用户中心派,即重点在于用户以及用户与系统之间的交互研究[5-6]。国内学者在借鉴国外信息检索相关性研究成果的基础上进行研究,基于相关性的动态性、多维性、可认知性和可测度性观点,目前,国内学者也普遍认同上述两种学派。
基于国内外有关信息检索相关性研究的两大研究学派类型,结合图3、图4对190篇文献进行梳理后,可以从计算机检索系统自身的内部运行机制研究和用户以及用户与系统之间的交互研究两大视角,总结出典型研究者对我国图书情报领域信息检索相关性研究的进展及概况,如表2、表3所示。
3 结语
本文以近15年(2001年~2015年)CNKI中有关图书情报领域信息检索相关性研究的论文为研究对象,从文献计量学的角度,利用知识图谱工具剖析了我国图书情报领域信息检索相关性研究现状,着重分析了文献发表时间、高产作者、研究机构、关键词等方面的内容,经梳理总结,得出以下几个方面的结论。
(1)从国内图情领域信息检索相关性研究的发文数量时间分布来看,在2003年后呈现明显的上升趋势,2011年达到研究的高峰期,2012~2013年发文量有所下降,2014年和2015年稍有回升。另外,近几年图情领域有关信息检索相关性研究热度下降的原因可能是在信息检索技术突破方面遇到了瓶颈。目前该领域研究已结积累了大量的理论观点,今后在实证和技术方面的研究有待提高。
(2)从国内图情领域信息检索相关性研究的高产作者及机构分布来看,高校图书馆员和高校信息管理系是该领域研究的主要阵地,拥有国内该领域信息检索相关性研究的核心群体。而公共图书馆相关研究人员较少,因此,还需要更多的专业人员加入公共图书馆,给予更好的理论分析及实践研究。同时,本研究领域迫切希望能够涌现出领军人物和核心研究团体来制定大科学时代的研究战略,组织本领域的协作研究,积极带领广大研究者开拓更广泛的研究领域和做出更专深的探索[6]。
(3)从国内图情领域信息检索相关性研究热点来看,本文基于国内外有关信息检索相关性研究的两大研究学派类型,分别从计算机索系统自身的内部运行机制研究和用户以及用户与系统之间的交互研究两大视角进行了梳理和总结。研究发现,国内在一定程度上取得了骄人的成绩,但主要集中在信息检索相关性研究的理论层面探讨上,而在实证方面的研究还有待加强。面对日益增长的海量网络信息,可以满足用户需求的信息检索相关性越来越重要,因此,以计算机检索系统为中心的设计思想转变为系统与用户并重的设计思想,重视用户友好性,是提高信息检索相关性的解决方案。相信未来国内图书情报领域信息检索相关性研究会不断深入,有所突破。
参考文献:
[ 1 ] SARACEVIC T. Information science[J].Journal of the American Society for Information Science,1999(12):1051-1063.
[ 2 ] 马费成.论情报学的基本原理及理论体系构建[J].情报学报,2007(26):3-13.
[ 3 ] 王旭.基于文献计量的国内大数据研究现状分析[J].农业图书情报学刊,2016(4):52-56.
[ 4 ] Bo-Y KANG, Dae-Won KIM, Sang-Jo LEE. Semantic indexing and fuzzy relevance model in information retrieval[J].Studies in Computational Intelligence (SCI),2005(2):49-60.
[ 5 ] HARTER S P. Psychological relevance and informationscience[J].Journal of the American Society for Information Science,1992(43):602-615.
[ 6 ] SPINK A, GREISDORF H, BATEMAN J. From highly relevant to not relevant:Examining different regions of relevance[J].Information Processing & Management,1998(34):599-621.
[ 7 ] MIZZARO S. Relevance: The whole history[J].Journal of the American Society for Information Science,1996(9):810-832.
[ 8 ] 王知津,卞丹,王文爽.信息检索中“相关性”的概念、类型及其不确定性[J].山东图书馆刊,2011(1):1-5.
[ 9 ] 成全,司辉.信息检索相关性评价及其改善策略研究[J].情报杂志,2008(2):129-133.
[10] 韩毅,邓小昭,刘丽,等.信息检索领域相关定义的演化及其启示[J].情报理论与实践,2006(3):270-273.
[11] 赖茂生,屈鹏.相关性基础理论及其在检索建模中的作用研究[J].情报理论与实践,2008(6):801-805.
[12] 黄丽红.信息检索中“相关性”的探究[J].图书馆学研究,2006(2):65-67.
[13] 成颖,孙建军,巢乃鹏.信息检索中的相关性模型[J].图书情报工作,2004(12):46-50.
[14] 王雅坤,成全.信息检索相关性研究综述及发展趋势[J].图书与情报,2012(1):88-94.
[15] 朱涵.BIR模型在提高用户检索相关性中的应用[J].情报探索,2007(4):53-55.
[16] 成颖.基于相关性判据的学术信息检索系统成功模型建构[J].现代图书情报技术,2011(9):46-53.
[17] 杨建林,邓三鸿.信息检索中相关性的维度与度量[J].情报理论与实践,2005(6):27-30.
[18] 吴丽华,罗云锋,张宏斌.信息检索模型及相关性算法的研究[J].情报杂志,2006(12):25-27.
[19] 周瑛,方宏彬,张持健.模糊聚类在信息检索中的应用[J].微机发展,2005(3):107-109.
[20] 刘铭,刘秉权,刘远超.面向信息检索的快速聚类算法[J].计算机研究与发展,2013(7):1452-1463.
[21] 何绍华,宫兆晖.基于语义网的网络信息检索相关性研究[J].情报杂志,2007(12):120-123.
[22] 成全,司辉.信息检索相关性评价及其改善策略研究[J].情报杂志,2008(2):129-133.
[23] 夏咏梅.浅析信息检索评价中“相关性”问题的内涵[J].情报杂志,2003(6):52-53.
[24] 杨锐.次序效应对用户判断检索结果相关性的影响[J].情报探索,2011(5):5-8.
[25] 成颖.信息检索相关性判据及应用研究[D].南京:南京大学,2011.
[26] 程娟.基于用户信息检索相关性反馈模型的研究[J].图书馆杂志,2008(4):52-55.
[27] 李亚琴,孙建军,杨月全,等.基于信息检索用户的相关性行为研究进展[J].情报科学,2014(5):157-160.
王 旭 黑龙江大学信息管理学院硕士研究生。黑龙江哈尔滨,150080。
柯凯艳 云南大学历史与档案学院硕士研究生。云南昆明,650000。
(收稿日期:2016-06-01 编校:陈安琪)