姜鑫 马海群
〔摘 要〕本文以CSSCI收录的18种图书情报学期刊发表于2014年的4 407篇期刊论文作为数据来源,通过共词聚类分析、战略坐标分析、作者合作分析和作者-关键词耦合分析方法探讨了2014年我国图书情报学领域的研究进展。本文通过共词聚类分析和战略坐标分析确定了2014年我国图书情报学研究的17个重要主题及其演变趋势,通过作者合作分析确定了2014年我国图书情报学领域的科学合作状况及主要合作团体,通过作者-关键词耦合分析确定了高产作者的主要研究领域。
〔关键词〕图书情报学;研究进展;文献计量分析;共词分析;聚类分析;战略坐标图;作者合作;作者-关键词耦合分析;综述;述评
DOI:10.3969/j.issn.1008-0821.2016.04.032
〔中图分类号〕G252.8 〔文献标识码〕A 〔文章编号〕1008-0821(2016)04-0170-08
〔Abstract〕Based on 4407 articles published in 18 journals of Library and Information Science(LIS)in 2014,which were covered by the Chinese Social Science Citation Index(CSSCI),this paper discussed the research progress in LIS research in China with the methods of co-word analysis,cluster analysis,drawing strategic diagram,co-authorship and author-keyword coupling analysis.This paper determined 17 important research themes and their revolution trend in LIS research in China by using co-word clustering analysis and drawing strategic diagram,found status quo of scientific collaboration and main cooperative groups by analyzing co-authorship network,and determined prolific authors main research fields through author-keyword coupling analysis.
〔Key words〕library and information science(LIS);research progress;bibliometric analysis;co-word analysis;cluster analysis;strategic diagram;co-authorship;author-keyword coupling analysis;summary;review
图书情报学领域的众多学者历来非常重视学科的回顾和展望,也更加注重学科领域的研究热点与前沿演进的追踪与探测,以期能够深入地揭示学科发展的轨迹、特征和规律,并有助于科研人员更好地把握本学科的研究动态和发展趋势[1]。本文以2014年发表的CSSCI来源期刊论文中的作者和关键词两个特征项作为分析单元,综合运用共现、耦合、聚类等多种文献计量分析方法并辅以信息可视化软件工具,从主题分析和作者分析两个视角对2014年我国图书情报学领域的研究进展及发展趋势进行了系统的梳理。
1 数据来源
本文选取CSSCI(2014-2015)收录的18种图书情报学期刊发表于2014年的全部期刊论文作为数据来源。由于我国图书情报学领域的研究成果绝大多数是以期刊论文的形式首发在国内期刊上,并且本领域具有较高学术认可度和代表性的期刊论文大多发表于CSSCI来源期刊上,因此CSSCI来源期刊论文可以比较全面、完整地反映出我国图书情报学领域的研究动态。上述18种CSSCI来源期刊分别是:《中国图书馆学报》、《大学图书馆学报》、《国家图书馆学刊》、《图书情报工作》、《图书情报知识》、《情报资料工作》、《图书与情报》、《情报学报》、《情报科学》、《情报杂志》、《情报理论与实践》、《现代图书情报技术》、《图书馆工作与研究》、《图书馆学研究》、《图书馆论坛》、《图书馆建设》、《图书馆杂志》和《图书馆》。利用Note Express文献管理软件通过CNKI和万方数据两个数据库获取论文题录数据。删除通知、简讯、评论等不相关的非学术文献,共计得到了4 407篇我国图书情报学研究相关文献。
2 数据分析
下面分别以4 407篇文献的关键词和作者两个特征项作为分析单元,从主题分析和作者分析两个视角系统梳理2014年我国图书情报学领域的研究进展。
2.1 主题分析
下面以4 407篇文献的关键词作为分析单元,通过共词聚类分析和战略坐标分析两种研究方法,从研究主题的视角揭示2014年我国图书情报学研究的主题分布及发展状况。
2.1.1 共词聚类分析
在上述4 407篇文献中共计出现了17 677个关键词,从中选取词频≥22的高频关键词70个(见表1)。
通过VBA编程计算上述70个高频关键词在4 407篇文献中的共现频次,得到一个70×70的高频关键词共现矩阵Zij(Co-word Matrix),并将其导入社会网络分析软件Ucinet 6.2,然后通过Ucinet的绘图软件工具NetDraw直接展现其关键词之间的共现关系(见图1)。图中的节点大小代表关键词的点度中心性,连线的粗细代表关键词之间的共现频次。为了更清晰地展现出关键词之间的共现关系,图1只保留了关键词之间共现频次≥3的全部连线。
本研究采用系统聚类法对高频关键词相关矩阵进行聚类分析。将原始共词矩阵通过Salton指数法转换为相关矩阵(Correlation Matrix)。Salton指数法的计算公式是:S=Cij/(Ci×Cj)1/2,其中Ci、Cj分别表示关键词i和关键词j的词频,Cij表示关键词i与关键词j的共现频次。通过SPSS 21.0对高频关键词相关矩阵进行系统聚类,“聚类方法”选择“组间联结”,“度量标准”选择“平方Euclidean距离”,分析结果如图2所示。由图2可见,上述70个高频关键词可划分成17个聚类,分别对应着2014年我国图书情报学研究的17个重要主题(见表2)。
从高频关键词系统聚类分析结果来看,2014年我国图书馆情报学研究的重要主题包括:用户信息行为、文献计量分析、馆藏资源建设、信息资源整合与共享、关联数据、MOOCs/信息素养教育、图书馆学科服务/信息服务/知识服务、图书馆移动服务、科学数据管理(管护、策管)、机构知识库/开放存取、竞争情报、数据挖掘/专利分析、图书馆联盟/战略规划、图书馆阅读推广、微博舆情;此外,公共图书馆法人治理也是重要研究主题之一。其中,用户信息行为、图书馆移动服务、MOOCs、科学数据管理、机构知识库/开放存取、关联数据、知识服务、数据挖掘/专利分析、图书馆阅读推广、公共图书馆法人治理是热门主题与研究前沿,也是2015年我国图书情报学研究深化拓展的重点主题。接下来通过战略坐标分析探讨各研究主题的发展状况及演变趋势。
2.1.2 战略坐标分析
战略坐标图是基于研究主题或聚类基础上的一种研究方法,可以用来描述各研究主题的发展状况和演变趋势。战略坐标图以向心度为横坐标,以密度为纵坐标,以两者的中位数或均值为坐标原点,将研究主题簇表示在平面直角坐标系中(见图3)。密度指标反映了一个研究主题簇的内部聚合能力,向心度指标反映了一个主题簇与其他主题簇的连接能力。一个研究主题簇的密度指标越大,说明该研究主题簇的内部结构稳定性越高,其所代表的研究领域发展越成熟;一个研究主题簇的向心度越大,说明它与其他研究主题簇的连接能力越强,在整个研究领域中越处于中心地位[2]。
研究主题簇在战略坐标图中分布在4个象限,第Ⅰ象限的主题簇为“核心,成熟类”(Central and Developed),是学科领域研究的热点和重点,受到广泛关注,内部结构稳定;第Ⅱ象限的主题簇为“边缘,成熟类”(Peripheral and Developed),内部结构稳定,但与其他主题联系松散,可能被边缘化;第Ⅲ象限的主题簇为“边缘,不成熟类”(Peripheral and Undeveloped),内部结构松散,研究不成熟;第Ⅳ象限的主题簇为“核心,不成熟类”(Central and Undeveloped),也是学科领域研究和关注的活跃领域,但内部结构不稳定[3]。
本文采用的密度(Density)和向心度(Centrality)的计算方法如下:对于i≠j,Density=∑i,j∈ΦsEijn-1;Centrality=∑i∈Φs,j∈(Φ-Φs)Eij〖〗N-n;其中,Eij是包容系数,其计算公式为:Eij=C2ij/Ci·Cj,其中Ci、Cj分别表示关键词i和关键词j的词频,Cij表示关键词i与关键词j的共现频次;n是某一聚类中的关键词数目,N是整个共词网络中关键词的总数;Φs是指某一聚类,Φ是指整个共词网络[5]。根据图3所示的系统聚类分析所确定的17个聚类,计算其密度和向心度的均值分别为0.0661和0.0014,通过Excel散点图的形式绘制2014年我国图书情报学研究主题簇的战略坐标图(见图4)。
从图4所示的研究主题簇的战略坐标图来看,第Ⅰ象限中包括以下3个研究主题:3(文献计量分析)、5(信息资源整合与共享)和7(高校图书馆学科服务),这些研究主题的密度和向心度都比较高,密度高说明这些研究主题的内部联系紧密,向心度高说明它们与其余研究主题之间具有广泛联系,它们处于所有研究主题的核心位置,受到学者们的关注比较多,并且其研究状况也比较成熟。
第Ⅱ象限中包括以下5个研究主题:1(用户信息行为)、2(图书馆学/情报学比较研究)、4(馆藏资源建设)、16(微博舆情)和17(知识管理),这些研究主题的密度较高但向心度较低,处于所有研究主题的边缘位置,但其研究状况还是比较成熟的,作为相对独立的研究主题目前表现不活跃;其中有3个研究主题涉及交叉学科研究,分别是:1(用户信息行为)、16(微博舆情)和17(知识管理)。
第Ⅲ象限中包括以下5个研究主题:8(公共图书馆阅读服务)、10(科学数据管理)、11(知识服务)、13(情报分析)和14(图书馆联盟),这些研究主题的密度和向心度都比较低,说明这些研究主题的内部联系松散,与其余研究主题之间的联系也不够紧密,它们处于所有研究主题的边缘位置,并且其研究状况也不够成熟,这些主题还有待于进一步研究;其中主题10(科学数据管理)是2014年我国图书情报学研究的新兴热点与研究前沿。
第Ⅳ象限中包括以下4个研究主题:6(信息素养教育)、9(图书馆移动服务)、12(数字图书馆信息服务)和15(图书馆阅读推广),这些研究主题的密度较低但向心度较高,说明它们虽处于所有研究主题的核心位置,但其研究状况目前尚不成熟,还具有较大的发展空间;与其余研究主题之间的联系也比较广泛,但由于其内部联系松散、不稳定,在后续发展过程中容易分解或演化为相关主题;其中有3个研究主题在2014年引起了较为广泛的研究关注,分别是:6(信息素养教育)、9(图书馆移动服务)和15(图书馆阅读推广)。
2.2 作者分析
下面以4 407篇文献的作者作为分析单元,通过作者合作分析和作者-关键词耦合分析两种研究方法,从研究人员的视角揭示2014年我国图书情报学领域的主要研究团体及其重要研究领域。
2.2.1 作者合作分析
在上述4 407篇文献中共计出现了8 815位作者,如果仅统计前三署名的作者的发文数,可以得到发文数≥5的205位高产作者,其中发文数≥7的85位高产作者如表3所示。
在全部4 407篇文献中合著论文共计2 643篇,其中,2人合著论文共计1 432篇,3人合著论文共计808篇,4人合著论文共计294篇,5人及5人以上合著论文共计109篇。由此可见,2014年我国图书情报学领域的科学合作比较广泛,并已成为影响科学生产力的重要因素。如果统计全部署名的作者的发文数,则可得到发文数≥5的230位高产作者,通过VBA编程构建230位高产作者之间的合作关系矩阵,再利用NetDraw软件工具直观展现高产作者之间的合作关系(见图5)。图5中的节点大小代表高产作者的点度中心性,连线的粗细代表高产作者之间的合作频次,并且已删去与其他作者无合作关系的孤立节点。
在全部230位高产作者中合作频次为1的作者对共计83对,合作频次为2的作者对共计26对,合作频次为3的作者对共计21对,合作频次为4的作者对共计19对,合作频次为5的作者对共计23对,合作频次≥6的作者对包括邱均平-余厚强、陈雅-孙宁、李纲-毛进、邱均平-刘国徽、邱均平-吕红、李纲-叶光辉、谢阳群-王文韬、李长玲-魏绪秋、郑建明-徐文哲、刘春年-张曼、李湘东-黄莉。可见,2014年我国图书情报学领域高产作者之间的科学合作更加广泛,并且以师生之间、同事之间、校友之间的合作关系为主。由图5可见,高产作者构成的合作团体中有较多仅由2~3位成员构成的小团体。从图5中还可以发现几个成员人数较多的合作团体,这些合作团体主要来自于武汉大学、南京大学和中科院系统,其中有两个合作关系较为密切的合作团体:以武汉大学邱均平教授为核心的合作团体、以国家科学图书馆张智雄教授为核心的合作团体。
2.2.2 作者-关键词耦合分析
作者-关键词耦合分析能够揭示出作者和关键词这两个重要特征项的关联关系。通过VBA编程构建230位高产作者与85个高频关键词之间的耦合关系矩阵,再利用NetDraw软件工具直观展现作者-关键词耦合关系网络(见图6)。图中的圆形节点●代表作者,方形节点■代表关键词,节点大小代表作者或关键词的点度中心性,连线的粗细代表作者-关键词的耦合强度。为了更清晰地展现出作者-关键词的耦合关系,图6只保留了作者-关键词的耦合强度≥3的全部连线。由图6可见,通过绘制作者-关键词2-模网络的可视化图,能够直观揭示作者的主要研究领域,反映出作者研究兴趣的多样性,并能显示出不同作者的相同研究领域,对学科领域结构的解读具有显性、直观的特点[6]。
图6清楚地展示出高产作者所涉及的主要研究领域,主要包括主题3:文献计量分析(文献计量学、社会网络分析、共词分析、知识图谱、可视化)、主题5:信息资源整合与共享(数字资源、资源整合、资源共享)、主题8:公共图书馆阅读服务(公共图书馆、图书馆服务)、主题9:图书馆移动服务(移动图书馆、移动服务、微信、服务质量)、主题10:科学数据管理(科学数据、机构知识库、开放存取、元数据)、主题11:知识服务(知识服务、知识组织)、主题13:情报分析(大数据、竞争情报、专利分析)、主题14:图书馆联盟(图书馆联盟、指标体系)、主题15:图书馆阅读推广(图书馆、著作权、社会化媒体)、主题16:微博舆情(微博、网络舆情、突发事件)。上述10个研究主题也是2014年我国图书情报领域备受关注的重点研究领域。
图6能够直观地揭示出高产作者的主要研究领域,如与邱均平教授直接相连的关键词有:文献计量学、知识图谱、可视化、社会网络分析、情报学和数字图书馆,表明邱均平教授涉及的主要研究领域是主题3:文献计量分析(文献计量学、知识图谱、可视化、社会网络分析);与黄如花教授直接相连的关键词有:MOOCs、信息检索、科学数据和元数据,表明黄如花教授涉及的主要研究领域包括主题6:信息素养教育(MOOCs、信息检索)和主题10:科学数据管理(科学数据、元数据);与施国洪教授直接相连的关键词有:移动图书馆、公共图书馆、移动服务和服务质量,表明施国洪教授涉及的主要研究领域是主题9:图书馆移动服务(移动图书馆、移动服务、服务质量)。
图6也可直观地展现出高产作者共同的研究领域,如涉及“科学数据”研究的高产作者包括:黄如花、司莉、邱春艳、李鑫和王晴;涉及“机构知识库”研究的高产作者包括:顾立平、聂华、姚晓娜、祝忠明和张旺强;涉及“知识服务”研究的高产作者包括:苏新宁、蒋勋、邓仲华和徐绪堪;涉及“移动图书馆”研究的高产作者包括:施国洪、夏前龙和过仕明;涉及“网络舆情”研究的高产作者包括:朱庆华、陈福集、陆和建、曾润喜、孙宁、陈雅和孙霄凌。
3 结 语
本文以18种图书情报学领域CSSCI来源期刊发表于2014年的期刊文献作为数据来源,以作者和关键词这两个重要特征项的共现、耦合、聚类等多种分析方法作为研究方法,从主题分析和作者分析两个视角探讨了2014年我国图书情报学领域的研究进展。通过共词聚类分析确定了2014年我国图书情报学研究的17个重要主题,通过绘制战略坐标图分析了17个重要研究主题的发展状况及其演变趋势,通过作者合作分析确定了2014年我国图书情报学领域的科学合作状况及主要合作团体,通过作者-关键词耦合分析揭示了高产作者的主要研究领域以及高产作者的共同研究领域。本文旨在为图书情报学科的科研人员进行科研选题、选择科研合作对象提供有效指导;也为本学科的科研管理者准确把握学科发展方向,预测新的学科生长点,正确制定学科发展政策,有效规避科研投资风险提供参考。
本文的研究不足及后续研究需关注的重点主要体现于以下两个方面:①由于本文的数据源仅限于期刊论文,没有统计学术专著、研究报告等其他类型的文献,此外由于共词聚类分析方法本身存在一定缺欠,因而对2014年我国图书情报学研究的主题分析难免有片面和疏漏之处;②由于本文仅以作者和关键词两个特征项作为分析单元,未能全面反映2014年我国图书情报学领域的研究状况,后续研究需考虑增加“机构”这一特征项作为分析单元,通过机构合作分析和机构-关键词耦合分析两种方法,揭示2014年我国图书情报领域的机构合作状况及主要研究机构的重要研究主题。笔者在后续研究中将致力于改进上述两个不足之处,以期更客观全面地揭示我国图书情报领域的研究进展。
参考文献
[1]邱均平,温芳芳.近五年来图书情报学研究热点与前沿的可视化分析——基于13种高影响力外文源刊的计量研究[J].中国图书馆学报,2011,37(2):51-60.
[2]韩红旗,安小米.科技论文关键词的战略图分析[J].情报理论与实践,2012,35(9):86-90.
[3]钟伟金,李佳.共词分析法研究(二)——类团分析[J].情报杂志,2008,(6):141-143.
[4]Callon M,Courtial J P,Laville F.Co-word analysis as a tool for describing the network of interactions between basic and technological research:The case of polymer chemistry[J].Scientometrics,1991,22(1):155-205.
[5]Bangrae Lee,Yong-Il Jeong.Mapping Koreas national R&D domain of robot technology by using the co-word analysis[J].Scientometrics,2008,77(1):3-19.
[6]孙海生.作者关键词共现网络及实证研究[J].情报杂志,2012,31(9):63-67.
(本文责任编辑:马 卓)