黄 东
(菏泽市图书馆,山东 菏泽274000)
随着大数据时代的来临,图书情报领域的研究主题发生了一定变化,为了从宏观上及时了解国际图书情报领域的发展状况、研究主题发展方向,笔者对该领域国内外权威期刊文献进行梳理,采用文献计量方法分析已有研究成果,总结热门研究主题,以便为我国图书情报领域后续研究提供一些参考。
关键词是文章核心内容的提炼与浓缩[1],可在较大程度上反映文章的研究重点,通过统计某一领域的高频关键词,并以此构建共词网络图谱及聚类分析,可反映此领域的研究重点及热点。因此,笔者在分析图书情报领域研究主题时,选取Web of Science核心合集为数据源,检索近五年有关此领域的文章,基于领域科研文献题录数据构建高频关键词共词网络,并在共词网络基础上进行高频关键词可视化分析与文献聚类分析。
为全面系统获得该研究领域的发展状况,笔者以Web of Science核心合集为数据源进行了相关文献检索。在“高级检索”下将检索式设置为“WC=Information Science&Library Science”;语种:(English);文献类型:(Article);检索时间跨度设置为2016—2020年;索 引=SCI-EXPANDED、SSCI、A&HCI、CPCI-S、CPCI-SSH、ESCI、CCR-EXPANDE;检索时间为2021年3月5日,共计检索得到28538篇文献。
在检索得到文献题录数据的基础上,使用共词分析软件Bibexcel抽取关键词,参考Donohue[2]提出的高低频词分界公式:T=(-1+1+8*I1)/2划分高频词与低频词,其中T表示词频分界值,I1表示频次为1的关键词数量。经过关键词抽取后共得到作者关键词53790个,累计出现频次173760,其中频次为1的关键词共41071个。使用以上公式计算可得T=286,此时符合条件的关键词仅11个,词频数量较少,无法据此进行可视化知识图谱分析。因此,根据关键词的频次排序,取30次以上的466个关键词为高频关键词,它们的累计出现频次为34772,占所有关键词出现频次的20%。在词频统计的基础上进行数据清洗:同义词合并如“Academic libraries”“Academic library”“university library”仅保留“Academic libraries”“Bibliometrics”“Bibliometric analysis”仅保留“Bibliometrics”等,去除无分析意义的词汇如“classification”“review”“Usability”“Learning”等,去除各个国家词汇如“China”“Ghana”“Europe”“North America”等,最终共得到346个高频关键词,以此进行后续的词频统计、可视化分析及聚类分析。
笔者在此列举出频次大于100的57个关键词,具体见表1。
通过表1可知,“Academic libraries(高校图书馆)”“social media(社交媒体)”“Qualitative research(定性研究)”“Bibliometrics(文献计量学)”“Citation analysis(引文分析)”依次位于高频关键词的前5位,频次均超过700,且数量远高于其他关键词。其中,“高校图书馆”频次最高,表明其是图书情报领域研究的重点与热点,其作为图书馆系统的重要组成部分,发挥着与公共图书馆同样重要的作用,承担着为在校师生提供资源服务、空间服务、科技查新、情报咨询、论文写作培训等多项职能;在图书情报领域,“social media(社交媒体)”常被作为重要的数据来源,研究者通过技术手段收集某一类别的社交媒体数据,挖掘数据之间的关联,以支撑研究结论或预测事件的发展趋势等。“Qualitative research(定性研究)”“Bibliometrics(文献计量学)”“Citation analysis(引文分析)”均是图书情报领域常用的研究方法,虽然数学方法、统计学方法、关联性分析等定量分析方法在相关研究中所占比例不断提高,但观察法、访谈法、田野调查法、理性思辨法等定性研究方法依然是图书情报领域常用的研究方法。“Bibliometrics(文献计量学)”起源于情报学领域,于1969年由英国情报学学家阿伦·普理查德[3]首次提出,标志着文献计量学正式诞生,通过应用数学与统计学知识,以定量方式分析一切知识载体,其中,“Citation analysis(引文分析)”是计量分析法中应用最广泛的一种,1956年普赖斯发表的《科学论文的网络》[4]为引文分析奠定了理论基础,其通过分析科学期刊、论文、著者、机构等之间的引用与被引用关系,反映某一学科的知识结构及科学交流模式,经过多年发展,计量分析法已在生物学、金融学等多个学科得到广泛应用,较大程度上提高了图书情报学科的社会价值。
表1 图书情报领域高频关键词
此外,“Knowledge management(知识管理)”“information literacy(信息素养)”的频次也较高,知识管理作为知识经济时代的产物,已成为一种新的管理理念,“知识”作为“信息”的下位类概念,是信息深加工的成果,知识管理与信息管理具有天然联系,因此,自知识管理出现以来就一直受到图书情报界的关注;“information literacy(信息素养)”包括文化素养、信息意识、信息技能3个层面,指能够自觉判断自身何时需要何种信息,并具备一定的信息技能获取所需信息的能力,图书情报学作为以“信息”为主要分析对象的学科,一直将信息素养作为研究重点。
对高频关键词的词频统计仅能展示图书情报领域研究几大主题,无法体现各高频关键词之间的内在联系,因此,笔者基于抽取的346个高频关键词,使用VOSviewer构建高频关键词共词网络,得到如下共词网络图谱,共词网络图谱见图1。
图1 图书情报领域高频关键词共词网络
共词网络图谱中,节点代表关键词,节点大小表示关键词的总出现次数,节点越大代表出现次数越多,此关键词的影响力就越强;节点之间的连线代表关键词之间的共现关系,连线越粗表示两关键词的共现次数越多,联系越紧密。图1中“Academic libraries(高校图书馆)”“information literacy(信息素养)”“social media(社交媒体)”“knowledge management(知识管理)”“bibliometrics(文献计量学)”这些关键词的节点较大,说明与之相关的研究较多,是图书情报学领域关注的重点。
“Academic libraries(高校图书馆)”与“information literacy(信息素养)”“library instruction(图书馆指导)”“Reference services(参考服务)”“scholarly communication(学术交流)”“open access(开放获取)”“social media(社交媒体)”“knowledge management(知识管理)”“higher education(高等教育)”等词之间的连线较粗,说明“Academic libraries(高校图书馆)”与以上词汇共同出现的次数较多。高校图书馆与以上词汇的高关联性,主要由高校图书馆承担的职能决定。首先,高校图书馆作为高校重要的文化服务高地,承担着借阅指导、参考咨询、科研培训等职能,师生多样化、个性化的信息需求,促使图书馆不断改变服务思路,逐步由传统的被动型信息服务向主动型知识服务转变,作为对信息进行深加工的知识管理,理所当然成为了图书馆实现精细化服务的必备手段。其次,高校图书馆因其师资优势、科研优势承担着为高校搭建学术交流平台的职能。美国大学与研究图书馆协会[5]提出“学术交流是一个提供研究和创作学术作品、衡量学术价值、传播到学术界进行学术研究的共享系统”。开放获取作为学术交流的新发展趋势,使高校图书馆不断探索如何转变其现有服务模式,以更好地促进信息交流及信息共享。最后,社交媒体作为图书馆与读者互动的主要媒介,其数据可在一定程度上作为评价图书馆服务水平的参考。
“social media(社交媒体)”与“knowledge management(知识管理)”“bibliometrics(文献计量学)”“scholarly communication(学术交流)”“sentiment analysis(情感分析)”“natural language processing(自然语言处理)”“machine learning(机器学习)”“text mining(文本挖掘)”等词之间的连线较粗。社交媒体作为当今社会人与人之间交流的主要工具,同时也是各类非正式学术交流的主要平台,可为图书情报领域的知识管理、文献计量分析、情感分析等研究提供数据来源,研究者借助文本挖掘、自然语言处理、机器学习、深度学习等数据挖掘工具挖掘所需数据,再进一步借助计量分析工具、情感分析工具进行数据加工,以实现复杂数据的计量分析及情感分析。
此外,“bibliometrics(文献计量学)”与“citation analysis(引文分析)”“open access(开放获取)”,“information literacy(信息素养)”与“library instruction(图书馆指导)”,“open access(开放获取)”与“scholarly communication(学术交流)”之间的连线也较粗,说明上述各个词汇之间也常共同出现。
在统计图书情报领域高频关键词,并进行高频关键词可视化分析的基础上,为了更好地理解各关键词之间的共现关系,在高频关键词网络图谱的基础上聚类得到以下7个类群,通过分别检索每个聚类下的文章以总结每个类群的研究主题。
2.3.1 聚类一:以图书馆服务、用户信息需求、信息素养、图书情报学教育研究为主
聚类一共89个词汇,主题集中在图书馆服务、用户信息需求、信息素养、图书情报教育4个方面。有关图书馆服务的研究主要有两个研究角度:首先,从图书馆角度出发,通过案例研究分析某一图书馆的服务现状、服务中存在的问题、特色服务、创新性的技术应用。如研究针对视障用户、孤独症用户[6]、国际学生、具有金融背景的用户等特殊群体提供的专门服务;采取内容分析法、问卷调查法、访谈法、数学评估模型等方法评估图书馆现有服务水平、内部管理等;通过问卷调查分析大学图书馆的知识管理水平[7],通过访谈法分析公共图书馆系统利用率低的原因[8]等。其次,从图书馆馆员角度出发,针对馆员的再教育、服务水平评估、绩效考核分析以及馆员在学术交流、资源利用、辅助教学等方面的价值研究,如高校图书馆馆员借助图书馆平台协助高校开展远程教育[9]。
针对用户信息需求的研究主要有4类:影响用户信息需求的因素、信息获取行为、信息需求模型构建、用户信息需求满意度研究。
如社会环境、教育背景、收入水平等均会影响用户的信息需求;微博、微信等新媒体拓宽了用户信息获取渠道,使用户不再仅依靠传统的人际交往获取信息;在构建用户信息需求模型时更注重反馈环节及模型的自我调节功能;关于信息需求满意度的研究以案例分析为主,调研用户对政务网站、高校图书馆、公共图书馆的信息提供行为满意度。
信息素养是公众对信息社会的适应能力,包括信息意识、信息能力、信息应用[10]。图书情报界对信息素养的研究集中于两个方面:一是关于信息素养教育与信息素养能力评价的案例研究,如将信息素养类课程纳入护理学教育中,以培养护理人员利用信息的能力[11],分析评价一所大学信息科学系学生的信息素养能力[12]。二是探讨如何在学校教育、日常工作中提高信息素养,如设置信息素养实践课程、在工作中进行专门培训等。图书情报学教育研究主要通过案例分析的形式梳理高校相关学科的课程设置、课时分配、实习项目,其中高校主要来源于iSchool联盟。
2.3.2 聚类二:以知识管理研究为主
聚类二共71个词汇,聚类六共37个词汇,这两个聚类的研究主题较为分散,既有知识管理相关研究,也有电子商务、社会网络分析、用户信息需求、健康信息学、信息管理在医疗领域的应用等主题。与知识管理相关的研究主要集中于以下两个方面:一是图书馆与信息服务机构如何借助知识管理理论进行知识服务,如通过知识挖掘、知识组织发现隐形知识,以提高信息价值、服务用户;二是知识管理理论在开展竞争情报活动中的应用,如以知识管理为基础构建竞争情报模型和平台,加强大数据环境下的竞争情报挖掘、分析、整合。
2.3.3 聚类三、聚类五:以“图书情报理论+新兴技术”共同服务于实践,健康信息学研究为主
聚类三共57个词汇,聚类五共39个词汇,以上两个聚类的研究主题具有一定相似性,均侧重于区块链、云计算、自然语言处理、人工智能、语义分析、文本挖掘、机器学习等新兴技术与图书情报知识的结合,以此服务于生物、医疗、材料科学等领域,同时也均关注健康信息学知识。如借助自然语言处理算法挖掘医疗系统中医护人员较为感兴趣的内容,以开发提供临床决策支持、护理教育、临床质量控制等多种功能的推荐系统[13]、借助机器学习算法基于过去数据进行快速预测,以确定由传统方法难以测量或计算的材料属性、利用语义网技术开发基于本体的国家卫生数据字典,以消除医学信息学标准之间的语义差异[14],在本体Web语言中实现纳米颗粒本体的设计与开发,以实现数据的共享与集成等[15]。健康信息学是指借助现代信息技术以满足用户健康信息需求的新兴交叉学科。随着公众健康意识提高及现代信息技术的发展,健康信息学受到广泛关注,如健康信息在公共卫生防护应急中的价值、用户健康信息需求、健康信息搜寻行为、健康信息评价等。同时,关于健康信息学教育的研究也不断增加,此类研究可辅助公共政策制定、预测疾病暴发、分析公众在互联网中检索或浏览健康信息的行为[16]等。此外,聚类三也较关注电子政务、大数据环境下的信息安全、信息保护政策、智慧城市建设等主题。
2.3.4 聚类四:以文献计量学、社会网络分析、学术交流、开放获取、机构知识库研究为主
聚类四共53个词汇,主题集中在文献计量学、社会网络分析、学术交流、开放获取、机构知识库方面。1981年White、Griffith[17]指出“文献计量学几乎构成了整个信息科学的一半,而且是生机勃勃的一半”,近40年的时间过去了,文献计量学依然是图书情报领域研究的重点与热点。文献计量学主要有两大研究主题:合作关系研究、引用关系研究,其中合作关系研究包括作者合作、机构合作;引用关系研究分为作者引用、期刊引用。社会网络分析是一门起源于数学领域的图论及矩阵理论的学科[18],因其对知识结构关系的高度关注,对文献计量学的发展产生巨大影响。基于社会网络分析对文献背后知识结构的揭示,其对以统计描述为主的文献计量学两大研究主题产生了巨大影响,如引入社会网络分析知识后,可以更好地探讨期刊之间的引用模式及期刊在知识传播中的情况、更好地评价科研机构的学术能力及为科研机构制定科研政策提供指导,也使以可视化呈现为主的文献计量学逐渐向知识计量学方向发展。
关于学术交流的研究主题分为以下3个方面:一是学术交流过程中涉及的开放存取、出版服务、机构知识库建设问题。因开放存取、开放仓储、资源共享已成为学术交流的新发展趋势,如何协调现有出版模式使其促进知识流通、构建更利于开放存取的机构知识库成为学者关注的重点。如Tsay[19]从搜索引擎、机构存储库、开放源代码3个角度出发促进开放存取系统建设的全面性和多样性,Ejikeme[20]梳理了尼日利亚国内现存的机构知识库发展现状,认为其还存在缺少政府支持、科学生产力低、科研成果种类少等问题。二是图书馆服务转型问题。Mounier[21]提出欧洲国家图书馆之间应围绕OPERAS(欧洲各地36个机构组成的图书馆联盟)开展更多合作、分享资源、共建学术交流基础设施,在大学图书馆内部建设专门的机构知识库开放存取职位,助力高校图书馆开放存取服务。三是非正式学术交流研究,即借助社交媒体进行的学术交流。如对36位阿拉伯学者学术交流行为访谈,大多数学者常使用ResearchGate、Facebook交流他们的学术成果[22]。
2.3.5 聚类七:以基于社交媒体的网络虚假信息传播及政治交流研究为主
聚类七仅3个词汇:虚假新闻(Fake news)、政治交流(Political communication)、推特(Twitter),以基于社交媒体的网络虚假信息传播及政治交流两个主题研究为主。如Al-Rawi[23]通过数据挖掘抽取Twitter中的虚假信息与访谈活跃用户相结合的方式,讨论社交媒体与虚假信息之间的关系,发现虚假信息与CNN等新闻组织、政党人士常共同出现;Montesi[24]从网络用户的信息行为角度出发研究Covid-19健康危机期间在西班牙传播的虚假信息,发现其对社会道德及政治生活产生了较大的无形伤害。
通过对Web of Science核心合集中图书情报领域近五年的科研文献进行计量分析发现,国际图书情报界既注重图书馆服务、信息素养、知识管理、文献计量学、学术交流、图书情报教育等传统研究,也较关注机器学习、自然语言处理、人工智能等新兴技术的应用及跨学科研究,同时国际图书情报学界也较为重视健康信息学、医学信息学相关研究,将其作为辅助临床决策、保障患者安全的重要信息来源。
基于以上研究及国内学者关于我国图书情报领域的研究发现[25-31],国内图书情报与国际图书情报研究主题既坚守了学科基础理论、文献计量、信息服务、知识管理、用户服务、学科教育等相同点,同时,其研究主题也具有以下不同点:首先,国际图书情报领域以情报学研究为主,而国内领域以图书馆学内容研究为主;其次,国际图书情报界更倾向于图书情报知识管理及服务特性本质研究,而国内更倾向于具体工作、业务研究,如提升信息素养、开展阅读推广、评价信息服务水平、推进空间改造等,而突出学科基础理论本质的研究较少;最后,与国际图书情报研究相比,国内图书情报领域对机器学习、自然语言处理等新兴技术更多集中于理念影响及计量分析研究,缺少对新技术的深入分析及应用研究。
我国图书情报学界应借鉴国际领域相关研究,在坚守传统研究重点的基础上适当拓宽研究外延,在提升业务工作的同时丰富学科基础理论知识,在关注新技术发展的同时更多注重其在图书情报领域的应用,以提高学科理论知识的应用价值及学科的社会价值。