李雁鸣
摘 要:文献计量作为量化情报信息的重要手段,在科研评价、馆藏核心测定、前沿发展方面发挥着重要作用。本文从文献计量的特性出发,研究了数据可视化技术、语义处理技术、文献计量与信息检索整合三个方面的研究技术展望,探讨了文献计量在我国现阶段图书情报领域中核心期刊测定、热点研究、科学评价、馆藏建设四个方面的应用,为我国提高图书情报工作质量提供了很多帮助。
关键词:量化;文献计量;应用
一、文献计量研究背景与研究意义
文献计量由文献学发展而来,从最初比较出版物、统计书目到采用统计学计算方法、整合文献事实研究及计量表征,发展到涵盖情报信息分布层次、数量变化、规律测试的指导、探讨科研热点、结构、特征的学科。我国文献计量起步于上世纪六十年代,发展于八十年代后期,经过数十年发展,基本形成了符合我国科研环境的文献计量理论、方法、实践经验的知识体系,为我国情报信息处理提供了有力支撑,成为图书情报与科学评价领域中一个重要的分支學科。
文献计量通过探索与完善表征词频分布或文献分散规律的实践方法,实现数学、统计、文献学的有机结合,将文献评价、出版物确定、文献利用率等机能日益完善,为实现图书情报的科学管理提供了有利条件。文献计量对实现情报网络建设、情报处理效率、文献服务利弊等方面的提升产生深远影响。但随着近年来图书情报领域不断发展,尤其当前 “大数据”、云计算、人工智能成为研究热点,呈现的文献数量以指数型增长,文献系统固有的不确定因素日益凸显,造成我国现阶段图书情报工作仍存在宏观定律依赖数学统计,微观依赖同行评价的旧弊,影响到学科评价的客观性。在此种情形下,如何正确地评价分析文献计量在图书情报领域的应用,充分发挥文献计量的优势,以量化指标全面评价某领域科研效率、研究能力、挖掘深度,实现数学理论与方法运用相结合,以定性过渡到定量,以科学方法探寻情报信息本质,从而提升我国图书情报信息分析质量。
二、文献计量在图书情报特性研究
当前,我国文献计量学研究范围已涉及社会网络映射、数据采集分析、标准制定与研究以及智库机构量化信息、引文量化分析等,研究方法中可视化、数据挖掘技术运用广泛,文献计量凸显技术与定量的实现趋势,其在图书情报领域体现以下特点。
1.指示目标的明确性
文献计量的指示目标必须遵循互斥、排他原则,即构建指示目标的明确性,作为文献计量指示的基础,明确性必须根植于情报信息内容与分析趋势,此要求包含以下方面:(1)科学指示,即指标在主题、内涵、容量、时间、计算单位、方法有明确的定义与要求,排除可能引发歧义的概念,以期减少收集数据的偏差、误差;(2)可测量操作,文献计量认为是一种量化方法,具备工具化、模型化的数学特点,因此其指标的设定前提必须是直接度量的、满足一定条件的、排除可能引发计算方法偏离的值域或阀值;(3)评价导向性,指示目标的学科评价必须具备正确的、同方向、持续性的引导与鼓励,计量不是为“文献打分”,而是归纳文献的学科发展,明确学科的导向功能,体现绝对的文献价值。
2.评价的结构层次性
学科评价是文献计量的重要功能,智库机构往往通过学科评价确定该信息的价值导向,而学科评价具备明确指向性的特点。组织作为要素基础,合理组织并建立评价体系模型至关重要,其关键在于模型结构的设计,对结构继续分解定义,赋予分层层数、各层定义和组合因素、层递关系明确的意义与内容。优秀的指标评价结构体系必须具备以下特点:(1)层次鲜明,即评价分层分析,因层分析,按层分析,既可以保证评价的严谨又能够保证评价目标及时更新;(2)主题一致性,即整体评价的指标与目标统一,层次目标与指标一致;(3)层次数量适度,即满足指标体系的及时创新及完善,层次衔接紧凑,分析内容紧密契合,易量化操作;(4)目标完备,即体系结构协调、齐整,评价目标完整、全面。
3.计量阀值的选择性
文献计量过程所设计、选择的单一指标可能会出现不符合指标原则的情况,出现评价指标的互相矛盾、相互掣肘、交叉、因果等不恰当关系,这种不确定关系给图书情报工作者造成干扰,严重的可能会出现重大决策失误。因此明确文献计量的指示目标必须设定一定的阀值、参数来进行计量选择。
计量阈值是指量化指标中数量关系、时间参数的设定值,即可理解为互斥条件。而科学选择阈值应综合考虑学科评价机理、内涵因素、特点属性等方面,学科代表性是当前计量阀值设定的基本思想。阀值设定思路包括:(1)以概念为设定阀值,即概念自身定义所隐藏、表征的数量、时间参数,如“年份” “关键词”;(2)以参考定理原理为设定阀值。即“影响因子”“期刊比重”所代表的学科核心定义选择,如“ISTP”“ESI”;(3)以随机区间、范围为设定阀值,即评价的“置信区间”可以涵盖足够的文献,如“某年份、某国”、前“n%”等区间参数。
三、文献计量主要研究技术与发展趋势
1.数据可视化技术
数据可视化技术是文献计量过程重要的实现工具,通过文献计量的引文方法、内容分析法、元分析法相融合的途径,实现了计量数据的深度挖掘。根植于数据挖掘、文本分解的分析软件在开发之初就将计量可视化思想进一步表述,如基于语义计算的Autonomy 软件,将概念与语义关联实现对信息的自动理解,自动筛选聚类信息及超链接,其核心IDOL(智能信息操作层),能够挖掘非结构数据,实现数据积累。可视化分析看似重点在于利于交互的界面建立,其实核心在于其中的分析手段、数据梳理方法,及其相应的计量理论。可视化技术帮助用户从庞大的非结构数据中抽脱出来,分离复杂的数据关系,理解推理结果及明确策略走向。应当强调的是可视化技术与信息可视化有所区别,信息可视化仅仅是实现计算机在网络环境下自动生成信息交互表现形式的开发、运用,缺少了可视化分析知识发现、梳理、甄别的过程,而可视化技术更侧重自动分析方法及算法研究。只有可视化技术选择与恰当信息自动化相结合、相辅助,情报信息的推送才能更好地完成用户决策。
2.语义处理技术
语义处理技术主要整合信息评价提取、自然语言(NLP)处理建模、AI应用、数据库(DT)等智能处理方法,其主要表现为数据表征与涵义提取为机器语言,利用计算机对语言结构进行分析,使得机器能够识别、理解语言并能够精确搜索、准确定义。语言处理技术向机器理解数据语义、完善语义技术应用范畴、完成结构化的语义数据采集分析的方向发展,语义处理技术成为当前语言处理技术难点,针对现有情报研究对象(核心期刊、专利、专著等文献)计量,虽已现存较为成熟的分析软件与工具,可以类聚关联链接,却仍旧缺少深层次语义支撑,仍需要耗费较多人力资源对设定进行评价,基于语义处理技术研究支持工具与技术还有提升的空间。
3.基于大数据背景下的发展态势
大数据技术的蓬勃发展,打破了情报学信息检索与文献计量两大分支的鸿沟,实现了两者的并行发展,信息检索中的信息查询技术智能化程度,“关键词”自动化提取能力有着显著提高,是进一步弥补文献计量中检索时间过长缺陷的重要补充手段。信息检索能够实现文献计量全过程的学术信息交互、使用,涵盖用户行为中的浏览记录、下载链接、期刊收录、科研评价、学术引用等方面,实现全时期、全空间的计量。大数据背景下,信息检索根植于文献计量,通过信息检索能够保存文献计量的样本,自动为文献计量提取样本,形成文献图谱,促使文献计量向网络计算发展,从而形成指标阀值基于个性化检索、精确推荐的文献计量指标体系。
四、现阶段文献计量在我国图书情报领域的应用
1.在学科核心期刊测定方面的应用
核心期刊代表着某学科科技前沿、研究前站,是该学科专业情报信息量最丰富、质量最高的主要刊物,是文献情报最重要的来源。文献计量在学科核心期刊“量化”“测定”方面应用出现较早,影响较为广泛,理论较为成熟,期刊测定是文献计量工具化直接的应用。实践方面,图书情报单位建立本机构馆藏核心、研究人员科学获得高质量密度情报源、论文撰写参阅专业期刊文献等文献引用操作,都离不开核心期刊科学、合理、恰当地测定与评价。文献计量为核心期刊测定形成一种普遍、广泛的评价体系,从早期简单考虑单因素的百分比法、累计法,到结合论文引用率、利用率的文摘法、引文法,再到具体问题数据处理的精确计算法,如权重目标法、“无量纲灰色关联法”。例如,“无量纲灰色关联法”将“引文量”“摘要词频”“流通数量”进行无量纲化,通过灰色关联系数ξ(Xi)构建灰色关联模型,比较研究对象与各影响因素的因子值贴近度,由此贴近度获得影响因子与待识别对象的关联度大小,从而将关联度绝对值作为核心期刊的测定值,我们通过绝对值大小来测定该期刊的质量是否满足评价要求。
2.在热点研究与科技前沿方面的应用
文献计量的基础来源于文献事实研究,文献研究古老而生命力顽强,往往带来新思想、新技术的萌芽,这种萌芽不仅能够促进学科的正循环发展,更能够进一步演示学科领域的发展方向。尤其近年来,数据库技术的应用,文献数量得到极大丰富,文献目录、引文归集的统计分析方法向计量学方向完善,计量分析在某学科热点确认、学科研究发展、学科预测等方面得到有效运用。目前,文献计量对学科动态理论、文献产出率与现阶段成果、发展变化与联系、词频变化与科技发展变化关系等进行切实可行、灵活多样的事实研究,其中包括了对该学科范围内论文、专著数量、作者分布概型、期刊组成、关键词频率、时空参数等全方位、多角度分析,对学科研究现状及发展趋势进行客观评价。如我国数字图书馆核心馆藏数据库建立研究的论著中,研究者主要利用“SCI”“JCR”等工具,运用“引文”间接分析法,通过引文量化频次、数量、刊物来源,由“引文量分布”“引文篇数分布”获得引文的集中离散规律,研究该主题文献量化规律及客户需求规律,从而为数字化图书馆核心馆藏库建立提供一定的参考价值。
3.在科研评价的应用
我国定性评价方式长期存在于学科研究过程中,其中同行评议的方式固然有着专业、权威、隐匿的优势,但主观性、保守性同样存在,不利于科研能力的客观评估。而文献是学科研发的事实依据、固有成果、过程体现,基于文献计量相关理论的“定量”分析,是将文献产出“数量”“引文频次”数量作为科研评价的量化标准,将作者文献作为科研产能,文献引用频次作为科研质量,在一定范围内提供科研评价参考。随着影响因子与混合量化指标理念的提出与完善,文献计量由单一指标,向复合计算演进,通过指数的量来预测、辅助同行评价,由作者核心论文作品集进行科研能力评估,从而建立起完整的科研评价体系。在科研评价过程中,把文献作为结构性资源,将其基于一般统计、回归计算等数学方法,纳入计量系统工程系统,纠正单一指标所带来的评价偏差,把科研团队、学术期刊绩效形成适用性报告,客观的把期刊影响因子、引文、h指数有机结合起来,从而形成科学地科研评价结果。
4.在图书馆藏建设中的应用
文献计量在我国图书情报的实践还体现在图书情报科学分析管理方面,并涉及到图书科学管理系统的建立,如图书流量、图书选订、馆藏定量、流通分析、用户评价等多个方面,而且馆购图书文献质量也影响本机构图书情报资源建设与发展。图书馆在采购文献时,可以使用文献计量中的“引文”法对文献收集、期刊订阅、馆藏核心进行确认,即通过学科期刊中所内含的文献“引用量”“衰退周期率”进行分析,确定图书馆文献资源管理内容。国内众多高校选择本校师生论文为研究样本,统计近年来本校师生发表的论文中引用的参考文献,并结合本校现阶段馆藏建设,采用“一次引文法”,以期获得基于本校用户行为的图书情报信息,促进馆藏更好的建设。馆藏建设在核心期刊计量方面,明确文献知识累积性、发展性、衰老性,推送给用户的信息必须是正确的、完整的、匹配的,从而构建基于“数据库资源”匹配的个性化推送模型,进而构建基于文献计量的“被引分析”“词频类聚”“h指数”的架构模型。同时在情报信息整合方面,图书馆要继续关注強化词频与自动化标注技术研究,完善定量评价与检索体系,同时借助大数据、云服务、数字图书馆联盟中海量的数据进行文献新整合,全面开展学科方向趋势与科研决策信息服务,深挖用户行为信息数据,推广科学的文献服务管理,谋求当前图书馆创新转型。
五、总结
我国文献计量学已经积累了相当多的理论与实践经验,文学计量相关应用在图书情报科学管理方面取得很大的进展,对情报服务实际工作、各图书情报机构信息处理发挥了举足轻重的作用。但是我们应该看到现阶段文献计量中重要的理论指导、重要计量可视化软件大多为西方国家创建,这就要求我们从国内实际出发,脚踏实地研究文献计量学原理,进一步提升我国现阶段文献计量水平,从而做好新时期图书情报学应用与管理
工作。
参考文献:
[1]朱 亮,孟宪学.文献计量法与内容分析法比较研究[J].图书馆工作与研究,2013
[2]董 琳.使用文献计量法开展学科研究[J].情报杂志,2013
[3]陈廉芳.高校图书馆文献计量类型梳理与融合策略研究[J]. 图书馆工作与研究,2019
[4]王节祥,蔡 宁.平台研究的流派、趋势与理论框架———基于文献计量和内容分析方法的诠释[J].商业经济与管理,2018
(作者单位:枣庄学院)