徐 妹 刘士霞
(滨州医学院图书馆 山东烟台 264003)
当前,科研范式趋向于去中心化分散型发展态势,科研社交网络服务与在线科研的时代背景给文献筛选、科学传播带来深刻影响。新的科研范式需要新的知识发现和评价体系,而以引文指标、同行评审和期刊影响因子为主的知识发现与评价机制已无法适应用户多元化的信息需要。作为产生于学术网络平台的新型分析指标,Altmetrics(补充计量学)的产生为评估学术成果影响力开辟了新视野[1],同时也为数字图书馆信息服务水平的突破创造了机遇。2014年,美国研究图书馆协会(Association of College& Research Libraries,简称ACRL)研究规划与审查委员会(Research Planning and Review Committee)把Altmetrics划分为当年度学术图书馆发展的七大趋势之一[2]。如何在Altmetrics的发展中定位已成为图书馆学界研究的新课题。本文通过分析Altmetrics应用于数字图书馆的功用并提出融合Altmetrics的信息服务创新模式,探讨图书馆应用Altmetrics计量方式优化馆藏资源、健全知识发现机制等,以期为今后数字图书馆的发展提供借鉴。
当前,科研在线服务针对科研团体或个体所需的协同合作及知识共享提供在线科研技术平台开发和科研成果使用,如提供协同编辑、文件文档上传和整理、文献共享等在线服务。在整个在线科研过程中,数字图书馆用户对知识服务产生了许多新的需要。
1.1.1 用户更注重出版物评价的综合性和时效性
以往文献计量学一般把成果被引频次或常用计量方式如JIF或h指数当作评估学术成果的标准。然而,在某些特指主题检索中,在图书、期刊等传统文献资源之外,用户还需要包含学术Blog、专家评论等内容的学术增值资源集合,而由此组成的资源网络有利于主体全面掌握科研进展。
1.1.2 用户需要融入集体智慧的知识产品
文献资源的快速增长使学者追踪前沿文献日益不便,用户迫切需要容纳各类过滤条件的服务成果。网络科研中学者对学术成果的评价、审读后的评分等信息都可以被分析、整合后形成过滤条件。如学者往往会首先遴选本领域专家好评率较多的成果阅览,该学术行为反映出用户对集体智慧的需要。
1.1.3 Altmetrics指标的学术服务功能
用户既需要源自于近似度配合等算法的搜索结果,也需要出自科研网络关联中的成果分析指标。在科研社交网络中,学术成果往往是学者学术实体中的一项基本属性。在查询学术成果时,用户需要通过科研社交网络呈现的数据协助他们进行科研合作。
1.2.1 开展基于大数据的知识发现服务
知识发现服务同数据科学(Data Science)有紧密联系。此处大数据既包括馆藏资源,还包括网络中有关科学成果的多类型有效数据。图书馆应将数字资源理念延展至整体网络领域,通过与在线科研成果有关的数据推动馆藏资源开发。
1.2.2 构建以集体智慧为主的信息滤化机制
集体智慧思想的导入可以加快资源处理速度,深化信息开发程度。因为自然语言加工技术的限制性,以往运用关键词便是对信息资源内容较深层次的展示。当前,针对用户对成果内涵挖掘的需要,图书馆可以在数字馆藏资源评估中引进人群来源标记(Crowdsource Tagging)、数字资源集成评价(Comments)、数字馆藏资源评级(Rating/Scoring)、分类等指标,并将专家群体对数字资源的软同行评价(Soft Peer Review)当作过滤体系服务于用户[3]。
1.2.3 开设学者科研个性化知识服务
首先是数字图书馆准许用户间进行联系、沟通和成果分享,即准许科研人员在数字图书馆在线平台上开展学术交流;其次是同一些重点在线科研网络合作,把图书馆部分开放网络和外部科研网络进行对接,延伸数字图书馆内部学术发展的内涵。
Altmetrics作为产生于学术社交网络范畴的新型分析指标,为传统图书馆信息服务的突破创造了契机。
Altmetrics以在线科研环境下的科研成果为研究目标,运用多元数据评价指标汇集的方式实现评估科研成果综合影响力、优化科研成果滤化效果的目的。狭义上讲,Altmetrics是专门用于研究基于引文分析的新型网络计量指标,特别注重分析科研网络数据评价指标[4]。21世纪初,北卡罗来那大学图书情报学博士候选学者Jason Priem最早提出“Altmetrics ”(即Alternative Metrics的缩写)这一术语,并把它定义为“以探索和评定学术为目标、源自于社会网络的新式计量标准”[5]。从逻辑起源看,它的出现源于论文成果指标ALMs(Article-Level Metrics)。ALMs是与论文有关的一系列限定性指标集,最初由美国科学公共图书馆(Public Library of Science,PLoS)于2009年开始使用。ALMs是在线科研时代学术成果测评机制演进的结果,是一套完整容纳异构数据源的工具包(Toolkit),并能按照评价任务的实际情况呈现全面的学术成果影响力覆盖面。广义上说,Altmetrics的目的在于用针对科学成果整体影响力的评估指标机制取代以往仅凭引用指标的定量学术评价机制。Altmetrics计量指标可以衡量引用指标无法涉及的范围,其构建了基于数据驱动的源数据平台评测体系,最大化地延伸了以引用数据或JIF为主要成果影响力测定途径的方法论视野。Altmetrics是科研成果计量与评价、知识发现计量、科学计量学2.0等诸多研究的融合。
按照余厚强等学者的学术计量分层理论,Altmetrics指标可以划分为扩散层、收集层和使用层指标[6]。和数字图书馆有关的学术评价指标包含以上方面,如在收集层有保存、分类、评级等;在使用层面则有点评、援引等。传统科研测度指标主要包括JIF,然而在数字科研环境下,JIF作为刊物成果引用指标既无法全面衡量学术作用力,也不能展示同一刊物中每篇论文的影响效力和即时分析结果,并且引文数据通常不重视学术界之外的评价,而Altmetrics在传统指标基础上还能同时呈现成果的社会影响力。
Altmetrics超越了JIF、文献引用分析和同行审查这些评价方式在学术评价与管理、决议咨询和参考等指标系统方面的路径依赖性并显示出独特优势。Altmetrics具备以下特点。
2.2.1 多元性
主要体现在计量数据来源面广,数据源自各类平台且传播机制多元,涵盖在线文献题录网站、商业数据仓库、OA开放仓储库、主流媒体可视化数据、社会化标签等互联网网站和数据库。如Altmetic.com网的数据来源包括政府公布文件、文献题录处理网站、同行审查平台、研究前沿等各渠道[7],评价目标由文献扩展到科研成果产出的普遍覆盖。Altmetrics的计量方式覆盖研究数据集、开放源代码软件、ETDs、e-book、在线课程等各类数据源;其计量指标涵盖科研成果被引用、存储、评述等各项指标。
2.2.2 实时性
以往学术成果的评议结果受出版周期影响,在评议机制上存在很强的延迟性。而利用嵌入专门Altmetrics工具的平台,用户能够追踪指定目标的即时动向,包含被下载、转发、注解及其他特殊指标信息及学术界外围所注意的热点。Altmetrics背景下,许多学术文献通过开源平台传播,系统内聚积了大批元数据信息,其内容每时都处在更新状况。Altmetrics计量工具运用API(Application Programming interface,应用程序编程接口)夜以继日地汇集计量数据,发现系统则会依照这些反馈数据完善资源结构。
2.2.3 社会价值性
学术影响力常被等同于学术成果的整体价值。伴随着大众科研的演进,学术评估也更趋向于社会价值研究。Altmetrics中许多计量数据的普及性及公开性使评估的学术影响力延伸为社会影响力,其评估对象也全面涉及著者、组织、部门等方面,这对于在公共卫生、生物制药、社会科学等行业的成果评价更具价值。
2.2.4 切入机构知识库知识单元研究
有别于以文章篇级为基本结构的计量方法,网络学术信息是Altmetrics的研究客体,此类资源是以字节为单元的数字化信息,其信息处理是以文献内的知识单元为基本元素,最后产生的是触及知识节点的评估和统计,并主要通过关联分解、聚类、动态数列分析等方式发掘学术文献信息内部蕴藏、关联的知识。以学位论文为例,成果检索和开发会细化至章节单元,开展面向专家、团队以及基于组织、成果、课题项目、主题和研究专业等方向的数据挖掘服务。
现在,图书馆知识发现及文献检索体系大多仍以文献外在特征及内容为检索点。在传统检索手段外,设置按照推荐率、分级、打分或点评等测定指标来检索可以整体展现数字环境下用户的学术行为,通过这些数据筛滤出有效信息。根据在线科研数据展开专业热点推测能够极大提高检索效能。Altmetrics既能协助发现系统强化资源质量,还能促进用户更深入地理解此类资源同其信息需要的符合度。如清华大学图书馆的“水木搜索”平台[8]应用基于Primo系统开发的一站式文献资源检索系统,通过建立海量学术资源元数据仓储和预索引提供检索;同时基于AJAX等技术提供相近检索词提示、标签检索等功能。用户通过“在线查看”和SFX链接可以快捷地获取数字对象。
对于科研机构和高校来说,保证馆藏发展与学科建设的一致性是图书馆发展的重点。开放科学环境中,Altmetrics为优化馆藏资源建设提供了新的可能。美国国家信息标准化组织(National Information Standards Organization,简称NISO)于2014年宣告的白皮书中认为,Altmetrics的主要作用是发现与评价,号召图书馆应当更进一步通过应用Altmetrics增加机构研究成果影响力并加强深层次服务支撑[9]。数字图书馆资源建设体系引进Altmetrics指标,借助其多元化和群体智慧性可以对涵盖开源软件、学术资料等各类学术文献进行评价,形成软同行评价机制。首先,Altmetrics报告可以促进图书馆获得各专业领域前沿动态,把握学科发展态势,确立馆藏优化决策基础;其次,图书馆可以通过查询Altmetrics高关注度文献是否被纳入馆藏系统,优化馆藏建设;最后,图书馆可以通过Altmetrics追踪科研课题从开展协作研究,再到学术成果产出、在线科学交流环节在特定群体产生扩大影响的进程。
补充计量数据的“大数据”规模为数字图书馆发掘主体个性化需要奠定了基础。Altmetrics数据能够切入资源内容的语义程度。关联化知识发现作为信息辨别程序,能够从数据中区分出实用、前沿、有潜在价值的信息。Altmetrics的研究目标是将学者所有学术成果和他们拥有的社交网络进行关联。对于相同专业的研究者而言,他们不但能够发现成果间理念传递的过程,还能发现学者和机构之间隐藏的合作、承袭、对峙等关系,进而打造学者间观念承接或对立网络,为主体开展语义层次的知识发掘与智能统计分析服务。
国外有名的机构知识库(如Digital Commons,DSpace和Eprints)现已形成Altmetrics新型评估模式,为机构库管理者、学者呈现多种形式的评估指标,从学术角度推进馆藏建设[10]。Altmetrics有利于弥补引文指标不能展现的知识短板。对学者而言,Altmetrics可以促进他们更好地把握已出版OA内容与用户的关系,为科研人员制定职聘档案等区分于JIF的扩展性影响力证明;从机构知识库角度分析,管理者通过使用Altmetrics能够促使潜在用户公开共享资源,协助资助方研究将机构知识库用于OA资源托管平台的价值,为资源配置提供量化决策依据。
4.1.1 基于Altmetrics的知识发现
Web2.0时代,数字资源呈现为指数级增加态势,图书馆通过Altmetrics进行信息资源发掘、从浩繁的来源数据中遴选出高质量的元数据为学者提供实时更新评价,为他们把握学科发展趋势准备稳妥的定量依据和资源支撑。同时,通过Altmetrics分析工具跟随专业领域及其学者馆际互借或文献传播情况,文献管理系统存储数量及科研社交平台上被讨论、评述及分享数量等,按照聚类Altmetrics指标做出科学决议,产生更加适合用户需要的资源选择战略。并且,Altmetrics以大众评审为根据,可以更为客观地遴选高质量的学术成果,规避了以往仅把商业数据资源看成学术文献唯一评估标准的弊端。Altmetrics同OA(Open Access,开放获取)期刊资源建设也有紧密联系,经由出版社筛选和同行审查途径,可以从OA期刊成果中遴选出高水平的文献并将其看成发现系统元数据的一部分。发现系统的资源展示也不应仅局限于成果层面,对著者的介绍也应被纳入其中。例如,2014年初EBSCO收购Plum Analytics平台在全世界范围推广PlumX服务。当前EBSCO的PlumX已延伸至专家、机构学术影响力以及基金资助效益的即时追踪和评价[11]。
4.1.2 完善发现系统资源排序的手段
发现系统资源排序首先仍以结果和主题词的符合度及成果被引次数指标为标准。引进Altmetrics的排序推算方式可以在选择主题词表优先法的同时,引进文献测评值和补充计量分值,并按照它们的综合分值实施排序。具体流程如图1所示。
图1 图书馆资源发现系统相关性排序算法
新型排序法是根据主题词、发表时间、同行评议、成果被收藏次数等因素形成科研影响力模型分级指标,把全部指标划分成传布、获取及应用三层,并赋予每层数据源相应权重,推算出替代计量指标分数当作发现系统资源排序的根本方法。各种身份类别用户对同一成果带来的学术行为会产生不同权重,并按照推荐者的学术能力对其实行加权以得到质量较高的推荐。在这方面Altmetric.com带来了较好启发。以历史学文献为例,史学家对文献进行评述、分享的赋值高于一般读者相同行为赋值。这样的测量方法在某种程度上明确了大众评议机制的界线,使用户的探索目标与收藏、群组相联系,并能向同行所在群体补充最新研究成果,使成果可以第一时间被同行学者获得和使用。相对于以往期刊评估方式,Altmetrics(如馆藏开发分析、电子期刊统计)可以提供更为详细、多样与及时的期刊使用统计。Altmetric除提供成果被引、全文下载等应用数据外,还能跟踪、识别使用者的专业背景。Altmetrics同OA期刊资源建设有紧密联系。图书馆在开展OA期刊资源建设时,可参照Altmetrics影响因素,遴选好评率、引用率较高的OA期刊。
在数据库、馆藏资源与网络资源中引进Altmetrics指标构建元数据聚合处理、分布式全文检索并支持发现服务全文获取导向服务的资源平台。该平台以资源整合为根本,其全部构架由数据收集层、数据加工层、数据整合层、主体服务层等部分组成。
(1)数据收集层。元数据资源层体系可以选择众包众筹的形式,经由出版机构、集成商联盟或在版权要求许可状态下自行收集在线元数据等多途径手段获得元数据资源。其中,元数据评估是关键任务,数据出处、范畴、真实性是关键测定指标,发现系统需要凭借这些指标的出处对发现系统收集的元数据进行评估。这些数据既能利用API从网络媒体中获得,也能从替代计量工具中下载,然后对抓取的数据进行分析以形成用于权衡学术成果影响力的指标凭据。元数据测评结束后,将形成包含出处稳固、质量可靠、更新迅速的数据资源的元数据仓储,组成数据资源层。
(2)数据加工层。数据加工层的任务主要是对元数据实施整合处理,具体内容有数据的标准化与查重、扩充元数据字段、滤化分析数据指标等。发现系统所使用的滤化程序是在同行审查的定性评估与文献计量的定量评估相联系基础上引进媒体数据源的方法进行。这里应当留意的是,在进行数据资源指标滤化时,应将各类载体数据与专业数据分别处理。如不能把文献引用率同视频的点击率进行比较,不能选择相同的方法对STEM(Science,Technology,Engineering and Mathematics,科学、技术、工程和数学教育)学科和人文社会学科进行对比以保障数据质量。
(3) 数据组织层。在该层需要切入文献知识单元内部进行处理、导引及链接,进而明确著者、组织、引文间的联系,产生相应的作者库、专家库、组织库和引文库进而达成各数据库间的连通。针对大量数据资源,确立其真实性与独特性是机构资源开发的难题。从Altmetrics平台、工具数据获取体系看,需要运用目标ID在所需的信息中提取Altmetrics数据,这里的ID能够是主体ID,如ORCID(Open Researcher and Contributor ID,研究者与贡献者身份),也可以是物的ID,如DOI(Digital Object Identifier,唯一标识符)[12]。DOI是知识发现体系与替代计量学资源建设中的根本属性。对学术成果来说,DOI具备各种模式,如Altmetric.com网站追踪的DOI囊括PubMedID、ADS ID、SSRN ID等类别,Altmetric.com网站采用的方法是针对各类ID分别展开映射或是把书目元数据和文献数据库中的文献实行组配并互相形成映射。而DOI号是该技术应用中最广泛的唯一标识号[13]。发现系统也能给系统内的全部元数据申请拥有唯一性的DOI,这里DOI的适用目标涵盖书刊、数据集、报告等各项资源。
(4)用户服务层。用户服务层是用户和系统开展互动的模块,面向体系内专业学科和学者用户开展专项服务,协助他们查找资源并提供获取帮助。如在全文获取平台内进行资源定位,按照版权协议科学导引全文获取途径,凭借各公益机构或商业公司联合开展全文服务或运用OpenURLs工具及资源分配方案达到检索结果同数据库全文、馆际互借体系、学术网络等的无缝衔接。
结合Altmetrics的图书馆信息服务模式从资源检索及个性化推荐方面出发。资源检索是主体按照需要自主在数字图书馆中获取知识,传统检索项常包括引文检索、关键词检索、题名检索、主题检索和全文检索等,融合Altmetrics数据后数字图书馆能够根据作品被链接数、标签、评价、浏览量和下载量等检索点开展服务以有效缩小学科差距。另外,将Altmetrics指标的新检索项和传统检索项连接将产生更强的功效,如用户能够搜索一段时期内被关注度在前10%内含特定主题词的有关文献,也可以专门在特定研究主题(Research Topic)内查询,馆藏资源经由这些检索项滤化后,再辅以语义技术、数据挖掘技术的支持及可视化技术的精确展示,然后推送至用户检索页面中满足用户细致化的检索需求(如图2所示)。
图2 融合Altmetrics计量指标的数字图书馆知识服务模式
4.3.1 个性化推荐是数字图书馆发掘读者的内在需要
这是使馆藏资源同读者需要进行匹配的过程。推送资源的精确度及时效性是决定服务质量的重点。许多出版商如Nature、PloS、Science等通过Altmetric.Com在其网络出版成果主页上汇集Altmetrics分析指标[14],该指标能够整体展现单独学术成果的网络影响力。应用Altmetrics工具还可以筛滤出最有学术价值的分析信息,发现、定位到同研究专业学者最相关的成果并及时推荐领域内最前沿的文献。图书馆还能使用Altmetrics工具跟踪科研人员学术成果,对科研过程和研究结论做出评价,使用户能找到相同研究方向的学者或科研项目。
4.3.2 加强机构资源推荐精度
资源推荐是向用户展示同给定文献有关的成果列表服务,根据用户的检索目标确立学术分区,即在同一搜索会话期内若有较多学者选用了给定文献和其他文献,那么这些文献就被看作是有关联的。但是,当前发现系统资源推荐只局限于“类似文献”,并没有将该成果作者的他类文献或学者所属组织的其他文献一起推送。相对而言,在搜索引擎或网络销售平台资源推荐案例中,用户的全部搜索记录都会被当作重要数据纳进系统当中,系统会按照这些记录为读者推荐类似产品。Altmetrics指标也开发了新的推送点,能有效增强资源推荐的精度。融入Altmetrics指标后,机构可以通过学科方向、专家社会网络、群组和收藏等来开展推荐。首先,Altmetrics记载了大批在线用户信息,包含科研社交网络中的评价、反馈建议数、Facebook等数据都可以被当作数据挖掘的基点;其次,Altmetrics指标中的标签和点评蕴藏着用户对文献的诠释,对此类数据展开语义性表达能够形成以语义构筑为基础的推荐;第三,包含Altmetrics技术的发现系统能够使主体在登录后自行连接个体网页履历信息,根据用户身份和用户数据信息向读者推荐有关检索结果,发掘读者隐性的信息需要。
机构知识库(Institutional Repository,简称IR)为数字资源的保存和分享打造了便捷平台,其主要功能在于强化学术成果的透明度。Altmetrics计量手段改变了图书馆介入IR管理的路径。传统管理机制下,图书馆IR更像是被动的信息存储库。而在以Altmetrics为基础的新型管理机制下,科研人员可以更为主动地将学术成果存储于IR,推动新一轮知识库存量增长。运用Altmetrics工具可以为学者搭建学术交流的桥梁。我国香港大学IR的统计分析除了展示Scopus、WoS、Pubmed等数据库使用指标,还推出源于F1000、Altmetrics.Com的补充计量指标与DSpace系统推出的下载及阅读分析信息[15]。可见,通过运用Altmetrisc技术可以完善IR发展模式,促进学者把各类学术成果上传至IR参与开放存取。当前一些主要机构仓储软件以传统应用统计数据为根本推出Altmetrics计量指标。如马萨诸塞大学医学院图书馆将Altmetrics指标纳入Digital Commons出版平台,美国匹兹堡大学图书馆则引进Altmetrics至本校馆藏系统D-ScholarshipInstitutional Repository,选取Plum X为Altmetric收集、研究与推广的工具,用户可在馆藏体系书目主页查询该成果全文下载数量及Altmetrics指标。除了单独成果外,用户还可以查询学者、院系、研究中心、机构出版刊物乃至全校Altmetrics影响力信息。该计量分析报告能够促进用户应用D-Scholarship@Pitt机构典藏(IR)体系,增强学术成果与其所属研究机构的可见度,并形成对学术成果影响力实时性、动态化、可视化的评估。台湾交通大学则于2014年以DSpace为基础研发出IR的新版本(http://ir.nctu.edu.tw/),该网页设计通过视觉化图型展示IR中的各项服务,在单篇学术成果中增添DOI标识符,使用户可查询网络流量统计数据、资源发现系统及全面的元数据栏位介绍,增添科研社交网站如Mendeley、Zotero的共享链接并通过Altmetric和Plum X共同展示该文献的各项Altmetrics计量指标[16]。
图书馆同工具提供商合作可以增强服务的精确性和时效性。威利线上图书馆(Wiley Online Library)作为世界最大、最全面的经同行审议的科技、医学和学术研究的在线多学科资源平台,同Altmetric公司协作,在OA文章主页增添AM Score指标,使用户可以即时追踪文章被引用的动态、在线分析结果及定性和归类有关文献。印第安纳大学图书馆同Altmetric.com共同研发了在DSpace中如何运用DOI和handle方式在XMLUI中添加成果社会价值指标的嵌入图标(badeges),并准许由作者直接管理和维护这些指标。当前,许多高校图书馆将Altmetrics纳入用户信息素质教育,针对博硕士研究生设置有关课程,其内容包括专业范畴信息管理技术、网络环境下Altmetrics计量指标分析、各专业领域科研网络应用等。此外,Altmetrics已开始被运用于电子期刊或馆藏数据库。比如:美国约翰斯霍普金斯大学图书馆、密歇根大学图书馆都在网站主页中增添Altmetrics网页。香港中文大学图书馆还聘请Altmetrics学者举行专题讲座并增设学术社区网站应用课程[17],支持用户把Altmetrics指标列进自己的履历,着重向用户传递开放存取、自出版平台等方面的内容。
作为评价学术成果影响力的手段,Altmetrics超越了以出版成果为重心的评价模式,为数字图书馆信息服务创新创造了契机。但在应用Altmetrics指标进行知识服务时,还应注意以下方面:首先,深入了解Altmetrics 每项指标内容及各指标的附加值和功能。其次,遵照评定目标和专业范畴要求选用适宜的计量指标。如面向成果科研价值的评估可以选取文章被引频次、学术领域专家评议及关注度等类别的指标;而面向成果社会影响力的评估则可以选取社交媒体中大众推荐和评论的指标。第三,审慎使用Altmetrics指标进行跨专业、跨组织及多专家间的横向对比。因为Altmetrics指标受专业范畴、区域特征及文献出版等因素影响,在当前阶段仍不适宜用在横向比较中。除此之外,图书馆还能运用Altmetrics协助出版社、科研团体、基金组织等机构制定竞争力评价及决议方案。如基金组织可以通过Altmetrics指标跟踪项目发展进度,建立学术成果影响力评价反映机制为后期方案准备量化策略。
把Altmetrics引进发现系统,并不是否认传统文献计量学功能,而是在选择影响因子、h指数、科研引文的同时探索一种更加适宜的计量手段,以填补科研出版与发布过程中存在的欠缺,由资源发现向知识发现转移以完成知识创新。将Altmetrics应用于图书馆馆藏优化、机构仓储建设、深层信息服务中,能够完善馆藏资源结构、推动机构仓储发展。当前,国内数字图书馆仍需要融入Altmetrics指标的实践研究进一步发展。