大数据环境下医学高校机构知识库建设现状调查与策略探析

2019-11-30 03:42朱碧纯吴爱民张以舒
图书馆学刊 2019年11期
关键词:首都医科大学知识库学者

朱碧纯 吴爱民 张以舒 郭 桑

(温州医科大学图书馆,浙江 温州 325000)

机构知识库(Institutional Repository,简称IR)又称机构库、成果库、典藏库等,是由特定机构(如大学、研究所、图书馆、博物馆等)建立起来的,用于收集、存放并长期保存机构内部所产生的各种数字化资源,并可供机构内外用户共享和交流的平台[1-2]。从2004年初吴建中首次发表有关机构知识库论文,提出机构库应该成为图书馆的一个组成部分[3],到2010年庞弘燊等人发表第一篇国内高校机构知识库案例论文[4],机构知识库经历了从无到有的过程。然而,随着大数据时代的来临,医学领域的学术成果呈爆发式增长,学者对机构库功能的需求层次也随之加深,2016年开放获取知识库联盟(COAR)启动“下一代机构知识库”项目,以“超越开放获取”为目的的机构库建设正面临着新的转型和挑战。笔者对现有的医学高校机构库建设情况进行调查并提出发展对策,旨在为推进全方位服务型机构知识库平台建设提供参考。

1 调查对象筛选

1.1 调查对象、时间及调查途径

为全面了解医学高校机构库建设现状,笔者选取2018武书连或校友会医学高校排名中共32所医学高校作为调查对象。本次调查途径采用网站调研为主,通过各医学院校图书馆首页或百度搜索引擎对各个医学院校机构库进行逐个检索(检索词:高校+机构知识库、高校+机构库)[5]。检索统计时间为2019年4月30日。

1.2 医学高校机构库普及状况

通过调查图书馆或百度搜索引擎获取医学高校机构库情况可知,共有17所医学高校提供机构库链接信息,普及率为53.13%。根据机构库访问情况、内容建设情况等将现有机构库分为3类:第一类图书馆主页有链接,但无法正常访问或需要学者登录访问(包括中国药科大学、广州中医药大学等3个);第二类有机构库建设招标公告,正在或计划建设机构库(包括沈阳药科大学、温州医科大学、山东中医药大学等3个);第三类机构库平台外网能够正常访问,功能完善且数据更新及时(包括首都医科大学、南京医科大学等11个)。

2 医学高校机构库建设现状

笔者选取第三类(11个)医学高校机构库作为研究对象,从数据来源、用户体验、衍生服务等方面进行调查,全面展现我国医学高校机构库建设现状。

2.1 数据来源

2.1.1 收录的数据库资源

医学高校机构库的首要职责是最大限度地收集、管理、展示本单位的知识产品。因此,从收录数据库资源的多样性和成果类型的多元化角度出发,对现有医学高校机构库数据的完整度进行调查。(详见表1)

从调查数据来源中发现,11个机构库收录的资源不尽相同,普遍收录的数据库有Web of Science核心合集(SCIE)、EI、CSCD。复旦大学上海医学院与昆明医科大学收录的数据库来源最丰富,提供14种收录来源的数据库,除基础数据库外还包括CCR-EXPA、BKCI-S、CPCI-SSH等。调查过程中发现首都医科大学收录来源较为单一,仅收录6种来源的数据库。

(1)11个机构库有9个提供北大核心收录,首都医科大学、湖南中医药大学未提供北大核心收录。

(2)11个机构库有7个提供SSCI收录,首都医科大学、南京中医药大学等未提供SSCI收录。

(3)11个机构库有6个提供CPCI-S收录,南京中医药大学等未提供CPCI-S收录。

(4)11个机构库有5个提供CSSCI收录,南京中医药大学等未提供CSSCI。

(5)11个机构库提供的其他收录来源包括Scopus(4个)、PUBMED(4个)、ISTP(4个)、Medline(4个)、CPCI-SSH(4个)等。

表1 医学高校机构库收录的数据库资源分析

2.1.2 收录成果类型

所调查机构库均以期刊论文、会议论文、学位论文为主要资源类型,除首都医科大学收录的成果类型中不含有专利外,11个机构库均涵盖专利资源。6个机构库支持科技成果查询,5个机构库支持奖励查询。南京医科大学收录的资源类型最为丰富,除基础的收录类型以外还提供教学课题、精品教材、教学奖项等8种成果类型查询。(详见表2)。

成果类型分析如下:

①11个机构库有8个提供“著作”(图书)成果,首都医科大学、南京医科大学、山西中医药大学机构库未提供“著作”成果。

②11个机构库提供的其他成果包括报纸(两个)、标准(两个)、精品教材(1个)、奖项(5个)、软件(3个)、教学课题(1个)等。

表2 医学高校机构知识库成果类型分析

2.2 用户体验

从机构库建设整体布局来看,11个机构库网站页面上均提供5个以上包括首页、机构(又称为科研平台、院系导航)、学者、成果、分析(学科分析、学科建设、统计分析)等基本功能(如表2所示)。但不同机构库网页功能完善度不一,用户能获取并利用的有效性差别较大。具体服务分析如下(详见表3):

①首页展示。11个机构库首页提供的信息主要涵盖成果类型(11个)、收录来源(11个)、学者(7个)、高被引论文(7个)等;9个机构库首页提供可视化统计结果,包括发文图谱(7个),成果类型(6个)、收录来源(两个)、核心期刊分布(两个)等。南京医科大学可视化程度高,湖南中医药大学、山西中医药大学等的可视化统计分析需要学者登录后可见。

②机构展示。不同的机构库对院系导航的方式不同,湖南中医药大学仅支持按字母索引方式导航,首都医科大学可通过机构类别或学科等多元化方式选择浏览。众机构库中,首都医科大学院系展示信息最为完善,包含院系简介、历史更名、研究方向、统计收录成果的使用情况、下载链接等信息,便于读者快速了解院系背景及产出。

③学者展示。11个机构库都支持按字母或者按院系的归属对学者进行归类,此外首都医科大学、南京医科大学等机构库还支持按学科、按职称、按级别对学者进行归类;在学者个人信息的获取过程中,11个机构库不同程度地展示了学者的个人简介,首都医科大学等3个机构库提供学者二维码、研究主题的词云等,可帮助用户快速了解学者的个人成果。首都医科大学等3个机构库还为学者提供成果认领,有助于学者更好地管理自己的知识产出,此外首都医科大学等增设学者对比等个性化功能,一定程度上为学者提供人事参考。

④成果展示。机构库成果展示的完整度和精细化管理主要参考如下方面:a.记录成果来源(6个);b.多元化整合,11个机构库均对成果做了细分,至少提供了8种细化方式,哈尔滨医科大学和泰山医学院机构库可提供17种细化分类选择;c.成果利用,8个机构库提供被引频次指标,南京中医药大学、泰山医学院等5个机构库提供替代计量学指标显示成果的影响力,3个机构库支持成果的在线下载,此外仅南京医科大学提供成果的影响因子;d.分享和收藏,除山西医科大学外,10个机构库均支持向主流媒体或社交平台分享学术成果。

2.3 特色衍生服务

表3 医学高校机构库服务功能汇总

在全面整合学术成果的基础上,机构库旨在为用户提供更多有效的信息以及更好地利用和分享学术成果,同时也是扩大学术影响力的有利方式。因此,调查11个机构库中各数据库的特色服务,旨在为完善机构库建设提供参考。具体分析如下:

①特色文化资源。对机构的特色资源进行突出展示,设置专题模块,创建各种专题,如山西中医药大学中医学、中药学、推拿针灸专题库。

②学术出版物查询。对国内7大核心期刊遴选体系以及世界著名的文献检索工具《科学引文索引》SCI进行整合,整理期刊目录或提供查询链接,以供读者利用。国内南京中医药大学等三所机构均可以提供出版物查询。

③学术快报。对机构的代表性科研成果自动进行收集,通过新闻方式实时播报最新成果、重点成果、ESI高被引成果、热点成果等。复旦大学上海医学院等3所机构支持重点成果、热门成果的报道,首都医科大学等7所机构支持高被引论文展示。

④中英文对照。部分机构库提供中英文界面,如南京医科大学、昆明医科大学等,但均仅提供中英文对照注释,未提供中英文切换版本,且对照注释仅在首页显示,未能对所有页面提供注释。

3 医学机构库建设存在的问题与思考

3.1 医学机构库建设存在的问题

3.1.1 医学高校机构库建设比例较低

32所医学高校机构库真正建设并投入使用的为11个,约占31.25%,这样的建设比例并不乐观。制约医学高校对机构库建设的主要原因可能是管理层对机构库的认识不充分、数据清洗等关键技术未达理想、人事系统对接等衍生功能尚未实现、前期建设费用较高等,不少医学高校对待机构库建设工程尤为谨慎。

3.1.2 医学高校机构库服务功能欠缺,国际化程度低

现有机构库主要涵盖学术成果的收录、展示、统计等,这些功能属于最基本的典藏功能,如何更好地利用知识成果产生的大数据为学者个人扩大学术影响力或寻求科研合作是机构库建设的下一步研究重心。尽可能跟踪采集科研成果在各数据库或平台中浏览、下载、引用、分享等指标,为用户提供个性化、动态化、可视化的个人科研成果分析图表。记录对学者关注度比较高的来访者,推荐研究领域相近或学科互有交叉的相关学者,起到利用大数据平台对科研辅助的作用。

所调查的医学高校机构库中仅有南京医科大学等两个机构库提供主页中英文对照标注。目前医科高校机构库均未能提供中英文自有切换的访问模式,提供英文版本的机构知识库有助于提高国际知名度,扩大本机构的科研知名度,促进科研国际合作。

3.1.3 医学高校机构库未实现数据关联满足人才评定、科研决策等需求

由于缺乏校内政策性支持,教师对于科研成果认领积极性不高,单靠图书馆馆员很难认证机构知识库内每位教师的成果,机构库数据准确性难以保证[6]。调研发现,现有的机构库尚未提供与人才评定、科研决策的对接功能。在未来的建设需求中,应着力将学者的知识成果数据关联到科研处、人事处等部门,这样做不仅可以有效解决人事决策,也可以节约相应的工作人员填表时间避免重复劳动,缩减办事流程。

3.2 机构知识库建设发展优化策略

3.2.1 提高数据智能化处理能力,宣传推进下一代机构知识库建设

机构库的内容是机构库建设的核心,数据准确、可靠、全面是支持整个机构库可持续动态发展的先决条件。最大限度地保障作者的所有成果纳入本机构库需要依托智能化的数据处理技术,需要不断提高计算机的数据处理能力。在此基础上,单纯典藏功能的机构库不能吸引学者主动登录机构库,亟待开发能为学者提供智慧化衍生功能。因此,首要任务是向决策者和行政人员讲解以“超越开放获取”为目的“下一代机构知识库”理念,以推进医学高校机构库建设。“下一代机构知识库”由开放获取知识库联盟(COAR)启动,其核心是将机构知识库作为一种分布式的、全球网络基础设施的学术交流平台[7]。强调从存储走向增值,存储的目的不是为了收藏,而是为了通过服务增加价值;通过开放获取为创新服务,强调开放获取只是手段,目的是为了推动科研和创新;强调走向集体合作和管理增强机构知识库之间的关联度和协作能力[8]。

3.2.2 采用相互操作变革机构库的数据管理,构建学术交流圈

机构库的健康可持续发展应该依靠学者和管理员双方的共同管理。依靠政策激励机制调动学者主动参与机构库建设的积极性,要求学者主动添加、认领、完善自己的学术成果。同时,机构库也应当为学者提供知识图谱、支持学者创建科研团队、支持科研小组之间共享文献等衍生服务型功能。为完善数据库的易用性和直观性,建议将数据转换成图表等可视化形式,这将有利于访问者快速获取有效信息,增加用户使用过程中良好的体验感。最后,可开发利用微信小程序[9]等新媒体使学者有意识地推广分享自己的学术成果,提高自己的学术影响力,从而寻求科研合作以及成果转化。通过向主流社交平台推广本校机构库,全方位展示本机构知识成果,吸引本机构外用户访问,以构建活跃的学术交流圈。

3.2.3 提高数据关联化,为人事绩效、学术不端管理等提供数据支撑

随着机构库知识成果数量的爆发式增长,大数据的统计计算和深度分析是机构知识库面临的转型与挑战。将数据按院系、部门以及学者进行多维度有效的关联,可获得如学者贡献度、院系贡献度、主题相关的学者分布等具有参考价值的信息,为人事部门、科研部门等考核评审提供有效佐证,同时减少重复填报数据等流程,提高工作效率;基于大数据计量分析多种数据库的使用效率,为数据库采购等提供有效的数据支撑,提高决策效率和决策质量。再者,近来高校学术不端的行为引起学者广泛关注,利用机构库缴存灰色资源保障科研数据真实有效不失为有效的策略。通过机构库加强对论文的数据管理,要求学者将发表论文所涉及的原始数据在论文发表1个月之内上传至机构库学者个人文档中,以供日后审查,为学术不端管理提供查询依据。

4 结语

大数据环境下,医学高校机构库不仅是展示机构自身科研实力的重要渠道,也是提供知识情报分析、参与人事绩效管理等重要平台,需要不断地与时俱进,优化升级。笔者建议通过提升智能化数据处理技术,深度分析大数据之间的关联、协调各部门之间的数据对接,利用政策机制、激励机制促进学者主动参与机构库建设等多种手段,满足以学者为中心构建学术交流圈,使医学高校机构库成为充满活力的资源共享和学术交流服务创新平台。

猜你喜欢
首都医科大学知识库学者
睡前一杯奶,到底好不好?睡眠专家告诉你真相
学者介绍
学者简介
汉语近义词辨析知识库构建研究
学者介绍
首都医科大学危重症医学系
首都医科大学北京儿童医院2017年国家级继续医学教育项目(之二)
首都医科大学北京儿童医院2017年国家级继续医学教育项目(之一)
学者介绍
卫星状态智能诊断知识库设计方法