李莘 李蕾
(哈尔滨工业大学图书馆,黑龙江 哈尔滨 150001)
数字资源的标准化建设主要涉及对各项相关技术标准的制定和实施,是关系到当前图书馆资源使用和共享的关键因素。如果不按照标准化建设,数字资源就容易出现重复开发和建设、重复投入和使用,造成人力和物力的浪费,同时造成资源信息的冗余[1]。美国信息学专家Gail M.Hodge将数字资源生命周期划分为创建、资源获取与集合生成、标识与编目、存储、保存成档以及检索与复用6个阶段[2]。因此,数字资源标准规范体系的建设规划应该围绕数字资源生命周期的全过程进行。国外关于数字资源建设的标准研究主要集中在对不同标准的理解[3~4]、元数据管理与长期保存[5-7],依据OAIS参考模型构建的数字资源长期保存系统[8],不同国家的长期保存认证标准体系情况[2],采用ISO15489系列标准的电子资源呈缴等[8]方面。我国数字资源建设标准研究主要包括国家数字图书馆的数字资源建设类、数字资源发布与服务规范类、数字资源统计类、数字资源长期保存规范类的标准规范;科技部制订的《数字图书馆建设中标准规范应用指南》《基本元数据规范》《元数据扩展规划》《专门元数据规范》《唯一标识符应用规范》等;CALIS管理中心制订的《中国高等教育数字图书馆技术标准与规范》[9]等。
综上,国内外关于数字资源标准体系建设的研究除国标委提出的规范体系外[9],基本只研究了数字资源全生命周期中某一阶段的标准或者虽然围绕生命周期阶段制订了标准,但是未形成通用的国家标准。因此,笔者提出在图标委拟定的标准规范体系下,按照全生命周期6阶段收集整理现存国内外相应标准及已出版的国家标准及数字资源的发展规律,以生命周期理论规划不同阶段的数字资源建设标准。
笔者以数字资源建设、数字图书馆、标准等主题词在中外文数据库进行检索。将检索结果利用知识图谱软件进行解析,以便更加直观地了解数字资源标准的国内外研究现状。
以主题=(数字资源建设or数字图书馆)and主题=标准,在中国知网中检索相关文献1385篇。该主题发表文献的整体趋势,关键词出现频次分布如图1、2所示。
图1 中文文献发表趋势分析
图2 中文文献主题分布情况(前40个主题词)
为了进一步细化该领域的研究主题,选取了SATI软件为该领域文献绘制了知识图谱。利用该软件对所研究主题下的文献关键词网络做进一步的分析,图3、4分别是对前40个、前100个出现频率最高的关键词网络的呈现。由关键词知识图谱可见,关于数字资源建设的标准研究主要围绕Marc格式、XML格式、SGML格式、互操作格式、元数据等方面,参考的标准主要有ISO、Dublin、Core、Z39.50等。
图3 中文文献中前40个关键词的共现情况
图4 中文文献中前100个关键词的共现情况
对于外文文献,选择了VOSviewer进行关键词网络绘制。选择Emerald数据库采集样本,该数据库于1967年由来自世界著名百所商学院之一Bradford University Management Center的学者建立。主要出版管理学、图书馆学、工程学等专业领域的期刊(出版32种图书馆和信息管理学期刊,其中10种被ISI收录)。在Emerald数据库以("digital resource*"or"digital library*")and construct*and(standard*or criteria*)为检索式在任意字段进行检索,共检出文献1278篇。在VOSviewer中选择在题名摘要字段提取关键词,以共现40次以上的词汇形成共词网络,如图5所示。
图5 外文文献共现40次以上的关键词共词网络
由图5可见,外文文献中关于数字资源建设的标准研究主要涉及对不同标准的理解[3-4]、元数据管理与长期保存[5-7]、数字资源获取方式[10]、基于云计算范式的图书馆电子书采用标准[11]、比较中外同义词库标准[12]、数字图书馆建设与管理中涉及的标准[13-14]、OAI标准[15]、数字资源的保存[16]等方面,研究范围较为宽泛。
综上所述,中文文献中关于数字资源建设的标准研究主要围绕Marc格式、XML格式、SGML格式、互操作格式、元数据等方面,参考的标准主要有ISO、Dublin、Core、Z39.50等。外文文献对于数字资源建设的标准研究主要集中于元数据、文献(馆藏)、资源获取等方面,参考的标准主要有Dublin、OAI等。
以ISO网站及李晶等对ISO数字图书馆标准规范体系内容体系的总结[17]、NISO网站颁布的标准、国家数字图书馆工程建设标准为对象,对比分析不同国家、机构制订的标准,国内外按数字资源生命周期制定的标准或规范在数字资源建设不同阶段的覆盖情况如下。
主要包括数字内容的编码标准、对象标识标准,如ISO10646、GB1803、DOI、EPUB[18]等;WH/T系列包括网络资源、图像、音频资源、视频资源、电子连续性资源、电子图书、古籍、期刊论文、学位论文的元数据规范及WH/T52-2012《管理元数据规范》[9]等。
资源获取与集合生成阶段的资源组织管理标准 主 要 包 括 PIE-J、KBART、DOI、ODI、Z39.2、Z39.71[19]等,国内标准有WH/T系列射频识别数据模型标准及两个待审查标准、WH/T47-2012《图书馆数字资源统计规范》、WH/T48-2012《数字对象唯一标识符》等[9]。
主要包括ISO15836:2009《信息与文献-都柏林核心元数据元素集》、ISO 23081-1:2017《信息与文献-文件管理-文件管理过程-元数据-第1部分:原则》《第2部分-概念与实施问题》[17]等涵盖元数据格式、编码体系、元数据置标等内容的标准,GB/T31219系列图书馆馆藏资源数字化加工规范第2部分:文本资源、第3部分:图像资源、第5部分:视频资源及WH/T系列的文本、图像、音频数据加工规范[9]。
主要包括DOI、DDA、ISO 14721:2012《空间数据和信息传输系统》——开放档案信息系统(OAIS)——参考模型》、WH/T72-2015《图书馆数字资源长期保存信息包封装规范》、WH/Z1-2012《图书馆数字资源长期保存元数据规范》[9]等。
主要包括ISO 25964-1:2011《信息与文献-叙词表及与其他词表的互操作-第1部分:用于信息检索的叙词表》、ISO 25964-2:2013《信息与文献-词库和互操作性与其他词汇-第2部分:互操作性与其他词汇》、ISO 10160:2015《信息与文献-开放系统互连-馆际互借应用服务定义》[17]等。
高校图书馆数字资源的标准化建设应该在图标委框架下以避免出现标准不统一,未来无法与国家标准兼容统一的问题。目前,图标委在数据加工、数字图书馆管理、对象元数据规范、数字资源长期保存4大类制订了25项数字图书馆相关标准,其中22项已发布[9]。
当前,高校图书馆的数字资源主要包括数据库、电子出版物(电子期刊、电子图书、光盘等)、网络资源、新媒体资源等。数据库包括购买的中外文数据库、自建的数据库(如特色资源库、学科导航库、光盘资源库、网络资源库、新媒体资源库等)。对于购买的中外文数据库,可以通过summon等一站式检索平台进行检索,其主要的数字资源建设问题是长期保存。而自建数据库的问题是系统多样、操作困难、数据兼容性与互操作性差、原始数据处理方式不统一等,非常不利于资源的共享。因此,高校图书馆的数字资源建设对于不同类型的数字资源要考虑设计的标准也不同。
高校图书馆应该发挥CALIS联盟共建共享优势,充分考虑用户使用需求,结合数字资源的特性进行评估,积极参与图标委标准制订。在与NISO合作获得标准翻译的授权下,按照图标委筹建中拟定的标准规范体系,考虑数字资源全生命周期各个阶段标准覆盖情况,在已完成的25项标准外重点规划建设下列标准。
江苏师范大学蒲筱哥等以数字资源使用绩效评价的5个准则层为基础,构建了包括收录量、学科覆盖率、权威出版物、检索结果准确性、数字资源适用率、年涨价幅度等23个反映数字资源使用绩效的指标层指标,利用改进熵权法和网络分析法相结合的赋权模型计算被评价数字资源使用绩效指标的组合权重,并应用改进TOPSIS模型对各样本数字资源使用绩效进行了实证分析[20]。张莹(音译)调查来自22个国家学者对数字图书馆整体评价指标的意见后,建立了数字图书馆评估模型,用于数字图书馆的整体评价[21]。Hariri、Nadjla等通过文献比较研究了数字图书馆建设用户界面的评估标准[22]。上述研究仅涉及数字资源绩效评估标准的部分内容,而考虑全生命周期的数字资源绩效评估标准应包括数字图书馆绩效评估标准、电子出版物服务绩效评估标准、二次文献数据库服务绩效标准、自建数据库绩效评估标准等。
可参照ISO15489、ISO9000[23]制定包括数据资源创建、资源获取与集合生成、标识与编目、存储、保存成档以及检索与复用6个阶段的数字资源建设全生命周期管理标准。在管理中避免出现数据孤岛,规范数据格式,保证资源的完整性,注意数字资源的版权保护问题,提高服务、管理与建设效率[24]。
在国际标准基础上,构建中国特色数字资源长期保存的认证标准体系,该体系建设可参照欧盟的ERPANET电子资源存储和获取项目、德国数字资源长期保存项目Nestor、美国数字信息设施保存项目NDIIPP[2]、英国长期保存的应用服务PLANETS和国家数字记忆、澳大利亚数字信息长期保存和利用PADI、荷兰网络化欧洲存储图书馆NEDLIB、日本网络信息保存项目WARP、新西兰联合数字保存战略JDPS[25]等,这些长期保存项目多由国家图书馆主导,而国外很多高校也自主或作为合作方参与到数字保存项目[25]。在数字资源长期保存标准建设中可参照的标准包括OAIS和ISO15489[8]。
作为高校图书馆的协调管理部门,CALIS管理中心可以借鉴国家公共文化数字支撑平台资源共享系统的数字资源建设标准化流程[26],前瞻性地以智慧图书馆[27-28]为研究对象选择上述尚未建立或者尚不完整的方向与国家图书馆合作制定建设标准框架体系,组织协调联盟内各高校图书馆参与编撰上述标准,完成标准制定后先在联盟内各成员馆中试行相关标准,及时就出现的问题进行标准修订,完成修订后通过图标委认证并报请国家标准化管理委员会批准成为正式标准,推广并及时组织贯标、标准培训等工作,使各成员馆可以统一工作标准,按照数字资源全生命周期创建、资源获取与集合生成、标识与编目、存储、保存成档以及检索与复用的6个阶段完成数字资源的呈缴、管理、长期保存等,同时推进联盟内及与公共图书馆、专业图书馆的数字资源共建共享,避免交叉重复研究。
数字资源的建设标准一直是近年国内外的研究热点,在标准建设方面,国内仍存在信息互通不畅的问题,笔者主要利用文献调研及知识图谱等方法研究国内外已发表的文献及相关标准,厘清了数字资源建设全生命周期6阶段标准覆盖情况。同时为避免重复研究,建议高校图书馆数字资源标准建设应利用CALIS联盟优势,与国家图书馆合作,在目前图标委的数字资源建设标准框架下查缺补漏,重点选择6阶段中未制订或制订不完善的标准如数字资源绩效评估标准、数字资源建设全生命周期的管理标准、数字资源长期保存标准进行研究。并且,在标准制定规划中要具有前瞻性,充分考虑未来智慧图书馆的发展需求,力求使研究制订的标准符合智慧图书馆的发展需要。