国外可信数字知识库标准与审计、认证工具研究*

2018-11-28 03:30:30
图书馆论坛 2018年12期
关键词:认证标志知识库指南

随着数据密集型科学范式的兴起,人们对数据开放共享和利用有了更深入的需求。作为重要的科研资源,数据的长期有效保存和安全便利的获取逐渐受到各方关注。近年来,数字知识库(DigitalRepositories,DR)作为保存和共享数据的重要工具得到迅速发展。根据开放存取名录Open DOAR(Directory of Open Access Repositories),截至2018年3月,在其处登记注册的全球数字知识库已经超过三千个[1]。数字知识库的优势是其可信赖性,数据生产者需要安全、稳定、可靠的存储环境,以保证存储的数据得到持续不断的维护;数据使用者需要便捷、专业、权威的获取途径,以便及时获取所需数据。更有一些研究项目资助者规定,其资助项目的研究数据必须存放在可靠的知识库中[2]。因此,数字知识库必须以各种方式建立和维护其可信赖性。

一个值得信赖的数字知识库要能识别系统中的威胁和风险,建立可行的组织体制和战略规划,进行持续的监控和维护,以履行数据长期保存的使命。同时,还需要提升透明度,与用户建立良好的关系,让用户及时了解其发展状态,以期产生更多信任。可信数字知识库建设是一个长期而复杂的过程,需要方法工具的支撑,如标准指南(规范数字知识库内部工作)、专业机构的认证(提升用户认同度)。目前,国外关于数字知识库可信赖性的研究已历经二十多年,建立了较为成熟的标准与审计、认证工具体系。

1 研究回顾

1996年,美国研究图书馆工作组(Research Libraries Group,RLG)发布《数字信息保存:数字信息存档工作组的最终报告》(Preserving Digital Information:Report of the Task Forceon Archiving of Digital Information),报告引入可信数字知识库(Trusted Digital Repositories,TDR)概念,提出要构建一种公开的制度来证明保存机构确实有能力胜任数据长期保存任务[3]。2002年,美国空间数据系统咨询委员会(Consultative Committee for Space Data Systems,CCSDS)发布了开放存档信息系统(Open Archival Information System,OAIS)参考模型[4],该模型为数据长期保存和访问建立了概念框架。同年,RLG和联机计算机图书馆中心(Online Computer Library Center,OCLC)发布了《可信数字知识库:属性和责任》(Trusted Digital Repositories:Attributes and Responsibilities),提出“可信数字知识库的使命是向现在和未来的指定社区提供可靠的、长期的数据访问权托管”[5],从组织体制、管理责任、财务、技术、程序等方面明确了TDR的属性和责任,并提出协作开发数字知识库认证及相关工具的建议。这些研究为后续可信数字知识库标准及相关工具的发展奠定了理论基础。

21世纪初,各国纷纷在前期研究的基础上推出一些工具。其中,RLG与美国国家档案和记录管理局发布的《可信知识库的审计及认证:标准与检查清单》(Trustworthy Repositories Audit&Certification:Criteria and Checklist,TRAC)、德国数字资源长期存储专业网络发布的《可信数字知识库指标目录》(Catalogue of Criteria for Trusted Digital Repositories)在国际上具有较大的影响力。目前,数字知识库的可信赖性工具包括标准、审计、评估、认证等方面,用以规范知识库的发展,协助知识库实现可信性。

国外学者对数字知识库可信赖性工具的发展也开展了相关研究,部分研究关注理论及发展现状,如Jean Dryden[6]、Lee等[7]梳理了数据保存的挑战及数字知识库标准指南的发展脉络,Dobratz 等[8]、Allegrezza[9]对 Nestor目录和数据认可印章(Data Sealof Approval,DSA)的内容、概念和作用进行了研究。部分学者做了实践工作的总结和分析,如Lawson等[10]介绍OCLC开发可信数字知识库工具的经验及其在康涅狄格州立图书馆的使用情况;Johnston[11]着重研究加拿大学者门户、图书馆和档案馆等建立可信数字知识库的情况;另有研究关注数字知识库可信赖性影响因素的分析,如Mchugh等[12]分析数字知识库审计和认证过程中获取证据的重要性;Yoon[13]从用户的角度展开对可信赖性的分析。

国内关于数字知识库可信赖性的研究刚刚起步,主要集中在国外相关政策法规、标准指南和审计认证工具的调研分析上。其中,刘晶晶等[14]对国外通用型数字知识库进行政策调研,分析利益相关方的权利与义务,并提出建立审核机制、制定数据识别标准、颁布传播使用规定等建议。杨璐[15]、何欢欢[16]、韩珂等[17]研究可信数字知识库认证的必要性、主体和认证体系,着重介绍OAIS模型及TRAC。伏安娜等[18]则通过分析DSA的评估指南、流程和工具,提出有关我国科学数据共享可信赖标准制定的建议。吴振新[19]梳理数字资源长期保存可信赖认证研究的发展脉络,总结出认证的组成基本要素:组织、数字对象管理和基础设施。

综合来看,国内外学者对数字知识库的可信赖性都较为重视,但大部分研究偏重于发展情况的梳理或者某一类工具的介绍,缺少系统介绍和综合分析。本文调研国外促进数字知识库可信赖性建设的标准与工具,将其按照不同功能进行分类,分别论述其内容及作用,分析其发展特点和趋势,以期对我国可信数字知识库标准及相关工具的开发和利用有所助益。

2 可信数字知识库标准与审计、认证工具概述

可信数字知识库标准发展较早,从2002年OAIS发布至今,已产生多个版本的标准指南。标准指南对规范数字知识库的发展具有指引作用。为有效发挥标准指南的作用,让其落实到可信数字知识库的建设上,一些机构开发了不同种类的审计、认证工具,它们和作为其理论基础的标准指南一起构成了数字知识库可信赖性工具体系。

本文以国内外现有相关研究为线索,调研国外研究数据长期保存的专业机构和项目组,从其官网上获取有关可信数字知识库标准及审计、认证工具的具体内容,搜集目前国际上较有影响力的可信数字知识库标准与工具,详见表1。这些工具的内容和形式有所不同,但主要可分为三种类型:(1)标准指南,即建立数字知识库发展指标和目录清单等,用以规范发展,如TRAC、Nestor目录以及随后的国际标准ISO 16363和德国国家标准DIN 31644,均设置了层级分明的数字知识库发展指标体系;(2)审计工具,即依据标准指南制定的评估表格、清单或在线评估系统等,用以协助审计师对数据知识库工作进行审计,如英国数字长期保存中心(Digital Curation Centre,DCC)和欧洲数字保存项目(Digital Preservation Europe,DPE)发布的《基于风险管理的数字知识库审计方法》(Digital Repository Audit Method Based On Risk Assessment,DRAMBORA)提供方便可用的DRAMBORA审计工具包;(3)认证服务,在自我评估和审计的基础上提供认证服务。数字知识库可申请认证,经过权威组织的评估审核后获得认证标志,并按时更新认证(证书)。DSA和欧洲数字知识库审核与认证框架设置了严格的认证流程,并提供权威的认证标志。值得注意的是,这三种功能是互相依存、层层递进的。标准指南是理论基础,审计工具的设置依据是标准指南,而认证服务开展之前一般也需要经过严格的自我评估和审计。数字知识库可信赖性工具一般具有两到三种功能,并趋向于流程化和体系化。

表1 国外具有代表性的可信数字知识库标准与审计、认证工具

3 可信数字知识库标准与审计、认证工具的内容及作用

3.1 标准指南

标准指南对于规范数字知识库具有指引作用,是促进数字知识库可信身份建设的基础。相关标准指南主要涵盖两个方面的内容,即保存、访问、描述、获取等数据知识库的核心功能和财务、管理制度及技术设施等普通的组织运营功能。国外可信数字知识库标准指南可分为详细清单和核心标准两类。

(1)详细清单类。此类标准指南覆盖面较广,设置层级分明的指标体系,列举数字知识库相关的详尽指标,并且每一个指标皆附有解释说明及最低要求。以TRAC指标、Nestor目录为例,两者的指标体系框架较为相似,都从组织基础设施、数字对象管理和基础技术设施与安全三大方面展开,详细的二级指标见表2。TRAC指标设有3项一级指标,14项二级指标,84项具体评估标准,并列举符合每条标准的证据示例。Nestor目录下设34项具体评估标准,基本框架和TRAC相似,也为每一条标准提供了解释说明,并给出最低分数要求及相关问题、文献。这类标准指南较为全面,可根据提供的清单进行细节评估和改善,但花费时间较多,适用于基础性、全面性的指引和评估工作。

表2 TRAC指标和Nestor目录指标体系

(2)核心标准类。此类标准只列出数字知识库发展的核心要求,在详细标准指南基础上总结出数字知识库必须满足的最低要求,内容简练,指标数量一般较少。数据认可印章(DSA)从前人设立的数字知识库标准指南中提取16条评估指南,见表3。DSA认为数字知识库应确保数据生产者和数据使用者遵守指南,如果数字知识库符合指南4-13,且其数据生产者和使用者均遵守指南1-3和14-16,则被认定为信数字知识库。2007年,由RLG、Nestor、DCC、DPE联合提出的十项原则是目前最为精简的数字知识库核心要求,包含长期保存、组织适应性、数字对象管理、基础设施与安全、战略与传播等方面,具体见表4。可信数字知识库必须满足这十大基本特征。

两种类型的标准指南详略不同,但内容框架基本一致,都具有较强的指引作用,数字知识库可根据需求选择详细版本或核心条目。整体来说,标准指南的理论指导意义较强,应用于审计和认证实践时,对使用人员的素养要求较高,需要结合审计工具一起使用。

表3 DSA16条指南[22]

表4 数字知识库十项原则[23]

3.2 审计工具

信息系统审计是指对信息技术基础设施内部的管理控制进行检查,以获得证据来评估信息系统是否能保护资产、维护数据的完整性,并通过有效运作实现组织的目标[24]。数字知识库的审计工作主要依据于数字知识库标准指南,审计工具是为协助数字知识库工作人员或者外部审计师使用标准指南进行评估及审计而建立的模板和清单等。

DRAMBORA是DCC和DPE于2007年发布的比较有代表性的数字知识库审计工具,目的是方便审计人员确定和识别数字知识库的任务、活动和资产等,确定各个环节可能出现的风险,通过评估和计算风险,确定风险管理措施,进行内部审计[25]。DRAMBORA工具包的设计基于TRAC和Nestor目录标准,同时参考2006年DCC的数字知识库审计经验。目前工具包较为简单,注册用户能从其网站下载离线版文档,内容包含工具包简介、审计过程说明、审计问题清单(见表5)、风险登记表及示例等,便于用户掌握其设计思路和使用方法。

DRAMBORA工具包的核心是风险管理,围绕这个核心设计了一系列简便可用的审计工具,且对工具包设计思路和使用方法有详细的解释,易于理解,实用性较强。DRAMBORA工具包第二版将设计为一个交互式网站,设置有半自动化的工作流机制,及预填写的字段选项、示例、建议等指导材料。这种半自动化的设计将会提高审计工作的效率。

表5DRAMBORA审计问题清单

除了DRAMBORA这类专门的审计工具包外,部分标准规范也附带了简易的表格工具。比如,TRAC为其全部指标设置了审计表格,以便于数字知识库审计人员填写。审计表格样式见图1,格式清晰,使用较为简单,不论是内部工作人员还是外部审计师都可以便捷地填写审计表格,梳理数字知识库各项指标,发现存在的问题。

审计工具是基于标准指南的辅助性工具,用以帮助用户理解和使用标准指南,对数字知识库进行评估和审计。依据不同版本标准指南设立的审计工具,内容形式有所差别,但用户皆能方便地获取和使用,而审计工具的电子化也将会给用户带来更大便利。

3.3 认证服务

数字知识库的审计可以由内部工作人员或者第三方审计师完成,而认证则是更进一步的评价活动,需要得到国际上相关机构正式的、公开的、客观的认可。通过认证的知识库将会获得权威性的认证标志,以向外界表明其可信赖性。认证流程一般包括认证材料提交、自我评估、同行评审、颁发认证标志、更新认证等环节。目前ISO 16363认证委员会、DSA、Nestor等机构都有认证服务,并为通过认证的组织提供认证标志。

DSA的认证流程主要在DSA在线系统完成,申请人登陆系统即可看到DSA评估指南,需要按照指引完成自我评估。自我评估完成后,下一步为同行评审,设有两个月期限,审核通过后即可收到DSA印章,同时通过认证的组织名单也将会在DSA网站上公布。DSA印章标注了两年时间,如要获得最新的印章,则需定期更新认证。ISO 16363作为广为接受的认证标准,专门成立了认证委员会(PrimaryTrustworthy Digital Repositories AuthorisationBody,PTAB)。PTAB认证遵循国际认证标准ISO 17021(《合格评定:提供管理体系审核和认证机构的要求》)的规定,主要流程见图2。知识库通过认证后,便获得PTAB的认证标志,可在组织文件、网站、广告等上使用。

2010年成立的欧洲数字知识库审核与认证框架[27]是一个合作性的认证综合框架,有三个层次:(1)基本认证,通过DSA认证即获得基本认证;(2)扩展认证,通过基本认证后,依据ISO 16363或DIN 31644进行结构化的外部审核,并公开审核结果;(3)正式认证,通过ISO 16363或DIN 31644的全面性外部审核和认证。三层框架集合了RAC、DSA、DIN三个专业组织之力,是一个综合性的认证机制,更具权威性和可信性。

总之,认证服务是在内部评估和审计的基础上进行的更为公开的活动。由于权威组织的参与,其公开性、透明性和可信性更高。对于参与认证的数字知识库来说,获取相关服务和认证标志能促进其内部发展和外部传播。随着各类认证实践的开展,目前认证服务积累了更多经验,流程也愈加成熟,专业性认证委员会和认证标准规范的出现也提升了认证服务的质量,可以预见未来专业化的综合认证体系将成为促进数字知识库可信赖性建设的重要工具。

4 可信数字知识库标准与审计、认证工具的特点

(1)公开性。国外可信数字知识库的标准与工具皆在网上进行信息公开,用户可以获取其具体内容,包括已认证数字知识库的公开报告等。此外,还可获取有关工具制定和使用的信息,包括制定组织、制定流程、专家人员、使用方法和发展情况等。公开透明是建立信任的基础。工具信息的公开透明一方面便于数字知识库工作人员及时获取信息,了解工具的使用方法,以应用于实践;另一方面也能够让用户明白工具的使命和价值,增加对获此工具认证的数字知识库的信任。

(2)发展性。可信数字知识库标准与审计、认证工具一直在不断发展和完善。其制定和发布都要经历较长的时间,且需结合组织内部数据保存的相关工作实践。例如,TRAC的最终版在2007年正式发布,在此之前RLG于2005-2006年间开展了多个数字知识库的审计测试,从实践中吸取经验,完善TRAC清单。工具制定和发布之后,仍然要不断完善,尤其是审计及认证工具,需在实际操作中发现问题并进行优化。目前,合作发展已成为趋势,很多组织机构都开始寻求与其他组织合作,以集合多方之力促进现有标准和审计、认证工具的发展。比如,2017年DSA联合ICSU世界数据系统(The ICSU World Data System,ICSU-WDS)成立新的认证机构Core Trust Seal,以打造新的品牌和构建新的治理模式,并用Core Trust Seal数字知识库认证取代DSA认证和ICSU-WDS定期成员认证。除此之外,数字知识库十项原则、欧洲数字知识库审核与认证框架等都是合作发展的成果。数字知识库的发展随着时代的变化而变化,因此可信赖工具持续不断的完善是其适应数字知识库发展的必然结果。

(3)可信赖性。一个具有可信度的专业组织所制定的工具会更容易得到用户的信赖。RLG、DCC、Nestor、DANS等是各国数据保存共享领域经验丰富的组织机构和项目,聚集了一批该领域的专家人才,长期从事数据保存研究和实践工作,具有较强的权威性、专业性和可信赖性。这些组织机构的共同特点是:有清晰的组织目标及战略规划、体系化的组织管理结构、提供数据保存相关的资源和服务、积极与其他组织合作等。例如,2004年成立的DCC设有明确的阶段战略规划,每个阶段设有不同的任务重点;经过十几年的发展,DCC在数据长期保存方面积累了丰富的经验,其制定的标准规范和相关工具受到多方认可。DANS成立于2005年,提供数据管理、长期存档及科学信息门户等服务。DANS目前有56名员工,设有项目开发、数据管理、软件开发、培训等岗位,形成层级分明的组织结构,为可信数字知识库工具的发展提供了强有力的组织和制度保障。

(4)时效性。数字知识库可信赖性的建立不是一劳永逸的。为了保持可信赖的地位,数字知识库需定期进行审计和认证。可信赖性工具的时效性目前主要体现在认证有效期上,一般为2年,显示在认证标志上。到期后,数字知识库需要决定是否更新认证。比如,DSA的认证标志上直接标记了两年期限,期满后需要重新申请审核才能获取新的标志。通过PTAB认证后的组织,需在前两年每年做一次小型的审核,并于第三年进行全面的重新认证。也许只有当一个数字知识库积累了足够的用户信任度,建立了牢固的信任关系,才可以免去定期认证和审核的麻烦。但这需要长期的努力,目前还未能实现。

(5)体系化。数字知识库的标准指南较为丰富,涵盖各国研发的标准清单、国际标准规范及合作研发的核心标准等。在标准指南日益成熟的基础上,近年来的工作重点是体系化的认证流程建设——以权威的标准规范为基础,包括自我审计、专家审计、认证标志的提供和更新等阶段。除了单次认证流程的完善,数字知识库的认证也形成了有层次的综合体系,包括初级、拓展和正式认证等层级。综合认证体系集合多方资源,提供不同程度的保障,极大地提升了数字知识库的可信度。

5 结语

国外对数据长期保存的质量和安全一直较为重视,发布了多种提升数字知识库可信赖性的工具,并开展了相关实践。总的来说,维护数字知识库的可信状态主要从三个方面入手:建设具有基础性指引作用的标准指南,构建辅助实践的审计工具以及提供公开透明的认证服务。三者相辅相成,共同构成系统化的工具体系。

各类工具仍在实践中不断发展演变,各国相关专业组织已从独立研究逐步走向目前的联盟合作,合力打造更权威、更可信的认证工具,促进了统一的国际化标准指南和工具的发展。同时,专业的认证委员会相继成立,认证流程和服务的标准也开始出现,这些都提升了数字知识库可信赖性标准与工具的可信度。各类工具也从离线文本向半自动化在线工具发展,有利于提高审计、认证的质量和效率。随着服务体系的完善,认证需要投入较多的人力、物力、财力,而定制付费服务也成为趋势。收费服务为数字知识库标准与审计、认证工具的发展提供经费保障,从而有利于组织机构的可持续发展。

我国数字知识库的发展刚刚起步,相关的标准指南和审计认证工具较少。因此,我们需要增强数据保存质量控制的意识,加强对数字知识库可信赖性保障的重视,学习和研究国外的经验,提供政策、制度、经费等方面的支持,建立专业的研究机构或者项目组,汇集相关领域专业人才参与研究与实践。在工具体系的开发上,需要先建立基础性的标准指南,具体可参照目前已有的国际标准并结合我国数字知识库的工作实践;在适用的标准指南的基础上开发审计工具,建立内容评估、外部评审、公开认证等一系列流程服务。此外,还需着重关注各类工具本身的可信度,其组织信息、开发进展、使用情况等都应公开以便用户查询。数字知识库的可信赖性是一个循序渐进的过程,需抱有开放的心态,积极参与国际数据长期保存等相关领域的研究和实践;在提升自我的同时,为促进国际标准规范及相应工具的发展做出贡献。

猜你喜欢
认证标志知识库指南
“标准引领、分类培养”的高端技能型IT人才培养创新实践
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
指南数读
电视指南(2016年12期)2017-02-05 15:08:06
新西兰:鼓励消费者检查有机产品认证标志
高速公路信息系统维护知识库的建立和应用
论碰撞的混搭指南
Coco薇(2015年12期)2015-12-10 02:55:48
基于Drupal发布学者知识库关联数据的研究
图书馆研究(2015年5期)2015-12-07 04:05:48
三招轻松选购节能灯
质量探索(2014年3期)2014-02-22 06:13:34
有机产品实行认证标志备案系统
中国农资(2012年9期)2012-01-29 15:36:46
位置与方向测试题