姚静
(中国人民大学信息资源管理学院 北京 100872)
近年来,数字技术的飞速发展丰富着档案的内涵与外延,扩展着档案的类型、载体,以及管理手段、管理工具和管理空间。从“三态两化”角度对当前档案标准体系的建设现状进行系统性梳理,能够为档案标准体系的把握和解读提供新的视角,有利于避免对于档案标准体系建设的认识处于混乱状态,符合数字化转型的长远目标。
目前关于档案标准体系建设的已有研究主要包括以下4种:其一,我国档案标准化工作和档案标准体系建设的宏观研究。例如,陈忠海等人对我国档案标准化工作现状展开调查,并就存在问题进行分析[1];倪晓春和王英玮对我国档案标准体系的建设历程进行回顾,并提出应当构建适应发展需求的新体系[2];倪晓春按照层级类别将体系划分为基础层、操作层和战略层,其中操作层的模型构建基于管理视角,是体系的核心部分[3]。其二,特定领域档案标准体系建设的微观解读。例如,张美芳和陈敏探讨了我国古籍、档案修复技术标准体系建设情况[4];黄丽华根据档案保护全流程及主要工作,从预防性保护和治理性保护的角度,提出了今后档案保护标准建设基本框架和发展趋势[5]。其三,国外档案标准化工作的实践探析与经验启示。例如,赵屹等人对美军档案工作标准及其特点展开研究[6];陈丽霖研究了英国文件档案管理标准体系的典型案例,提出从法律层次、管理层次和基础层次构建我国文件档案管理标准体系[7]。其四,档案信息化标准体系建设研究。杨安莲从业务、技术、管理、评估等维度提出数字档案馆标准体系的构建框架[8];冯建周从层次领域、档案管理、信息技术维度构建了档案信息化标准体系的三维框架模型[9];程妍妍则运用功能分析法,结合生命周期视角,解析了我国数字档案馆标准规范体系的具体内容[10]。
综上可知,已有宏观研究旨在树立档案标准体系构建原则,缺乏针对档案标准体系框架的梳理与划分;已有微观研究视角局限在档案门类、业务功能、生命周期等常规维度,需要更新对档案标准体系的系统性认知,为档案标准体系建设提供助力。对此,笔者以“三态两化”理论为视角,结合“静态”的档案形态与“动态”的转化趋势,提出如下研究问题:“三态两化”视角下的我国档案标准体系建设现状如何?未来应该如何发展?
“三态两化”的概念最早于2018年由中国人民大学的钱毅教授提出,他将不同技术环境所对应的档案对象管理空间阐述为“三态”(模拟态、数字态、数据态),并将三态之间的转换过程概括为“两化”(数字化和数据化)[11]。“三态”与“两化”之间是一静一动的关系(如图1所示),具体概念与内涵如下:
图1 “三态两化”概念关系图
一方面,“三态”包括模拟态、数字态和数据态。模拟态档案是以模拟信号进行记录和保存的档案管理对象[12],具有载体与信息统一的特质,包括甲骨、金石、竹简、纸张、胶片等多种传统档案类型,模拟态档案标准以规范档案载体实体管理为主要目的的准则和依据,事由涉及整理、接收、著录、分类、统计、利用、保管、销毁等操作。数字态档案是以离散的数字信号进行记录和保存的信息[13],包括档案数字化成果和原生数字形态档案两种情形。数字态档案实质上实现了资源描述方式的电子化,管理对象涉及电子公文、电子邮件、电子合同、数码照片、网页、电子政务审批文件等,旨在维护其真实性、完整性、可用性、安全性与长期保存。数据态档案是“大智移云物”技术推动形成的、以数据颗粒度存在并持续运转形成的档案[14],重在对数据规则、本体、模型的管理。数据态档案的原件形式为“数据体+规则+参数形成的快照”,包括二次文献数据库、语料库、知识库、媒体资源库、关系型数据库、GIS文件、BIM系统、三维数据、数字交付模型等。
另一方面,“两化”包括数字化和数据化。档案数字化是指将档案模拟信号转化为计算机可处理、以0和1表示的二进制代码的过程[15]。从广义上讲,数字化的档案标准涵盖了数字化扫描、档案目录数字化、全文数字化、系统平台建设、电子文件管理,以及光盘、缩微胶片等档案数字化转型的相关内容。档案数据化是档案数字化发展的新阶段,旨在将数字态档案资源转化可阅读、分析和处理的数据态档案资源[16]。标准内容覆盖全文数据化、光学识别、语义识别、语义表达、本体描述、关联建设,以及数据著录、抽取与挂接等。
以“三态两化”视角考察我国档案标准体系的建设情况,具有适应时代发展的必要性,以及在档案管理对象与空间层面的可行性。一方面,以“三态两化”为视角考察我国档案标准体系建设情况是必要的。以“三态两化”视角对档案对象进行审视,符合我国当前档案工作从纸质时代转向电子时代的档案对象空间变革趋势,有利于构建新技术环境下多层次的档案资源观。从实践意义来看,档案标准体系的制定和运维以档案态别为考察对象,以便从宏观上查漏补缺、增删平衡,有利于完善优化档案标准的内部结构。另一方面,以“三态两化”为视角考察我国档案标准体系建设情况是可行的。对象是管理活动的客体,空间是管理活动的场景,档案管理对象和档案管理空间是档案管理活动必不可少的构成要素。“三态两化”作为对于档案管理对象(模拟态、数字态、数据态)和档案管理空间(数字化、数据化)的本质属性的提炼,在逻辑上能够涵盖已有档案工作中存在的各种情况,具有理论合理性与实践可行性。
为确保可行性与准确性,笔者将“三态两化”视角下档案标准的梳理条件限定为:(1)国家标准(GB)或行业标准(DA);(2)以国家档案局官方网站的档案标准库公示结果为准[17];(3)属于典型的“三态两化”管理对象和管理空间。截至2021年4月10日,调研发现目前标准序列的101个国家标准或行业标准中,有62个标准可以纳入“三态两化”范畴,其中“三态”标准52个,“两化”标准10个(如表1所示)。结合标准内容判断,现有标准体系呈现出“模拟态标准基本完备,数字态(化)标准初具雏形,数据态(化)标准起步萌芽”的总体特征,符合技术发展的演进路线。此外,“三态”档案标准数量比“两化”档案标准数量更多,体现出我国目前的档案标准化工作更加侧重于对静态的档案形态予以规范。
表1 “三态两化”视角下的档案标准体系现状
12 2003年4月1日 2002年11月29日 DA/T 29-2002档案缩微品制作记录格式和要求13 2003年5月1日 2002年12月4日 GB/T 11821-2002 照片档案管理规范14 2008年9月1日 2008年6月20日 DA/T 39-2008 会计档案案卷格式15 2008年9月1日 2008年6月20日 DA/T 40-2008 印章档案整理规则16 2013年1月1日 2012年11月15日 DA/T 12-2012 全宗卷规范17 2015年8月1日 2014年12月31日 DA/T 55-2014 特藏档案库基本要求18 2017年8月2日 2018年1月1日 DA/T 65-2017档案密集架智能管理系统技术要求19 2018年1月1日 2017年8月2日 DA/T 35-2017 档案虫霉防治一般规则20 2018年1月1日 2017年8月2日 DA/T 60-2017纸质档案真空充氮密封包装技术要求21 2018年1月1日 2017年8月2日 DA/T 61-2017明清纸质档案病害分类与图示22 2018年1月1日 2017年8月2日 DA/T 64.1-2017纸质档案抢救与修复规范 第1部分:破损等级的划分23 2018年1月1日 2017年8月2日 DA/T 64.2-2017纸质档案抢救与修复规范 第2部分:档案保存状况的调查方法24 2018年1月1日 2017年8月2日 DA/T 64.3-2017纸质档案抢救与修复规范 第3部分:修复质量要求25 2018年10月1日 2018年4月8日 DA/Z 64.4-2018纸质档案抢救与修复规范 第4部分:修复操作指南26 2018年10月1日 2018年4月8日 DA/T 69-2018 纸质归档文件装订规范27 2019年9月1日 2019年3月4日 DA/T 75-2019档案数据硬磁盘离线存储管理规范序号 实施日期 批准日期 编号 名称 态别1 2010年1月1日 2009年11月2日 DA/T 43-2009 缩微胶片数字化技术规范 数字化(10个)
2 2010年1月1日 2009年11月2日 DA/T 44-2009数字档案信息输出到缩微胶片上的技术规范3 2013年1月1日 2012年11月15日 DA/T 49-2012特殊和超大尺寸纸质档案数字图像输出到缩微胶片上的技术规范4 2015年8月1日 2014年12月31日 DA/T 52-2014 档案数字化光盘标识规范5 2015年8月1日 2014年12月31日 DA/T 53-2014 数字档案COM和COLD技术规范6 2018年1月1日 2017年8月2日 DA/T 31-2017 纸质档案数字化规范7 2018年1月1日 2017年8月2日 DA/T 62-2017 录音录像档案数字化规范8 2018年10月1日 2018年4月8日 DA/T 71-2018纸质档案缩微数字一体化技术规范9 2020年5月1日 2019年12月16日 DA/T 77-2019 纸质档案数字复制件光学字符识别(OCR)工作规范10 2020年6月1日 2020年5月18日 DA/T 68.2-2020档案服务外包工作规范 第2部分:档案数字化服务序号 实施日期 批准日期 编号 名称 态别1 1996年10月1日 1996年3月1日 DA/T 15-1995磁性载体档案管理与保护规范2 1999年10月1日 1999年2月26日 GB/T 17678.1-1999 CAD电子文件光盘存储、归档与档案管理要求 第一部分:电子文件归档与档案管理3 1999年12月1日 1999年5月31日 DA/T 20.1-1999民国档案目录中心数据采集标准 民国档案著录细则4 2005年9月1日 2005年4月30日 DA/T 32-2005公务电子邮件归档与管理规则5 2008年7月1日 2008年4月23日 DA/T 38-2008电子文件归档光盘技术要求和应用规范数字态(22个)6 2010年6月1日 2009年12月16日 DA/T 46-2009 文书类电子文件元数据方案7 2010年6月1日 2009年12月16日 DA/T 47-2009版式电子文件长期保存格式需求8 2011年6月1日 2011年1月14日 GB/T 26163.1-2010信息与文献——文件管理——文件元数据 第1部分:原则
9 2015年8月1日 2014年12月31日 DA/T 50-2014 数码照片归档与管理规范10 2015年8月1日 2014年12月31日 DA/T 54-2014 照片类电子档案元数据方案11 2015年8月1日 2014年12月31日 DA/T 56-2014 档案信息系统运行维护规范12 2015年8月1日 2014年12月31日 DA/T 58-2014 电子档案管理基本术语13 2017年3月1日 2016年8月29日 GB/T 18894-2016电子文件归档与电子档案管理规范14 2018年1月1日 2017年8月2日 DA/T 63-2017录音录像类电子档案元数据方案15 2018年10月1日 2018年4月8日 DA/T 70-2018文书类电子档案检测一般要求16 2019年9月1日 2019年3月4日 DA/T 74-2019电子档案存储用可录类蓝光光盘(BD-R)技术要求和应用规范17 2019年9月1日 2019年3月4日 DA/T 73-2019 档案移动服务平台建设指南18 2020年5月1日 2019年12月16日 DA/T 85-2019政务服务事项电子文件归档规范19 2020年5月1日 2019年12月16日 DA/T 83-2019档案数据存储用LTO磁带应用规范20 2020年5月1日 2019年12月16日 DA/T 80-2019 政府网站网页归档指南21 2020年5月1日 2019年12月16日 DA/T 78-2019 录音录像档案管理规范22 2021年6月1日 2020年11月19日 GB/T 39362-2020 党政机关电子公文归档规范序号 实施日期 批准日期 编号 名称 态别1 2009年12月16日 2010年6月1日 DA/T 48-2009基于XML的电子文件封装规范2 2015年8月1日 2014年12月31日 DA/T 57-2014 档案关系型数据库转换为XML文件的技术规范数据态(3个)3 2020年5月1日 2019年12月16日 DA/T 82-2019基于文档型非关系型数据库的档案数据存储规范
模拟态档案标准的管理对象与流程范围极广,在管理空间要素和业务流程的覆盖方面呈现出基本完备的特点。一方面,模拟态档案标准的管理空间要素包括传统的纸质档案、档案缩微品、照片档案、印章档案等多种类型。例如,《档案缩微品保管规范》(DA/T 21-1999)就对档案缩微胶片的保管提出了温湿度控制、胶片包装方式等一系列要求;《印章档案整理规则》(DA/T 40-2008)则是将印章这种具有特殊载体形态的档案作为管理对象,对其提出了整理原则和质量要求等。另一方面,模拟态档案标准的流程范围涉及档案整理、归档、著录、分类、统计、利用、保管、修复、抢救、销毁等一系列业务流程。例如,针对归档工作而制定的《纸质归档文件装订规范》(DA/T 69-2018),针对档案修复和抢救而制定的《纸质档案抢救与修复规范 第1部分:破损等级的划分》(DA/T 64.3-2017)。
最早的模拟态档案标准发布于1992年,此后近30年的时间内,相关标准的发布时间较为均匀,且未来还将不断修订与补充完善。具体而言,未来发展方向包括两个方面:一方面,技术进步要求做好已制定标准的定期审查与修订工作。模拟态档案的形成时间相对较早,管理活动由来已久,相应标准也制定较早,而档案管理环境的发展变化要求相应标准与时俱进。例如,近年来纸质文献的修复与抢救技术不断改善,2018年先后出台了《纸质档案抢救与修复规范》的一系列标准。然而,虽然2001年全国档案工作标准化技术委员会第九次年会通过了对《缩微摄影技术 在16mm卷片上拍摄档案的规定》(DA/T 4-1992)的修订计划[18],但并未取得明显改变,且距今已近20年未再次修订。对此,国家档案局、全国标准化技术委员会等归口单位应当严格按照“每满5年复审”的原则,做好模拟态档案标准的定期审查与修订工作[19]。另一方面,结合现实需求补充制定模拟态档案标准。从内容主题来看,以《档案密集架智能管理系统技术要求》(DA/T 65-2017)为代表的标准也体现出模拟态档案标准的关注重点逐渐从档案载体本身扩展到档案库房建设、智能管理系统技术等方面的特点。
从国家统计数据也可一窥40年来我国农药工业由小到大、由弱到强的华丽蜕变。改革开放初期,我国农药工业较为薄弱,年产量约为53万吨,品种较少且以高毒农药为主,很多农药品种需要依赖进口。经过40年发展,我国已成为世界最大的农药生产国,能生产500多种原药、几十种剂型,且环境友好型农药成为主流;2017年累计生产农药294.1万吨,农药行业主营业务收入达到3080亿元、利润总额260亿元,在解决中国人吃饭的大问题上功不可没。
数字态档案标准顺应数字转型浪潮,制定已初具雏形。从内容来看,数字态档案标准围绕电子公文、电子邮件、数码照片、录音录像、网页文件等数字态档案的归档、封装、分类、标引、存储等业务活动展开,强调元数据方案和数据交换格式的规范性、电子文件的长期保存,以及真实性、完整性、可用性、安全性的检测等方面的重点内容。例如,《文书类电子档案检测一般要求》(DA/T 70-2018)从检测内容和检测方案两个方面对电子文件的四性检测工作提出了具体要求。
数字态档案标准集中于2010年代至今,发布与实施时间跨度从1996年持续到2021年,呈现出“突飞猛进”的发展趋势。数字态档案管理工作本身具有很强的技术依赖性,在“标准先行”概念广为推行的当今,数字态档案标准更应当紧密结合新兴技术的发展。
首先,借助数字态档案标准实现技术赋能。随着区块链技术的兴起,学者提出“应用现有区块链技术框架”和“开展档案适应性技术研发”两种文件档案部门主动应用区块链的思路[20],中国石油化工集团有限公司等大型企业也开展了利用区块链进行电子文件管理的实践[21]。然而从相关标准的制定情况来看,目前仅有国家互联网应急中心牵头推进的《区块链技术架构安全要求》、中国电子技术标准化研究院牵头制定的《区块链系统的标准数据格式》出台,相较于企业积极参与区块链标准制定的身影而言,我国档案部门发声不足。
其次,数字态档案标准服务于行业应用。电子发票作为近年来电商行业、税务部门与档案部门重点关注的话题,相关标准也陆续出台并实施。例如国家市场监督管理总局、中国国家标准化管理委员会发布的《电子发票基础信息规范》、国家税务总局发布的《企业自建和第三方电子发票服务平台建设标准规范》,均针对电子发票的编制规范和信息描述作出规定。对此,国家档案局仅发布《关于规范电子会计凭证报销入账归档的通知》,缺少标准相关的规定。
最后,数字态档案标准辅助系统建设。信息系统建设和服务是信息化建设中不可或缺的重要环节,信息系统建设和服务能力评估体系标准的制定有助于科学评价建设和服务提供者的能力水平,促进信息化建设质量的提升,然而目前我国仅有个别团体标准对其进行了规定,缺少相关的档案标准。上述事例均提醒档案部门今后应与时俱进开展数字态标准化工作,快速适应并指导解决电子文件管理过程中出现的新问题、新变化。
数据态标准侧重于数据转换和规则、本体、模型管理,呈现出起步萌芽状态。从内容来看,数据态档案标准围绕基于XML的电子文件封装与转换、基于文档型非关系型数据库的档案数据存储展开。《基于XML的电子文件封装规范》(DA/T 48-2009)规定了电子文件封装的格式和要求,以确保生成电子文件交换、长期保存和利用的有效形式。具体而言,该标准规定利用XML语言将电子文件与其元数据按照规范结构封装在一个数据包中,以维护电子文件与其元数据的完整性,并保障两者之间的可靠联系,实现电子文件自包含、自描述和自证明。
从时间来看,数据态档案标准集中实施于2010年代至今,这也说明近年来我国档案行业逐步适应“大智移云物”技术对档案管理工作带来的革新,开始重视档案资源的可阅读、可分析和可处理能力,然而当前数据态档案标准数量较少。 综合数据态标准在内容和时间维度的发展现状,笔者提出以下建议:
一方面,档案部门要转变档案标准化工作的观念。档案管理观念和意识的转变是提升档案管理工作质量和效率的前提和基础,当前档案部门对于信息技术应用、数据库建设、模型与框架参考、语义描述、本体构建、关联分析、三维数据存储等数据态档案的管理实践还处于初级探索阶段,一定程度上落后于网络技术及其所带来的观念变革,对此档案部门需要在观念上完成由“数字态”向“数据态”的转移[22],积极尝试与探索性开展数据态档案的制定工作。另一方面,档案部门应当积极借鉴与参考其他行业的相关标准。从其他行业的标准化工作进展来看,我国智能交通领域早在2005年就修改采用了“Intelligent transportation systems-Geographic Data Files(GDF)-Overall data specification”(ISO14825:2004),发布《导航地理数据模型与交换格式》(GB/T 19711-2005),以实现对地图数据库建设与数据交换活动的规范化管理。此外,机械工业领域也于2009年出台《工业自动化系统与集成产品数据表达与交换》(GB/T16656)系列标准。上述实践也启示档案部门可以集思广益,合理借鉴与吸纳其他行业的先进经验,逐步建立起涵盖二次文献数据库、语料库、知识库、媒体资源库、关系型数据库等标准化工具和架构,以及GIS文件、BIM系统、三维数据、数字交付模型等内容的数据态档案管理算法、公式和规则。
数字化档案标准的制定与数字时代的背景紧密结合,呈现方兴未艾的特征。20世纪90年代,我国档案信息化建设正式拉开序幕,档案工作开始从模拟时代迈向数字时代,档案数字化成为数字时代档案工作的重要内容[23]。
从内容来看,档案数字化标准既强调对纸质文件和缩微胶片等模拟态档案的数字化扫描、识别、复制、输出,还重视录音录像档案的保存、光盘存储与标识、信息系统与服务平台的建设、数字化外包服务的管理等方面内容。例如,《纸质档案数字化规范》(DA/T 31-2017)从组织与管理、数字化前处理、技术参数、图像处理和成果验收等方面对纸质档案数字化的加工处理过程进行了规范。此外值得注意的是,“反向数字化”操作在档案数字化标准中得到明显体现,即采用数字化输出技术,使数字态档案转换为模拟态档案进行双套备份保管。例如《数字档案信息输出到缩微胶片上的技术规范》(DA/T 44-2009)规定了数字档案信息输出到16mm和35mm卷式黑白缩微胶片上的一般要求。
档案数字化标准的发布与实施集中于2010年至今。截至目前,2010年至2020年期间是档案工作从模拟时代迈向数字时代的高峰期,且可以推测这种方兴未艾的标准化工作趋势仍将在2020年及之后持续较长时间。从发展趋势来看,档案数字化工作从最初的扫描、识别、复制、输出发展至今,相关技术已日益成熟,对应的管理规范也较为齐全,故今后档案数字化工作将朝向更加灵活、高效、优质、创新的路径转型,从侧重技术转向侧重管理,这也要求标准化工作与之配套。
其一,加强档案数字化外包服务规范力度。随着社会上档案外包服务队伍的日益壮大,越来越多的政府机构和企事业单位选择服务外包的方式完成纸质档案的数字化工作。然而,我国档案数字化外包服务却存在数字化成果质量难以保障、返工率偏高[24]、秘密或隐私泄露等问题。我国目前虽然已经出台《档案服务外包工作规范:档案数字化服务》(DA/T 68.2-2020),但仍然缺乏针对秘密或隐私保护的档案数字化服务外包条款内容,这也是今后档案数字化标准制定的改进方向。
其二,加强电子文件的证据价值和法律效力。在传统的档案管理观念中,只有纸质档案才是具有最高证据价值和法律效力的正本,而数字化生成的扫描件仅仅作为副本保存。然而,随着数字化技术的不断成熟,将有可能借助一系列严格的数字化标准规范,通过对电子版扫描件真实性、合法性、关联性的维护,使其具有与纸质档案同等的证据价值和法律效力。
从现实进展来看,虽然“档案数据化”一词在近年来受到热烈关注,但我国档案行业目前尚未出台档案数据化标准,呈现亟待补足的局面。相比之下,我国信息技术领域的数据化标准已在一定程度上得到应用,例如:《多媒体数据语义描述要求》(GB/T 34952-2017)规定了多媒体数据的语义描述要求,为应用系统的数据字典设计提供依据;《信息技术 学习、教育和培训 数字化学习资源语义描述》(GB/T 36350-2018)应用于数字化学习资源、在线教育平台的设计和开发领域,规范了数字化学习资源语义描述的内容、流程、方法和要求。相较于档案工作对于档案数据化的迫切需求,相关标准的制定与之存在巨大落差。可以考虑从以下两个方面着手制定档案数据化标准:
一方面,重视数字化成果的数据著录、抽取与挂接工作。当前档案标准化的工作重心集中在档案数字化和数字态档案管理阶段。对此,笔者建议在考核档案信息化建设成效时,不片面关注档案数字化数量,更应当关注档案数据化质量[25],从全文数据化、光学识别、语义识别、语义表达、本体描述、关联建设,以及数据著录、抽取与挂接等方面建立全面的档案数据化标准,从而更好推动档案数据资源充分发挥价值,并促进数字人文学科的进一步发展。
另一方面,注重概念模型的构建及其本体化。国际档案理事会(ICA)提出了数字时代的RiC概念模型(Records in Context Conceptual Model),强调多维来源的权威规范性、多维内容的体系完备性和多维应用的高效灵活性[26],旨在提醒档案工作者在数字时代自觉维护来源原则,加强电子文件之间的内容关联。这也启示我国档案部门在档案数据化标准制定过程中,应当重视文件或档案著录本体构建,并增强本体的语义精准性。。
经过长期的实践积累,我国模拟态档案标准的制定已经相当完善;数字态(化)档案标准也经过二十余年的技术应用形成初步成熟的规模体系;但由于“大智移云物”技术在近几年才逐渐得到应用与推广,档案资源的数据级挖掘与开发还处于探索阶段,因此数据态(化)档案标准的制定还存在相当大的欠缺。针对模拟态档案齐全完备、数字态(化)档案初具雏形、数据态(化)档案亟待补足的情况,档案部门在今后的标准化工作中应当注意及时更新模拟态标准,补充完善数字态标准,着力建立数据态标准,并发挥专业优势、促进双向交流,从而进一步优化我国“三态两化”档案标准体系,更好地指导新形势下档案工作的稳步推进。