周枫 吕东伟 邓晶京 黄丽萍 骆建珍
摘 要:OFD格式是我国自主可控的电子文件版式文档格式。文章从版式文档存在的问题着手,对OFD格式产生背景进行分析;结合OFD格式的特征,对OFD格式在档案领域应用场景进行探讨;采用SWOT分析法,对OFD格式在档案领域应用前景进行分析,并指出应用策略。
关键词:OFD;版式文档;格式;档案;SWOT分析法
Abstract: OFD is the self-controlled fixed layout documents format of electronic files. Firstly, the paper analyze the creation background of OFD by summarizing the problem of other fixed layout documents. Secondly, the paper discussing the application scenario of OFD format in archives by integrating the feature of OFD format. At last, the paper analyze the application prospect and point out the application strategy of OFD format in archives by using SWOT analytical method.
Keywords: OFD; fixed layout documents; format; archives; SWOT
版式文檔是指版面呈现效果固定的电子文档。版式文档通过将文字、图像、图表等数字内容对象按一定规则进行版面固化呈现,呈现效果不因软硬件环境、操作者的变化而变化,版面固定、不跑版、所见即所得,可以视为计算机时代的“数字纸张”。版式文档的特点使它成为电子文档发布、数字化信息传播和存档的理想文档格式。2017年5月,国家标准《电子文件存储与交换格式版式文档》(GB/T 33190-2016)正式实施,该标准规定了国家版式文档格式规范,简称OFD(Open Fixed-Layout Document)。然而,作为一项文档格式的国家标准,对于OFD格式的研究主要仍局限于产品本身,因此非常有必要加强OFD格式在档案领域的研究,从而更好地推进OFD格式在档案工作中的进一步应用。
1.1 存档格式多样,造成信息孤岛。在OFD格式产生之前,电子文件存档格式并没有统一的国家或行业标准,档案工作中普遍采用DOC、WPS、PPTX等流式文件格式。由于其存在内容易更改、迁移过程易变异和损失等不足,因此并不符合电子文件长期保存要求。同时,部分文档以PDF、XPS、SEP、CEBX等版式格式存档,但不同版式文件依赖某个具体软硬件平台且格式技术未能完全打通,导致格式之间不能互通、传递不畅,文档信息传播利用受限。
1.2 格式应用受限,信息失存失信。由于没有统一标准,当前文档格式大多不易扩展,导致各领域的应用受限。有些版式文档不能嵌入元数据信息,从前端业务系统形成的电子文件自带的信息量太少,导致电子文件所包含的元数据信息大量减少;部分版式文档格式不能很好地支持数字签名、电子印章等技术认证机制,无法满足电子文件长久保存的要求。在对不符合长期保存要求的格式进行格式转换时,容易出现新的问题:业务系统中的流转、签批等信息在转换为归档格式后可能会丢失;格式转化过程的数字签名、印章等认证信息丢失;不同格式之间的数字签名不能互通,不能互签互用;大批量文件进行格式转换用时长,转化过程不稳定,容易出错。
1.3 现有格式垄断,存在安全风险。一些格式依赖非自主可控技术,无法在全自主可控平台下运行,格式的使用和服务受限于外部厂商和技术,对于文档的发展应用始终处于跟随状态,而当需要对文档格式进行扩展时,又容易受制于相关厂商。格式标准不公开,私有版式文档的格式解析、标准解释掌握在国外企业手中,文档信息资源容易遭到“劫持”,也无法保证对数据解析的长期技术支持。同时,国外软件厂商的文档格式不支持国产加密算法应用,无法通过国密算法保证电子文档的安全。
2009年,中央办公厅颁布《电子文件管理暂行办法》,明确提出“应采用符合国家标准的文件存储格式,确保能够长期有效可读”。2010年5月,全国档案工作标准化技术委员会第十八次年会提出,与工业和信息化部一同暂缓采用以美国ADOBE公司技术为基础的《长期保存的电子文档文件格式第1部分:PDF1.4(PDF/A-1)的使用》作为国家标准在我国的实施,并最终与国家标准委达成协议,将该标准的使用范围限定在“涉密文档以及作为档案保存的文档”[1]以外,因此,制定适合我国电子文件长期存储和交换的国家自主可控版式文档应运而生。
2.1电子文件归档格式。对于电子文件归档而言,采用“原生”格式归档,不仅可以更好地保证电子文件的“四性”,还有利于电子档案的长期保存和有效利用。因此,在前端即采用OFD格式生成并以OFD格式归档,可以视为电子文件归档格式的前端控制,如浙江省档案局印发《浙江省省直单位电子公文归档与电子档案管理暂行办法》,提出电子公文采用OFD格式归档。
2.2 元数据采集。OFD具有很强的结构化描述能力,外部系统或用户可以通过标引的方式添加自定义的标记和信息,为在文档中嵌入更多应用相关的结构化语义信息提供支持,同时,OFD支持语义导览并可将内嵌语义导出为数据,从而达到与其他系统、数据交互的目的并扩展应用,而这也是OFD吸取其他格式方案发展应用中的经验教训而形成的独特优势。对于电子档案而言,在电子公文阶段利用自定义标引定义电子公文所需的元数据,构建电子公文语义树;进入档案部门后,可继承电子公文中原有的前端元数据,并根据档案管理的需要补充扩展相关档案管理元数据,从而更好地保证电子文件全生命周期过程的“四性”。
2.3 电子文件格式转换。采用OFD进行格式转换有两种情况:一是归档时将各种主流格式的文件统一转换为OFD格式,实现“多头流入,单一保存”。例如,在OFD格式颁布前的试点过程中,国土资源部将文书档案、业务档案、网页等进行了OFD格式电子文件归档,审计署对其行政及审计公文进行了转版应用。二是由于原先格式即将被淘汰、原格式不符合国家标准、格式多样管理不便等原因,对电子档案的格式进行统一转换。
2.4 电子档案长期保存。《版式电子文件长期保存格式需求》(DA/T 47-2009)中对长期保存格式需求进行了定义:长期保存是用一种可靠的、科学合理的方式长期维护电子文件真实、完整、有效的行为。同时,DA/T 47给出了版式电子文件长期保存格式11项需求,可以作为电子文件长期保存格式选择的依据:格式开放、不绑定软硬件、文件自包含、格式自描述、显示一致性、持续可解释、稳健、利于存储、支持技术认证机制、易于利用。通过将OFD版式文件的内容、特性与DA/T 47要求进行对比,其完全符合电子档案长期保存文件格式要求,是作为电子档案文件格式的理想选择。
2.5 电子档案数据交换。为了维护电子档案的完整性,数据交换一般而言并不会以单个电子文件的方式进行交换,而是以信息包的方式进行交换,包括 ASIP、TSIP、AIP、DIP等。信息包以一定的目標结构方式组织,为了交换方便的需要也会封装成ZIP压缩包、EEP封装包、电子书等形式。OFD作为电子文件存储和交换格式,采用Zip压缩,支持以数字签名的方式进行数据交换过程中的安全认证,可有效实现电子档案的数据转换。
2.6 电子档案开放利用。随着无纸化进程的推进,越来越多的文件利用以电子形式进行,如何确保在不同的环境下文件利用的安全和便利,并始终保持所利用文件的权威性和凭证作用,是开放利用中不得不考虑的一个问题。作为一种版式文档,OFD能够实现存档格式和利用格式合一,提供给用户相同的用户体验,提供全面、安全、高效的文档呈现、交换和再利用,同时结合用户操作习惯,提供视图、注释、工具等功能,满足利用过程中的文档处理需要。OFD版式文件基于层次文本+压缩打包的技术机制,比同样内容的DOC、PDF等格式文件体积更小,在线阅读时文件加载、打开速度更快,同时用户终端不留存副本,安全性好。此外,OFD还可根据需要实现多文档的分类合并,更好地满足业务需求。
2.7 自主可控档案系统。在部分安全保密要求级别较高的系统中,OFD应该是唯一的版式文件格式,不管是保存、交换还是利用。OFD对于全国产环境(基于国产 CPU/OS的数字档案信息系统)的支持相对于PDF格式也有明显的优势。OFD格式得到国产厂商的广泛支持,其与CA认证、国产加密算法、电子印章等安全防护措施的结合比PDF更有优势。因此,在自主可控档案系统中,OFD格式无疑是自主可控档案系统的最好选择。
3.1 优势(Strengths)分析
3.1.1 格式自主可控。随着信息及网络安全国家战略的推进,相关软硬件的国产化快速推进。从服务器到芯片,从操作系统到应用工具,OFD的推出正是这股浪潮的重要体现。OFD格式的出现,使我国第一次拥有了国家级的自主版式格式。OFD作为PDF的国内替代格式,标准自主可控,不受控于外部厂商,可阶段性地实现“将自己的鸡蛋篮子挂在自己树上”的战略需求,这也是创立自主可控的版式格式最重要的初衷之一。
3.1.2 较强技术优势。在版式文档格式方面,除目前国际通用的PDF外,还有其他的很多文档格式如CEB、SEP、CAJ等在使用。相比于其他格式,OFD格式有一系列技术优势。第一,OFD基于XML技术来描述文档数据,格式开放,利于理解,长期可读可用;第二,OFD支持根据各领域需要进行语义标引扩展,这已经超出了单纯版式格式的功能,更加贴合应用需求;第三,OFD支持国产密码算法,是文件具有法律效力的基本条件。总的而言,OFD具有开放性高、兼容性好、真实性好、集成性高、保存性好、成本低等特点,是一种理想的长期保存格式。
3.2 劣势(Weaknesses)分析
3.2.1更换成本较大。经过二十多年的标准化与国际化,PDF在使用和沟通上的成本已经非常低,良好的用户体验已经培养了一群忠实的用户群体,从实际情况看,PDF已在档案部门大量使用。此外,OFD的阅读需要专门的阅读软件,不同于PDF阅读软件的开源,OFD软件由不同的企业开发,自然涉及不菲的成本。据调研,目前一套专业的OFD阅读软件将近20万元。“OFD将不可避免地面临与PDF直接的成本竞争,这种成本由使用成本、沟通成本、管理成本和风险成本共同组成,同时也包括其他用户的转嫁成本。”[2]短期来看,出于降低技术风险和成本投入的考虑,档案部门没有抛弃PDF而采用OFD的强烈意愿。
3.2.2 理论研究不足。作为一个崭新格式,目前对OFD的格式研究更多地还停留在格式介绍及其与PDF的格式对比层面,对OFD格式本身的技术方案、特性分析及其应用场景研究相对欠缺,而在档案行业的应用研究更是凤毛麟角。理论研究的不足使得人们对其认识还停留在“PDF的替代格式”这种概念层次,无法形成对OFD应用拓展的深度支撑。
3.3 机会(Opportunities)分析
3.3.1 实践需求强烈。随着数字技术的快速发展,数字信息资源的可存取性却变得极为脆弱。由于文档格式不统一、不开放、不可控,造成文档交换有障碍、应用扩展有困难。更为重要的是,在长期、安全保存中存在着极大的风险。调查显示,1990年北京亚运会的部分电子文件已经无法读取,22%的中央机关存在读不出来的电子文件。针对该问题,一般采取三种方法:一是不断将文件转化为当前通用的新文件格式;二是采用独立于任何计算机系统的开放格式存储文件;三是将该文件与其软硬件系统一同保存。从现实情况来看,大多数单位选择了第二种办法。
3.3.2 政策推动有力。早在2009年,中办《电子文件管理暂行办法》就明确提出“应采用符合国家标准的文件存储格式,确保能够长期有效读取”;2016年11月,《国家电子文件管理“十三五”规划》提出“鼓励党政机关等重点行业领域使用具有自主产权、安全可控的电子文件管理产品”[3]。2016年12月,在国标委发布的《党政机关电子公文系列标准规范》(GB/T 33476~33483-2016)中,明确要求“电子公文的承载格式为OFD”。国家电子政务综合试点方案提出“试点地区要推进OFD版式标准的应用,规范党政机关电子文件管理、电子公文标准化应用”[4]。此外,电子文件管理行业也采取了切实的措施来推动OFD格式的发展。2016年11月,在国家电子文件管理部际联席会议、工业和信息化部、国家标准委的指导下,由电子文件管理领域相关企业、院校、科研机构及用户等组成的电子文件管理推进联盟成立,联盟章程第五条明确提出“推动GB/T 33190-2016《电子文件存储与交换格式版式文档》等标准在办公、证照、档案和票据等各领域的推广应用”。
3.4 威胁(Threats)分析
3.4.1 竞争激烈,生态脆弱。经过20多年的发展,PDF已从Adobe公司的一款产品上升为ISO 32000国际标准,而PDF/Archive(PDF/A)更是被视为电子档案保存的最佳解决方案而成为ISO/DIS19005-1国际标准。无论是Office、WPS抑或众多浏览器、应用系统,均支持PDF的应用,从而形成了一个良性的生态环境。OFD则显得“势单力薄”,目前能够对OFD阅读具有支撑作用的软硬件环境屈指可数,更别提与各种环境的“无缝对接”。因此,总的来看,OFD发展的生态环境目前还比较脆弱,若没有强有力的支持,有可能被扼杀在幼儿期。
3.4.2 政策变更风险。当前,OFD格式主要由不具强制力的行业联盟来进行“自上而下”的推广,执行力度较难保障。一旦推广效果不达预期,有可能导致政策的重大转变,进而影响OFD格式的应用。
虽然OFD格式在档案领域的应用正处于起步阶段,更多的是个別单位的零星试点,但基于上述SWOT分析,OFD在档案领域的应用“优势大于劣势,机遇多于挑战”。从长期来看,由于OFD格式自身的优越属性,加之国家推动自主可控格式的决心,OFD格式在档案领域有着光明的应用前景;从短期来看,由于用户习惯短期内较难改变,OFD在档案领域的全面应用还有待时日,但作为集中统一地进行长久保存的机构,档案部门可先行采用OFD作为备份和利用的主要格式,从而以点带面地推动OFD格式的全面应用。
[1]国家档案局、中央档案馆关于印发《全国档案工作标准化技术委员会第十八次年会会议纪要》的通知[EB/OL].(2010-06-12)[2017-12-20]. http://cpc.people.com.cn/GB/64114/83904/83906/12155917.html.
[2]梁凯.档案部门应用OFD格式的若干思考[J].浙江档案,2017(1):64.
[3]中共中央办公厅 国务院办公厅关于印发《国家电子文件管理“十三五”规划》的通知.厅字〔2016〕37号.
[4]国家多部门联合开展国家电子政务综合试点[EB/OL].(2017-12-29)[2018-02-20]. http://www.miit.gov.cn/newweb/n1146285/n1146352/n3054355/n3057656/n3057660/c5995240/content.html.