周林兴/上海大学图书情报档案系
数字信息技术的发展和广泛运用,不仅给档案事业带来了前所未有的机遇和挑战,也不可避免地给档案理论界带来了全新的认知范式。对于社会大众、档案从业者或档案学者等社会主体而言,由于受思维惯性的影响,难免会对档案现象产生一些认知上的偏差。
传统纸质时代,由于档案载体与内容的不可分离,社会主体在认知档案时不会深究“载体”与“内容”的区别,也不会追问“档案价值”到底是来自于“载体”还是“内容”或者是两者的综合,可以说形成了一种“档案”即载体抑或“档案”即内容的思维定式。而数字时代,由于电子档案的特有属性,即载体与内容可以实现相对分离,即内容可以在不同的载体之间进行“流动”或传输,社会主体对电子档案认知产生了很大的偏差。例如“双套制”管理机制就是一个典型例子,这种认知偏差基本是基于这样一个认知逻辑,即“档案”等于“内容”,抑或说“档案”与“载体”无关。殊不知,“档案”的凭证意义及价值并不仅仅体现在“内容”层面,其“载体”亦是一种象征,也体现着一种价值。“电子档案”就是对当前社会存在状态最为直接的反映,其价值及存在意义绝不仅仅体现在“内容”层面,以“电子”形式存在更是其对真实社会进程的呈现;从这个意义上来说,“双套制”是否是一种篡改历史存在的行为,值得深究。因此,数字时代对于档案本质属性的认知必须要重新思量,不能简单地套用传统思维惯性下的逻辑去判定,并以此来指导档案实践工作。
长期的物资匮乏导致社会公众在考虑问题时多从物质层面出发,并以此指导行为。虽然,改革开放后物资得到了极大丰富,但“以经济建设为中心”的指导思想可谓“深入人心”。上述原因导致了社会公众在计量行为结果时更多是从经济效益的角度来考量,而对其可能产生的社会效益等则“选择性”地忽视。比如认为保管档案时主要考虑的因素为所付出的成本与所保管的这份档案未来可能带来的经济收益是否“合算”[1],而不是选择站在历史长河的角度来思考档案对未来人类可能的影响与价值、考量其可能存在的各种潜在价值。特别是随着数字时代的到来,数字资源的快速增长使这种认知偏差更是有增无减,社会主体往往没有认识到保存它们所付出的成本是一种维持社会运转所必须的正常性支付,即常规性社会消耗。因此,在对待数字环境下电子档案的保管问题时,应该避免过多地从经济效益的角度来看待保存成本问题。总之,当前数字时代快速增长的数字资源是当下的一种社会真实存在状态,决不能以传统的认知眼光去衡量其绝对数量的多少,并以此来考量经济效益的高低。
数字时代社会公众可能经常会碰到这样的问题:“我怎么打不开你的文件?”“为什么又发过来错误的版本?”原因是“你用的是Office2010,我还在用Office2003呢!”;“系统运行怎么这么慢啊!数据管理压力实在太大了!”“检索速度怎么这么慢呢,看来是数据太多了!”原因是“我用的计算机是10年前购买的!现在i7的CPU都普及了,我的计算机还是i3的CPU呢!”面对这种失序抑或是失控的现象,到底是因为档案是“电子的”之过还是管理之过呢?有理由相信,纸张代替竹简等时,或许也出现过类似的问题,历史已证明这与载体形态没有必然的关联。必须要认识到这些问题并不是这份档案不是“纸质的”而是“电子的”时才出现的,即与它是不是“电子的”并无直接关系,其实质原因是管理的失序甚至是失控或失范。面对当前电子档案管理中出现的种种失序现象,再也不能以档案是“电子的”形式作为借口,必须清醒地认识到问题的症结所在并勇敢地面对。不能用10年前的设备性能来衡量当前数字资源数量,“愚公移山”的工作手段如果用在当前的基础建设中一定会被认为是一个笑话。因此,应该看到当前档案管理中的种种失序并不是因为数字资源太多,问题是出在管理工具、管理思想、管理理念以及管理制度上。
在过去20年左右的时间里,硬盘的容量起码增加了500倍以上,平均每年增加25倍以上。数字资源的增长速度是大概每2年才增长一倍[2]。2013年全球一共产生了1000EB的流量[3],到2018年全球的网络流量达到了8.6ZB[4],而到2020年数字资源将会达到44万亿GB[5],但这并不足以说明当前档案太多。在当前社交媒体环境之下,相互转载、相互链接等导致重复发表现象尤为严重,大量冗余数字资源的存在已成为了一种社会常态,原创性的数字资源即能称为档案数据的资源能占到多少比例还是未知数,但凭常识可以推断肯定比44万亿GB要少很多。因此,应该看到虽然当前环境下数字资源的确是快速增长,但是用来存储它的载体在以更快的速度增长,当前正确的做法是对残缺数据、错误数据、重复数据等进行清洗,而不为了节省所谓的存储空间销毁那些所谓没有价值的原创性档案数据。
在纸质环境下档案的存储成本与存储增量之间存在着一种正比例关系,或许还勉强说得过去。但在数字环境下肯定是一种错误论点,即载体容量与成本价格或许存在正相关关系,但一定不会构成一种正比例关系。载体的存储容量有了巨大的增加,但是成本却并没有明显增加,如果从购买力的角度来看,甚至与以前相比其单位成本还在不断地降低。而且,从载体容量与载体成本来看,随着载体容量的不断增大,其边际效应也越来越显现,保存更多的档案数据比保存部分档案数据的边际效应更具科学性。
在传统的纸质环境之下,之所以要强调对档案内容进行价值鉴定,挑选一些被认为更有价值的档案保存下来,其最为朴素的出发点就是考虑到手工检索档案信息的效率问题[5]。这种强化一个方面而弱化另一个方面的做法,在当前存取技术、搜索技术、全文检索技术等相关信息技术快速发展的社会环境之下完全可以摒弃,即不仅可以保全档案的完整性,亦可以保证档案检索的准确性。如复旦大学张卫、周鹏团队开发了具有颠覆性的二维半导体准非易失存储原型器件,开创了第三类存储技术,其写入速度比目前U盘快一万倍,数据刷新时间是内存技术的156倍,并且拥有卓越的调控性,可以实现按照数据有效时间需求设计存储器结构[6]。此外,社会主体有一些社会活动过程不会形成文字信息,因此即使档案数据全部保全都难以完整还原所有历史事实与历史细节,更不用说只用部分文字信息来述说过往的完整历史。如果再对这些有文字记载的信息进行厚此薄彼的挑选,并非是对历史负责任,而是对历史的不尊重。所以,不管是从载体容量的发展速度的角度、还是从保管成本以及利用效率的角度来看,当前档案都不是太多,而应该说是太少。现在之所以有好多历史事实不清楚,很大一部分原因在于找不到相关的文字记录。
第一,未来的社会一定是一个数据驱动的社会,未来的决策一定是建立在“大数据”之上的,而不是建立在“残缺的”“小数据”之上的;“大数据”一定是以数据的齐全完整为前提的,并且当前的技术条件等为齐全完整地保留所有数据提供了可能与支撑。所以,档案数据的精减或进行所谓的内容价值判定,在很大程度上破坏了档案数据的完整性,也极大地破坏了档案数据的生态系统。而且在这个所谓的内容价值判定过程之中,把档案人为地分为三六九等,其实质是给反映某个社会事件或活动的一组档案数据输入了大量的“噪音”,带来了不必要的“信息污染”。这样不但没有使档案数据的证据力得到强化,反而被弱化了。
第二,哪份档案数据有价值、哪份档案数据无价值?社会主体不能仅从当下的认知能力与认知标准去判定,这是不科学的,不能为了一份档案的存在而剥夺另一份档案的生存机会。在判定一份档案的价值时一定是从历史长河的角度来考量的,而不是基于当下更不是基于个体。特别是在数字环境下,档案数据的关联性挖掘一定是建立在全数据基础之上的,每份档案数据的价值一定是建立在另一份档案价值的基础之上的。
第三,数字时代虽然档案数据的总量很庞大,但必须要明白庞大的档案数据并不是由一个或少数几个社会主体形成的,也不应由一个或少数几个社会主体来保存,44ZB的资源分配到每个社会公众头上可以说是少得可怜,甚至是微不足道。另外,如果在对这些资源进行保管的过程中能够精准地实施“以我为主”的保存策略,这些资源就一定能够被保全且不存在重复。