摘 要:档案资源建设理念影响档案数据质量水平。文章分析了供给导向档案质量观和需求导向档案质量观的内涵及其局限,提出采用供需平衡视角来分析档案数据质量问题,指出档案数据质量是档案数据固有特性的客观性衡量与满足用户需求的主观性评价的统一,并点明从供给侧与需求侧共同提升档案数据质量。
关键词:档案数据;数据质量;供需匹配;供需平衡;资源建设;四性;信息不对称
“资源是档案机构最重要的本钱”[1],资源质量决定存在价值,决定着档案事业的长远发展。尽管档案相对是一种高质量信息资源,但随着技术、组织、环境等方面变化,档案数据也出现了一些质量问题。根据调研,我国“数以亿计的电子文件不同程度地处于失控、失存、失信、失用、失密的状态中”[2],尽管档案资源“数量急剧增长,其质量并不是很高”[3],大数据时代“档案数据面临的质量问题日益严峻”[4]。因此,《“十四五”全国档案事业发展规划》提出,“加强档案资源质量管控”“提高归档文件质量”。[5]已有研究主要侧重于档案数据质量概念内涵[6]、问题表征[7]、治理策略[4]等,缺少对档案数据质量形成机理的研究,导致档案数据质量治理理念不清晰、质量治理措施不精准、质量提升成效不彰显,因此有必要探索档案数据质量问题形成机理,推动档案数据高质量发展。
质量是“客体的一组固有特性满足要求的程度”,[8]包括固有特性、要求和满足程度三个要素。其中,固有特性主要由供给方提供,是一种客观存在;要求主要指用户的各种需求,是一种主观存在;客观供给和主观需求之间的匹配度就是满足程度。因此,质量是固有特性的客观性衡量与满足需求的主观性评价的统一。档案数据质量问题取决于两个变量:怎样的质量和谁的质量。如果采取立场各不相同甚至互相抵触的质量标准进行分析,试图从中达成理论共识,必然无功而返。若围绕档案数据质量展开共识和对话,一种比较合理的做法是,明确不同主体针对档案数据质量的立场,在此基础上,求同存异,达成共识。
1 供需分离视角及其局限性
当前,对档案质量的分析主要包括供给导向的档案质量观和需求导向的档案质量观,作为供给方的档案部门和作为需求方的用户对于档案质量有着不同理解和认识。
1.1 供给视角:档案“四性”要求及其局限性
所谓供给导向的档案质量观,是指档案部门“以我为主”,从档案部门自身立场出发去界定档案质量。“长期以来,我国档案馆采取的是‘供给导向’的发展模式,往往从自身业务供给的角度出发,有什么样的内容就提供什么样的服务,用户常常面临着‘提供的服务不需要,需要的服务找不到’的尴尬。”[9]如在浙江省人民政府数据开放平台上,由浙江省档案馆提供的“浙江清代官员履历信息”开放数据集仅有“籍贯”“年代”“数据编号”三个字段,从这些开放档案数据集中看不出任何实质信息,以致有不少用户留言“差评”“没有任何参考价值”。[10]
大数据时代,供给导向质量观的典型观点为档案质量就是档案的真实性、完整性、安全性、可用性等“四性”要求。针对档案“四性”的研究,许多专家学者虽不直接以“质量”之名,却将其视为档案质量的“代名词”。徐华[6]指出,档案数字资源的质量内涵包括真实性、完整性、有效性、安全性;汤健指出,“可以从真实性、可靠性、完整性、可用性四个方面对信息质量进行分析”[11];杨来青等认为,青岛市数字档案馆的数据质量问题可“归纳为完整性、准确性、规范性3种类型”[12]。进入数字时代以来,档案部门大多以“四性”作为抓手来衡量档案数据质量,制定了《文书类电子档案检测一般要求》(DA/T 70—2018)等标准规范,在归档、移交接收、长期保存等不同环节制定了完整的四性检测方案,并成为各类数字档案馆(室)测评中针对档案数据质量管控的关注重点。
从逻辑上讲,档案“四性”只是档案质量表象化的一种形式而已,绝非档案质量问题的实质内涵。一方面,以“四性”视角去研究档案质量,一个难以逾越的障碍是:符合“四性”要求的档案是否就没有质量问题,是否就是用户需要的档案资源呢?尽管档案“四性”中包括“可用性”,但这个“可用性”是谁的可用、何时要用、利用哪些、如何利用,事实上也很难明确。因此,针对这些不确定的用户和需求,以纯粹的“四性”视角去研究,本身就存在一定缺陷。在我国档案资源建设中,之所以“三重三轻”“官重民轻”“不见平民史”等现象长期为社会所诟病,其关键就在于供给导向的资源建设方式,对用户需求考虑不充分,进而导致档案资源的多样性、丰富性、特色性等存在不足。另一方面,档案“四性”本身存在一定的冲突。类似于档案检索中“查全率”和“查准率”天然存在一定的互逆关系,在档案质量中也存在类似问题。大数据时代,当过分追求数据的完整性时,往往会影响到数据查找利用的准确性、可用性和便捷性。因此,“四性”尽管对保障档案数据质量有较大价值,却依然存在一定局限。
1.2 需求视角:用户感知及其局限性
需求导向的档案质量观将能否满足用户需求作为档案质量的目标导向,即档案质量取决于档案资源在多大程度上满足了用户的需求,典型观点是用户服务感知。质量认识的主观性、相对性极大地影响了人们对档案数据质量问题的认知和质量改进方式的选择。当站在不同利益相关者角度讨论档案数据质量问题时,由于立场、认知和需求的差异,对质量问题的把握也会存在较大差异,这种认知上的天然差异决定了针对档案数据质量本身不可能达成一个不同利益主体都能认可的范本。例如,针对某一主题档案资源,历史研究者与工作查考人员的质量需求往往也不相同。因此,档案数据质量归根结底与所处的时代、社会和场域有关,和某一人群的特定需求有关。“质量问题到底是不是问题,对其判断完全依赖于从何种角度解读和以什么方式来解读”[13],这是一个开放性的问题。
从档案数据的产生尤其是保存来看,档案数据不是为了自身的管理利用。无论是为国管档、为党守史还是为民服务,都反映了国家、社会和公众的需求,也必然存在着一定的质量要求,“质量需要已成为当前和今后用户信息需要的主要特色”。[14]从需求角度看,档案数据质量可以理解为用户对数据使用的一种感受,“当用户对信息完备性、可理解性、时效性、适用性等客观属性的评价越高,其感知到的对自己有用程度也就越强”。[15]徐华指出,具有“顾客满意度”的档案数字资源是指“满足‘真实、完整、有效、安全’的质量要求,被长期或永久保存,归档范围、分类体系、保管期限准确,具有可信性、可追溯性,可以真实再现当时社会历史”。[6]然而,用户需求本身具有不可知性,既可能超前于档案工作实际,也可能落后于档案工作发展,其质量要求存在较大不确定性,这对档案数据质量也造成了较大的困扰。
总之,档案数据质量不仅仅是真实性、完整性、安全性等本身特性的反映,还是一定社会关系的反映,“离开了信息质量的社会性,特别是对社会性属性的具体表现形式——满足用户信息需要程度的考察,对信息质量问题的认识和分析就毫无意义甚至毫无可能”。[14]用户需求是档案质量关系产生的依据,档案自身属性只有用户通过认知和实践才能进入到质量化的过程,形成质量关系,此时才有质量可言。这也就意味着,在档案数据质量研究中,要摒弃以往的“单方”视角,更多地从供给实际和需求实际出发,做到供给和需求之间的有效匹配。
2 供需平衡的研究新视角
供需理论是经济学的重要理论,是分析问题的基本方法。供给是“处在市场上的产品,或者能够提供给市场的产品”,需求则是指“市场对商品的需要”。[16]供给和需求是对立统一的辩证关系:一方面,供给决定需求,即生产决定了消费对象与消费方式;另一方面,需求也会反作用于供给,即需求会促进生产的顺利进行甚至产生新的供给。“供给与需求之间必须保持适度的均衡发展关系,即平衡比例关系,或协调发展关系,整个国家的社会生产才能保持正常健康状态,整个社会经济才能保持持续增长和发展。”[17]或者说,供求平衡是供需关系的终极目标,是资源配置的最优体现。基于供需平衡视角的档案学研究主要涉及档案资政服务、公共服务和档案管理等多个方面。[18-20]原国家档案局局长李明华指出,“推进档案服务升级,档案部门就是供给侧,要抓好供给侧结构性改革,减少无效和低端供给,扩大有效和高端供给,增强供给体系对需求变化的适应性和灵活性”[21],事实上指的就是供给和需求之间的结合和平衡。陈永生教授也曾提出“有效利用”的观点,“既考虑了利用者对效果和收益的重视,也体现了档案部门对成本和收益的兼顾”[22],事实上也是强调了在档案资源建设过程中档案部门供给和用户需求之间的相对平衡。
档案数据的固有属性,是构成档案数据质量的客观基础,用户的主体需求则是构成档案数据质量的前提条件。当档案数据的固有属性匹配主体需求时,便形成了质量关系。因此,解决质量问题、提升档案数据质量,除了进一步增强档案数据本身的属性,还需要更加注重用户需求。供给导向的档案质量观和需求导向的档案质量观虽然是从不同角度看待问题,但这两种观点可以实现有效融合。理想状态下,如果档案质量能同时满足供需双方的要求或者说实现供需平衡,此时可以称之为“高质量”。从供方角度看,档案数据质量高低取决于提供的档案数据属性的高低,此时高质量并非绝对完美,而是在符合成本效益的基础上,满足用户需求和保持自身声誉等需求的一种适当的程度。就需求方而言,以提供的档案数据对需求方的满足程度来衡量档案数据质量,或者说取决于用户的感知。满足需求者的高质量也并不是某种极限,而是在用户可接受的条件下、可感知的一种最佳状态。
综上,本文认为质量本质上是一种程度,是固有特性的客观性衡量和满足需求的主观性评价的统一,试图让所有相关方百分之百满意只可能是理想,但却不可能百分之百实现。此时就需要权衡,立足于供求平衡来界定档案质量,找到两者之间的平衡点:供求平衡的档案数据就是合格的档案数据,供求失衡的档案数据就是存在质量问题的档案数据。
3 档案数据质量问题的形成机理
当我们从供需平衡视角去看待档案数据质量问题时,质量问题将变得很简单,我们也可以很清晰地分析出档案数据质量问题的形成机理。
(1)档案供给主体和需求主体合一时,一般不存在档案质量问题。根据ISO 9000,供方是指“提供产品或服务的组织”,需方或者说顾客,是指“接受产品或服务的组织或个人,可以是组织内部的或外部的”。[23]一般而言,档案资源的供给主体是档案馆(室),需求主体则包括多方,起初是单位内部,而后扩展到相关业务人员、研究人员等。从档案信息产品的属性来看,当供给主体与需求主体一致时,档案信息表现为私人产品,是“君主手中的剑”,主要为所有者服务,需要多少档案就供应多少档案,需要什么档案就供应什么档案,此时也就不存在什么质量问题。
(2)档案供给主体和需求主体分离是产生档案质量问题的必要前提。随着社会的发展,逐渐出现了来自外部的档案需求者,此时就出现了供给主体和需求主体的分离。档案需求主体日趋多元化,供给主体很难针对性地满足不同主体的全部需求,由此必然导致供需的不平衡,进而成为产生档案质量问题的必要前提。
(3)供需信息不对称是档案质量问题的根源。尽管供需主体分离是档案质量问题的必要前提,但从逻辑上讲,不一定必然产生档案质量问题。当供需双方信息对称时,尽管供需主体分离,也不会产生档案质量问题。因此,信息不对称是档案质量问题产生的根源。质量管理大师休哈特指出:“在定义质量时所遭遇的困难在于我们须将使用者的未来需求转化诠释成可以衡量的特性,以便设计产品。这么做可不容易,而且,当你觉得努力已经相当成功时,消费者的需要又改变了。”[24]也就是说,相对于需求而言,供给往往具有滞后性。这种质量信息的不对称是一种常态,并最终导致了质量问题的产生。
对于档案数据形成部门而言,由于档案数据是业务活动的“副产品”,数据质量要求本身就不是很高,在数据进入半衰期后,很少关注数据的利用,对数据质量的关注程度就更低;对于档案主管部门和档案保管部门而言,一般不产生档案数据或利用档案数据,既不清楚前端移交归档的档案数据质量或无力影响归档数据质量,也不了解后端用户的档案数据质量需求。然而,相比于产品或服务的固有属性而言,最不确定的是用户需求。对于用户而言,虽然有一定的质量要求,但由于档案数据质量具有较大的技术性特征,实际上用户对前端档案数据的完整性、准确性、可用性等质量要求并无系统认识,其质量需求也比较模糊。总之,在档案数据的生命周期信息链中,由于信息链上不同主体的地位、立场等的不同,导致对档案数据质量情况的了解各异,进而带来了一种信息不对称,最终出现了各类质量问题。
从供需平衡角度看档案数据质量治理,主要有两种途径:一是供给侧上围绕固有特性不断“减少错误”,减少甚至消除产品或服务中所包含的质量问题;二是需求侧上围绕用户需求不断“创造价值”,促使其包含更多满足用户需求的质量要素。“减少错误”和“创造价值”共同构成了质量提升的两条发展路径,甚至有学者指出,质量的一个新趋势是“质量不再是减少缺陷,质量必须创造每件事物的价值”,[25]而这也将成为我们研究提升档案数据质量的重要方向。
本文系国家社科基金重大项目“数字档案馆生态系统治理研究”(项目编号:19ZDA342)研究成果。
参考文献:
[1]冯惠玲.档案记忆观、资源观与“中国记忆”数字资源建设[J].档案学通讯,2012(03):4-8.
[2]冯惠玲,赵国俊,等.中国电子文件管理:问题与对策[M].北京:中国人民大学出版社,2009:13.
[3]傅华,冯惠玲.国家档案资源建设研究[J].档案学通讯,2005(05):41-43.
[4]周林兴,林凯.大数据时代c34eaf8d45cba73e4ccf097d4d48dd03档案数据质量治理:因素、架架和路径[J].档案学研究,2023(02):111-119.
[5]中办国办印发《“十四五”全国档案事业发展规划》[J].中国档案,2021(06):18-23.
[6]徐华.基于ISO 9000的档案数字资源质量管理分析及术语释义[J].档案学研究,2017(06):39-44.
[7]陈慧,罗慧玉,陈晖.档案数据质量要素识别及智能化保障研究:以昆柳龙直流工程项目档案为例[J].档案学通讯,2021(05):49-57.
[8]全国质量管理和质量保证标准化技术委员会.质量管理体系 基础与术语:GB/T 19000-2016/ISO 9000:2015[S].北京:中国标准出版社,2017:15.
[9]周枫.资源·技术·思维:大数据时代档案馆的三维诠释[J].档案学研究,2013(06):61-64.
[10]数据集-浙江清代官员履历信息[EB/OL].(2021-02-02)[2023-12-08].http://data.zjzwfw.gov.cn/jdop_front/detail/data.do?iid=3024&searchString=.
[11]汤健.基于模糊层次分析法的数字信息质量评价方法[J].档案学通讯,2008(06):76-81.
[12]杨来青,崔玉华,王晓华.数字档案馆数据质量控制方法研究[J].中国档案,2016(01):66-67.
[13]邱德雄,樊华强,谢武纪.我国高等教育质量问题及其化解策略探讨[J].中国高校科技,2020(Z1):85-88.
[14]周毅.信息商品质量问题初探[J].情报理论与实践,1996(04):7-11.
[15]林强,关芳.数字档案馆用户体验因素实证研究[J].档案与建设,2016(12):14-18.
[16]中共中央马克思恩格斯列宁斯大林著作编译局.马克思恩格斯全集·第七卷[M].北京:人民出版社,2009:207-210.
[17]纪尽善.马克思供需平衡理论与扩大内需战略取向和现实选择[J].当代经济研究,2002(09):8-11.
[18]归吉官,田晓青.档案资政服务样态及路径优化:基于多案例研究[J].档案管理,2023(03):66-70.
[19]罗宝勇,徐刘红.社交媒体视域下档案公共服务评价指标体系构建研究[J].山西档案,2022(04):42-54.
[20]李琳.高质量发展语境下突发事件档案管理的实践困境与突破路径[J].档案管理,2022(04):90-91.
[21]李明华.高举习近平新时代中国特色社会主义思想伟大旗帜 奋力开创全国档案事业发展新局面[J].人民论坛,2018(15):6-9.
[22]陈永生.档案合理利用研究:从档案部门的角度[J].档案学通讯,2007(01):52-57.
[23]全国质量管理和质量保证标准化技术委员会.质量管理体系 基础与术语:GB/T 19000-2016/ISO9000:2015[S].北京:中国标准出版社,2017:10.
[24]W·爱德华兹·戴明.戴明论质量管理[M].钟汉清,戴久永,译.海口:海南出版社,2003:115.
[25]程虹,许伟.质量创新战略:质量管理的新范式与框架体系研究[J].宏观质量研究,2016(03):1-22.
(作者单位:1.海通证券股份有限公司 周枫,博士,馆员;2.上海大学文化遗产与信息管理学院 杨智勇;博士,副教授 来稿日期:2024-02-20)