国外公共档案馆发展趋势及启示

2020-12-06 22:27:04四川大学公共管理学院段先娥四川电力设计咨询有限责任公司
浙江档案 2020年10期
关键词:档案馆公众人工智能

赵 跃/四川大学公共管理学院 段先娥/四川电力设计咨询有限责任公司

公共档案馆是档案馆发展到一定阶段的产物,在提升行政效率、表达公民意识、追求经济效益等方面发挥着不可替代的作用[1]。随着数字转型的纵深,国内外档案界开始思考公共档案馆的未来方向,国际档案理事会2019年年会的主题为“设计21世纪的档案馆”,表现出了对公共档案馆发展的关注。很多国家也围绕公共档案馆的未来发展进行规划和探索,澳大利亚国家档案馆(National Archives of Australia,NAA)制定了“2020年发展愿景:成为数字时代世界领先的档案馆”[2];美国国家档案与文件署(National Archives and Records Administration,NARA)制定的“2018—2022年战略规划”明确了未来档案馆发展的战略目标和具体策略[3];英国国家档案馆(The National Archives,TNA)在2015—2019年战略规划总结中重申了其在档案领域的领导地位,并表示未来需要建立新的学术和研究合作伙伴关系,与新的受众群体建立联系,建立21世纪的档案馆[4]。以上规划都体现出国外公共档案馆在发展理念和发展方式上的新趋势和新方向。本文主要以上述文本为研究对象,结合国外一些典型公共档案馆的发展实践,对国外公共档案发展趋势进行解读与分析,以期在“十三五”规划的收官之年和“十四五”规划研究的关键时间节点上,为国内公共档案馆的发展提供一些启发。

1 国外公共档案馆发展趋势分析

1.1 进一步推动档案资源开放获取

为了做好档案开放和公众获取工作,各国档案馆从多个方面进行了努力,包括加速档案资源的处理、拓宽公众获取档案资源的渠道、加强档案开放过程中的安全保障等。

首先,档案资源处理包括档案数字化、整理、录入和维护等,处理后的档案在利用及时性和便捷性方面具备优势。NARA已对78%的传统(模拟)文件进行了数字化,对89%的电子文件进行了整理,并计划到2024财年完成5亿页文件的数字化[5]。澳大利亚政府向NAA提供了1000万澳元经费,用于在未来四年内将二战的服务文件数字化。确保澳大利亚人更轻松地访问相关档案,了解二战时期的故事[6],此外NAA 还建立了电子文件与档案管理系统(EDRMS)和数字档案在线描述工具[7]。通过上述努力,NAA开放期档案向公众开放比例总体已达到了98%[8]。

其次,经过数字化处理后的档案资源需要借助一定的渠道才能为公众获取利用,很多档案馆都在探索公众获取平台的改进和创新。如NAA数字档案馆中正在建设一个多功能平台,让所有的澳大利亚人都可以获取档案服务、活动和展览[9];NARA升级了国家档案馆的目录,以解决可扩展性问题[10],还建立了创新中心,负责开发档案共享工具,方便社会各界进行数字获取和档案研究[11]。

此外,在开放获取过程中,对档案内容和公众隐私的安全保障是不可忽视的部分。国外档案馆既通过制度来保障档案安全,如美国《信息自由法》《私人信息法》《阳光政府法》等规定了档案的开放期限和利用限制,英国《公共档案法》《信息自由法》规定了档案公开的豁免时限,澳大利亚《澳大利亚联邦档案法》《隐私法》强调档案公开过程中公民隐私保护等。同时,利用技术对开放获取中的数据安全进行保障,如ARCHANGEL通过区块链技术保障公共档案中数字文档的完整性和透明度,创建了一个去中心化的内容证据存储库,通过对区块链的共识检查对档案库进行统一维护[12][13],还有学者探索基于贝叶斯方法建立档案安全风险预测模型[14]。

1.2 加速人工智能在档案工作中的运用

随着海量的、非结构化的档案数据持续增加,档案的分类、整理、著录、鉴定、检索等工作变得更加复杂,寻求新技术来支持档案工作的正常运行已成为迫切需求,自动化、智能化成为公共档案馆的新目标,其中人工智能在档案工作中的运用成为关注焦点。当前,国外公共档案馆中人工智能的应用主要集中于档案整理、检索和服务方面[15]。

首先,人工智能技术可以通过自然语言处理和机器学习将数据资源按照一定标准进行分类,保证档案的准确有序。澳大利亚新南威尔士州档案馆借助内部试点项目,利用机器学习技术,解决了州政府部门大量非结构化数据集的分类问题[16]。澳大利亚维多利亚公共档案馆基于Proof of Concept(PoC)项目,运用机器学习实现了对维多利亚州政府大量非结构化电子邮件的鉴定、处置和敏感性审查;而NAA的团队研究了实体和自动元数据提取、语义分析、分类法、本体构建以及关联数据方法,并建立了档案馆处置授权的概念模型和语义分析模型。下一步将在机器学习和人工智能专家的建议下,评估各类机器学习的创建和实施,包括自动分类、聚类和索引工具。预计这一阶段将成为所有文件管理机构未来数字方法的试点[17]。

其次,人工智能技术在运用于档案检索过程中出现了对古老的手写档案识别精度不够的问题,为此,各档案馆开始寻求对其的升级改造,其中梵蒂冈秘密档案馆就尝试与高校及社会力量合作,创建了一个新项目In Codice Ratio,结合使用人工智能和OCR软件搜索文本并提供结果,它不仅更准确,而且转录速度快。其创新之处在于拼图分割,将单词分解成更接近每个笔划的东西,也就是通过将每个单词分成一系列垂直和水平带并寻找局部最小值来达到对古老的手写档案更精准快速识别和检索的目的,成功后该技术将在所有的档案馆中被通用[18]。

最后,随着公众对个性化服务和用户体验的要求持续提高,档案馆通过自然语言处理技术、智能代理检索技术、专家系统、智能机器人等来提供档案个性化定制系统[19]。还有档案馆用语音指令来简化搜索,可谓是对视力障碍者的特别关照,极大改善了用户使用体验[20]。当然,正如安西娅·赛勒斯所言,机器学习有其固有的局限,无法完全达到人类对档案数据理解分析的精确性,需要档案人员在进行人工智能与档案工作融合测试时注意测量精度,调整算法,确保档案工作自动化系统算法透明[21]。基于此,TNA对人工智能与机器学习系统进行测试,认为档案行业需要修订相应规范和准则应对可能存在的风险。同时发挥人与机器的不同优势,以人的主观能动性克服人工智能和机器学习的局限性[22]。并提出进一步保存人工智能分析过程中的数据和记录,以保证人工智能技术下档案的真实性[23]。NAA也提出,要使技术增强档案信息的描述性和互操作性,需要更改档案过程本身[24]。

1.3 加强公共档案馆与公众的联系

英、美、澳等国家档案馆都将“加强与公众的联系”作为未来几年的发展目标,一方面是各国构建开放政府、透明政府的需要,另一方面也是加强公众对档案工作参与度的重要手段。当前这种联系的加强主要通过档案馆自上而下改善档案服务方式和公众自下而上参与档案馆建设两种途径进行。

首先,档案馆主动调查公众对自身服务的满意度,并根据反馈加以改进。NARA在其工作计划中将未来发展目标进行明确和量化:到2020年,逐步满足93%的用户的不同要求,同时在博物馆、外展、教育和公共项目活动中获得90%的满意度。并为此目标的实现制定新的标准以及时有效地响应用户的需求[25]。NAA也表示要增加满意客户和访客的数量[26]。此外,很多档案馆通过改进服务方式来扩大服务的受众范围和影响力,如NAA建立新的体验式档案网站,提供全国性的展览巡回节目和引人入胜的公共节目来增加访客和公众满意度。NARA推出“铭刻印迹:签名里的故事”展览,通过“签名”将美国历史上的重要事件直观地呈现给观众。这些体验活动都增加了档案馆与公众的互动,吸引了更多关注[27]。

其次,鼓励公众转变角色,将自己从“接受者”变成“参与者”是当前更为普遍的趋势[28]。其中公众参与又以公众自发性参与和档案众包两种模式为主。前一种模式表现为公众通过网站主动地进行意见反馈,如公众通过TNA网站首页的用户调研问卷,表达自身的访问需求,推动档案馆服务质量的提升[29]。这种参与模式对公众的专业性要求不高,可以根据自身利用情况进行反馈或是根据兴趣爱好参与档案馆建设,公众参与门槛较低。

而众包模式更具专业性,它的核心理念是档案馆在互联网平台发布有关任务,公众自由自愿地承接。最终通过汇聚公众的力量与智慧完成档案收集、文本转录、著录、标引等工作[30]。近几年随着众包项目普遍发展。NARA、NAA等将其作为加强档案馆与公众联系的重要策略写入工作计划中:NARA通过向在线国家档案目录提供独特的内容,鼓励公众添加“标签”并抄录文件,以改善搜索结果;到2025财年,公民对国家档案目录的贡献使手写或难以阅读的文字可供更广泛的受众使用。澳大利亚作为档案众包发展最为迅猛的国家,诸如“目的地:澳大利亚——分享我们的战后移民故事”项目;“强制收养”历史项目;“发现米尔登霍尔的堪培拉”项目;“蜂巢”转录等项目正在如火如荼进行。当前国外公共档案馆的众包模式呈现出了以下特点:一是依托于多样的技术和平台,既有通过档案机构网站也有通过社交平台发起的众包项目。有档案馆开发搜索工具,不仅向用户呈现的描述性信息,还允许用户创建和分享标记和虚拟列表集合[31],还有档案馆通过与其他联邦机构,私营部门和公众合作,将诸如档案馆、图书馆、博物馆等机构的数据源进行连接,以提高数据的可检索性和可用性[32];二是类型多样且贯穿于档案管理工作的全过程,从档案资源众包、档案整理与组织众包、档案鉴定众包到档案利用与传播众包,公众得以更全面地参与整个档案工作中;三是档案工作者自身定位的转变,由之前的信息提供者变成了公众参与的指导者、系统者和监督者,档案管理员也在努力以开放的态度承担新角色[33]。

2 国外公共档案馆发展趋势对我国的启示

2.1 加大档案开放力度

改革开放以来,我国在档案开放和公众对档案的利用服务中已经进行了卓有成效的探索。2019年《政府信息公开条例》的重新修订,对档案开放以支持政府治理提出了更高要求。2020年6月20日新修订档案法不仅将档案开放期限从30年改为25年,还要求档案馆通过其网站或者其他方式定期公布开放档案的目录,为档案的利用提供便利。目前,我国在档案开放和公众获取过程中仍存在一些问题:档案工作人员害怕担责,“重藏轻用”意识依旧强烈;档案服务渠道单一,法律制度中有关开放期限界定和利用之间存在矛盾[34]。要想解决上述问题需要从以下方面努力。首先,要树立政治和文化自信,重新认识档案开放。严格按照新修订档案法对档案开放的新要求,充分尊重公民追求自由、平等获取信息的权利,做到依法且合规地开放档案。其次,要做好档案开放的政策与制度设计。基于新修订档案法明确并细化档案开放政策,改进完善档案开放制度,使档案开放工作有据可依。在档案安全保密责任制、问责制的基础上,应适当考虑责任豁免的情形,解决好保密与开放之间的矛盾;另外,需要在保障安全与隐私的基础上改进档案开放形式,推进档案开放向档案数据开放的转变,探索实现开放目录、开放元数据到开放内容数据的路径。

2.2 拥抱智能技术

我国公共档案馆运用人工智能技术还处于起步阶段[35]。2018年4月,科大讯飞与国家档案局科学技术研究所签署了战略合作协议,重点从档案的智慧收集、管理、存储、利用等方面促进人工智能在档案管理中的应用[36];太仓市档案馆通过智能 Agent 进行档案检索,通过人工智能技术模拟人的感官及思维方式,对人脸、声音、指纹、视网膜、虹膜等信息进行识别和加密,在利用者和实体档案资源间建立起了一道安全屏障[37]。但相比国外,国内人工智能技术的应用明显滞后,在档案管理具体环节的应用探索还需要加强。首先,需要在正确处理人工智能技术和档案人员参与档案工作的基础上,注重与相关技术机构的合作,提高人工智能技术水平,逐步从理论研究向实践运用的转换。其次,需要加强人工智能技术在档案工作中的应用深度,以项目为导向,将人工智能技术运用于档案整理、检索和利用等具体的实践阶段,进一步推动档案管理和服务效率的提高,为智慧档案馆的建设提供技术支持。

2.3 鼓励公众参与

近年来,国内公共档案馆在吸收公众参与方面取得了一定进展。很多档案馆网站都设置了局长信箱、咨询投诉和网上调查等栏目,还有档案馆通过众包吸纳公众参与,如沈阳市档案馆建立的家庭档案网站。其鼓励公众上传分享自己的家庭档案,具有档案征集和展示众包色彩,但仍停留在档案征集层次,未涉及馆藏公共档案资源的开发利用。今后的公众参与,首先需要丰富参与类型,提高参与广度,注重机构间合作。其次,要提升公众参与深度,档案人员在过程中作为监督者和指导者,需要对公众参与进行引导和帮助,以更好帮助公众发挥潜力和创造性。最后,要让众包在国内档案部门落地,不仅需要技术和平台的搭建,更关键的是敢于开展众包项目的意识和魄力。如果仍在档案开放层面“畏首畏尾”,不解放思想,做好安全保障,众包项目将难以实现。因此,需要进一步完善相关政策法规,保障档案众包各方合法权益和档案信息安全,加强档案馆自身众包理念、资源和能力建设。

猜你喜欢
档案馆公众人工智能
公众号3月热榜
公众号9月热榜
公众号8月热榜
公众号5月热榜
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能与就业
IT经理世界(2018年20期)2018-10-24 02:38:24
数读人工智能
小康(2017年16期)2017-06-07 09:00:59
关于县级档案馆馆藏档案开发利用的思考
兰台内外(2017年6期)2017-05-30 06:46:41
全省部分档案馆新馆掠影
浙江档案(2017年10期)2017-03-31 06:27:31
下一幕,人工智能!
南风窗(2016年19期)2016-09-21 16:51:29