倪 榕
(厦门蓝极档案技术有限公司,福建 厦门 361000)
《“十四五”全国档案事业发展规划》提出“积极探索知识管理、人工智能、数字人文技术在档案信息深层加工和利用中的应用”,为档案管理的智慧化标准化建设指明了方向。当前,人工智能技术成为推动社会治理效能的关键因素,要激发其在档案服务体系建设中的作用,推动档案工作更好地服务经济社会发展。
人工智能技术与档案管理有天然的契合性,为二者融合开阔了空间,奠定了深度融合的物质基础。
一是档案服务进入转型发展期。伴随新技术广泛应用,催生了数字化、网络化、智慧化的公共服务新模式和档案治理新理念,为人们生活带来了极大便利。同时,人们对优质服务的需求也随着提升,将人工智能技术应用档案服务已成为必然要求。比如,当利用者进行资料编研时,机器学习技术根据利用者需求自动推送相关内容,提升利用者编研效率。再比如,数据挖掘技术可以按照不同用户的需求,进行档案信息的收集和处理,保证了数据服务的个性化。二是传统档案服务模式的滞后性。随着电子档案的铺开,档案信息资源管理难度越来越大,大量结构化的数据资源成为管理的主要对象。与之相对的是对电子档案服务能力和效率的要求提升,需要借助知识管理工具开展科学管理。比如,《“十四五”全国档案事业发展规划》指出,档案开放审核是档案开放利用的基础,也是档案工作中的难点问题。在电子档案开放中应用人工智能的自动审核优势,将档案人员从繁重任务中解脱出来,提高档案开放的准确性和实效性。
目前,我国正处于向数字社会建设的转型时期,档案工作的环境、对象、内容、方法都发生了根本性变化,档案管理与人工智能相融合也将有助于更好发挥人工智能的优势。具体表现在:从管理来说,人工智能与物联网技术相结合,通过射频信号实现自动识别管理对象获取数据,依托人工技术的机器学习和深度学习,从海量数据中提取有用价值,应用较为广泛的是智能库房建设,实现档案位置、类别和库房“九防”的跟踪和感知;从服务来说,人工智能实现从低层次数据记录到高层次知识聚合、图像查询由目录级向内容转变,体现了人工智能在知识挖掘和开发利用中的独特优势,为档案资政服务和公共服务打开了更为广阔的空间。从资源来说,人们对电子档案质量和效率有了更高要求,人工智能通过搭建数据化管理系统,依托计算机视觉、自然语言处理、机器学习等技术,实现档案的自动化识别、分类、存储和检索,从而提高档案管理的效率和准确性。
根据《基于人工智能的接入网运维和业务智能化场景与需求》(YD/T 4070-2022)和《国家新一代人工智能标准体系建设指南》,人工智能技术在档案服务领域主要体现在利用、鉴定、安全、审核等方面,应用场景广阔。
电子档案呈现海量增长的趋势,对档案利用提出了新要求。要突破传统的人工检索模式,降低人力、精力和时间的损耗,需要借助人工智能自然语言技术加以解决。自然语言处理就是用人工智能来处理、理解以及运用人类语言,已在生产生活领域广泛运用。比如,机器语言翻译、繁体字和手写体字符识别,语音识别文字转换、文本语义的抽取、过滤与分析等。它融合了语言处理中的语法、语义和篇章分析技术,是人工智能方面最前沿的研究方法。时至今日语言分析技术已把识别准确率从70%提高到了90%以上。电子档案管理可以运用语言分析技术,实现某一内容的智能化检索服务,尤其是对年代较为久远的档案资料,比如手写体、繁体字文档,依靠人工模式出错率高、效率低,依托该种技术,可极大提升文字识别的效率和准确度,实现提升查询利用的效果。比如,昆山市档案馆建立AI 智能校对系统,将大量的档案数据机器学习与人工智能服务的文字识别(OCR)服务、自然语言(NLP)分析服务进行对接,实现档案数据智能校对。
根据《人工智能知识图谱技术框架》(GB/T 42 131-2022)人工智能赋能档案编研的途径有三种形式:一是自助编研。人工智能技术利用知识图谱中的数据,以可视化的方式结合语义检索、推荐和大语言模型,打造自主编研模式,深度挖掘利用档案内容和知识。比如,有的档案部门根据《数字档案馆室建设指南》《电子文件归档和电子档案管理规范》,搭建智能编研模块,只要输入关键字、时间节点、事件等系统能够自助按照模式进行汇总,像大事记等都可以采用此方式。二是方式创新。人工智能和虚拟现实的发展,丰富档案编研形式,使得展览素材更加逼真,例如,该技术能够对老照片进行色彩还原,结合历史背景使得人物鲜活生动,增强虚拟现实的体验,使虚拟环境更加智能和真实。同时,该技术在展览效果上突破了时空限制,通过虚拟现实参观主题展览、体验档案文化,提高了教育效果和参与度。三是智能推送。人工智能能够以语义分析利用者的需求,对关联内容进行推送,提升利用者的查询效率。同时,也可基于海量档案语言模型,对档案内容的事件抽取、文本摘要抽取,建立后台事件数据库和摘要数据库,为档案编研利用进行内容创新服务。
档案审核划控是人工智能应用最广泛的领域,通过OCR 技术提取档案全文,然后使用NLP 技术进行语义分析,优化训练一种基于规则和语义驱动的开放审核模型,对关键档案信息进行识别标注,并动态更新关键词库和自动分类,有效解决了审核数量多和人员少的结构性矛盾。比如,福建省档案馆设计训练了深度神经网络辅助开放审核算法模型,编制了档案开放审核关键词表,提出了档案开放审核工作流程,对规范档案开放审核工作,提升档案开放审核工作效率。人工智能在审核中应加强人工抽检力度,因为人工智能系统需要大量的数据进行训练和学习,但系统常出现“数据偏见”,如果这种重复出现“偏见”,就造成某一模块审核准确率较低。比如,在部分手写稿或者繁体文档中,对部分词语识别准确率较低,造成审核结果失真,会影响整体审核质量。
人工智能技术已经涵盖了档案物理层、网络层、传输层和载体层的全方位安全保护与控制,具体而言主要有:一是智能库房。人工智能建立环境监测系统、中央空调系统、通风设备、中央除尘系统、消防报警及联动控制系统、视频监控系统组成的一体化复合型智慧库房管理模式,实现了库房建设的更新迭代。目前,人工智能已实现全过程机器值守操作,减少人工干预。比如,上海静安区档案馆建立数字孪生技术、三维建模,构建技防与人防相结合、软硬件同步发展的档案实体安全管理体系,打造采用机器人实现档案拿取功能的无人值守库房。二是信息安全。人工智能可设置安全权限,利用人员只能查看安全权限以内的信息;同时,系统的安全风险感知、监测预警、实时阻断、追踪溯源能力提升,防入侵技术有显著提升,防火墙、防水墙的安全防护指数增强,用技术进步解决了安全风险难题。三是传输安全。人工智能通过计算机系统和人工智能的算法优化信息存储的方式,实现电子档案的在线存储、传输和备份,将档案资料从一个地点传输到另一个地点,以及进行档案的跟踪、审计和管理等全流程安全保管。四是载体安全。人工智能与云计算技术,可以提供一个高效、安全和可靠的载体存储环境,使得档案信息可以更加安全、可靠地存储和管理。同时,也可以提供灵活的服务扩展能力,满足档案工作中不断增长的数据存储和管理需求。
结合《云平台人工智能建模系统框架及功能要求》(DB14/T 2527-2022)要求,人工智能在资源建设方面的优势主要体现在档案收集、整理和数据库建设方面。从收集上来看,通过搭建全方位的数据采集系统,对文字、声音、视频、自媒体进行收集,实现了档案资源建设的准、全、多样的要求。从整理上来看,人工智能技术通过预设的分类规则和方案,利用智能分类模型、文字处理技术、模式识别技术等手段,对档案整理流程进行智慧化改造,形成融合智慧化、自主性、一键式功能的整理体系。从数据库建设来看,人工智能推动数字档案馆向智慧馆转变,将全域档案数据转化为结构化的数据,打破了不同数据类型档案之间的信息壁垒,完成了全域档案数据的知识融合。
人工智能的融合路径需要建立完善的推进措施,形成较为完备的要素支撑体系,实现档案服务的智能化标准化。
作为最热门的新技术之一,早在2017 年,国务院就发布了《新一代人工智能发展规划》,提出了面向2030 年我国新一代人工智能发展的指导思想、战略目标、重点任务和保障措施。随着深度学习、自然语言处理、计算机视觉等技术持续创新,人工智能将更加准确地识别和理解人类语言、行为和情感,并能够自主地进行决策和学习,能够拓展档案管理应用的场景和任务,为档案管理带来了更多创新。因此,要紧紧把握时代发展潮流,抓住人工智能发展的战略机遇期,以“智能+技术”赋能档案管理,逐步培育具有鲜明特色、自主可控的人工智能治理新业态。一是加强人工智能技术创新。聚焦深度学习、模拟计算、模态分析、认知推理等实施创新专项和关键核心技术攻关项目,形成具有档案特色的人工智能新技术。二是实施人工智能场景拓展计划。打造智能技术与解决方案供给体系,围绕开发利用、编研、整理鉴定、安全等智能化升级需求,提供自主可控的智能制造“档案方案”。三是加强智慧数字化治理提升。完善档案大脑中枢平台功能,重点围绕数据推送、交互平台等,提升利用的便捷性和人民群众幸福感。
人工智能需要进行深度知识学习,其中就涉及个人的隐私问题,如果这些信息被泄露,就会对社会产生负面影响;人工智能依靠对数据的计算和训练,如果存在技术偏好将产生不公平现象,同时,人工智能系统也面临着网络黑客的攻击。因此,在推进人工智能的同时认真思考如何管理其潜在的负面风险,并采取适当的措施来保护个人和社会的利益。一是高位推动。采取措施加强监管,以确保公众利益和安全,加速建立形成通行、共识的人工智能治理规则和体系。建立多方参与机制,协力促进人工智能良性发展。二是技术突破。要加大技术攻关,围绕实时监测、数据筛选、数据保护、网络安全等方面进行研究,构建更为公平和包容的技术安全环境。三是明确规范。加强人工智能法律机制建设,规范技术标准,通过有效的技术创新、有效的流程管理和有效的风险防范来构筑人工智能治理的生态底座。
新技术的发展为档案管理带来了新的机遇与挑战,档案部门要加速推动档案管理与人工智能深度融合。一是创新投入机制。充分发挥政府投入的主渠道作用,完善以财政投入为主,企业、社会广泛参与的经费保障机制,加大人工智能经费投入力度,加强对政策支持力度,为推进人工智能提供良好的政策环境和发展空间。二是加强宣传引导。坚持典型引路的推进机制,总结提炼先进经验与典型案例。通过组织现场观摩会、举办讲座等方式,广泛宣传经验成效,发挥辐射引导效应。开展选树先进典型,发挥示范引领作用,激发人工智能引用的积极性。要按照《人工智能从业人员能力要求》(SJ/T 11805-2022 )要求,加强专业化队伍建设。三是加强资源配置。重点围绕人民群众关心的服务媒介、资源建设、开发利用等方面,加强智慧档案馆、远程利用的资源和政策供给,提高人工智能应用效能。
人工智能技术的发展已经成为了科技领域的热点话题,已不再是一个遥远的概念,而是渗透到生活的每一个角落,成为推动人类文明进步的重要力量。未来人工智能将会变得更加智慧化,应用场景将会更加广泛,发展方向也会更加多样化,为社会发展带来更多的机遇和挑战。站在新的历史节点上,档案工作者要加强运用人工智能技术的能力和水平,加强科技创新和交流合作,培养高技能人才,推动人工智能健康、可持续的发展,让智能技术更好地服务于档案事业发展。