文/李 军
档案工作是维护党和国家历史真实面貌、保障人民群众根本利益的重要事业。建档与档案保管的真正目的是开发利用档案。2020年新修订的《中华人民共和国档案法》中,缩短了档案开放时间、明确了档案开放职责、规定了档案开放的审核办法、新增了档案信息化建设,这些规定都将有力推进档案的开发利用。《“十四五”全国档案事业发展规划》中进一步指出档案利用服务要达到新水平,做到以人民为中心的档案服务理念深入人心,档案开放力度明显加大、共享程度显著提高、利用手段更加便捷,档案资政服务、公共服务、文化教育能力明显提升。同时,发展规划中还提出“完善档案科技创新和应用”“开展新一代信息技术在档案管理中的应用”,指导档案管理工作中积极应用人工智能等创新技术,深入推进档案利用体系建设,充分实现档案对国家和社会的价值。本文结合档案管理需求与人工智能技术特征,论述在档案开发利用中人工智能技术的应用场景及实施建议。
档案开放划控是各级各类档案馆馆藏档案达到开放年限后经过组织鉴定审查、划控、审核、审批,向社会开放的过程,是档案馆业务建设的基础工作之一,也是一项政治性、政策性很强的工作。这项工作必须根据国家档案法定程序进行,将有用的和可用的档案向社会开放,实现档案信息资源共享,发挥其应有的社会效益和经济效益。
传统的档案开放划控都是依据档案管理人员的经验进行,费时费力且主观性较强。利用人工智能技术可实现档案自动开放划控,保证档案划控更加科学、有依据,有效解决档案管理人手不足的问题。
档案智能开放划控是通过对档案进行自动分类,参照每类档案人工划控的结果,通过机器学习技术,让划控系统“学会”自主划控初审,初审结果再由人工进行抽样复审,不仅能够解决划控工作人手不足的问题,更能使划控工作更加标准规范,结果更为客观。
档案资政参考通过充分挖掘馆藏档案资料,切实提升档案工作服务大局的能力和水平,是发挥档案鉴往知今作用的重要服务形式。
利用人工智能技术能够更全面收集档案内容、充分挖掘档案信息,并自动化、智能化地完成编目工作、生成摘要信息。例如,针对某一政务主题,找到相关背景、政策、实施、调研、报告等文件,进行深度加工分析,从而得到在一定背景下面对一个问题制定的政策取得的效果及原因报告,为政府提供有价值的咨询建议。
运用文本挖掘、语义分析、自动聚类、知识表示等自然语言处理技术,可实现根据资政主题自动聚合高关联性文件,对编研素材进行加工处理,协助人工完成素材的整理,并能够通过自动摘要、自动编目,辅助完成资政参考的编写。
检索是档案利用的重要应用场景,是把开放的档案高效展现给使用者的保障手段。利用OCR、自然语言理解、图像识别、视频解析、知识图谱等技术,可以在传统全文检索基础上提供更为丰富、便利的检索能力。
多模态检索。通过图像识别、视频解析等技术对图像、音频、视频类档案预处理,提取对应档案内容特征,实现文字、图片、音频多模态检索,全方位、多维度地挖掘档案信息,满足用户以图搜图、以文搜音等丰富的检索需求。
基于档案领域知识图谱的智能化检索。随着语义网络、深度神经网络的发展,知识图谱、图数据库、深度学习等相关技术也逐渐渗透到档案研究领域。通过对数字档案资源的本体提炼、知识抽取和语义关联,可以准确提取数字档案资源的核心,为用户提供更精准的基于深度语义理解的检索服务,并通过简洁明了的可视化形式把检索结果展现给用户。
基于用户画像的精准档案推荐。针对档案用户特征、检索历史、页面浏览习惯等识别用户偏好构建用户画像,基于用户画像技术为用户提供个性化的档案内容推荐,并进一步提供内容联想服务,将相关内容以统一且连贯的方式展现给用户,减少用户检索次数和检索步骤,提高检索效率,提升服务质量。
人工智能在档案开发利用中的应用是一个复杂的工程,需要所有档案从业者以科学的方法积极参与,才能有效推动档案开发利用工作提质增效。
1.加强组织领导。各级档案管理部门要高度重视档案人工智能工作,认真学习中央和国家、国家档案局相关文件精神,结合本地区实际,积极探索“人工智能+档案工作”模式,统筹推进档案人工智能各项试点任务的部署落实。
2.增强人才储备。人才是档案管理人工智能发展的关键,档案管理部门要形成培训方案,分类开展综合型、应用型、技术型培训,培养一批既懂业务又懂技术的高层次档案人工智能理论与实践人才,打造档案人工智能骨干团队。
3.打好数据基础。档案管理中人工智能技术的应用,行业数据积累是基础、数据质量是关键,因此要在档案管理工作中扎实推动档案管理电子化、数字化,为智能档案开发利用打好基础。
4.建立科技支撑体系。借助国家科技资金扶持、政策引导,达成科技服务档案管理工作、科技引领档案利用工作,形成产、学、研、用相结合的智慧档案管理、档案开放利用的生态体系。
5.遵循行业标准。智能化档案开发利用中,要严格遵循行业标准,并充分利用行业标准体系,增强研究成果的实用性。《中国档案主题词表》《中国档案分类法》《档案著录规则》等文件积累了档案管理行业多年的行业管理经验,可以为人工智能技术应用提供基础的专家经验。