2017 年,国务院印发《新一代人工智能发展规划》,提出要“部署构筑我国人工智能发展的先发优势,加快建设创新型国家和世界科技强国”[1]。2019年,德勤科技发布的《全球人工智能发展白皮书》指出人工智能技术正全方位商业化,将深刻变革教育、数字政务、医疗、无人驾驶、制造业、智慧城市等各行各业[2]。2021年,中共中央办公厅、国务院办公厅印发的《“十四五”全国档案事业发展规划》表明,要“加强大数据、人工智能等新一代信息技术在数字档案馆(室)建设中的应用”[3]。2022年,国家档案局开展的科技项目立项工作也明确提出要加强人工智能技术在档案管理中的应用研究[4]。在国家政策的引领下,人工智能等新一代信息技术迅速崛起,引发了档案管理方式的变革浪潮,我国各地档案馆纷纷开展试点,将人工智能应用于档案管理中。目前,我国档案学界主要聚焦于人工智能在档案资源开发利用[5]、音视频档案智能整理[6]、档案智能开放审核[7]、影像档案智能修复[8]等方面的应用,鲜有学者从宏观角度出发,研究人工智能技术在我国档案管理各环节的应用。基于此,本文围绕人工智能在我国档案收管存用环节的应用现状,通过文献研究和案例分析,发现其存在的问题与不足,并针对问题与不足制定优化路径,以期促进我国档案事业的高质量、现代化发展。
一、人工智能在我国档案管理中的应用现状
(一)人工智能在档案智能收集中的应用
档案收集是档案工作的起点,也是实现档案集中统一管理的前提,通过有效收集档案,可以确保档案的完整性和一致性,从而为后续的管理和利用奠定基础。在信息时代,档案资源的数量呈爆炸式增长,档案种类日益丰富。面对不同载体形式的海量档案,利用自然语言处理、模式识别等人工智能技术,能够完成音视频、图像、手写文字等主要元素的数字化处理,实现档案数据的智能采集[9]。对于音频档案,人工智能技术可以运用语音识别技术智能识别音频,将语音信号中的词汇内容转变为计算机可识别的数据,进而进行分类操作。例如,科大讯飞股份有限公司依托讯飞档案机和智录机,应用语音识别、转写等技术提取历史音频档案信息生成字幕,实现辅助著录[10]。对于音像档案,云南税务部门利用人工智能技术中的自然语言处理技术识别档案中的文字,并采用模式识别技术抽取音像档案的内容,从而完成税务执法音像档案的收集[11]。对于图像档案,北京市市场监督管理局利用人工智能技术中的图像识别和信息抽取技术,对现存的图像档案进行批量智能自动识别处理,从而实现图像档案信息的智能收集 [12]。对于文字档案,百度公司开发出一种基于深度学习的OCR技术,能够自动识别扫描版档案中的文字内容,辅助完成档案的数字化处理。
(二)人工智能在档案智能管理中的应用
人工智能技术在档案管理中的应用主要体现在档案智能整理、档案价值智能鉴定、档案智能检索和档案智能安全管理四个方面。
第一,档案智能整理。档案整理是档案管理的基础,档案只有经过系统整理,才能反映出各项活动的历史联系和本来面貌,才能更好地发挥其价值和作用。人工智能凭借强大的学习能力和语义分析能力,可以辅助档案自动归档、自动分类,提高档案整理效率,推动档案工作的科学化、智能化发展 [13]。人工智能融入档案整理已是大势所趋,档案行业纷纷开展试点,不断提高档案整理的智能化水平。2019年5月,浙江省档案馆与讯飞智元信息科技有限公司共同承担的“人工智能技术在音视频档案整理利用中的应用研究”课题被国家档案局正式立项,该课题提出了人工智能技术辅助音视频档案整理的解决方案,实现音视频档案的智慧化整理[6]。广州供电局会计档案电子化试点项目借助人工智能技术实现会计档案的自动整理和元数据的自动生成[14]。
第二,档案价值智能鉴定。面对纷繁复杂的结构化和非结构化档案信息,做好档案价值鉴定工作能有效地提高档案部门管理档案的质量和效率,大幅度提升档案资源的有效性。人工智能技术与档案鉴定的结合能够解决档案人工质检效率低、漏检、错检等问题,并为档案鉴定走向自动化、智能化提供可能[9]。就国内而言,江西省档案馆借助人工智能技术制作档案鉴定模型,共完成26.526万件档案二分类预测与运用工作,其中鉴定模型总准确率为70.68%,总精确率为67.6%[15]。北京市市场监督管理局运用专家系统,研发出某种类型档案的页面公开级智能鉴定工具,实现企业登记档案的智能化鉴定。
第三,档案智能检索。档案检索是档案管理的重要环节,随着社会信息化发展,档案检索不仅仅是纸质档案的查询,更多的是电子档案和数字化档案资源的检索。为了顺应档案信息化战略转型的需要,各地档案部门积极开展人工智能技术应用于档案检索的实践。为提升档案检索的智能化发展,太仓市档案馆和河南省数字档案馆都开展了相关的实践探索。江苏省太仓市档案馆利用智能代理技术,实现对馆藏档案的全文检索[16]。河南省数字档案馆借助智能检索系统,挖掘出大量结构化和非结构化馆藏资源,通过档案数据和信息之间的关联形成知识图谱和档案知识库,提高了馆藏档案检索的查全率和查准率[17]。
第四,档案智能安全管理。档案安全是档案工作的生命线,直接关系到档案事业的可持续发展。档案安全管理包括实体档案安全管理和数字档案安全管理,其中,实体档案安全主要是档案库房的安全,档案库房安全是保证档案安全的基本条件。在档案库房安全方面,江苏省太仓市智慧档案馆将人工智能技术嵌入门禁系统和能够辅助识别、定位的监控跟踪系统,实时监控档案库房的安全状况,排除安全隐患[16]。此外,江苏省昆山市档案馆与市公安局联合开发“网上查档大厅”系统,利用人工智能技术中的人脸识别辅助验证身份,确保线上查档的安全[18]。在数字档案安全管理方面,融入人工智能技术的智能防火墙和智能入侵检测系统能够自主拦截病毒、阻止网络攻击,并主动追击攻击者、收集攻击数据,为数字档案安全保驾护航 [19]。
(三)人工智能在档案智能保存中的应用
档案保存关系到档案的完整性、真实性和可用性,对于维护历史真实面貌、促进社会发展和保障公众权益具有不可替代的作用。随着信息技术的快速发展,人工智能的算法能够优化档案信息存储的方式,确保档案保存的智能、安全、有效。除此之外,人工智能融入电子文件管理系统,可以实现文件自动化归档保存。例如,2020年中国石油数字档案管理系统利用人工智能及其他新兴技术,集成电子公文、财务管理等多个系统,实现电子化公文、会计票据等自动归档保存[20]。此外,杭州远大档案技术有限公司借助人工智能中的机器学习技术,实现电子文件自动整理、在线归档和精细管控,保证归档电子文件的真实性和完整性 [10]。
(四)人工智能在档案智能利用中的应用
档案管理的根本目的在于档案利用,档案只有被有效利用才能真正发挥其应有的价值和作用。人工智能技术在档案利用层面的应用主要体现在档案服务和档案展览两个方面。在档案服务方面,人工智能中的模式识别和专家系统技术,可以根据用户的借阅历史和偏好,预测其可能感兴趣的档案类型,从而实现个性化推荐,如智能推荐、虚拟助手等。人工智能还可以利用机器学习算法识别分析档案资源出现的人、地、事、时、物要素形成细粒度档案知识库,支持语义检索、自然语言问答等功能,完善资源利用智慧化程度,如广州市妇女儿童医疗中心挖掘病例档案数据集训练人工智能,实现儿科疾病的智能化诊断[21]。在档案展览方hzYk3sXKNLlC6bPpImEt2GM1Ybzb+aB2qyr5XX0rJ7U=面,人工智能借助机器学习和多模态融合等技术,能够深度挖掘数字化档案信息资源,深化展览主题 [22]。例如,天津市红桥区采用“人工智能+数字档案”的新方式,将主题宣传视频集中推送至新媒体平台上[23]。
二、 人工智能应用于档案管理存在的问题
(一)档案管理全过程智能化有待拓展
档案管理的全过程智能化是指档案在进行“收管存用”的过程中,形成的一整套智能化、自动化、整体化的档案管理模式。尽管我国档案管理智能化实践图景不断丰富,但目前人工智能技术与档案工作收管存用的融合更多地表现在某一工作环节的智能化,档案管理的全过程智能化有很大的发展空间。制约我国档案管理全过程智能化的因素:
第一,政策实施不到位。《“十四五”全国档案事业发展规划》明确人工智能推动数字档案馆(室)建设优化升级的政策导向,但在具体实施过程中,运用人工智能技术实现档案管理的全过程智能化需要依靠大量资金、技术和人才的支持,对于经费有限或技术基础薄弱的地区和单位来说,这无疑是一个难以跨越的障碍。此外,各地区档案馆档案工作人员的文化水平和能力参差不齐,对应用人工智能技术建设数字档案馆(室)的理解不同,部分地区的档案管理员将人工智能技术在档案管理中的应用理解成诸如档案智能收集或者档案智能保管等某一档案管理环节的智能化建设,这在很大程度上制约了我国档案管理全过程智能化的建设水平。
第二,档案数据孤岛问题。档案数据是人工智能技术发挥效用的前提和基础,档案数据的质量决定档案管理的水平,档案数据质量参差不齐会导致人工智能算法在处理档案数据时出现错误或失效,进而影响档案工作其他环节的顺利开展。目前,我国档案数据标准不统一,部分地区存在档案数据接口不开放、档案数据共享机制不健全等问题,这导致不同档案部门和业务系统之间无法实现档案数据的高效流通和共享,进而形成档案数据孤岛现象。我国档案资源基数大,不同载体形式的档案数量繁多,面对纷繁复杂、多源异构的档案资源[24],档案数据孤岛现象会影响档案数据收集的真实性、完整性、可用性和安全性,严重阻碍档案全生命周期管理模式的实施,从而对档案管理全过程智能化的发展产生负面影响。
(二)人工智能技术集成化应用有待深化
纵观我国开展的人工智能辅助档案管理的实践可知,档案管理是一项极其复杂的工作,涉及收管存用多个环节,尽管人工智能技术在档案管理领域展示出了巨大的潜力,但其在档案管理中的应用仍处于初级阶段。一方面,人工智能仍处于弱人工智能阶段,其在档案管理领域的应用面临自身技术革新的局限性问题,技术的成熟度和稳定性有待考量。这意味着,虽然人工智能能够辅助处理大量档案数据并进行预测和决策,但其决策过程仅仅依靠人工智能技术往往是黑箱操作,使人很难理解其决策的依据和逻辑。另一方面,在新一轮科技革命和产业变革的浪潮中,人工智能与大数据、物联网、云计算、区块链等新一代信息技术之间存在着紧密的联系。虽然我国部分地区已经针对人工智能技术开展档案管理试点实验,但其大多倾向于将人工智能技术应用于重复性较高的档案管理工作,并不能完全实现档案管理的类人脑智慧化发展。为顺应档案管理智能化转型的需要,档案部门应加强技术研发和创新,推进人工智能技术与大数据、云计算、区块链等其他先进技术的集成应用。同时,也要加强人工智能与计算机科学、信息科学等的跨学科合作,共同推动人工智能技术在档案管理中的成熟与稳定。
(三)复合型人才队伍建设有待加强
人工智能技术为我国档案事业的发展带来了新契机,但我国在实际应用人工智能技术进行档案管理的过程中,各地档案馆档案管理人员综合素质参差不齐,导致其对运用人工智能技术进行档案管理的适应程度存在差异。一方面,自然语言处理、模式识别、专家系统等人工智能技术涉及计算机科学、数学、统计学等多方面的知识,这要求档案工作者必须具备持续学习和自我更新的能力。但各地区档案馆档案管理人员的教育背景、工作经验和专业技能参差不齐,其对人工智能技术应用的掌握程度存在差异。另一方面,人工智能等新技术的应用使档案管理模式发生了许多变化,部分地区档案馆档案工作者尚未适应角色转变,对人工智能技术的应用持有抵触情绪,仍坚持使用传统的档案管理方法和技能,忽视人工智能技术的应用价值。人工智能背景下,我国应加强培养“会技术,懂档案”的复合型高素质人才,转变档案管理人员的管理意识[25],积极应对人工智能技术给档案管理带来的挑战与冲击。
三、人工智能应用于档案管理的优化路径
(一)拓展档案管理的全过程智能化
第一,落实人工智能技术应用政策。人工智能技术在档案管理全过程智能化发展中起关键作用,尽管我国在宏观层面出台了《全球人工智能发展白皮书》《“十四五”全国档案事业发展规划》等有关人工智能技术应用的政策,但在具体实施过程中,还需要进一步细化政策指导,通过制定统一的规则和标准将政策落实到位。基于此,政府部门应重视人工智能在档案管理领域的发展,出台统一的规范和标准支持技术创新和应用推广,加大资金投入,保障人工智能技术在档案管理中的优化升级。同时,政府部门还需要借助新闻媒体、社交媒体等各种渠道加大宣传和普及力度,向公众普及人工智能技术在档案管理中的应用情况和优势,加强公众对档案管理全过程智能化的理解。此外,档案主管部门应联合企业加大研发投入,通过开展算法优化、模型设计及训练等适配工作,拓宽更多的应用场景并开展试点工作,积极落实人工智能技术应用于档案管理全过程智能化的政策[26]。
第二,建立统一的档案数据共享平台。2021年,新修订的《中华人民共和国档案法》明确提出“推进档案信息资源共享服务平台建设,推动档案数字资源跨区域、跨部门共享利用”的要求。档案数据贯彻档案管理全过程智能化的始终,完整有效的档案数据是档案管理工作得以顺利开展的前提。未来是“数据为王”的时代,为打破不同区域、不同部门间出现的“档案数据孤岛”现象,首先,需要制定统一的档案数据标准和规范,以消除各部门对档案数据的定义差异,解决逻辑性档案数据孤岛问题;其次,构建档案数据共享平台,以统一的标准对档案数字化成果和电子文件进行管理,实现跨部门、跨系统的档案数据共享和交换;最后,利用大数据技术对共享平台的档案数据进行整合和分析,以此构建深度融合、全面丰富的档案信息资源数据库,满足档案管理全过程智能化的档案数据要求[27]。
(二)深化人工智能技术的集成化应用
在数字档案馆建设背景下,想要破除人工智能黑箱操作,实现档案管理的全过程智能化需要人工智能与云计算、大数据、区块链、虚拟现实、物联网等其他先进技术的集成应用,如在档案智能收集方面,“人工智能+云计算”能够拓展档案资源的存储空间,实现存量档案的数字化;在档案智能管理方面,“人工智能+大数据”能够实现多源异质档案数据的统一划分,满足档案管理的智能分类、智能检索和智能安全防护等要求;在档案智能保存方面,“人工智能+区块链”能够提供可信、可靠的流程跟踪溯源,确保档案数据的不可篡改性和可追溯性;在档案智能利用方面,“人工智能+虚拟现实”能够满足用户个性化档案利用需求,增强用户档案服务体验。除此之外,还要开展跨界合作,积极学习国外跨界合作项目经验,主动寻求与互联网企业、其他科研机构、高校相关专业的跨界协同协作,结合人工智能与其他技术的特点和档案管理的方法与规律进行深入探究,并积极试点,以此推动档案智能化管理的拓展与升级。
(三)加强复合型人才队伍建设
人工智能技术为档案管理带来机遇的同时,也给档案管理人员带来了挑战。为了应对这些挑战,需要培养兼具档案管理理论和人工智能技术的综合性高素质人才。首先,学校要优化档案学专业人才培养方案。在档案学的课程设置中,开设与人工智能技术相关的专业课程,如机器学习、数据挖掘、自然语言处理等,以此为档案馆培养适应新时代新要求的复合型高素质人才。其次,档案E1TstKIMfRLoTyB26YAsXg==馆(室)要及时调整档案工作者的角色定位,加大对档案管理人员的培训力度。随着人工智能技术的应用,档案工作者逐渐由传统的档案管理者转变为技术应用者和创新者,他们需要具备数据分析、机器学习等相关技能,能够利用人工智能技术对档案信息进行智能化处理和管理。为适应角色转变,档案馆(室)可以通过组织内部培训、邀请专家开展讲座等方式加强对档案管理人员的培训,不断更新其技术知识和实践操作能力。同时,档案馆(室)还可以与高校、科研机构等合作,共同开展科研项目,提升档案管理人员的科研能力和创新能力。未来,只有通过培养“理技兼通”的复合型、高素质人才,才能更快、更准确地找到人工智能技术与档案管理结合的切入点,早日实现人才兴档。
四、结语
人工智能在我国档案管理收管存用领域具有广泛的应用前景,为我国档案事业的现代化发展带来了新契机。但现阶段,人工智能技术尚未成熟,其在档案管理工作中的应用还存在很多制约因素。未来,需要档案主管部门联合政府及其他研究机构深入开展实践,进一步加强技术研发和试点实验,推动人工智能在档案管理工作中的创新与发展,真正实现档案管理的智能化转型和智慧化升级。
参考文献:
[1]中华人民共和国中央人民政府.国务院关于印发新一代人工智能发展规划的通知 [EB/OL].[2017-07-20][2024-01-05]. http://www.gov.cn/zhengce/content/2017-07/20/content_5211996. htm?from=timeline&isappinstalled=0.
[2]德勤:2019全球人工智能发展白皮书-Useit知识库[EB/OL].(2019-10-09)[2024-01-05]. https://
www.sohu.com/a/345921126_680938.
[3] 中华人民共和国国家档案局.中办国办印发《“十四五”全国档案事业发展规划》[EB/OL].(2021-06-08)[2024-01-05].http://www.saac.gov.cn/daj/yaow/202106/899650c1b1ec4c0e9ad3c2ca7310eca4.shtml.
[4]中华人民共和国国家档案局.国家档案局办公室关于开展2022年度国家档案局科技项目立项工作的通知[EB/OL].(2022-01-29)[2024-01-05].https://www.saac.gov.cn/daj/tzgg/20220 1/7b1c8ea467ad4b6dbb64a3b3815be2df.shtml.
[5] 李欢, 施瑞婷, 张洁. 人工智能在档案资源开发利用中的应用分析[J]. 山西档案, 2021(2): 71-78.
[6] 林空, 李衍. 人工智能技术在音视频档案整理利用中的应用研究[J]. 中国档案, 2023(7): 62-63.
[7] 聂云霞, 范志伟. AI技术在档案开放审核中的SWOT分析[J]. 山西档案, 2023(4): 35-45, 88.
[8] 李新宇. 影像档案人工智能修复中的几个问题[J]. 档案学研究, 2023(3): 144-148.
[9] 牛力, 黎安润泽, 刘慧琳. 融合、延展、重构:物理与数字双空间业务转型视角下的档案信息技术应用思考[J]. 档案学通讯, 2023(5): 19-27.
[10] 浙江省委办公厅档案监督管理处. 浙江省三项国家档案局科技项目通过专家验收[J]. 浙江档案, 2021(9): 6.
[11]中华人民共和国国家档案局.云南税务征管电子文件单套制归档试点通过验收[EB/OL].(2021-10-11)[2024-01-05]. https://www.saac.gov.cn/daj/c100262/202110/4528cbde36e24b ea88ce457bfb8bae21.shtml.
[12] 陈会明, 史爱丽, 王宁, 等. 人工智能在档案工作中的应用实践与挑战: 以北京市市场监督管理局为例[J]. 档案与建设, 2019(7): 53-56.
[13] 黄新荣, 刘亚宁. 推进档案整理 “三合一” 工作[J]. 档案与建设, 2022(10): 56-59.
[14]中华人民共和国国家档案局.广州供电局会计档案电子化试点项目通过验收[EB/OL].(2021-01-28)[2024-01-05].https:// www.saac.gov.cn/daj/c100338/202102/0f7e51484c3e4247b4448e3 68a9f41dd.shtml.
[15] 毛海帆, 李鹏达, 傅培超, 等. 基于数据挖掘技术构建辅助档案开放鉴定模型[J]. 中国档案, 2022(12): 29-31.
[16] 陈亮. 人工智能技术在智慧档案馆建设中的应用初探: 以太仓市档案馆为例[J]. 档案与建设, 2016(7): 80-82.
[17]中华人民共和国国家档案局.提升档案信息化发展水平实现远程利用社会共享——河南省数字档案馆建设概述[EB/OL].(2020-06-12)[2024-01-05]. https://www.saac.gov.cn/daj/c100226/202006/6d0ad86e8a4443e187bbe67908b4ffab.shtml.
[18]中华人民共和国国家档案局.江苏昆山“网上查档大厅”受到市民热捧[EB/OL].(2022-01-21)[2024-01-05].https://www. saac.gov.cn/daj/c100202/202201/b7c701582a7d4b85903a4e3ae70 620c5.shtml.
[19] 沙洲. 人工智能在档案工作中的应用研究[J]. 档案与建设, 2018(2): 36-39.
[20]中华人民共和国国家档案局.中国石油天然气集团数字档案管理系统全面上线运行[EB/OL].(2020-07-10)[2024-01-05]. https://www.saac.gov.cn/daj/c100166/202007/efce9562bde545eea22950e0e913b1f9.shtml.
[21] 丁然, 丁华东. AI驱动与电子健康档案智慧诊疗的 功能实现[J]. 山西档案, 2019(6): 57-65.
[22] 支凤稳, 孙若阳, 云仲伦. 元宇宙: 档案展览模式与路径的新探索[J]. 档案与建设, 2022(9): 32-36.
[23]中华人民共和国国家档案局.以档案为媒 展兰台风采——各级档案部门举办丰富多彩的2020年国际档案日系列宣传活动[EB/OL].(2020-06-18)[2024-01-05]. https://www.saac.gov.cn/daj/c100170/202006/6e67bbda62a546ed84ce815cf705b83b.shtml
[24] 丁海斌, 赵锦涛. 数据集成技术在档案管理系统中的应用研究[J]. 档案管理, 2022(6): 94-99.
[25] 韩洁, 史江. 人工智能赋能背景下中外档案管理创新比较与启示[J]. 档案与建设, 2020(2): 40-44.
[26] 贠疆鹏, 加小双, 王妍. 人工智能在我国档案管理中的应用现状与对策分析[J]. 档案与建设, 2023(2): 62-65.
[27] 赵湘渝. 智能化技术在档案信息化建设中的应用现状与对策分析[J]. 档案管理, 2022(3): 73-74.
作者单位:安徽大学管理学院