论人工智能技术在我国档案工作中的应用

2024-06-27 02:46马仁杰邓齐凤
档案管理 2024年2期
关键词:操作能力档案工作创新意识

马仁杰 邓齐凤

关键词:人工智能;档案工作;档案数据;智能化;创新意识;技术知识;操作能力

2017年,国务院印发《新一代人工智能发展规划》,强调要部署构筑我国人工智能发展的先发优势,加快建设创新型国家和世界科技强国。[1]2019年,德勤科技、传媒和电信行业推出《全球人工智能发展白皮书》,深入研究人工智能技术步入全方位商业化后给教育、医疗、无人驾驶、制造业、智慧城市等各行各业带来的深刻变革。[2]2021年,中共中央办公厅、国务院办公厅印发的《“十四五”全国档案事业发展规划》提出要“加强大数据、人工智能等新一代信息技术在数字档案馆(室)建设中的应用,推动数字档案馆(室)建设优化升级”。[3]2022年,国家档案局开展的科技项目立项工作也明确表明要加强人工智能技术在档案管理中的应用研究。[4]在国家政策的引领下,人工智能等新一代信息技术迅速崛起,引发了档案工作的变革浪潮,我国各地档案机构纷纷开展试点,将人工智能技术应用于档案工作中。目前,我国档案学界聚焦于研究人工智能技术在音视频档案智能管理[5]、档案智能开放审核[6]、档案资源开发利用[7]、影像档案智能修复[8]等方面的应用,鲜有学者从宏观角度出发,研究人工智能技术在我国档案工作各环节的应用。基于此,本文围绕人工智能技术在我国档案收管用环节的应用现状,通过文献研究和案例分析,发现其存在的问题,并针对存在的问题提出优化建议,以期促进我国档案事业的高质量发展。

1 人工智能技术在我国档案工作中的应用现状

为了深入了解我国应用人工智能技术开展档案工作的现状,通过对中国全文期刊数据库(CNKI)、万方数据库、维普数据库、超星等平台进行文献检索,系统梳理人工智能技术在我国档案工作中的应用现状。

1.1 人工智能技术在档案收集中的应用。在信息技术高度发达的时代,档案资源数量繁多、种类丰富,具有多来源、多模态的特点。面对纷繁复杂、多源异质的档案资源,融合数据采集、智能转录、模式识别、专家系统等人工智能技术,能有效提升档案收集的质量和效率,提高档案收集的智能化水平。[9]我国在文字档案、图像档案、音频档案、视频档案等跨模态档案资源的智能收集实践中,均涉及人工智能技术。例如,安徽省档案馆借助OCR识别技术对简体手写体档案和民国繁体档案等历史档案进行识别,完成历史档案信息的智能收集[10];北京市市场监督管理局利用人工智能技术中的图像识别和信息抽取技术,对现存的图像档案进行批量智能自动识别处理,实现图像档案信息的智能收集[11 ];浙江省档案馆与科大讯飞公司合作,运用AI识别、转写等技术实现对音频档案的采集和著录[12],完成音频档案的智能收集;云南税务部门利用人工智能技术中的模式识别技术抽取视频档案的内容,从而完成税务执法视频档案的智能收集[13]。

1.2 人工智能技术在档案管理中的应用。人工智能技术在档案管理中的应用主要体现在智能保存、智能整理、智能价值鉴定、智能检索和智能安全管理五个方面。

1.2.1 档案智能保存。随着信息技术的飞速发展,传统的档案保存方式已不再适合新技术环境的要求,人工智能融入电子文件管理系统,可以优化档案保存的性能,实现文件自动化归档保存。针对档案智能保存,我国很早就开展了相关实践,如2020年中国石油数字档案管理系统利用人工智能及其他新兴技术,集成电子公文、财务管理等多个系统,实现电子化公文、会计票据等自动归档保存。[14]不仅如此,杭州远大档案技术有限公司借助人工智能中的机器学习技术,实现电子文件自动整理、在线归档和精细管控,保证归档电子文件的真实性和完整性。人工智能技术在我国档案智能保存中的应用,能够实现多元档案数据的智能化归档和分类,为后续的智能检索和利用等奠定基础。

1.2.2 档案智能整理。人工智能凭借先进的算法和模型,可以辅助档案自动化分类、归档,提高档案整理的效率。我国各地档案机构针对人工智能技术在档案整理领域的应用纷纷开展试点,如山东省威海市环翠区档案馆在积极推进国家级单套制、单轨制试点过程中,使用了智能采集模型的人工智能技术,实现了电子文件区域智能归档整理和档案信息资源共享[15];广州供电局会计档案电子化试点项目借助人工智能技术实现会计档案的自动整理和元数据的自动生成。[16]人工智能在我国档案智能整理中的应用涵盖多个方面,除了自动归档、分类,还包括辅助档案智能编研等内容。

1.2.3 档案智能价值鉴定。人工智能中的自然语言处理技术支持模糊查询和快速定位,能够自动识别档案内容中的语义信息,解决人工质检档案漏检、错检等问题,有效提高档案价值鉴定的质量和效率。例如,江苏省张家港市档案局依托人工智能技术开发出电子档案检校系统,能够自动对数字化扫描件的目录、影像偏正、页面缺漏等进行全面检测校验,弥补了传统人工抽检的不足。[17]同时,辽宁省档案馆借助机器学习、专家系统、语义分析等人工智能技术,构建多维语义理解算法模型,从敏感词、敏感语句、敏感图像等多角度对档案全件进行语义分析,提升档案价值鉴定业务的智能化水平。[18]此外,国家安全监督管理总局档案馆结合保管期限判定原则,依托人工智能中的专家系统分析档案内容,实现计算机辅助判定档案保管期限的功能。

1.2.4 档案智能检索。人工智能技术在档案检索中的应用,可以增强档案信息的可搜索性,有效提高档案检索效率。为提升档案检索的智能化水平,江苏省太仓市档案馆和河南省数字档案馆都应用人工智能技术开展了相关的实践探索。江苏省太仓市档案馆利用智能代理技术,实现对馆藏档案的全文检索。[19]河南省数字档案馆借助智能检索系统,挖掘出大量结构化和非结构化馆藏资源,通过档案数据间的关联形成知识图谱和档案知识库,提高检索的查全率和查准率。[20]

1.2.5 档案智能安全管理。档案安全管理包括档案库房安全管理和数字档案安全管理,在档案库房安全管理方面,人工智能技术能够对人脸、声音、指纹等信息进行识别和加密,从而对档案存放位置、库房“八防”状况进行实时感知和跟踪,以此建立完备的智能安防系统。在新冠疫情期间,国网湖北省电力公司武汉供电公司充分利用智能档案库房建设成果,发挥库房智能环境控制系统、智能消防系统和安防系统的作用,减少人员接触,有效保障档案库房和档案实体的安全。[21]此外,宁波市鄞州区档案馆开发出“可信认证+人脸识别”系统,通过利用人工智能技术中的人脸识别辅助验证用户身份,排除安全隐患。在数字档案安全管理方面,通过相关技术手段,人工智能可以预测潜在的安全风险,并提前加以防范。例如,科大讯飞的档案超脑平台2.0版本内置专业语料库,形成完全本地化保存的档案数据,实现与互联网的完全隔离,保证档案数据的安全可靠。[22]

1.3 人工智能技术在档案利用中的应用。人工智能技术在我国档案利用中的应用主要体现在档案服务方面。一方面,人工智能技术中的数据挖掘、数据分析、知识地图等技术能够细化档案资源的颗粒度,挖掘档案信息间的内在联系和发展脉络,并以可视化的形式展示档案资源中的关系网络,最大限度地盘活档案信息的潜在价值,如上海市档案馆应用人工智能技术打造“跟着档案观上海”数字人文平台,为了解上海的历史发展提供档案数据支撑。[23]另一方面,人工智能中的用户画像、专家系统等技术,可以深度分析用户的利用需求和偏好,预测其可能感兴趣的档案类型,主动为其推送相关档案信息,如广州市妇女儿童医疗中心借助人工智能技术挖掘病历档案数据,实现儿科疾病的智能化诊断。[24]

2 人工智能技术在我国档案工作应用中存在的问题

通过系统梳理人工智能技术在我国档案工作中的应用现状,结合国内学者有关“人工智能+档案”的研究成果,我们发现我国档案工作全程智能化尚未实现。档案工作的全程智能化是指档案在进行收管用的过程中,形成的一整套智能化、整体化的档案工作模式。尽管我国档案工作智能化实践场景不断丰富,但目前人工智能技术与档案工作收管用的融合更多地表现在某一工作环节的智能化,档案工作全程智能化有待实现。

2.1 政策制定和实施不到位。尽管我国出台了《全球人工智能发展白皮书》《“十四五”全国档案事业发展规划》等有关人工智能技术应用的政策,但仍存在具体政策制定不到位和政策实施不到位的问题。一方面,有关档案工作全程智能化的政策制定不到位。《“十四五”全国档案事业发展规划》明确了大数据、人工智能等推动数字档案馆(室)建设优化升级的政策导向,但这只是国家在宏观层面的政策指引,有关档案工作全程智能化的应用规范等微观层面的规定并未提及,使得各地档案馆无从下手。另一方面,有关档案工作全程智能化的政策实施不到位。尽管人工智能技术在档案工作中的应用前景广阔,但政策制定和实施不到位是实现档案工作全程智能化的重要影响因素。

2.2 资金投入不足。首先,人工智能技术在档案收管用各环节的应用依赖大量软硬件设备的支持。其次,人工智能技术在档案工作全程智能化的应用需要引进相关的研发人员和技术专家,专业人员的引进同样需要花费大量资金。最后,随着人工智能技术的不断发展,原有的系统和算法需要不断优化和升级,人工智能技术在档案工作全程智能化应用中持续维护和更新的成本也需要大量资金的支持。但现阶段,各地档案部门对资金投入的需求和我国对于应用人工智能技术实现档案工作全程智能化的资金投入不足产生矛盾,这对于经费有限的档案部门来说,无疑是一大障碍。

2.3 档案数据标准不统一。真实、完整的档案数据是应用人工智能技术开展档案工作全程智能化的基础。目前,我国各地档案部门产生的档案数据所依据的技术标准、管理规范不尽相同,这使得档案数据在分类标准、存储格式、目录规范等方面存在较大差异,[25]导致档案数据质量参差不齐、档案数据标准不统一。我国档案资源基数大,不同载体形式的档案数量繁多,面对纷繁复杂、多源异质的档案资源,[26]档案数据标准不统一会严重影响档案数据收集的真实性、完整性、可用性和安全性,严重阻碍档案全生命周期管理模式的实施,不利于档案工作全程智能化的开展。

2.4 档案数据孤岛现象。2021年,新修订的《中华人民共和国档案法》明确提出“推进档案信息资源共享服务平台建设,推动档案数字资源跨区域、跨部门共享利用”的要求。[27]目前,我国部分地区档案数据接口不开放、档案数据共享机制不健全,使得档案数据资源呈现分散化、碎片化的现象,这导致不同档案部门和业务系统之间无法实现档案数据的高效流通和共享,进而形成档案数据孤岛现象。档案数据孤岛现象会形成档案数据资源浪费,影响档案数据的完整性、可用性和可靠性以及人工智能技术的有效应用。

2.5 档案人才问题。人工智能技术为我国档案事业的发展带来了新契机,但各地档案部门工作人员的综合素质和能力水平参差不齐,对应用人工智能技术实现档案工作全程智能化的认识不同,这在很大程度上制约了我国档案工作全程智能化的建设水平。一方面,人工智能等新技术的应用使档案工作模式发生许多变化,部分档案工作者尚未适应角色转变,对应用人工智能技术开展档案工作持有不同看法,这导致许多档案工作者仍坚持传统的档案工作原则和方法,极大地影响了人工智能技术推进档案工作全程智能化的发展进程。另一方面,自然语言处理、模式识别、专家系统等人工智能技术涉及计算机科学、数学、统计学等多方面的知识,这要求档案工作者必须具备持续学习和自我更新的能力,但许多档案工作者的教育背景、工作经验和专业技能参差不齐,对运用人工智能技术开展档案工作的理解也不同,这就影响了人工智能技术在档案工作全程智能化领域的应用效果。

3 人工智能技术应用于我国档案工作中的优化建议

3.1 加快出台并实施相关政策。档案工作全程智能化的实现离不开国家政策的支持。在政策制定层面,我国政府部门应重视人工智能技术在档案工作全程智能化发展中的应用,加强各地档案机构对档案工作全程智能化的理解,进一步细化政策指导,通过制定统一的标准支持技术创新和应用推广,以此推动档案工作的优化升级。在政策实施层面,档案部门应联合企业、相关科研机构加强技术研发,通过开展算法优化、模型设计及训练等适配工作,拓宽更多的应用场景并开展试点工作,积极落实人工智能技术在档案工作全程智能化应用中的政策。[28]不仅如此,在新一轮科技革命和产业变革的浪潮中,人工智能与大数据、物联网、云计算、区块链等新一代信息技术之间存在着紧密的联系。为实现档案工作全程智能化,必须配套使用云计算、大数据、区块链、虚拟现实等新技术,如:在档案智能收集方面,“人工智能+云计算”能够拓展档案资源的存储空间,实现存量档案的数字化;在档案智能管理方面,“人工智能+大数据”能够实现多源异质档案数据的统一划分,满足档案管理的智能分类、智能检索和智能安全防护等要求;在档案智能保存方面,“人工智能+区块链”能够提供可信、可靠的流程跟踪溯源,确保档案数据的不可篡改性和可追溯性;在档案智能利用方面,“人工智能+虚拟现实”能够满足用户的个性化档案利用需求,增强用户档案服务体验。人工智能技术与其他先进技术的集约化应用,可以有效破除人工智能在档案工作应用中的技术不成熟问题,进而推动政策落实,早日实现档案工作全程智能化。

3.2 加大资金投入。充足的资金是保障档案工作全程智能化顺利开展的前提。为解决资金投入不足问题,首先,我国政府部门应将人工智能技术在档案工作中的应用纳入经费预算,加强对人工智能技术应用于档案工作全程智能化领域的资金投入,同时,鼓励和支持相关企业、科研机构开展技术研发和应用,推动人工智能技术在档案工作全程智能化应用中的发展。其次,对于应用人工智能技术开展档案工作全程智能化试点的档案机构,政府部门应出台相关的措施,保证专项资金供给和投入,以此提高各档案机构应用人工智能技术实现档案工作全程智能化的主动性和积极性。最后,各机关、团体、企业事业单位要做好本单位档案工作的经费预算,加大对应用人工智能技术实现档案工作全程智能化的经费投入,同时,各地档案机构可以与高校、企业、科研机构等进行合作,共享资源和技术,降低研发成本。

3.3 统一档案数据标准。档案数据贯穿人工智能技术应用于档案收管用工作的全过程。为消除各档案部门对档案数据定义的理解差异,解决档案数据孤岛问题,需要制定统一的档案数据标准。根据统一领导、分级管理的原则,国家档案局应在宏观层面建立统一的档案数据标准体系,各地档案机构再按照宏观层面的指引,制定相应的业务规范与行业标准。在档案收集层面,通过应用人工智能技术,统一文本档案、图像档案、音频档案、视频档案在内容识别、数据录入、数据分类、元数据描述等方面的档案数据收集规范,保障档案数据与实体档案内容的一致性。在档案管理层面,统一档案数据的数据格式、数据编码、数据存储结构、数据归档范围与数据集成规则等标准,[29]保障档案数据的真实性、完整性、可用性、安全性。在档案利用层面,统一开放档案数据的范围和时间,保证档案数据的安全性和可用性。通过统一档案数据标准,有利于档案数据在档案收管用各环节的流动,促进人工智能技术在档案工作全程智能化中的应用。

3.4 打破数据孤岛现象。为打破不同区域、不同部门间出现的“档案数据孤岛”现象,首先,建立统一的档案数据共建共享平台。一方面,依托全国档案查询利用服务平台建立全国范围内的档案数据共享机制,推动国家、地区档案数据共享平台一体化发展;另一方面,加强各地区档案机构档案数据共建共享平台建设,通过建立档案全文数据库和档案目录数据库,实现档案数据跨层级、跨部门共享利用,保障档案数据互联互通,消除档案数据孤岛障碍。其次,加强档案数据的安全保护和管理。通过建立完善的档案数据备份和恢复机制,采用先进的加密技术和访问控制策略,确保档案数据的完整性、保密性和可用性,防止档案数据泄露和滥用。[30]最后,利用人工智能技术,加强对档案数据共建共享平台的维护和升级,满足档案工作全程智能化的档案数据要求。

3.5 加强档案人才队伍建设。目前,人工智能技术尚未成熟,当前及未来一个时期内的档案工作全程智能化还需要人的参与。[31]首先,档案机构要及时调整档案工作者的角色定位,加大对档案工作人员的培训力度。随着人工智能技术的应用,档案工作者逐渐由传统的档案管理者转变为技术应用者和创新者,他们需要具备数据分析和解读等相关技能,能够利用人工智能技术对档案数据进行智能化处理和管理。为适应角色转变,档案机构可以通过组织内部培训、邀请专家开展讲座等方式加强对档案工作人员的意识转变和技能培训,不断更新其技术知识和实践操作能力。其次,档案机构可以与互联网企业、高校、科研机构等开展跨界协同合作,[32]积极组建智能化档案工作研发团队,结合人工智能与其他技术的特点和档案工作的方法与规律进行深入探究,不断提升档案工作人员的科研能力和创新能力。最后,学校要优化档案学专业人才培养方案。在档案学的课程设置中,高校要找到人工智能技术与档案工作结合的切入点,增设与人工智能技术相关的专业课程,以此为档案机构培养出适应新时代发展的复合型高素质档案专业人才。

猜你喜欢
操作能力档案工作创新意识
高中生物教学对学生能力的培养探微
探究式教学法在初中物理教学中的运用
浅谈实现档案工作规范化管理的路径
探析全程管理视角下如何贯彻落实“344”制度
艺术档案工作重要性研究
试析机关档案管理工作的创新
高中体育教学中创新意识的培养
浅析农村小学数学教学中如何培养学生创新意识
素质教育背景下音乐欣赏教学的实践与思考
当代大学生创新意识培养的研究