陈雅茜,李亚琼
(1.武汉理工大学 档案馆,湖北 武汉 430070;2.南开大学 保密办公室,天津 300071)
经过60多年的演进,人工智能(artificial intelligence,AI)的发展已经进入全新阶段,其提出者麦卡锡认为它是“研制智能机器的一门科学与技术”。简言之,人工智能是研究、开发用于模拟和扩展人类智能的理论、方法、技术,以及应用系统的一门技术科学[1]。
为梳理档案学领域人工智能的研究情况,笔者在CNKI中以篇名“人工智能”进行期刊检索,时间设定为2011-2020年,得到相关国内外论文43 339篇,中文27 284篇;以篇名“人工智能档案”进行期刊检索,时间设定为2011-2020年,得到相关国内外论文113篇,中文68篇。在CALIS外文期刊网中,以篇名包含“artificial intelligence”进行检索,时间设定为2011—2020年,得到相关外文论文64 897篇;以篇名包含“artificial intelligence”与“archives”进行检索,时间设定为2011—2020年,得到相关外文论文21篇。
国内外学者对人工智能研究颇多,国内相关领域研究起步于2015年,直至2018年对人工智能领域的学术研究成果数目超过国外,而国内档案学界自2018年才开始热衷研究人工智能,相关关注度明显提升,但人工智能在国内外档案学领域的研究与运用大幅落后,我国高校档案管理及其相关收集、整理工作方面仍存在较大研究空间。
2017年我国将人工智能上升到国家战略层面,2018年中国档案学会年会关于人工智能的大会主旨发言引发档案学界广泛关注[2]。2020年以来,新冠疫情全球肆虐,世界卫生组织将这种流行病描述为百年一遇的公共卫生危机,其影响将持续数十年。在这后疫情时代,高校严格控制人员进出,积极倡导保持社交距离,线上办公学习模式常态化,依靠人力为主的传统档案收集整理工作,受到一定影响。而人工智能作为驱动科技革命、产业变革和人力优化的重要力量,高校档案馆工作人员如何在后疫情时代运用AI技术完成档案收集整理工作值得思考。
目前,高校档案收集整理工作主要流程为:①由档案馆工作人员发布归档通知,相关归档部门收集资料,该通知一般由档案馆根据已制定的工作手册,通知各归档部门需归档内容及整理要求等;②归档部门在档案馆工作人员指导下利用档案管理系统,大致按照分类、组件、排列、编号、编目、装订等步骤整理资料,在此过程中,档案馆工作人员通过QQ、微信、电话等方式解答各部门咨询;③以上工作完成无误后,归档部门到馆移交档案,在档案馆工作人员指导协同下,完成档案装盒等相关工作;④档案馆工作人员按照移交目录一一核查、鉴定档案,确认无误后,搬运档案入库、上架,如图1所示。
图1 传统档案收集整理工作流程
虽然档案收集整理工作早已运用计算机系统处理档案数据,但除少数OA办公系统中流转的电子文件外,大多数高校档案馆仍然停留在档案接收完成后,将常用档案外包数字化的阶段。传统收集整理工作模式在后疫情时代存在诸多局限性,档案收集整理与服务利用无法及时自发联动,人工劳动强度较大,人工干预较多,人为出错率较高,借助AI技术的发展,传统的档案收集整理工作流程必将迎来新的机遇。
为适应计算机技术的不断发展,2015年国家档案局出台的修订版《归档文件整理规则》(DA/T22—2015),高校档案收集整理工作发生了变革,按“件”收集整理档案成为大势[3]。2019年突发新冠疫情,武汉“封城”,大量核酸检查,严格管控。2020年上半年,武汉“重启”,国内疫情好转,但2020年下半年,国外各大经济主体疫情严重,反扑国内。我国通过隔离等防疫措施有效控制疫情后,将继续保持防疫管控,日常保持社交距离限制聚集人数,灵活转换线上、线下办公学习相结合的状态,且该状态会持续很长一段时间。
在后疫情时代,这一系列的变化,使得高校档案人必将面对线上模式与传统模式的主要矛盾。疫情发生以前,高校档案馆定期各类收集、整理、利用、培训等活动以线下纸质档案为主,电子文件为辅助,实行双套制档案管理。而在后疫情时代,封控积压的工作,工作模式转变成以线上为主的模式,电子文件应占据主导位置,信息化工作难度加大,高校档案部门可利用AI技术处理档案管理工作,提高工作效率,解决疫情积压档案工作,智能引导归档单位完成工作。
近年来,计算机技术高速发展,AI算法不断升级,大数据技术、数据挖掘技术、图像识别、机器人与知识图谱等得到了广泛的应用。过去的计算机技术是将有规则的行为通过计算机代替人工,而AI技术则是将自动推理实现变成了可能,其重要技术集中在大数据、云计算、生物识别技术、计算机视觉、深度学习、自然语言理解、机器人、知识图谱、语音处理技术、智能标签等方面。为解决后疫情时代高校档案收集整理工作所面临的问题,可运用以下AI技术,如表1所示:
表1 人工智能技术与档案收集整理工作的应用
(1)大数据、云计算。大数据、云计算是人工智能的基础,智能系统可采集并处理档案收集整理与后期利用服务的全部数据,基于这些海量数据和云计算的强大数据处理能力,建立更精确的算法模型,更准确地自动收集相关归档部门的电子数据(包括声像档案等),形成电子档案及其元数据,自动编目,将实物档案目录目标推送到需归档部门的责任人[4]。
(2)生物识别技术与计算机视觉。目前,AI技术中的生物识别技术与计算机视觉,可以实现刷脸、指纹或声纹登入智能管理系统,避免了用户名与密码的记忆问题;同时,系统认证后可调用系统中预设的个人及部门签章图像嵌入,加盖个人数字签名等。这些应用可有效解决工作人员密码遗忘问题,简化安全登录,并且增强系统安全性,提升档案追溯性,责任到人,为个人绩效管理提供更有效、更直观的数据,激励归档部门和档案馆工作人员,提供高校人力资源管理决策的量化依据。
(3)深度学习。深度学习与自然语音处理相结合可通过建立深层神经网络,模拟人脑的机制进行解释并分析学习图像、语音、文本及自然语言等数据[5]。高校档案收集整理工作可借助该技术,从全校、互联网数据中,抽取并组织信息形成标准化或自定义的电子档案和元数据,自动编辑并核对档案目录,更准确命名档案,获取数据摘要,提供更有效的检索方式与入口,为用户提供更易获取、更有价值的信息服务。
(4)机器人。后疫情时代,人力管控加强,人工减少,造成一定程度的工作延时,疫情期间档案积存,需上架、移库等。机器人技术的利用可以解决档案人员体力有限[6]、人力不足的问题,及时将档案上架,完成库房移库整理,更安全、便捷地存储档案,管理库房。
(5)智能标签。智能标签包括射频识别技术RFID(radio frequency identification)标签、近场通讯技术NFC(near field communication)标签及二维码等技术。档案收集整理可运用智能标签在手机等移动设备上接入档案管理系统,借助标签本身的存储功能,使每件实物档案具有独一无二的识别特征,让档案上架、存储更有序安全,定位利用时更准确快捷[7]。
(6)知识图谱。知识图谱是一种揭示实体间关系的语义网络,可对事物及其相互关系进行形式化地描述。已应用于智能搜索、深度问答、社交网络等领域[8]。高校档案收集整理方面可利用知识图谱生成更个性化的检索工具,帮助管理系统更具易用性、交互性,使档案馆存储的资源更有整合性与关联性,便于利用服务工作开展与深挖,反馈指导档案收集整理工作,突出价值高、利用率高的档案。
(7)语音处理技术。智能语音处理包括语音识别与语音合成,与生物识别技术、自然语言处理技术相交融[9]。该技术的运用为高校档案收集整理口述档案、会议纪要、声像档案等数据提供了更安全高效的采集方式;同时该技术可在电子档案中添加语音备注,基于语音的可识别性,不仅提升了个人数字签名的安全性,且更直观有效,省时省力。
合理运用AI技术,高校档案收集整理的整个工作流程将得到优化,高校档案人员资源优化,并能够有机融合到智慧档案馆、智慧校园及智慧城市的发展中。
随着AI技术的发展,智慧校园在智慧城市的背景下产生,两者发展催生了智慧档案馆[10]。智能档案收集整理与利用服务两个工作阶段形成档案资源内循环,嵌入智慧校园系统之中,成为其重要组成部分,融入智慧城市的发展中去。后疫情时代,国家、高校加大投入智慧城市与智慧校园相关项目发展,高校档案馆需顺应其势,在社会各项事业信息化高度发展的智慧时代[11],融合贯通、高效协同,智能化、开放化地建设智慧档案馆。
运用AI技术的档案收集整理工作作为基础环节之一,必将与智慧档案馆及智慧校园、智慧城市相糅合,形成一个有机大循环,在后疫情时代为纸质社会各界提供全面便捷的服务。智慧城市、智慧校园、智慧档案馆的发展将会为档案收集整理工作提供三大方面支持:
(1)经费支持。高校档案收集整理工作运用人工智能技术需要大量的经费支持,应用系统的开发应用、硬件设备的购置维护、跨平台数据资源的导入使用等都需要资金的支持。高校档案馆的非盈利性和服务性,使得其在高校发展中处于边缘化的地位,受高校领导关注程度的影响颇深。档案收集整理工作作为档案馆后台基础,其效益和价值极难被具象化呈现,故而在申请经费建设项目时,高校一般会优先考虑其他部门,忽视档案部门。档案馆作为高校储存、保管学校信息的重要部门,智慧校园建设将把档案馆纳入建设之中,档案收集整理部门应抓住这个机遇,提出合理有效的建设方案,将其纳入智慧档案馆、智慧校园建设的统一规划中[12]。而高校作为教育中心,在城市发展中,同样作为非盈利性的文化产业,智慧校园及智慧档案馆本质上是为智慧城市发展提供文化中心、认证服务和知识中心的基础环节[13]。智慧校园及智慧档案馆的开发经费都需要依托于智慧城市项目发展,也必须与智慧城市相融合,从而解决AI技术发展经费问题。
(2)技术支持。以数字档案馆为核心的档案信息化建设已发展十余年之久,数字档案馆从以档案数字化为标志的1.0版发展到以电子档案管理和资源共享为标志的2.0版,其技术基础是数字化技术[14]。而智慧城市、智慧校园及智慧档案馆所依托的技术正是智能档案收集整理工作所必备的。AI技术在高校档案收集整理领域的应用,需要熟练掌握AI技术的高素质专业性人才参与智能档案收集整理工作系统的前期开发和研究及后期升级和管理。高校档案馆甚至高校一般很少能长期配有专业AI信息技术人员,档案信息化建设大多要依托于高校对外招标,引进专业技术开发团队,针对各高校具体定制管理系统。因此,档案收集整理工作智能化升级可以依托智慧档案馆、智慧校园建设的专业技术团队在各系统、平台、云端等多方面获得跨平台技术支持,给智慧档案馆的建设奠定坚实的技术基础,实现人工智能化档案收集整理工作。
(3)统筹支持。现阶段高校信息系统建设缺乏服务于城市与高校发展的整体规划,现行高校信息化系统多是将各部门随需而建的应用系统进行延时数据对接汇总,而后提供数据利用。一个综合性高校可能同时运行十几个子系统,每个系统的数据库相互独立,数据异构、关联性差,需要在特定时间在各个系统间进行数据的批量导入、导出。各单位系统管理员专业素养也参差不齐,在未来AI应用系统的升级维护和安全管理上存在诸多隐患。后疫情时代,应由智慧城市项目发展出发,利用AI技术搭建高校各子系统与外部智慧城市系统之间互动桥梁,数据的格式、信息条目的需求、数据端口的对接等应统筹规划,统一标准。由政府牵头,以智慧城市发展为契机,整合社会各界资源,并即时反馈,让智慧校园、智慧档案馆获取社会各界用户的需求数据,优化智能档案收集整理系统,靶向收集整理档案资源,按需分优先级地构建高校资源库,确保高校电子资源的充分利用,为高校发展和城市建设出力。同时,应用系统之间存在数据的重复采集,耗费很多人力、物力和财力。在智慧校园的建设下,可以合理规划统筹各部门的应用系统,减少不必要的浪费,从而提高工作的质量和效率。
综上,AI技术的运用与推广必须由上而下整体设计运行,收集全部数据,获得最佳算法,形成真正智能的系统来管理数据,实现跨系统协同[15]。在政府全面推行AI技术的后疫情时代,只有大融合的档案收集整理系统才能实现其智能性,提高人力工作效率,为政府决策者提供知识服务,为社会各界用户出具高校有效证明,为高校学生提供各类资源服务,并确保高校档案安全。
基于人工智能技术,档案馆可利用生物识别技术和计算机视觉技术,自动识别每一位用户,认证个人数字通行权限,每一位系统认证的用户在智慧校园、智慧城市的平台上成为数据主体,不同数据主体生成多维数据,人工智能算法建立智能合约代码,整合各个数据主体的数据资源以实现完整的数据拼图并优化资源[16],升级成为智能化档案工作模式如图2所示,其主要工作流程将进阶为以下内容:
图2 智能档案收集整理工作流程图
(1)档案智能收集整理,利用大数据收集、深度学习达到智能采集及目标推送,智能整理和识别各类档案,完成接收与智能入库工作:①智能采集与目标推送,在确保数据安全及保障用户数据隐私的前提下,智能档案收集整理系统通过大数据、云计算等技术,采集和处理各个数据主体的全部去敏性数据,建立适用于高校档案馆的算法模型,更准确地自动收集相关归档部门的电子数据,并运用深度学习推送给对应归档负责人员提醒归档;②智能整理与智能识别,利用生物识别、计算机视觉及语音处理等技术自动识别智能分析整理,核对档案目录,自动命名档案,获取数据摘要,提供有效地检索方式与入口,完成电子文件编目工作。如声像类档案,会自动标记出声像档案中相关人物、时间、事件等要素,编辑有效目录及检索词,数字化声像档案,并根据利用率、保密级别、期限安全保存于云端;③馆内接收与智能入库,各类档案在电子签章得到智慧校园及智慧城市乃至全国认证后,仅少量纸质档案、实体档案需到馆移交,馆内智能机器可在为用户提供利用服务时,直接利用电子档案生成纸质档案,减少纸质文件的收集、整理、上架入库量,避免纸质资源和库房空间的浪费。
(2)智能优化整合发展:档案系统可根据利用服务的数据,对归档工作人员和档案馆接收人员的工作情况进行反馈,形成档案馆工作人员更明确的指导靶向,用以改进指导后续工作。档案馆接收人员还可利用服务数据对库存各类档案进行优先级分类,制定完善并收集整理档案内容,减轻工作人员无意义的体力劳动和低效工作,各部门直接联动,校内外跨平台协作,提升归档单位对档案馆满意度。
PETER[17]的研究认为,到2030年80%的项目管理任务,如数据收集、报告和预测分析等,将由人工智能以持续高效的方式完成。未来AI技术的发展必然会减少对普通劳动人力的需求,档案工作者必须不断提升自身的信息技术素养,改善自身的知识结构,以适应后疫情时代下大量运用AI技术的线上办公办学模式。
(1)开展线上学习培训。后疫情时代,智慧城市项目深化将惠及智慧校园、智慧档案馆发展。疫情期间高速发展的线上教学系统及模式,可在线为校内、外档案管理工作人员开设与AI技术、信息管理相关的课程。对外实行线上常规办学,对内利用AI技术即时监督相关人员系统学习,并与智慧校园结合,实行学分制与绩效考核制度,全校推送考核成绩排名,督促工作人员熟练运用智慧校园、智慧档案馆相关系统[18]。
(2)树立现代管理理念。AI技术推行初期,高校档案工作人员应树立现代化的管理理念,注重培养与提升档案管理人员运用AI技术的理念,强化后疫情时代的新思维,以确保档案人更倾向于运用AI技术解决实际工作问题,避免投入大量资金和各类软硬件设备后,工作人员因传统工作理念和惯性思维模式,消极应对创新技术的应用,使得新技术沦为备选。应积极利用AI技术收集数据,不断深化学习,建立更精确的算法,最终促进档案管理效率的有效提升。
(3)融合共享平台资源。智能档案收集整理工作模式必然深植于智慧校园,甚至成为智慧城市的一环。跨平台融合,政府及高校层面的统一筹划更有利于高校档案馆的人才引进与资源利用,使得高素质的互联网技术人才可通过跨平台、线上或云共享的方式参与高校档案工作,通过AI算法分析用户的信息素养与工作强度,遵从能岗匹配原则,选择最优人选完成档案工作,降低成本,解决AI技术在高校档案馆推行的人力资源缺乏的问题,推动档案管理工作的创新与发展[19]。
(1)后疫情时代,随着政府大力推动智慧城市项目建设,人工智能将在各个领域快速发展,档案馆数字化转型是必然,档案收集整理工作势必迎来更多的机遇与挑战。智慧高校及智慧档案馆的建立将推动档案收集整理工作的智能化,即时与档案资源利用服务联动,与社会公共平台互联,利用AI个人数字认证等技术,优化用户资源和安全管理,在确保用户信息安全及隐私安全的条件下,实现档案资源的高效检索及利用。
(2)众多现实因素会制约AI技术在档案收集整理领域的全面应用,而通过档案理念调整、信息素养提升等措施能够优化人工智能在档案收集整理工作中的应用,以期高校档案馆能更好挖掘自身价值,高校能更合理配置人力、数据资源等。
(3)档案馆学界乃至社会各界都需要注意的是技术变革存在风险,初期往往带来减速发展和低适配感,同时人工智能引发的隐形剥削及隐私安全等问题都需谨慎对待[20],档案馆工作人员需以长远发展的眼光看待AI技术在档案收集整理工作中运用的问题。