文/上海财经大学档案馆(校史馆、博物馆) 李倩
高校是人才培养和学术研究的重要场所,其所产生的大量文献和资料有着巨大的历史和文化价值。为了更好地保护和利用这些珍贵的文献和资料,高校数字档案馆建设已经成为一项重要的任务。数字档案馆的建设,不仅可以保护珍贵文献和资料,还可以为后人提供文献查询和学术研究的便利。本文将分析人工智能对高校数字化档案建设的影响与挑战,并提出一些解决方案。
人工智能是一种模拟人类智能的技术,包括机器学习、自然语言处理、计算机视觉等多个领域。近年来,随着计算机科学技术水平的不断提高和算法的不断优化,人工智能技术已经在各个领域得到广泛应用。
(一)机器学习。是人工智能技术的一个重要分支,其主要目的是通过算法让计算机自动学习并改进自己的性能。机器学习可以应用于语音识别、图像识别、自然语言处理等多个领域,如谷歌的AlphaGo就是一种基于机器学习的人工智能棋手。
(二)自然语言处理。指计算机能够理解和处理自然语言的技术。其应用范围广泛,包括机器翻译、情感分析、文本分类等多个领域。如微软的小冰就是一种基于自然语言处理技术的聊天机器人。
(三)计算机视觉。指让计算机理解和处理图像和视频的技术。其应用范围广泛,包括人脸识别、图像搜索、自动驾驶等多个领域。如谷歌的图像搜索就是一种基于计算机视觉技术的搜索引擎。
(一)人工智能赋能数字档案信息化建设。人工智能技术可以有效提升数字档案信息化建设的效率,可以自动检测档案信息,快速准确地进行归类和分析,大大降低人力成本,提高工作效率。人工智能技术能够改善数字档案信息化建设的质量,有效解决档案信息的检索、归类等问题,更好地为用户提供服务。此外,人工智能技术还能改变数字档案信息化建设的结构,可以实现档案信息的自动化处理,大大改变传统档案信息处理模式,实现更加高效的管理。
(二)借助人工智能技术建设智能化数字档案馆。在人工智能背景下,数字档案馆可以利用AI技术进行更加智能化和高效的数字化处理、管理和利用,建立云端数字档案系统,人工智能技术可以帮助高校数字档案馆实现数字化目标。如通过OCR技术将纸质文献和资料数字化,从而使其能更加方便地存储、检索和利用。数字化后的档案数据可以存储在网络云端或者专门的数字化存储设备中。将历史档案数据进行数字化,并存放在学校统一建设的云存储上,使档案馆的老师能够随时随地访问和检索,不仅提高了工作效率,盘活了历史档案的价值,还能够保障历史档案数据的存储安全。
此外,基于AI的自动化处理引擎,通过机器学习算法自动识别文献和资料的类型和属性,对数字档案进行统一的数据标准化处理,包括统一的命名规则、元数据标准、数据格式标准等,能够减轻人工处理的负担,提高工作效率,方便管理和利用。
建立档案数据关联分析平台,通过智能分析和模式识别,分析不同历史档案的关联信息,挖掘出档案内部的潜在联系,从而实现关联查询和模糊查询功能,可以为档案利用业务提供更加精准的档案查询服务。构建档案智能审核系统,借助机器学习技术,自动识别档案中的信息,并基于识别结果进行分类存档以及检测档案中的错误等,能有效提高审核效率。构建智能档案管理系统,建立大数据智能管理系统,能够有效管理档案的归档、检索、统计等工作,提高档案管理效率。
(一)数字档案馆建设内容。上海财经大学档案馆以建设“数字化智慧档案馆”为核心,实现了档案管理过程的科学化、规范化、自动化,提供了跨部门、跨单位、跨职能、跨组织的档案智慧管理服务。数字化智慧档案馆建设内容主要包括档案数字化收集系统、档案自动归档系统、档案综合管理系统、数字档案云存储系统、档案利用综合服务系统、档案存储与保护系统以及电子签章密码认证系统对数字档案的鉴定等。
档案数字化收集系统,对接上财管理信息系统2.0平台,自动收集来自办公自动化系统的公文、内请、督办等电子文档,教学管理系统、研究生管理系统的学生信息表、成绩单、录取名册等学生档案,人事管理系统的干部人事档案数据,科研项目管理系统中的科研及教学成果,评教系统中的教师评价表,教师培训管理系统中的教师培训及发展电子档案等,实现了电子档案自动收集的应用场景和目标。
档案自动归档系统的数据来源于电子档案自动收集的所有数据,自动归档系统根据自定义规则,把不同门类的数字化档案自动分类、编排后,统一建立索引并归档保存,以方便后续的档案利用和档案管理。
档案综合管理系统主要实现档案登记、档案编目、档案分类、档案存放、档案查询、档案审核以及档案的安全管理等功能,实现档案的审批、审核,提高档案的安全管理效率。
数字档案云存储系统实现档案存放管理、档案检索管理的功能。另外,暴露开放的API给档案综合管理系统远程调用,包含档案的检索、查询等功能。
档案利用综合服务系统实现了用户查档信息登记、馆员查档调阅、复印打印、邮件快递等信息化管理,实现了档案利用一站式服务。其通过系统实现数字档案的共享,方便各部门或组织之间的档案调用,提高档案管理效率。
档案存储与保护系统主要实现数字档案的备份、数据的恢复、历史数据的存档等功能,可有效保证档案的安全,防止档案的意外丢失或损坏。
电子签章是一种新型的档案管理工具,借助电子签章技术建设数字档案鉴定系统,对查档用户进行身份验证,并准确记录每次档案使用的时间、内容以及使用者的身份等信息,以便于馆员更好地监督档案的使用情况。其中,实现档案的分级存储,根据档案的重要性给予不同的权限,以确保档案的安全。对于日常烦琐的数字档案鉴别真伪这项常规工作提供了新的技术手段,用户只需要自主到系统里去鉴定,无须馆员的人工接入,大大减少了工作量,也受到查档用户的一致好评。
(二)数字档案馆建设的经验总结。为了顺应数字化转型的发展趋势,高校档案馆自2019年启动并稳步推进数字档案馆的建设,努力建设一套功能完善、管理有序、便捷高效的管理体系,规范学校数字档案的收集、归档、管理、利用、存储、备份等整套流程,实现了数字档案收集的自动化、智能化,声像档案管理的信息化、规范化,档案利用的自助化、流程化。其中电子签章技术应用于档案鉴定的创新工作思路,简化了人工鉴定时代烦琐复杂的工作流程。另外,档案管理系统可自动收集和统计并生成可视化报表和馆领导“驾驶舱仪表盘”,方便馆领导从全局科学地掌控档案工作的全貌,科学辅助领导层做决策。
目前,一期的项目已经完成阶段性工作,确定了数字档案馆的功能定位,把握好了数字档案馆的功能结构,制定了符合学校实际的功能定位;建立了学校数字档案馆的数据架构,建立了完善的数据管理机制,制定了相应的数据管理规范,并以此为标准加强数据管理,推动了学校数字档案馆的信息共享,达到了项目的验收标准,为数字档案馆未来的建设夯实了基础,也为上海市数字化转型标杆学校的顺利验收做出了一定的贡献。今后,我馆将继续推进数字档案馆二期的建设进程,认真总结,及时改进工作,并加强同兄弟院校的交流互访,使得数字档案能够更好地支撑学校的中心工作,让数字档案赋能人才培养和学科建设。
(三)数字档案馆的建设路径。具体如下:
1.制定数字化建设规划。高校档案馆应先制定数字化建设规划,明确数字化目标、范围、标准和要求,确定数字化资源建设和数字化服务的方向和目标。评估高校档案馆的数字化资源现状和需求,确定数字化的文物资源、目标受众、数字服务范围、数字化存储需求等,为后续数字化工作提供指导。高校档案馆还需确定数字化建设方案,包括数字化流程、数字资源管理系统、数字化存储设备、数字化服务等,确保数字化工作的高效性、规范性和可持续性。对需要进行数字化建设的工作,包括文物数字化、元数据制作、数字化存储、数字化管理系统开发等,应建设数字档案馆数字资源库和数字服务平台。
2.数字资源管理。高校档案馆需要对数字资源进行分类、编目、检索、保存、备份、维护等管理工作,确保数字资源的长期保存和服务能力;需要为用户提供数字化服务,包括数字资源的在线展示、查询、下载等服务,以满足不同用户的需求。数字档案存储一般包括本地存储和云存储。本地存储指在本地计算机或服务器中存储,云存储指将数字档案存储在云端,使用云存储可以提高数据的可靠性和可访问性。为了保障数字档案的安全性和完整性,需要定期进行数据备份。备份可以采用本地备份和云备份的方式,以保证数据在出现故障或者损坏时能够得到恢复。
3.监测评估。高校档案馆需要对数字档案馆的数字资源、数字服务等方面进行监测和评估,包括数字资源使用情况、用户满意度、数字资源保存状况等,为数字档案馆的后续发展提供参考依据。还要充分考虑数字化资源的特殊性,科学规划,全面布局,有序推进,创新服务,确保数字化工作的高效性、规范性和可持续性。
(四)人工智能对高校数字档案馆建设的挑战。一是隐私泄露。在数字化和自动化的过程中,高校数字档案馆可能会涉及用户的隐私信息,如个人身份信息、社会保障号码、成绩单等。因此,高校数字档案馆需要采取有效的安全措施来防止隐私泄露,如采用加密技术保护用户隐私信息,建立完善的安全管理机制等。其中使用AI技术进行数据处理和挖掘时需要保障数据的隐私和安全。二是数据质量。高校档案涵盖了丰富的历史文化和知识资料,这些资料需要高质量的数字化转换以及有效的数据标准化分类。数字化和自动化需要大量的数据支持。因此,高校数字档案馆需要建立完善的数据管理机制来保证数据的质量。如需要对数据进行分类、整合、清洗等处理,确保数据的准确性和完整性。三是高效存储和检索。AI技术可以通过语义分析和自然语言处理等技术,实现高效的档案存储和检索,方便学者和研究者快速获取所需信息,还可通过自然语言理解和智能问答等技术,为学者和研究者提供智能化的问答服务,解答他们的疑问和需求。四是技术壁垒。人工智能技术需要专业的人才和先进的设备来支持。因此,高校数字档案馆要投入大量的人力、物力和财力来建设和维护。此外,人工智能技术的快速发展也要求高校数字档案馆不断跟进和更新技术,以适应新的需求和挑战。
高校数字档案馆是高校信息化建设的重要组成部分,具有重要的文化、历史和教育价值。人工智能技术作为一种新兴技术,为高校数字档案馆的建设和发展提供了新的机遇和挑战。
在数字化、自动化和智能化的过程中,高校数字档案馆需要注意隐私保护、数据质量和技术壁垒等问题。因此,高校数字档案馆要不断跟进和更新技术,积极探索人工智能技术在数字档案馆建设和服务中的应用,更好地服务于高校的教育和研究工作。
此外,高校数字档案馆也需要加强与其他高校之间的协作和共享,建立数字档案馆联盟或者平台,共同促进数字档案馆的建设和发展。同时,数字档案馆也需要与相关部门、机构和企业进行合作,共同推进数字档案馆的普及和应用。
高校数字档案馆的建设和发展离不开人工智能技术的支持和应用。在数字化、自动化和智能化的过程中,数字档案馆需要注意隐私保护、数据质量和技术壁垒等问题。未来,数字档案馆还需要与时俱进,积极探索人工智能技术在数字档案馆建设和服务中的应用,更好地服务于高校的教育和研究工作。