摘要:随着大数据和人工智能技术的飞速发展,高校数字档案馆的建设面临前所未有的机遇。本文深入探讨了大数据和人工智能时代高校数字档案馆的建设思路,分析了当前高校档案馆数字化建设的特点和现状,提出了针对性的建设策略,如多渠道拓展数字资源、应用人工智能技术挖掘大数据、建立数字档案管理系统,加强智能化、个性化服务、构筑信息安全防护体系等,以有效提升高校数字档案馆的服务水平,为高校的教学、管理、科研提供有力支持,为发展新质生产力、服务经济社会发展发挥应有的作用。
关键词:大数据和人工智能时代;高校;数字档案馆;策略
高校作为知识和信息的信源地、集散地,其档案馆承载着记录学校历史、教学、科研等重要信息的使命,如何构建一个适应大数据时代需求、融合人工智能技术的高校数字档案馆,已经成为各高校信息化建设的重要方面。
一、大数据和人工智能时代高校档案馆建设面临的机遇
在大数据和AI迅猛发展的背景下,高校档案馆数字化建设和发展面临一些新的机遇。一是高校档案数字化建设是落实 “十四五”规划、实现档案资源数字转型的必然要求。中办、国办印发的 《“十四五”全国档案事业发展规划》明确提出加快档案资源数字转型,加强国家档案数字资源规划管理,逐步建立以档案数字资源为主导的档案资源体系。[1]二是大数据和人工智能技术的发展为高校档案馆建设提供了更广阔的空间。大数据和人工智能技术的应用可以推动高校档案建设的数字化转型,传统的档案管理方式、方法已经不能适应信息化建设要求,而通过大数据技术,可以将纸质档案转化为电子档案,实现档案信息的数字化管理,这不仅可以节省存储空间、提高管理效率,还方便用户进行远程访问。三是高校档案馆数字化建设是人工智能发展的内在要求,承担着为 “数字档案馆”向 “智慧档案馆”转变提供 “海量”数据的任务。大数据技术可以帮助高校档案馆实现数据资源的整合和共享,高校各部门在日常工作中会产生大量的数据资源,这些数据资源对于档案建设具有重要价值,通过大数据技术,可以将这些分散的数据资源进行整合,实现数据的互通互联,这些 “海量”的数字资源为人工智能技术应用于档案数字化建设打下了坚实的基础。
二、高校档案馆特点和当前数字化建设现状
(一)高校档案馆特点是馆藏档案资源数量大、种类多但价值密度偏低
高校档案馆大多馆藏了建校以来大量的原始实体档案。以笔者所在的临沂大学为例,该校库藏党群、行政、教学、科研、外事、财会等十大类档案共计5.7万余卷 (册),档案数据信息达到了3.9TB,随着纸质档案数字化加工和档案馆信息化建设进程,档案数据容量正呈指数级增长。随着信息技术的快速发展,高校档案馆不再局限于传统的纸质实体档案,而是纳入了多元数据,不仅包括电子文件、声像、图表等,还涵盖社交媒体数据、系统流程数据等各种形式的信息。这些数据的格式多样且来源于不同的部门、机构,每个部门都有其独特的数据生成方式,不同的数据格式也带来了存储方式的多样化。此外,高校档案馆的馆藏数量大、数据种类多,意味着数据价值密度的降低,因为反映同一对象的档案可能分散在不同的数据类型中,需要通过对各种数据进行提取、分析,才能发现其潜在的价值。高校档案馆保存了大量反映高校历史、教学、科研等方面的珍贵档案,具有很高的保存价值,对于学校的决策、规划、育人等方面具有重要的应用价值。以临沂大学为例,该校始于抗战时期的抗大一分校,学校馆藏了大量抗战时期师生抗日斗争的珍贵史料,这些史料对于学校开展爱国主义教育、坚守共产党人的初心使命具有很高的研究、宣传价值。然而,正是因为高校档案中涉及的信息种类多,这些档案可能存在相互关联或重复的情况,因此,高校档案馆需要采用有效的技术手段,提高档案数据的价值密度。[2]
(二)高校档案馆数字化建设现状
一是材料归档方式单一,数据资源收集主动性不强。当前,大多高校仅依靠人工进行数据信息搜集,不仅难以保障信息的准确性、完整性,还大大增加了管理工作的难度。许多高校数字档案管理缺少与时俱进的制度设计,其原有的管理制度已跟不上数字化发展的需要。[3]尤其缺少各类专门数字档案管理制度,导致数据档案的归档不全面、不完整、随机性比较强。没有实现电子文件 “应归尽归”和电子档案 “应收尽收”。二是部分高校档案管理系统老化,基础设备落后、服务效率较低。目前,各高校都在大力推进档案数字化建设,档案数字化资源占比逐渐提高,但由于一些高校档案管理部门投入有限,未配备信息化管理平台或管理平台落后,缺少对档案信息统计、信息数据分析、数据管理等功能的升级和大数据技术的使用,不能完全适应当前档案管理数字化的发展需要,无法提供简洁、高效的智能化服务。三是档案管理和服务观念还较为传统和保守。目前,各高校档案还是以纸质档案为主,随着高校档案数字化建设的发展,档案管理人员转变传统档案管理和服务观念势在必行,将 “重藏轻用”的观念向 “藏用并重”转变,提升档案管理人员的业务能力和服务意识。
三、大数据和人工智能时代高校数字档案馆建设思路
(一)多渠道拓展数字资源,为数字档案馆建设“筑底”
高校作为国家重要的人才聚集地,让科研学术资源、创新成果更好地服务于经济社会发展,是发展新质生产力的内在要求。没有大量基础数据资源的支撑并完成高校档案数字化,在数字档案馆建设中人工智能技术将无用武之地,所以,拓展数字资源建设是实现数字档案馆的首要任务。以下从三个角度进行分析,首先,从技术角度分析,高校可以利用爬虫技术、API接口等方式,自动收集数据资源,整合到数字档案馆中,通过大数据分析,对收集到的数字资源进行深入挖掘,提取有价值的信息,然后使用云计算、分布式存储等技术,实现数字资源的高效管理;其次,从用户角度分析,充分利用人工智能大模型,通过用户行为分析等方式,了解用户对数字资源的需求,为资源建设提供指导,这一过程中要优化检索界面、增强交互性等,并建立用户反馈系统,及时收集用户意见,持续改进数字资源建设和用户服务体验;最后,从管理角度分析,要制订数字资源建设计划,明确建设目标,并建立数字资源的质量评估标准,确保资源的准确性,此外还要与其他机构建立合作关系,共享、共建数字资源。
(二)应用人工智能技术挖掘大数据,为数字档案馆建设“筑基”
高校数字档案馆收集、归档、存储大量数字资源,目的是充分利用这些资源,开展大数据挖掘、分析、提取工作,以发现隐藏在数据中的有价值的信息。所以,高校数字档案馆需要组建一支具备数据挖掘技能的专业团队,设计挖掘项目,明确挖掘目标、范围、标准和要求,除了挖掘本校档案馆内的资源,团队还需要整合其他来源的数据,多源数据的整合有助于发现更全面的信息。此外,数据挖掘团队要充分运用人工智能数据挖掘技术,帮助团队从海量数据中提取出有效信息,不断加强机器学习,优化挖掘策略,以提高挖掘结果的准确性。[4]在智能分类档案信息时,AI技术可以按照不同的档案介质,运用相应的关键技术对其进行智能化分类。数字档案馆可以运用人工智能技术来智能挖掘档案信息,运用数据挖掘技术进行档案价值的智能鉴定。最终的挖掘结果要以易于理解的方式呈现给用户,所以团队需要使用数据可视化工具,将挖掘结果以图表、报告、语音等形式展示出来,并解释其含义和应用价值。
(三)多体系支撑为数字档案馆建设“筑路”
1.数字档案管理系统
高校数字档案馆的建设要注重系统的整合性和功能性,建立数字档案管理系统,是实现这一目标的关键。明确数字档案管理系统的整体架构和技术路线,通过调研,深入了解用户对数字档案管理的具体需求,根据需求分析结果设计系统的各个模块,确保系统能够满足用户的需求。选择合适的技术,进行系统的开发工作,高校可以采用模块化的设计思想,提高系统的可扩展性。将高校数字档案馆现有的数字资源进行整合,确保它们能够无缝地集成到新的数字档案管理系统中,并将旧系统中的数据迁移到新系统中,确保数据的完整性,充分利用AI技术,根据用户需求,实现数据分析、个性化推荐等高级功能,提升系统的使用价值。[5]
2.档案资源数据库
高校数字档案馆要构建一个全面、灵活的档案资源数据库,以满足日益增长的数据存储、检索和利用需求。要分析高校档案资源的种类、存储需求等,明确数据库的建设目标,根据需求分析结果,设计数据库的逻辑结构和物理结构,通过自动化工具、人工录入等方式,构建多主体参与、多渠道供给、多形式服务的数字档案资源供给体系,收集高校内部的各类档案资源,充分发挥数字化 “工具箱”作用,构建稳定、可靠的数据库管理系统。
(四)以人工智能技术为支撑,为数字档案馆实现智慧服务“筑智”
1.建立用户需求感知引擎和智能化人机交互系统
档案工作者要紧密关注用户需求,并据此不断优化服务内容,建立用户需求感知引擎和智能化人机交互系统。要明确需求感知引擎的主要目标,并通过用户调查等多种渠道,收集用户的访问记录、反馈意见等数据。人工智能促使人机交互从传统的 “由输入到反馈”循环转变为智能的 “由推荐到选择”循环,在此基础上,数字档案馆可以建立智能档案信息利用服务系统,通过该系统与利用者进行语音交互、视觉交互以及触觉交互,从而向利用者提供个性化的智能服务。利用系统分析工具对交互数据进行分析,发现用户的访问规律、检索频率、常用服务、兴趣偏好等,根据数据分析结果,建立用户需求感知模型,这一模型能够识别用户的显性需求和隐性需求,并为用户提供个性化的服务推荐。此外,要建立实时响应机制,确保需求感知引擎能够在第一时间捕捉到用户的需求变化,向用户提供更高品质的个性化、智慧化服务。
2.提升远程服务智能和效能
高校数字档案馆不仅需要满足校内师生的需求,还要积极向校外用户提供服务,而当前大多数档案馆的查档方式还是实地查档,所以,提升远程服务能力是非常重要的。一是要将人工智能大模型运用到高校数字档案馆建设之中,利用基于AI的自动化处理引擎,进一步降本增效;二是要积极运用、优化远程智能访问界面,设计简洁的用户界面和交互语言,确保校外用户能够轻松访问档案资源;三是要加强宣传和用户在线智能服务,积极运用官网、微信公众号等宣传媒介积极宣传、推广数字档案馆的远程智能服务,提高校外用户的认知度和使用率,帮助用户更好地了解和使用远程智能服务。
(五)加强信息安全防护体系建设,为数字档案馆建设“筑墙”
在大数据和人工智能时代,数字档案馆在为我们带来便捷高效服务的同时也面临更加严峻的安全挑战,构筑高效的信息安全防护体系尤为重要。一是要制定信息安全政策,明确数字档案馆的信息安全要求,并定期对政策进行审查,确保其适应不断变化的安全威胁;二是要对数字档案馆的硬件设施进行加固,防止未经授权访问,并部署高性能的防火墙和入侵检测系统,防止恶意软件的入侵,设计合理的访问控制策略,确保只有授权用户能够访问特定的数字档案资源;三是要定期对数字档案数据进行备份,制订应急响应计划,以便在发生安全事故时迅速恢复数据;四是严格落实数据档案安全工作责任制,开展数据安全监测预警、应急演练、专项检查,提升对数据档案安全的态势感知、应急处置和追踪溯源能力。
四、结束语
当前,高校数字档案馆建设机遇与挑战并存,通过多渠道拓展数字资源、应用人工智能技术挖掘大数据、建立数字档案管理系统和数据库、构筑信息安全防护体系等策略,可以构建一个智能、安全、绿色、高效的数字档案馆,这不仅有利于提升高校档案服务效率,还能为高校的科研和管理提供数据支持。推进档案事业数字化、智能化是一个系统性、长期性、渐进性的过程,档案工作人员还需要不断加强理论探索和实践创新,以适应高校信息化发展需求,开创高校档案数字化、智能化服务体系建设的新局面。
参考文献:
[1] 中办国办印发 《“十四五”全国档案事业发展规划》[EB/OL]. [2024-03-20].https://www.saac.gov.cn/daj/toutiao/202106/ecca2de5bce44a0eb55c890762868683.shtml.
[2] 余子丹.大数据时代高校数字档案馆建设思路[J].兰台世界,2018(12):50-53.
[3] 志伟.基于SWOT分析方法的高校数字档案馆建设思路探讨[J].兰台世界,2023(07):59-63.
[4] 罗家靖.新 《档案法》背景下高校数字档案馆建设突破路径:以深圳大学数字档案馆建设为例[J].黑龙江档案,2023(02):311-313.
[5] 李倩.人工智能对高校数字档案馆建设的影响与挑战[J].办公室业务,2023(11):183-185+189.