人工智能在科技档案领域的应用场景及实现策略

2024-12-27 00:00:00李博张晓明
档案天地 2024年12期

科技档案作为重要的科技创新资源[1-2],记录着科技创新活动的来龙去脉和创新成果产出,对其进行有效利用能够促进科技创新水平提升。然而,目前科技档案管理工作的重点仍停留在档案实体管理等常规工作上,缺少基于科技档案内容的知识服务、档案智能检索等深度开发,难以发挥出科技档案资源对科技创新活动的赋能作用[3]。

人工智能技术[4]诞生于1956年,是研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术以及应用系统的一门技术科学。目前,其在自然语言处理、模式识别、生物特征识别以及知识图谱等领域取得显著进展[5]。《“十四五”全国档案事业发展规划》提出要探索人工智能在档案信息深层加工和利用中的应用以及数字档案馆建设中的应用。当前,城建等行业探索将人工智能技术应用于行业档案管理,并形成了较为成熟的研究成果[6]。将人工智能技术与科技档案特点和管理规律相结合并运用在科技档案工作之中,势必能够发挥科技档案资源对创新的赋能作用。

一、人工智能技术在科技档案领域的适用性分析

科技档案作为档案资源重要组成部分,具有完整性、综合性和动态性等显著特点。

在完整性方面,科技档案记录科研项目立项论证、研究实施、过程管理、结题验收、绩效评价、成果登记等环节,各环节之间既相互独立又紧密相关,反应了科研项目的全流程,具有较强的完整性。

在综合性方面,科学研究、技术开发都是综合且复杂的系统工程,项目可行性研究、立项论证、研究方案制定、技术路线实施、成果应用与转化等环节之间有着较强的关联性,这就决定了科技档案具有形式多样性、内容广泛性的特点。

在动态性方面,科技创新是不断发展进步的迭代过程,科技档案工作必须要与科技创新保持同步,进行必要的动态跟踪管理,对已有档案进行及时补充、完善和更新,使科技档案能够全面、真实反应科技创新水平。

科技档案的上述特点决定了其在科技创新过程中发挥着重要作用,同时也促进参与创新活动的各类主体、科创活动管理部门、成果转化及应用部门的联系更加紧密,这都对科技档案管理的工作量和档案质量提出了新的要求。同时,由于科技档案要具备动态性,档案部门及时对接科创活动各相关方,在第一时间合规获取最新档案,并发挥科技档案对科技创新的参考、凭证、资政的多重价值。为此,需要处理好各部门间的资源对接、文件归档、卷宗管理,并从内容层面甚至语义层面对档案进行信息检索和智能分析,根据用户需求提供精准信息服务。然而,科技档案管理部门受体制机制、人员编制、业务水平等因素制约,难以全部满足上述要求。

人工智能技术的本质是信息系统在资源受限的情况下,对外界环境或需求变化作出自适应的调整。同时,根据《国家新一代人工智能标准体系建设指南》,可将人工智能技术分为通用技术(如知识图谱、模式识别等)和关键领域技术(如自然语音处理、生物特征识别等)。这些细分技术在社会生产、生活各方面均得到较为成熟的应用[7],同时以ChatGPT为代表的智能产品将人工智能技术带到了新的高度。因此,将人工智能技术应用到科技档案工作当中,势必能够满足科技档案高质量管理、精准服务等方面的要求,破解目前科技档案部门工作中存在的各类资源相对不足的难题。

二、人工智能在科技档案领域的应用场景分析

科技档案作为档案资源的一个重要类型,其全生命周期包括“收管存用”四个环节。

(一)智能化采集

在大数据时代,科技档案具有种类多样、形式多元、来源多渠道等特征。因此,在进行档案资料采集时,一方面需要借助智能终端设备在线爬取互联网信息资源等作为元数据,并通过自然语言处理技术将其转化为结构化数据,实现原始档案素材的采集;另一方面,利用人工智能技术可以将科技档案中对专家学者进行采访获得的口述史等原始音频和视频素材转录为文字资料。

(二)智能化管理

1.档案智能分类

利用自然语言处理技术和自监督学习技术训练出人工智能文本分类器模型,对科技档案文本进行面向特定服务的语义级档案分类,如:从研究领域、成果形式、项目单位等维度对科技档案进行分类。同时,利用文字识别技术对科技档案内容进行智能分类,辅助开展科技档案分类体系建设。

2.档案开放鉴定

将《文书档案保管期限表》《科学技术研究档案管理规定》等作为人工智能模型训练的微调知识,进行下游任务训练,使人工智能模型具备科技管理和档案管理等相关知识,能够实现专家系统的功能,模拟人类专家对档案开放共享策略作出决策,为科技档案有效开放利用提供工具支撑和技术保障。

3.档案修复及安全管理

利用人工智能技术修复文字档案中的文字坏损、音频或视频档案中的信息失帧等,提升科技档案的完整性。同时,将生物特征识别、模式识别等技术嵌入档案门禁管理系统、识别跟踪系统以及防火墙等产品中,实现档案访问权限控制、安全预警、风险监控等,提升科技档案的使用安全性。

(三)智能化保存

将人工智能技术运用在科技档案保存环节是将人工智能模型与档案数字化系统进行系统集成和功能融合,实现对科技活动中形成的项目申报书、研究报告、研究方案等科研过程文档进行电子化保存和自动化归档。一方面,可以利用人工智能提升档案数字化系统功能,使其能够对科技档案进行自动化保存,实现档案电子化即归档的功能。另一方面,可以将人工智能模型融入档案数字化管理系统,对管理系统中录入的档案信息进行智能化处理,将离散的系统信息整合为可直接归档的科技档案文件。

(四)智能化利用

1.档案智能化检索

利用人工智能中的自然语言处理技术训练科技档案语料库,使人工智能模型具备针对特定主题或研究领域的智能检索能力,同时结合人工智能技术实现智能化检索主题档案、智能化存取档案操作以及智能化档案归档等,减轻一线工作人员的劳动强度。

2.档案知识服务

通过自然语言处理技术实现语义级的档案内容提取,实现面向特定应用场景或用户需求的档案内容服务。如:针对同一科研项目档案,既可以对项目研究领域进行分析,形成该领域的研究案例,还可以对项目成果转化情况进行概述归纳,形成研究成果展示素材。同时,通过从语义级提取科技档案信息、获取科技档案内容,利用内容标注与分类技术,将科技档案进行多维度划分,实现对同一档案资源的多场景复用。

3.科技主题宣传

利用“人工智能多模态大模型+数字档案馆”提取科技档案中的文字内容信息,利用文生图、文生视频技术生成图片或视频等多媒体资料并通过音频和视频的方式进行同步展现,利用新媒体对外发布,实现对科技创新活动及其成果的推广宣传。

三、人工智能在科技档案管理中的应用策略

(一)夯实数字化档案资源基础

推进科技档案资源增量数字化和存量电子化,将科技档案中包含的文字、图片等转化为计算机可读、可用的格式,并作为人工智能模型训练的先验知识,训练出科技档案管理垂直领域模型,提升模型对科技档案资源管理及开发利用的适用性。此外,对现有档案管理信息系统进行改造,将人工智能模型嵌入现有系统,实现档案管理的智能化与自动化。

(二)注重档案资源利用安全性

部分科技档案会涉及对国家科技安全具有重要影响的项目信息,而人工智能的“黑盒”特性使其输出结果不可解释、运行过程不安全。因此,注重人工智能产品训练过程中的数据安全,筛选已在行业主管部门登记备案的人工智能产品进行模型训练,确保训练过程不发生数据泄露;同时,加强人工智能使用过程中的数据安全制度设计,形成涵盖档案电子化与数字化、档案信息提取、档案信息资源输入、人工智能产品输出等全链条的数据安全制度。

(三)编制科技档案领域人工智能应用指南

编制科技档案领域人工智能应用指南,提升利用人工智能技术的规范性和应用效能。一方面,促进人工智能与档案管理学融合,对人工智能应用于科技档案来源、全宗原则、文件生命周期,以及电子档案四性保障、元数据管理等场景进行梳理,实现档案管理原则、方法与人工智能技术的有机融合;另一方面,引导人工智能模型集成至科技档案管理系统框架,使其支撑数字化档案全生命周期、全流程、全要素的管理与服务,发挥人工智能对科技档案资源开发利用的引领作用,更好服务科技创新。

四、结语

科技档案具有完整性、综合性、动态性等特点,将人工智能应用在科技档案管理工作的“收管存用”四个环节,通过网络信息爬取、信息转录、档案分类、开放鉴定、档案修复与安全管理、档案知识服务、智能检索等,可充分提升科技档案利用效能,但在此过程中,也要注意夯实数字化档案资源基础、注重档案资源利用安全、编制应用指南等,以更好发挥人工智能技术在档案管理中的作用。

参考文献:

[1] 张文馨,张笑星,田议方.我国人工智能在档案领域的应用研究综述[J].兰台内外,2021 (15):12-15.

[2] 郝莎.科技档案编研探析[J].兰台世界,2017(18):60-63.

[3] 贠疆鹏,加小双,王妍.人工智能在我国档案管理中的应用现状与对策分析[J].档案与建设,2023(2):62-65.

[4] 沙洲.人工智能在档案工作中的应用研究[J].档案与建设,2018(2):36-39.

[5] 林凯,郑慧. 国外人工智能在档案工作中的应用研究及启示[J].山西档案,2020(1):104-111.

[6] 孙琳,陈着,刘谨铭.人工智能技术在城建档案管理中的可能应用场景及推进策略[J].档案与建设,2023(7):68-70.

[7] 刘丽,王兆伟,张明智.生成式人工智能对档案工作的影响[J].浙江档案,2023(9):47-50.

基金项目:天津市科技计划智库项目“天津市应用基础研究项目‘首席制’组织管理模式研究”(21ZLZKZF00500)

作者单位:天津市科学技术发展战略研究院 天津工业大学后勤管理处