陈娅婷,张淑凤,李佳泽,单琳
(中核战略规划研究总院,北京,100043)
自20世纪50年代起步以来,装备科技信息工作发挥了重要的“耳目、尖兵和参谋”作用,为全面推进国防和军队武器装备现代化建设做出重大贡献[1]。目前,国家安全环境日趋复杂,传统的装备科技信息工作面临着巨大挑战,正处于创新发展的新时代。随着信息技术飞速发展,大数据等前沿技术在军事领域的广泛应用,装备科技信息工作也迎来了新的机遇[2,3]。如何在当前复杂环境下推动装备科技信息工作创新发展,如何利用先进的信息技术手段从海量数据中获取有价值的信息,如何借助大数据技术构建有效的装备科技信息服务系统架构,是装备科技信息工作当前亟待研究的问题。
装备科技信息是指与武器装备建设、管理和运用直接相关的可供交流的科技信息或科技知识,包括国内外武器装备建设、军事技术发展以及国防科研、生产活动中产生的科技报告、技术资源等各类科技信息[4]。国防科技和武器装备发展建设规划、计划的制定,军事技术发展方向、重点的确定,武器装备和技术发展项目的拟定,都要有相应的科技信息作为依据[5]。装备科技信息工作对于提高装备管理决策效率、促进装备科技创新发展和加快新装备形成战斗力等方面发挥着重要作用。当前,在装备科技信息工作实际研究过程中,仍存在一系列阻碍因素和问题困难。
在大数据时代,数据成为了整个时代发展的核心,为加速装备科技信息工作的进步提供了前所未有的机遇[6]。数据急剧增多使得装备科技信息工作摆脱了信息匮乏的局面,但涉及不同领域和平台、分布广泛的信息资源大大增加了信息采集、分析处理的难度。目前,装备科技信息工作技术手段落后,科研工作人员人工处置应接不暇,疲于奔命,无法全面搜集、深入处理信息,导致出现信息流失、低效、重复与失真等情况。然而,装备科技信息工作追求快速、准确和全面,迫切需要高效的信息技术手段提高工作效率和成果质量。大数据、云计算、人工智能、自然语言处理等先进的信息技术以其自动化、智能化的功能和高效性,当仁不让地成为可靠的中坚力量。
同时,由于装备科技信息工作所使用的信息资源分布在不同的领域和平台上,大量信息数据掌握在部门或个人内部,形成诸多孤立的小型信息库,信息孤岛严重,数据利用率低,无法发挥信息资源共享共用的最大效能,使装备科技信息工作成果缺乏准确性和可信性。因此,加强装备科技信息资源的沟通与合作,建立资源共享平台,扩展信息资源并实现信息资源共享共用与装备科技信息工作协同发展至关重要。
大数据环境下的装备科技信息工作建立在数据集中的基础上,朝着数字化、智能化、平台化方向迈进,如图1所示。
图1 大数据环境下的装备科技信息工作全流程示意图
为装备科技创新发展提供准确、可靠的决策服务需要大量、全面的数据支持。在装备科技信息工作发展过程中,已积累了很多数据,部分已形成数据库,如装备科技成果库、装备科技项目库等结构化数据集,但大部分为半结构化、非结构化的数据集,如文本类数据、图形图像数据、音视频数据等。这些数据资源规模越来越大,结构多样,存储位置和形式不一致,但通过关联与融合,呈现出巨大的分析挖掘与决策的参考价值。
大数据环境下的装备科技信息工作,依托云存储、分布式文件存储等大数据存储技术,构建装备科技信息工作统一的存储体系,将在传统基础设施中长期保存的分散、多样的电子数据和纸质文件数字化,并存储在存储设施中进行统一管理,取代了传统的存储方式,实现对非结构化数据的特征提取和半结构化数据的内容检索,便于对装备科技信息工作的各类数据进行整理、交叉分析、对比和深度挖掘。
装备科技信息工作历来以信息收集、处理、分析与提供决策服务为主。在大数据环境下,数据来源激增给装备科技信息工作带来了丰富的信息资源,使信息多元化、广泛化,但规模巨量的数据、多样的数据类型、复杂的数据来源以及数据价值密度的降低也给装备科技信息工作带来了新的挑战[7,8]。传统的分析处理手段已无法处理海量的结构化、半结构化和非结构化的数据,大数据时代开启了装备科技信息工作新范式,人工智能、机器学习等新兴信息技术使得研究范式向着以数据分析为主导的方向转移。从传统的提出问题、搜集相关信息、分析并生成研究成果转变为主动采集数据、根据规划进行数据挖掘分析、生成研究成果。
依托大数据技术,装备科技信息工作可以更好地构建服务系统,借助先进的信息技术和方法工具,在大量采集装备科技信息数据的基础上,对装备科技信息数据进行科学有效地组织、存储、数据分析挖掘、成果展示等,从而发现国内外武器装备建设、军事技术发展可能出现的变化,对国防科技和武器装备发展建设规划提供有力的决策支持,从而促进装备科技信息工作创新发展。
大数据环境下,利用大数据技术开展装备科技信息工作,建立数据驱动型智能装备科技信息服务系统,通过知识库、采集和处理系统精确满足用户需求[9]。基于大数据技术的装备科技信息服务系统的架构如图2所示,主要为信息采集、信息共享共用、信息智能搜索、信息智能分析和成果展示提供统一管理和使用的平台。该系统以装备科技信息共享共用平台为核心,依赖于巨量数据的分析挖掘获得研究成果,利用了机器学习、自然语言处理等信息技术,实现了装备科技信息工作从信息采集到应用的全流程各环节的智能化、规范化功能。整个系统综合考虑了大数据的特性以及对接第三方应用系统,使得出的结果更加贴近实际,并符合科研工作人员的需求。
图2 基于大数据技术的装备科技信息服务系统架构
装备科技信息需求规划平台提供用户个性化信息采集需求定制服务和海量站点统一管理服务。用户个性化信息采集需求定制服务:用户统一规划信息采集需求,系统根据用户提供的信息采集对象、类型、范围等需求进行数据自动采集工作。海量站点统一管理服务:实现对众多信息采集渠道进行统一管理的功能,构建官方、社会、网络等多维度信息采集对象,采用先进的信息技术对海量站点进行统一监督和自动实时的信息采集,通过人工智能等信息技术对海量站点进行访问结果监督和反馈,例如监督站点的可用性,自动清理故障站点;监督站点关联站点,丰富资源获取渠道;监督站点的访问和资源下载效率。
装备科技信息共享共用平台提供知识库管理服务和权限管理服务。知识库管理服务:在基础数据库的基础上,根据装备科技信息资源的类别,利用深度学习算法完成关键词匹配,将数据重新分类后形成知识库。通过将所具有的信息资源以及成果按照统一的分类系统,组织和存储到统一的信息资源库,并对同一事项形成的系统信息进行统一存储和管理,消灭信息孤岛,实现信息的有效共享,为管理者和决策者提供全方位的信息,以便于其作出正确的决断。权限管理服务:考虑装备科技信息的特殊性,提供精确的信息共享服务,用户可根据装备科技信息资源和成果的属性、分类、知悉范围等要素,对装备科技信息资源和成果进行访问控制设置,将操作权限细粒度化,实现信息共享的同时,保障知悉范围可控和数据安全。
装备科技信息智能搜索平台提供用户个性化检索推荐服务。系统通过记录用户检索信息的行为和习惯,将这些记录进行分类和排序,利用深度学习方法,给用户塑造检索行为画像,从而根据用户的兴趣点提供检索优先排序,达到精准推荐的目的。
装备科技信息智能分析平台提供在线数据加工服务。利用提供的机器学习算法,用户自定义数据挖掘模型,对采集的数据进行智能分类、统计,根据用户目标进行综合态势、重点热点等方向的关联分析,从时间、人物、背景、项目动态、技术动态等多维度对资源进行画像,从而在海量数据资源中挖掘潜在信息,为科研工作人员提供内容更深入、范围更广阔、联系更清晰、分析更细致的智能分析服务,从而获得准确、科学、可信的结果
装备科技信息成果展示平台提供可视化服务。根据用户需要,运用可视化技术,将装备科技信息研究成果以图表、报告、画像、知识图谱等多种形式展现,加快用户对数据的理解,便于快捷、清晰的提供装备科技信息服务。
信息采集是装备科技信息工作流程中最重要的也是最基础的环节。然而,目前装备科技信息的采集由科研工作人员独自组织管理,缺少系统规范的采集程序,在信息采集范围、质量、实用性以及时效性等方面没有明确的要求。同时,由于科研工作人员技术水平高低不同,导致采集的信息的质量、准确度和实用性难以保证,不能客观真实地反映出数据的结果。建立规范、统一的信息采集程序,有助于保证系统能够收集到足够全面的信息,大大提高信息的收集速度,以及保证信息的及时性和有效性。
大数据环境下,数据的存储和传输方面都存在着许多的安全问题,一旦触发很有可能引发一系列严重问题,造成极大的经济损失,因此无论是政府机关还是企业,都需要对信息安全问题加以重视[10]。装备科技信息服务系统的开放性和共享性,会加大病毒感染、数据泄露、数据强行上传下载、数据恶意删除、黑客侵扰等危害发生几率,为此需加大安全技术投入力度,降低该系统安全故障发生几率。目前常规的运维管理方式已经无法满足大数据环境的快速变化,在实施信息安全防护工作的时候需要考虑到当前的信息安全技术发展,利用跟踪监测技术、加密技术、数字签名等先进技术建立安全防范机制,对数据信息进行保护,从而确保信息系统的安全性,避免数据信息遭受到破坏和盗窃。
人才是信息化建设发展的根本,装备科技信息服务系统的建立和维护必须要有一支集数据分析挖掘与装备科技信息研究等方面的复合型人才队伍。因此,要建立完善的培训机制和人才激励机制,在引进高技术人才的同时,积极培养能够掌握信息化技术和装备科技信息研究的学习型人才,使工作人员除拥有专业高效的装备科技信息工作能力外,还善用互联网技术,为信息资源共享共用提供良好的技术环境,确保系统的稳定、健康发展。
大数据环境下信息资源丰富,存在着巨大的价值,构建基于大数据技术的装备科技信息服务系统,有助于高效、准确的全面收集数据,挖掘潜藏的信息,为用户提供准确科学的装备科技信息服务。