国家高能物理科学数据安全保障体系

2024-12-01 00:00:00王佳荣周彩秋苑新阳朱一鸣孙千然颜田陈刚齐法制
农业大数据学报 2024年2期
关键词:高能物理保障体系数据安全

摘要:为解决国家高能物理科学数据中心面临的数据安全问题,本文在传统的网络安全相关研究基础上,分析我国高能物理科学数据中心面临的科学数据安全风险,总结出高能物理科学数据安全保障的特点,提出了适合我国高能物理领域科学数据的安全管理体系、技术体系和运维体系,以期为科学数据安全问题的实践应用提供参考借鉴。本文提出的高能物理科学数据安全保障体系,覆盖数据全生命周期,可以有效保障数据在传输、存储和使用过程中的机密性、完整性和可用性,防止未经授权的访问、窃取、破坏、篡改和泄露等安全事件的发生。

关键词:科学数据;数据安全;高能物理;保障体系

1 "引言

数据安全问题是关系到内部安全、外部安全以及经济社会发展的重大问题。2017年12月8日,在中央政治局集体学习会议上习近平总书记强调要在推动实施国家大数据战略的同时保障数据安全。2021年6月10日,十三届全国人大常委会第二十九次会议上,具有历史意义的《中华人民共和国数据安全法》获得通过。这部法律不仅是数据领域的基础性法律,也是国家安全法律体系的重要组成部分,更是我国首部专门针对数据安全领域的立法,于2021年9月1日起正式施行。该部法律贯彻了总体国家安全观的立法宗旨,为聚焦数据安全领域的关键问题提供了法律框架,确立了数据分类分级管理、风险评估、监测预警、应急处置和数据安全审查等基本制度,并明确了相关主体的数据安全保护义务。

随着国家各个层面对数据安全问题重视程度的不断提高,国内相关研究也如雨后春笋般涌现,这些研究的内容主要集中在数据安全治理体系构建[1]、图书馆数据安全及保障策略[2]、数据安全风险评估与检测[3]、数据存储与传输安全[4]、新兴技术在数据安全防护中的应用[5]、特定行业领域数据安全[6]、数据安全管理政策[7]、个人隐私数据保护[8]等方面。尽管关于数据安全的研究成果已较为丰富,但聚焦到科学数据安全的研究成果却比较匮乏。

作为数据资源的特殊类型,科学数据已经成为解决复杂问题的关键要素、驱动科学发现的战略资源和支撑国家创新的基本要素。尽管我国科学数据开放共享已取得一定成效,但科学数据安全问题同样值得关注,科学数据开放共享与数据安全之间的博弈关系存在失衡现象。虽然相关政策划定了科学数据利益相关者(机构及个人)的职责和义务,但总体而言,国家法律法规/条例均仅从宏观角度概括了科学数据安全的相关原则,如何将其具体细化到各类行为主体并应用于科学数据管理实践工作中去还需持续跟进与研究。

本文以国家高能物理科学数据中心为例,阐述高能物理科学数据保障体系研究与规划。高能物理科学数据包括高能物理领域科研活动产生的实验数据和衍生数据,包括粒子物理、中子科学、光子科学、天体物理等领域,同时涵盖与高能物理相关的交叉学科数据,并兼顾其他相关数据,如科研条件、管理和信息系统数据等,用于开展物质的基本构成以及宇宙起源等粒子物理最前沿的研究。由于高价值和集中存放的特性,高能物理科学数据容易成为攻击和窃取的目标,也容易因利益相关者的漠视而导致科学数据外泄。目前,我国面临的高能物理科学数据安全威胁主要表现在利益相关者安全意识不足、重点科学数据外泄、科学数据安全危机仍然存在等方面[9]。

针对高能物理科学领域所面临的数据安全挑战,本文在深入分析数据安全风险的基础上,提出高能物理科学数据安全保障体系,该体系从高能物理科学数据全生命周期安全角度,构建管理体系、技术体系和运维体系,旨在确保科学数据的完整性、可用性和机密性,为高能物理科学数据营造一个稳固的安全基础,支持科学家们在数据驱动的科学探索中无后顾之忧地前行。

2 "高能物理科学数据安全

2.1 "高能物理科学数据安全风险分析

综合考虑高能物理科学数据的敏感性、价值、存储和传输方式、访问控制、网络安全、合规性需求等多个因素后,我们将其面临的主要安全风险分为数据完整性破坏、数据机密性破坏和数据可用性破坏三类。

高能物理科学数据完整性的高风险点主要源于黑客入侵,这可能导致科研数据被恶意篡改。中等风险点涵盖软硬件故障或中间人攻击引起的数据传输错误,以及软硬件故障引起的数据读写错误。数据完整性的破坏可能使科研数据无法正常使用,甚至导致错误的科研结论。

高能物理科学数据机密性的高风险点涉及权限管控不当、员工数据泄露、应用系统漏洞,以及数据未脱敏或明文传输所导致的敏感数据泄露。此外,黑客入侵和窃密木马也可能导致关键数据被窃取,进而危及国家安全和公共利益。

高能物理科学数据可用性高风险点包括勒索病毒导致数据被恶意加密、操作失误导致数据被误删除,以及软硬件故障引起的数据破坏。这些威胁可能导致数据丢失,进而使科研工作无法顺利开展。

此外,还可能存在开放源代码漏洞、社会工程和钓鱼攻击、不当的数据共享、数据归档和销毁不当、法规和合规性问题等安全风险。为了降低潜在的安全风险,可以采用综合性的方法,包括技术、政策和培训等手段,以确保科学研究数据的完整性、可用性和保密性。

2.2 "高能物理科学数据安全保障难点

高能物理科学数据与非科学数据面临着相似的安全风险和安全保障需求,因而可以采用类似的安全防护手段。然而,相较于非科学数据,高能物理科学数据呈现出一些独特的特点,这为高能物理科学数据安全保障工作带来了更为严峻的考验。

首先,高能物理科学数据的特点在于其数据容量庞大、非结构化数据比例高和来源多样化。对其进行分类的主要维度包括:子学科领域(比如粒子物理、中子科学、光子科学、天体物理、其他),数据源或实验装置(比如BESIII、LHAASO、JUNO、DYB、CMS、ATLAS等),数据生命周期(比如原始数据、模拟数据、重建数据等)。从管理体系角度来看,为了防止数据泄露,要根据数据遭到泄露、破坏或非法使用时产生的危害的影响程度进行分级,对不同级别的数据采取不同的保护策略。然而,我们目前并没有相对成熟的针对非结构化数据的安全保障体系,现行的数据安全策略实施过程中,常因体系的不健全而受阻,这不仅对数据的安全性处理提出了严峻的挑战,同时也导致了数据灾备成本的显著增加。

其次,高能物理科学数据需要开放共享。尽管开放共享对推动科学研究具有积极的影响,但如何在保持数据开放性的同时确保其安全性,目前尚未有明确的指导原则和操作流程,且数据共享过程中的安全漏洞可能导致未经授权的访问或数据的不当使用。鉴于高能物理科学数据具有极高的价值,集中存储的数据成为潜在的攻击目标。现有的安全防护措施未能充分考虑数据的特定需求,缺乏针对性的安全设计和策略,尤其是在关键领域如数据加密、访问控制和入侵检测等方面。科研人员往往对数据安全的认识不够深刻,对科学数据安全的投入也未能满足实际需求,这在数据开放共享的背景下,使得数据安全性难以得到全面的保障。

第三,数据安全管理工作过度依赖于人工干预。目前数据全生命周期的管理过程中,部分环节自动化水平不足,导致数据安全管理工作依赖人工干预,也是数据安全保障面临的重大挑战之一。这不仅提高了操作失误的风险,也延长了对安全事件的响应时间。因此,建立一套面向高能物理科学数据全生命周期需求的自动化运维体系,提高自动化水平和运维效率,成为确保数据安全不可或缺的一环。通过优化运维流程和提升技术水平,可以有效减轻数据安全管理的负担,降低风险,并为高能物理科学数据的安全保障提

供坚实的支撑。

3 "高能物理科学数据全生命周期安全保障体系

针对高能物理科学数据中心数据安全面临的严峻

安全问题,重点突破传统威胁检测方法,未知攻击识别能力弱,风险识别模糊和预警滞后等问题,提出融合纵深防御思想的安全保障体系,针对数据在采集、存储、处理、传输、交换、销毁的全生命周期中可能存在的破坏、篡改、窃取等风险,研究数据传输及存储加密方式、数据安全访问控制、数据脱敏、数据防泄漏、状态监控与日志审计等方法保障数据中心的数据安全。整体架构如图1所示。

3.1 "管理体系

科学数据管理体系包括数据安全管理制度、组织机构和安全责任制、数据安全协调机制、数据分类分级管理和数据安全意识教育。

(1)数据安全管理制度

国家高能物理科学数据中心根据数据安全相关规范性文件《中华人民共和国网络安全法》《中华人民共和国数据安全法》等,以及参考中国科学院重要数据和核心数据识别规范、科学数据安全分类分级指南(征求意见稿)等,制定国家高能物理科学数据中心安全管理制度体系,参见图2。

(2)组织机构与责任制

组织机构的任务是协调各种关系,有效地运用每个组织成员的才能,充分发挥组织系统的力量,达成团体的目标。高能物理科学数据安全组织机构由数据安全工作协调组和网信领导小组作为领导机构,负责对安全组织进行协调、领导工作,确定安全组织的指导思想、总体目标、基本原则。其次是主要负责人,负责管理安全职能部门,在安全职能部门中,系统管理员负责系统安全保障,安全运维团队负责安全保障体系的建设与运维,数据管理员负责数据安全管理,安全管理过程中采取责任制,由各级签署安全责任书,落实数据安全责任。

(3)数据安全协调机制

高能物理科学数据中心成立了数据安全工作协调小组,落实国家、中科院数据安全有关重大方针政策,统筹协调高能所数据安全重大事项和重要工作,每年召开一次会议。并成立数据安全工作推进小组负责进

一步的任务,推进数据分类分级保护,数据安全监测预警、数据安全审查等具体工作,贯彻落实高能所数据安全工作协调小组的决策部署,完成协调小组交办的其他工作任务。每半年召开一次会议。

(4)数据分类分级管理

国家高能物理科学数据中心根据高能物理领域科研和数据处理工作实际情况,遵循《国家高能物理科学数据中心数据安全分类分级指南》,构建了一套数据资源分级分类管理体系。该体系依据数据来源和整个生命周期的不同阶段,将数据划分为五大类别:粒子物理数据、中子科学数据、光子科学数据、天体物理数据和其他高能物理相关数据。其中,粒子物理数据源自各类实验装置,服务于基本物质构成和宇宙起源研究;中子科学数据基于脉冲中子源实验,支持多个学科及各领域基础研发;光子科学数据借助同步辐射光源揭示微观结构演变规律,为诸多高科技领域提供理论支撑;天体物理数据则来源于宇宙线实验和空间天文观测,聚焦高能宇宙线起源及相关宇宙学课题。在上述大类下,进一步按具体实验装置(例如BESIII、JUNO等)和数据处理流程(原始数据、模拟数据、重建数据等)细化分类。

3.2 "技术体系

国家高能物理科学数据技术体系设计了分级分域的网络结构,加强网络边界的入侵监测和防御,支持多维安全威胁检测、数据全流程安全防护、多源风险融合预警等功能。主要包括通用网络安全防护、认证

与授权、数据完整性校验、自动化分级分类、数据备份、数据传输加密与脱敏等。

(1)通用网络安全防护

由于科学数据的开放共享,科学数据会暴露在互联网上,为了应当对互联网上的网络威胁可以使用通用的网络安全防护方法。首先,国家高能物理科学数据中心部署必要的边界安全防护,包括防火墙、IDS/IPS、VPN、WAF等网络安全设备,其次,需要部署入侵检测与防护设备及时有效地检测网络威胁,例如NIDS, HIDS, EDR, SOC,第三,对检测的网络安全事件进行快速响应处置,阻断攻击进一步蔓延。与此同时,为了减小数据中心的网络安全风险,对科学数据采集、存储、处理、传输、交换、销毁全生命周期中包括的资产进行定期的漏扫和渗透测试,对识别到的高危漏洞进行及时有效等修复。

(2)认证与授权

国家高能物理X.509证书是全球高能物理计算网格通用的数字证书,高能物理网格计算环境中使用X.509证书认证来保障计算环境的安全。另一方面,研发部署统一认证系统,能够支持OAuth2.0,LDAP, Shibboleth认证协议,通过CARSI加入了eduGAIN认证联盟,构建基于IAM的认证框架。同时,对于科学数据的访问授权,由科学数据管理员负责管理,基于用户认证信息、组信息、用户位置IP和自身权限管理数据库判断用户权限。

(3)数据完整性校验

数据的Hash值有CRC32、MD5和SHA,高能物理科学数据在数据采集阶段计算初始hash值,然后将Hash值保存到科学元数据管理系统。在数据传输、数据交换前后读取元数据管理系统中的Hash值进行数据校验,同时在数据处理前也需要进行Hash值校验。

(4)数据加解密与数据脱敏

为了保证高能物理科学数据保存、传输和接口安全,需要对敏感数据进行加密和脱敏。数据加密可以使用对称加密算法、公钥加密算法、国密算法,网站使用HTTPS加密传输协议。数据脱敏采用专门的脱敏算法对敏感数据进行变形、屏蔽、替换、随机化、加密,并将敏感数据转化为虚构数据。

(5)自动化分级分类

科学数据自动分级分类可以通过对科学元数据的文本数据进行分析,自动划分数据级别。首先使用自然语言处理技术基于元数据内容对数据集进行分类,在获取到数据集的类别之后,使用大语言模型识别元数据中的敏感内容,侧重个人信息,地理位置信息等关键信息的抽取。然后再加权科学数据敏感性和所属类别,最后加权得分对照分级的标准得到科学数据级别。

(6)科学数据备份

数据存储之后需要备份,以防因不可控因素受损

或丢失。在确保数据物理安全的基础上,需要对数据进行专业评估,评估数据的安全等级、重要程度等,以分级分类进行安全归档管理。高能物理科学数据采用分级多副本的存储方式,利用磁盘存储、磁带存储、私有云存储,同时CEPH、EOS存储实行三副本配置。

数据存储盘阵使用RAID 6+2。对于重要的科学数据使用大容量磁带进行容灾备份,同时进行异地备份。

3.3 "运维体系

本文提出了基于机器学习算法的海量安全数据分析预警运维体系,实现运维的自动化响应处理,包括安全运维平台、安全运维团队以及数据安全联盟与协作,使数据安全的运维自动化向运维智能化转换。

(1)安全运维平台

由于科学数据中心的网络安全数据异构多样,未充分发挥海量数据的关联分析价值,因此构建安全运维平台,对各类型安全日志、资产、漏洞进行集中管理,设置安全数据采集、预处理、存储、分析、应用的五层架构,如下图6所示。安全运维平台通过态势感知、威胁发现、告警处置、资产与漏洞管理、安全策略管理等功能实现科学数据中心的安全监测、分析、预警、处置的闭环流程,提供持续、迭代、螺旋上升的安全保障与支持能力,形成面向科学数据中心的动态演进的体系化的安全防御平台。

安全运维平台目前已经应用到了包含BEPC、CSNS、NSRL等在内的5个大装置和4个科学数据中心。该平台为中科院大装置和科学数据中心网络安全保障工作作出了重要贡献。它基于大装置和数据中心运行单位之间的共享情报与安全事件协同应急响应,累计安全日志达到了34.6亿条,发现各类威胁9200多个。利用该平台处理各大装置和数据中心安全事件超过30次,自动化检测及响应高危网络攻击超过44万次,平均响应时间达到分钟级,误报率小于0.1%,累计特色情报达到23万多条,有效保障了大装置和数据中心的安全稳定运行。

(2)安全运维团队

建设安全运维团队,成员分为三类:一线运维人员、二线运维人员、运维研发人员,分别负责安全事件应急响应处置、安全事件溯源分析和研判以及开发自动化检测和处置工具,有效提高运维效率。团队具备应急响应能力,能独立处置数据中心各类安全事件,及时对网络进行安全加固,同时通过应急响应、安全竞赛和攻防演习,不断提升团队实战化运维技术能力。

(3)安全联盟与协作

为了形成有效的多科学数据中心联动的运营体系,需要建立科学数据中心安全联盟,加强多个科学数据中心之间的信任和协作机制建设。安全联盟主要

协作机制包括:定期召开会议,建立邮件列表、微信群等沟通渠道;建立基于TLP的安全情报共享信任机制;共同推动科学数据安全规范的研制和落地;依托安全运维平台的威胁情报子系统,建立情报和知识库共享机制;依托安全运维平台的事件响应处置子系统,建立安全人员共享与协作机制。

4 "总结

国家高能物理科学数据安全保障体系的研究对于高能物理实验数据的安全保障具有重要意义。随着科学数据量的增加,数据共享程度的扩大,高能物理科学数据中心将在数据安全方面面临更严峻的考验,因此构建一个适合科学数据中心的网络保障体系显得十分必要。本文对国家高能物理科学数据安全保障体系进行了详细探讨,通过构建完善的制度体系、技术体系和运维体系,加强职工数据安全意识培训,以及建立应急响应处理能力,可以有效提高高能物理科学数据中心整体的安全性,为高能物理科学研究提供更加可靠的数据支持。

参考文献

[1] 都婧.新形势下对于构建数据安全治理体系的思考与建议[J].中国信息安全,2019(12):68-70.

[2] 鲍劼,李丕仕,都平平,等.高校图书馆面临的数据安全问题及防护策略研究[J].现代情报,2017, 37(7):93-96.

[3] 徐湖鹏,吴宗大,卢成浪,等.私有云的数据安全风险评估体系的构建与应用[J].单片机与嵌入式系统应用,2019,19(12):23-25,28.

[4] 王军.网络数据动态传输与存储安全自动监测系统设计[J].自动化与仪器仪表,2020(1):70-73.

[5] 冯涛,焦滢,方君丽,等.基于联盟区块链的医疗健康数据安全模型[J].计算机科学,2020,47(4):305-311.

[6] 窦佐超,汪诚弘,邓杰仁,等.生物医疗大数据隐私与安全保护 "的应对策略与技术[J].中华医学图书情报杂志,2019, 28(11): 11-15.

[7] 张涛,马海群.基于政策文本计算的开放数据与数据安全政策协同研究[J].情报理论与实践,2020,43(6):149-155,141.

[8] 魏丹阳,马海群.网络环境下个人数据存储安全和隐私保护影响因素研究[J].图书馆理论与实践,2018(1):89-95,100.

[9] Li Yang, Wen Liangming. Research on security guarantee path of scientific data in China [J]. Library, 2021, (3):99-105.

引用格式:王佳荣,周彩秋,苑新阳,朱一鸣,孙千然,颜田,陈刚,齐法制.国家高能物理科学数据安全保障体系[J].农业大数据学报,2024,6(2):269-277. DOI: 10.19788/j.issn.2096-6369.000028.

CITATION: WANG JiaRong, ZHOU CaiQiu, YUAN XinYang, ZHU YiMing, SUN QianRan, YAN Tian, CHEN Gang, QI FaZhi. National High Energy Physics Science Data Security System[J]. Journal of Agricultural Big Data, 2024,6(2):269-277. DOI: 10.19788/j.issn.2096-6369.000028.

National High Energy Physics Science Data Security System

WANG JiaRong1, ZHOU CaiQiu1,2, YUAN XinYang1, ZHU YiMing1, SUN QianRan1, YAN Tian1, CHEN Gang1,2, QI FaZhi1,2*

1. Institute of High Energy Physics, Chinese Academy of Sciences, Beijing 100049, China; 2. Spallation Neutron Source Science Center, Dongguan 523000, Guangdong, China

Abstract: To address the data security issues faced by the National High Energy Physics Data Center, this paper analyzes the scientific data security risks faced by High Energy Physics Data Center based on traditional network security, and summarizes the characteristics of high energy physics science data security and proposes a data security management system, technical system, and operation system suitable for China's high energy physics science, aiming to provide reference and inspiration for the practical application of scientific data security issues. The system covers the entire data lifecycle, effectively ensuring the confidentiality, integrity, and availability of data during transmission, storage, and applications, preventing unauthorized access, theft, destruction, tampering, and leakage of security events.

Keywords: scientific data; data security; high energy physics; security system

猜你喜欢
高能物理保障体系数据安全
基于智能机器学习的高能物理技术研究
科技资讯(2024年24期)2024-02-09 00:00:00
盛宴已经结束
云计算中基于用户隐私的数据安全保护方法
电子制作(2019年14期)2019-08-20 05:43:42
ETC关键设备准入标准及运行保障体系构建
建立激励相容机制保护数据安全
当代贵州(2018年21期)2018-08-29 00:47:20
关于构建战区联合作战后勤聚合保障体系的思考
大数据云计算环境下的数据安全
电子制作(2017年20期)2017-04-26 06:57:48
构建更安全可靠的机房电源保障体系
大数据安全搜索与共享
健全大数据安全保障体系研究