陈亚茹,洪 鑫,张红斌,毛万华
(1.中国铁道科学研究院集团有限公司 电子计算技术研究所,北京 100081;2.中国铁道科学研究院集团有限公司 北京经纬信息技术有限公司, 北京 100081;3.中国铁路兰州局集团有限公司调度所,甘肃 兰州 730000)
数字经济时代,除传统的土地要素、劳动力要素、资本要素等要素外,数字要素作为完善要素市场化配置的新增因素之一,在引领行业创新发展、推动社会生产组织模式变革方面起着愈加显著的作用[1]。随着云计算、物联网、移动互联、大数据、人工智能等新兴技术与各应用领域之间的深度融合,基于数据驱动的业务模式创新已经成为当前各应用领域的重要发展方向之一。
数据作为数字经济的核心要素,在数字化、智能化发展趋势下扮演着越来越重要的角色[2-3]。加强数据安全治理,做好数据分类分级工作,是充分发挥数据资源价值的基础保障。近年来,国家先后出台了一系列文件推进构建数据分类分级治理体系。2021 年9 月1 日起施行的《中华人民共和国数据安全法》(以下简称《数据安全法》)第21 条提出建立数据分类分级保护制度。为进一步贯彻落实数据分类分级保护制度,全国信息安全标准化技术委员会于2022 年9 月14 日发布《信息安全技术 网络数据分类分级要求》(征求意见稿)(以下简称《数据分类分级要求》),提供了数据分类分级原则、框架和方法,为行业领域主管(监管)部门制定本行业本领域的数据分类分级标准规范提供参考。
数据分类分级管理是数字经济背景下实现数据赋能的前提和基础。近年来,随着铁路信息化建设的大力推进,铁路客运、货运、调度、机辆等各个部门为提高运输组织效率分别研发了各自的信息化系统。同时铁路行业也积累了丰富多源的数据,数据量呈现爆炸式增长。《“十四五”铁路网络安全和信息化规划》也指出,要持续构建一体化的现代铁路信息基础设施,强化铁路网络安全能力建设,加强网络攻防、数据安全、风险评估、供应链安全、控制系统安全、国产密码应用和国产化等技术研究与创新应用,健全网络安全信息共享机制。由此可见,数据安全越来越受到重视,通过对数据分级和保护策略研究,对于补强铁路数据在采集、存储、传输、使用等全生命周期的安全薄弱环节,提高数据安全防护能力,加快构建铁路数据安全治理体系具有重要意义。
为切实保障数据分类分级保护制度的落实,我国部分行业近年来陆续开展了先行探索。
在工业领域,2020年2月,工业和信息化部印发《工业数据分类分级指南(试行)》,进一步明确工业数据的范围,以及各工业企业需要结合自身业务场景梳理数据清单。根据工业数据遭到破坏后,对数据造成的影响对数据分级,不同级别数据分别制定保护措施,并先后开展工业数据分类分级应用试点工作[4]。
在金融领域,2020年9月,中国人民银行发布《金融数据安全 数据安全分级指南》,根据金融行业特性,提出了更有针对性的管理和保护需求。同时在对数据资产进行梳理分类后,将金融数据划分为5级。
在电信领域,2020 年12 月,《基础电信企业数据分类分级方法》开始实施,根据数据破坏后的影响范围和影响程度,将数据划分为敏感数据、较敏感数据、低敏感数据和不敏感数据共4 个级别[5]。
截至目前,工业、金融、电信、网络、政务等多个领域先后出台了适用于本行业的数据安全分类分级指南。这些都为铁路领域构建系统化、体系化的数据分类分级方法体系提供了借鉴。铁路运输调度指挥直接影响铁路日常运输生产,贯穿运输生产全过程,聚焦铁路运输调度领域数据,开展数据分级管理研究,进一步提升铁路运输调度数据的安全治理水平,在保障数据安全可靠的基础上,为促进铁路运输调度指挥精细化、精益化、精准化保驾护航。
铁路运输涵盖客运、货运、调度、移动设备及基础设施运用等。调度部门作为铁路日常运输组织的指挥中枢,涉及车务、机务、工务、电务、车辆等多个工种的密切配合、协同运作,在组织客货运输、保障运输安全、提高客货服务质量等方面发挥着至关重要的作用。铁路运输调度指挥过程主要是以客货运市场需求为牵引,以计划为抓手,形成计划编制、执行、调整和反馈的闭环管理[6-7]。数据作为信息传递的载体,加强数据的安全治理,有助于进一步提升铁路运输调度指挥过程的精益化、精细化水平,充分发挥全路“一张网”“一盘棋”优势[8-10]。
分析铁路运输调度数据可从多个维度,单从数据的角度可以分为格式化数据、非格式数据及半格式化数据,但这种方式下数据与业务的联系不够紧密,对于后续数据驱动业务的提升难以满足;按照调度工种也可以进一步划分为计划调度、货运调度、客运调度、列车调度、机车调度、车辆调度、施工调度等各个工种需要涉及的业务数据,但存在工种间数据的交叉和重复问题,比如计划调度需要掌握机车、车辆以及施工等相关数据。综合考虑,从运输生产全过程视角出发,按照调度指挥工作流程及上下游信息,从需求感知、计划编制、计划执行与调整、评价分析4 个维度梳理运输调度相关数据,运输调度领域数据归纳如表1所示。
表1 运输调度领域数据归纳Tab.1 Data summary in railway transportation dispatching
表1 展示了广义上运输调度指挥涉及的数据,包括客货运市场需求数据,中国国家铁路集团有限公司、铁路局集团公司及站段三级调度指挥机构涉及的各类工作计划数据,计划执行和调整需要掌握的移动设备(机车、车辆等)和固定基础设施(车站、线路等)等运力资源的供给情况,以及评价分析环节从运输生产任务完成情况、设备设施利用情况、车流组织效果、运输经济指标等多个维度的评价指标数据。就铁路运输调度领域而言,其涉及的数据量庞大、数据结构差异化程度高,且目前尚未形成科学完善的数据分级管理体系,无法有针对性地制定数据安全分级保护策略,数据资源价值得不到充分发挥。针对现有存在问题,亟需建立一套完善的运输调度领域数据处理规范和分级标准,继而制定分级保护策略,以促进调度指挥业务数字化转型,加快数字铁路建设,赋能铁路高质量发展。
《数据分类分级要求》介绍了数据分类分级基本方法、数据分级框架和数据定级等内容,主要目的是便于不同级别数据实行分级保护措施,从而加强数据安全治理。数据分类简单来说,就是把相同属性或特征的数据归集到一起,形成不同的类别,从而便于管理和使用。数据分级,指的是对分类后的数据进一步按照一定价值识别标准划分保护级别,并以此为依据确立适当的保护策略与规则,从而实现数据的完整性、保密性和可用性[11]。就铁路运输调度数据而言,按照行业分类可以归为交通运输业数据,本研究不再对其开展分类研究,而是从分级保护的角度,开展运输调度数据分级探讨,并针对不同级别的数据进一步开展分级保护策略研究,其必要性主要体现在以下方面。
(1)落实国家数据分类分级管理相关法律法规的具体措施。近年来《数据安全法》《网络安全法》等一系列法律法规的出台,推动数据分类分级管理体系加快构建,彰显国家对于加强数据安全治理的决心。加强铁路运输调度数据分级管理,是铁路行业加强数据管理的初步探索,也是贯彻国家相关法律法规的具体体现。
(2)进一步加强运输调度数据安全治理的基础。在数字经济时代,如果缺乏数据安全防护,数据一旦泄露极易对国家政治、经济和社会等多个方面造成负面影响。数据分级管理作为保障数据安全治理的基础,其重要性不言而喻。而铁路运输调度部门作为铁路指挥的“大脑”,汇集了铁路各专业领域的海量数据,直接掌握铁路日常运输生产实际情况。部分核心数据(如路网运力资源分布、列车运行数据等)的外溢会造成不同程度的危害,轻则影响运输组织秩序,重则危害国家安全,因此开展铁路运输调度数据分级管理迫在眉睫。
(3)确保运输调度数据共享流通的基本前提。在数据驱动的发展背景下,实现数据的开放共享是趋势。而制定数据分级管理规范,保障数据安全性是保证发展可持续性的前提[12]。海量的铁路运输调度数据种类多种多样,铁路运输调度部门需要依据科学性和系统性、规范性和明确性、稳定性和实用性以及扩展性等原则,以调度指挥过程为着眼点,对运输调度指挥全流程各环节数据进行系统的梳理,形成调度部门数据清单。根据数据标识分类,明确用于共享流通的数据类型,对内可向铁路系统运输、客运、货运、机务、车辆等部门提供基于数据的应用服务,对外可向社会提供列车运行等实时数据。根据面向对象不同,制定不同类型的数据共享机制,从而实现调度数据的共享流通。
《数据安全法》作为我国数据安全领域的基础性法律,将数据从高到低依次划分为核心数据、重要数据以及一般数据3 个级别[13]。数据级别的划分主要是依据数据本身的资源价值,以及数据遭到篡改、破坏、泄露,或者被非法获取、非法利用,从而对国家安全、经济运行、社会稳定、公共利用或者组织、个人利益造成的危害程度。以铁路运输调度领域数据分析为例,运输调度核心数据指的是运输调度领域可能直接危害政治安全、国家安全重点领域以及重大公共利益的数据;运输调度重要数据指的是运输调度领域可能直接危害国家安全、经济运行、社会稳定、公共健康和安全的数据;运输调度一般数据指的是运输调度领域仅影响小范围的组织或者公民个体合法权益的数据。以《数据安全法》规定为基础,结合铁路运输调度具体业务场景以及数据在经济社会发展中所起的作用,总结铁路运输调度数据分级依据如图1所示。
图1 铁路运输调度数据分级依据Fig.1 Classification basis for railway transportation dispatching data
在梳理和分析铁路运输调度数据的基础上,根据调度具体业务场景和数据使用过程中存在的问题,设计运输调度数据定级流程。铁路运输调度数据定级流程如图2所示。
图2 铁路运输调度数据定级流程Fig.2 Grading process of railway transportation dispatching data
步骤1:识别运输调度数据范围,结合铁路运输调度具体业务场景,梳理调度业务全生命周期数据的流转流程,确定运输调度数据的覆盖范围。
步骤2:梳理运输调度数据清单,在步骤1的基础上,进一步分析不同业务场景下数据的流通机制,任意选取一个角度,如数据的类型、业务场景、涉及的岗位工种等,形成详细的运输调度数据清单。
步骤3:初步判定数据级别,综合考量数据分级各项要素,判定数据破坏后影响对象及造成的影响程度,形成数据初始分级判定结果。
步骤4:最终判定数据级别,将初步判定的数据级别代入到目标对象具体的业务场景中,根据业务场景和数据应用情况反馈修正。
值得注意的是,数据处于动态变化的过程,这也就造成了数据的分级也是不断变化的。究其原因在于数据安全作为数据等级评估考虑的重要因素,随着时间、应用场景及使用目的的不同,导致初始判定的数据级别后续会出现动态调整的情况。如当前列车运行轨迹数据可以直接作为后续列车晚点预测的依据、车流径路调整的基础。而随着时间的推进,以往的列车运行轨迹数据重要性会有所下降,导致数据级别的降低。因此,在实际应用中需要进一步结合具体业务场景,实现数据动态定级。
参照数据分级依据,按照数据分级流程,再结合前文梳理的运输调度相关数据,对其展开分级探讨。铁路运输调度一般数据包括列车种类、列车速度等级、机车型号、机车走行公里等基础数据,这类数据如若泄露对国家和经济社会不至于产生危害,通常这类数据在正常保护措施下可以对外提供数据使用、共享和交易服务;铁路运输调度重要数据包括列车到发时分、列车运行径路、列车编组内容、列车正晚点信息、停限装命令等,这类数据的泄露会对经济运行和公共利益造成一定损害,其使用要经过严格的技术处理,有特定的使用场景;铁路运输调度核心数据包括列车位置信息、特殊重点物资输送信息等,这类数据一旦泄露会对国家安全和社会运行、经济发展等产生严重危害,一般禁止对外交易和共享。运输调度数据分级结果如表2所示。
表2 运输调度数据分级结果Tab.2 Classification results of railway transportation dispatching data
以上为运输调度数据的初步分级结果,共划分为3 级。L1 级对应一般数据,L2 级对应重要数据,L3 级对应核心数据。不同级别的数据分别给出了示例,但考虑到数据的动态变化性在实际应用过程中还是要结合具体业务场景确认数据的安全级别。
数据安全保护应贯穿数据全生命周期,形成“数据采集—数据传输—数据存储—数据处理—数据交换—数据销毁”全流程各环节数据保障机制。针对铁路运输调度领域数据分级结果,考虑不同级别数据采集、存储、传输、共享和访问控制的难度,制定相对应的数据分级保护策略,实现数据分级管理。
在数据传输过程中,目前用于保障数据安全性的技术手段有很多,常用的技术手段主要有2 种:①数据脱敏,具体指的是在给定的规则范围内,按照一定的策略,通过对敏感数据进行交换、修改,从而有效解决敏感数据传输和使用的安全问题。②数据加密,作为目前保障数据安全的主要技术手段之一,是通过加密算法和加密密钥将明文转变为密文,可以有效防止数据传输过程中的机密数据泄露[14-15]。常见的数据加密主要有对称加密和非对称加密。
在数据共享层面根据数据安全等级的差异,也需要提升不同级别数据安全共享保护能力。近年来基于区块链和联邦学习的数据共享方法应用广泛。区块链是一种建立在互相不信任的用户之间的一种分布式、透明的、安全的、不可篡改的、可审计的数据交互;而联邦学习作为多安全计算框架下的机器学习算法,主要是为解决数据孤岛及隐私保护和数据安全问题。这些方法都可以在铁路运输调度数据的分级保护方面应用。
除此之外,研究不同级别数据的访问控制技术也是实现数据分级保护的手段之一。目前数据访问控制策略可以归纳为3 种,一种是基于属性的访问控制,在实际应用中,基于运输调度数据本身特点,选取典型的业务场景,考虑主体和客体的属性作为基本决策要素,采用属性或者属性集合的方式来描述实体;一种是属性基加密技术,主要用以解决云存储环境中数据的细粒度访问控制问题和大规模用户动态访问问题;另一种是基于区块链的访问控制技术,充分利用区块链的去中心化、集体维护、可编程和安全可行等优势,进一步构建细粒度访问控制模型,实现不同级别数据的安全访问控制。
针对铁路运输调度领域不同级别的数据,需要满足不同的保护要求,继而对应不同的保护策略。从数据传输、数据共享和访问控制等角度出发,通过多种数据安全保护技术的组合,形成运输调度数据分级保护策略如表3 所示。表3 中针对不同级别的数据,结合应满足的保护要求,给出了具体保护策略。
表3 运输调度数据分级保护策略Tab.3 Classification protection strategy of railway transportation dispatching data
国家相继出台了《数据安全法》《数据分类分级要求》等一系列法律法规,旨在健全数据安全管理制度。数据分类分级作为数据安全治理的基础,对于促进数据流通共享、充分发挥数据资源价值起着不可估量的作用。铁路运输调度部门直接指挥铁路日常运输工作,调度指挥贯通运输生产组织全过程。分析了调度指挥过程涉及的相关数据,参考数据分级基本依据,设计调度数据分级流程,并进一步针对不同级别数据制定对应的数据保护策略。提出的数据分级及保护策略具有一定的参考价值,并对进一步加强调度数据安全治理具有重要意义。未来,还需要针对铁路领域各专业数据开展系统性研究,加快完善铁路行业数据安全治理体系。