王 煜,黄 磊
WANG Yu, HUANG Lei
(北京交通大学 经济管理学院,北京 100044)
(School of Economics and Management, Beijing Jiaotong University, Beijing 100044, China)
铁路信息化起步较早[1],至今已经积累了丰富的数据资源。大数据所蕴含的经济社会价值逐渐被发掘并实现增值[2-3],已经成为企业的重要资产,对促进企业发展起着重要作用,因而为实现数据资源的充分利用,铁路持续推进数据共享。然而,铁路数据保护与利用不平衡[4]、开放共享难以充分实现等问题,不利于实现铁路可持续健康发展。首先,铁路局集团公司各系统大多垂直部署,不同层级之间数据难以相互打通,即使是相同层级的各铁路局集团公司,由于铁路局集团公司各站段产生的数据直接汇集到中国国家铁路集团有限公司(以下简称“国铁集团”),跨铁路局集团公司、跨部门的数据难以相互利用,无法满足各铁路局集团公司日益增长的数据需求。其次,目前铁路数据开放共享更偏向于铁路内部,与外部铁路相关机构、企业、社会公众无法进行大量的数据交换。在数据共享日益重要的今天,无论是铁路内部还是铁路外部,均对铁路数据开放共享提出更高的要求,在铁路数据权属不明确的前提下进行大数据分析并提供数据服务,难以保证铁路数据安全,造成铁路关键信息泄露等潜在问题,不利于铁路的安全发展。实现铁路数据充分开放共享,需要明确铁路数据权属。
学术界对数据权属的理解不尽相同,有学者认为数据权属是指数据的权利属性集合,如丁道勤[5]提出个人数据兼具人格权与财产权双重属性,鲍静等[6]认为政府数据权属包括数据主权和数据权利,数据主权指数据管理权和数据控制权,数据权利指数据人格权和财产权;张鹏等[7]则认为数据权属是指数据的权利归属。铁路数据权属具有特殊性,一是可以确定铁路数据归国铁集团所有,国铁集团的各个业务部门可以代表国铁集团管理数据,铁路数据的所有权、管理权和控制权相对明确。二是铁路数据权属大多涉及整个部门或单位,较少涉及自然人,对于人格权的要求较低。三是国铁集团正在试图打通专业壁垒,更好地解决铁路内外部无法使用所需要的数据支持本单位正常工作从而影响铁路工作效率等问题。
数据确权是指数据权属的确定,在学术界尚没有统一的解释。从数据交易的角度将数据确权定义为[8]:为明确数据交易双方责权利等方面的相互关系,保护各自的合法权益,而在数据权利人、权利性、数据来源、取得时间、使用期限、数据用途、数据量、数据格式、数据粒度、数据行业性质和数据交易方式等方面给出的权属确认指引,以引导交易相关方科学、统一、安全地完成数据交易。袁勇等[9]认为数据确权一般是确定数据的权利人,即谁拥有对数据的所有权、占有权、使用权、受益权,以及对个人隐私权的保护责任等。
综上分析,铁路数据确权应明确铁路数据权利主体对某铁路数据具有何种数据权利类型。铁路数据权属的特殊性决定了铁路数据确权的重点是数据财产权中的数据使用权,在研究铁路数据确权时,主要聚焦于数据使用权,数据使用权是指数据主体使用其数据的权利[10]。因此,铁路数据确权需要解决2 个问题:①明确铁路数据权利主体,即谁应该享有铁路数据的使用权;②铁路数据使用权授予,即如何授予他人铁路数据的数据使用权。
数据权利主体是指数据权属授予对象,即被授予数据使用权的对象。铁路数据权利主体涵盖铁路相关组织机构、企事业单位、政府部门及社会公众等。根据数据共享需求及数据安全性要求的不同,将铁路数据权利主体分为铁路内部数据权利主体和铁路外部数据权利主体,分别制定数据确权方案。
(1)铁路内部数据权利主体。2016 年,国务院印发《政务信息资源共享管理暂行办法》,提出“以共享为原则、不共享为例外”的原则支持政务信息公开。铁路作为支撑国民经济的产业,也在数据共享、信息公开方面不断探索。目前,铁路数据内部共享应用有一定的审批流程,数据授权需要各业务部门进行审批,审批通过才可获取相应铁路数据,而内部数据共享授权审批流程复杂、低效且不易获取,限制了铁路数据内部共享的实践,影响铁路数据应用的效率与价值生成,但出于安全考虑,审批流程必不可少。因此,铁路数据内部确权应在保留各业务部门审批的基础上,实现审批流程的简单、高效。
(2)铁路外部数据权利主体。铁路产业链、政府部门、高校研究院、社会公众等属于铁路外网范畴。铁路外部数据确权的首要问题是确保数据的安全性。此外,此类数据权利主体的特点是数据需求较单一,数据流通方向多为铁路内部向外部单向流通,因而铁路数据外部确权应注重数据外部开放。
无论是铁路数据内部共享还是外部开放,均需要保证数据的安全性。管晓宏[11]认为数据分类分级管理是实现数据安全有序共享的基础保障。对铁路数据进行分级分类,形成不同的数据集,以数据集为单位进行数据使用权授权操作,一方面可有针对性的共享铁路数据,使数据使用方获取所需的大量数据,另一方面可保证铁路数据的安全,降低铁路重要数据被泄露的风险。从共享维度、安全维度、时间维度、空间维度4 个方面构建铁路数据分级分类体系如下。
(1)共享维度。数据的共享维度是指数据是否可共享及其共享的范围。将铁路数据权利主体划分为铁路内部数据权利主体、铁路外部数据权利主体2 种,相应地,将共享维度分为不可共享、铁路内部共享和铁路外部开放。共享维度为不可共享的数据不可进行授权操作。共享维度为铁路内部共享的数据可被铁路内部数据权利主体使用。共享维度为铁路外部开放的数据可被铁路外部数据权利主体使用。
(2)安全维度。安全维度体现铁路数据的敏感程度,决定铁路数据进行开放和共享的条件及是否需要加密和脱敏,由低到高分为3 级:公开、敏感、高敏感。不同安全维度取值下的授权策略有所不同。
(3)时间维度。时间维度是指以数据的产生时间为起点,数据经过多久后可用。铁路存在具有时效性的数据,此类数据在某一特定的时间范围内具有较高的安全级别,不能被外界使用,否则可能因数据泄露造成严重的后果,如TEDS 数据。然而经过一段时间后此类数据的安全级别下降,外界使用不会有风险。时间维度按时间长短划分为实时、分钟、小时、天、月、季度、年。
(4)空间维度。空间维度表明数据可授权的空间范围,按照团体不同分为铁路产业链、政府部门、高校研究院、社会公众。不同的团体所需的数据有所区别,如中国中车股份有限公司(以下简称“中国中车”)属于铁路产业链范畴,对于数据具有需求量大、数据专业化等特点,相比之下,政府部门、高校研究院所需的数据类型更复杂、数据覆盖范围更广,而社会公众的数据需求量相对较小。为数据细分空间维度有利于根据不同团体的特点为其提供更合适的数据集,提升铁路数据外部开放的效率。
2.1.1 铁路数据内部确权方案
国铁集团内部数据以共享为原则,而限制铁路数据内部共享的原因在于授权审批流程复杂而低效,由于重要数据的审批流程又不可或缺,铁路数据内部确权需要做到共享范围广、力度大,并保证审批流程的简单、高效,同时兼顾数据的安全性。考虑到这些要求,铁路数据内部确权方案按共享维度和安全维度将铁路数据分级分类形成数据集,并对铁路内部数据权利主体授予数据集的数据使用权。
铁路内部数据权利主体包括国铁集团各部门、各铁路局集团公司及其下属各个站段、科室等,涵盖铁路内部各个层级。铁路内部数据分级分类应先确定铁路数据的共享维度,继而确定铁路数据的安全维度形成数据集,并确定各个数据集的使用权授权策略。在确定数据共享维度的基础上,继续为铁路数据划分安全维度,既可确保铁路数据的安全,防止敏感、高敏感的数据被滥用,又可避免申请审批安全级别较低的数据而使数据获取周期延长,减少不必要的审批流程,提高铁路数据内部共享效率。
(1)共享维度。对于对整个铁路可持续运营具有重要意义,但涉及铁路相关利益,具有较高安全级别的数据,仅可以用于铁路内部,其共享维度取值为铁路内部共享,表明该数据的使用权仅可授予铁路内部数据权利主体。
(2)安全维度。对于铁路内部共享的数据,如果不存在敏感信息,可以确定其安全维度为公开,铁路内部数据权利主体均可无条件共享,此类数据集的使用权自动授予铁路内部各个层级,无需进行数据审批。如果铁路内部共享的数据安全级别较高,不得不进行审批,则确定其安全维度为敏感;如果铁路内部共享的数据内容高度敏感,涉及铁路机密,则确定其安全维度为高敏感。安全维度敏感数据集的使用需要申请审批流程,数据需求方提出申请,相关部门审批并进行必要的脱敏操作后方可授予需求方数据使用权。
2.1.2 铁路数据外部确权方案
外部开放的对象属于铁路外部范畴,对于数据的安全性要求更高,需在安全的基础上实现最大程度的数据开放,为此需要对数据集进一步细化。铁路数据外部确权方案按共享维度、安全维度、时间维度和空间维度将铁路数据分级分类形成数据集,并对铁路外部数据权利主体授予数据集的数据使用权。铁路外部数据权利主体包括铁路产业链、政府部门、高校研究院、社会公众等非铁路内部的单位机构。对于铁路外部的数据权利主体,不支持其提出数据申请,仅根据其数据需求主动开放数据集。铁路外部开放数据维度应先确定数据内容的共享维度,共享维度确定后,继而确定铁路数据的安全维度,而安全维度的取值决定是否存在时间、空间维度,通过4 个维度形成数据集,并确定各个数据集的使用权授权策略。在共享维度和安全维度的前提下,添加时间维度和空间维度便于通过调整时间和空间尺度来控制铁路数据的开放力度,确保铁路数据的安全可控。
(1)共享维度。对于可用于铁路外部的数据,其共享维度取值为铁路外部开放,表明该数据的使用权可授予铁路外部数据权利主体,铁路内部同样可以使用。
(2)安全维度。对于安全级别不高,外部使用不会损害铁路利益的数据,确定其安全维度为公开。对于安全级别相对较高,但开放给铁路外部可实现共赢的数据,设置其安全维度为敏感。对于安全级别更高,不能或无法直接开放给铁路外部的数据,设置其安全维度为高敏感。
(3)时间维度。指数据的时效性,以数据的产生时间为起点,数据的可用时间。对于存在时效性的数据,即数据刚产生时高度敏感,但当时效过期,外界使用不会造成损失,可通过设置相应的时间维度值进行铁路外部开放。
(4)空间维度。表明数据可授权的空间范围,是对铁路外部数据权利主体的细分,需划分到各个团体的各个层级,以便实现数据集精准空间开放。对于较敏感但铁路外部数据权利主体中某团体亟需的数据,可通过空间维度对铁路外部特定的空间范围开放。
综上分析,共享维度是铁路外部开放、安全维度是公开的数据集,可对铁路外部无条件开放,此类数据集的使用权自动授予铁路外部,铁路外部数据权利主体均可无条件使用,并且无需继续确定数据的时间和空间维度。共享维度是铁路外部开放、安全维度是敏感的数据集,需要进一步确定时间维度和空间维度,此类数据集仅可在时间维度所设值过期后被空间维度所设值的团体使用。共享维度是铁路外部开放、安全维度是高敏感的数据集需要进行脱敏处理,确定经脱敏后的数据是否可转化成公开或敏感数据,如果可转化为公开数据,则此类数据集按照共享维度是铁路外部开放、安全维度是公开的数据集进行处理;如果转化为敏感数据,则按照共享维度是铁路外部开放、安全维度是敏感的数据集进行处理;如果不可转化,则此类数据集不可进行使用权授权操作。
以上海动车段为例,通过分析上海动车段数据内外部共享开放需求,对铁路数据内外部确权方案进行检验。
2.2.1 数据需求
上海动车段对于其他铁路局集团公司的检修工艺流程、故障信息和成本支出信息等数据存在需求。检修工艺流程,一般是指动车段技术科下发的作业工艺文件,是整体的检修项点、流程及检修操作说明书;故障信息是指动车在运行过程中出现的各种故障;成本支出信息即动车所在检修一辆动车时所耗费的全部费用。利用此类数据便于找出自身在动车检修、故障处理、成本支出中的不足,实现自身效率的提升。
上海动车段对于跨局原始TEDS 数据也存在需求。跨局原始TEDS 数据是指本铁路局集团公司动车运行在其他铁路局集团公司铁轨上产生的TEDS数据。目前跨局TEDS 数据由其他铁路局集团公司直接上传到国铁集团,国铁集团再向相关铁路局集团公司下达故障处理单,这使得本铁路局集团公司无法及时获取原始数据,无法及时进行问题排查,了解发生故障的原因并及时对故障进行处理。
智沪铁路设备有限公司(以下简称“智沪公司”)是智奇铁路设备有限公司(以下简称“智奇公司”)与中国铁路上海局集团有限公司(以下简称“上海局集团公司”)合资创办的企业,由智奇公司控股,主要负责上海局集团公司的轮轴检修业务,包括三级修、四级修、临修的轮对检修。智沪公司属于外网,由于安全问题,其不再允许接入到内网中,导致智沪公司难以得到上海动车段/所内的各项数据,如轮对故障动态检测系统中的轮径信息。
2.2.2 维度分析
(1)共享、安全维度。检修工艺流程、故障信息和成本支出信息等数据对于优化铁路局集团公司检修流程具有重要意义,但由于涉及铁路局集团公司的相关利益,具有较高的保密性,仅可对铁路内部共享,而且数据的安全级别较高,需要有审批流程保证数据的安全。因此,确定此类数据的共享维度为铁路内部共享、安全维度为敏感而形成数据集。
跨局原始TEDS 数据由数据需求方产生,数据需求方对其理应具有使用权,且此类数据被数据需求方使用对收集数据的铁路局集团公司无损失,可在铁路内部无条件共享。此外,TEDS 数据具有时效性,当时效一过,外界使用不会造成损失,可对铁路外部开放。因此,当此类数据的共享维度为铁路内部共享时,安全维度为公开,形成数据集;当此类数据的共享维度为铁路外部开放时,安全维度为敏感,需继续确定时间、空间维度。轮径信息等数据安全级别较高,但将此类数据开放给智沪公司可实现双赢,对铁路外部特定的空间范围开放。因此,确定此类数据的共享维度为铁路外部开放、安全维度为敏感。
(2)时间、空间维度。共享维度为铁路外部开放、安全维度为敏感的数据需进一步确定时间、空间维度而形成数据集,如跨局原始TEDS 数据和轮径信息等数据。跨局原始TEDS 数据的时间维度可按照TEDS 数据的时效设定,空间维度可设为高校研究院,有助于高校研究院利用此类数据为铁路事业做贡献。轮径信息等数据的时效性不强,其安全等级不会随时间变化而产生较大变化,时间维度可设为实时,表明数据的使用权可实时授予,重点确定其空间维度为铁路产业链下的智沪公司,实现轮径信息等数据的精准空间开放。
2.2.3 确权方案应用
根据铁路数据内部确权方案的要求,共享维度为铁路内部共享、安全维度为公开的数据集无需进行数据审批,铁路内部数据权利主体可无条件使用;共享维度为铁路内部共享、安全维度为敏感的数据集可在铁路内部共享但需要申请审批流程。因此,上海动车段可无条件使用跨局原始TEDS 数据,而当需要检修工艺流程、故障信息和成本支出信息等数据时,需要提出申请,相关部门审批并进行必要的脱敏操作后方可授予上海动车段其他路局集团公司此类数据的数据使用权。
根据铁路数据外部确权方案的要求,共享维度为铁路外部开放、安全维度为敏感的数据进一步确定时间、空间维度,形成数据集,此类数据集可在时间维度所设值期过后被空间维度所设值的团体使用。因此,当跨局原始TEDS 数据所设时间维度数值期过, 即可授予高校研究院此类数据的使用权,而轮径信息等数据的使用权可实时授予铁路产业链下的智沪公司。
随着数据共享日益重要,无论是铁路内部还是铁路外部,均对铁路数据开放共享提出更高的要求,而目前的开放共享应用现状已无法满足铁路内外部日益增长的数据需求,不利于实现铁路可持续健康发展。因此,在理清铁路内外部数据权利主体基础上,聚焦于铁路数据使用权,结合数据分级分类管理,对铁路内外部分别提出一套数据确权方案,为保证铁路数据安全的同时充分实现铁路数据内部共享、外部开放提供支撑,从而简化铁路内部审批流程及数据获取过程,实现铁路数据更高质量的共享与开放。