王明哲,金久强,李 健,李 锋,席 宁
(1.中国铁道科学研究院集团有限公司 电子计算技术研究所,北京 100081;2.中国铁路网络有限公司,北京 100038)
随着移动设备、智能终端、传感器等网络设备和通信技术在铁路客票发售与旅客出行服务方面的广泛应用,在铁路企业运营的基础网络平台、运营支撑系统以及各类业务平台中蕴含着海量的用户数据,铁路旅客数据的种类和规模正在迅速增长,铁路科研人员将旅客大数据与行业内部现有的计算机技术相结合,从结构、半结构及非结构化的旅客数据中获得有价值的信息。旅客大数据包含了丰富的、有价值的个人信息,如果对这些敏感信息处理不当,不仅会导致个人隐私和企业机密的泄露,损害用户利益,还会给铁路运营企业自身带来一系列的社会责任和法律风险问题。因此,在旅客数据安全、隐私保护方面,需要研究一套行之有效的数据运营方案来确保旅客数据安全,规避隐私泄露所带来的社会不良影响和法律风险。
在全球化开源社区、互联网企业中的先行者等共同推动下,大数据技术已日渐成熟。面向铁路运营企业内部,可以通过分析用户的出行行为偏好,推出类似面向特定内容的、有针对性的旅客服务,在提升铁路运营水平的同时,为旅客提供智能化、便捷化的多元服务;面向铁路运营企业外部,可以对铁路旅客数据进行脱敏处理、包装,形成有市场的数据产品。铁路科研人员积极探索铁路旅客大数据对内、对外应用的同时,应注意大数据在广泛应用的同时也存在着一系列的问题,例如个人数据信息的知情权、选择权、支配权、索赔权[1]以及数据安全和个人隐私保护等。
当前,数据信息已成为了一种极为重要的原材料,甚至可以直接转化为经济效益,对于企业和个人而言,数据的采纳和收集都极为重要[2],数据主体与数据控制者权益需实现平衡。在个人资料的收集、保管、使用等环节中,法律应该明确资料所有人的各种权利[3],通过建立如通知同意、授权协议等规则及路径,更好地依法依规,在铁路营运服务中合理确定数据主体并合法收集、利用个人数据。
铁路企业需明确铁路旅客数据使用流程和规范,在维护广大旅客群众利益、社会稳定、国家安全的基础上,建立一套行之有效的铁路旅客信息数据保护和应用流程体系,为进一步完善智能铁路系统工程建设打下坚实的基础。
目前,客票系统在全路拥有2个铁路总公司级中心、18个铁路局级中心,售票窗口3万余个,自动售/取票机1万余台,电话订票接入线数11万条,互联网注册用户超过3亿人,全路日均售票量超过900万张,峰值售票量已超1 300万张/日,其中,12306互联网售票系统(简称:12306)售票量峰值超过1 100万张/日,占全渠道售票量70%以上[4]。从以上数据可以看出,在铁路企业运营的基础网络平台、运营支撑系统以及各类业务平台中蕴含着海量的用户数据。
目前,除铁路部门12306售票平台之外,还存在很多外部订票平台,这些外部订票平台向旅客提供包括高铁票务、酒店预订、出行服务等捆绑服务,代替旅客在12306售票平台订票,所以要求旅客提供真实信息。但由于这类外部订票平台缺乏在信息安全方面的投入及在内部数据安全管理方面的严格规定,存在很大的个人信息安全隐患,如黑客攻击、内部人员泄露等,因此,在旅客数据安全隐私保护方面,铁路部门急需有效的安全应用来确保旅客数据安全,同时避免个人数据泄露的事件发生。
从各国(地区)的立法来看,大多数国家(地区)的立法通常都以数据的“身份可识别性”作为判断是否属于个人数据的标准。比如我国《网络安全法》第76 条、欧盟《通用数据保护条例》第4 条、台湾《个人资料保护法》第2 条等大多数国家和地区的法律都将直接与间接可以识别个人身份的数据认定为个人数据[5],我们通过研究,基于旅客大数据设计“中铁客户码”概念应用,采用“虚外实内”的方法,即旅客真实身份信息只留存在12306平台,以虚拟代码作为旅客身份的统一标识登录外部订票平台,旅客用户可自主选择在12306平台申请“中铁客户码”,申请后就不需要在外部订票平台填写真实身份信息,只需通过手机号发送验证码,通过外部订票系统向12306后台传递,由12306后台随机生成“中铁客户码”返给客户即可确认。通过提供以“中铁客户码”为客户统一识别方式的订票机制,解决目前各互联网外部订票平台在客户隐私数据信息保护方面的问题,“中铁客户码”在提升个人数据信息安全保护的同时,又能为公众订票出行提供便利。旅客使用“中铁客户码”的同时,在网上签订个人信息采集授权电子合同,授权旅客个人数据的采集权及使用权。
铁路旅客大数据应用通过对海量旅客数据的分析和挖掘,使大量的数据转化为多种具有价值的信息,进而实现产品化和价值创造,为政府决策、行业发展、民生服务提供帮助。在铁路旅客大数据创新应用方面,铁路运营企业未来需在以下几个层面开展研究工作。
为了更好地利用第三方大数据公司在应用领域上的成功经验,同时确保旅客隐私信息的安全性,建议通过与各大数据应用领域处于领军地位的第三方大数据公司合作,建立实验室,开展数据加工、分析及建模,研究并实现包括数据失真技术、数据加密技术和匿名化限制发布技术等的应用,打造相关数据创新产品,提供一系列应用及服务。
制定科学的合作伙伴进入和退出机制,是数据安全应用需要解决的关键问题之一。以核心能力为评判标准的筛选体系完善和提升管理水平,例如,通过对企业征信牌照、个人征信资质和综合建模能力等方面进行评判,进而筛选出有资质的合作伙伴。
制定相应的数据应用合规机制,从数据采集合法性、数据安全合规性、数据输出合规性3个方面进行设计,例如,在数据采集合法性中要求旅客信息采集需与旅客之间签定采集及使用授权电子合同;在数据安全合规性中要求需按照国务院征信业监督管理部门的规定,建立健全和严格执行保障信息安全的规章制度,并采取有效技术措施保障信息安全;在数据输出合规性中要求向客户输出旅客脱敏数据:如信用评分、乘车频率和消费能力等。
铁路旅客数据主要包括用户基本信息、登录位置信息、交流活动信息、社交网络信息、商业交易信息、其他应用信息等。铁路旅客大数据应用可基于现有铁路旅客出行信息以及平台汇集的旅客周边数据等建立客户画像,通过画像,根据不同行业应用需求,分析其支付能力、客户特征等,进而为银行做精准营销和信贷分析,为互联网行业提供商品推荐和针对性广告投放服务等。
需要从制度、人员和设施3方面开展数据安全和保密工作,加强铁路旅客关键隐私信息基础设施安全保护,增强数据安全预警和溯源能力。技术保障相应管理措施主要包括数据落地配套机房安装严格门禁设施、重要数据访问要求多人同时授权、核心数据管理人员要求在北京有房产等。
铁路旅客大数据应用要加强政策、监管、法律的统筹协调,法律和行业规范的制定与实施应该和技术保持同步[6]。制定铁路旅客大数据资源专业加工、建模分析、应用服务相关制度,完善数据隐私保护制度和技术。同时要加大对技术专利、应用产品及个人隐私等的保护力度,在维护广大旅客利益、社会稳定、国家安全的基础之上,建立一套规范有效的铁路旅客数据信息保护和应用流程体系,为进一步完善智能铁路系统工程建设打下坚实的基础。
结合国家政策,形成高可行性、标准化的铁路旅客隐私数据信息保护和使用规范标准。旅客数据的采集、处理、存储、分析、建模等环节应集成在一套内部整体系统中,建议在现有12306基础上升级,或并行建立一个集标准化、工厂化数据采集、清洗、存储、分析、建模等一体的“一站式”旅客大数据应用开发系统,在铁路旅客大数据应用开发及使用过程中,通过对铁路旅客主体行为数据全自动、全天候的挖掘、分析与建模,以及实时的跟踪监测,既能实现信息采集、隐私信息安全加密、数据运用、分析计算、应用结果的高度客观性、智能性和高效性,同时也能做到数据不出门,最大程度地确保旅客隐私数据信息安全。
12306 通过授权确认后,铁路旅客购票行为及相关身份信息在客户端形成记录,通过安全接口将数据传递到“一站式”旅客大数据应用开发系统的采集终端,并依据预先设定的数据关系,将旅客数据自动保存到数据库中。整合传输过程由系统自动完成,整个采集过程中没有人为参与,确保旅客个人隐私信息的安全性[7]。
根据不同业务需求,需要对采集的不合规数据、内容错误数据、格式错误数据、残缺数据和重复数据等进行过滤和标准化。将采集的旅客信息比对处理后入库到“核心旅客数据存储区”,整个环节由系统自动完成,避免人工操作,防止数据泄露。如有未比对上的数据需单独存储,通过手工比对后重新入库,数据工作人员须签订数据安全协议,全部操作都在内网环境及“一站式”旅客大数据应用开发系统上执行。
旅客数据的传播和共享需在闭环条件下操作,参与数据使用的技术人员需要签订数据安全协议,对于核心数据管理人员,还需满足其它特定条件,全部操作都在内网环境及“一站式”旅客大数据应用开发系统上执行。在与第三方用户机构的业务合作过程中,签订个人数据保密协议的同时,最好是根据客户业务需求在“一站式”旅客大数据应用开发系统进行内部建模,测试结果经用户确认后,最终向用户机构提供处理后的结果。
在旅客大数据深化利用的过程中,旅客数据安全和保护个人隐私是旅客大数据应用的前提,建立“中铁客户码”及“一站式”旅客大数据应用开发系统,有助于铁路运营企业积极稳妥提升铁路旅客大数据应用服务能力,避免探索创新过程中可能遇到的舆论和法律风险。下一步,将在动态数据的利用和敏感信息保护等方面进行更深入的理论研究和实践探索。