李鹏 王明 张海洋
摘 要:本论文主要目标是讨论民航旅客敏感信息保护的解决方案,介绍了中国民航信息网络股份有限公司(本文简称:中航信)通过建设数据脱敏平台、流程体系来达到数据保护的目标,并对中航信数据脱敏系统的建设经验进行了总结。主要包括数据分类分级、敏感数据管理、数据脱敏平台、数据脱敏算法等。
关键词:民航旅客数据;数据脱敏;保密性;可用性
中图分类号:V354-39;TP393.08 文献标识码:A 文章编号:2096-4706(2019)05-0150-03
Abstract:The main purpose of this paper is to discuss the solution of sensitive information protection for civil aviation passengers. It introduces that TravelSky Technology Limited (shorter form:TravelSky)achieves the goal of data protection by building data desensitization platform and process system,and summarizes the construction experience of TravelSky data desensitization system. It mainly includes data classification ,sensitive data management,data desensitization platform,data desensitization algorithm and so on.
Keywords:civil aviation passenger data;data desensitization;confidentiality;availability
0 引 言
0.1 數据安全背景
信息安全已上升到国家安全层面。一方面,《中华人民共和国网络安全法》于2017年6月1日起施行,重在保护公民个人信息安全。另一方面,信息安全事件频发,CSDN、12306和日本航空等数据泄露事件造成了极其严重的影响。
中国民航信息网络股份有限公司(本文简称:中航信)所运营的民航商务信息系统被国务院列为八大系统之一,既包含旅客身份等敏感信息,也包含票价等商业机密信息。数据安全责任重大,数据脱敏则是保障数据安全行之有效的首选方案,通过数据脱敏还可以在保障数据安全的同时不影响正常测试、开发和数据分析工作的开展,符合数据使用需求。因此,针对本课题的研究工作十分必要。
0.2 研究现状
在银行、电信等数据敏感行业,数据脱敏工作已经广泛开展。
IBM、Oracle已有成熟的数据脱敏产品,HP提供定制解决方案,天融信等国内企业也都有成功的实施案例。
中航信运营的信息系统安全性要求非常高;Unisys主机等特殊硬件及架构没有成熟的经验可借鉴;民航业务的复杂性决定了较多的定制化要求。因此,中航信自主建设了适用于民航旅客数据脱敏的技术平台及解决方案。
1 应用前景和社会经济效益
1.1 民航领域
随着民航旅客运输量持续高增长,2018年旅客运输量6.1亿人次,同比增长10.9%,国际航协预测到2037年全球航空客运量将达到82亿人次。脱敏技术应用空间广阔。
1.2 大数据领域
数据交换、融通的需求迫切,但数据的机密性要求制约了流动性,迫切需要一种业务和技术手段保障民航大数据的安全流动。
2 建设内容
2.1 敏感数据梳理
首先,中航信系统中存在海量高维度数据、分散在数百个系统、依赖关系错综复杂,需要详细调研以确定数据脱敏范围;其次,部分数据来源于航空公司等外部系统;最后,数据的存储方式存在较大差异。
2.2 数据分类分级体系建设
为明确对业务数据的安全保护要求,首先需要对业务数据进行分类分级。数据分类分级是实施数据安全防护、确保系统信息安全的基础。
数据分类可以有多种维度,常见的分类维度有数据主题、数据形态、数据元特征、数据应用、数据部署地点、数据生成时间等。本技术标准以数据主题为主维度,数据形态为辅维度进行分类。
2.3 脱敏平台建设
数据脱敏平台是实施数据脱敏的工具平台(如图1所示),需要满足以下五点。
(1)关系型数据库、大数据、Unisys主机、文件型数据脱敏;(2)脱敏后的数据需要保持一致性、关联关系、数据格式合规性;(3)多种算法类型(如:证件、姓名、常客卡、电话等)及算法组合;(4)敏感数据的多种识别模式(智能识别)和动态脱敏;(5)其他:多线程并发;异常策略控制;性能;脱敏后数据业务可用性。
2.3.1 算法支撑
(1)业界通用原子算法。连接、哈希、截取、随机、递增、运算、替换、混淆、均化、老化(年轻化)、加密、映射等;(2)针对民航业务开发算法。结合中航信数据特征定制开发算法5大类20个子类,开发敏感数据识别规则30多种;(3)通过密钥机制保障跨平台脱敏后一致性。数据脱敏覆盖Linux、UNIX、Unisys等环境,通过批次、因子、密钥保障脱敏后数据的机密性、一致性和关联关系。为避免密钥被嗅探,只传输因子。管理员也无权访问密钥,规避人员风险(如图2所示)。
2.3.2 数据库类型支持
(1)业界常用数据库:Oracle、SQL Server、MySQL、Informix、PostgreSQL、DB2、Sybase、EDB、达梦等;(2)Unisys主机系统,自主创新开发,该系统专业性强,采用独特的文件型数据结构,缺乏数据脱敏案例和参考资料,需要根据需求自主定制开发;(3)大数据脱敏支持:同样在没有参考资料的情况下摸索开发,目前支持:GreenPlum、HDFS、HBase、HIVE、Impala等,属于技术首创;(4)文件系统支撑:文本、XML、JSON、序列化格式文件。
2.3.3 定制化功能开发(如表1所示)
2.3.4 平台自身建设
(1)分布式。为了更好发挥分布式计算的高性能和资源利用率,采用分布式架构设计。充分发挥大数据架构的优势,同时支持MapReduce和Spark;(2)自主可控。中航信作为关键基础设施的维护者,始终坚持自主可控,平台代码全部定制开发,平台数据库支持商业和开源数据库软件。
2.4 中转环境建设
为保障数据传递安全,约定:
(1)非生产环境无敏感数据;(2)非生产环境不直连生产系统。
通过中转环境存放生产数据、脱敏、脱敏后数据推送。为了保障生产与测试的安全隔离,参考完整性访问控制Biba模型,通过中航信数据摆渡系统实现物理隔离、安全高效传输。
2.5 数据脱敏标准建设
依托数据脱敏工作的成果,结合敏感数据分类定级标准,建立数据脱敏标准及数据交换标准,其内容包括:敏感数据的定级;敏感数据的分类;敏感数据脱敏的标准算法;脱敏数据交換规则等。
2.6 数据脱敏非功能要求
非功能要求:性能、可扩展、安全性等均已经过实践验证,各系统24小时内完成脱敏。
2.7 数据脱敏效果验证
为检验脱敏效果,采用技术验证和业务验证两种方式:
(1)技术验证:通过工具统计实际脱敏、未脱敏数据量,脱敏覆盖率99%以上;(2)业务验证:脱敏后数据导入业务系统,业务实测数据有效率99%以上。
3 数据脱敏工具简介
3.1 商业的专业软件
目前市场上主流的商业软件Data Masking、Optim产品等。国内厂商的脱敏工具也可满足传统数据库的脱敏需求。
3.2 ETL工具
使用ETL工具进行数据脱敏,比如:Data Integration(or Kettle)。开源脱敏工具大大降低了成本。同时,支持个性化开发。
3.3 中航信数据脱敏平台
中航信数据脱敏平台支持业界常见关系型数据库、Unisys主机和大数据脱敏,部分技术属于行业首创,同时支持国产数据库。年累计脱敏数据量达到400亿条以上。
4 全生命周期的数据脱敏工作流程
概括为:提交数据申请,数据申请审核,中转平台数据准备,数据脱敏(算法、配置、执行、验证、分发)。
5 结 论
中航信数据脱敏解决方案在以旅客服务为核心的新一代民航信息系统建设中保障敏感数据安全和数据的可用性,起草行业标准,为民航企业间数据交换提供统一标准和安全保障,有助于提高民航IT企业的协同工作效率,为数据交换奠定基础,为客户带来更多价值,为民航事业的蓬勃健康发展贡献力量。
参考文献:
[1] 宋燕妮.《网络安全法》的主要特点及施行工作 [J].中国信息安全,2017(6):63-66.
[2] 彭明田.中国民航信息系统现状及发展展望 [J].计算机工程,2005,31(S1):61-63.
[3] 陈瑜.80%大数据交易涉及个人信息 专家呼吁统一脱敏标准推行安全众筹 [EB/OL].http://www.legaldaily.com.cn/IT/content/2016-07/11/content_6722436.htm?node=69477,2016-07-11.
[4] 夏冰.网络安全法和网络安全等级保护2.0 [M].北京:电子工业出版社,2017.
[5] 李呈祥.大数据与数据脱敏 [EB/OL].https://blog.csdn.net/wgrzhuaq/article/details/51984709,2016-07-21.
[6] Wikipedia.Data masking [DB/OL].Wikipedia,2017-06-25.
[7] IBM.Dynamic Data Masking with IBM Optim [DB/OL].www.IBM.com,2017-06-25.
[8] Net 2000 Ltd.“Data Masking:What You Need to Know” [Z].A Net 2000 Ltd. White Paper,Retrieved 2017.
作者简介:李鹏(1979-),男,汉族,北京人,部门经理,高级职称,从事软件测试工作超过10年,硕士,研究方向:信息安全、测试管理;王明(1981-),男,汉族,北京人,高级测试管理工程师,工程师,本科,研究方向:数据安全、安全开发、自动化安全测试、渗透测试;张海洋(1985-),男,汉族,河北保定人,测试管理工程师,工程师,本科,研究方向:数据安全、源代码安全、黑盒安全测试、渗透测试。