付维维
摘 要:随着各地数据中心建设、云计算技术的发展,各数据中心协作日趋频繁,异地多源数据共享成为必然趋势。传统的数据共享方式主要基于统一的数据中心,然而这种模式未能充分考虑各异地数据中心权限管控、安全性等因素,使得异地多源数据共享仍然困难重重。本文提出了一种基于总线结构的异地多源数据共享应用模型,各数据中心只需将共享交换的数据副本上传至总线,通过统一的权限管控,以期为异地多源数据共享提供支持。相对传统的数据共享模型,该模型灵活的权限管控既可以较好地保障数据安全又能防止利益冲突造成的信息壁垒,同时又可以大大降低共享的资金、人力和时间成本。
关键词:异地多源数据;总线结构;数据共享;数据副本;权限管控
Research on theApplication Modelof the Multi-Source Data Replica AuthorityControl
Abstract:With the development of data centers and the development of cloud computing technologies in various places, the cooperation of data centers has become more and more frequent, and multi-source data sharing in different places has become an inevitable trend.The traditional data sharing methodsare mainly based on a unified data center. However, these models fail to fully consider the control and security of data centers in different places, and other factors, making multi-source data sharing in different places still difficult.This paper proposed a multi-source data sharing application model based on bus structure. Each data center only needs to upload a copy of the shared exchange data to the bus, and through unified authority control, in order to provide support for multi-source data sharing in different places.Compared with the traditional data sharing model, the flexible privilege management of the model can better protect data security and prevent information barriers caused by conflicts of interest, and at the same time greatly reduce the shared capital, labor and time costs.
Key words:Different place Multi-Source Data;bus structure;data sharing;data replica;authority control
1 引言
随着各地数据中心建设、云计算技术的发展,各数据中心的协作日趋频繁,根据业务需求产生了大量的数据交换。然而随着互联网、物联网、人工智能等新兴技术的高速发展,各地数据中心的数据量激增,同时业务需求的多样化导致各数据中心间数据交换需要大量的时间成本,因此异地多源数据共享成为一种必然趋势。异地多源数据共享具有重要的作用和意义,一方面,它可以促进异地数据中心数据管理的科学、高效,促使有效数据应用的形成; 另一方面,它可以解决当前异地数据中心多源数据共享存在的诸多问题。
当前的异地数据中心多源数据共享主要面临着三大难题: 其一,各数据中心形成信息壁垒。由于管理体制问题,各数据中心间相互独立,形成信息壁垒。这使得数据中心存在重复建设的想象,严重浪费人力、物力、财力,同时也使得大量数据资源难以共享开发,其真正价值难以得到充分发挥[1-2]。其二,各数据中心缺乏统一的标准体系。各数据中心的数据库缺乏标准体系的支撑,数据格式、元数据标准不一致,采用的处理技术各不相同,数据接口也不互通,数据共享困难[3]。最后,缺乏统一的权限管控。各数据中心数据或多或少涉及公民隐私和业务秘密,如果在共享交换过程中缺乏统一的权限管控,将会带来严重后果。
本文提出了一种基于总线结构的异地多源数据共享应用模型,该模型主要从共享的数据副本权限管控方面支撑实现异地多源数据的共享。相较传统模型,该模型具有多数据中心互联互通、权限自主管控、物理上分散、逻辑上统一等特点,既可以保障数据安全和各數据中心利益,又有利于异地多源数据共享的推进,同时还可以大大降低实施资金、人力和时间成本。
2 基于总线结构的异地多源数据共享
当前研究主要基于统一的数据中心实现数据共享,但各数据中心出于数据安全性的考虑,异地数据中心多源数据共享积极性不高,因此亟需提出一种新的共享方式。总线结构具有全员互联互通、权限管控、物理上分散、逻辑上统一等特点,为解决上述异地多源数据共享的问题提供了很好的思路,因此本文基于总线结构提出了一种新型的异地多源数据共享模型。
2.1 异地多源数据共享模型
基于总线结构实现异地多源数据共享的基本思想是各数据中心基于统一的数据标准体系,将需要共享交换的数据副本通过标准化的接口上传至服务总线,并通过统一的权限管控,识别用户身份,控制访问权限,实行三员分立,从而形成一种逻辑上统一、物理上分散的总线结构。如图1所示:逻辑上统一体现在异地数据中心基于统一的数据标准体系,通过统一的接口标准进行数据副本交换共享,异地数据中心之间不再孤立,而是通过统一的标准体系联系在一起,形成逻辑上统一的整体; 而物理上分散体现在异地多源数据只储存在该数据中心的数据库中,因此物理上各数据中心是分散的。综上,基于总线结构异地多源数据共享的核心是一套统一标准体系和统一的总线共享数据副本权限管理体系。
3 数据副本权限管控体系
3.1数据副本管理
数据副本管理(Copy Data Management,CDM):是从生产环境通过快照技术获取有应用一致性保证的数据,在非生产存储上生成“黄金副本”(Golden Image),这个“黄金副本”数据格式是原始的磁盘格式,可再虚拟化成多个副本直接挂载给服务器,分别用于备份恢复、容灾或开发测试[4]。在异地多源数据共享场景中,数据副本则主要用于数据的共享交换,根据业务需求,只需将共享的数据副本上传至总线。此时,数据副本的权限管控显得尤为重要,不仅需要有效满足各共享数据业务需求,同时还要保证各数据源的安全,防止数据泄漏。
3.2权限管控体系
各异地数据中心的数据不可避免会涉及到大量的公众隐私和业务秘密,对上传至总线的数据副本需要实行严格的权限管控。包括三员分立管理、统一身份认证、角色权限控制等。
3.2.1三员分立管理
总线服务采用基于角色的权限控制模型,禁止超级特权用户,实现三员(系统管理员、审计管理员、安全管理员)分立管理。
异地多源数据共享平台系统将数据副本资源与操作相结合形成相应的授权策略,并将授权策略授权给角色,建立三种类型的角色;将角色分配给相应的用戶,实现用户对数据副本资源的权限控制与分配。对资源的操作分为管理和使用两种方式,实现对系统资源管理和使用的权限分离。结合以上三类管理员的模式,将共享平台系统的数据副本资源使用和管理进行分离且三类管理员的行为进行相互制约,如图2所示。
安全管理员:负责对共享平台系统中系统管理员的创建及资源权限的分配,安全管理员自身不具备对资源使用的权限;安全管理员对资源权限的分配是根据管理员的安全域进行限制,安全管理员不能为自身分配权限。
系统管理员:由安全管理员创建、维护,系统管理员只能对共享平台系统的数据副本资源拥有使用的权限,不具备相应的管理权限;其使用资源的权限范围由安全管理员分配。
审计管理员:负责对系统安全管理员及系统管理员的行为进行审计,并对共享平台系统数据副本资源的运行状态进行监控,不能使用共享平台系统资源,也不能对共享平台系统资源进行分配和管理。
3.2.2统一身份认证
本文选取依托身份认证服务体系,采用身份认证载体与用户岗位绑定的方式进行统一身份认证,实现用户依授权访问,为安全事件的跟踪审计提供依据。
1)用户管理
由系统管理员统一生成用户的身份标识符,采用基于数字证书和USBKey进行身份认证并确保身份标识符在系统生命周期中的唯一性;对系统内的身份标识符加强管理、维护,确保身份标识符列表不被非授权地访问、修改或删除;用户标识符与安全审计相关联,保证系统内安全事件的可核查性。
2)用户认证
用户登录时采用用户名/口令+数字证书的方式进行,用户登录时,首先输入系统用户名及口令然后输入数字证书保护密码,然后由密码设备校验用户的数字证书,如果通过,则用户是合法用户,否则认证失败,采用双因子认证提供系统的安全性。
3)日志审计
针对登录异地多源数据共享平台的用户,建立跟踪用户在系统的共享数据副本操作行为,当数据副本出现问题时可提供一个数据修改记录的追溯手段。对证书用户的访问记录进行敏感访问记录,对证书用户的业务操作进行不可抵赖的日志记录。对日志进行制度性地审核,确保安全事件及时发现制止。
3.2.3角色权限控制
用户权限管理的主要目的就是保证系统的安全,而在信息系统中,基于用户行为对用户访问进行控制是保证系统安全的主要措施之一[5]。当前主要有3种访问控制策略: 自主访问控制( DAC: Discretionary Access Control )、强制访问控制( MAC: Mandatory Access Control) 和基于角色的访问控制( RBAC: Role-Based Access Control) 。
前两种访问控制方式在授权时需要对每对主体与客体制定访问许可,当主体和客体的数量非常大时,授权工作会很困难。而基于角色的访问控制是将单个主体的权限转换为角色的权限,通过给用户分配不同的角色,达到赋予用户不同权限的目的[6]。这种方式大大降低了系统的复杂度,同时体现了系统的组织结构,简洁并具有灵活性。因此,本文选取该种方式对用户进行访问控制。比如同一个数据副本,有的用户可以查阅下载,有的用户可以删除修改,而有的用户则不能做此操作。
4 结语
由于信息壁垒和安全性问题,各地数据中心大量的数据资源无法得到有效利用,为了更好地促进信息化发展,异地多源数据共享是一个必然的趋势。然而,传统的数据共享大都基于统一的大数据中心实现,这种方式主要存在三方面问题: 一是共享成本比较高,包括搭建共享平台的资金成本和集成各数据中心的多源数据并标准化的时间和人力成本; 二是数据安全难以保障,共享平台中庞大的数据量为数据安全保障工作带来了很大困难;三是需要考虑数据一致性问题,需定期进行数据维护。
为解决上述问题,本文提出了一种基于总线结构的异地多源数据共享应用模型,该模型的基本思想是: 各数据中心基于统一的数据标准体系通过标准化接口实现异地数据中心的互联互通; 数据共享时,各数据中心只需将用于共享交换的数据副本上传至服务总线,同时对总线上的数据副本进行统一的权限管控,包三员分立管理、括统一身份认证、角色访问控制。相较传统的大数据中心共享方式,该模型通过物理上分散、逻辑上统一的总线结构,既用较少的成本实现了各地数据中心的互联互通,又通过数据副本权限管控很好地保障了各地数据中心的数据安全,此外还无需考虑数据一致性问题,大大减轻了数据维护工作,可行性更强。
参考文献
[1] 董凌峰,李永忠. 基于云计算的政务数据信息共享平台构建研 究———以“数字福建”为例 [J]. 现代情报,2015,35 ( 10) : 76-81.
[2] 邓念国. 政务大数据共享难题如何破解? [J]. 大数据时代,2017,( 3) : 22-25.
[3] 唐长乐,王春迎. 基于政务云数据中心的政府数据开放共享服 务集成平台研究 [J]. 情报资料工作,2017,( 5) : 13-19.
[4]Pushan Rinnen,Garth Landers. Innovation Insight: Copy Data Management Accelerates Bimodal IT. Gartner.com, 2016.
[5] Ping N,Liao J,Wang C,et al. Web Information Recommenda- tion Based on User Behaviors [P]. Computer Science and Informa- tion Engineering,2009 WRI World Congress on,2009.
[6] 唐成华,陈新度,陈新. 管理信息系统中多用户权限管理的 研究及实现 [J]. 计算机应用研究,2004,( 3) : 217-219.