大数据时代数据封存系统设计与研究

2017-10-19 05:47
计算机时代 2017年10期
关键词:网卡彩票日志

刘 瀚

(西京学院商贸技术系,陕西 西安 710123)

大数据时代数据封存系统设计与研究

刘 瀚

(西京学院商贸技术系,陕西 西安 710123)

为了克服光盘数据封存系统在大数据时代的种种局限,通过网络传输实现数据自动封存、实时封存、批量封存的功能,研发基于硬盘存储的软硬件一体化数据封存系统势在必行。文章从彩票行业的具体应用需求出发,重点围绕数据封存系统的通用性、安全性、可扩展性进行设计,并运用大规模并行处理和无共享架构等技术加以实现。给出了完整的产品解决方案,其测试产品满足了彩票行业对数据封存的苛刻要求,因此具有可行性。

数据封存;信息安全;彩票;大规模并行处理;无共享架构

0 引言

数据封存系统是基于专用硬件的为用户提供联网使用的、长期安全存储的数据存储设备。封存中的数据具有不可更改的特点,适合于需要长期保存且不允许修改和删除的数据存储应用。近年来,数据封存系统的应用领域越来越多,如彩票业、卫生医疗、公检法司、教育系统、档案信息化建设、证书存储查询等,每时每刻产生大量的重要数据,迫切需要一个有足够安全保障、高效率低成本的数据封存解决方案。以往采用的光盘刻录方式,已经无法适应需求。基于硬盘存储的数据封存系统,具有速度快、容量大、成本低,易于保存、存储介质寿命长、对保管环境无特殊要求等优势,必然成为数据封存的主流方案。

1 需求分析

财政部条法司在2012年公布了《彩票管理条例实施细则》[1],首次明确彩票销售原始数据也要封存,且保存期限自封存之日起不得少于60个月。为了保证彩民参与开奖的安全和公平,在《彩票管理条例》[2]第22条中明确规定,彩票发行机构、彩票销售机构应当确保彩票销售数据的完整、准确和安全。当期彩票销售数据封存后至开奖活动结束前,不得查阅、变更或删除。总之,国家对数据封存提出了四点具体要求,一是封存的强制性,二是即时封存,三是不得变更,四是保存期限至少5年。传统的光盘刻录已经无法满足这种需要。比如无法对即开型彩票进行即时封存,或实现成本极其高昂[3]。

为了适应大数据时代的需要,克服传统方式的种种弊端,基于硬盘存储的安全、可靠的封装系统应运而生。数据封存系统作为软硬件一体化设备应至少满足以下需求:

⑴ 无论是外部接入还是人员登录,接入系统都需要进行身份认证;

⑵ 只提供数据写入、查询,不能对数据进行修改和删除;

⑶ 系统无法感染病毒或者被入侵;

⑷ 数据网络传输过程安全与可靠;

⑸ 在性能允许的情况下,并发支持多个封存任务;

⑹ 数据存储可靠性高、容量大,介质易于更换和保存;

⑺ 提供安全可靠的系统维护方式;

⑻ 适用范围广,支持多行业多领域的广泛应用;

⑼ 性能高,配置灵活,易于扩展。

2 系统设计

安全性保障是数据封存系统的核心要求,因此系统设计首重安全性,其次兼顾通用性、可扩展性和易用性。

2.1 设计概要

⑴ 限制设备接入方式;

⑵ 外部接入须身份验证;

⑶ 只提供数据写入、追加和查询;

⑷ 支持日志查询;

⑸ 网络传输过程加密;

⑹ 提供数据完整性校验;

⑺ 数据存储加密;

⑻ 支持多任务调度和自动管理;

⑼ 支持多机数据同步;

⑽ 支持并机扩展性能;

⑾ 支持数据硬盘热插拔;

⑿ 提供数字证书管理;

⒀ 提供用于二次开发的动态链接库。

2.2 内核精简

⑴ 对文件系统进行修改,去除文件删除和修改的底层支持;

⑵ 禁用USB设备,去除对USB设备的支持,包括驱动程序;

⑶禁用PS2接口,去除对PS2的支持,包括驱动程序;⑷ 仅保留对网卡和串口设备的支持;

⑸ 禁用图形界面,仅支持字符命令行模式;

⑹ 精简操作系统的软件包,仅支持必要的外部命令;

⑺ 定制两个shell,分别是用户模式和工程模式;用户模式仅能运行几个必需的脚本,工程模式保留对系统的必要底层操作;

⑻ 对外部终端的访问记录详细的日志;

⑼ 优化操作系统做最大化精简,一次性烧入EPROM中,避免人为或病毒修改操作系统。

2.3 协议及安全

⑴ 默认提供基于Webservice协议传输数据流的API接口;

⑵ 默认提供基于FTP协议的文件传输服务;

⑶ 对网络传输协议提供SSL双向加密认证,在日志中记录外部终端的身份;

⑷ 通过对用户名和密码、license的授权,实现外部接入的身份认证;

⑸ 自带证书中心,能够为外接终端生成密钥对,终端只有安装了生成的密钥对,才能访问系统,以便识别和记录终端身份。

2.4 物理接口

⑴ 外部接口只有两个千兆网卡和一个串口,没有键盘和鼠标以及USB接口;

⑵ 终端可通过两个网卡访问系统,实际使用一个,另一个作为备份。串口支持RS232,可以通过串口登录系统的用户模式或工程模式;这两个模式均为命令模式,其中用户模式只有少数命令,包括网卡设置、日志查看等;工程模式不公开,用于厂家维护。

2.5 数据存储

⑴ 硬盘采用RAID10,提供镜像磁盘功能,在硬件层面确保数据读写的可靠性;

⑵ 对完成写入的数据文件进行MD5校验,并保存到特定文件中,用于文件完整性校验;

⑶ 在文件系统级别提供128位对称加解密,写入前加密,读取后解密。

2.6 可扩展性

⑴ 支持多种网络传输协议,除了Webservice和FTP外,可扩展支持其他协议;

⑵ 支持主备模式,一台主机可以另行配置一台或以上备机,提供更高的可靠性;

⑶ 支持多设备并机部署,能够满足高吞吐量的数据插入和查询操作。

2.7 系统运维

⑴ 通过串口的运行维护命令,实现对于系统的基本参数设置;

⑵ 对于每次的文件操作进行日志记录,使得文件和数据操作有迹可查;并且对日志记录进行加密,保证日志数据的安全性;

⑶ 对系统运行过程中的各种异常提供告警接口,提供资源告警、系统运行告警和数据异常告警。

2.8 硬件配置

定制服务器设备,电源、网卡等硬件采用双备份,机箱前后面板加锁。提供两种型号的服务器,分别提供2T和6T的存储容量。2T版本支持20000条/秒的处理能力,6T版本支持40000条/秒的处理能力。部分存储采用IO性能极高的固态硬盘,保证数据的突发读写能力。

3 实现要点

3.1 系统整体结构

如图1所示,数据保护系统由数据接入、调度中心、数据存储、数据加解密、数据应用和系统维护等部分组成。

图1 系统整体结构图

3.2 MPP技术

系统采用大规模并行处理[4]和无共享架构[5]来实现数据封存系统的可扩展性。如图2所示。

图2 系统技术架构图

如图3所示,调度中心节点负责实现:①建立与客户端的连接和管理;②数据和任务的分发;③写入、查询的解析并形成执行计划;④执行计划向存储节点的分发;⑤收集存储节点的执行结果;⑥只存储数据字典和元数据。数据存储节点负责实现:①业务数据的存储和存取;②用户查询的执行。

图3 调度中心节点和数据存储节点

封存系统采用MPP/无共享架构,有如下优势:①最易于扩展;②具有自动化的并行处理机制;③数据分布在所有并行节点上,I/O处理最优化;④所有节点并行工作,完全无共享,无I/O冲突;⑤增加节点可实现线性扩展存储容量及工作性能;⑥对用户透明。

3.3 安全性实现

安全性是数据封存系统最基本的特性,我们在以下五个级别上来实现安全性。

⑴ 硬件级别:只提供网口和串口,屏蔽其他接口方式。串口主要传输系统的配置数据信息及可信任的客户端证书;网口主要传输系统的业务数据信息;实现控制与业务相分离的模式。

⑵ 操作系统级别:安装定制的专用嵌入式系统,该系统仅支持定制的命令和操作;并且不支持键盘、鼠标、USB等接口,仅保留对网卡和串口设备的支持。

⑶ 应用级别:对网络传输提供SSL双向加密认证,日志中记录外部主机的身份。对客户端的接入及网络传输提供SSL双向加密认证,以对称密码技术和公开密码技术相结合,实现数据传输过程中的机密性、完整性和认证性。采用串口通讯方式传输并配置客户端证书。

⑷ 数据级别:为保证数据文件的完整性,对完成写入的数据文件进行多级校验,文件校验采用SHA算法。

系统同时对存储数据进行加密,采用可选的128位分组对称加密算法。数据与日志采用不同的加密方式。

⑸ 容灾级别:为了提高数据的安全性和可靠性,系统能够提供在线容灾功能。系统设计采用分布式集群架构,系统主节点采用双机冗余热备方式,数据记录节点采用分布式集群方式,支持双机备份。当硬件发生故障后,可以从另外节点进行恢复。系统支持异地分布式多级存储结构。

3.4 系统性能测试

存储容量2T版本的数据封存系统已通过性能及稳定性测试。在60Mbits/s的流量下,目前已稳定运行72小时(程序终止原因为程序升级更新)。经过性能优化后,该版本的数据封存系统目前实际处理能力为200Mbits/s,远远超过某省级彩票机构20000条/s记录处理能力的要求。

4 总结

随着大数据时代来临,政府和企、事业单位每天都有大量的原始数据需要封存。基于硬盘存储技术的数据封存系统为我们提供了一个高效率低成本的一体化解决方案。采用的操作系统定制、信息安全协议、硬盘存储及软件开发技术成熟、可靠,完美实现了系统的通用性、安全性和可扩展性。其可行性已经得到实际验证,能够适应我国大数据时代对数据封存的要求,极具推广价值。

[1]财政部,民政部,国家体育总局.彩票管理条例实施细则[Z].中华人民共和国国务院,2012.

[2]中华人民共和国国务院.彩票管理条例[Z].中华人民共和国国务院,2009.

[3]谭小地.大数据时代的光存储技术[J].红外与激光工程,2016.9.

[4]何秉姣,童小念,舒万能,喻成.并行处理技术研究[R].全国第18届计算机技术与应用(CACIS)学术会议,2007.8.

[5]赵卓峰,魏文飞,马强.基于无共享架构的海量感知数据实时处理系统[J].微电子学与计算机,2012.9.

Design and research of data archiving system in big data age

Liu Han
(Department of business technology,Xijing University,Xi'an,Shannxi 710123,China)

In order to overcome the limitations of CD data archiving system in the age of big data,it is imperative to realize the functions of automatic data archiving,real-time archiving,bulk archiving through the network transmission,to research and develop the data archiving system with hard disk storage based and hardware and software integrated.In this paper,starting from the specific requirements of lottery industry,the data archiving system is designed with the focus on the universality,security and scalability,and realized by using several technologies such as MPP (massively parallel processing)and SNA (shared-nothing architecture)etc.A complete solution is provided,and its testing products meet the stringent requirements of the lottery industry for data archiving,so it is feasible.

data archiving;information security;lottery;massively parallel processing;shared-nothing architecture

TP309

A

1006-8228(2017)10-01-04

2017-09-08

刘瀚(1969-),男,陕西西安人,硕士研究生,工程师,主要研究方向:计算机应用技术。

10.16644/j.cnki.cn33-1094/tp.2017.10.001

猜你喜欢
网卡彩票日志
在DDS 中间件上实现双冗余网卡切换的方法
一名老党员的工作日志
扶贫日志
Server 2016网卡组合模式
丢失的中奖彩票
游学日志
噜噜猪买彩票
挑战Killer网卡Realtek网游专用Dragon网卡
彩票呀,你该飞向哪
读编往来