大数据视域下可视化数据信息的加密与认证研究

2017-11-20 13:09龙虎宋贵山
电脑知识与技术 2017年27期
关键词:数据信息认证加密

龙虎+宋贵山

摘要:大数据视域下,可视化数据信息的加密与认证是当前大数据应用研究领域及信息安全领域研究的热点。笔者主要从大数据可视化的过程、实现流程、可视化工具、可视化表现形式、数据可视化的数据类型和大数据可视化的数据呈现方式等综合视角出发,对大数据可视化进行了梳理,利用系统分析法、定性定量分析法和文献研究法等多种方法,对大数据视域下数据信息的加密与认证进行了分析,提出了数据信息安全结构图和数据信息安全风险图,从实际应用的角度出发,对大数据可视化数据信息的加密与认证进行研究,给出了大数据信息加密系统模型和可视化数据信息的加密解密系统图。希望该研究能为大数据信息安全领域的研究者提供借鉴和参考。

关键词:大数据可视化;数据信息;加密;认证

中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2017)27-0054-03

Abstract: Big data visualization data information encryption and authentication is the current big data applications and the hotspot in research of information security research field. The author mainly from large data visualization process, implementation process, visualization tools, visual form data type, data visualization and large data visualization of the data presentation comprehensive perspective, such as big data visualization for the comb, using system analysis method, qualitative and quantitative analysis methods such as literature research, the big data information encryption and authentication data are analyzed, and puts forward the data structure and data information security information security risk figure, from the perspective of practical application, for large data visualization data encryption and authentication information, gives a big data information encryption system model and visualize the data encryption to decrypt system diagram. Hope this research can big data reference and reference for the researchers in the field of information security.

Key words: big data visualization; data information; encryption; certification

大數据时代背景下,各种类型的数据不断涌现,海量的数据已大大超出利用传统工具处理数据的能力,如何快速处理海量数据并挖掘出数据中有价值的信息,以高效的、实时动态的、直观的方式呈现出来,是当前大数据领域研究的热点问题,数据可视化能以直观、动态和实时的将丰富的视觉效果呈现出来给用户,可有效地提升数据分析的效果和效率。数据可视化可实现对数据的在线观测和在线跟踪,利用可视化技术呈现出来的数据信息可以帮助用户快速获得有价值的信息。大数据可视化这种新的视觉表达形式是应信息社会蓬勃发展而出现的。大数据可视化数据信息在当前也面临着可视化数据信息容易造成泄露、非法使用、完整性侵害等诸多问题,针对该问题,立足大数据可视化的研究现状,研究大数据可视化数据信息的加密与认证,通过对现有的大数据可视化和信息安全技术进行梳理,从实际应用的角度出发,结合RHSP 算法对大数据可视化数据信息的加密与认证进行研究,以期为大数据可视化数据信息安全领域的研究提供借鉴。

1 大数据可视化概述

大数据是指一般的软件工具难以捕捉、管理和分析的大容量数据[1]。大数据是指海量数据,既包括结构化、半结构化数据,还包括非结构化的数据,具有种类繁多的信息价值,无法用目前的主流软件工具在一定的时间内采取、 分析处理及管理的高速海量的信息资产[2]。大数据可视化让数据变得更加直观可信,是正确理解数据信息的最好方式。数据可视化是大数据应用研究的一个重要方面,是关于数据的视觉表现形式的科学技术研究,是当前大数据应用研究的热点,大数据可视化可为用户实时在线快速的收集、筛选、分析和归纳所需要的重要信息,利用大数据可视化工具还可实现数据呈现的多维度需求。针对海量的半结构化、结构化和非结构化的数据,数据可视化的实现流程较为复杂,需要先对海量数据进行采集、分析、管理和挖掘等处理,然后再进行表现形式的设计,表现形式一般有立体的、动态的、实时的、交互的等多种,笔者认为大数据可视化指的是海量数据的可视化,一般包括结构化、非结构化和半结构化的数据,需要先对数据进行采集、分析、管理和挖掘等处理之后再对数据的表现形式进行设计,实现数据的动态化、立体化和直观化的呈现。endprint

大数据可视化与数据可视化有着本质的区别,大数据可视化的数据类型主要是针对结构化数据、半结构化数据和非结构化数据,而数据可视化的数据类型主要针对的是结构化的数据;大数据可视化的表现形式为多种形式,而数据可视化的表现形式主要为统计图表,大数据可视化的结果主要为发现数据中蕴含的规律特征;而数据可视化的结果为注重数据及其结构关系。大数据可视化的过程主要有数据的可视化、指标的可视化、数据关系的可视化、背景数据的可视化、转换成便于接受的形式、聚焦、集中或汇总展示、扫尾的处理和完美的风格化等九个方面。

大数据时代,在Hadoop以及其他的大数据技术快速发展的推动下,可视化分析工具和技术快速发展,可视化分析工具能实现多维度、全方位实时在线的呈现。大数据可视化就是利用可视化的方式将海量的、多维的、复杂的数据呈现出来,通过地理空间、时间序列和逻辑关系等不同维度,使决策者在短时间内洞见数据背后的规律与价值。大数据可视化有别于传统的数据呈现方式,能实现海量数据信息的快速呈现,是技术性、艺术性与功能性的有效结合,多样化、恰当化、精细化的呈现和交互方式,揭示了数据背后隐藏的趋势、规律和关系。

2 数据信息的加密与认证

数据信息安全是一个大的概念,数据信息安全体系一般由技术体系、组织体系和管理体系三个部分组成,数据信息的安全技术主要是通过数据信息的加密与认证来实现,加密技术能为数据信息提供机密性,加密算法是对消息的一种编码规则,该规则的编码和译码主要依赖于被称为密匙的参数,加密算法一般可分为传统密码和公匙密码两大类。Hash函数一般主要用于信息认证和信息完整性检测。为了保证信息m的完整性,及时发现信息m是否被非法篡改,可以在信息传输之前先对信息m用Hash函数变换得h(m),然后再将信息(m,h(m))传输给对方。

数据信息安全是当前研究的热点问题,数据信息一般有物理安全、网络安全、应用安全和数据安全等多个方面,物理安全主要有机房管理、设备管理、门禁管理等多种手段;网络安全主要手段是防病毒、防火墙等手段;应用层次安全主要手段是身份验证、入侵防护、流量控制、VPV、内网安全等,数据安全层次主要手段是数据防漏和数据防抵赖等。数据信息安全结构图如图1所示。

数据信息可视化是指通过交互式视觉呈现的形式来帮助用户探索和洞悉复杂数据的价值信息[3]。可视化后的信息安全问题一直以来被许多专家和学者广泛关注,因大数据环境下,数据海量化,海量的数据中还会隐含有个人的隐私信息,因此,数据信息安全风险一直存在着,数据信息安全受多方面因素的影响,如基础设施部分,基础设施部分是实现数据互联的基础,且该部分易受自然环境的影响,此外,还有数据分析与处理、数据管理、技术漏洞、数据可信度、现有法律法规、行业内自律性、个人隐私意识和黑客攻击等多个方面。数据信息安全风险结构图如下图所示。

3 大数据可视化数据信息的加密与认证

大数据信息安全是信息安全领域研究的热点问题,大数据信息安全保护与传统数据安全保护相比变得更为复杂,大数据由于数据量巨大,蕴含着大量的私人信息,个人隐私的各种行为细节均包含在其中,数据泄漏风险明显增加,在当前面临着诸多威胁,其中数据信息泄露、数据信息非法窃取利用、完整性侵害、拒绝数据服务和数据信息完整性侵害是当前最典型的安全威胁。大数据给数据的完整性、可用性和保密性帶来了诸多的挑战,利用传统的工具来进行保护已然不能奏效。大数据的特征为黑客进行非法窃听提供了更多的机会,同时,管理员的疏忽也会造成数据信息泄露,此外,黑客对大数据发起网络攻击,并进行病毒植入也是会对数据的完整性及安全性造成很大威胁。

3.1 加密技术

利用密码技术对数据信息进行加密是保证信息安全最常用的手段,加密技术一般可分为公共密匙和私用密匙以及数字摘要等,公共密匙和私用密匙主要是由Rivest、Shamir、Adlernan三个人共同研究发明的,该加密方法也可以称之为RSA编码法,主要是利用两个很大的质数相乘所产生的乘积来加密;数字摘要加密方法也可以称之为Hash编码法,该加密方法主要有Ron Rivest设计的。关于大数据信息加密技术国内外已取得了初步成果,国外方面,如Shannon对信息保密问题的诠释,Shamir提出的身份加密的概念等;国内方面,如张强教授提出建立的基于图像的DNA编码和运算理论,多种基于DNA的图像加密算法;宋怀明等提出的一种大规模数据密集型系统中的去查询优化算法,针对Shared-nothing结构下大规模数据密集型系统的查询,提出了一种有效的数据分布策略和并行处理方法;韩希先等提出的一种新的大数据上的top-k查询算法TKEP等。目前主要集中在基于现代密码体制的大数据加密技术、基于生物工程的大数据加密技术、基于属性基的大数据加密技术、基于并行计算的大数据加密技术等方面的研究。

大数据信息加密相比传统数据加密要复杂很多,大数据加密对于存储资源和计算资源要求较高,对于大数据加密处理,一般有数据采样和分而治之的两种方式,数据采样的方式主要是搜集相关的关键信息数据域,将数据规模变小,使数据处理的速度加快;分而治之的方式主要是利用分布式计算技术,对大数据信息在分布不同的计算机进行加密处理,以提高加密处理的速度。大数据可视化数据信息加密的作用是防止有用或私用化可视化数据信息被盗取,保证进过可视化后的数据信息的安全。大数据信息加密模型如下图所示。

大数据信息加密系统[4]可表示为一个五元组,即 ,其中P表示交互数据集合;C表示加密数据集合;K表示密匙集合;E表示加密函数,主要是利用设计的加密函数E和密匙k(k∈K)对交互数据p(p∈P)进行加密,得加密数据c(c∈C),即E:P?K"C,即可表示为Ek(P)=C;D表示解密函数,即利用设计的解密函数D和密匙k(k∈K)对加密数据c进行解密,得解密数据p,即D:C?K"P,简单表示为Dk(C)=P。大数据信息的特点是存储密度较大,计算强度大,需要较大规模的并行存储和处理能力,基于并行计算的大数据信息加密技术当前还处于初级研究阶段,但其超强的计算能力和迅速的处理能力在大数据信息加密已经表现出了优越的性能。大数据信息加密技术在未来会进一步与云计算、数据挖掘技术、搜索技术和数据消冗技术等结合获得快速发展,其加密的安全性会越来越好、加密速度更快、能耗更加节约、更加容易扩展、有着更好的交互性和时效性。

3.2 认证技术

大数据时代背景下,身份认证是指网络中或者信息系统中确认用户的身份的过程。身份认证又可称为身份识别,其主要目的是证实用户的真实身份与其声称的身份是否相符的过程。身份识别是在后续交互中对其标识符的一个证明过程,一般是交互协议来实现的。身份识别技术一般有基于物理形式的身份识别技术和基于密码技术两大类,基于物理形式的身份识别技术又有基于口令的识别和基于用户特征的识别等技术,口令的识别一般是要求验证方提示证明方输入口令,证明方输入后由验证方进行真伪识别,该识别技术一般容易造成口令泄露和口令猜测等弱点,很容易造成密码被盗取。基于大数据的认证技术指的是收集用户行为和设备行为数据,并对这些数据进行分析,获得用户行为和设备行为的特征,进而通过鉴别操作者行为及其设备行为来确定其身份[5]。数据可分为静态数据及动态数据,静态数据主要是指诸如报表和文档等不参与实际计算的数据,而动态数据则需要参与实际计算的数据,动态加密方面,如果加密操作为E,明文为m,加密得e,即e=E(m),m=E'(e),该加密算法是当前密码学领域研究的热点问题[6]。可视化数据信息的加密解密系统图如下图所示。

从可视化数据信息的加密解密系统图中可得出,利用Hardoop技术来对结构化、半结构化和非结构化的海量数据进行分析,采用数据可视化工具对多源多模大数据可视化数据信息进行研究,通过对大数据的可视化分析,将得到的可视化数据利用RHSP算法进行加密和认证,并建立多源多模态数据的表示和关联模型,得出以可视化数据信息为中心的计算模型和系统架构。经过大数据工具可视化后,上述的信息发送端的明文信息利用RHSP算法(Resist Hidden Subgroup Problem,即具有抗量子计算攻击新密码算法),进行加密,利用通信信道将加密后的信息进行传送,接收方接收到信息后通过解密后方可获得明文信息。

4 结束语

网络大数据时代,随着网络用户行为信息的不断增加,这类信息经过恶意收集和挖掘以及可视化,可能会导致个人隐私信息的泄露,此外,未经过处理的共享数据信息也是当前数据信息容易造成泄露的一方面,数据信息的安全性面临着巨大的风险和威胁,同时,数据信息的复杂性加深了数据加密和认证的难度,采用传统的加密算法和认证技术已很难解决安全问题,针对该难度采用RHSP算法,该算法既具有抗量子计算,又能同時满足加密与认证,该算法能很好地解决数据信息安全的问题。大数据视域下可视化数据信息的加密与认证已成为当前大数据安全领域的一个重要课题,希望该研究能为大数据信息安全研究者提供一定的参考和借鉴。

参考文献:

[1] 李军.大数据从海量到精准[M].北京:清华大学出版社,2015.

[2] 龙虎,杨晖.大数据背景下的数据分析与可视化研究[J].凯里学院学报,2016,34(3):98-102.

[3] 龙虎,李娜.大数据环境下的可视化数据信息安全研究[J].福建电脑,2016(12):53-54.

[4] 段竹.大数据基础与管理[M].北京:清华大学出版社,2016.

[5] 冯登国,等. 大数据安全与隐私保护[J].计算机学报,2014,37(1):246-258.

[6] 张小梅,龙虎,等.大数据环境下的网络信息加密与认证研究[J].凯里学院学报,2015,33(6):90-92.endprint

猜你喜欢
数据信息认证加密
一种基于熵的混沌加密小波变换水印算法
浅析数据信息在医院医疗保险管理中的应用
美国职业棒球大数据对提升中国棒球竞争力的研究
中职校园网络安全管理系统设计
如何做好成本核算工作
认证加密的研究进展
基于ECC加密的电子商务系统
基于格的公钥加密与证书基加密