王康?王晓慧
摘 要 论文以数据安全相关文献为研究对象,选取CNKI核心期刊库和CSSCI期刊库为数据来源,利用Excel描述论文的年代分布和学科分布,同时利用Bibexcel、Ucinet和CiteSpace可视化软件对高频关键词进行分析。结果表明:数据安全研究热点主要集中于云计算、云存储、隐私保护、大数据、网络安全和图书馆领域,其中研究前沿包括大数据、隐私保护、Hadoop架构、敏感数据、属性加密、代理重加密、数据存储与数据共享研究。
关键词 数据安全 云计算 大数据 可视化分析
分类号 TP309.2
DOI 10.16810/j.cnki.1672-514X.2018.09.019
Abstract Taking relevant study achievements on data security as the research object,selecting the CNKI core journals and CSSCI journals as the data source, and using Excel to describe the distribution and discipline distribution of papers.And using Bibexcel, Ucinet and CiteSpace software to analyze the high frequency keywords. The results show that the hot spots of study on data security include cloud computing, cloud storage, privacy protection, big data, network security,libraries and so on,and the research fronts include big data, privacy protection, Hadoop architecture, sensitive data, attribute encryption, proxy re-encryption, data storage and data sharing.
Keywords Data security. Cloud computing. Big data. Visual analysis.
大数据、云计算和互联网的快速发展带来的数据安全问题日趋严重,数据泄露将会给政府、企业和个人带来极大的危害。如何在利用新技术的同时保护隐私数据和防止敏感数据的泄露是亟待解决的问题,籍此我国学者对数据安全做了大量的研究。本文选取中国知网(CNKI) 核心期刊库和CSSCI期刊库作为文献的统计来源,以题名OR关键词为检索字段,“数据安全”为检索词对所有学科领域进行精确检索,时间限定为2006—2017年。进行数据清理,剔除通知、简讯、报道和无关键词字段等不符合要求的文献,得到相关文献874篇,检索时间为2017年4月1日。本文利用文献处理工具Excel、Bibexcel、Ucinet和CiteSpace对相关文献进行统计并绘制图表,然后利用定性的方法对可视化图表进行分析,探究和评价国内数据安全研究现状与趋势,以期为后续研究提供参考。
1 国内数据安全研究热点概述
2006-2017年间有关数据安全研究的文献经过统计,可以认为文献量总体趋势呈逐年增加的态势,其中2016年增加幅度比其它年份大。由此说明,数据安全意识有所增强,数据安全问题逐渐受到重视。
数据安全研究在诸多学科领域均有涉及,其中计算机与互联网技术是数据安全中的主要学科阵地,其次是电信技术、图书情报与档案管理、自动化技术、电力工业、自然地理学、测绘学和贸易经济等学科,形成了一种多元化研究的态势。随着大数据、云计算和物联网等新一代信息技术的发展,数据安全在计算机、互联网、自动化等领域的关注度有望继续升温。本文以高频关键词为基础,采用社会网络分析和中心性分析两种方法,从不同角度进行相互验证以确定该领域的研究热点。
1.1 社会网络分析提取研究热点
利用Bibexcel作出高频关键词共现矩阵,然后将数据安全、安全、安全性等概括性关键词剔除,利用Ucinet对高频关键词进行聚类分析,如图1所示,其中矩形越大代表关键词出现的频率越高,线条代表关键词之间的联系。社会网络分析结果显示位于网络中心位置的云计算、云存储、大数据、物联网、隐私保护、网络安全、图书馆是数据安全研究领域热点问题。
1.2 中心性分析提取研究热点
中心性是测量个体处于网络中的地位,个体越是处于网络中的中心位置,其影响力越大,分为三种形式:点度中心性、接近中心性和中间中心性。点度中心性可以用网络中与该点有直接联系的点的数目来衡量[1],数目越多越是网络的核心,拥有的“权利”越大。接近中心性反映一个节点不受其他节点控制的程度[2],是指一个节点与其它所有节点的距离之和,这個距离越小说明越是网络的核心。中间中心性是指一个节点若处于许多其他两点之间的路径上,可以认为该节点居于重要地位,因为它具有控制其他两个节点之间联系的能力[3]。
利用Ucinet对关键词进行中心性分析得到高频关键词的点度中心性、接近中心性和中间中心性,如表1所示,从表1中可知以三种不同的角度对关键词的中心性进行分析,最终得出的结果基本相同,即数据安全相关研究主要集中在云计算与云存储、隐私保护、大数据、图书馆、网络安全等方面。
综上,通过社会网络分析方法和中心性分析方法对数据安全的研究热点进行提取,最终得出的研究热点基本相同,从而有效印证了每种方法的可靠性。通过综合考量提取出的研究热点,最终概括出国内数据安全研究的主要热点领域
2 云计算、云存储与数据安全
随着云计算与云存储技术的快速发展,越来越多的企业和个人选择利用云存储来保存和备份数据。用户对云存储数据的安全性十分关切。数据加密是确保数据安全的有效方法之一,但在云存储中传统的数据加密将使数据的检索运算异常困难,此外,云存储在数据隔离、数据迁移、数据残留和数据安全审计方面面临的挑战依然严峻。目前,密文访问控制、加密存储和完整性审计三个方面是云存储针对数据安全的重点研究方面。李晖[4]认为需要综合采用加密机制、密文搜索、完整性审计机制以及安全数据删除等技术保护数据。胡光永[5]提出一种新的加密、解密方案,用以保护云存储过程中的数据,防止数据泄漏。此外,在法律制度方面齐爱民,祝高峰[6]以云存储的特征、架构模式、数据安全危机为基础构建了云存储数据安全的法律保护制度。
3 大数据与数据安全
大数据技术具有大量、多样、高价值和高速等特点,其更加注重事物整体性和事物之间的关联性。大数据技术在提升数据价值的同时,数据安全问题也伴随而来。目前,传统的数据安全保护技术和政策已无法满足大数据环境下的数据安全问题,甚至成为大数据发展的瓶颈。大数据时代实时在线计算、海量数据访问、实时的数据流动、频繁的数据流转和交换利用等业务和技术需要新的安全防护方案给予支撑。因此,在新的环境下要做到政策和技术的同步发展完善。首先,对目前存在的数据保护法律政策进一步完善,同时针对大数据应用制定细化和针对性的指引,明确哪些数据未经授权不得私自采集,采集的哪些数据属于敏感数据,哪些非敏感数据通过二次或三次组合有可能成为敏感数据以及私自泄露敏感数据如何惩罚等问题;其次,要重视大数据标准化工作,建立相关采集、处理、分析和发布标准,使数据脱敏、清洗规范化,防止数据泄露;最后,需要加快研发数据安全保护技术,数据处理的每一步都存在数据泄露问题,政府和企业要不断提高自身技术水平,提高自身承受非法入侵的能力,加强数据加密技术和访问权限等防护措施。
4 隐私保护与网络安全
互联网的快速发展给人们的生活带来了极大的便捷。与此同时,网络也成为数据泄露的重灾区,互联网安全已成为公众关注的焦点。目前,各电商网站、门户网站、手机APP等对个人数据的收集轻而易举,若其遭受黑客攻击,数据安全将难以得到保证,如大麦网、俄罗斯约会网站和益百利公司都曾发生过数据泄露事件。网络安全已严重影响到人们的生活,补天平台统计显示,2015年由于网站漏洞的存在,可能或已造成55.3亿条个人信息的泄露。如何有效保护隐私是亟待解决的问题,政府应进一步完善相关法律,企业应积极研发数据保护技术,公众应该提高隐私保护意识,尽量避免敏感信息的泄露。
同时,网络安全也事关国家安全。目前我国不论个人还是机构使用的电脑、操纵系统大部分还是采用美国的核心技术,给我国的网络安全留下了重大隐患。随着大数据技术的应用,我国各个领域的海量数据流向美国,美国利用先进技术对我国的政治、经济和社会的最新情况进行分析,有可能给我国造成严重的灾难。国家应鼓励研发国产操作系统,政府等对信息安全要求高的机构应带头使用国产操作系统。
无论是从个人角度还是国家层面都必须重视网络安全问题,迫切需要建立健全网络安全法律体系,增强网络安全意识,同时对危害网络安全的行为进行相应的处罚。
5 图书馆与数据安全
数据安全是图书馆服务用户与稳定发展的基础。随着互联网的快速发展,图书馆面临的数据安全、知识产权和用户个人隐私问题日益突出。随着新一代信息技术的发展,图书馆广泛利用大数据、云计算技术进行自身数据的保护。金志敏[7]研究了云计算下的高校图书馆数据安全策略。张凌云[8]以天津图书馆为例,研究和探讨了连续数据保护技术在数据安全保护中所起的作用。马晓亭,梁俊荣[9]设计了敏感大数据保护系统,用以防护图书馆敏感数据的泄露。
此外,图书馆在统一身份认证、严格控制访问权限、加快信息安全基础设施建设、制定相关标准及政策法规等方面也进行了相关研究。
6 国内数据安全研究热点变化分析
关键词是一篇文献主题的最精炼表达,因此可以通过关键词的变化来研究主题的变化。利用Citespace5.0软件做出数据安全的主题演化图谱(见图2)。
从图2可知,2006年出现的“数据安全”“网络安全”和“信息安全”字体较大,且与后续出现的关键词联系紧密,说明数据安全研究是以“网络安全”和“信息安全”为主要研究对象。随着时间推移,该领域的研究对象正在发生变化,依次出现了以“隐私保护”“云计算”“云存储”“物联网”和“大数据”为主的研究对象。
关键词的数量及增长情况能够有效反映各学术领域的发展及热点前沿问题[10]。为了探究数据安全研究前沿,利用Citespace5.0软件自带的膨胀词探测技术及算法进行突现词(某一时间段内突然大量出现的词)的探测,如表2所示,较单独计算关键词出现频次的高低确定研究前沿更具可靠性。由表2可知突现度最大的关键词是大数据,说明大数据是目前数据安全中研究的前沿,此外该领域研究的前沿还涉及隐私保护、Hadoop架构、敏感数据、数据加密、数据存储与数据共享。
大数据技术的快速发展给各行各业带来了巨大的价值,Hadoop是较为流行的开源大数据处理平台,其为大数据处理和分析提供了创新性和低成本基础架构,然而在大数据存储、分析、开放和共享过程中数据安全存在着一定的隐患,个人隐私与敏感数据的保护成为关注的重点。如何在利用新技术的同时防止数据泄露是亟待解决的问题。今后应加强数据安全策略的研究,政府应该在旧法规的基础上制定与大数据相适应的新法规,以数据安全体系建设为核心,加快数据立法的顶层设计,制定数据开放的行动计划,重视个人数据隐私权保护,而企业在市场竞争中更应研发新技术对数据安全程度进行有效监测,防止企业关键技术数据泄露。
参考文献:
张世怡,刘春茂.中文网站社会网络分析方法的实证研究[J].情报科学,2011,29(2):246-252.
陈远,李韫慧,张敏.基于节点度测度SNS用户信息传播贡献的实证研究:以腾讯微博为例[J].情报杂志,2014,33(10):159-164.
王卫,吴丹,潘京华.国内外博弈论研究的计量分析[J].图书情报工作,2013(S2)228-232,223.
李晖,孙文海,李凤华,等.公共云存储服务数据安全及隐私保护技术综述[J].计算机研究与发展,2014,51(7):1397-1409.
胡光永.基于云计算的数据安全存储策略研究[J].计算机测量与控制,2011,19(10):2539-2541.
齐爱民,祝高峰.论云存儲中数据安全的法律保护[J].重庆大学学报(社会科学版),2017,23(1):101-108.
金志敏.基于云计算下的高校图书馆数据安全策略的探讨[J].计算机安全,2011(6):96-99.
张凌云.略论连续数据保护技术为图书馆数据安全护航:以天津图书馆为例[J].图书馆工作与研究,2013(11):44-47.
马晓亭,梁俊荣.大数据环境下图书馆敏感数据保护方法研究[J].图书馆学研究,2016(21):50-55.
陈美家,于海洋,张婉滢,等.我国OA期刊研究的可视化分析[J].图书情报工作,2011,55(22):133-137.
王 康 辽宁师范大学管理学院2016级硕士研究生。 辽宁大连, 116029。
王晓慧 辽宁师范大学管理学院副教授、系主任。 辽宁大连, 116029。
(收稿日期:2017-05-04 编校:刘 明,陈安琪)