基于信息生命周期视角下的大数据隐私风险管理框架的分析

2018-10-19 03:52邓青菁付达杰邱蒙雯
软件 2018年9期
关键词:生命周期框架风险管理

邓青菁,付达杰,邱蒙雯



基于信息生命周期视角下的大数据隐私风险管理框架的分析

邓青菁1,2,付达杰2,邱蒙雯1

(1. 江西财经职业学院 图书馆,江西 九江 332000;2. 江西财经职业学院 信息工程学院,江西 九江 332000)

大数据的时代背景下,图书馆运用大数据更好的为读者提供服务的同时,也会给读者带来隐私方面的风险。基于信息生命周期视角对大数据隐私风险展开分析的基础上,对图书馆的大数据隐私风险管理框架的建构和实现方法展开分析,形成了基于信息生命周期的大数据隐私风险管理框架,可为关注这一话题的人们提供参考。

信息生命周期;大数据;图书馆;隐私风险管理框架

0 引言

在云计算、大数据等技术取得快速发展的同时,人类已经进入到大数据时代。对于图书馆来讲,在读者信息管理的整个生命周期内,尽管运用大数据可以更好的为读者提供服务,但也会给读者带来隐私风险。因此,还应加强对信息生命周期视角下的大数据隐私风险管理框架的研究,以便更好的进行大数据的安全应用。

1 信息生命周期视角下大数据隐私风险

1.1 隐私风险成因

在大数据时代,从信息生产、采集、传输、计算分析到存储和应用的整个过程中,都存在信息泄露的风险[1]。因为大数据的应用可以带来可观的效益,以至于信息成为各行各业战略级资源,导致个人信息保护约束被不断削弱,各领域都开始进行个人数据的大量收集和存储以满足业务需求。而对于图书馆来讲,在智慧化发展的过程中,势必要通过数据采集、计算分析、传输、存储和应用提供一站式检索等智能化服务。在为读者提供个性化服务的过程中,也要对读者个人信息进行收集和挖掘,对读者信息需求特点进行总结,以便实现对读者阅读需求和趋向的合理预测,满足读者的服务要求[2]。借助网络,需要对读者信息进行传输。借助网络互动接口,图书馆可以为读者提供知识导航、个性推荐等服务。而包含读者个人信息、使用记录等在内的数据均为读者隐私,一旦在某个环节出现信息泄露问题,就会引发风险[3]。

1.2 隐私风险发生

从图书馆信息生命周期视角来看,图书馆在读者信息管理方面存在较多的隐私风险。首先,在数据收集方面,读者在登录图书馆平台进行信息提交和资源搜索的过程中,相关数据信息都将被后台服务器自动记录。在到实体图书馆获取服务的过程中,包含门禁系统、借阅系统等系统在内都会对读者借阅信息和个人信息进行采集。在这种情况下,读者实际上失去了对隐私的控制权,无法阻止个人隐私数据被采集。其次,图书馆在数据分析和计算方面,也会利用数据挖掘技术对收集到的数据进行处理,从而结合读者需求信息提供更好的服务。结合读者行为规律,图书馆也将对读者的偏好和趋向进行预测,完成读者潜在需求的挖掘,同样会给读者带来隐私风险。再者,在数据传输的过程中,图书馆通常利用公开的网络技能型读者个人信息传输。采用链路窃听、木马等手段,可以对读者信息进行获取,同样会给读者隐私带来威胁。此外,在数据存储方面,图书馆目前广泛采用了云计算技术,以降低数据存储成本和实现数据循环利用。采用该种存储方式,可以通过登录账号随时随地的进行读者个人隐私信息的查看,难以保证数据不被泄露。最后,在数据应用方面,图书馆会根据读者请求对各种数据进行频繁存取。在设备缺乏病毒防御能力,并且系统访问无需身份认证的情况下,就可能导致读者隐私信息遭到泄漏或破坏。

2 信息生命周期视角下大数据隐私风险管理框架的构建

2.1 框架构建思路

针对图书馆大数据隐私风险,还要完成相应管理框架的构建,以便采用隐私保护理论和大数据技术加强读者隐私风险管控,避免读者隐私信息泄露或遭到破坏。考虑到隐私风险存在于各个环节,还要从信息生命周期视角进行框架的构建,实现对隐私风险的全生命周期管理。从风险管理需求上来看,依据法律,图书馆应当加强对读者利益的维护,同时坚持隐私保护政策开放,以便在隐私保护和大数据决策收益之间达到一种平衡。为此,管理框架的构建应保证读者享有隐私数据采集、存储、处理等过程的告知权,能够根据自身需求选择是否进行隐私大数据的采集和使用。图书馆在面向读者的过程中,需要向读者说明大数据隐私风险、数据采集的目的和图书馆采取的隐私保护措施,从而得到读者的许可和授权。读者作为大数据生产者,同时也是大数据决策受益人,将根据自身价值衡量结果做出选择。图书馆在读者大数据的隐私风险管理方面,则要完成生命周期管理模块的设计,围绕隐私大数据生命周期各阶段进行隐私风险分析和评估,并采取相应的措施进行隐私保护管理。在建模的过程中,重点需要对隐私信息生命周期特点进行突显,同时需要加强对各种大数据隐私风险的监测和评估。从总体上来看,在图书馆进行读者隐私大数据管理的过程中,风险因素即包含来自于外部的威胁,同时也来自于内部问题。从外部来看,在图书馆进行信息服务提供的过程中,可能遭受黑客攻击、服务中断等因素的威胁。从内部问题上来看,网络漏洞、决策者人为泄露信息、服务环境恶化等因素的存在也都容易导致隐私风险的产生。针对这些问题,建立的隐私风险管理框架能够从法律和技术层面采取相应的措施进行隐私保护,因此能够实现对隐私风险的全面管理。

2.2 框架结构组成

结合上述思路,可以完成如图1所示的基于信息生命周期的大数据隐私风险管理框架。从框架构成上来看,可以大致划分为三部分,即大数据生命周期管理模块、隐私风险评估模块和隐私保护模块。在大数据生命周期管理模块设计上,符合信息生命周期发展规律,确定了大数据产生、采集、存储、计算和应用各环节对应的管理对象,即数据生产者、大数据采集设备、大数据存储服务器、云计算服务器和大数据决策者[4]。结合读者隐私数据生命周期各环节涉及的对象和整个管理流程,可以完成隐私信息特征的挖掘,确定信息传播机理,为隐私风险评估奠定良好基础。而在隐私风险评估方面,将对各环节读者隐私被侵犯可能面对的风险问题进行详细叙述和划分,能够为后续采取隐私保护措施提供科学依据。最后,结合各环节存在的隐私风险,提出了隐私安全动态监控、隐私安全动态评估、隐私安全管理技术、事故审计问责、法律与规定保护等措施,确保生命周期各环节实体行为引发的隐私风险能够得到有效管控[5]。按照管理框架,读者将根据阅读服务等级和收益进行大数据应用范围的选择。对于图书馆来讲,则要根据读者授权在采集读者隐私数据时通过隐私安全动态监控避免进行不相关数据的采集,体现图书馆以负责为中心的隐私风险管理原则,避免对读者隐私数据进行过度采集和挖掘。在利用设备进行大数据采集和传输的过程中,则要结合这一环节隐私数据易被窃取等特点加强隐私安全动态评估,对数据来源多样性进行分析,实现对违反隐私策略的行为进行跟踪和问责,避免读者隐私数据遭到泄漏。在大数据云存储阶段,考虑到黑客可以通过攻击大数据存储服务器进行图书馆云空间访问,所以还要采用身份认证等隐私安全管理技术避免读者隐私数据被非法获取。在大数据计算和分析的二次利用环节,由于图书馆需要利用云计算服务器进行大数据聚类、分类等处理,完成读者隐私的进一步挖掘和分析,容易出现分析人员违背规章制度进行读者隐私数据进行泄露和破坏等行为,因此还要建立安全事故审计问责制度,通过问责预防数据安全问题的发生。最后,在图书馆决策者制定大数据应用决策时,可能出现在与第三方服务商进行信息资源争夺过程中侵害读者隐私安全的行为,以至于违背读者意愿进行数据交换和共享,因此还要借助法规和行规对决策者的行为进行约束,确保大数据的应用范围能够得到有效限制。

图1 基于信息生命周期的大数据隐私风险管理框架

3 信息生命周期视角下大数据隐私风险管理框架的实现

3.1 隐私安全动态监测

在读者隐私安全动态监控方面,图书馆可以采用P3P系统。通过将该系统与图书馆网页浏览器绑定在一起,则能在读者借助浏览器进行图书馆资源或服务获取的过程中,同时在后台进行P3P系统启动。系统结合网站要求,会进行读者个人处理策略的生成,由读者根据需求完成隐私偏好设定。在隐私设定方面,需要采用EPLA语言,即读者通过标记语言定义隐私保护策略,确保读者能够获得的隐私的控制权,明确网站需要收集的信息。读者根据图书馆网站提供的隐私保护选项,可以确定哪些数据信息可以被收集。在默认系统设置的条件下,读者任何信息都不允许被搜集。在读者进行各种网页浏览的过程中,一旦有网页存在搜集行为,P3P系统会在读者进入网站前提醒读者,与读者设定的策略进行比对,询问读者是否进行隐私策略的修改[6]。如果读者选择修改策略,可以自由浏览该网页,否则将退出该网页。实际上,采用该种方法对读者隐私安全进行动态监测,即利用读者隐私协商保护机制加强读者隐私保护,能够采取自定义方式由读者确定图书馆可以搜集的隐私数据。

3.2 隐私安全动态评估

在读者隐私安全动态评估方面,主要采用隐私泄露影响评估的方法,即结合法律规定对隐私风险带来的影响进行全生命周期的评估。在此基础上,则要采用安全目标识别的方法,对隐私风险发生的可靠性和严重程度进行分析,确定风险大小。采用模糊层次分析法,可以对各风险因素的权重进行确定,然后通过模糊评估确定风险带来的损失。在权重确定时,可以引入信息熵,结合信息量大小进行客观赋值。根据各项隐私风险对应的风险等级隶属度,则能完成图书馆读者隐私风险等级的定义,将读者隐私风险划分为高、较高、中等、较低、低五个等级,结合风险损失概率进行风险等级的判定。最后通过采取安全多方计算的方法,实现对图书馆、云服务提供商、第三方评估机构等各方协同问题的计算,确定各评估主体的隐私能够得到保护[7]。针对读者隐私大数据,存在多样隐私风险。联合采用多种方法进行隐私安全评估,可以实现对读者隐私风险的系统评估。从隐私安全评估流程上来看,图书馆需要先完成读者隐私安全需求的评估,然后通过信息流的描述实现隐私风险识别。采用模糊层次法,则能实现隐私风险量化分析,最终得到隐私风险解决方案。

3.3 隐私安全管理技术

在读者隐私安全管理方面,图书馆还应采用多种技术手段,加强对读者隐私的全面保护。首先,图书馆可以实现对读者隐私数据的匿名化处理,使读者隐私数据精度得到降低。采用该技术,需要对读者隐私信息的个性化特征进行去除,保证读者无法被轻易定位。采取该种措施,可以将读者隐藏在群体中,在完成读者偏好分析的同时,加强读者隐私数据保护。其次,可以采用数据加密技术进行隐私数据处理,如DES算法、RC2等等[8]。采用不同的算法,拥有不同的安全强度,并且算法应用范围和运行速度存在一定差异。采用密钥进行数据非对称加密,需要利用公开密钥完成数据加密,然后利用对应私有密钥完成解密。相较于对称加密算法,尽管非对称加密算法相对复杂,但是可以更好的实现通信过程中数据加密,因此可以满足能够直接识别读者身份的隐私数据风险管理要求。针对读者阅读行为等数据,由于安全强度要求不高,因此可以采用对称加密算法进行数据处理。此外,在读者登录图书馆平台进行资源或服务获取的过程中,可以采用身份认证技术和访问控制技术,保证只有经过授权的用户才能进行读者信息数据库访问。而对读者的访问权限,也要进行一定的限制,即通过限制数据删除、修改等权限避免读者信息被非法使用或篡改。

3.4 隐私安全管理制度

在读者隐私数据二次利用和应用决策方面,图书馆还要加强隐私安全管理制度的建设,以便利用法规和行业规范加强读者隐私风险管理。针对目前大数据时代图书馆读者隐私保护需求,国家还应出台相关的法律法规确保图书馆、网络运营商等机构在采集和使用读者隐私数据时保证行为规范,加强对读者隐私的保护[9]。在行业规定上,图书馆还应建立读者隐私风险管理制度,针对收集得到的读者隐私数据进行一致化处理和清洗、过滤等操作,确保与图书馆服务无关的读者隐私数据能够被及时删除[10]。在读者隐私数据使用方面,则要提高管理过程的透明度,确保管理决策者能够在多方监督下进行读者隐私数据的使用。最后,图书馆需要建立问责机制,即结合读者隐私风险评估和动态监测结果进行隐私泄露事件的追踪调查,确定数据泄露原因,采取相应措施进行责任人或机构的追责。

4 结论

通过分析可以发现,在整个信息生命周期内,读者隐私大数据都存在泄露的风险。面对这种情况,图书馆在加强读者隐私大数据利用的同时,还应加强读者隐私保护。为此,图书馆还要从法律和技术层面完成由大数据生命周期管理模块、隐私风险评估模块、隐私保护管理模块构成的大数据隐私风险管理框架的建构,从而实现对读者隐私风险的系统管理。

[1] 马凯航, 高永明, 吴止锾等. 大数据时代数据管理技术研究综述[J]. 软件, 2015, 36(10): 46-49

[2] 刘红霞. 物联网技术在图书馆中的应用[J]. 河南科技, 2015, 14: 4-6.

[3] 王家玲. 智慧图书馆模式下读者隐私技术保护研究[J]. 图书馆杂志, 2017, 36(9): 82-88.

[4] 朱光, 崔维军, 张薇薇信息生命周期视角下的大数据隐私风险管理框架研究[J]. 情报资料工作, 2016, 01: 99-103.

[5] 马晓亭, 陈臣. 基于大数据生命周期理论的读者隐私风险管理与保护框架构建[J]. 图书馆, 2016(12): 62-66.

[6] 曾子明, 秦思琪. 嵌入PbD理论的云图书馆隐私管理架构[J]. 图书馆论坛, 2017, 37(1): 93-100+18.

[7] 彭华杰. 大数据时代图书馆读者的隐私危机与隐私保护[J]. 图书馆工作与研究, 2014(12): 56-59.

[8] 卜晓波. 试论大数据云计算环境下的数据安全[J]. 软件, 2018, 39(2): 197-199.

[9] 闫实, 付佳, 石莉. 大数据环境下基于智慧校园的教学改革[J]. 软件, 2018, 39(2): 208-211

[10] 马晓亭. 大数据时代基于服务等级协议的图书馆读者隐私感知与保护研究[J]. 情报理论与实践, 2014, 37(4): 57-60.

Analysis of Big Data Privacy Risk Management Framework Based on Information Life Cycle Perspective

DENG Qing-jing1,2, FU Da-jie2, QIU Meng-wen1

(1. Jiangxi Vocational College of Finance and Economics, Library, Jiujiang 332000, China; Jiangxi Vocational College of Finance and Economics, School of Information Engineering, Jiujiang 332000, China)

Under the background of big data, the use of big data in libraries can better serve readers, but it also brings privacy risks to readers. Based on the analysis of big data privacy risk from the perspective of information life cycle, this paper analyzes the construction and implementation of the big data privacy risk management framework of the library, and forms a big data privacy risk management framework based on information life cycle. This paper can provide a reference for people who pay attention to this topic.

Information life cycle; Big data; Library; Privacy risk management framework

TP309.2

A

10.3969/j.issn.1003-6970.2018.09.009

江西省教育厅科技项目“面向大数据的隐私保护技术研究”(GJJ171300)

邓青菁(1990-),女,助教,主要研究方向:计算机信息管理;付达杰(1983-),男,教授,主要研究方向:数据挖掘与学习分析;邱蒙雯(1992-),女,助理馆员,主要研究方向:信息管理。

本文著录格式:邓青菁,付达杰,邱蒙雯. 基于信息生命周期视角下的大数据隐私风险管理框架的分析[J]. 软件,2018,39(9):42-45

猜你喜欢
生命周期框架风险管理
探讨风险管理在呼吸机维护与维修中的应用
广义框架的不相交性
从生命周期视角看并购保险
民用飞机全生命周期KPI的研究与应用
企业生命周期及其管理
WTO框架下
护理风险管理在冠状动脉介入治疗中的应用
一种基于OpenStack的云应用开发框架
风险管理在工程建设中的应用