大数据时代用户信息隐私问题对策研究

2022-03-21 21:39包晓慧吴文杰
计算机时代 2022年3期
关键词:信息泄露数据安全大数据时代

包晓慧 吴文杰

摘  要: 在大数据时代,如何解决用户隐私问题已经成为近年来大数据领域学者研究的热点问题之一。文章提出从大数据收集、大数据存储和大数据应用三个阶段进行综合治理,各方联动以共同应对用户信息隐私问题,并针对具体阶段制定相应的对策。

关键词: 大数据时代; 信息泄露; 用户隐私; 数据安全

中图分类号:TP393;G203          文献标识码:A     文章编号:1006-8228(2022)03-50-03

Abstract: In the era of big data, how to solve the problem of personal information privacy has become one of the hot issues studied by scholars in the field of big data in recent years. This article proposes comprehensive treatment in three stages, which include big data collection, big data storage, and big data application; proposes all parties should work together to deal with the issue of user information privacy; and also makes out the pertinence countermeasures.

Key words: big data era; information leak; personal information privacy; data security

0 引言

第48次《中国互联网络发展状况统计报告》显示,截至2021年6月,我国网民规模达10.11亿,互联网普及率达71.6%。十亿用户接入互联网,形成了全球最为庞大、生机勃勃的数字社会[1]。随着互联网用户规模不断扩大,用户在诸多场景的行为被记录进而转化为数据,全新的大数据时代悄然而至。如今,用户无时无刻不被大数据所包围,海量的数据来源于用户的日常行为活动,用户反过来依靠大数据助力自身发展,由此所形成的双向交互模式既充分发挥着大数据的潜在价值,同时也为用户带来了便捷。

1 研究意义

大数据技术包含一系列采集和处理、分析用户信息的行为。从大数据收集、存储,到应用的各阶段,用户信息所受到的威胁是不容忽视的[2-3]。这是因为各阶段所包含的不安全因素太多,如主体的多样、技术的不确定及法律监管的欠完善等,无疑都会带来用户信息泄露的风险。现实中,外界挖掘个人信息体系的行为充斥在每个人的周围。比如将社交网站中的用户记录、智能手机的位置信息等多种数据组合起来,可以高精度地锁定个人用户。再比如基于大量个人浏览记录与历史购买行为等数据,淘宝、京东等电子商务网站能针对用户精准化地推荐商品。

因此,构建用户信息隐私安全环境的意义深远,一方面,它可以减少网络精准诈骗和犯罪,提升国家层面的数据竞争力;另一方面,它能帮助大数据技术升级,加速大数据相关行业的健康發展。近年来如何解决用户隐私问题已经成为大数据领域学者研究的热点问题之一[4-6],本文将分析在大数据收集,大数据存储和大数据应用三个阶段所存在的用户隐私问题,并针对具体阶段制定相应对策。

2 用户信息隐私问题对策研究

2.1 大数据收集阶段

大数据收集阶段的典型行为包括用户产生数据,平台或商家经传输获得数据,其中的不安全因素大多依存于用户、商家或平台与网络安全服务提供方这三者,故用户信息隐私保护对策要以上三者为中心进行制定。

对用户而言,要想规避信息泄露风险,首先必须提升个人账户密码复杂度,尽可能地对账户实施多重保护操作;其次是选择官方渠道下载软件,不安装来源不明的应用软件;最后对要提交个人信息的网页谨慎甄别,对手机APP做到非必要不安装,必须安装的要设置软件权限。

对商家或平台而言,首先严格遵照相关安全和认证规范选择和创建平台,其中安全规范包括加密算法、安全通信协议等,认证规范包括数字签名、数字认证和PKI等。同时要确保用户对自身信息的获取有知情权,选择权和拒绝权,杜绝出现霸王条款。接着提升工作人员安全意识,避免其直接或间接地泄露甚至出售用户数据。

对网络安全服务提供者而言,一方面要不断更新技术水平并及时修复安全漏洞,以解决传统网络安全问题,如安全漏洞被利用、木马、钓鱼网站恶意盗取等;另一方面要认清大数据时代智能终端体量庞大且无线传输方式居多的新形势,尤其是无线传输方式自身漏洞造成的用户信息被黑客窃取风险增高的特点,采取数据加密技术、启用访问控制、定期更换密码,以及禁用远程服务等防护手段。

2.2 大数据存储阶段

大数据体量庞大且增速快,因此使用传统的本地存储方式来存放大数据成为不可能,此时云存储方式应运而生。云存储即大量的用户数据被存储在云端,所以,用户数据的安全很大程度上取决于云平台的可靠性。而事实是,服务商受限于经济因素及密码技术,很难提供给用户足够的云平台安全保障。加上考虑到数据残留问题可能带来的巨大安全隐患,用户将数据存放在公共云中往往等同于承担着高风险。为降低数据泄露风险,用户要避免把敏感信息存储在公共云平台上。

除了数据存储的物理安全外,还要保证数据库系统的安全,尤其是非关系型数据库的安全。这是因为一方面非关系型数据库主要用来管理非结构化数据,这种数据相较于传统结构化数据占比大,因此非关系型数据库应用范围更广;另一方面非关系型数据存储技术虽有易扩展、性能好与高可用性等优点,但仍然存在若干安全问题,如技术漏洞和成熟度问题、授权与验证的安全问题、访问控制和隐私管理模式问题等。为解决上述问题,目前主要采用数据库加密技术将通过删选、层次划分等方式选出的符合条件的用户敏感信息进行加密,以高效地保证数据安全。此外,还可以利用访问控制技术来保证数据不被非法使用或访问,以增加数据库管理的可靠性。

2.3 大数据应用阶段

大数据应用阶段是大数据价值获得最终体现的阶段。该阶段是通过对海量数据的关联,将用户的诸多零散数据聚集起来分析,最终获得连个人也无法预知和控制的隐性数据。在该阶段,用户隐私信息保护的途径是把用户信息中的关键敏感数据匿名化。

按照数据特征分类,用户数据有结构化数据和社交网络图数据两个典型分类,而以上两者的隐私保护手段也不尽相同。对于前者而言,数据发布匿名保护技术是实现其隐私保护的关键技术和基本手段,如k-匿名技术是通过将用户信息隐藏在一组相似的记录中实现匿名化,它主要适用于静态的、一次性发布数据的理想情形,但现实中数据的发布往往是连续的、多次发布的,因此该方法并不能够完美解决现实中的匿名保护问题,它仍然在不断发展和完善。对于后者而言,社会网络图匿名化技术是通过修改图的操作来保护用户隐私,如随机增删交换边操作、基于超级节点对图进行分割和集聚操作等。需要注意的是,通过修改图的操作来实现社交网络图匿名是以降低数据可用性为代价的,因此,实际操作中不要单纯追求高质量的匿名化效果,亦要综合考虑数据可用性。

3 结束语

大数据技术的快速发展加剧了个人信息隐私问题的凸显,实际上该问题已经明显阻碍了大数据技术发展的脚步。正因如此,个人信息隐私保护问题成为当今大数据领域亟待解决的问题之一。本文提出从大数据收集、大数据存储与大数据应用三个阶段进行综合治理,各方联动以共同应对用户信息隐私问题,并针对具体阶段制定相应对策,其目的在于提升大数据时代用户隐私保护技术,保证数据在各個阶段都得到有效保护。

目前,大数据的隐私保护技术研究还处于初级阶段,现有技术手段虽能在一定程度上减少信息泄露几率,但仍存在若干问题有待进一步研究。如在相对不安全的公共云平台上如何实现数据的安全存储,又如在不同应用场景中实现数据匿名化时如何找到匿名化效果和数据可用性的最优平衡点,以上都是用户信息隐私技术领域未来有价值的研究方向。

参考文献(References):

[1] 中国互联网络信息中心(CNNIC).第48次中国互联网络发展现状统计报告[R].北京,2021.8.27

[2] 康海燕.网络隐私保护与信息安全[M].北京:人民邮电出版社,2016

[3] 申琦.中国网民网络信息隐私认知与隐私保护行为研究[M].上海:复旦大学出版社,2015

[4]丁红发,孟秋晴,王祥,等.面向数据生命周期的政府数据开放的数据安全与隐私保护对策分析[J].情报杂志,2019,38(7):151

[5] 陈晨,郑永爱.高校大数据应用中的安全及隐私保护研究[J].网络安全技术与应用,2019(9):77

[6] 王国峰,雷琦,唐云,等.大数据环境下用户数据隐私保护研究[J].网络安全技术与应用,2021(7):67

3795501908218

猜你喜欢
信息泄露数据安全大数据时代
云计算中基于用户隐私的数据安全保护方法
建立激励相容机制保护数据安全
大数据云计算环境下的数据安全
大数据时代下图书馆的服务创新与发展
大数据时代高校学生知识管理
从“数据新闻”看当前互联网新闻信息传播生态
大数据时代网络信息安全的研究
某媒体在一信息泄露事件中报道的内容分析
基于二维码的物流小助手
现代信息技术环境中的信息安全问题及其对策