大数据的保护等级划分及数据保护

2021-12-31 12:09高晓峰
科技创新与应用 2021年36期
关键词:加密信息

高晓峰

(中共扬中市委党校,江苏 扬中212200)

1 大数据及其特征

1.1 大数据定义

大数据这个概念首先于2008年9月在美国由《自然》杂志提出;2011年5月,美国《科学》杂志使用社会调查的方式,第一次分析了大数据对于人类生活产生的影响。

2011年美国麦肯锡研究院正式对大数据进行定义,英文名字叫做Big Data。

所谓大数据,就是在一定范围内难以用常规工具收集、分析、管理的数据集合。大数据属于一种信息资产,具有多样化、海量、增长速度快等特点。通过新型的处理方式,人们获得一些有用的信息,从而可以优化流程,提升管理者的洞察力和决策力。

1.2 大数据的特点

从以上大数据定义可以看出来,大数据有以下几个特征。

第一个特征:价值量高

大数据具有非常巨大的潜在价值,可以应用到人类生产生活的各个方面,极大提高了人类的生产力。但是从其具体收集的数据来看,其价值密度却非常低,因为大数据对于数据的收集几乎是全方面的,不管有用没用都会全部搜集过来。如某个具体的人在某购物平台上浏览商品,过程中他浏览了什么商品,某个具体的商品浏览了多长时间,每天使用这个购物平台的APP几次,习惯采取什么样的支付方式,喜欢购买什么产品,这些数据都是价值量不高的数据。然后在此基础上分析出有用的数据,而这部分数据的价值非常高。例如将成千上万的用户数据集中起来,信息量将会很大,其价值也会很大。如果对这些数据进行汇总和分类,就能得出消费者的某些偏好,从而使得这些数据具有巨大的商业价值。

第二个特征:体量大

大数据的“大”字就体现在体量大。大数据在收集数据的阶段一般不对数据进行区分,不会区分待收集的数据是否有价值,虽然看起来某些数据没有价值,但是当这些数据的体量大到一定程度时,就会形成巨大价值。如生活中的一些数据看起来没有用处,但是当整个城市乃至地区的这类数据集中起来,就能说明很多问题,如反映该地区人的健康状况,医疗需求等。

第三个特征:速度快

这里的速度快是指数据形成的速度非常快,几乎每18个月整个人类形成的数据就会翻一番。根据IBM公司的研究表明,2012年前人类总共形成的数据总量约为200EB,但是这个数据正在以每18个月翻一番的速度增加。因为信息技术的高速发展,收集和存储数据的难度和成本越来越低,每年会有大量的数据被保存。所以大数据定义强调,大数据是常规方式无法收集和整理的数据,只有在信息技术高度发达的情况下,才能进行大数据的收集、分析和管理。

第四个特征:种类多

大数据之所以称之为“大”,不仅是指其数据的体量大,而且还指其范围大。不但人类生产生活当中各类数据可以收集,乃至自然界的各种数据都是构成大数据的一部分。光仅是人类生产生活当中数据的种类,就庞大到难以想象。此前人类社会的数据量之所以较小,并不是产生的数据量小,而是那个时代的数据搜集和保存手段非常有限,所以能够流传到后世的数据较少。进入信息社会之后,人类收集保存数据的能力猛增,而数据收集的途径也有了巨大拓展,从而使得整个大数据涉及的领域和种类非常繁多。

2 大数据的作用

大数据的数据量非常庞大,即使在现代信息社会要对其进行收集也是一项浩大的工程,人们如此热衷于收集大数据,其实也是因为大数据对人类社会活动非常有用,所以才会如此耗费精力,进行大数据的收集、整理和分析。

2.1 大数据技术正在成为信息化大潮当中最有效的应用形式

整个人类社会已经进入了信息化社会的时代,在大部分国家,个人开始拥有各种信息化终端,包括台式电脑、笔记本、平板电脑、智能手机等。这些个人终端,使得人类生活发生了翻天覆地的变化。在大数据技术得以广泛应用之前,互联网时代虽然给人类带来了巨大便利,而大数据技术广泛应用后,这种便利被推向了极致。

在移动互联网、电子商务、社交媒体、物联网等各个领域,大数据正在日益改变人类的生活。此前人们获得信息的最主要途径是电视和报纸,但是现在移动互联网已经逐渐取代了这两种途径,人们不但可以从网上获取各种各样的信息,大数据系统还能根据个人喜好,更有针对性地对用户投放其感兴趣的资讯。在社交媒体领域,大数据系统也会针对其此前的记录,推荐其感兴趣的话题和好友。在电子商务领域,大数据的应用更加能够促进用户消费的提升,因为系统推荐出来的产品,都是用户近期想要购买的东西。

这些现象说明,尽管每一个人产生的数据并不具备太高价值,但是将大量用户产生的数据进行收集整理分析,将会形成具有较大价值量的数据,从而能够指导各种社会生活,包括生产和销售等,最终形成巨大的经济价值和社会价值,催生社会变革的伟大力量。美国在2020年就以我国字节跳动的Tiktok软件以及腾讯公司的WeChat软件危害美方国家安全为由,禁止其在美国国内的使用。这两款APP自身没有什么危害,但是因为其数据收集功能,使得美方非常忌惮,担心其搜集美国用户的各种数据,传回国内,从而使得我国能够掌握很多有用情报和数据。

2.2 大数据加速了信息科学领域新技术、新产品、新服务的衍生

大数据产生于信息时代,因为只有信息技术高度发达,人类才能够非常方便地收集数据。信息时代之前整个人类社会也会产生大量的数据,但是因为收集手段的落后,只能对这些数据当中最为重要的部分进行收集,其他部分只能放弃。如封建社会对于户籍的统计以及田亩归属,只能记录最为重要的基本信息,如户籍当中的人口姓名、性别、住所,田亩信息当中的位置、面积、所有人等,但是对于这两者当中的其他不太重要的特征和数据,则无法记录。因为一旦记录这些东西,一方面将会消耗大量的人力物力,同时也会占用大量的储存介质和空间。就像古代最早使用的竹简,以及后来使用的纸张,这些介质的本身能够储藏的信息量较小,而且体积较大,非常占用空间。

而大数据技术的出现,一方面是因为信息收集手段的提升,另一方面也是存储科技的提升以及存储业务的大量出现。大数据一方面依靠信息收集手段的提升。由于当前大数据业务量不断提升,以及发展大数据需要更多的设备和存储空间,因此促进了信息技术以及芯片、服务器领域的高速发展。另一方面,大量数据的收集需要海量的存储空间。或许大数据技术的出现得益于存储技术的提升,但海量大数据的产生,同时也会促进如云计算、网络云盘、云存储等领域的高速发展。此外,对大数据进行分析和研究,对大数据进行各种应用,已经成为一门新兴的学科。

2.3 大数据将会极大提升核心竞争力

大数据时代,人们将会变得越来越“懒”。在人类生活的各个领域,大数据的存在使得人们生活的便利程度在不断提升,消费者在消费的时候,大数据系统将会给出客户最喜欢的消费方式;而在商业领域,可以通过大数据即时掌握市场的动态以及消费者的需求,从而能够迅速做出应对,以满足市场和消费者的需求;在一些科技领域,大数据能够帮助研究者找准研究方向,从而使得研发更具有目的性和指向性,更加能够贴近人类的生活和工作。

2.4 大数据将会使得科学研究方式产生重大转变

传统的科学研究基本思路是大胆假设,严格论证,这样的研究方式要求对科学研究方向上的任何可能性进行分析,然后找到正确的思路。从这一点来说,这种方式类似于大数据的分析方式。未来的科学研究,必然会通过对研究对象进行大量数据的收集和分析,挖掘出一些规律性的东西,然后进行研究和分析,最终取得成果。所以说,大数据的广泛应用,必然会对科学研究的方式产生巨大影响,从而使得研究方式产生重大变革。

3 大数据的等级划分

大数据如此重要,必然会引发对大数据的滥用,从而给社会和个人造成损失和困扰,所以必须对大数据进行安全等级划分。

在数据保护领域,数据等级划分也是一项关键性的工作,必须根据数据的各种不同特点,制定统一的标准,采用准确和完善的方法,将数据划分成不同等级,从而采取不同的方式保护数据的安全。同理,对大数据也必须采用类似的分类方法,进行不同等级大数据的划分。

由于大数据自身的特点,大部分数据的价值密度较低,不可能对这些数据全部进行保护,一旦全部进行保护,也使得外界无法获得海量的数据进行分析,从而也失去了大数据科技的意义,所以一般说来,对大数据可以采用价值密度以及隐私程度的标准进行划分。按照这个标准,可以将数据划分成三个等级。

3.1 低价值密度的一般数据

大数据本身就是大量低价值密度数据的集合,大数据当中大量的数据都是一些基本数据,而这些基本数据支撑了大数据系统的数据库,通过对这些数据的收集、分析以及公布,不会对个人和社会造成影响。如一个地区的多年天气情况,某个地区的用户更偏好购买某种服装等,这些数据就是一些低价值密度的数据,对于这样的数据往往不需要进行太多保护。

3.2 高价值密度的重要数据

对价值密度数据进行分析得出二次处理后的数据,或者直接在某个领域非常具体的数据,如某个地区的用户在某个时间段,更倾向于购买哪一种具体产品;或者在购物平台更倾向于花费具体的金额购买什么样的产品和服务。这样的数据已经能够对商业行为起到巨大的引导作用,具备了极大的商业价值。这样的数据就是高价值密度的重要数据,对于这样的数据,必须保持谨慎使用的原则,而且必须进行一定的保护。

3.3 一些隐私和机密数据

大数据当中其实还有很多非常隐私和机密的信息,如个人的健康状况、平时购买什么样的药品、银行卡号、密码、家庭地址、电话号码等等。这些数据都是重要的隐私信息,一旦泄露将会对个人造成重大影响,甚至会导致重大损失,所以对于这部分数据,必须进行严格保护,严防泄露。

另外,还有一些机密数据,如涉及到国家地理、道路等方面的信息,或是重要机构的网络信息等。这些数据可能看起来不太重要,但是如果泄露出去,很有可能会被他国用作军事用途,会对我国的安全造成巨大威胁,这部分数据也是必须受到严格保护的数据。

4 大数据的保护

针对大数据的这些特点,必须采取分级保护的措施。

4.1 分级授权保护

很多网站对于数据的保护措施不是十分严格,有时候一些没有权限的用户往往能够获取到很多信息。所以对于重要数据必须进行分级授权保护,未经授权的用户,无法访问数据。未经授权或者权限较低的用户,只能在有限的范围内,获取一些不太重要的信息。授权访问的好处是避免一些敏感数据在公共区域被轻易获取,增加了获取超权限数据的成本。此前或许只要取得一些普通权限的账号就能获取很多重要数据,但是分级授权保护后,必须获得具备足够权限的账号才能获取数据。一般说来,普通用户的普通账号安全防护措施不太强,而高权限账号肯定会更加难以攻破和获得,从而增强了数据的安全性。

4.2 重要数据保护

对于一些重要的数据,必须采取更为严格的保护措施,如将重要数据和外界网络断开,如果想要访问,只能通过内网访问。而且对于内网的访问终端和介质,也必须进行严格管理,只有经过授权的终端和存储介质,才能访问特定的数据。这一点在银行等领域体现较多,即使拥有账号和密码,如果没有相应的加密狗或者其他加密装置的话,依然无法访问数据。而在政府部门内部进行文件交换的系统,完全和外网物理隔离,只有通过内部专线才能

实现对文件的接收和访问。

4.3 机密信息加密保护

对于机密信息,除了采取以上保护措施外,还必须进行加密,通过一定的算法,将机密信息进行加密保护,即使这些信息因为一些不可预见的原因被泄露了出去,但是因为经过了严格的加密,获取者也无法获得信息的具体内容,这就相当于给机密信息加上了一道锁,使信息更加安全。对数据进行复杂的加密将会增加数据的体积,同时增加读取的难度和读取的时间,这是弊端。但是这样做的好处是增加破解的难度,如果以现有计算机算力水平破解某个数据,耗费时间达到几十年的话,那么可以认为这个数据是无法破解的,因为等到数十年之后即使破解出来了,数据也失去了时效性,几乎不具备价值。但是如果不加密或者进行简单加密的话,又会非常容易破解。因此,应对加密复杂程度要进行权衡,找到最佳加密方案。

4.4 关键信息防篡改

随着电子商务和电子政务的发展,网络上涉及到这方面的内容很多,特别是关于一些可以公开的重要文件以及重要合同等数据非常容易遭到篡改,从而对社会和个人形成误导。对于这样的关键信息,必须采用防篡改措施,如采用区块链技术,采用分布存储的方式,类似于比特币的技术,只能获取该信息,但是无法对信息进行修改。大数据技术和区块链技术都有彼此的优点和不足,如果能够将大数据技术和区块链技术相结合,取大数据技术对数据的强大收集和分析能力,结合区块链技术的防篡改性,将一些不希望被篡改的数据经过加密后通过行业区块链网络或者内部区块链网络进行存储,可以有效避免重要关键信息的篡改,从而能够保证数据的真实可靠性。

4.5 对信息系统的保护

信息系统是数据的承载体,只有拥有安全的信息系统,才能保证数据的完整和安全。如果信息系统和数据遭到破坏,将会严重影响信息的使用以及安全。所以必须建立完善的应急措施,多对数据进行备份,建立完善的备用系统。在主系统遭到破坏后,立即能够开展相应的应急措施,如立即启用备用系统,并调取备份文件,完成对数据的恢复,确保信息的安全。同时能够在短期内修复主系统,恢复数据的提供。

4.6 做好防攻击措施

网络攻击是窃取重要数据以及瘫痪重要网络的常见手段,此行为能够对数据安全形成巨大威胁。所以大数据系统必须做好防攻击措施,如此前所讲的将重要数据隔断和互联网的物理连接等。另外,信息系统必须经常查找并修复可能被利用的漏洞,建立起防攻击的规则,限制攻击行为的频次以及数据广播的攻击。另外,还必须建立起安全有效的系统日志功能,能够对各种行为进行记录,即使遭到攻击,也可以溯源,甚至能够对攻击者采取措施,追究其责任。

4.7 完善数据流动和保护方面的立法

目前关于数据流通和保护方面的立法还不完善,对于数据的流通以及保护的法律条文虽然也有一些,但是分布在多个不同的法律法规当中。如《网络安全法》《中华人民共和国保守国家秘密法》《征信业管理条例》《地图管理条例》等。其中《网络安全法》并没有对重要数据进行精确的定义,其范围和界限也显得非常模糊,也未对大数据进行分级定义。这样的情况就导致关于大数据相关业务游走在法律的边缘,一方面受到利益驱动大肆搜集各种数据包括隐私数据;另一方面缺乏足够的法律依据,导致一些重要数据会产生跨境流动,转移到美国等发达国家,进一步加强其数字霸权。不过相关部门已经意识到这个问题的严重性,开始着手解决这种现状。如近期对某打车APP进行下架处理,同时对一些公司的人脸识别APP进行甄别,其主要目的就是从行动层杜绝这种数据跨境流动的灰色行为。以上做法可以看做是对美方禁止我国字节跳动以及腾讯公司APP的对应反制行为,这也能看出我国对数据保护领域已经有了足够重视。相关部门肯定会针对这一现状进行立法,对数据进行分级,并对重要数据从法律层面进行严格的保护和控制。

猜你喜欢
加密信息
基于广义logistic混沌系统的快速图像加密方法
保护数据按需创建多种加密磁盘
电力安全防护加密装置
加密与解密
订阅信息
展会信息
SQL server 2005数据库加密技术
信息
健康信息
健康信息(九则)