◎于 跃
◎王庆华
(吉林大学 行政学院,吉林长春130012)
大数据的特质及其安全和信用风险
◎于 跃
◎王庆华
(吉林大学 行政学院,吉林长春130012)
大数据已成为国家基础性战略资源,纳入国家行动计划。大数据之“特质”,体现在“5V”+“5S”上,即拥有大体量(Volumes)、大品种(Variety)、大速度(Velocity)、大真实(Veracity)、大价值(Value)、大范围(Scope)、大结构(Structure)、大存储(Storage)、大策略(Strategy)、大灵魂(Spirit)等方面。认清大数据之十大特质,了解其中潜藏的或可能引发的诸多安全和信用风险,对引领大数据健康有序发展十分重要。
政府管理;电子政府;互联网;大数据;安全风险;信用风险
随着大数据时代的开启,大数据话题被广泛传播,大数据思维被大肆渲染,大数据技术被一再推介,加之大数据已成为国家基础性战略资源,大数据挖掘和利用能力也被认为是大数据时代一国竞争力的重要来源和关键内容,使得研究大数据渐成学界和业界的热点,追随大数据也被政府纳入国家行动计划。其实,大数据之“大”,不只限于专家们早已解说的“5V”,即拥有大体量(Volumes)、大品种(Variety)、大速度(Velocity)、大真实(Veracity)和大价值(Value)等特质;它还体现在本文所阐释的“5S”上,即拥有大范围(Scope)、大结构(Structure)、大存储(Storage)、大策略(Strategy)和大灵魂(Spirit)等特质。“5V”体现的主要是优势和机遇,“5S”展现的更多是难题和挑战,但不可否认的严峻现实是,无论哪一种特质,都潜藏着安全风险,都可能引发信用危机。鉴于在问题开始显现而具体解决思路和方法还不很明朗的情况下,提出问题、分析问题比解决问题更重要,本文旨在揭示大数据的十大特质及其潜藏的或可能引发的安全和信用风险,提请人们重视,而把这些问题的解决留待多领域专家去研究。
大数据的特质首先表现在其体量或容量大,大到在可承受的时间范围内用常规的软件工具无法捕捉、管理和处理的程度。以中国为例,2013年产生的数据问题超过0.8ZB,是2012年的两倍,相当于2009年全球数据总量。预计到2020年,产生的数据总量将超过8.5ZB,相当于2013年的10倍[1]。中国网民现已超过6.68亿人,如此大规模的网民每天上网产生的数据也足够庞大。这些数字提醒我们,无论是在现在还是未来,政府都必须面对海量数据所带来的冲击,要么驾驭它,要么被它淹没,不可能置身其外。
大数据因其体量大而更趋全面,其自身优势是十分明显的。首先,谁掌握了大数据,谁就可以弥补以往只能依靠抽样数据、局部数据、片面数据、理论假设和实践经验进行管理和决策的缺陷,且可依此预测趋势和赢得先机,此为其优势和机遇所在。但是,利用优势和赢得机遇靠的主要是大数据技术实力,鉴于缺乏高素质专业技术人才且现有人员培训不足的政府是不可能具备这样的技术实力的,因此,政府寻找专业化的合作伙伴成为必然选择,由此,合作伙伴在与政府的长期合作中自然“合理”地拥有了政府的大数据,再加上其日积月累沉淀的商业数据,其数据资产拥有量将远胜同行业对手,甚至会超过政府,政府在向其购买数据服务,依靠其资源和能力挖掘、分析数据的过程中,其信用亦会成为政府大数据安全风险的关键掣肘因素。其次,因为大数据的全面,包容了来自各种正规的、非正规的渠道的各类数据,这些来源广泛、渠道众多、日积月累形成的大数据本是出于不同目的、立场、能力沉淀的结果,其中也有相当多的数据是企业出于商业目的以隐密搜集、近零成本、漠视所有者权利的方式得到的,这些获取渠道和取用方式注定了大数据中真实与虚假混杂、历史与现实不同,即质量不一、时效参差。包容、超脱的结果,是在原有社会隐私权规则体系不再奏效而数据安全保护方面的法律法规又不健全的大数据时代,数据占有者极易操控和利用其所拥有的大数据,为谋求私利而泄露数据贡献者的隐私,侵害其信息权利,甚至危及社会安全和政府信用。如超过6.68亿的网民利用各类搜索引擎查找某类信息或利用电子邮件等通信工具联系某人之后,虽可利用安全工具软件清除自己电脑的上网痕迹及相关信息,但却无从消除甚至知晓搜索引擎或网络运营商是否有意无意中存下了这些记录。而实际上,搜索引擎所有者和网络运营商正是凭借这些记录采集大数据,成为大数据实际的占有者。待大数据累积达成一定规模之后,大数据占有者就可以借此累积庞大的数据资产,并从中获利,而其中蕴含的泄露网民个人隐私和侵犯网民信息权利的风险远超想象,需要政府采取严格的管理措施来保护数据质量和数据安全,对违法违规者造成的影响进行风险控制和严格管制。如果政府做不到,违法违规者会进一步侵害国家安全和社会权益,安全风险将更难掌控。
需要警惕的是,大数据的全面是相对的,真正全面、相对全面和以为全面毕竟不同,何况还有大量的干扰性数据混杂其间,所以政府在利用大数据进行管理和决策时既需要依赖机器和技术,也需要人的深刻的洞察能力和合作沟通能力。此外,究竟数据量级达到何种规模才算完整,至今也没有定论,在这种情况下,政府在利用大数据进行社会管理、公共服务和科学决策时,就必须同时考虑传统数据的利用,以规避数据不完整可能带来的风险,维护政府信息信用。
大数据之大品种,既体现在大数据可以聚集采集自以往难以企及的领域、层次和深度的数据,创造前所未有的量化维度,增强其多样性、系统性和相关性;体现在大数据的贡献者们来自不同社会阶层、不同地域,代表不同利益群体或利益集团的数据贡献者们主动传播、分享、交换的各类数据,赋予大数据以代表性、倾向性和复杂性;也体现在呈现文字、图片、音频、视频、互动、三维等多种不同形态的数据多样性。更多的数据采集与贡献成就了大数据的多样性类别特质,即增多了数据获取的渠道,放大了数据内容的范围,增加了数据理解的深度,呈现出数据的不同类别。当然,在渠道、范围、深度、类别扩展的同时,新的安全和信用风险也不期而至。以手机用户数据为例,如今,用户个人成为数据产生的主要来源,移动运营商或服务提供商能够全面、准确、及时地获取其所有移动用户每时每刻的方位、联系号码和短信内容等用户信息,并可通过大数据分析推断出每个用户的行动轨迹、行为规律、兴趣偏好以及关系网络,而用户在将其位置、行为、文字、视频、图片信息在内的真实数据提供给移动运营商和服务提供商以获取更有针对性的、更好的信息化服务的同时,也极大地增加了暴露手机用户的个人隐私的风险,给其带来不同程度的安全隐患,也给移动运营商和服务提供商自身带来了信用风险。再以贡献者们为例,由于他们受教育程度不同,代表利益不同,认知水平不同,判断能力不同,所提供的数据虽种类多样,但客观性、真实性和准确性参差不齐,所以,要获得可靠数据,最大的挑战在于数据整合,提高数据质量的关键在于在整合数据中融入更多的民主、参与、理性和合作,否则大品种就会成为大杂烩,弱能力极易导致大危机。当然,大品种蕴藏的安全和信用风险,是可以通过进一步扩大大数据的规模,增加大数据的流动性和分享性,进一步推动数据的开放,以及施以评估手段等方式来解决的。这一切需要政府做出实质性努力,加以行政性推动。
如果按现在存储容量每年以40%的增长速度计算,到2017年需要存储的数据量会大于存储设备的总容量,且预计到2020年全球数据总量将超过40ZB[2],这说明大数据产量增长的高速度。此外,大数据之大体量和大品种的优势发挥,以及大数据的价值利用,取决于大数据技术的大速度,如今大数据技术的能量已达到几秒钟能处理上亿次数据的速度,这是在数据爆炸式增长和新数据不断涌现的情势下快速获取有价值信息的必备条件。在传统的决策模式下,更多的决策依赖于内部数据,互联网的出现使得数据流动起来,数据在流动的过程中得以增值,而大数据应用的需求,又对数据的流动速度提出了新的要求,割裂的、孤立的、静态的数据只会让决策者陷落到自己设置的“信息孤岛”中去。唯赖大速度,方能使大数据实现实时处理并得到有效利用,进而容忍其大真实,去冗降噪,实现其大价值。否则,大体量和大品种的数据不但不能成就大数据的优势,反而会变成大数据的拖累。此外,促进大数据突破性发展的关键在于解决数据的获取性和流动性问题。而对于这两个问题的解决,首先需要解决数据的获取速度和流动速度问题,因为它们决定着数据的价值、意义、时效性、响应性,关系到用户的体验感、成就感和满意度。可见,如果数据获取和流动速度低下,大数据的效用将大打折扣,人类处理更多数据的机会、条件和能力将受到限制。同时,对于政府来说,大规模的、高速流动的数据很难被完全清洗或拦截,数据的高速流动带来了更多数据的跨境迁移,未来有可能会有越来越多的涉及安全的数据将被存储在世界各地的云数据中心,这些是对政府应对大数据的能力的考验,美国的“棱镜事件”已经为我们敲响了警钟。所以对政府来说,如何促进自身以及全社会的数据的流动,在获取更大价值的同时,保证秘密数据的安全性,管理好数据的跨境流动,是大数据时代赋予政府的重要使命。
大真实是由美国快捷药方公司(Express Scripts)的首席数据官(CDO)Inderpal Bhandar在波士顿大数据创新高峰会(Big Data Innovation Summit)上首次提出的。大数据的大真实指的并不是数据本身的真实性,而是在数据分析中应注意分析并过滤数据中有偏差、伪造、异常的部分,防止这些差异数据破坏数据系统的准确性,进而影响决策。大数据对于数据真实性的宽容度远高于传统数据,这使得人们得以摆脱过度依赖数据精确性的羁绊,大真实的数据观念由此确立。依赖这种“要效率不要绝对精确,要相关不要因果”[3]的大真实,一方面,降低了数据真实性的门槛,导致数据形态的改变,即允许数据以不完美、不真实、大混杂的形态进入数据系统;另一方面,即时数据如此之多,累积起海量数据,建构起相关关系,如辅以适当的数学算法模型,完全能够利用数据挖掘算法识别出数据的真实性,帮助用户掌握事物的大体状况和预测其可能的发展方向。如此一来,大数据得以强大,相关关系更近真相。但无奈的是,“在广泛流行的技术的帮助下,遗忘已经变成了例外,而记忆却成了常态”[4]6。丧失遗忘能力导致的后果是,有关数据贡献者的隐私和信用等数据所有者不情愿保留的大真实数据被长久地保存下来,甚至保存时间比我们的寿命还要长,这类记忆后果需要数据贡献者余生来承受。例如,加拿大心理咨询师费尔德玛就因为他在2001年为一本交叉学科杂志所写的文章中提到自己在20世纪60年代曾服用过致幻剂,就在穿过美国与加拿大边境时被扣留了4个小时,被告知不准再进入美国境内。他从来没预料到,他在那样一本晦涩杂志上发表的文章,居然能在全球化的网络上如此容易地被找到,使自己成为数字化记忆的受害者,不得不为过去快40年了的错事买单[4]8。由此,大数据的适时清洗、遗忘机制以及共同存储期限的设定,亦应成为政府履行保护公民隐私和信用安全职责的一部分,因为学会遗忘和懂得宽恕毕竟是人类所需要的。
还以移动运营商为例,他们有出于商业利益出卖手机用户隐私信息的主观性可能和客观性可行。目前,中国拥有超过12.29亿部手机,其每天新增的数据量可谓庞大,鉴于这些大数据包含大量牵涉行为主体隐私、相关关系、安全和信用的信息,只要大数据占有者利用数据分析系统对相关数据进行综合分析并建立关联,即可依据用户手机号码、联系号码、短信线索等尽数掌握数据贡献者的一举一动,分析出其行为习惯、兴趣偏好,并对其进行定位。而利用哪些数据,使用其中哪些成分,用于何种用途,输送给何类组织或个人,以及采取怎样的数据模型加以运用等都是由大数据占有者决定的,相关约束机制几近阙如。可见,在信息安全体系还不健全、国家信用体系尚未建立、大数据占有者的行为难以规范的现实条件下,出于自身利益需求和商业竞争目的而泄露数据贡献者隐私的风险难以避免,安全和信用问题可能时时发生,如果政府不能制定相关政策保护公民免受监视与记忆的伤害,不能采取有效措施打击侵权行为和控制安全风险,不仅手机用户利益和财产受损,政府权威和国家形象也必定深受影响。因此,政府需要教育公民在网上谨慎言行,注意自我保护。此外,大真实毕竟不是真真实,倘若真实数据不被认同,错误数据擅加利用,无论是对公民隐私和权利,还是对政府管理和决策,其负面影响都将是致命性的打击,由此可能引致的社会政治和经济秩序的混乱也是需要警惕的。
在大数据时代,数据已经具备商品或资产属性,可以像其他商品或资产一样进行买卖与交换,只是“从对数据的交易、记录到对数据的分析、比较、提炼、再分析”[5]等一系列证析过程的转化成就了大数据之大价值。大价值的优势具体体现为其大用途,缘其“有用”。据已有研究成果,大数据的有用性体现在以下方面:它作为巨大的经济商品或资产,不会因为共享而缺损,却可通过复用而增值,产生效益;它作为得力的数据资源,可以提供更多数据和相关关系,助力人们高效获取有用数据,辅助管理和决策;它作为有力的思维工具,能扩展人的数据分析能力,使精英人士和普通公众平等共享数据,并从中获取利益和创造价值。无疑,作为全球人口、市场和计算设备保有量的大国,中国是数据大国,也理应成为数据强国,以依赖所拥有的巨大的数据资产创造巨大的商业机会。然而,尽管技术专家们保证大数据能帮助组织在适当的时机做出正确决策,但由于大数据分析处理中存在诸多不可知因素,如数据价值密度低的问题,以及大数据的价值会随着时间推移发生变化等,其决策风险仍是难以预料的。何况,数据贡献者要维护自身权益,保护自身安全;数据占有者要深挖数据价值,争取更大利益;而数据使用者则希望高质高效地共享数据,谋求最大价值。诸如此类的利益诉求和目标追求,使得必须保证大数据应用的公正公开以及维护数据所有者的隐私安全成为利益相关方的普适规则和共同选择,而这些都需要政府的努力。当然,利益相关方技术上的不平等,蕴藏着技术强势方产生数据独裁的风险;而利益相关方经济上的不平等,意味着其享用带宽和使用数据频率必有差距,数字鸿沟会带来信用风险。为公平、公正地发挥大数据的大价值,大数据建设和运营中的民主与法治、分权与制衡、自由与约束、资费与效益等也急需政府勤勉运筹。
我们知道,大数据的数据量是空前巨大的,但随着大数据应用的深入,大数据的准入门槛在逐步降低,大数据的大范围打破了原有数据间不同类型、不同来源的边界,让一个个“信息孤岛”之间的数据合纵连横,所以大范围无疑是重要的,因为大范围必然涉及更多数据,可以惠及更多用户。但大范围同时又是困难的,因为大范围和大用户必然要求大服务,而大服务也可能带来大麻烦。面对现在日益庞大的数据量,我们可以不考虑数据的边界有多大,但不能不限定数据的应用边界在哪里。大范围导致的大服务,必然反映在数据手段的大规模应用上。以中国为例,规模超6.68亿的网民每天使用电脑上网产生的数据可谓大规模。当网民利用各类搜索引擎查找某类信息或利用电子邮件等通信工具联系某人之后,虽可利用安全工具软件清除掉电脑的上网痕迹及相关信息,但却无法避免搜索引擎所有者或网络运营商存下这些信息,借此建立起网民间的相关关系,也无从知晓甚至获取搜索引擎所有者或网络运营商所存储的大量隐私记录,这些记录极有可能涉及网民的宗教信仰、兴趣爱好、行为习惯、家庭关系等隐私信息,成为利益相关者利用和攻击用户的“枪械”。正如枪械设计师卡拉什尼科夫所言,“枪械是无罪的,有罪的是扣动扳机的人”[6],不受限制的大数据应用将会带来无法估量的隐私侵害,大数据的应用边界就是大数据服务的隐私底线。搜索引擎所有者和网络运营商借此采集加工成大数据,成为大数据占有者,进而操控这些“枪械”谋取利益。如通过分析用户心理状况和从众心理等对网络用户日常购物行为进行引导就可进行有效的商品营销。但搜索引擎所有者或网络运营商是否对其中的隐私数据擅自利用,可否对网民人身安全造成损害,以及由此导致的安全和信用风险,是网民依靠一己力量所无法规避的,需要政府清洁网络环境和构建信用体系加以规范。以塔吉特百货为例:在美国,公民的出生记录是公开数据,所以如何吸引新生儿家庭消费成为每一家零售商的重要项目。塔吉特百货(Target)的顾客数据分析部(Guest Data&Analytical Services)为抢占消费潜力巨大的客户群体建立了一个数据模型,可以及早地将孕期客户从客户群体中分离出来,抢占客户资源,进行有针对性的产品推送。而一位美国的父亲也正是因为这种类型的产品推送意外地得知自己16岁的女儿怀孕的消息。从商家的角度来看,这是一次利用大数据精准营销的典型案例,而从用户角度来看,这可以看作一次大数据应用越界而造成的隐私侵害。所以,从这样一个商业化的大数据应用也可以衍生出一种基于隐私保护的大数据服务。
大数据的大结构指的是大数据涵盖结构复杂、种类多样、规模很大的结构化数据、半结构化数据和非结构化数据。以往计算机处理的数据通常是事先定义好的、以表格形式保存的结构化数据,而如今互联网上流动的和遍及各个角落的传感器产生的大多是半结构化、非结构化数据。大数据应用的出现,使得原本埋藏在邮件、文档、网页、社交媒体、感知数据之中的文本、音频、图片、视频、模拟信号等非结构化数据可以得到更有效的利用,非结构化数据已逐渐成为大数据的代名词。IDC(Internet Data Center,互联网数据中心)在2010年的一份研究报告中就曾显示:从数据总量来看,当前的企业数据,其中有超过80%的数据是非结构化数据,并预计在2012年,非结构化数据将占整个互联网数据的75%以上;从数据增量来看,2010年全球结构化数据增长速度约为32%,而非结构化数据增速则高达63%,且非结构化数据中50%—75%的数据都来自人际交互[7]。信息技术的不断发展,使得以往难以企及的数据,变得便于采集和存储。“大数据区别于传统数据处理最大的不同就是重点关注非结构化信息,大数据关注包含大量细节信息的非结构化数据”[8]。这种混杂性的数据结构不仅显示出大数据之搜集范围大、加工程度不一、表现形式不规则,还表现为其来源广泛、性质复杂、变量众多、变化经常。在这种情形下,既然精确性已不能够获得,索性降低精确度门槛,包容并承认其混杂性;既然因果关系太过复杂,暂且放弃因果追究,转而发现相关关系。至于承认与发现是否可靠,能否安全,有否信用,也不予追究查证,唯信庞大数据足以覆盖一切真实,这对整体全局叙事而言也许适合,但对个体局部求证而言,显然有失公允,凸显出对个人安全和信用的损害。
爆炸式增长的数据,对数据的采集速度和采集能力提出了新的挑战,采集的海量数据又使得数据存储系统需要具备更强大的数据存储空间、付出更大的存储成本。大存储是大数据带来的大挑战。大数据需要低成本、高效率的大存储,云计算因具此优势的数据存储、分享和挖掘手段而被选用。云计算环境搭建有三条路径:公用云、专有云和混合云。其中,公用云一般由第三方运行,在信息安全方面需要承担相对较大的风险;专有云由自身拥有,降低了安全风险,但信用风险升高了;混合云虽可规避两者短处,但极有可能出现两者长处无法施展而短处却共同存在的情况[9]。可见,无论采取哪种路径,安全和信用风险都相伴而行。目前,“互联网+各行各业”仰赖的新基础设施就包括“云、网、端”[10],这使得各行各业运作涉及的网络、设备和人更多,安全和信用风险增大。而当人类越来越需要依赖云计算,就得时时处处与云服务商打交道,包括用户要调用和处理自己存储于云中的大数据都得向云服务商申请、付费并接受应用裁决。伴随着云计算的迅速普及和各行各业数据资产保存和利用意识的持续增强,数据所有权和占有权分离导致的问题将更加雪上加霜,如数据所有者不能自己对自己的数据做主,数据占有者却可以任意侵入数据所有者的隐私领地等,会促使安全与信用风险进一步升级。当然,这些风险更多的是人为造成的。为此,政府可以借助预测告诫数据强者(即数据占有者)权衡利弊,促发自省,通过制定规则约束数据强者,保护数据弱者(即数据所有者)。须知,数据所有者贡献越大,数据占有者的成本越低,诚实守信才能合作共赢。
要赢得大竞争,必拥有大策略。大策略涉及大战略,也包括行动方案。已知的涉及大数据的大策略尤其是行动方案,更多的是基于技术及其应用的,市场经济制度和法治体系的保障支撑力度不够,加之社会主体、制度因素、非制度因素等社会风险加大[11],使得大数据极有可能演变为数据占有者掌控网络和攻击网民的利器,这样的风险不同程度地存在于网络世界的各个角落,危害数据安全、网络安全甚至国家安全的事件也时有发生。尽管各国政府对大数据应用及发展给予高度重视,如2012年3月美国政府拨款2亿美元启动《大数据研究和发展倡议》(Big Data Research and Development Initiative)计划,将对大数据的研究上升为国家意志;2015年9月,中国《促进大数据发展行动纲要》出台,国务院系统部署大数据发展工作,但受各国信息基础环境和技术发展条件制约,大数据所引发的不同层面的安全和信用风险亟待各国采取有效策略分而治之。目前,在加强大数据技术策略之外,更多地寻求制定国家大数据产业发展战略和法律法规做保障是明智之举。为此,相关研究和联合攻关亟待开展,以指导其发展。现实情况下的政府责任包括:不仅要保护企业商业秘密和公民个人隐私,还要保障国家安全和政府信用。鉴于网络安全执法中查处群体易,追究个体难,政府可从政策制定、资源投入、人才培养等方面入手,通过逐渐建立和完善政府信用体系、企业信用体系、个人信用体系等来规避大数据可能引发的各种安全和信用风险,鼓励全社会厉行保护信息自由又善待彼此隐私的行动。
大数据之大灵魂,首先,体现在它是人类广泛参与和集体智慧贡献的成果——泛在化;其次,体现在它通过降低技术准入门槛,使更多企业能够从事大数据的组织与管理、分析与发现、应用与服务等活动,更多公民具备了数据挖掘和利用能力——平等化;再次,体现在它成为现代社会信息基础设施,不断融合与改变着各领域各行业各类人群的生产与生活方式——变革性;最后,体现在它是与物质、能量、人力一样重要的战略资源,影响着国家经济发展和社会进步——战略性。泛在化、平等化、变革性、战略性铸就的大灵魂,是人与人合作的成果,它最终契入数据乃至人的灵魂,引导与驾驭的威力不可谓不强大,但人与人在其中做出的诚信与不诚信的选择,极易因其便利且缺乏有效监管而演变成数据安全和信用灾难。为此,迎接大数据挑战,政府必须承担的责任至少应该包括:建立大数据环境,为之营造良好生态;统筹大数据规划,鼓励各行业携手参与;推动大数据建设,制定数据保护规则;推广大数据应用,赢得竞争优势和价值财富。这些重大责任的承担,使政府面临重大的风险挑战。比如,数据真实性门槛的降低势必影响数据质量,监管数据清洗以维护其绩效成为政府必须承担的职责;数据资源属于战略资源,决定国家命脉,其合理开发、利用、储备、分配和消费事关社会公正以及公民权益保障,需要政府主导筹划。难题事关政府的信用和能力,亟须政府联合社会力量共同解决。只因政府自身也存在信用缺失甚至信任危机以及技术能力有限等问题,令其在克服难题时力量不够强大,需要自我革命。
“科学征服人心靠的是方便、实用、安全、高效,但实际效果往往相反”[12]。“5V”+“5S”在体现大数据诸多优势的同时,也展现了大数据带来的各种挑战。但无论是大数据的优势还是挑战,透露出的安全和信用风险是毋庸置疑的,政府绝不能熟视无睹,必须认识到:一方面,良好的安全和信用体系是大数据健康发展的有效保障,面对各种安全和信用问题,必须树立大安全、大信用观念以及大民主、大开放和大理性意识,掌握深入研析和预判应对大数据挖掘和利用中的各种安全与信用问题的良策的能力,为应对潜在危机和规避更大风险提供法律、管理和技术等多维安全和信用预案,以将大数据可能产生的危机和风险控制在可接受的范围之内。这也是保证大数据时代一国数据秩序和信息安全的应有举措。另一方面,要认识到中国是信息弱国,在技术上,尤其是在安全技术上,还处于被动依附他国的地位,因此要立足于现实技术国情,鼓励基础研发和自主创新,寻求安全技术产品的突破之路。而在科学、合理、可行的安全策略还没有设计完善的情况下,小心谨慎地筹谋大数据开发利用的范围、方式和方法,把数据公开至数据开放、“+互联网”至“互联网+”的路选好、做对,是非常关键的。
[1]涂之沛.数据之巅:大数据革命、历史、现实与未来[M].北京:中信出版社,2015:21.
[2]周文.2020年全球数据总量将超40ZB大数据落地成焦点[EB/OL](2013-08-29)[2015-05-11].http://net.chinabyte.com/139/12703139.shtml.
[3]维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代:生活、工作与思维的大变革[M].杭州:浙江人民出版社,2013:8.
[4]维克托·迈尔-舍恩伯格.删除——大数据取舍之道[M].杭州:浙江人民出版社,2013.
[5]郑毅.证析——大数据与基于证据的决策[M].北京:华夏出版社,2012:2.
[6]“互联网时代”主创团队.互联网时代[M].北京:北京联合出版公司,2015:183.
[7]GANTZ J,REINSEL D.Extracting Value from Chaos[J].IDC IView,2011,(6):1-12.
[8]马建光,姜巍.大数据的概念、特征及其应用[J].国防科技,2013,(2):10-17.
[9]张锐昕,张乔.云计算环境下政府信息资源管理运行和约束机制[J].情报科学,2014,(11):45-49.
[10]阿里研究院.互联网+未来空间无限[M].北京:人民出版社,2015:21.
[11]张毅,陈友福,徐晓林.我国智慧城市建设的社会风险因素分析[J].行政论坛,2015,(4):44-47.
[12]仲昭川.互联网哲学[M].北京:电子工业出版社,2015:11.
(责任编辑:于健慧)
TP311.13
A
1005-460X(2016)01-0083-06
2015-07-30
国家社会科学规划基金重点项目“电子政府构建和运行的保障体系研究”(13AZZ016)
于跃(1989—),男,吉林长春人,博士研究生,从事公共政策和电子政务研究;王庆华(1966—),女,黑龙江大庆人,博士,教授,博士研究生导师,从事公共政策和公共经济研究。