“大数据与信息安全企业家峰会”在京成功召开
大数据产业作为信息技术与服务业的排头兵,近些年在发展中不断壮大,“十二五”期间在促进大数据发展的行动纲要等国家战略的引领下,大数据逐渐成为了创新战略的先导力量,带动经济结构改革的重要抓手。未来,将会迎来新的发展机遇,开创更具辉煌的发展前景。
2016年11月25日下午,大数据与信息安全企业家峰会在京成功举办,聚焦“创新、发展、安全、共赢”这一主题,相关政府部门领导、业内专家以及大数据领域杰出的企业家代表齐聚一堂,共同探讨大数据与信息安全发展新思路,明确行业发展新目标。
大数据与信息安全
步入快车道
工业和信息化部信息化和软件服务业司司长谢少锋出席峰会并讲话。谢少锋指出,数据已成为国家基础性产业,也是重要的生产资料,其引擎作用已经充分体现,催生了数字经济时代到来。
他表示,未来五到十年将是大数据产业的黄金增长期,为贯彻落实《促进大数据发展行动纲要》,根据国家“十三五”发展规划,工信部组织编制了大数据产业发展规划,将于年内出台。其中,构建强有力的大数据安全保障体系,是大数据发展中的重要部分,大数据发展和应用在创造价值的同时,也确实面临着严重复杂的安全挑战。因此,在推动产业发展过程中,要牢固树立正确的安全观。他强调,我们发展大数据产业,要坚持安全是发展的前提,发展是安全的保障,安全和发展要同时进行。
同时要认真学习网络安全法,以此为契机面对新形势、新问题,不断加强大数据安全保障体系建设,统筹规划信息安全相关标准制定,建立建全相关法律法规和制度体系,强化数据安全相关的检测和评估。
组织开展大数据安全产品研发和应用示范,全力支持相关企业科研院所开展大数据全生命周期的安全研究,研发数据来源的可信,现在最重要的大数据的产业发展就是对可信数据关键技术的突破。支持建设一批大数据的安全实验室,研究建立软硬一体化国际环境,在工业、互联网等重点行业开展一系列的数据安全方面的实验,提升数据安全的防护水平和应急处置的能力。
中国大数据企业联盟作为今年新成立的社会组织,已集聚近百家大数据骨干企业,是做好大数据产业的重要力量。希望联盟围绕《促进大数据发展行动纲要》、《大数据产业发展规划》,进一步贯彻落实,汇聚资源,凝聚力量,共同研究总结大数据发展中尤其是信息安全方面遇到的问题,探索大数据在各行业的典型应用,推广示范,拓展大数据应用的广度和深度。加快建立数据开放共享,推动产业创新发展,健全数据安全保障。建立数据安全标准体系建设的协作机制,助推我国大数据产业健康有序的发展。
会上,中国电子信息产业发展研究院副院长樊会文在致辞中表示,大数据未来发展潜力巨大,但大数据也是一把双刃剑。这个技术既有应用价值的一面,也有安全忧患的一面,这两年已发生多次安全事件,第一类是数据本身泄密的安全事件,第二类是在大数据应用中个人隐私暴露的诸多安全事件。
他强调,要解决上述问题需要从技术、法律两个层面入手,技术上需要找到更好的防范手段和安全手段,必然要用大数据解决安全问题,例如如今的网络诈骗、网络骚扰等,更需要实践一线的企业家代表提出解决方案,协调产学研用多方合作。中国大数据企业联盟作为第三方平台应广泛联动大数据企业,组织企业代表共同研讨,为产业发展作出应有贡献。
如今,数据成为战略资产已经成为行业共识,业界普遍认为数据资源是继陆海空三大资源外的重要战略资源,打击网络攻击和窃取个人数据以及培养安全人才等方面,各国采取了有效的举措,这说明大数据的合规、安全使用直接影响到了整个产业链能否健康持续的发展。
为推动数据信息产业持续健康发展, 形成公平有序的产业生态环境,加强数据信息安全保护,促进数据相关环节的规范有序,加强数据的充分流转及价值开发,完善企业内部数据信息合规制度管理和技术保障,在峰会现场多家知名大数据企业、机构代表及律师代表共同签署了大数据与信息化安全自律标准化文件。
技术创新
“数据中国”值得期待
大数据技术应用正与智慧城市建设紧密结合,为城市注入了智慧,更好地关注民生,提升公共产品、服务质量和城市的宜居水平,真正实现城市管理和发展“以人为本”的理念。针对此类问题,中国工程院院士李伯虎结合智慧城市大数据的研究与实践在峰会上展开介绍。
他表示,在智慧城市的整体构架中,需要将智慧的资源和能力这两方面虚拟化、服务化,并构成云池,然后对云池中的资源形成一个支撑。智慧资源的能力、资源管理、数据知识模型管理以及根据用户需要如何去構建所需要的虚拟化环境,管理、定性并评估这个环境等诸多方面,一个很重要的体现就是将大数据的资源呈现出来。
谈及大数据作用智慧城市的众多技术,李伯虎提到智慧城市大数据继承与清洗技术。这个数据集成把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集合起来,清洗得到干净的一数据,为智慧城市建设提供全面的数据共享基础,并发送给存储系统或数据空间件系统进行相关后续处理。
存储和管理技术方面,就采用云存储和分布存储技术以及高吞吐量数据库技术与非结构化数据访问技术,来实现经济、高效、高可靠、容错好的存储和访问与管理,其中在异地存储,大数据的快速访问等方面已有成果;数据分析挖掘技术则是数据库中发现隐含在其中有价值的、潜在有用的信息和知识的过程,也是一种决策支持的过程。
如今大数据已经成为智慧城市建设运行的战略资源,作用潜力巨大,研究和实践的过程中普遍认为要把技术应用和产业同时协调发展。在技术方面,要重视大数据技术,必须要与信息通信技术、智能科学技术、系统工程技术与城市运行管理技术等多种技术深度融合,其中没有高性能计算,没有人工智能技术就没有进展可能。所以在大数据技术与相关技术深度融合的同时,要不断加强大数据三类技术、工具以及平台的研发产业包括相关运营工作的开展。
众所周知,无测量无管理,是职业经理人耳熟能详的一句话。如何利用结构化非结构化的海量数据为企业人员在公司治理、城市治理中提供可靠、可视、可控的决策依据,会上曙光信息副总裁王元兵带来了“拥抱数据革命浪潮,迎接产业数据再造”的主题分享。
王元兵对《中国信息化周报》记者说:“业界需要健全大数据的安全保障体系,并建立大数据安全评估体系来保障大数据处理过程中在各环节所隐含的安全问题,在这个基础上,我们可以推进产业界限的重建和融合。例如曙光的方舟平台,主要特点是多维多元异构数据。首先是多维、多元、异构数据的采集,实现结构化、非结构化数据收集,实现来自数据库、问津、数据流的数据,实现文本、图片、视频等数据的融合。其次是规则关联数据清洗,提升数据质量,提升去除脏数据的能力,采用统计学、聚类、分类、规则关联等方法进行清洗,与文本、语言、视频、地理信息等产业链上下游融合,然后根据产业进行细分。”
在社会安全领域,有关大数据的重建实践,王元兵提出这样一个事例。某市公安智能警务认知系统,通过人机交互,语音解析,技能分析实现语义的检索,建立数据库等完成管理。设计算法库、图算法库等建模平台,最后实现图表可视化、推送可视化,从而形成警务智能的闭环体系生态。
目前已有超过一百亿项的各类警务数据为基础,进行聚合并赋予警务数据接受为综合警务平台进行服务,以数据利用为核心,打造基于技术平台的人、车、案件、警务的综合的可视化的体系。通过对警务数据、流动趋势、历史轨迹的回溯和及时的控制信息,对社会风气和警情进行分析。通过对警务数据建立关联模型,对重点警务目标的各类关系进行分析,形成关系图谱辅助进行警务的处理。这个在目前警务系统中的应用获得了用户非常满意的效果。
大数据时代对于企业意味着什么?阿里告诉我们“双十一”淘宝的核心交易实现每秒17.5万笔定单,每秒处理12万笔支付,获取对企业来说不仅如此,还包括实时的分析决策,要求对海量数据多元数据的整合,解决大容量、批处理的能力,最后完成可视化的价值交互。东方金信的核心产品来自于谷歌分布式大数据平台,他们专注于实现企业级高性能分布式大数据解决方案和云解决方案,专注于大数据的咨询、产品、实施和服务的同时主要提供产品和服务一站式解决方案。
“我们可以为客户提供大数据的一站式服务,基于大数据用户平台整合内部和外部的数据,会通过一些向内部的ERP数据,外部第三方社交网络数据进入整个大数据平臺进行数据分析挖掘以及处理建模以及模型评估,能集成像数据的应用、报表展示以及管理价值、客户体验分析。”东方金信联合创始人石棋玲阐释道。
峰会现场,石棋玲认为,产品和服务覆盖的大数据全链条,整个过程可以分为几个阶段:第一阶段是数据普及,第二阶段是数据存储,然后就是数据挖掘以及数据应用,在数据的采集端会用到类似开源。首先对接传统的关系型数据库,在数据挖掘方面通过一些业务专家进行解读,实现分析建模的过程。整个大数据平台通过路由器、数据压缩到目标。“这是我们的特色,是实现分布式内存技术实现的多数据源的整合,冷热数据是一个数据流的流向,也就是说当数据从外部数据源进行采集过程中,会通过实时处理,进行分析。”石棋玲补充道。
另外,一键化部署可以实现一键安装,只要输入IP地址,从页面上进行点击,下一步就完成整个步骤。这是一个统一化的定位监控平台,在界面化的大数据平台可以监管整个集群,包括CPU使用率各种指标服务,还有统一化安全管理平台,可以察看整个平台使用权限。该平台提供集中管理的安全框架统筹整个集群的各个用户。在介绍中,石棋玲提到了无缝打通与传统关系型数据的混合部署与应用,可以通过自身的搜索引擎与其进行对接。
她说:“结合传统的数据仓库和数据湖的企业级大数据仓库探索,在传统仓库上我们有不同的层次,包括标准数据层、共性加工层,对非结构化数据进行加工处理,会进入标准数据层,共性加工层,这样才能快速响应各种数据服务。上方可以建立实时处理的机制,能解决银行业或其他行业监护的问题。”
彰显价值
聚焦大数据安全
大数据时代就是预测的时代,通过预测服务进行决策是大数据应用的终极体现,其中整合数据形成驱动力是关键。企业把各种结构化和非结构化的数据进行整合,形成预测模型,决策者就可以更容易地发现和预测黑天鹅。在“数据价值运营和安全保障实践”的分享中,数据堂副总裁肖永红从数据处理获取等方面做了详细介绍,对如何融合和盘活各类大数据的资源,实现数据价值最大化,推动相关技术应用和产业的创新都有独到的见解。
肖永红认为,非结构化数据的处理是很重要的工作。相比较来说,单独数据或者自身业务系统所产生的数据价值其实是比较低的,如果只用一次,那么一定要有开放生态。例如在做大数据的平台或者产品时,除了自身数据,还要吸纳外部数据进来。首先要对数据本身敏感,这需要数据科学家基本能力或者经验。另外要对行业理解,原因在于数据产品和大数据应用一定要服务于某个领域,这些数据提取之后怎么应用到行业中,也是重要的问题。所以数据关联这一步非常重要,需要有数据知识或者领悟经验的才能做出很好的数据产品,这是数据处理的重要环节。
数据经过基本清洗处理,构成高端的数据关联,随后就要做成普世化的数据产品服务,其中涉及几种形态。有一种最基本的形态就是把数据打包成数据包,肖永红表示现在这样的趋势已经越来越少,更常见的形态就是把数据打包成标准的数据包;还有一种情况可能是直接转移数据甚至可以利用数据投资某些业务开发者或者孵化产生应用,这才是整个数据服务的形态。另外,对于数据的隐私、版权以及安全的探讨,人们在讨论这个问题时可能经常会不由自主地把三者混为一谈,业界认为三者应该分开考虑。首当其冲的是隐私问题,隐私问题现在的普遍做法就是众所周知的数据资源运营,其中涉及几个环节,数据采集和获取,数据处理和数据服务。
相关数据显示,近一年来因个人信息泄露,垃圾信息,诈骗信息等现象导致了总体损失约805亿元,企业数据信息所造成的恶果更是令社会震惊。如何加强信息保护是一个亟待解决的重要问题,小米科技有限责任公司副总裁首席架构师崔宝秋在“大数据的隐私和安全”的演讲中提出用户信息的完整性和真实性安全也就是用户信息安全。
必须在数据准确、安全的前提下上传用户的个人信息,在上传过程中要加密,在内存中保管临时存放,落地到磁盘永久性存放,以及做离线分析等用途之前,数据处理过程中数据都要加密脱敏。另外,需要销毁的数据一定要销毁,很多数据用了一下其实不需要保留,用户也不希望保留,就要走销毁的流程,因为很多情况下数据意味着责任。
在数据匿名化、脱敏方面,小米尝试将一些关联打乱,可能比较隐私的要对应到随机产生的ID,这个加密的ID和ABCD的行为存放在另外一个地方,这样加密系数就更高一些。加密是传输的加密,当个人信息、个人数据上传到服务器或者云端后会用各种方式进行加密。“我们做密钥管理中心,用来产生一些密钥,让各种大数据团队或其他团队来加密数据,存放数据。对一些极度敏感的数据,包括一些密钥,核心的绝密信息,我们用硬件保密来保护,很多机房也会用独立的物理隔离的机柜保护,例如小米支付比较核心的业务,用高标准的物理隔离机柜保护信息。”崔宝秋解釋道。
技术上,在大数据时代增强用户的隐私保护,对技术提出了新的挑战,包括云化、数据加密,怎么匿名化大量数据,转化动态的流失数据等都是一个挑战。做到在关系数据库或数据库中有效加密又不影响数据处理效率,能够搜索,加密库的搜索等都是新的技术领域的新挑战。
此外,峰会现场除了多家大数据企业代表进行了相关探讨与分享外,作为法律方面代表的观韬中茂律师事务所合伙人王渝伟从“从网络安全法看大数据行业的法律痛点及立法趋势”的主题出发探究了网络安全法颁布后对各家数据信息公司,特别是大数据公司可能会带来的影响等问题。
首先是关于个人信息保护的规定对大数据企业业务模式会产生一些影响,例如以前专做数据收集,现在关于数据收集可能会有非常明确的,包括数据转移以及数据储存等方面的明确规定,业务模式可能当网络安全法正式实施后,就会需要特别关注,否则会触碰红线。
“其次关于数据信息存储及跨境转移的规定对大数据企业的影响,这种影响更多是在一些外资企业,需要把一些数据传到原国家,或者业务模式可能会涉及到部分境外,所以这个时候企业可能比较关注这么一个点。再次关于数据信息安全保护制度的规定,可能对大数据企业的合规管理提出更高的要求。最后就是对网络安全的进一步要求,对安全大数据这个产业可能会带来一些比较好的机会。”
从网络安全法看大数据行业的立法趋势,王渝伟认为可以在三个方面表现出来,同时与痛点紧密相关。第一是个人数据保护专项立法提上议事日程,第二是数据信息权属有望通过立法确定,将为数据交易提供法律依据,第三是关于公共数据开放将逐步完善,为政府数据公开提出了挑战。
另外,众多企业嘉宾以及律师还针对大数据技术创新与价值提升、大数据合规利用与隐私保护以及大数据标准化与综合治理等三个方面进行了圆桌讨论,现场互动气氛热烈。