导读

2016-03-24 05:56
中兴通讯技术 2016年2期
关键词:数据挖掘机遇挑战

清华大学计算机科学与技术系教授、博士生导师;长期从事计算机系统结构、大规模数据存储、高性能计算等领域的科研教学工作;主持并完成了“973”、“863”、自然科学基金等科研项目36项,负责或参与工程项目11项;获国家科技进步一等奖1次,奖获国家科技进步奖二等奖2次,获国家技术发明奖二等奖1次;发表论文500余篇,著作10部。

专家论坛栏目策划人

2004年7月获美国罗彻斯特大学计算机科学博士学位;现任美国佛罗里达国际大学计算机学院教授、博导,同时担任南京邮电大学计算机学院、软件学院院长,南京邮电大学大数据研究院院长;2006年获得美国国家自然科学基金委颁发的杰出青年教授奖,2009年获得佛罗里达国际大学最高学术研究奖,2010年获得IBM大规模数据分析创新奖;发表文章250余篇。

随着信息和通信技术的飞速发展,人类社会已经步入了一个激动人心的时代——万物互联,虚实(cyber-physics)共长。在这一演化过程中,人们在实验、理论和计算之外,发展出了认识世界和改造世界的第4种手段——数据科学,而大数据则是数据科学在大众中间的一种通俗的说法。

简单来说,大数据描述了这样的一种事实和诉求:数据的巨量、快速增长和多样化,也就是通常人们所提到的大数据的3V(Volume、Velocity和Variety),这方面已经有众多的例子,我们就不再赘述;而如何从数据中提取出价值(Value),丰富人们对于世界的认识,增加人们改造世界的手段,这是大数据的核心所在,最近震撼整个人类社会的引力波确认事件就是一个典型的例子。

大数据蕴含着大机遇,正是看到了大数据的潜在价值,麦肯锡才将其作为创新、竞争和生产力的下一个前沿,世界各国政府纷纷推出相关的计划或战略予以支持。

天下没有免费的午餐,大的机遇也意味着众多的挑战。大数据面临的挑战可以用奥运会的口号——更快、更高、更强——来描述:为了在激烈的全球化竞争中获得优势,为了更好解决当前人类社会面临的种种挑战,人们需要更快地对数据进行分析处理,从中提取出更高的价值(而不仅仅像之前那样只是简单的给出一些统计结果),来更加科学地做出各种决策;要实现上述目标,人们需要站在更高的角度上高屋建瓴的审视整个行业,开发出更强的技术,既包括数据收集、存储和处理相关的各种软件技术,也包括传感器、存储器件以及高性能计算装置等各种硬件设备。

大数据时代,机遇与挑战并存。如何面对这些挑战和机遇,推动整个大数据行业的发展,进而带动整个社会经济和管理、服务水平的提升乃至人类自身的进步,是摆在各行各业人们面前的公共议题。本期专题就是从信息技术从业人员的视角,对大数据发展与应用中的一些问题,特别是技术问题进行了具体地探讨。

另外,在大数据时代,数据来源于应用,实际的应用是根本与目标。数据的产生、收集和管理是基础,数据挖掘(知识发现)是工具和手段,而数据安全和隐私保护贯穿应用的整个过程。大数据的发展为数据挖掘的研究和应用带来了新的特点和需求,同时也为数据安全和隐私保护带来了更加严峻的挑战。本期论坛栏目则对大数据时代的数据挖掘和安全及隐私保护进行了探讨,提出了一些创新的观点,如大数据的核心和本质是应用、算法、数据和平台4个要素的有机结合;信息安全企业未来的发展前景是以底层大数据服务为基础,并通过构建安全大数据,逐步形成大数据的安全生态环境等。

这些论文作者既有来自学术界的资深研究人员,也有来自工业界的前沿领军人物。希望这些探讨能够给读者带来有益的启示与参考,对于推动大数据的发展与应用能够起到一份绵薄之力。

猜你喜欢
数据挖掘机遇挑战
再见,机遇号
指数再创新低 把握底部机遇
数据挖掘综述
软件工程领域中的异常数据挖掘算法
基于R的医学大数据挖掘系统研究
机遇
第52Q 迈向新挑战
机遇
一本面向中高级读者的数据挖掘好书