主题论坛:大数据分析与管理
5月25日下午,“大数据分析与管理”主题论坛在贵阳金阳万丽酒店3F贵阳大厅1举行,中国人民大学信息学院院长杜小勇教授担任论坛主席及主持人。会上,嘉宾演讲精彩绝伦,现场气氛热烈,听众爆棚。会议开始,论坛主席杜小勇教授首先给观众解释了“大数据分析与管理”论坛主题的范畴,要考虑数据的采集、数据的存储、数据的分析、数据的管理,特别是数据的管理,因为任何一个技术的产业化,一定要考虑它的经济成本,要考虑它的经济价值,大数据同样也是如此。
“大数据分析与管理”主题论坛观众席
会议期间,中国人民大学信息学院院长杜小勇教授接受了数据观记者的采访,他表示:大数据正在成为这个世界上最重要的“土壤”和“基础”,成为一切管理和决策的依据。运用新理念、新技术、新方法对大数据进行全生命周期的创新管理和应用,是推动国民经济转型和社会管理创新的重要契机,也是提升国家综合竞争力的重要趋势。
他认为,大数据因其规模巨大、类型复杂、产生速度快、价值密度低等因素,对现有信息技术产生巨大挑战,需要运用新理念、新技术、新方法对其进行全生命周期的创新管理和应用,从而促进国民经济的转型升级、社会管理的模式更新,乃至国家综合竞争力的全面提升。在大数据时代,有志于引领组织实现大数据转型的管理者们首先要养成看“数据怎么说”的习惯,重视数据。其次,要允许数据做主,放手让“大数据说话”,这将是改变组织决策文化的最大力量。
杜小勇教授表示,政府要做好大数据治理,必须深入理解互联网思维,这其中包括关联思维、去中心思维和人本思维。
加拿大西蒙弗雷泽大学教授、IEEE TKDE学报主编、ACM/IEEE Fellow 裴健在“大数据分析与管理”论坛作了题为“以大数据分析促进业务观念和内容创新”的演讲。
裴健教授认为大数据和大数据的分析管理,不仅仅是技术问题,更多的是业务问题,跟业务开发和发展息息相关。从技术的层面出发,要提供数据管理到分析再到业务解决方案的全盘考虑。
他分享了其团队在大数据应用上面的认识和经验:首先可以用大数据来承载灵巧的新兴应用,这是传统的应用领域与新兴的大数据应用领域的一个很大区别。通过创造性地使用丰富的数据,应用可以做得很小,开发快捷,而产生的社会效益却可能很大。其次,希望做若干应用能形成关键的业务流程。如通过现有工具进行欺诈检测时,很多工具会告诉我们这是疑似的欺诈案例,但鲜有系统直接支持我们怎样去调查一个案例,怎么分配人员和开销等。再次,要集中力量把业务的临界量超越过去,迅速推进多种相关业务,形成大数据支撑的新的业务群,使大家能很快看到大数据带来的益处,才能够吸引更多的业务投入。最后,业务手段和内容创新实际上是相辅相成的。大数据分析的作用体现在能否直接支撑业务部门进行业务手段和业务内容的创新。
香港中文大学工程学院教授、副院长黄锦辉在“大数据分析与管理”主题论坛作了精彩演讲。黄锦辉教授在其报告中,逆向看待大数据分析,对大数据分析的可靠性提出了质疑。他认为如果数据量不足,或数据的质量较差,或者数据是动态持续变化,那么分析的结果不一定是好的。另外,如果只靠商界人士开放数据,而政府不开放数据的话,出现“马太效应”的可能性是很大的。
黄锦辉教授还提到,大数据是把双刃剑,要避免一些不良商人利用一些数据,做一些对消费者不利的行为,这是忽略消费者权益的事情,政府或者管理层应该把这点考虑清楚,需要制定法律监管、保护消费者的权利。大数据分析的关键是要有优质的数据、优良的模型算法。
华东师范大学研究生院院长、数据科学与工程研究院院长、长江学者特聘教授周傲英在论坛上作了题为“从管理和分析说起:感悟大数据”的精彩演讲。
在大数据时代,对实时分析的需求很多。需要实时分析的问题有相应时间的要求,且数据量很大,需要分析的数据可随时注入,大数据的核心就是将这些数据关联起来,实时分析,实时注入,有弹性。大数据分析中事务处理非常重要,需要高可靠的、高弹性的事务处理系统,支持现象级的应用。
周傲英教授表示,IT的发展,要立足应用,现在要去IOE,要讲安全可靠,自主可控。应用驱动创新,一方面要立足应用,另一方面需要开放,解放思想。如果中国开源环境好了,中国的创新一定会强起来的,万众创新,草根创新。
北京大学文理大数据研究中心常务副主任,北京大学信息科学技术学院教授王腾蛟在论坛上作了精彩报告,题目为“大数据分析是一种科研方法吗”王腾蛟说《Nature》和《Science》,甚至《光明日报》都认为人文社会科学的大数据研究会成为未来人文社会科学的主要领域,他们认为这种方向性是没有问题的。当然反对方也有很多,但是仔细看看这些反对方的态度,不是否定大数据的方向,而是认为很多团队有了海量的数据之后,肯定都能得出一些结论,但是同样面对这样的数据,不同的方法可能出来的结论是矛盾的,所以怎么用工程的、科学的方法去处理数据,得到正确的结论,这个是大家比较关心的。
王腾蛟教授认为,有了数据拿来分析可以得出一个结论,但是其正确与否需要用工程技术的方法作保证,大家要沉下心做工程分析,然后评估数据从收集到应用的技术环节。从工程技术保障上来说,个人很难做这样的事情,要做这样大的事情,在应用上有价值的事情,真的需要大家合作来实现共赢。
明略数据CTO冯是聪在“大数据分析与管理”主题论坛作了题为“大规模复杂关联数据在公安领域的应用”的精彩报告。冯是聪表示,明略数据是专门做大数据的,认为公安领域特别适合作为大数据的应用场景。他列举了3个犯罪实例证明大数据在公安领域会发挥巨大作用。用大数据或者大情报帮助公安部门抓犯罪分子的问题如下,第一个问题就是如何把结构化和非结构化的海量数据聚在一起;第二个问题是如何在危害性非常强的涉恐案件发生前做预警;第三个问题就是时效性,时效性特别重要。
冯是聪用举例、视频演示的方式给出了大数据分析在公安领域的应用。最后就大数据分析技术应用在案例中的情况,提出了4个问题寻求领域专家的建议,包括:第一个是数据仿真的问题;第二个是预警问题;第三个是如何找一个评判模式,在大社群里面找出特异的样本;第四个是在超大规模上支持实时性和事务性,这和大数据里面很多理论是相悖论的。