全湘溶 中国信息通信研究院数据研究中心助理工程师
大数据对信息社会的促进作用分析
全湘溶中国信息通信研究院数据研究中心助理工程师
摘要:随着信息通信技术的飞速发展,每天都有大量的数据产生出来,信息被快捷地传递到世界各地,存储在世界各地。大数据逐步成为热门话题,人们希望依靠大数据能进一步提高生产效率,改善所接受的服务质量,但是因为大数据本身缺乏明确的概念边界,使得人们对它产生了或过高、或过低的预期。本文从大数据应用的一些情境出发,讨论了大数据的本质和应用边界,为运用大数据促进信息社会发展提出了积极建议。
关键词:大数据;征信;组织竞争力;管理;公共服务
近年来,大数据成为了一个炙手可热的词汇,各行各业都在谈论大数据对其发展的影响,都希望依靠大数据实现转型发展、提高生产效率和质量。但是对于什么是大数据,学术界、工业界都没有一个公认的定义,更没有一个量的标准。本文所指的大数据,在对《大数据应用中的若干问题》中的内容进行适当修正后,按照以下4条标准确定:
第一,数据运算量超过了1台通用计算机的运算能力,或者必须使用超过1台计算机提供存储和计算资源,才能使运算时间在可容忍范围之内。
第二,采用可无限拓展的存储、计算技术手段。
第三,用于计算的样本等于或非常接近于潜在的、定义说明的总体,即采用全量计算或接近于全量计算。
第四,结果依靠算法驱动得出,而且是基于多维度的数据。
2015年,国务院发布了《促进大数据发展行动纲要》,把发展大数据重要性提高到了国家战略的高度,更多的专家学者投身于大数据的研究和实践领域,然而在媒体对大数据成果的相关报道中,不乏浮夸之处。受各方炒作的影响,很多企事业单位盲目上马大数据相关项目,造成了资源的浪费,有必要对大数据的应用树立一个理性的认识,使其能够对经济社会发展起到应有的促进作用。
大数据在各行业中的应用有很多,这里仅举金融征信方面的例子和采用了大数据相关技术的企业经营、发展的例子做分析,意图说明大数据并没有看上去那么万能,要发挥其积极作用需要在一个清晰的范围内,不能滥用大数据技术和相关成果。
(1)在金融征信行业中的实践
2015年,中国人民银行向多家企业发布了准备开放征信行业发展的通知,中国的征信行业进入了一个新的发展阶段。随着大数据相关技术的成熟,以及小额贷款等金融业态的蓬勃发展,开放企业征信能够增加金融市场活力。有人认为,使用大数据征信能够解决信息不对称问题,降低贷款风险。然而,从实践经验看,尽管使用了大数据技术,也搜集了大量关于个人的信息,人们仍然不能消除信贷的风险,大数据征信的结果也很难被采纳为信用计算的基础。
征信第一原则是准确,任何造假的信息都不能够被接纳。但是从电商交易看,尽管相关企业已经采用了多种方式打击刷单等现象,但是仍然无法禁止这种事件的发生,如果这个问题不能彻底解决,刷单骗贷现象就无法杜绝。另外,因为大数据本身的特点就是不精确,它本身是依靠样本空间的增大来消除一些异常样本的影响,金融作为高风险行业,坏账率每升高1%,都会使得金融机构利润的明显下滑。如何保证大数据征信算法能够长期维持极高的正确率和可信度仍然没有一个公认的判定结果。理想状况是,依靠大数据进行信用计算,不再需要信贷员进行资格审核。但是实际上,任何商业银行都无法放心地把信贷审核工作交给计算机算法,仍然需要依靠信贷员进行最终确认。影响某人信贷的因素非常多,用于大数据计算的原材料可以当作放贷之前核查的重要参考,但其计算结果却不能直接利用,贷款与否不仅与贷款人资质密切相关,也与所处行业、所在单位等密切相关,如果采用的数据出现偏差,决策风险就会剧增。
对于那些纯网商而言,其大部分的资金流水都在网络上有记录,可以利用这些数据从事信贷业务,但是对于消费者而言,其网上消费额占总开销比例有很大的不确定性,依据网络交易行为发放小额消费贷风险尚可控制,对于金额较大的项目就无法获得充分的保障,比如P2P这样的互联网金融,借款人的资质基本无法通过“大数据”征信进行保障,大量P2P公司跑路就能说明其所标榜的“新金融”、“大数据风控”纯属无稽之谈。因此,很多众筹项目实际上成为了非法集资,并不因为“大数据”的实验而发生本质变化。在各种数据资源仍处于割据的时期,众筹炒房、众筹股权融资等行为无异于聚众赌博。即便各种网络上的数据能够集中起来进行挖掘利用,长期看这样得出的信用评级也无法成为行业公认的标准。
相对于无序地盲目搜集各种网络行为数据以计算个人的信用评级,不如稳健推进多级信用形成体系建设。首先是人民银行与各个商业银行共同构建的基础信用库,记载着人们的真实资金流水和信贷情况;其次是由各个公共事业部门提供的补充数据,如水电燃气等缴费情况、电话火车飞机等的缴费情况等,这些数据相对而言重要性小,说明性差一些,仅仅作为补充参考;最后就是各个企业自行搜集的特色数据,作为持牌企业进行信贷活动的判断材料,自行承担风险,自负盈亏。我国征信现在需要做的工作还很多,比如信用数据的报送以及各种报送数据重要性分类、时效性判断等精细化管理,都不能通过大数据而一劳永逸地解决。
(2)大数据对企事业单位竞争力的作用分析
受经济下行压力增大的影响,许多企业都在谋求转型发展,或涉足不相关行业,或希望通过各种改革提升经营效率,使自己能够挺过这段艰难的时期。当下热门的大数据技术备受重视,然而各种炒作的话题容易让人失去必要的理性,一些企事业单位盲目地投资了一些劳民伤财的项目。
很多例子可以证明,大数据并不是企业具备竞争力的充分条件,甚至不是必要条件。根据中国互联网络信息中心发布的中国移动互联网调查研究报告(2013—2014年)显示,百度地图APP市场占有率为63.7%,而谷歌地图为13.9%,腾讯地图占比约11.9%。从大数据技术的角度讲,3家都是大数据企业,谷歌的技术甚至领先于百度、腾讯,然而它在中国的市场率很低。如果不考虑国外的企业,腾讯这个有海量用户基础的企业旗下的购物网站拍拍,运营结果远差于淘宝,甚至弱于京东,以至于不得不最终与京东商城达成商务合作和股权投资协议,做了资产剥离重组。以上公司都有自己的大数据系统,也有充足的人力、物力进行投资运维,但是腾讯的地图业务和电子商务都在同行业中较为落后,说明大数据技术与否不是企业具备竞争力的充分条件。
具有数十年经营历史的沃尔玛超市,从SEC网站查寻其上市以来的运营表现,可以看出在2005年以前,其营业收入都能以两位数增长,当时并没有什么大数据的技术可以为其提供长达30年的帮助;2005年以后,亦或大数据技术概念开始升温后,“啤酒—尿布”的故事人尽皆知,但是沃尔玛的销售额却只能勉强以个位数增长,甚至下滑。沃尔玛曾经投资过巨大的数据中心以提高效率,但是仍然没有挽救营收放缓的势头。
因此,是否使用大数据技术,并不是企业核心竞争力的表现,还需要考察具体所处的行业环境、选取的商业模式等非数据化因素。就沃尔玛这家超市公司而言,需要比较的是其运营成本,以及购物体验能否与电子商务公司相竞争。
(1)信息数据化是大数据发展的根本动力
要发展大数据,首先需要知道是什么原因形成了大数据。在过去,存储成本高昂,传输速率低下,信息技术关注的重点是如何减少存储空间和对资源的占用。多年后,随着各种成本的快速下降,人们开始存储一些在过去会被清除的数据。从根源上来说,大数据生成的基础是人们在生活中产生的各种信息,这些信息在过去或被无意识地忽略,或被有意识地删除。现在,人们有条件把这些信息存储下来,而各种计算机算法的发展又使得人们能从新的角度看待这些过去存留的信息。所以,大数据尽管是一个新概念,但并不是新事物,只是人们对待信息的方式和能力发生了变化的表现。
孤立、单一的信息是缺乏价值的,只有相互连接的信息才能够产生价值,引发大家的研究兴趣。要发展大数据,首先需要让信息形成数据,让一些无形存在的信息被以数据的形式固化下来,成为可视听、可感知的东西;其次是让数据上网,让各种本来不相联系的数据能够以极低的成本组织起来。也只有如此,大数据才能获得源源不断的发展动力。
(2)审慎评估大数据系统建设的条件成熟度
大数据能否给组织带来收益,主要还是看是否具备发展大数据的条件。张小彦介绍的美国DELTA大数据应用准备程度评估工具能够便捷地初步评价组织是否有条件上马大数据相关项目。这个工具从以下5个方面对一个企业(或单位)进行评估:
●D指数据(Data)。
●E指企业环境(Enterprise)。
●L指领导重视(Leadership)。
●T指目标(Target)和技术(Technology)。
●A指分析人才(Analysts)。
以上5个方面的标准缺一不可,对数据量和质量的要求能够保证大数据系统持续获得有效信息,企业经营环境的评估可以保证大数据系统确实能够为提高企业竞争力、降低成本或者产生可测的新价值,领导重视是大数据发展的组织保障,目标明确和技术实力则是大数据系统能够有力支持发展的必要条件,高水平的分析人才队伍则是大数据能否有效运转的关键因素。
(3)成本效益仍然是应用成败的最终衡量标准
如果DELTA工具的分析得到了通过,大数据应用的成败仍然需要通过企业的综合成本效益变化来衡量,或降低成本,或增加营收,如果对大数据系统的投资在适当长时间内没有达成这些可测的目标,很难说上马这个项目是成功的。如上文所说,建设大数据系统是企事业单位提升竞争力的非充分、非必要条件,而企业经营状况的改良则是其成败的核心标准。
在当前的环境下,大数据所带来的想像空间巨大,但真正全面走入人们的生活,特别是在预测、规划、决策方面影响人们生活,还需要学术界做更多的工作。学术前沿的问题转化为工程问题需要一个不确定长的周期。
(4)信息公开、数据共享应观念先行、制度保障
因为信息数据化是大数据形成的根本动力,所以在发展大数据的时候,比建设信息系统更重要的是改变过去的信息封闭观念,在加强信息安全保障和合理划定安全级别的前提下,把信息公开、数据共享作为大数据发展的出发点和落脚点。政府、行业协会、企业本身等各个相关主体,要积极通过立法、设立自律准则以及发展信息安全技术等多种形式,一方面保障必要的个人隐私,另一方面促进相关信息的公开。政府部门特别要作为信息公开、数据共享的表率,落实《促进大数据发展行动纲要》的相关要求,为大数据服务大众生活、创新创业营造良好的环境。
(5)公共部门要积极适应信息公开大趋势,努力提升服务质量
公共部门发展大数据,不是各个系统或地方自行建造大数据系统,而是划分责任,大部分单位进行信息公开,少部分单位从事信息整合、数据交换,这其中还可能涉及到公私合作的问题。例如,一些对外服务的窗口单位,如派出所、民政局等,就可以与点评类互联网企业合作,接受大众对其服务的监督。同时,也可以发动私有部门对有普遍意义的公共服务部门的信息系统进行对接,形成办事流程的全程公开。相关事务办理到什么节点、还需要多久、有什么法律法规可依,都可以在网上方便地查询到,这样节约了公民来回咨询的交通成本、时间成本,同时对于一些服务态度差、办事效率低的个人或部门,形成有效的约束,对相应机构的管理优化提供了数据支持。
建设智慧城市,离不开大数据的支持,但组织或个人不能把发展大数据简单理解为兴建IT系统,或者对已有系统的一种升级改造。小数据充分实现了信息公开、数据共享,最终就会变成大数据的一部分。同时,发展大数据,也应该先从小数据方面入手,积少成多,实现集约化演进。应该允许有条件的非公有制企业整合公共服务类的数据,帮助他们实现发展大数据的目标。例如,小汽车摇号结果、煤电燃气的缴费等,已经逐步可以在手机上方便地进行,更多的部门应该效仿,把依靠大数据便利人们的衣食住行作为首要目标。
大数据在未来能够为人们的生活带来巨大的便利,对于一些行业也会形成深刻的影响,需要正确认识大数据形成的原因和其利用的各种局限性,才能理性地对待它。如果盲目地相信大数据,认为依靠大数据就能消除信息不对称,实现对事态的全监控,甚至实现决策的自动化,本质上和20世纪的计划经济思想并无差别。为了使得大数据能够对信息社会发挥积极的促进作用,有必要对大数据的概念、技术成熟度评估、应用场景和局限性等方面进行更多讨论。
参考文献
[1]全湘溶,赵妍.大数据应用中的若干问题[J].现代电信科技,2016(1):13~19.
[2]赵燕,牟啸天.个人征信机构数据采集标准研究——看美国征信机构如何报送数据[J].标准科学,2015(4):94-96.
[3]王强“.垃圾进垃圾出”:大数据征信的难题[OL].财新网. http://opinion.caixin.com/2015-04-23/100802880.html.
[4]李勇.积极探索个人征信数据元推动征信标准化建设[J].征信,2012(4):53-55.
[5]CNNIC.中国移动互联网调查研究报告[R/OL]. http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/ydhlwbg/201408/P02 0140826360212699278.pdf.
[6]张小彦.大数据应用的准备程度财新网[OL].http://opinion. caixin.com/2016-02-29/100913826.html.
[7]Hayek F . The Use of Knowledge in Society[J]. American EconomicReview,1945,35(4):519-530.
Analysisonthe promotion big data to information society
QUAN Xiangrong
Abstract:The technology of information and communication has developed rapidly for decades, enormous data is generated daily, innumerable pieces of information is spread and stored all over the world. People research on big data aiming at improving productivity or optimizing service. But they also hold too high or too low goals as the concept and connotation of big data are not clear. This paper firstly introduces two situations to illustratehowbig data can not do, and finally put up with some positive suggestionsonhowto promote the development of our societybybig data.
Keywords:big data; credit investigation; competence of organization;management; public service
收稿日期:(2016-03-10)