李士猛 步倩
摘 要:大数据时代的来临,海量般的数据从简单的处理对象开始转变为一种基础性资源,如何更好有效地管理和充分挖掘利用大数据,对我国统计提出极大的挑战。本文重点阐述大数据对经济统计和政府统计带来的影响,并提出相应的建议。
关键词:大数据;统计数据;政府统计
一、引言
随着信息技术的不断发展和普及,大数据时代悄然而至,给世界各个行业带来前所未有的变化。大数据时代不仅带来海量数据,而且开启了人们利用数据的新模式,给传统统计带来前所未有的强有力冲击。企业、公司等如何利用海量数据,政府部门如何在统计工作中结合大数据改革现有统计流程,成为经济统计学者们亟待思考和解决的问题。
二、大数据定义及其特征
1.大数据的定义。大数据概念最早源于IT行业的数据库领域,被认为是表示数据量很大、数据形式多样化的非结构化数据,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。从数据的类别上看,"大数据"指的是无法使用传统流程或工具处理或分析的信息。究竟什么是大数据,目前还没有权威统计的定义,但是大数据必将带来社会新的变革。
2.大数据的特征。(1)数据容量巨大。从TB级别,跃升到PB级别。传统的统计数据收集包括抽样调查、普查等等,所得到的数据量和大数据容量不能相比。据统计,目前世界储存信息量的速度比世界经济的增长速度快4倍,计算机处理数据的速度比世界经济增长速度快9倍。(2)数据类型繁多。包括网络日志、视频、图片、地理位置信息,等等。世界每天以飞快的速度储存着大量的数据,这些数据以复杂的形式记录下来,来供人们利用,但是其中只有很小部分被利用。(3)价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。海量的储存数据中,蕴含着巨大价值,但实际有意义的数据,就在其中的特别小的一部分。(4)处理速度快。这一点也是和传统的数据挖掘技术有着本质的不同。物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或者承载的方式。
三、大数据对统计的影响
1.大数据对经济统计的影响。(1)数据收集方式的变化。传统的数据收集方式通常包括:普查、问卷调查、抽样调查、报表收集等等。传统的数据收集方法已不能满足现代人们的数据的需求,传统的数据收集方式已也不适合大数据时代的数据收集,并且海量数据的处理和分析传统的应用软件也无法实现。这就要求需要转变新的数据收集方式、处理分析手段与之相适应,才能更好的开发海量的数据库。(2)不再依赖随机抽样。传统的数据采集中,随机抽样、抽样分析扮演着很重要的角色。但大数据时代的到来,我们需要分析更多的数据,甚至可以得到与某些现象的全部数据。全数据模式已成为一种可能,大数据分析采用所有数据,能带来更高的准确性和时效性。(3)不再寻求因果关系。传统的统计工作中,习惯性去寻求一种因果关系。在大数据时代,我们不需要再去发现事物之间的因果关系,而更需要我们关注的是事物之间的相关关系,通过分析数据之间的相关关系,来发掘数据中的价值。
2.大数据对政府统计的影响。与传统政府统计相比,大数据能够给政府统计带来翻天覆地的变化:扩充记录内容量,扩大调查样本范围,提高调查时效和结果的准确性。
(1)居民消费价格调查。当前采用的居民消费价格(CPI)中包含很多种类,包括食杂店、百货店、超市、购物中心、农贸市场及服务消费单位等,每月发布一次,存在一定的滞后性。如果应用大数据技术,调查范围更加广泛,样本量更大,得到的CPI是对市场价格的实时反映,可以做到每天发布,提高价格调查的时效性和数据质量。
(2)人口普查。我国是一个人口大国,传统的人口普查是通过入户调查、填写问卷、光电扫描录入或人口录入数据而得到相关数据的。花费大量的人力、物力、财力,信息也有较大的时间滞后性。如果建立一套有效的人口管理系统,利用大数据库,可以高时效和高精度地完成全国人口普查。
(3)统计数据质量。统计部门每年要对我国经济社会各个方面进行检测,通过抽样调查获得大量数据,难免会出现误差。在大数据时代,政府部门如果建立一套有效机制,很好的利用大数据库,不仅可以减少统计误差,而且能够保证发布数据的时效性和真实可靠性。
四、结论
1.改进统计方法,充分利用大数据库。大数据时代带来了海量的数据,传统的数据收集方式已不能与之相匹配,全数据模式开启了统计方法的变革。在大数据库面前,传统的抽样调查没有被淘汰,而是一些抽样调查可以被全新的数据收集方式取代,通过新的收据处理可以更准确的反映社会经济现象。
2.有效利用大数据,提高统计质量。传统的政府统计,是在利用现有的统计方法来实现对社会经济现象的观测。大数据时代的到来,必然对原有政府统计产生强有力的冲击。政府部门可以通过现有技术条件,有效利用大数据库,不仅能够提高统计数据质量,而且能够提高数据发布的时效性。
参考文献:
[1]乔晗.“大数据”背景下利用扫描数据编制中国CPI问题研究[J].统计与信息论坛,2014(2):12-18.
[2]曾凡斌.大数据:一场管理革命[J].中国传媒科技,2013(1)
[3]涂子沛.大数据:正在到来的数据革命[M].广西师范大学出版,2012(7)
[4]李国杰,称学旗.大数据的研究现状与决策思考[J].战略与决策研究,2012(6)
作者简介:李士猛(1987- )男,汉族,河南信阳人。现为河南财经政法大学统计学院2012级研究生,研究方向:经济统计学;步倩(1988- )女,汉族,河南驻马店人。现为河南财经政法大学统计学院2012级研究生,研究方向:经济统计学endprint