戴卫章 滨海县统计局
大数据背景下对政府统计工作的思考
戴卫章 滨海县统计局
摘 要:互联网购物、物联网、云计算等技术的迅速发展,使传统统计工作中的数据来源、统计理念、统计方法等发生了重大变革,政府统计工作面临大数据带来的一系列挑战。本文对大数据背景下政府统计工作的优势及面临的机遇和挑战作了详细分析,并给出了对策建议。
关键词:大数据政府统计机遇挑战
麦肯锡全球研究所提出大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。如今,大数据已经深刻改变了人们的日常生活和工作方式,随着我国互联网购物、物联网、云计算等技术的迅速发展,必将推动传统统计工作中的数据来源、统计理念、统计方法等重大变革,政府统计工作面临大数据带来的一系列挑战。
(一)拥有海量的数据资源
政府统计数据来源主要有两种,一是人口普查、经济普查、农业普查以及常规调查所收集取得的各种类型数据,通过加工、汇总提供给政府相关部门进行分析供领导决策参考。二是工商、税务、质监等部门的行政记录。行政部门在行使监督、管理和服务等职能,如办证、登记、检查、税收、罚款等过程中形成的文字描述和记载是政府统计资料的一种重要补充。
(二)拥有不断更新数据的能力
我国目前已初步形成以周期性普查为基础,以经常性抽样调查为主体,综合运用全面调查、重点调查等方法,并充分利用行政记录等资料的统计调查方法体系。“四上”企业数据采集方式已经实现了通过互联网直接向全国数据中心报送原始数据、各级统计机构在线同步同享的工作模式。在价格、人口普查中,大力推广应用电子采价器、住户记帐器等电子终端采集原始数据并通过网络向全国数据中心报送原始数据。
(一)大数据背景下政府统计面临的机遇
1.大数据有利于政府拓宽统计数据来源渠道。大数据为政府统计调查工作提供了大量的原始数据。运用高科技手段进行数据搜集和数据挖掘工作,可以大量减少统计调查负担、缩短数据生产时间,从而提高统计工作的效率。
2.大数据有利于政府推进统计信息化建设进程。要运用大数据,需要提供相应的软件和硬件技术,提高数据挖掘分析能力的技术、工具和方法,这对政府统计信息化建设提出了更高要求,推动政府加快统计信息化建设。
3.大数据有利于政府提高统计数据质量。通过物联网和互联网等设备产生的数据,基本上避免了人为干预数据的可能,搜集的数据更真实、可靠,也从侧面验证政府统计数据真实性,从而倒逼政府必须提高统计数据质量,才能提高统计公信力。
(二)大数据背景下政府统计遭遇的挑战
1.大数据挑战政府统计数据垄断地位
大数据时代政府统计部门不再是数据的唯一拥有者。长期以来,传统统计服务产品单一,服务渠道狭窄,绝大部分服务对象是政府机构,提供给一般企业和个人的信息较少,统计信息效用大打折扣。当前,社会公众和企业经营者对统计数据的需求日益旺盛,迫切需要贴合他们需求的统计服务产品,而大数据的出现,恰好满足了这一需求。政府统计数据的垄断地位将受到挑战。
2.大数据挑战政府统计数据整合能力
大数据时代的数据服务,不再是政府统计机构一家的事情,它是政府各部门以及各专业机构掌握数据资源的总和。政府统计机构亟需建立统一的数据信息共享平台实现全方位数据共享,避免不同部门数据各自为战现象,这对政府统计机构整合能力是一项挑战。
3.大数据挑战政府统计数据搜集智能化水平
与传统统计方法不同,大数据时代数据来源于信息技术记录下的原始数据,这些数据仅仅依赖于测量方法(如阿里巴巴、GPS 定位系统、ETC 电子收费系统),都是无意间获得,不需要调查对象刻意配合。政府统计机构若不提升数据搜集智能化话水平,统计调查难度将加大,数据可靠性也得不到保证。
4.大数据挑战政府统计数据分析能力
“大数据”背景下的数据分析,面临的是大量存储于各处(包括“云端”)的非结构化或半结构化数据环境,首先要将这些无法识别和运算的信息转化为结构化的数据,针对结构化的海量数据分析挖掘数据之间的内在关系,寻找更多价值信息。在这一背景下,数据分析就变成了统计部门一个关键性的环节,需要专业化的数据挖掘与处理技术。
1.加强大数据基础环境建设
建设完善大数据云计算运行环境,利用云计算环境下的分布式存储的多服务器存储资源满足海量、多类数据的存储需求,构建高效、可扩展的大数据存储体系,同时保证数据读写操作的安全性,提供可靠性与高性能。充分发挥云计算并行计算、按需分配资源等优势,构建高效的快速大数据集群处理环境,支撑各类数据统计、分析、挖掘、预测和可视化展示。
2.加强大数据处理技术水平
目前,我国的统计工作人员计算机应用水平参差不齐。大数据时代,统计人员应具备较高计算机信息处理技术,要懂得大数据采集、设计和挖掘方法。统计工作人员应向数据专家、数据分析师方向转变,因此有必要加强现有统计人员统计数据处理技术培训。
3.加强统计数据的管理
大数据时代统计数据的搜集方式多样,这就要求政府统计部门强化对统计数据的管理。目前“联网直报”采取IP 定位控制、修改痕迹保留等方式就是统计数据管理的应用。比如为了保证每个采价员按照“三定原则”进行采价,可以对每台采价器进行数字化定位,其采价的时间、地点、数据情况可以即时传到服务器,即可进行监测管理。
作者简介:戴卫章(1983-),男,汉族,江苏连云港人,统计师,南京财经大学本科学历,西北师范大学硕士研究生。单位:江苏省滨海县统计局,研究方向:数量经济学、统计学。