大数据时代中国政府统计调查体系改革研究

2016-04-12 01:50陈光慧
商业经济与管理 2016年6期
关键词:抽样调查大数据

陈光慧

(暨南大学 经济学院,广东 广州 510632)



大数据时代中国政府统计调查体系改革研究

陈光慧

(暨南大学 经济学院,广东 广州 510632)

摘要:科学、合理的调查体系设计是保障各项调查工作顺利开展并保证调查数据质量的前提。当前大数据时代的来临,客观上要求我们在统计调查体系方面进行相应改革,以充分挖掘大数据在政府统计中的利用潜力。文章从思想意识、思维方式、工作作风、调查方法、调查手段、调查内容、调查项目、调查指标以及数据发布与后续分析等内外多角度对中国政府统计调查体系提出一系列改革设想。这套体系通过解决现行调查体系存在的各类问题,将传统的调查方法与新式的电子化记录数据结合起来,整合利用各类大数据资源,目标是更加准确、及时、全面和连续地产生各类宏观时间序列数据和微观纵向数据,以此推进中国统计管理体制的改革与发展。

关键词:政府统计;调查体系;抽样调查;行政记录;大数据

一、 引言

随着全球信息化、网络化时代的到来,大数据正在政府行政管理、企业生产经营和居民商务活动等众多领域源源不断地产生和积累着,这些都在慢慢改变着传统的政府统计调查方法和数据搜集方法[1]。为了更好地适应大数据时代的要求,有必要充分挖掘和利用大数据在政府统计中的应用潜力,更好地将普查、抽样调查等传统的调查方法与政府行政记录、企业生产经营和居民商业记录等新式数据来源形式相结合,是新时期政府统计调查体系改革的方向。

科学、合理的调查体系设计是保障各项调查工作顺利开展并保证调查数据质量的前提[2]。这些年来,中国政府统计部门一直在积极行动,针对不同的问题从不同的角度不断地进行改革和尝试[3-5]。但是,到目前为止,还没有从根本上解决统计调查数据质量不高的难题,改革之路仍然是任重道远。

因此,本文针对大数据带来的冲击和挑战,在全面总结现行调查体系内外存在的各方面矛盾和问题的基础上,通过对新形势下中国政府统计调查体系进行一系列改革,构建一套适应中国政府管理体制的统计调查体系,将传统的调查方法与新式电子化记录的大数据结合起来,整合利用各类大数据资源,最终产生更加准确、及时、全面和连续的社会经济统计数据。

二、 中国政府统计调查体系的现状分析

近年来,中国逐步建立起以周期性普查为基础、经常性抽样调查为主体,辅之以全面报表、行政记录、重点调查、科学估算等多种方法综合运用且较为全面的政府统计调查体系,改革内容涉及调查方法、调查手段、调查项目、调查指标,以及数据发布与后续分析等方面,具体归纳如下。

第一,在调查方法方面,抽样调查与统计报表制度结合应用,抽样方法逐步得到推广使用,但统计报表制度仍占据主导地位。目前,国家统计局应用的调查方法门类较为齐全,但主要还是使用统计报表的调查方式,不过,抽样调查和行政记录等方法的应用范围在逐步扩大。

第二,在调查手段方面,不断应用高科技手段提高数据搜集的效率。随着互联网技术的发展,国家统计局在很多调查领域已逐步建立起网上直报系统,如工业企业联网直报系统、3000家房地产企业直报系统。从2011年起,国家统计局逐步推广企业一套表制度,采用联网直报方式搜集数据,有效减少中间环节对原始调查数据的干扰,保证源头数据的准确和及时。

第三,在调查项目和指标体系设置方面,现行调查体系基本覆盖了国民经济各个行业,反映了社会经济生产、生活的方方面面,在一定程度上满足了国家宏观经济管理的需要。据统计,现行国家统计调查制度共46套,583种报表,11310个指标[6]。此外,各省统计局和调查总队为满足地方政府宏观经济管理的需要,都增加了不少反映地方经济特色的调查项目[7]246。

第四,在调查数据发布与后续分析方面,国家统计局也在不断改革,取得了很大成效。从整体上看,基本做到了基本统计数据发布内容和时间的事前公开,如果由于特殊原因推迟数据发布日期,也会及时在官方网站上或者以新闻发布会的形式向外界公布。主要宏观统计数据及时进行了大量的后续分析,为各级政府提供决策参考。

近年来,国家统计局一直在调查体系方面进行大胆的改革。从2011年开始,在全国着力建设“四大工程”,即统一的基本单位名录库、统一的一套表制度、统一的数据采集处理软件平台、统一的联网直报系统。“四大工程”是统计调查流程的系统再造,对于推进统计数据采集、传输、汇总、加工环节的科学化和规范化,提高基础数据质量具有重要意义。

三、 现行政府统计调查体系存在的问题分析

在肯定上述成绩的同时,我们也应看到,在逐渐来临的大数据时代,调查主体和数据来源的多元化发展趋势给政府统计数据的生产方式带来了诸多挑战,不断冲击着政府统计管理体系;而现行统计调查体系还没有完全摆脱全面统计报表制度的惯性和束缚,难以从根本上适应市场经济体制和与国际统计惯例接轨的需要,具体表现在以下几方面:

(一) 政府统计人员在思想意识、思维方式和工作作风方面存在不利于现代统计调查方法创新、推广和应用的制约因素

1.在思想意识方面,由于统计部门长期实行全面统计报表,有些统计人员对抽样调查、行政记录等适应新形势需要的调查方法是否适合中国国情还存在疑虑,依然习惯于使用依附于计划经济体制的全面统计报表从上而下地布置统计任务。不少统计人员对抽样等其它调查方法的掌握还非常有限,并未完全接受其科学性,导致在实际应用中大打折扣。

2.在思维方式方面,中国人固有的传统思维模式不利于现代调查方法的推广应用。中国自古以来就有“大事化小,小事化了”的思维惯性。当统计人员在实际调查中遇到问题,总是尝试应用较为简单和实用的方法化解这些问题,而不是直接面对并尽力改进已有的调查方法来解决这些问题。这种思维模式长久运行下去必然造成理论与实践脱节,难以互相促进。比如,在某些实际抽样调查方案中,关于抽样设计、估计方法、精度安排等方面的论述都较为简单、笼统,在实施调查时存在很大随意性。

3.在工作作风方面,调查理论研究与推广应用没有很好地结合。改革开放后,调查理论研究得到空前发展,不少经典文献引入到中国,如科克伦版《抽样技术》于1985年翻译出版,推动了抽样方法在中国的传播和发展;国内也陆续涌现出不少优秀学者对调查理论及应用展开了深入研究。但是,中国很多调查理论专家都是高等院校和科研部门的学者,他们很少有机会真正参与到实际调查工作,也就难以将理论研究与实践相结合,研究内容大多停留在理论层面,对调查实务的指导作用有限[8-9]。

(二) 现行数据搜集方式难以适应大数据时代全球网络信息化发展需要

如何改进调查数据的搜集方式,确保数据准确、及时、全面和连续,这也是调查体系中应该考虑的问题。近几年,省级以下各级调查部门要求改革调查数据搜集方式的呼声越来越高,加之信息通讯技术和互联网络的飞速发展,为实施统计调查一体化奠定了良好的技术保障。

在大数据时代,随着办公电脑和个人电脑的普及、互联网和数据库的健全,网络平台建设的最佳时机已经到来,从而利用最先进的信息技术改造传统的数据搜集方式。网络平台建设是指在计算机网络环境下进行大数据的整合、筛选、采集、传输、处理、存储、分析,将统计信息生产的各个环节进行融合,形成高度自动化的信息生产。目前,统计部门已经实行的大中型企业联网直报制度取得了良好效果,但在其它调查领域还未建立起专门、独立、完整的统计调查直报平台,难以适应大数据时代的社会发展需要。因此,如何整合多种数据来源,同时兼顾和融合传统的现场调查与联网直报方式是当前急需解决的问题。

(三) 统计报表制度仍然占据主导地位,排挤了抽样调查、行政记录等调查方法的正常发挥

若单纯从调查方法上看,统计报表其实仅仅是一种调查数据的搜集方式或手段而已,是计划经济时代的产物。在当前社会主义市场经济体制下,由于统计管理体制改革的滞后,工业、建筑业、服务业等一系列重要调查领域执行的依然是全面统计报表制度。

面对这么多的报表,一方面,基层调查人员处于被动应付、疲于奔命的状态,使得实施效果大打折扣;另一方面,企业统计基础、统计台账不健全,造成很多企业经常是预计或估计报表数据,而由于时间和人力的限制,调查人员也无法认真审核源头数据质量。在当前调查体系下,虽然统计报表制度已经担当不起主导作用,但依然没有退下来,造成经常性抽样调查、行政记录等新式的调查方法难以正常发挥。

(四) 调查项目设置不合理,造成重复、繁琐、过时

在大数据时代,社会经济各个领域将逐步面临海量数据。现行的各类抽样调查项目和调查内容必将显得更加琐碎、重复甚至过时,同时又缺乏相应的统计指标及时反映社会经济发展变化的新情况。主要问题如下:

第一,调查项目重复现象严重。以工业企业调查项目为例,有规模以上企业调查、规模以下企业调查、能源购进和消费及库存情况调查、大中型企业科技活动调查、工业品价格调查、企业投入构成调查、高技术产业企业调查、企业科技活动调查、企业劳动情况调查、重点企业调查和企业景气调查等十多种,这些调查的内容存在较多重复[10]。

第二,调查项目较为繁琐。目前,县级统计局和调查队一般只有十几人,却要承担大量的统计报表、抽样调查和专项调查任务,2005年县级统计局平均承担的国家调查项目有79.4项[11]。基层调查人员基本上是处于穷于应付、疲于奔命的工作状态。

第三,调查项目存在滞后性。随着社会主义市场经济的不断发展,新情况、新问题层出不穷,如土地流转及收益、城市房地产交易问题,还有一些应急的调查项目,如某些年份出现的生猪生产情况、食品(奶粉)安全问题,这些都难以及时纳入到现行调查项目中。

(五) 调查内容追求大而全,造成指标体系繁杂、老化

第一,调查指标过多、过细增加了基层调查负担,难以保证调查数据的及时、准确。据国家统计局统计报表清理结果显示,2006年统计公报指标有637个,而服务于公报的统计指标有2225个,占指标总数的24%;用于统计摘要、提要的指标有2552个,占28%;剩下的大量指标极少用到[12]。比如在农产量调查的农综年报(A302)中,稻谷细分为籼稻、粳稻、糯稻,小麦分为硬粒、软粒,这些指标都太过繁杂[7]246。

第二,调查指标存在老化现象。例如,在国内贸易统计中,仍然保留各种商品的购进总额、批发总额、零售总额,而这些指标对于政府宏观调控来说已经没有多大用处,但统计部门仍然在调查并统计这些数据,造成经费和人力的极大浪费,也加重了调查对象的负担。

(六) 调查数据资料的发布与后续开发机制还有待规范和加强

中国在定期发布调查数据方面有待规范,主要表现在调查数据发布内容不够全面。中国一般仅仅发布调查数据本身,而不公布调查数据产生的具体环节和过程。相反,西方发达国家在发布数据时,一般都会同时公布调查机构、调查方法、抽样比、抽样误差及回答率等相关信息,以便用户了解数据质量和信度[13]。

大量调查数据和行政记录数据后续没有得到充分开发和利用,大数据时代的海量统计信息浪费严重。其原因主要在于政府统计部门是分专业、分项目采集数据,由不同部门或专业司组织实施,数据处理采用不同的程序,调查成果被不同部门割据,不能共享,后续便难以得到有效地开发和利用。

四、 大数据时代中国政府统计调查体系改革的主要内容

鉴于上述存在的问题,本文在“四大工程”建设的基础上,借鉴国外成功经验,正视和顺应大数据变革潮流及有利形势,提出未来改革的基本思路为:紧密围绕大数据时代社会经济发展要求,进一步理顺政府统计管理体制,建立一套既适合中国国情,适应中国政府统计管理体制又符合国际惯例,科学合理、运转高效的政府统计调查体系,产生更加准确、及时、全面和连续的社会经济统计数据。具体改革内容如下:

(一) 改革政府统计人员的思想认识、思维方式和工作作风,消除制约调查制度与方法创新的内在因素

1.在思想认识方面,应大力宣传先进调查技术方法的科学性,提高政府官员、基层调查员和被调查者以及社会公众对抽样调查、行政记录的认同感。特别是当前,不少人主观上认为大数据时代不需要抽样,过早地否定了抽样的应用价值,这些在思想认识上的障碍和错误应及时消除,从而为中国更有效应用抽样技术等科学方法奠定良好的思想认识基础。

2.在思维方式方面,特别是政府公务人员应改变“大事化小,小事化了”的传统思维惯性和工作习惯。就调查部门来说,应用抽样调查和行政记录数据等方法是一项技术性非常强的政府公共事业,尤其在大数据时代,调查的各个环节和基本方法都不可避免会出现这样那样的新问题,政府统计人员尤其不能回避,必须直接面对,尝试应用自己的理论知识或改进已有的调查方法去解决。如果能这样持续下去,中国统计调查理论及其应用才能与大数据更好地融合,不断地得到相互推进和完善。

3.在工作作风方面,调查理论方法与推广应用应更好地结合,实现理论与实践的互相促进。政府统计部门应主动和科研部门和高等院校的研究型学者,特别是对理论有深入研究的专家学者进行合作,让他们有更多的机会真正参与实地调查工作,并对存在的问题进行理论研究,提出切实可行的解决方案。另外,从公务员录用的角度来看,调查机构应改革现行的录取方式,更多地招收一些对调查感兴趣,并有一定理论研究基础的人员进入调查队伍。如有可能,可直接从科研机构和高等院校选调那些对调查理论已有深入研究的学者进入调查队伍,提高调查队伍的专业能力。

(二) 改进传统的数据搜集方式,整合利用各类大数据

当前,信息技术的运用不仅可以改变统计工作方式,也能为数据搜集方法改革提供重要保障。政府统计调查部门应该积极采用先进的信息技术,紧密依托互联网,进一步加快统计信息网络化、自动化、现代化建设步伐,抓紧建立全国统一的统计登记平台和数据共享平台,积极探索建立快速、高效的统计调查平台,提高调查的科学性、准确性和时效性。

在报送平台方面,分步实施如下:首先,要建立专门的基层网络直报网,统一运用软件平台,统一调查表式,统一设置标志、统一数据处理方式;其次,开展试点,先在直属调查队系统实行,在基层调查网络聘用的调查员建立终端并试运行;再次,选择部门有条件的、素质较高的直接调查对象建立终端,开展基层网点数据的直报工作,条件成熟后再全面推广[7]301。

在信息来源方面,充分整合利用各类大数据,注重与抽样调查数据相衔接,减轻抽样调查的负担。针对政府各部门的行政记录、大型企业的商业记录和经营信息,以及个人的商务信息,加快研究将这些非标准化大数据转换为标准化统计数据的方法,积极开发能够自动导入大数据的软件,加快整合各类大数据的步伐。

(三) 完善经常性抽样调查和各类电子化大数据制度,限制和减少统计报表制度的使用

在市场经济条件下,抽样调查取代全面统计报表制度成为政府调查的主要方式,同时充分利用各类电子化记录的大数据,是社会主义市场经济和大数据时代的必然要求。

首先,应大力推广抽样调查方法,并在构建和维护抽样框、设计抽样方案、抽样估计和数据调整等方面尽量利用经常性抽样调查方法,同时充分利用各类电子化的记录数据作为补充数据或辅助信息,将其作为一项制度加以规范和加强。

其次,要限制和减少统计报表制度的使用,将统计报表限制在仅仅是一种数据搜集的方式,而不是一种调查方法。这就要求对现有的统计报表进行精简,减少其应用范围。目前,应按照调查网点分类标准将报表精简为企业法人类一套表、家庭住户类一套表和群体组织类一套表等。

(四) 精简、整合、增加调查内容、调查项目和指标体系

1.调查内容的精简、整合和增加。在市场经济条件下,中国政府统计调查应当及时从过去那种以各种具体产品的数量统计为主要调查内容转变为以各种宏观统计数据为主要调查内容,这是适应政府职能转变,满足政府对国民经济进行宏观调控的客观需要。

2.调查项目的精简、整合和增加。为了更好地适应调查内容的转变,本文将现行的各类调查项目进行精简、整合,划分为如下三类:(1)人口住户类调查,全面了解中国各类人口的收入、消费、就业、迁移等情况。(2)社会经济类调查,以各类基本单位为调查对象,全面系统地了解生产、经营情况,核算经济产出和分析国民经济各行业发展状况。(3)其它专项调查,了解社会经济发展过程中出现的新情况和新问题,随着社会发展变化还可增加其它一些调查项目。

3.调查指标的精简、整合和增加。目前,应主动适应大数据的特征和要求,科学设置抽样调查指标体系框架,合理把握指标数量的“度”,优化指标结构,填补指标缺口,规范指标名称,统一和明确指标含义,逐步建立科学、统一、简约的抽样调查指标体系。取消过时的、利用率低的指标,改进不易取得和无法与大数据衔接的指标,增加政府及社会各界普遍关注的、与社会经济发展相适应的指标。

(五) 建立和健全调查数据的发布与后续开发机制

1.建立规范的统计调查数据发布机制,按时向全社会发布有关统计调查数据。首先,发布数据的内容应具有更加广泛的涵义,具体包括调查数据的调查方法、取得方式、整理方法、调整方法、保密程度与方式、数据公布的时间与方式、数据资料的使用权限与公众知情权以及数据资料开发的广度与深度等各个方面。其次,建立和完善统计资料和统计新闻发布制度,统一对外提供和发布重要国民经济与社会发展的统计数据,确保统计数据发布的规范性和统一性。最后,统计机构和统计人员对在统计调查中知悉的私人、家庭单项调查资料和统计调查对象的商业秘密等都负有保密义务。

2.海量调查数据包含着丰富的信息,应当与大数据结合进行充分地开发和利用,反哺社会。特别是在经常性抽样调查和各类电子化记录数据下,不同时期的调查数据相互衔接,从而产生了一系列反映总体变化趋势的时间序列数据以及反映总体各部分变化的面板数据,我们可利用上述数据资料进行各种宏观经济分析。另外,还可建立重叠样本单元在连续各期之间的时间序列数据和纵向调查数据资料,我们可利用这些单项资料在企业和家庭等社会经济活动的微观层面上建立各种统计模型进行微观分析。

五、 结语

为了更有效应对大数据时代的冲击和挑战,本文从思想意识、思维方式、工作作风、调查方法、调查手段、调查内容、调查项目、调查指标,以及数据发布与后续分析等内外多角度对中国政府统计调查体系提出一系列改革设想。这套体系通过解决现行调查体系存在的各类问题,将传统的调查方法与新式的电子化记录数据结合起来,目标是更好地适应大数据时代的需要,从而能够更加准确、及时、全面和连续地产生各类宏观时间序列调查数据和微观纵向调查数据,进一步推动中国统计管理体制的改革与发展。

本文对现行统计调查体系提出了改革框架和思路,但还存在诸多不足之处,有待进一步研究,主要表现在以下几方面:

第一,大数据与传统的统计调查数据融合问题。虽然政府统计部门能够获得越来越多的大数据资源,但是作为研究总体变化特征的国家统计部门,还需结合传统的统计调查数据对大数据无法涵盖的领域进行推断估计。这时,必然存在两类数据如何融合并存的问题,特别是在数据结构、推断方法、权重调整和数据分析等方面实现合理兼容。

第二,本文主要对统计调查体系下的制度与方法等问题进行了研究,未能对该体系下的其它方面问题展开详细研究。改革和完善统计调查体系是一项系统性工程,还包括组织机构、法律制度、后勤保障等各个环节的改革;此外,诸如抽样框的维护和更新、小区域估计、多目标调查以及无回答等问题亦是实际调查部门必须面对和解决的调查技术方法性问题。

第三,现行政府管理体制是多年来多方相关利益主体博弈的结果,理论研究者和实际工作者往往无力改变这种管理体制,只能在自身能力允许范围内尽量改进某些调查制度与方法。因此,本文提出的改革思路在实际工作中需要根据具体情况加以修改和调整,还可能存在与当前政府管理体制不相适应的地方,这些都需要在实际改革过程中加以完善。

参考文献:

[1]郑京平,王全众.官方统计应如何面对BigData的挑战[J].统计研究,2012,29(12):3-7.

[2]李金昌.论我国统计调查运行体系的重新构建[J].商业经济与管理,2004(10):4-10.

[3]李金昌.对我国统计调查方法体系改革的回顾与展望[J].统计研究,2002,19(7):32-35.

[4]雷钦礼.中国政府统计抽样调查制度的总体框架研究[J].山西财经大学学报,2004,26(5):21-28.

[5]曾五一.统计调查体系与调查方法问题研究[M].北京:中国统计出版社,2009.

[6]李强.新中国政府统计调查制度的建立、发展和改革六十年[J].统计研究,2012,29(8):3-7.

[7]国家统计局统计设计管理司.全国统计制度方法重点研究课题报告[M].北京:中国统计出版社,2009.

[8]金勇进,戴明锋.我国政府统计抽样调查的回顾与思考[J].统计研究,2012,29(8):27-32.

[9]刘建平,王克林.中美抽样调查发展的比较与思考[J].统计研究,2009,26(9):21-27.

[10]胡安荣.认识与行动——统计改革探索[M].北京:中国统计出版社,2005.

[11]欧卫东.科学发展观与深化政府综合统计体制改革[J].统计研究,2008,25(2):12-16.

[12]中华人民和国国家统计局.国家统计调查制度[M].北京:中国统计出版社,2007.

[13]权贤佐.探索:统计创新与现代化[M].北京:中国统计出版社,2002.

(责任编辑孙敬水)

Research on the Government Reform of Statistical Survey System in China in the Big Data Era

CHEN Guang-hui

(SchoolofEconomics,JinanUniversity,Guangzhou510632,China)

Key words:governmental statistics; survey system; sampling survey; administrative records; big data

Abstract:The design of scientific and rational survey system is the premise that guarantees the smooth flow of a survey and ensures the quality of survey data. In the current era of big data, reforms of statistical survey system are necessary in order to fully tap the potential of big data in the government statistics. In this paper, a series of reforms are put forward for the Chinese governmental statistical survey system both internally and externally, including ideology, way of thinking, work style, survey methodology, survey instruments, survey content, survey items, survey indicators, and data publishing and subsequent analysis. Through these reforms, the current survey system could solve various existent problems, and combine the traditional survey methods and new electronic record data, and integrate the use of all kinds of big data resources. The reform goal is to produce more accurate, timely, comprehensive and successive macroscopic time series and microscopic longitudinal data. Ultimately, the reforms would promote the development of the Chinese statistics management system.

收稿日期:2015-12-30

基金项目:国家社科基金青年项目“超总体模型辅助条件下抽样估计方法及其应用研究”(14CTJ014);广东省优秀博士学位论文资助项目“基于连续抽样调查的时间序列数据产生机制研究”(sybzzxm201120);全国统计科研计划项目“现代抽样技术在政府统计中应用研究”(2012LY014)

作者简介:陈光慧,男,教授,博士生导师,经济学博士,主要从事政府统计调查与数据分析研究。

中图分类号:C811

文献标识码:A

文章编号:1000-2154(2016)06-0092-06

猜你喜欢
抽样调查大数据
对整群抽样与分层抽样结合使用的探究
计算机辅助的抽样调查应用框架探讨
《抽样调查》实验教学创新性研究
中小企业融资问题研究及对策
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索
城市居民住户调查抽样框存在的缺陷及优化策略分析
简述抽样调查在“大数据”时代下的意义