王锐 谢杨
摘 要:国民经济核算是一套生产和表现国民经济统计数据的体系,是当代经济描述与分析研究的一种主流方法,其结合统计、会计与数学的知识,应用于经济领域。但是我国现行核算制度、方法和经济产业新趋势的矛盾导致了核算体系的局限。从我国国民经济核算的局限出发,在方法论层面,论述大数据的大量性、高速性、多样性等特点对经济核算的影响,以期探讨大数据与我国国民经济核算有效融合的路径。
关键词:国民经济核算;统计;大数据
国民经济核算是一套生产和表现国民经济统计数据的体系,是当代经济描述与分析研究的一种主流方法,是一种对宏观经济运行进行实证分析的工具[1],以描述经济结构和各部门、产业之间的关联。
我国现行国民经济核算体系的发展过程有三个主要阶段:计划经济时期,物质产品平衡表体系(System of Material Product Balances,MPS)阶段(1952—1984年);计划经济到市场经济转型时期,MPS与联合国国民账户体系(System of National Accounts,SNA)并存阶段(1985—1992年);市场经济深化发展时期,取消MPS,正式采用SNA体系阶段(1993年以后)[2~3]。该核算体系的演变一方面是为了适应我国经济体制改革和产业结构转型,另一方面是为了更好与国际体系接轨。
其核算体系中有关国内生产总值(Gross Domestic Product,GDP)、通货膨胀率、失业率以及贸易赤字等指标是进行宏观分析、政策规划的科学依据。一段时间以来,GDP甚至成了我国衡量各地区及整体经济成败的标准。但随着经济全球化、我国产业结构的变化,以及生产及消费方式的改变,传统的宏观经济数据与核算方法渐渐不能涵盖经济发展的全貌,这使得公民对于官方公布的GDP、房价、劳动报酬数据等产生了一定的质疑[4]。
随着5G、物联网、人工智能等技术的迅猛发展,大数据这个概念受到越来越多学者的关注,大数据的含义不单单等于数据量大,其还包含了范围更广泛、更实时的信息。除了传统数据及其处理技术外,大数据及其技术,如深度学习、机器学习、人工智能,使得研究者能更好地捕捉到经济生活各方面,所获取的数据也更加全面与及时。数据是国民经济核算的重要要素,而具有全面性、时效性的数据将能提升国民经济核算的质量与效率,从而更好地反映我国经济现状,发挥国民经济核算体系在宏观调控中的作用。因此,探討大数据对国民经济核算的影响具有理论和实践意义。
一、我国国民经济核算的局限
国民经济是由各种活动——生产(包括流通)、分配、使用等再生产环节的活动构成,具有多因素、多系统、多层次的特点[5]。整体来说,我国国民经济核算体系的框架与核心内容包括生产、收入分配、消费、投资和对外交易等[1](如下图所示)。
从1993年我国正式采用SNA以来,国家统计局一直在通过体制、机制、法治和技术的手段,发展和完善符合我国国情并能与世界更好接轨的核算制度与方法。但国民经济核算方法基于一定的统计学思想,这使得其本身存在一些固有的局限。此外,社会经济的变化使得传统核算方法无法很好地满足经济描述及分析的要求,这种局限性与不足存在于经济数据收集、处理及结果公布的全过程之中。
(一)数据收集与处理过程
1.现行体系核算范围限制。这种限制一方面是因为现行体系本身的框架与边界,一方面源于传统统计学的制度与方法。比如,由于传统国民经济核算忽视经济增长“副产品”因素,使得自然环境、自然资源、能耗等因素在数据收集及核算时被忽视,郑丽琳等人基于能值理论测算得2011—2016年安徽绿色GDP占传统GDP呈下降趋势[6];由于核算范围与对象边界的限制,使得与新兴经济有关的经济行为未被归入国民经济核算体系。宋旭光等人认为,共享经济催生新商业模式,产生大量非货币交易,使得实际的消费和服务业数字高于目前国家统计局一些传统口径数据的统计数字[7];由于传统的统计制度与方法,使得很多地下经济的产值和收入等被遗漏。王永兴测算发现,地下经济的存在使得我国的真实GDP水平被系统性地低估[8]。以上这些类情况使得某些经济行为无法客观被反映,从而影响国民经济核算的客观性、真实性等。
2.数据误差问题。经济数据收集过程中,由于收集条件、工具和人员失误等因素,数据很难保证完整与高质量,这样都会造成所采集数据的失真。比如在核算GDP时,理论上生产法、收入法及支出法应该一致,但实际操作时需要使用“统计误差”去调整三者间的差异[5]。
3.时效性问题。在数据收集及处理过程中,面对大量数据量,收集过程较为费时费力,如GDP、居民消费价格指数等数据采集。另外,统计资料上报均要符合各部门的统计要求[9],这不可避免造成数据汇总与处理及最后公布存在一定滞后性。比如当前GDP核算周期为一季度或一年,季度GDP可提供季度经济总量、经济增长率、经济结构和价格缩减指数等重要宏观经济数据[4],但若对于某些时间区间较短的经济行为,在季度数据基础上,进行统计分析,其经济描述及预测能力是有限的。
4.数据处理能力限制。传统国民经济核算体系只收集和处理结构化数据,但现实中存在大量非结构化数据,如音频、视频及半结构化数据,如HTML文档。近年来,我国网络购物、网络约车业务不断增加,比如2019年天猫“双十一”交易额突破2 000亿元(耗时约14小时21分)[10],电子商务快速发展使得相应搜索过程和交易平台产生许多半结构化、非结构化数据,传统统计方法对这些数据收集与分析,往往显得力不从心。
(二)统计结果的公布过程
我国统计结果的公布内容和形式相对单一。一方面,统计结果关注点在于宏观层面,这些数据对于政府有着重要意义,但对于中小企业和公众来说,宏观层面的数据往往无法满足其需求。例如,虽然统计结果有不同产业的价格信息,但企业个体无法了解到具体细分产品价格变动的信息;统计结果包括了劳动报酬情况,但居民无法了解不同年龄层劳动报酬情况。另一方面,现在核算结果的发布主要是通过新闻发布会、统计局官方网站、统计公报或年鉴,公布的数据主要是文字和数字,具有较固定的格式,其公布方式和手段相对刻板单调,可读性、可视化、交互性及生动性较差[11]。
二、大数据对国民经济核算的影响
根据维基百科定义,大数据(big data)并不等于数据量大,IBM提出大数据具有5V特点,即Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)[12]。大数据的大量性、高速性及多样性的特点,同时配合5G、物联网、人工智能等技术,从理论上来说,能提升国民经济核算过程中,经济数据采集与分析的准确性及时效性等,在一定程度上突破了现有局限。
(一)大数据采集、处理与发布
1.大数据应用于经济数据采集上。近年,人们利用各种新的科学技术成果,创造出各种获取全新数据的工具,如手机、手表、眼镜、穿戴用品、运输工具、制造设备、医疗设备等,数据借以上移动或固定设备为依托,产生大量结构化、半结构化与非结构的数据[12]。这种以物联网技术为基础的数据采集,如二维码技术、RFID技术、云计算技术以及传感器技术,能促进经济数据收集的全面提升。从核算覆盖范围来说,在权责发生制核算中,通过这些技术可有效记录整个生产服务过程,涉及产品创造实践、中间消耗使用时间以及提供服务的时间、货存产出变化、跨核算期的国际交易等[13]。当然,也可采集到与自然资源、环境污染、地下经济有关的经济数据,如PM2.5的时间序列、各片区域耗电量情况等;从数据时效性来说,其应用可以消去数据时滞性影响,在未来的体系中,运用大数据的智能抓取、运算和跟踪信息,必然会提高数据采集的时间频率,从而原来基于季度的数据公布,可以变为天,甚至小时[14],那么数据的时间滞后性就可以得到解决。
2.大数据应用于经济数据处理上。大数据结合深度学习、特征工程等方法可以处理半结构化与非结构化数据,这样就将这两类以往传统方法无法处理的信息涵盖在相关研究范围。另外,大数据的多样性和高速性运用到国民经济核算中,通过对各种数据进行挖掘处理,大数据技术可将更多与国民经济有关的因素包含到核算中,并进行高速分析,比如核算时,不仅可对交易型数据进行处理,还可将环保、科技、文化、教育等领域的非交易型数据进行转换,转换后再进行核算工作,这样就实现了核算口径的扩展。同时,可以保证在不低于现有处理速度的情况下,将分析维度从一维提升到多维,从不同角度分析经济数据,使得同一经济行为被多层次地解读。
3.大数据应用于经济数据发布上。在大数据技术下,可视化及良好交互式的界面并不成问题。同时,配合数据挖掘技术,针对各类企业和个人不同的关注点,统计公布可以导出有关数据,这些数据更加细分,或可运用于微观层面。另外,借助各类新媒体平台,丰富数据公布的渠道。
(二)大数据样本的特点
抽样技术是在特定时期相对有效解决某些问题时采用的方式,运用该技术是由于过往能力的限制,比如常规年的GDP统计数据基本为总体的样本。
为了保证统计意义上的有效性,对研究对象进行总体抽样时,一般需要构建充分完备统计量,采用特定的假设和抽样方式,希望知晓该统计量的分布,但实际上所涉及统计量的分布可能过于复杂或未知,故只是近似趋于某类已知分布[15]。所以,实际进行统计工作前,会设定某些合理化的假设以便进行后续分析。但在大数据时代,巨大的数据信息虽然混杂,但可采用数据挖掘和人工智能技术进行信息获取,所获得的数据就是充分完备统计量,即“样本=总体”[16],并且总体的统计分布也可计算导出,从而弱化了特定抽样方式这一前提。同时,由于足量的信息,通过强大的机器算法更迅速地完成数据的价值“提纯”[17],统计过程中对噪音与信号进行更好识别,减少统计误差的影响。
基于上述说明,传统经济统计工作若进行大数据化,国民经济核算工作将发生相应的变化。在生产统计方面,以往工作多停留在行业层面或局限于有一定规模的企业,而未来大数据化后,该工作可包含所有规模的企业;在消费统计上,以往工作一般基于抽样调查,而未来可具体到每个家庭或个人;在价格统计上,以往统计范围仅包含千种商品、涉及几万个调查销售网点,但往后可涉及几万种商品、所有的在线销售商和大部分线下销售网点[18]。随着大数据技术不断成熟,“样本=总体”形成一定趋势,无须采用特定的抽样方式,这样将弱化核算统计过程中的假设,减少统计误差。
三、结语
经济系统动态性、产业结构变化、信息技术不断更新等因素不可避免地与现行国民经济核算体系和方法发生矛盾,可以预见现行核算制度及方法会逐渐无法全面、客观、科学地描述我国经济现状。当然,我国统计核算部门一直在实践中探索与完善现有体系。在大数据时代,大数据及其技术可与国民经济核算有机融合,一方面提高数据采集、处理、公布信息的效率,另一方面使得核算活动更加主动、全面。
需要指出,应对当前大数据的影响并非打破现行国民经济核算体系本身。因为,现行体系的中心框架具有唯一性,相应的全套账户序列在账户数量和内容上都是极为稳定的,大数据对其影响是极为有限的[19]。但国民经济核算有必要适应新形势,主动尝试使用新工具,形成运用大数据的意识,从而进行有效革新,实现核算制度和体系进一步发展,最终帮助政府、企业及个人进行更科学、更合理的决策。
参考文献:
[1] 华先.浅谈国民经济核算及其统计思想[J].时代金融,2011,(30):70.
[2] 许宪春.中国国民经济核算体系的建立、改革和发展[J].中国社会科学,2009,(6):41-59.
[3] 胡健.新中国国民经济核算体系演化的理论动因:历史回顾与展望[J].统计与信息论坛,2019,(12):3-8.
[4] 李世伟.大数据环境下国民经济核算体系的改进[J].市场经济与价格,2015,(7):10-14.
[5] 向蓉美,楊作廪,王青华.国民经济核算及分析[M].成都:西南财经大学出版社,2005.
[6] 郑丽琳,李旭辉,戴炜.安徽省绿色GDP与生态环境压力的空间效应分析[J].统计与决策,2018,(15):136-141.
[7] 宋旭光,贾玮.分享经济对国民经济核算的影响[J].统计与信息论坛,2018,(3):65-71.
[8] 王永兴.中国的经济规模被高估了吗?——基于地下经济的反证[J].南开经济研究,2018,(6):74-92.
[9] 赵彬竹,张嘉纯,郝园园.我国国民经济核算体系优化和发展研究[J].合作经济与科技,2019,(14):36-37.
[10] 第一财经.2019年天猫“双十一”交易额突破2000亿元[EB/OL].东方财富网,2019-11-11.
[11] 刘兴远.“大数据”对官方统计数 据发布的冲击及应对[J].统计科学与实践,2013,(12):51-53.
[12] 谢文.大数据经济[M].北京:北京联合出版公司,2016.
[13] 张烨.物联网技术对国民经济核算发展的影响[J].消费导刊,2019,(9):45-46.
[14] 李红艳,汪涛.大数据时代背景下的新型国民经济核算体系研究[J].经济视角,2013,(8):24-26.
[15] 茆诗松,王静龙,濮晓龙.高等数理统计[M].北京:高等教育出版社,2006.
[16] 俞立平.大数据与大数据经济学[J].中国软科学,2013,(7):177-183.
[17] 刘涛雄,徐晓飞.大数据与宏观经济分析研究综述[J].国外理论动态,2015,(1):57-64.
[18] 陈恒.大数据时代:GDP统计过时了吗?[N].光明日报,2014-04-10.
[19] 彭刚.大数据如何影响国民经济核算?[EB/OL].浙江省统计信息调查服务行业协会网站,2020-03-25.