共享经济统计实践面临的局限性与改进思路

2023-03-20 03:26向书坚孔晓瑞
统计与信息论坛 2023年3期
关键词:统计数据区块经济

向书坚,孔晓瑞,李 凯

(1.浙江工商大学 a.统计与数学学院;b.统计数据工程技术与应用协同创新中心,浙江 杭州 310018;2.贵州师范大学 数学科学学院,贵州 贵阳 550025)

一、引言

自中国进入高质量发展转型阶段,新产业、新业态、新商业模式(简称“三新”)经济已成为社会经济可持续发展的新动能。其中,共享经济作为一种社会闲散资源再配置的新经济模式,随着信息技术创新已成为中国新经济发展模式中的重要组成部分。

对于“共享经济”的起源,一般认为与Felson和Spaeth在《社区结构与协同消费:一种日常活动的方法》中提出的“协同消费”紧密相关,即一种社区成员间发生的协调与竞争的生产和消费关系,主要表现为利用个人闲置资源有偿提供消费个性化服务[1]。在2008年金融危机爆发之后,社会消费观念发生了转变,共享经济借助互联网平台技术迅速发展。中国国家信息中心在《中国共享经济发展报告(2021)》中指出,共享经济是指利用互联网等现代信息技术,以使用权分享为主要特征,整合海量、分散化资源,满足多样化需求的经济活动总和,其研究结果显示,2021年中国共享经济市场交易规模达到36 881亿元,同比增长约9.2%,融资规模同比增长约80.3%,表现出了强劲的发展潜力,涵盖B2B、B2C、C2C和C2B四种商业模式,涉及交通出行、共享住宿、知识技能等七大领域(1)中国共享经济发展报告(2022),http:∥www.sic.gov.cn/News/568/11277.htm。。

显然,在复杂的国际环境和疫情防控下,共享经济对实现“六稳”“六保”和社会经济数字化转型方面具有重要作用。2020年中国出台的一系列关于稳定就业、拉动消费、经济增长等政策中,大多包含“发展共享经济”的内容,尤其是11月份的《中共中央关于制定国民经济和社会发展第十四个五年规划和二○三五年远景目标的建议》强调了“促进平台经济、共享经济健康发展”的重要性。

然而,共享经济的统计工作面临诸多挑战和局限性,现有的宏观经济核算体系缺乏共享经济部分。虽然中国基于联合国《国民账户体系(2008)》(简称“SNA2008”)设计的《中国国民经济核算体系(2016)》(简称“CSNA2016”)标准中,提出核算“三新”经济的要求,但缺少共享经济的具体核算标准,因此,目前较难准确统计出共享经济的实际规模、结构和影响[2]。为进一步完善共享经济等“三新”经济统计工作,国家统计局指出,统计部门要加快推动大数据、云计算和区块链等现代化新技术与统计工作深度融合,要健全“三新”经济统计指标体系和“三新”统计监测,探索区块链、智能计算等新技术在统计工作中的应用场景[3]。2022年3月3日国家统计局党组会议再次强调,统计部门要认真落实“十四五”时期统计现代化改革规划,加快数字经济统计核算等重点领域改革任务取得新进展(2)http:∥www.stats.gov.cn/tjgz/tjdj/gzyw/202203/t20220315_1828671.html。。

据此,本文围绕共享经济统计实践的改进问题,首先,梳理国内外共享经济统计实践情况及存在的局限性和面临的共性问题;其次,借鉴国外实践经验和本文改进思路,提出解决局限性和所面临问题的思路;最后,结合“三新”经济未来发展趋势及政府统计现代化改革要求,在《国家统计质量保证框架(2021)》下,从数字化视角构建一套基于区块链技术的共享经济统计数据互联生态体系,既能在保证统计数据质量的前提下准确剥离“三新”统计中共享经济部分,进而由点及面地解决“三新”统计中“统不进、分不出、抓不住”的问题,又能体现时代发展的要求。

二、共享经济统计实践情况及局限性分析

目前,有关共享经济的统计工作,尤其是官方层面,中国、美国、英国、澳大利亚、加拿大等国家统计机构已经开展了一定程度的专项统计调查,并取得了阶段性成果。本部分一是探讨国内共享经济统计实践情况及存在的局限性;二是梳理国外共享经济统计实践情况,以助于解决国内共享经济统计存在的局限性,并总结国内外共享经济统计实践存在的共性问题。

(一)国内共享经济统计实践情况及局限性

1.国内共享经济统计实践情况

国家统计局为指导共享经济等新经济统计工作,从2016年起制定了《新产业、新业态、新商业模式专项统计报表制度》,通过不断扩充和完善,该制度已更新至2021版《新产业新业态新商业模式统计监测制度(2021)》(3)http:∥tjj.ningbo.gov.cn/art/2021/5/8/art_1229042816_58913567.html。,涉及共享经济方面的调查内容也在逐步细化,具体见表1。

表1 2016版与2021版“三新”统计报表制度内容对比

从制度改进内容看,主要体现出监测内容扩展和监测项目细化两个方面的变化。

在监测内容扩展方面,制度由2016版的11项扩展到2021版的14项,新增了“三新”经济综合情况和新兴现代农业两个重点内容。互联网金融也拆分为互联网平台和金融科技平台两个内容,其中互联网平台监测内容与共享经济最为相关。

在监测项目细化方面,包括行业活动分类和统计指标。一方面,项目涉及共享经济的部分,行业活动分类细化为4个平台活动,包含有重点互联网出行平台、医疗平台、教育平台和房屋共享平台;另一方面,设置了交易额、订单数、在线注册人数等统计指标,细化和丰富了统计数据,并由服务业调查中心利用《互联网经济统计报表制度》《部门综合统计报表制度》加工汇总形成数据来源,以年度或季度的频率报送统计数据。

2.国内共享经济统计实践存在的局限性

(1)统计对象识别不全面。国家统计局制定的针对共享经济等“三新”经济的统计调查制度具有一定的探索性(4)http:∥finance.china.com.cn/news/special/2016nsbnhgjjsj/20160715/3813841.shtml。。现行《国民经济行业分类(GB/T4754—2017)》标准中只对平台活动进行了分类,并无明确共享经济的部分。同时,“三新”统计制度以上述分类标准为基础,虽然增加了网络平台,但主要是以服务形态、盈利模式区分新旧产业,导致对共享经济的认识仍然存在盲区。从表1看出,2021版“三新”统计监测内容虽涉及共享经济,但并无细致的相关行业分类,且B2B和B2C商业模式中大多数企业存在复杂的、非传统的法律结构和交易模式,在共享经济定义缺乏一般性规范的情况下,难以有效区分其与传统经济商业活动。

对于被调查者而言,自身关于共享经济的认识偏差也会导致统计识别问题。对于企业参与者,由于平台服务的大多数企业属于初创型企业,基本上具有规模小、变化快等特征,即便是有些企业参与了共享经济,但由于认知原因,未将其共享经济部分进行单独记录,同时,C2C和C2B商业模式中参与者大多数属于居民个人,未在工商部门和税务部门登记,而官方的传统统计调查对象是以法人企业和个体工商户为主,这就会导致居民个人参与共享经济的活动无法被识别。此外,现行统计方案只能捕获发生在网络共享平台的经济活动,居民个人的线下共享经济活动被排除在整体抽样框之外,导致现有“三新”统计未能将其全面覆盖[4]。

(2)统计指标设计有待完善。在《新产业新业态新商业模式统计监测制度(2021)》中,主要采用“互联网平台基本情况表”获取共享经济的统计数据,但有关统计指标较为简单,无法满足分析需求。一方面只能获取平台企业诸如注册用户数、交易量、交易额等基本情况,无法开展共享经济对国民经济增长、就业、收入等方面的影响分析;另一方面涉及共享经济活动的对应指标难以从整体报表中有效地分离出来。共享经济中不同商业模式之间的活动类别、范围、方式等均存在差异,在设计指标时未进行区分,则导致共享经济的“三新”统计资料与GDP核算指标之间存在衔接性弱、口径不一致、数据缺乏等问题,进而需要开展专门的统计调查。对此,原国家统计局副局长鲜祖德指出,“三新”统计工作应进一步完善,推动数据共享、建立数据和相关分类标准、完善“三新”经济增加值核算等,使“三新”经济活动能够“进得来”“抓得住”[5]。

(3)常规统计调查对新经济的适应性较弱。共享经济依托于物联网、大数据等技术创新得以规模化发展,更新迭代较快,有关统计数据主要来源于诸如滴滴、Airbnb等平台企业组织的共享经济交易活动,具有高频、随机等特征。B2B和B2C商业模式中大多为规模以下的中小微企业,其经济活动范围广、变化快、新生和退出现象频繁,是动态性总体。而实践中,“三新”统计专项调查主要采用经济普查资料,在非普查年份依据普查年份资料制定抽样框进行调查。常规抽样设计的总体更新频率低,应用于共享经济时,会导致样本框出现代表性弱、稳定性差、延续性低等问题。同时,C2C和C2B商业模式中居民个人参与者居多,调查对象的识别问题也会导致常规调查存在时效性不强、有效性不足和全面性不够等问题。因此,采用传统统计报表的调查方法难以及时、全面地反映共享经济发展的实际情况[6-8],应寻找低成本且高效的统计数据获取方法,建立统计部门、行政部门和共享平台间数据共享的机制[9]。

(二)国外共享经济统计实践情况及共性问题

1.国外共享经济统计实践情况

(1)美国共享经济统计实践情况。美国商务部(U.S.Department of Commerce)识别及界定共享经济时,主要基于以下五个特征:其一,以现代化信息技术为依托,即使用互联网平台将供需双方进行匹配;其二,供给方有偿共享其闲置资源(时间、空间、知识技能等);其三,具有完善的信用评价体系,依靠基于用户的评级系统进行质量控制,确保供需双方之间有一定程度的信任;其四,共享经济从业者就业时间灵活,且与共享平台不具有法律上的雇佣关系;其五,提供中介服务的共享平台不具有自己的工具和资产,从而将“共享单车”和“共享汽车”这些伪共享排除在外。整体而言,即是否具有服务交易成本降低、灵活就业机会、利用过剩产能、改善客户体验及刺激新消费的潜力[10]。

关于共享经济统计数据的获取,美国商务部提出了四种来源渠道:一是采用对供给双方的私人调查获取数据;二是采用典型抽样的调查方法,选取普华永道(PwC)、咨询公司(MBO Partners)等为典型代表,分析其年度报告,虽然这些报告考虑了共享经济定义之外的公司,但总体表明共享经济在过去五年有了显著的增长;三是劳工部和美国人口普查局在2017年重新引入应急工人补贴(CWS),通过调整以反映与共享经济相关的问题,获取相应的调查资料;四是扩大联邦统计机构获取联邦税收信息的权限,以此获取更广泛的共享经济数据。

(2)英国共享经济统计实践情况。英国国家统计局(Office for National Statistics,简称“ONS”)从2016年开始研究共享经济统计,探索利用大数据、行政记录、企业调查等多种渠道收集共享经济企业数据,以此分析共享经济的特征,并更新至2020年[11]。

在数据调查方法上,ONS提出了问卷调查、定向数据调查和网络爬虫三种数据来源方案。其中,问卷调查是指利用电子商务调查和年度企业调查(ABS)对共享经济企业进行抽样,通过部门间商业登记册(IDBR)建立主要抽样框,以此获取共享经济活动的主要特征和潜在边界;定向数据调查就是融合对比各部门行政记录数据,获取共享经济企业交易额、营业额等数据;网络爬虫则是指借用网络爬虫技术提取共享平台企业交易、价格、就业等信息,作为共享经济统计数据的补充来源。

在统计调查问卷设计方面,ONS采用决策树形式对参与调查的企业进行识别剥离,如图1所示。以企业是否拥有自己网站或者app应用为二分叉决策树的起点,只有满足分叉树左边所有项时,才认为被调查企业的业务可能属于共享经济。

图1 共享经济业务识别决策树

在调查数据分析方面,ONS尝试使用非监控式机器学习算法自动识别共享经济企业对象。并得出,结合使用k-means与“二元”决策树进行共享经济对象识别效果较好。

(3)澳大利亚共享经济统计实践情况。澳大利亚统计局(Australian Bureau of Statistics)与ONS类似,采用决策树进行共享经济行业分类。首先,确定经济单位是否参与共享经济活动,典型特征是市场中存在连接买卖双方、降低交易成本的平台,且买卖双方都是个人或小企业;其次,区分服务商是否独立于提供者进行操作,即不提供物理上的服务;最后,采用收入流“方向”进行分类,收入流的“方向”是分类的核心,以共享汽车为例,若资金是从消费者到中间服务商再流入到提供商手中,服务商为客户提供增值服务,将服务商的活动分类为提供者的服务类别。乘客通过平台支付费用,平台向司机支付费用,则归类为“的士及其他道路运输”。反之司机向乘客收费,随后司机向服务商(平台)支付佣金的情况,则归类为“其他运输支援服务”[13]。

(4)加拿大共享经济统计实践情况。加拿大统计局(Statistics Canada)针对共享经济活动的识别和分类问题提出以下解决思路:首先,选择产业比例高的共享经济行业作为代表进行研究,提炼识别分类特征;其次,审查数据来源,探索当前的调查数据能否形成分析数据来源;再次,建立住户部门生产账户,以便在加拿大宏观经济账户体系中覆盖住户部门的共享经济活动;最后,开发卫星账户以确定共享经济的覆盖范围,并估计加拿大共享经济的规模[14]。

2.国内外共享经济统计实践共性问题

通过梳理国外有关共享经济统计实践情况总结以下三点:第一,ONS采用决策树识别共享经济统计调查企业,澳大利亚国家统计局借鉴该方法进行共享经济行业分类,在此非监控式机器学习算法下识别共享经济统计对象具有一定的科学性和准确性;第二,关于共享经济统计指标方面,除了ONS提到的共享经济企业交易额、营业额等统计指标,并未有详细的可体现共享经济总量、结构等方面的指标;第三,在数据获取方面,国外共享经济统计调查方法有待改进,如美国采用共享经济供需双方私人调查、大型咨询公司典型调查等,所得数据只能大致判断共享经济近几年的增长趋势,并不能准确地统计共享经济的实际规模等,加拿大存在类似问题。ONS采用决策树可在一定程度上保证调查对象识别准确,但采用年度调查从时限性上与共享经济企业变化较快的特征不匹配,同时网络爬虫获取数据的方法虽具有科学性,但对于各大共享平台数据开放度可知该方法实施性不高,同样,澳大利亚也存在类似问题。

由此,对比国内共享经济统计实践存在的局限性,即统计对象识别不全面、统计指标设计有待完善和常规统计调查对新经济的适应性较弱,本文认为对于“统计对象识别不全面”的问题可借鉴国外有关共享经济统计实践经验来改进,如ONS的决策树。但另外两点局限性,目前国外共享经济统计实践存在同样的问题,即国内外有关共享经济统计实践的共性问题有两点:一是统计指标设计有待完善;二是常规统计调查对新经济的适应性较弱。

三、“三新”统计中共享经济统计改进思路

针对上述“三新”统计中共享经济统计实践存在的局限性,本部分将从以下两方面改进:一是借鉴国外实践经验构建国内共享经济统计对象的识别框架;二是针对上述国内外有关共享经济统计实践存在的两个共性问题,本文结合国内实际情况尝试提出相应的改进思路(5)国内有关共享经济的官方统计仅包含于国家统计局的“三新”统计,且国内共享经济统计实践的局限性主要基于“三新”统计制度总结而来,因此这里用“三新”统计中共享经济统计改进思路作为标题更具有针对性。,以期补充完善可全面反映共享经济统计总量、结构等方面的统计指标,并基于共享经济不同商业模式特征探讨具有针对性的调查方法。

(一)借鉴国外实践经验构建国内共享经济统计对象的识别框架

针对“三新”统计工作“统不进、分不出、抓不住”等问题,可以从共享经济的定义、企业名录库和智能识别三个方面予以改进。

首先,厘清共享经济的定义,解决“统不进”的问题。目前,社会各界对共享经济有不同的认知,缺乏一般性共识,这就有必要先通过调研居民个人、企业、共享平台、监管部门等共享经济参与者,结合多方意见界定出共享经济的内涵和主要识别特征。

其次,构建新型共享经济企业名录库,解决“分不开”的问题。共享经济呈现出的混合经营、变化快等特点,导致坚持“组织机构”为前提,兼顾“经济活动”的统计单位名录库形式不再适用于共享经济等新经济统计。因此,应当改进原有名录库录入的方式。可以“统一社会信用代码”为标识,构建兼顾型的共享经济名录库入库标准,构建以“法人”名录为主库,继而将其经营活动按照不同的行业类别和统计要求形成多个“产业活动”子库,并设置匹配的分类代码。例如,针对开展的共享经济活动在子库指标中设置“共享经济”标识。同时,借助现代化信息技术和工商部门等行政记录数据融合,根据共享经济的主要识别特征,智能识别筛选出共享经济企业名录。

最后,采用大数据技术智能化识别共享经济行业活动,解决“抓不住”的问题。借鉴ONS的经验,大数据技术可以实现数据采集自动化,继而行业分类可以利用大数据智能识别技术达到实时识别统计的效果。例如,可使用现行机器学习方法中诸如监控式分类算法(决策树算法、k邻近算法等),基于现有共享经济行业分类标准及闲置产品的各种属性和特征,实现“识别”环节的自动化处理。以共享出行中的滴滴顺风车为例,实时记录了交易的时间、里程数、价格、交易双方的详细信息(如共享出行车辆的型号、购买日期等),可使用分布式集群计算方法汇聚不同的共享网络平台数据信息。

(二)基于CSNA2016补充共享经济统计宏微观衔接指标

根据CSNA2016,宏观核算对象包括经济流量和经济存量两大部分。因此,共享经济统计指标体系需要覆盖其全部交易活动和相关的存量变化。但是,不同商业模式围绕闲散资源使用权的交易活动具有差异性,因此,本文主要以共享经济不同商业模式的特征,设计补充相应的流量指标和存量指标。

流量指标又分为产品生产指标(基于生产的角度)、收入分配指标(基于分配的角度)、收入使用指标(基于使用的角度)等。通常设计调查指标时还要考虑可操作性,就以共享经济规模测度来说,实际上主要采用剥离法从现有增加值中提取共享经济部分。关于新经济增加值核算的方法目前主要采用有生产法和收入法两种,因此共享经济增加值核算时主要基于价值创造和价值分配的角度设计指标。存量指标需要考虑平台的资本形成,例如资产变化方面需要考虑平台的资本形成总额、固定资本消耗、存货变化等。负债和净值变化方面需要考虑平台的净储蓄、应收(付)资本转移、投资补助等。居民个人耐用消费品转为资本品要考虑固定资本消耗、存货变化、投资补助等存量指标。鉴于不同模式参与主体特征不同,C2C和C2B模式可采用问卷调查的方式从微观层面收集居民个人的产出和收入等相关数据。

同时,设计指标时需注意宏微指标的衔接问题。目前共享经济的统计工作主要是按照“三新”统计制度进行,其数据也主要来源于“三新”统计调查中的基层报表,而报表数据最初来源于企业的财务报表,所以宏微指标之间的衔接性需要予以保证。表2所示为B2B和B2C模式规模测度指标体系。

表2 共享经济B2B和B2C模式生产法和收入法增加值核算宏微观衔接指标

(三)基于共享经济不同商业模式特征探索针对性统计调查方法

共享经济变化快主要表现为企业和个人层面的交易模式创新,因而传统的统计报表无法较好地适用于此类迭代更新较快的经济活动。因此,采用合适的抽样调查获取统计数据。

1.共享经济B2B和B2C商业模式的统计调查

共享经济参与企业的规模不同,其调查方式也应不同。

(1)规上企业一般规模较大,其结构模式和经营范围相对稳定。且对于规上企业部门的统计调查,政府统计实践部门目前已有较为完善的统计制度。基于此,首先,收集较为详实的调查企业名录,补充共享经济规上企业的调查名录。其次,在中国原有“三新”统计报表的基础上,增添共享经济企业的基本情况统计指标(如表2所示),设计工业企业共享经济统计调查制度。调查方式可采用联网直报,各级统计局按时按规组织实施数据的审核及验收,最终上报至国家统计局,以此形成规上企业共享经济核算数据库。最后,依据新型共享经济名录库对规上企业展开分层或重点抽样调查,弥补全面调查的滞后性。

(2)规下企业新生和退出现象频繁,是动态性总体,需要选择合适的抽样框,通过抽取代表性样本并收集相关经济数据,有助于后期开展共享经济核算,具体调查思路见图2。

图2 规下企业共享经济统计调查构建逻辑

根据图2,规下企业统计调查体系的构建分为以下五个步骤:

第一步,收集规下企业名录单。国务院2015年发布的《促进大数据发展行动纲要》等文件,进一步强调要利用大数据技术等实现政府机构间数据的共享。由此,相关统计部门可利用大数据技术将经济普查资料、行政记录及平台数据进行有效的整合、筛选、匹配等,最终得以形成详实的规下企业名录单,构成完备的统计调查对象。

第二步,形成规下企业共享经济名录库。采用随机抽样方式,对获取的规下企业名录单进行抽样,实施访谈并以此确定较为广泛认可的共享经济的定义后,利用上文中共享经济新型企业名录构建逻辑及相关机器学习算法,从规下企业名录单中自动筛选出符合共享经济参与者特征的对象,形成规下企业共享经济名录库。

第三步,设计相应统计报表或调查问卷(类似规上企业)。可借鉴“三新”统计制度和常规企业统计制度,结合规下企业的共享经济特征,进而制定相应的统计报表或调查问卷,以获取调查对象的基本信息、财务状况、交易信息等数据。

第四步,展开调查。由于共享经济规下企业具有动态总体的特征,“三新”统计调查存在一定的局限性,即固定抽样框无法完全覆盖共享经济这种新型商业模式,样本的代表性会有所偏差。因此,大多规下企业调查是采用两个或两个以上的抽样框组合在一起,这样得到的信息较为全面,形成一个能够以此推断总体特征的多重抽样框[15]。还有一种比较适合共享经济这种新生和退出现象频繁的动态总体抽样方法,即事后分层复合抽样,通过调查前后两期抽样框内各层所抽取样本推断总体的一种估计方法[16]。

第五步,整理分析调查数据。国家统计局根据各省份统计局上报的数据最终进行汇总整理,基于企业的基本信息和机器学习算法,可实现共享经济规下企业的自动智能化行业分类等;同时,构成规下企业层面的共享经济的核算数据库,并结合规上企业共享经济核算数据库最终形成B2B和B2C两种共享模式的核算数据库。

2.共享经济C2C和C2B商业模式的统计调查

企业文化是企业保持旺盛生命力的不竭源泉,它为员工提供了价值导向和行为准则,使员工自觉地调整自己的价值观和行为方式。通用电气通过培训,向所有部门和员工传输新的价值观、管理特征与制度,使员工发展成为企业所需要的人才,尤其注重将企业文化理念植入员工的灵魂。“通用电气的每位职员都有一张‘通用电气价值观卡’:痛恨官僚主义、开明、讲究速度、自信、高瞻远瞩、精力充沛、果敢地设定目标、将变化视为机遇,以及适应全球化。”[1]

居民个人共享经济的统计可采用常规住户调查补充相关统计指标,以此获取C2C和C2B共享模式的全面调查资料。鉴于共享经济中居民个人的交易频繁且复杂,又分为平台注册用户和非平台注册用户,导致整体网络交易规模不易准确获得。因此,需要分别采用合适的抽样方法。

(1)对于平台注册用户,其信息具有可溯性,可采用聚类随机游走抽样(Random Walking Sampling,简称RWS)算法抽取样本,是一种既能保持高效率抽样又能尽可能涵盖原有网络拓扑结构的一种抽样算法[17]。具体步骤为:首先使用聚类算法将网络用户按照标签等划分为不同社区,继而针对不同的社区再采用随机游走抽样,直到获取相应规模的样本。

(2)对于非平台注册用户,考虑到其分散性、隐匿性及整体规模的未知性等,在调查时可借助个人的社交网络关系采用同伴驱动抽样(Respondent Driven Sampling,简称RDS)[18],一种在滚雪球抽样的基础上加入社会网络理论,并赋予样本权重的数理统计模型,可使抽样框达到总体的渐进无偏[19]。具体框架如图3所示。

图3 居民个人共享经济统计调查构建框架

根据图3所示,居民个人共享经济统计调查分为以下四个步骤:

第一步,设计问卷。基于调查目的,设计包含共享经济居民个人的基本情况、交易活动特征、产出和收入的相关指标、建议等方面的问卷,并通过访谈、调研的方式进行修改完善。

第二步,针对平台注册用户采用RWS的抽样方式。首先,基于平台注册用户间的社会网络,利用社区聚类算法将原始的网络节点(每个平台注册用户视为一个节点)按照不同的标签如共享出行、共享住宿进行聚类;其次,针对不同的类别随机选取一个节点,随机游走连接其他节点;最后,直到收集相应规模的样本。

第三步,针对非平台注册用户采用RDS抽样方式。首先,选择几个合适的“种子”,即最初的调查对象,但要注意根据共享经济产品和行业的多样化,尽量使选择的种子具有差异化。其次,针对“种子”发放招募券,用于记录被招募者的编号、其与招募者的关系及网络度数(即认识多少共享经济非平台用户),基于上述内容确定该被招募者是否为调查对象,若是,则对其展开调查,并采用双重奖励机制,对招募者和被招募者都给予一定的奖励,一般每个种子的招募券为3~8张。再次,重复上一步骤,直到获取所需的样本规模为止。根据马尔科夫链的原理,一般每个种子的链条(招募轮次)达到5到8层即可使获得的样本逐渐达到均衡状态(6)在马尔科夫链模型中,当前一批样本构成与后一批之间的比例差异小于2%时,样本构成即实现均衡。,而后对上述获取的样本数据进行评估检验(如使用软件RDSAT),以此验证样本的均衡性和代表性。最后,通过获取样本被访者的网络度数和招募券来推论总体情况。

第四步,整理调查数据。汇总共享经济居民个人平台注册用户及非平台注册用户的调查资料,以此形成C2C和C2B两种共享经济模式的核算数据库。

基于上述研究,最终汇总共享经济四种模式的核算数据库,形成中国共享经济整体核算数据库,可用于估算中国共享经济规模、流量等。

四、基于区块链的共享经济统计改进思路

本文认为上述改进思路可有效解决现有“三新”统计中有关共享经济统计存在的三点局限性,但自2021年以来,国家统计局局长宁吉喆在传达学习中央经济工作会议等重要会议精神的过程中,多次强调统计数据质量的重要性。且结合“三新”经济蓬勃发展的趋势可知,“三新”经济统计数据将日趋复杂化、混频数据常态化、数据生成主体多样化和数据要素化等,采用传统低频抽样手段采集此类数据时,难以实时有效地反映中国共享经济的实际规模及影响。

若想实时有效地反映共享经济的规模及其产生的影响,前提是要保证共享经济统计数据的质量。同时,在中国统计现代化改革要求下,结合新一代信息技术建立与其匹配的现代化统计体系,进而改进传统统计方法、统计制度等是必然趋势[20-22]。因此,本文认为可基于新的视角,引入数字化技术到整个“三新”统计体系中,并在《国家统计质量保证框架(2021)》下,重点就“三新”统计中共享经济统计存在的数据质量问题为代表进行探讨,并尝试构建一套基于区块链技术的共享经济统计数据互联生态体系,以期借用区块链技术保证共享经济统计数据的质量,从而由点到面实现“三新”经济统计。

(一)共享经济统计数据的主要质量问题

国家统计局印发的《国家统计质量保证框架(2021)》表明统计数据质量应涵盖真实性、准确性、完整性、及时性以及适用性、经济性、可比性、协调性和可获得性等九个方面(7)http:∥www.stats.gov.cn/tjsj/zxfb/202106/t20210617_1818529.html。。对照此标准及现有的统计体系及调查制度,共享经济统计数据质量存在以下三点主要问题。

(1)共享经济统计数据的真实性和准确性误差偏大。上文中所述在调查过程中共享经济企业会出现无意和有意配合性差的现象,导致共享经济统计数据真实性弱,且统计部门目前尚未形成针对共享经济等新经济数据质量的有效评估手段。现有的“中心化”式统计体系的统计数据存储集风险较大,一旦遭受黑客攻击,必然会造成数据的丢失、伪造等后果,导致数据准确性降低。

(2)共享经济统计数据的完整性、及时性、适用性和可获得性不够。共享经济居民个人具有分散性,造成其统计数据的调查和收集困难且耗时较长。同时,考虑到共享经济等新兴产业的动态性及复杂性,而传统统计调查工作过程较长,流程较多,很难做到数据的实时更新,且对高频高维数据采用传统低频抽样方式获取的数据其适用性和完整性均不够。共享经济发展过程中逐步呈现出了一种“赢家通吃”“强者恒强”的马太效应,几大共享平台企业构成垄断竞争形势,并在追求利益最大化下建立了数据壁垒,大大降低了数据的可获得性。

(3)共享经济统计数据的经济性、可比性、协调性较弱。原因在于中国现有的统计管理系统分解为综合统计和部门统计两个系统,不同部门统计调查目的不同、缺乏有效的共享机制和统一的统计标准,既会出现部分统计数据重复采集、浪费人力物力等情况,又会出现因人力物力的限制难以采集到数据的情况。

(二)区块链对共享经济统计数据质量问题的改善作用

结合区块链技术的特征,本文认为采用区块链技术可从以下三点改善数据质量问题。

(1)区块链技术可以确保共享经济统计数据的真实性和准确性。在区块链共识机制下就某种方法由某个节点记账的权利达成共识。同时,在区块链的激励机制下,参与者可通过赋予记账节点一定的数据权益(统计币等)等,来激励共享经济被调查者积极如实地填报和共享数据,并通过公私密钥和多重签名机制下,共享双方可以互验身份,私有秘钥可用来选择性地针对数据进行加密,比如对数据进行“脱敏”处理等。全网只拥有一套相同的账本,数据既不会丢失更不会轻易被更改。在区块链分布式账本中,各个节点都保留相同的副本信息,且均参与账本记录信息的验证,即在分布式众多节点中并不存在拥有绝对控制权的中心,这种去中心化的网络框架,也能够降低集中式服务器被攻击和篡改的风险,可确保共享经济统计数据的真实性和准确性。

(2)区块链技术可以确保共享经济统计数据的完整性、及时性、适用性和可获得性。在共享经济数据上链后,每一个数据块都会加上时间戳,即使在共享经济更新换代快的情况下也能保证数据的可溯性,保证了共享经济统计数据的完整性。在共享经济统计数据上链后,利用区块链中的点对点网络技术和共识机制,可保证将采集到的数据实时地更新到整个网络中,确保了数据的及时性。在智能合约下,一种在智能机制下,根据多方需求可以将事先设定好的统计目的、内容等规则嵌入到“区块链+共享经济”脚本中,然后实现自我执行及验证的计算机协议,确保共享经济统计数据的适用性。同时,在区块链的激励机制下可激励各部门积极共享数据,也会激励更多的机构或团队参与共享经济统计数据的挖掘和研究,确保了共享经济统计数据的可获得性。

(3)区块链技术可以确保共享经济统计数据的经济性、可比性和协调性。区块链中的分布式存储技术避免各统计部门间信息“孤岛效应”和不对称性问题,并在共识机制下各节点(部门统计)就数据的存储、管理等达成共识,然后统一上链至整个网络,避免传统部门统计因需求角度不同上报部分重复性数据,提高数据的协调性。同时,引入智能合约,可减少人力、物力、财力的投入,确保了共享经济统计数据的经济性。此外,时间戳可以保证共享经济统计数据具有连续可比性。

(三)基于区块链技术的共享经济统计框架的构建

在区块链的统计实践方面,经合组织(OECD)经过5年多的设计验证,其成员国于2018年同意建立经合组织区块链政策中心[23]。联邦经济统计咨询委员(FESAC)针对劳动力和工作的统计数据存在滞后、不一致、重复性等问题,基于区块链的基础设施设计了相应的就业和收入统计信息模式[24]。中国目前还未构建基于区块链的统计系统,因此,本文尝试构建一个基于区块链技术的共享经济统计框架,原因有两点:一是国家统计局印发的《国家统计质量保证框架(2021)》是基于统计数据生产全过程进行综合评价的标准,根据上述区块链技术对共享经济统计数据质量的改善作用,可将区块链技术纳入到共享经济统计框架中,进而从统计数据生产的全流程保障中国共享经济统计的有效性和真实性等;二是考虑到经济性、适用性及“三新”统计未来发展趋势等。本文以共享经济统计为切入点引入区块链技术,一方面可以保障共享经济统计的准确性、有效性等;另一方面有助于准确地从“三新”统计中剥离出共享经济,同时一并完成其他新经济的统计,进而由点及面地解决“三新”统计中“统不进、分不出、抓不住”的问题。具体框架如图4所示。

图4 “区块链+共享经济”统计框架

整个统计框架由共享经济统计数据的“生成、采集、管理和应用”四个环节组成。

(1)数据生成。基于区块链技术的交易数据生成,能形成安全可靠的统计数据来源。原因在于,在采用区块链技术的共享经济参与者(居民个人、企业、网络平台和公共信用主管部门)之间,联盟链(多个机构共同参与管理的区块链)和智能合约可以促使共享双方信用信息的汇集和交换,减少共享交易中“非人格化”引起的不确定性,并通过非对称加密算法保证共享双方脱敏信用信息的公开化、非中心化、时效性,满足共享经济供需双方在P2P网络中自动匹配交易的安全性,同时也形成了统计数据的稳定来源,包括公共信用主管部门的信用数据、共享平台保存的交易数据(交易者信息、交易额、交易频率、订单量、价格、生产投入成本、收入等)。因此,在数据生成环节中,只要设置合理的统计指标,就能不间断地获取共享经济的流量和存量数据。

(2)数据采集。采用区块链的分布式存储技术,可降低数据专用成本,形成数据要素化规模效应,提高统计数据应用效率。传统的统计架构设计一般以中心机构为核心,以中心机构的职能为导向采集数据,具有较高的数据专用成本,而不同的中心机构间处于一种割裂状态,导致其间数据形成“数据孤岛”,难以发挥数据融合后的规模化效应。但是,在分布式存储模式的“去中心化”和共享激励机制下,诸如政府统计部门、统计研究机构及共享平台企业等组成共享经济统计网络体系,其中每个节点(各部门)都可以根据具体需求从其他节点中采集对应的数据。比如,根据共享经济统计调查制度,政府统计部门向其他统计机构提出数据请求,在后者允许共享时采集直报数据和调查数据;统计研究机构根据研究目的采集相应的调研数据;共享平台自动采集共享交易记录。以上数据共享机制,不仅会降低数据收集成本,还能促进多源统计数据融合后形成规模化效应,即数据要素化在不同应用场景中发挥重要的经济价值,也即形成各节点部门的数据资产。

(3)数据管理。采用区块链的智能合约、联盟链和激励机制等,可实现共享经济统计数据的智能化管理,有效整合非同源数据,促使数据管理从统计业务主导转向市场价值主导。由于共享经济变化快等特点,原有的统计体系下各部门间在工作流程长、环节多的情况下缺乏有效的沟通,很难实现多种来源数据的高度匹配,更难将不同时间、空间的数据进行有效整合。而在机构部门共同参与管理的区块链下,就共享数据的内容、统计的标准和准则等达成共识后,采用可编辑的智能合约来自动完成数据的审核、校对等。不仅能保证数据的协调性和可比性,还能大幅度降低传统数据管理的人工、时间成本。此外,在激励机制下,通过数据有偿共享,还能获取数据作为资产的收益,充分体现按要素贡献分配价值的市场导向。

(4)数据应用。采用区块链的智能合约和非对称加密算法等可实现数据的智能化统计,提升共享经济统计的效率及适用性。原有统计体系下,出于不同统计分析业务需求,需要进行大量的人工分析,通常会导致统计分析结果的时滞性,最终降低数据的应用价值。但采用大数据技术,根据不同的业务流程,如共享经济的就业统计、总量统计、价格统计等,形成不同的数据链,在该系统中的智能机制下嵌入事先设定好的“区块链+共享经济统计”分析程序,可快速地实现统计数据的智能化分析。此外,由于传统中心化统计体系的职能专业性及资源约束,相关机构很难满足不同用户的个性化需求,这无疑会降低数据应用价值。而采用非对称加密算法时,数据持有机构可选择性地向其他社会单位公开数据,用户根据需求制定不同的智能合约,实现共享经济统计数据应用的精准化和范围扩展,突破传统应用的局限性。

据上所述,区块链+共享经济统计系统,不仅能改善数据质量问题,提高共享经济统计测度的时效性和准确性,还能实现数据应用市场化,体现数据生产要素的经济效应。

五、结论与启示

本文以共享经济统计问题为出发点,探讨了共享经济统计的实践情况及局限性,基于“三新”统计和区块链的共享经济统计改进思路等方面,并得出以下结论和政策启示。

(一)研究结论

第一,共享经济统计存在“统不进”的问题。从共享经济统计实践情况看,C2C和C2B商业模式中参与者大多数属于住户部门居民个人,多数未在工商部门和税务部门登记,且国内“三新”统计监测内容虽涉及共享经济,但并无细致的相关行业分类,存在调查对象识别不全面、指标体系不完善等局限性。

第二,共享经济统计存在“分不开”的问题。共享平台多元化,同时涉及多种新经济活动,单一指标难以剥离共享经济部分,且B2B和B2C商业模式中大多数企业存在复杂的、非传统的法律结构和交易模式,在共享经济定义缺乏一般性规范下,难以有效区分其与传统经济商业活动。

第三,共享经济统计存在“抓不住”的问题。网络共享平台提高了交易效率、降低了交易成本,借此吸引了需求更丰富的用户加入平台,促进共享模式的内容创新,并产生了大量高频、多样的交易数据,传统的统计报表无法较好地适用于共享经济等迭代更新较快的经济活动,难以捕获相关交易信息。居民个人和小微企业是共享经济的主要参与者,两者交易活动高度定制化,仅采用低频抽样方式采集此类活动数据,存在统计遗漏的问题。

(二)政策启示

第一,完善共享经济统计调查制度是准确测度共享经济的关键。对此,可以借鉴国外实践经验和本文改进思路从共享经济活动特征和范围开展调查,归纳其识别标准,并在此基础上改进现行“三新”统计制度,包括扩展现有统计报表,建全调查名录,对不同共享模式中规模以下中小微企业和居民个人分别开展抽样调查,以此解决共享经济统计“统不进”的问题。

第二,数字技术是推进统计现代化改革的重要动力。共享经济借助数字技术快速发展,活动的快速变化对现有统计方式提出了新要求。因此,不同的共享经济模式应结合其自身特征可借用机器学习算法等开展相适应的统计方式,B2B和B2C商业模式的统计调查可在补充完善新型工业企业名录库的基础上,根据企业规模分别采用联网直报和事后分层抽样,C2C和C2B商业模式根据是否平台注册分别采用RWS和RDS抽样,以此形成完整、准确和独立的共享经济核算数据库,有助于解决共享经济统计“分不开”的问题。

第三,数据质量是统计工作的中心任务,在新经济时代应当结合国家统计局印发的《国家统计质量保证框架(2021)》,应用新一代数字化技术区块链,采用分布式存储技术、激励机制和共享机制有效解决统计数据的“孤岛效应”并释放数据价值,以此解决共享经济统计“抓不住”的问题。同时利用智能合约实现共享经济统计数据的智能化管理和统计分析,大幅度降低人工统计分析的管理成本,消除数据质量的时效性问题,以此提高统计工作的效率。

猜你喜欢
统计数据区块经济
“林下经济”助农增收
创新视角下统计数据的提取与使用
区块链:一个改变未来的幽灵
增加就业, 这些“经济”要关注
区块链:主要角色和衍生应用
国际统计数据
区块链+媒体业的N种可能
读懂区块链
2017年居民消费统计数据资料
民营经济大有可为