卢新元,张孜铭,李思虹,曾培春, 陈柯帆
(1.华中师范大学信息管理学院,湖北武汉 430079;2.湖北省电子商务研究中心,湖北武汉 430079;3.华中师范大学经济与工商管理学院,湖北武汉 430079)
第三产业的区域发展水平是衡量该区域内经济状况的重要参考指标。随着现代经济的发展,产业结构的不断优化,第三产业在国民经济中的地位日益突出。步入21世纪以来,互联网的发展为第三产业注入了新的动力。2015年7月4日,国务院颁布的《国务院关于积极推进“互联网+”行动的指导意见》(国发〔2015〕40号)将“互联网+”行动上升至国家战略层面,提出要建立“网络化、智能化、服务化、协同化”的“互联网+”产业生态体系[1],进一步强调了“互联网”的发展对于第三产业的驱动作用。
但是,互联网在促进经济发展的同时也加剧了经济的收敛性,地域之间的经济差距日渐拉大[2]。由于中国幅员辽阔,各个省份具有迥异的经济环境、资源禀赋和人文差异,互联网对于第三产业的影响程度,会存在明显的空间异质性[3]。现有文献的相关研究多采用传统OLS回归模型的方式,研究互联网与第三产业之间的关系[4-5],未将造成区域异质性因素以变量形式纳入经济计量模型来探究其产生的影响和是否显著等问题。因此,本文以中国互联网转型期的重要节点——2012和2016年,年度横截面分省数据为例,采用GWR模型进行实证分析,从空间相关性和空间异质性两个角度探究各省份互联网对第三产业的影响,并为区域产业经济的发展提出合理建议。
对于中国这样一个发展中国家而言,产业的成长是以存在一个明确的世界技术前沿为前提的,而其顺着产业阶梯拾级而上的过程,即产业结构的升级[6]。互联网作为第三次科技革命的代表性技术,在产业结构高度化过程中的作用不容小觑,即它作为开拓性的技术革新力量,促进着中国的经济重心由一、二产业向第三产业转移。从理论视角看,Ngai等[7]的研究认为跨部门全要素生产(Total Factor Productivity,TFP)的差异将推动一个国家的产业结构调整,而互联网对属于技术进步推动型的中国全要素生产率有着显著的促进作用[8]。实证研究方面,Cardona等[9]通过实证分析发现互联网通信技术通过改变产业的技术效率、组织形式和产业竞争力来推动产业结构调整,这也一定程度上反映了Rosenstein-Rodan[10]“大推动”理论(The Big Push)的预测——良好的硬件设施能在短时间内得到迅速改善。国内的诸多文献也论述了互联网对于第三产业的这种反哺作用。比如徐伟呈等人[11]的研究发现互联网技术进步能够促进全国产业结构趋于高度化,互联网创新成果与服务业的融合极大地推动了服务业的产值增长和生产率。张军涛等人[12]通过构建城市创新能力评价指标体系,对六大互联网产业核心城市的创新能力进行了评价和比较研究,提出应从宏观层面规划统筹移动互联网的产业布局和结构调整,推动互联网产业升级。
然而,这些研究虽然在探讨互联网与第三产业协同发展时都综合考虑了产业布局因素,但鲜有研究将这种布局背后的空间相关性与异质性进行专门解读。中国幅员辽阔,经济文化环境迥异,居民的受教育程度也有所不同,因此智力资源的分布存在着显著的地域性差异。互联网产业属于知识密集型产业,知识集聚区的空间溢出效应会对互联网技术创新、经济增长产生推动作用[13-14]。而结合中国具体情况,韩德超等人[15]借助对1987—2016年省级面板数据的统计分析发现,我国服务业的二元结构特征存在显著的省际差异性,这也体现了研究互联网和第三产业相互作用过程时加入空间因素联合考虑的必要性。
在研究我国互联网与第三产业的空间相关性和空间异质性方面,有两类研究方法最具代表性:(1)基于传统OLS回归模型(Ordinary Least Square,OLS)的地域性数据分析:如李大明等人[16]通过多元线性回归分析模型对影响全国各地现代服务业发展的因素进行实证分析,得出影响地区服务业发展差异的因素;(2)基于因子分析法的地域性数据分析:如尹楠[17]利用因子对应分析法和K-means聚类分析法对我国31个省、市、自治区的互联网发展情况分析后发现互联网发展水平与经济发展程度的相关性,孙晶晶[18]采用因子分析的方法分析河南省各地市第三产业结构差异。这两类方法对于空间平稳性数据的拟合与检验具有较好的效果,但若自变量间存在空间自相关性,则解释效力大大减弱[19]。对于此类问题,一种叫做地理加权回归(Geographically Weighted Regression,GWR)的方法曾在1996年由Brunsdon[20]提出。它允许自变量系数存在空间分异,可以有效探测空间非平稳性特征,在探讨区域差异问题上具有空间回归优势。实证方面,GWR方法在区域经济问题上尤其是知识溢出视角取得了良好的效果:如李晓飞等[21]通过GWR方法探究了知识溢出与区域经济的关系问题,Caragliu等[22]运用GWR研究了知识溢出的传播渠道,这些研究也证明了该方法在互联网此类知识密集型产业区域经济影响问题探究上的可行性。所以,本文以2012、2016年中国各省数据为例,采用GWR模型从区域差异视角研究中国互联网对第三产业的影响,并为互联网与第三产业发展提出合理建议。
2011年是互联网由PC时代到移动互联网时代的重要转折点,而到2015年,国家正式文件出台将“互联网+”与产业生态体系建设相联系。故本文综合考虑研究的问题和数据的可得性,选取两个关键时间节点的次年,即2012、2016年衡量第三产业和互联网发展情况的分省年度数据开展分析[23]。将第三产业地区发展总值(GDP)作为描述区域第三产业发展状况的主要指标,选做因变量。根据国家数据划分标准,互联网主要发展指标分为以下九项:互联网上网人数、域名数、网站数、网页数、互联网宽带接入端口、互联网拨号用户、互联网宽带接入用户、城市宽带接入用户、农村宽带接入用户。已有研究也多选取这些指标作为互联网发展情况的主要衡量变量[24-25]。随着互联网技术的发展,拨号上网方式逐渐被废弃,使用用户较少,且和农村宽带接入用户数据一样,部分省份存在严重的缺失,且互联网宽带接入用户的指标涵盖了城市宽带接入用户和农村宽带接入用户,所以本文在建立模型时去除互联网拨号用户、城市宽带接入用户、农村宽带接入用户这三项指标,将其余六项指标作为自变量。各变量的含义如表1所示。
表1 各变量含义及对第三产业的主要影响
因各变量之间存在数量级的差距,为避免带宽选择过大造成的回归模型拟合度的降低,回归前对所有变量进行以10为底取对数的预处理后再作为输入数据,这样能在不改变数据的性质和相关关系的同时,压缩变量的尺度,预处理公式如(1)所示。
(1)
2.2.1 地理加权回归(GWR)
地理加权回归模型是传统OLS回归模型的扩展形式,它将变量的空间坐标纳入到了模型之中,OLS与GWR模型的表达形式差异如公式(2)和(3)所示:
其中,xik表示第i个样本点的第k个指标值,yi表示第i个样本被解释变量的拟合值。(ui,vi)是第i个样本点的经纬度坐标,βk(ui,vi)是连续函数βk(u,v)在点i处的值。若βk(ui,vi)在空间内的任意点i处都具有相同的值,则GWR公式(3)就在全局等效于OLS公式(2)。
针对上述形式,GWR采用加权最小二乘法,通过样本点本身和与其位置i相邻的其他样本点信息进行加权估计局部回归系数,使局部回归系数随空间地理位置的变化而变化[26],令
则局部回归系数表达式如公式(4)所示:
(4)
其中,n表示样本点个数。
,β0是β的估计值,
,win是对位置i处数据赋予的权重。
对于GWR模型中的权重,选用高斯核函数作为权重函数来表示与回归点i的关系,其表达式如公式(5)所示:
上式(5)中,b为距离与权重之间函数关系的非负衰减参数,即带宽。当b值给定时,距离回归点i越远的样本点权重将越趋近于0,且b越大,空间权重随着距离增减越慢。dy为预测点和实际点之间的欧氏距离。
为确定最佳带宽,减少GWR模型的估计误差,本文采用交叉确认法(Cross-validation, CV)来确定带宽b[27],该方法将不同带宽分别计算CV值,通过寻找CV的最小值以确定带宽,其表达式如(6)所示。
2.2.2 空间自相关
本文采用空间自相关的方法对各区域之间的依赖关系进行测量,主要包括:全局自相关和局部自相关。
(1)全局空间自相关。全局空间自相关是用于检验临近区域间是否存在空间相关性,本文采用Moran’s I指数[28]进行衡量,该指数可以表示空间邻近区域要素变量值的相似程度,其表达式如公式(7)所示:
(2)局部空间自相关。局部空间自相关是用来检验目标区域与其相邻区域之间的空间关联性和空间差异程度,其公式如(8)、(9)所示:
为探究互联网对第三产业发展影响的省际差异,本文首先对中国2012年到2016年各省第三产业GDP的空间分布情况做出初步分析。分析结果如图1所示,2012年第三产业GDP空间格局大体呈川字型格局,东部沿海地区水平最高,中部其次,西部最低。其中,江苏、广东两省的第三产业GDP规模超过2万亿元,北京、山东、上海、浙江四省市的规模超过1万亿元,西藏、青海、宁夏、海南四省市的不足2 000亿元。
图1 2012、2016年第三产业GDP省际分布
而在2016年,东中西第三产业GDP分布的空间格局大体不变,但中部地区增长显著。其中,北京、山东、浙江三省市的GDP规模跃居2万亿元梯队,辽宁、河北、福建、河南、湖北、湖南、四川七省市的GDP规模超过1万亿,西藏、青海、宁夏三省市的GDP规模依旧未突破2 000亿元关口。
就增长率而言,则呈现出内陆及中西部高、东部沿海及东北部低的格局。河南、重庆、四川的第三产业增长率最高,超过80%。安徽、江西、湖北、青海其次,辽宁省的增长率最低,仅为21.2%。各省5年增长率分布情况如图2所示。
图2 2012—2016年第三产业GDP增长率省际分布
为探究互联网发展各项主要指标对各省第三产业GDP的影响作用,本文利用Arcgis 10.2提取各省份几何中心的经纬度坐标,使用GWR4.0分别选取2012年、2016年的横截面数据,将互联网发展各项指标与第三产业GDP进行地理加权回归对比分析。部分省市回归结果示例如表2(完整结果见附表A、附表B)。
表2 部分省市GWR回归结果示例
表2(续)
上表中v和Std.v分别表示残差和标准化残差,Local R2代表该省局部的拟合效果,Influence和CooksD用于衡量观察值对结果的影响力和影响距离。由2012年、2016年各省市回归结果可以计算GWR回归模型拟合精度相关指标如表3所示。
表3 2012、2016年GWR回归模型拟合精度评价指标
表4 2012年 GWR回归系数分布情况
表5 2016年 GWR回归系数分布情况
结合时代背景,2012年正处于传统互联网到新型互联网时代的转型期,这一时期的互联网经济还保有工业经济时代的相关特征——在价值链内部通过一系列的活动完成价值创造,通过激进的新技术去获得商机,技术要素和市场要素是关键[29]。互联网对于第三产业的价值主要受制于软硬件设施方面,“网站”这一重要媒介为服务业、金融业等第三产业提供平台,用户的市场参与度也主要受宽带端口接入的影响。而随着后来移动互联网的进一步发展,互联网的新态势全面带动了社群经济、知识经济的发展,互联网企业经营模式也转变为C2B主导,用户成为价值创造的主体,因此互联网上网人数对第三产业GDP的影响力大大增强。
为探究各影响因素2012、2016年在省际上分布的空间相关性和空间异质性,将各省的回归系数绘制成分布地图做进一步分析。图3—8中,每幅图数据按照该组数据的上下分位点及中位数作为分界线分为五组。
图3 2012、2016年上网人数因子回归系数分布
图4 2012、2016年域名数因子回归系数分布
图5 2012、2016年网站数因子回归系数分布
由图3—5可知,2012年、2016年互联网上网人数的回归系数在绝对数值大小分布上整体格局由南高北低变为北高南低。而2012年域名数系数则呈现东南高西北低的形势,到2016年随着域名的回归系数由负值变为正值,东北地区域名数回归系数数值显著提升,且对该省第三产业GDP促进作用最大。南方省份的在各省系数大小的相对优势不再明显,内陆地区变化不大。网站数因子对各省的相对影响力情况基本不变,始终保持着西北高,东南低的特点。但青海、甘肃、内蒙古、云南省的系数影响力相对于其他省份有所减弱。
图6 2012、2016年网页数因子回归系数分布
图7 2012、2016年接入端口数因子回归系数分布
图8 2012、2016年接入用户数因子回归系数分布
由图6—8可知,网页数因子的回归系数的分布相对稳定,尽管由2012年的负向影响转变为2016年的正向影响,但依然呈现出西北高,东南低的局势,而2016年四川、云南等地的网页数因子对GDP的促进作用较2012年有了一定的提升。2012年接入端口数因子分布呈现西北高东南低的特点,随着其与第三产业的关联由正相关变为负相关,2016年沿海地区影响趋同化现象明显,东北的回归系数相对于其他省份系数的相对位次下降明显,中西部系数的绝对大小相对于其他省份排序最前。接入用户数系数各省在绝对数值的分布范围变化不大,但各省排序南北异置,与互联网上网用户数因子分布相似。
3.3.1 全局空间自相关
为检验GWR整体估计的显著性,对模型进行全局自相关分析得到表6,其中,Z(I)为标准化后的正态分布统计量,E(I)为理论均值。由下表6可知,该GWR模型对于2012年、2016年在空间上全局分布的解释效力均在5%的水平上显著,对于2012—2016年增长率的解释效力在1%水平上显著。
表6 全局空间自相关分析
注:*表示在5%水平上显著,**表示在1%水平上显著。
3.3.2 局部空间自相关
对上述数据进行局部空间相关性分析可以确定各省份与周围省份互联网各指标对于第三产业影响的相似性和相异性。由图9可知,2012、2016年山东及江浙一带在相似性上显著、广东省在相异性上显著;而在2012—2016年增长率方面东北地区(除黑龙江外)在低值相似性上显著,中部地区四川、重庆、湖北、河南在高值相似性上显著。
图9 局部空间自相关分析
3.3.3 空间变异性检验
由表7和表8可知2012年各指标的各类准则综合得到的DIFF值都为负值,即6个指标的空间变异性都具有显著性。而该时期宽带接入用户数量造成了非常明显的空间变异性,其F值达到了113.757。但是到2016年互联网上网人数和网站数、宽带接入用户数对于第三产业的影响空间变异性不再显著。这主要是由于互联网产业的迅速发展带来的用户数量增多和网页的增加,使得区域之间在用户参与和网站建设方面的差异缩小。
表7 2012年空间变异性检验
表7(续)
表8 2016年空间变异性检验
本文通过对2012年、2016年中国各省第三产业GDP数据进行初步分析后,根据六项互联网指标建立GWR回归模型,并进行空间相关性分析。研究发现,互联网的发展对于第三产业影响具有明显的地区差异,2012年这种影响主要来自于网站数、互联网入端口数这类互联网软硬件基础上,2016年主要来自于互联网上网人数。就省际差异来说,五年内变动较大,以东北部、西南部变化最为明显,涉及“人”这一因素的因子影响程度南北分布前后截然相反。在空间相关性方面,山东及江浙一带与周边表现出显著的空间相关性,广东省与邻近地区有显著的空间相异性,在增长率方面,中部内陆地区和东北部空间相关性显著。造成以上区域分布特点的原因主要有以下几点:
(1)区域要素禀赋效应。已有研究表明,我国的技术创新与产业发展遵循比较优势原则,这一观点又被称为“要素禀赋论”[30],即一个地区技术的自生能力,是与该地区的要素禀赋相适应的[31]。互联网技术对于各省份第三产业发展的影响也受到不同区域要素禀赋影响。根据其影响因素的不同,可以划分为两个阶段,第一阶段是以技术要素为主的传统互联网阶段,第二阶段是以人才要素为主导的移动互联网阶段。东部及沿海地区因开放程度高,技术、人才、市场资源充沛,在刚刚步入移动互联网时代的初期就已开始向第二阶段做出转换,而中西部内陆地区却发展迟缓。当移动互联网逐渐走向成熟,东部沿海地区产业发展进入收敛期,因要素禀赋驱动力不足而滞后发展的中西部内陆地区正处于产业发展的峰值,故而后期互联网上网人数对于该区域第三产业的影响力更大。同时,一定时期内的区域要素禀赋是处于相对稳定状态的,对于像域名数、网站数、接入端口数这类与区域技术、人才储备直接相关的因素,随着时间推移,省际布局变化不大。
(2)“服务众包模式”下的知识溢出与社群经济。根据新增长理论,知识溢出与物质资本类似,对区域经济增长存在一定促进作用,这种增长来自于增强区域创新能力[31],而“人”作为创新的主体,作用尤其突出。移动互联网时代,用户不再是单一的需求方,而成为价值的创造方,企业成为用户提供服务与需求对接的平台,这种模式也被称为服务众包模式[32]。用户掌握了主导权,在服务业方面根据兴趣、需求上的特点自发形成了一个个社群,而第三产业对于此类社群依赖性很高,这种全新模式也逐渐成为中国互联网服务行业发展的主流。因此,互联网上网人数对于第三产业GDP增长的促进作用越来越显著,而知识溢出与社群经济都具有一定的区域性,这就导致了这种促进作用出现了各区域之间的分异和区域内部的趋同现象。
(3)产业集聚与产业分散的交互作用。根据新经济地理理论,隐性知识溢出的空间局域性特征加强了人才、产业的集聚,产业集聚的规模效应促进了产业的发展。阿里巴巴、腾讯、百度等互联网巨头集聚江浙一带,大大带动了周边区域产业经济的升级与发展,形成了高度的空间相关性。而在产业集聚的同时,因地域性产业分工重心的不同,势必导致产业的分散,这也影响了该地域互联网对于第三产业的作用力,也就是空间异质性的形成。产业集聚效应与分散效应的交替作用形成了当今各省的产业布局。
现有研究对于互联网与第三产业关系的探讨大多侧重于要素侧面,而未考虑区域上的分异,更未考虑这一分异在不同时期所产生的影响。鉴于中国地域辽阔,区域经济文化环境差异较大,本文选取2012、2016年中国各省数据采用GWR模型对各省互联网对于第三产业作用的空间相关性和异质性进行研究,力图在新的发展时期为中国各地区产业结构的调整升级与互联网经济发展提供一些启示。
本文的研究表明,互联网对于第三产业作用力的区域分异与该区域的要素禀赋直接相关,且在不同的发展时期有所不同。新时期移动互联网的发展改变了传统互联网时代技术要素主导的特征,“人”这一行为主体的作用日益突出,服务众包模式下所产生的知识溢出与社群经济现象对区域第三产业的发展特征产生了重要影响,而这种影响又有很强的空间局域性特征,加强了产业的集聚。与此同时,区域分工的不同带来的产业分散效应与集聚效应交互作用,形成了不同时期下的区域产业格局。研究结果对于“互联网+”背景下的区域产业结构的调整升级形成了理论创新。
上述发现对于宏观上经济政策的制定和微观上互联网企业的市场竞争都具有很大借鉴意义。政府在制定第三产业区域政策方面,应该结合各区域当前的互联网发展阶段、要素禀赋,客观认识到有的正处于移动互联网的后发优势阶段,有的已经进入了饱和期逐渐迈向以“人工智能”“云计算”等技术为代表的新互联网时代。而对于企业来说,应把握以用户社群为导向,大力发展知识经济,同时在与互联网结合紧密的服务业业务选址上,结合区域产业发展情况,尽量选择技术密集型、人才密集型地区,从规模效应中获得竞争优势。
首先,在数据选择上,因为受到国家统计局的数据汇总延迟性质,分省数据只能采集到2016年以前的,在刻画当前产业经济最新形式上有所欠缺。其次,受版面与方法特性限制,仅选取关键时间节点的横截面数据进行了区域差异分析,缺乏对整个连续的时间段内各区域变化进行探究。最后,本文仅探究了互联网对于第三产业的区域影响,而这种影响是双方面的,文中对于第三产业的发展是怎样影响互联网的未有涉及。未来将根据更全面的第三产业与互联网的数据,进一步深化互联网全新发展趋势下第三产业对于互联网发展的反作用研究。