摘要:本文运用面板数据模型和关联规则模型比较信息化与工业行业融合程度,分析不同的信息通讯技术对于省域工业结构升级的影响。结果发现:在2003-2012年间,通讯技术比信息技术对省域工业结构升级的影响更显著;随着时间的推移,信息通讯技术与技术密集型工业行业的融合程度更好。因此,信息化对我国省域工业结构的升级具有促进作用,未来应更好地促进中西部地区工业化与信息化的融合,还应更好地发挥互联网技术的作用。
关键词:信息通讯技术;工业化;面板数据模型;关联规则模型
中图分类号:F062.5 文献标识码:A
作者简介:刘飞(1975-),男,西安人,西安邮电大学经济与管理学院讲师,经济学博士,研究方向:信息产业发展。
改革开放以来,我国的工业增加值在GDP中的比重,基本上围绕着40%的比例上下波动。从1983年开始,我国工业增加值的比重大致呈周期性的波动,基本上每十年一个波动周期,但波动的幅度不断变小。我国的信息化建设在2000年以后得到了突飞猛进的发展,“以信息化带动工业化”成为新型工业化的重要内容之一。工业化的一个发展方向就是工业产业结构的升级,即技术密集型行业增加值或总产值所占比重不断提高。本文选择我国2003-2012年的省域数据,运用不同的分析方法研究省级区域信息化建设对工业化结构升级的影响。之所以选择这个时期,一是因为2000年以后,我国的信息通讯技术才得到广泛的应用;二是因为这个时间段接近一个工业增加值比重变化的周期。
一、基于面板数据模型的分析
对于本文的研究主题,国外关注的焦点主要是验证“索洛悖论”,即信息通讯技术的使用是否提高了生产率。关于信息通讯技术对生产率影响的研究,通常采用三种方法(Chou等,2012)[1]:第一种方法是基于生产函数框架,除了劳动和资本外,还将信息通讯技术看做单独的生产要素,分析信息通讯技术的影响;第二种方法是将信息通讯技术对生产率的影响,通过信息通讯技术资本积累和经济增长的关系来研究;第三种方法是评估信息通讯技术资本对生产的作用,目的是要回答信息产业如何促进经济增长。在行业层次通常的做法是按照一定的标准,将不同国家(如OECD国家)或同一国家(如美国)的不同行业分为信息通讯技术密集行业和非密集行业,再比较这两类行业的劳动生产率是否有差异,以验证信息通讯技术是否带来行业生产率得到提高(Dahl,2011)[2]。大量的研究文献发现“索洛悖率”不存在,信息通讯技术的使用提高了生产率。目前,我国经济发展的关键问题是如何实现产业结构升级,即高附加值产业的增加值或总产值比重不断提高,本文将基于我国省域的数据进行研究。
面板数据(Panel Data)模型是将横截面数据与时间序列数据相结合的一种数据模型,与传统的回归模型相比,它可以充分利用数据信息、减少估计的偏误等(Cheng Hsiao,2005)[3],其基本形式如下:
+εit
本文用各省区的工业结构高度化来作为因变量,用技术密集型行业总产值在工业总产值中所占的比重来表示工业结构高度化,这里的技术密集型行业主要包括普通机械制造业、专用设备制造业、交通运输设备制造业、电气机械及器材制造业、电子及通信设备制造业、仪器仪表及文化办公用机械制造业等六大行业。
由于数据约束等原因,现有的研究倾向于把信息通讯技术看做是同质的(Nicholas等,2009)[4],通常选择计算机数量、信息通讯技术投资、互联网用户数量等指标来代替信息通讯技术的发展。但是,信息通讯技术具有不同的内容,本文使用的信息通讯技术变量主要从两个角度来划分,一是将信息通讯技术分为基础设施建设和使用,反映使用的变量主要有固定电话年末用户人数、移动电话年末用户人数、互联网上网人数等,反映基础设施建设的变量主要有本地电话局用交换机容量、长途自动交换机容量、移动电话交换机容量、长途光缆线路长度、互联网宽带接入端口等。另外一种分类方法是分为通讯技术和信息技术,前者主要用固定电话年末用户人数、移动电话年末用户人数、本地电话局用交换机容量、长途自动交换机容量、移动电话交换机容量,后者主要有互联网上网人数、长途光缆线路长度、互联网宽带接入端口等。除了信息化的因素外,其他变量也可能影响工业结构高度化。本文选择自主创新、居民收入、市场化水平作为控制变量,其中自主创新用各省域国内专利授权数表示,居民收入用消除价格因素后的各省域城镇居民实际收入表示,市场化水平用各省域的非国有经济增加值比重来表示。
本文所用变量数值主要来自于国研网数据库,2012年数据来源于《中国工业经济统计年鉴2013》,主要指标的平均值如表1所示。从表1可以看出这些数据的平均值符合人们一般的概念性认识,即东部地区的信息化水平、专利数等数据大于中西部的数据,这表明我国不同区域的信息化建设等方面存在差异,东部地区的发展要好于西部地区。另外,随着时间的推移,2012年的信息化水平等数据大于2003年的,这表明我国的信息化建设水平等有所提高。
本文分别利用固定效应模型和随机效应模型进行分析,并进行Hausman检验,发现固定效应要优于随机效应模型。用Stata 12.0软件得到的固定效应模型主要结果如表2所示,对于全国各省区来说,从表2可以看出工业高度化要受到出口比例、市场化程度、移动电话使用人数、互联网接入端口等变量的影响,而专利授权数、居民收入等变量对工业结构高度化的影响不显著。另外,本文还分别对东部地区和中西部地区进行了分析,发现除了出口比例外,其他变量的情况也全国总体基本一致。东部地区的变量参数值大于中西部地区,这说明东部地区相应的变量对工业结构升级的影响更大。本文还可以发现这里移动电话使用人数的变量系数要大于互联网接入端口,前者代表通讯技术,后者代表信息技术,这说明通讯技术对工业高度化的影响要大于信息技术。
二、基于关联规则模型的实证分析
简单地说,关联分析就是寻找事物之间的联系和规律,从而发现它们之间的关联性(薛薇和陈欢歌,2012)[5]。在数据挖掘中,关联分析的主要技术是关联规则,关联规则的一般表示形式是:
X Y(规则支持度,规则置信度)
这里的X表示规则的前项,相当于回归模型中的自变量;Y表示规则的后项,相当于回归模型中的因变量,但不同于一般的回归模型,Y中可以包括很多变量;规则支持度和规则置信度是判断关联规则有效性的两个重要指标,规则置信度描述了包含项目X的事务中同时包含项目Y的概率,反映了在X出现的情况下Y出现的可能性;规则支持度表示项目X和项目Y同时出现的概率。
关联规则挖掘比较适用于记录中的指标取离散值的情况,如果原始数据是连续的数据,则在关联规则挖掘之前要进行适当的数据离散化。关联规则中最核心的算法是Apriori算法,它从资料集合中找出所有的频繁项集,再从这些频繁项集中产生关联规则。关联规则的基本思想是通过计算现象之间的条件概率,如果这样的条件概率满足一定的条件,就可以认为这些现象在一定的概率下同时发生,从而说明这些现象之间具有一定的关联性。本文的变量值都是连续的变量,而且有的变量值不完全服从正态分布,可以取每个变量的中位数作为临界值,如果大于中位数,则为1,如果小于等于中位数,则取0。因此,本文的研究问题就变成了在信息化的某个或某些指标取值大于临界值的情况下,哪些工业行业的总产值比例也大于临界值,以及在多大程度上大于临界值。据此就可以判断信息化带动了哪些工业行业的发展,或者说两者融合程度更好。
本文将反映信息化的变量作为关联规则的前项,将工业中各行业的总产值比例作为关联规则的后项,取每个变量的中位数进行离散化。用IBM SPSS Modeler14.2软件得到关联规则模型的结果,对于置信度小于80%,且支持度小于30%的规则予以排除。本文对全部地区运用关联规则进行分析,主要的结果如表3所示。表3的前项可以理解为原因,后项可以理解为结果。可以看出固定电话用户数、固定电话交换机容量指标值大于临界值的省域,其通用设备制造业的总产值比重大于临界值的概率为47.67%。类似地长途交换机容量、固定电话交换机容量指标值大于临界值的省域,其纺织业的总产值比重也大于临界值的概率为44.8%等。这说明信息化的发展既对各省域传统的金属制品业和纺织业有促进作用,同时也对电气机械制造业等技术密集型行业有促进作用。
对东部地区进行关联规则分析,结果如表4所示。对中西部地区进行关联规则分析,结果如表5所示。相比较而言,对比上述两表可以看出信息化对于东部地区的通用设备制造业等行业带动作用比较明显,而对于西部地区的金属冶炼业、纺织业等传统行业的带动作用比较明显,这说明信息化对于东部和中西部地区工业结构升级的影响存在比较明显的差异。为了比较信息化是否随着时间的变化而对工业结构升级产生影响,本文分别对2003年和2012年的信息化指标和工业行业总产值比重进行了关联规则分析。2003年的数据关联规则分析结果如表6所示,从表6可以看出2003年信息通讯技术支持度较高的行业主要是传统的行业,如非金属矿采选业、金属制品业、纺织业等,而在技术密集行业中,电气机械制造业和通信设备制造业的支持度较高。另外,还可以看出前项主要是长途光缆长度、宽带接入端口数量等基础设施指标,这说明在2003年主要是信息通讯技术基础设施对工业结构升级产生影响,而这些基础设施还没有得到充分的利用。
本文对2012年的数据进行关联规则分析,得到的结果如表7所示。从表7可以看出2012年支持度较高的行业比2003年有所增加,而且技术密集行业增多,并且支持度更高。这表明到2012年信息通讯技术对工业结构升级具有更大的促进作用。另外,2012年前项主要是信息通讯技术利用方面的指标,说明信息通讯技术的使用更好地促进了工业结构升级;同时,通过和表6的对比可以发现2012年信息化对于金属制品业、纺织业等传统制造业的支持度都有所提高,说明信息化与这些行业的融合程度更好。
三、结束语
从本文的分析中可以得出以下结论:
第一,在信息通讯技术基础设施中,互联网接入端口数量对工业高度化影响显著,移动电话使用人数在信息通讯技术使用中对工业高度化的影响显著,而且后者的影响程度要大于前者。这说明我国在2003-2012年间不同省域通讯技术对工业高度化的影响更大,而新兴的互联网技术对我国经济发展的促进作用还有待于进一步发挥。
第二,信息通讯技术既可以与一些传统的工业行业融合较好,也可以与技术密集型行业融合较好。这提示人们对于那些与信息化融合不够好的传统行业,应该加大信息通讯技术的使用,从而减少成本,提高效率。
第三,信息通讯技术东部地区工业结构升级的促进作用要比西部地区更好,这说明我国不同区域信息化的作用发挥存在一定的差异,中西部地区在利用信息通讯技术促进工业结构升级方面还有很大的发展空间。
第三,随着时间的推移,信息通讯技术与技术密集型行业的融合程度更大,而且发挥作用的信息通讯技术逐渐从信息通讯技术基础设施,转向了信息通讯技术使用,这应该成为我国未来信息化与工业化融合的重要发展方向。
参考文献:
[1] Chou Y.C,Shao B,Lin W.T.Performance evaluation of production of IT capital goods across OECD countries: A stochastic frontier approach to Malmquist index[J].Decision Support Systems, 2012,54:173-184.
[2] Dahl C.M.,Hans C.K.,Anders S.ICT and productivity growth in the 1990s: panel data evidence on Europe[J]. Empirical Economy,2011,40:141-164.
[3] Cheng Hsiao.面板数据分析(第2版)[M].北京:北京大学出版社,2005.
[4] Nicholas B,Luis G.Raffaella S,John V.R.The distinct effects of Information Technology and Communication Technology on firm organization[R].NBER Working Paper 14975,2009.
[5] 薛薇,陈欢歌.基于Clementine的数据挖掘[M].北京:中国人民大学出版社,2012.
(责任编辑:厉新)