陈星楠 福州大学人文社会科学学院
电子商务是诞生于互联网的新兴经济类型,吸引了许多学者对电子商务展开了研究[1-3]。这些研究集中在概念、内涵、经验借鉴、发展模式和影响因素等,但是由于不同地域的复杂性,这些研究的适配性都有限,给学术成果的迁移应用带来了障碍。
美国商务部最早提出了电子商务水平的测量标准指出电子商务测度的指标体系包括三个大类:电子商务的就绪度、电子商务的应用度和电子商务的影响度。我国的电子商务测量源自信息化水平的测量,当前普遍认为地区信息化水平与电子商务水平呈正相关[4-5],我国的电子商务水平测量指标中相当一部分是反应信息化水平高低的,而所有的指标在不同的地区是否都适用却有待商榷[6]。
基于此,本文在现有文献研究的基础上,根据权威原始数据,运用因子分析和聚类分析的方法,对福建省各地区企业信息化水平和电子商务业务开展情况在因子分析的基础上进行聚类量化的评估,探讨地区信息化水平对电子商务的影响,为提高电子商务发展水平提供一定参考。
影响电子商务的发展水平的因素有很多,国内的指标体系包括上网人数、互联网普及率、互联网宽带接入端口、计算机拥有数、第三产业产值、网站数量、网页数量、域名总数、电话普及率、移动电话普及率、互联网拨号用户数、互联网宽带接入数等。通过《福建经济普查年鉴(2018)》收集整理企业信息化和电子商务交易情况,运用SPSS统计软件进行因子分析基础上的聚类实证研究。
根据权威资料中的指标包括企业数、建立网站企业数目、建立网站企业比重、网站数量、每百家拥有网站数、使用局域网企业数目、使用局域网企业比重、使用互联网企业数目、使用互联网企业比重、使用计算机的企业数目、使用计算机的企业比重、期末在用计算机数、每百人拥有计算机数。其中比重型和人均型指标与数目型有所重复,因此保留数目型指标,舍弃比重型指标。
上述指标从不同方面反应了企业信息化水平,许多指标高度相关。全面的指标一方面有助于客观反应现实,但另一方面,数据的高相关度使得选取合适指标即可体现信息化水平,模型中的共线问题会影响模型的有效性。因此,首先通过相关度分析,对各指标进行初步取舍,筛选合适的变量(见表1)。
由表1可知,指标都呈高度效果性,表明研究所选的指标做因子分析能够有效反应企业信息化水平。总企业数与其他企业数有关,且企业数与其他指标都呈高相关度,因此,在后续的研究中舍去企业数,保留其他企业数目指标。此外,网站数量与建立网站数目有所重复,因此保留高相关度的建立网站的企业数目指标即可。最后,期末在用计算机数相对其他指标而言,相关度不在一个水平,不适合统一建模,优化后的指标从7个变为4个。
表1 企业信息化指标相关系数
同样来自《福建经济普查年鉴(2018)》,权威资料中电子商务交易量指标包括有电子商务的企业数、有电子商务销售的企业数与销售金额、有电子商务采购的企业数与销售金额等。为避免重复选择指标,因此将有电子商务的企业数排除,从剩余指标中选择电子商务销售的企业数、电子商务销售金额、有电子商务采购的企业数、电子商务采购金额四个指标,相关性分析结果见表2。从表2 可知,四个指标变量相关性较高,适合做因子分析[7-8]。
表2 电子商务开展指标相关性关系
首先运用因子分析对10个地区的信息化水平和电子商务开展情况有关指标进行分析。对各单变量原始数据进行Z-Scores法标准化处理,消除各指标不同量纲对因子分析的影响。再利用SPSS对福建省各地区相关指标进行因子分析,提取特征值大于1的公因子,公因子描述的总方差越大越好。
第一步对上述指标进行KMO和巴特利特的球形度检验,看数据是否适合进行因子分析。分析结果如表3、表4所示。
表3 地区信息化水平指标的KMO和巴特利特球形度检验
表4 地区电子商务开展情况指标的KMO和巴特利特球形度检验
地区信息化水平KMO=0.787>0.7,地区电子商务开展情况KMO=0.780>0.7,较合适做因子分析;两体系的巴特利特球形度检验Sig均为0,拒绝原假设,认为个变量之间并不是独立的,适合做因子分析。
提取公因子,对福建省10个地区的企业信息化指标和电子商务开展情况指标进行提取主成份,结果见表5、表6。提取的2个公因子分别描述了原变量总方差的98.876%和86.252%,可以认为这2个因子基本反映了原变量的绝大部分信息[9]。
表5 企业信息化指标解释的总方差
表6 电子商务开展情况指标解释的总方差
再根据因子得分系数矩阵(见表7、表8)将因子(信息化指标)和因子(电子商务开展情况)得分进一步用各因素表示如下:
表7 企业信息化成分得分系数矩阵
F1=0.249Z建立网站企业数+0.252Z使用局域网企业数目+0.252Z使用互联网企业数目+0.252Z使用计算机企业数目
F2=0.248Z有电子商务销售企业数目+0.281Z电子商务销售金额+0.274Z有电子商务采购企业数目+0.273Z电子商务采购金额
综合计算出各地区信息化水平综合评分和电子商务开展水平综合评分。需要特别指出的是,由于在初时数据时进行了标准化,综合得分可为负,但并不表示电子商务水平为负,而是表明其综合水平低于平均水平。将企业信息化综合得分和电子商务业务水平得分综合比较,讨论企业信息化水平和电子商务业务水平的关系,结果见表8。从表中可知,除福州和平潭地区企业信息化水平和电子商务业务水平排名完全相同,其余地区两排名都有一定距离。但是,各地区两排名差距并不大,可知信息化水平和电子商务业务水平还是有一定相关性的,并且从综合排名可以看出企业信息化水平和电子商务业务水平具有一定空间分异性。
表8 地区信息化水平得分和电子商务业务水平得分排名比较
为进一步探讨企业信息化水平和电子商务业务的空间分异[10],下面运用系统聚类的方法对因子分析中产生的新因子变量进行系统聚类分析。方法为“组间联接”,度量标准区间为“平方Euclidean距离”,绘制树状图。经SPSS25.0分析得系统聚类树状图。此次聚类采用新的作为自变量,地区为分类变量,结果如图1、图2所示。
图1 企业信息化水平树状图
图2 电子商务开展情况树状图
从企业信息化聚类结果可以看出,10个地区分成了5类,厦门为第一类,福州、泉州为第二类,平潭为第三类,莆田、龙岩、漳州为第四类,南平、宁德、三明为第五类。而从电子商务开展情况聚类分析结果可以得知,最小组距分组情况是厦门、福州、平潭、泉州各自单独一类,其余六个地区为第五类,其中厦门、福州组间距较小,视为一个大类。
通过相关分析剔除了电子商务水平研究因素的多重共线性,从而找到影响我国电子商务水平的核心因素。通过因子分析,构建了无差异的综合得分,在此基础上用聚类分析把各省域电子商务发展水平相似区域归在一类,既可以发现共性,又可以区分差异,满足完备性而不会丢失信息。
通过上述因子分析和聚类分析可以得出以下结论。
第一,各地区企业信息化和电子商务发展水平存在较大的不平衡。从得分来看,平潭地区与其他地区的发展水平存在较大差距。厦门、福州、泉州地区发展水平也远高出平均水平。
第二,地区企业信息化水平与电子商务业务水平有一定相关性,但并不完全一致。企业信息化达到一定水平的地区相应电子商务水平高,如福州、厦门、泉州;企业信息化不足的地区如平潭,其电子商务业务开展有限。其余地区的企业信息化水平与电子商务业务水平也存在一定相关性,但相关性不如上述的情况高。
第三,企业信息化和电子商务发展水平存在明显的地区反应。通过系统聚类分析可知,企业信息化和电子商务业务水平存在明显的空间分异。信息化和电子商务发展程度高的地区集中在东南沿海地区,并且存在福州、厦门、泉州三个高发展水平中心。与中心空间联系越紧密的地区,企业信息化和电子商务业务水平也更高。