基于支持向量机的中国城市软件产业竞争力研究

2016-05-14 14:01胡俊超王丹丹
现代管理科学 2016年5期
关键词:支持向量机竞争力

胡俊超 王丹丹

摘要:作为关系国民经济和社会发展全局的基础性、战略性、先导性产业,软件产业对中国城市经济社会发展具有重要的支撑和引领作用。研究中国城市软件产业竞争力,有利于加快中国城市软件产业布局和政策调整,争抢新一代信息技术和产业发展先机。文章在充分借鉴已有研究成果的基础上,创新地提出城市软件产业竞争力评价体系应结合世界八大科技园区成功关键要素以及世界科技园区的核心竞争力,通过综合环境、产业实力、创新能力和发展潜力四个维度构建。结果表明,产业实力对软件产业竞争力影响最大,贡献度高达54.5%。具体来看,软件产业对经济拉动作用、软件产业政策以及软件产业盈利水平成为影响中国城市软件产业竞争力的主要因素。

关键词:城市软件产业;竞争力;支持向量机

一、 引言

近年来,包括美国、欧盟、日本、韩国和中国在内的世界各个主要国家和地区纷纷加大投入,出台包括云计算、大数据、移动互联网等领域战略规划,积极推进对新一代信息技术的研发和应用,加快技术、标准和产业布局,力图抢占发展先机和战略制高点。

伴随各国加快支持、布局新一代信息技术和产业,争抢发展先机,软件和信息技术服务业(以下简称“软件产业”)的重要地位日益凸现,其在IT产业中的比重不断提高。根据Gartner的相关数据计算,2013年世界软件产业支出占世界IT支出的比重高达33%。工业和信息化部数据显示,在中国IT产业结构中,软件产业的比例从2008年的11.3%上升至2014年的24.2%。

研究中国城市软件产业竞争力,有利于加快中国城市产业布局和政策调整,争抢新一代信息技术和产业发展先机,带动资源要素向具有较强竞争力的城市流动,促进资源合理优化配置。

二、 研究思路与指标体系

1. 研究思路。关于城市软件产业竞争力研究成果有很多,大部分研究以波特钻石模型为分析依据,从产业投入、产业产出、产业创新能力等方面构建指标体系,研究软件产业竞争力现状、揭示影响软件产业竞争力的主要因素。

贾建莉、刘西林等(2005)以产业的投入和产出、产业的技术创新、产业的市场绩效和产业的外部支撑环境为关键要素,加入劳动强度等相关指标,将陕西省软件产业与其他省和直辖市的软件产业进行了横向比较;嵇留洋,何有世(2012)等人从生产成本、基础设施、人才、软件产业的业务收入等方面对国内软件外包的竞争力进行分析,并对江苏省和国内其他7个省市软件外包的竞争力进行横向的比较和分析;孙德祥(2012)通过主成分分析方法,从产业基础、产业投入、产业产出、创新能力、集聚能力、社会效益和经济效益等方面建立18个指标对国内9个城市进行了评价;袁丹、雷宏振(2014)基于因子分析法,通过软件研发人均经费支出、软件研发人员占比等8个指标对国内12个软件园区竞争力进行了比较分析。

笔者认为,研究中国城市软件产业竞争力时,在充分借鉴已有城市软件产业竞争力研究成果的基础上,应当认真研究全球软件产业发展规律,总结世界科技园区成功的关键要素,寻求世界科技园区核心竞争力,同时结合中国软件产业发展实际,从科学性、全面性和系统性等方面构建中国城市软件产业竞争力评价指标体系,这也是本文的创新之一。

2. 指标体系设计。在全球范围内,具有重要影响力的科技园区包括美国硅谷、日本筑波科学城、法国安蒂波利斯科技城、爱尔兰国家科技园区、英国剑桥科技园区、德国慕尼黑高科技园区、印度班加罗尔、中国台湾新竹科技园区等,通过研究这些科技园区的发展历程,笔者发现,世界八大科技园区成功的关键,一是具有强有力的技术基础,包括健全的基础设施和完善的网络架构,二是具有鼓励创新、容忍失败、政策灵活的创业氛围,三是毗邻高校、依托人才的智力支持,四是在园区管理方面,引入景观规划、行政管理、招商引资方面先进的理念。

从产业竞争力角度看,世界八大科技园区的竞争力突出体现在三个方面:一是知识创新,二是产业聚集,三是政府和市场推动,具体体现在研发支出、科研机构数量、专利数量、产品新形态、信息设施、生活质量等方面。

值得注意的是,与国外科技园区的发展完全由市场主导的发展路径不同,中国城市软件产业一般采用城市发展与软件园区同步一体的发展模式,具有独特的发展特点,突出表现出城市软件产业发展综合环境好、产业集聚能力强、政策支撑力度大、后发优势明显等优点。

根据本文此前拟定的分析思路,笔者认为,中国城市软件产业竞争力评价指标体系应当构建如下:

三、 样本城市和研究方法选择

1. 样本城市选择。根据软件产业实力强,软件产业发展潜力大以及数据可比、可得等原则,本文将样本城市锁定在:北京、上海、天津、重庆、大连、宁波、厦门、青岛、深圳、长春、哈尔滨、南京、杭州、济南、沈阳、武汉、广州、成都、西安等19个城市。

2. 研究方法选择。本文在进行中国城市软件产业竞争力研究时,样本城市为19个,即样本量为19个,评价指标为24个,即变量为24个。由于样本量小于变量个数,传统的统计方法将会失效,应当寻求小样本分析方法。

目前,国内外常用的解决小样本问题的方法主要包括:贝叶斯(Bayes)方法、自助法(Bootstrap)方法、贝叶斯-自助法(Bayes Bootstrap)方法、蒙特卡洛(Monte Carlo)模拟及支持向量机(SVM)方法。

贝叶斯(Bayes)方法通过将关于未知参数的先验信息与样本信息综合,再根据贝叶斯公式,得出后验信息,然后根据后验信息去推断未知参数。使用这种方需要事先获得先验信息。自助法(Bootstrap)方法通过从给定训练集中有放回的均匀抽样来对总体进行推断的方法,这种方法在样本量较小时,会产生较大的误差。贝叶斯-自助法(Bayes Bootstrap)方法将贝叶斯(Bayes)方法与自助法(Bootstrap)方法有效结合,提高了估计的精度,不过它仍然需要掌握部分先验信息。蒙特卡洛(Monte Carlo)模拟通过构造概率模型或模拟系统模型,使所求问题的解正好是该模型的参数或特征量,然后通过模拟给出模型参数或特征量的估计值。它操作简单、程序简单,但存在着收敛速度慢等缺点。支持向量机(SVM)方法以结构风险最小化原则为理论基础,通过适当地选择函数子集及该子集中的判别函数,使学习机器的实际风险达到最小。

综合以上几种方法,支持向量机(SVM)方法在解决小样本、非线性及高维模式识别中表现出许多特有的优势,如对于维数不敏感、可收敛到全局最优、可去除大量冗余样本等。鉴于此,本文选择支持向量机(SVM)方法建模。

SVM方法假定支持向量机目的是把空间中的两类点(y=-1或y=1)用超平面wTx+b=0分开,而且希望这个超平面距离两类点的距离最大,也就是说,使得隔离带宽?籽=2/||w||最大,这等价于用Lagarange乘子法求下式的极小值,即:

根据得到的解w*,b*,?琢*得到最优分割超平面方程w*Tx+b*=0。任意点(x)的函数值w*Tx+b*的符号确定了该点的分类,或者说判别函数为sgn(w*Tx+b*),其数值大小代表了位置,即可用来进行竞争力判断。

四、 实证研究

根据前述中国城市软件产业竞争力评价指标体系,有四个分类变量(7.1是否云计算试点城市、7.2是否信息消费试点城市、7.3是否智慧软件园区试点城市和8.1是否拥有软件和信息技术服务业发展规划),可以按照各个变量结果为是或否,将样本城市分为训练集和测试集体,然后按照前述方法进行参数估计,使得?籽=2/||w||达到最大的参数估计为最优选择。

本文中指标体系数据全部来自于工业和信息化部,考虑到部分指标2014年度数据尚未发布,本文统一采用2013年度数据。同时,为消除量纲因素,本文在进行计算之前对数据进行了正态标准化,软件选择Matlab和minitab。

1. 竞争力评价结果。根据前述内容,使得?籽=2/||w||最大(即||w||最小)的分类变量为最优分类变量。根据计算结果,当分类变量为“7.3是否智慧软件园区试点城市”时||w||最小,此时对应的w*和b*数值带入相应方程即可得到最优超平面表达式f(x)为:

f(x)=-40.3x1+79.8x2-4.2x3+164.6x4+16.2x5+207.4x6+302.8x7+15.8x8+198.8x9-140.1x10+221x11+126.4x12+127.5x13+100.5x14+157.7x15-36.7x16+117.7x17+122.9x18+218.2x19+227.2x24+0.789 5

根据最优分类变量对应的参数估计结果,将样品观察值代入相应的方程中,可以得到中国城市软件产业竞争力按照从高到低的顺序为:北京市、深圳市、上海市、南京市、广州市、杭州市、成都市、沈阳市、济南市、大连市、武汉市、厦门市、西安市、青岛市、重庆市、天津市、宁波市、哈尔滨市和长春市,结果如图1示。

2. 聚类分析。根据快速聚类法,本文研究对象中的19个样本城市聚类结果如下:

由聚类树图(图1)可以看出,这19个样本城市大致可以分为五类:第一类:北京市、深圳市、上海市、广州市;第二类:南京市、杭州市、成都市;第三类:天津市、重庆市、武汉市;第四类:大连市、沈阳市、厦门市、济南市、西安市;第五类:宁波市、青岛市、长春市、哈尔滨。

从分类情况来看,第一类属于一线城市,在多项指标上领先,处于总体上具有竞争优势的梯队;第二类比较优势在于软件业务收入占城市GDP比重和中国软协年度推优产品数量,表明第二类软件城市竞争优势在于软件产业对城市经济的带动作用;第三类比较优势在于市辖区面积和高等院校数量,表明城市发展空间和智力资源成为第三类的比较优势;第四类城市各要素竞争力均处于中游,其竞争优势在于发展软件产业的整体性,第五类软件城市的比较优势在于软件和信息技术服务业收入增速,表明第五类城市发展软件产业的潜力较大。

3. 竞争力影响因素分析。通过最优超平面方程发现,对软件竞争力影响较大的因素包括:软件业务收入占城市GDP比重、软件和信息技术服务业发展政策及资金和软件和信息技术服务业盈利水平,这三项指标的贡献度达到40.5%。由此可见,软件产业对经济拉动作用、软件产业政策以及软件产业盈利水平成为影响中国城市软件产业竞争力的主要因素。

将各个竞争力影响因素的贡献度累加可得到四个一级指标对中国城市软件产业竞争力的影响程度,结果如下:综合环境的贡献度为7.45%,产业实力的贡献度为54.5%,创新能力的贡献度为27.18%,发展潜力的贡献度为10.87%。

结果表明,中国城市软件产业竞争力的主要影响因素为产业实力,其次是创新能力和发展潜力。

五、 结论展望

本文从综合环境、产业实力、创新能力和发展潜力四个维度刻画了中国城市软件产业竞争力,其中,对软件产业竞争力影响最大的是产业实力,方差贡献率高达54.5%。从具体指标上来看,软件产业对经济拉动作用、软件产业政策以及软件产业盈利水平成为影响中国城市软件产业竞争力的主要因素。根据已有数据,可将国内19个软件城市分为四类:第一类为北上广深等一线城市,总体上竞争优势较强,未来需要在保持已有优势基础上,通过不断创新增强竞争力;第二类为南京、杭州和成都,其竞争优势在于软件产业对城市经济的带动作用,未来应进一步扩大这方面的优势,提升整体竞争力;第三类为天津、重庆和武汉市,其竞争优势在于城市发展空间和智力资源,未来应通过软件产业空间布局、促进当地科研院所知识转化方面出台更多有效措施;第四类为大连、沈阳、厦门、济南和西安,其竞争优势在于整体性,未来应发挥这些城市发展软件产业的协同效应,增强协同创新性,不断提高整体竞争力;第五类宁波、青岛、长春和哈尔滨,其竞争优势在于发展潜力,未来应当出台措施培养软件产业的成长性、挖掘软件产业的市场潜力。

参考文献:

[1] 赵彦云.国际竞争力统计模型及应用研究[M].北京:中国标准出版社,2005.

[2] 迈克尔波特.国家竞争优势[M].北京:华夏出版社,2005.

[3] 高惠璇.统计计算[M].北京,北京大学出版社,2014.

[4] 吴喜之.复杂数据统计方法——基于R的应用[M].北京:中国人民大学出版社,2013.

[5] 李航.统计学习方法[M].北京:清华大学出版社,2015.

[6] 高尚.支持向量机及其个人信用评估[M].西安:西安电子科技大学出版社,2013.

作者简介:胡俊超(1981-),男,汉族,河南省泌阳市人,中国人民大学统计学院博士生,新华社中国经济信息社征信中心总经理、主任编辑(副高),研究方向为应用统计;王丹丹(1983-),女,汉族,河南省安阳市人,北京交通大学中国产业安全研究中心博士后,就职于交通银行北京市分行,研究方向为产业竞争力、产业安全、商业银行压力测试。

收稿日期:2016-03-14。

猜你喜欢
支持向量机竞争力
2018中国商业银行竞争力评价结果
基于改进支持向量机的船舶纵摇预报模型
基于SVM的烟草销售量预测
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于熵技术的公共事业费最优组合预测
基于支持向量机的金融数据分析研究
责任竞争力:企业可持续发展 的必选项
中国城市竞争力最新排名
“北上广深”pk城市竞争力