刘阳洋 魏鑫坤
摘 要:本文运用主成分分析(PCA)对影响企业资金成本的指标进行了降维处理,将17个影响指标变量变成了6个综合变量,然后将综合变量输入到支持向量回归机(SVR)模型中,最后确定模型是有效的可以用来进行企业资金成本的预测。
关键词:PCA;SVR;企业资金成本
一、基本理论
主成分分析(Prineipal Component Analysis,PCA),起初由英国的Karl Pearosn运用到非随机变量中,由霍特林在上个世纪30年代将主成分分析法引入到随机变量的情况中去。主成分分析就是思考在不减少原有指标信息的基础上,将较多的变量问题转化为少数几个不相关的综合变量,为了将要解决的问题简单化,通常将多维空间的问题变动到低维空间,这样使问题转化的通俗容易懂,主成分分析是方法是一类特别重要的统计方法,它的将输入变量降维的模式,有力的从理论及技术方面对综合评价进行了支撑。
支持向量机(SVM)是一种可以在多个方面应用的学习机器,它主要解决识别模型这个难题,可以达成统计学习理论,并且在这个过程中将结构风险降到了极小值。它的运行机理为把我们输入的向量通过映射反映到一个维数较高的特征空间,然后在这个空间中组织最合理的分类。它能弥补多层前向网络中的不足,而且在理论上证实了:在选择了恰当的映射函数之后,一大部分空间内线性不可分的通过特征空间都得到转化变成了线性可分。但还有一个问题是解决不了的,就是低向高维转化时,因为空间的维数变化太大,并且使维数大大增加,导致有时不能在特征空间找到最优的分类平面。在SVM中解决上述问题的方法是找到一个可以使用的分类平面,它是一个更优异的超平面。而且还能将训练集中的点远离这个平面,也就是说紧挨这个超优平面两侧的点尽量的少。不仅如此,SVM还给出了核函数,核函数将替换维数较高的特征空间的内部乘积计算,也就是说它的作用是避免维数过高而导致的计算量过大。核函数实施的具体过程是将原空间向量经过非线性映射到一个维数较高的空间,使原来并不具有线性特征的向量变成线性关系,然后在这个高维空间中得到具有线性关系的最优解,也就是最优决策函数。
通过对企业的资料分析,采用专家调查法确定企业资金成本影响因素,影响因素有固定成本的分摊,专业化生产,大规模设备,经验成本,企业组织状况,一体化经营,制度因素,地理因素,企业文化等。
主成分分析及支持向量回归机模型的建立
我们运用主成分分析和支持向量回归机方法对数据与信息进行处理:分析建筑企业的资料,首先采用专家调查法确定影响企业资金成本的因素进行因素识别,建立指标体系的基础,其次就要搜集整理数据,运用SPSS软件对原始数据进行离散化、标准化,最终获得主成分得分矩阵数据,在获取输入数据之后确定主成分分析法和支持向量回归机的组合方式,再次将数据作为支持向量回归机的输入向量,将企业资金成本作为支持向量机的输出,构建训练样本集。最后选择或者构造一个核函数,确定一个不敏感损失函数,根据规定的项目精度标准,确定与之对应的误差允许值,以误差值为依据,通过一定的方式寻找最优值和核函数参数,来优化支持向量回归机自适应性能。当满足训练要求时,支持向量回归机模型就能够进行工程成本预测,将测试数据集按一定方式输入到模型中就可以进行预测,而且可以快速批量地进行。
二、预测结果分析
运用SPSS软件对原始数据进行标准化处理,然后进行主成分分析,主成分分析过程如参考文献5,得到主成分值。然后运用25家企业的前20家作为训练样本,对SVR模型先进行训练,最后选择了径向基核函数(RBF)为本研究的核函数,最优秀數惩罚因子C=88,核函数=1.1,损失函数值=0.0006,训练完成后用最后5家企业进行预测,并对预测结果与实际结果做比较。测试样本的相对误差如表,实际值和预测值的对比曲线见图。
可见PCA-SVR模型对企业资金成本的预测结果的相对误差都不大于5%,可以满足企业资金成本预测的精度要求。因此该模型是有效的,适于企业资金成本的预测。
参考文献:
[1]王芹芹,雷晓云,高凡.基于主成分分析和RBF神经网络的融雪期积雪深度模拟[J].干旱区资源与环境,2014,02:175-179.
[2]闻芳,卢欣,孙之荣等.基于支持向量机(SVM)的剪接位点识别[J]. 生物物理学报,1999,04:733-739.
[3]姚潇,余乐安.模糊近似支持向量机模型及其在信用风险评估中的应用[J].系统工程理论与实践,2012,03:549-554.
[4]卢钰.基于参数优化的支持向量机股票市场趋势预测[D].浙江:浙江工商大学,2013.
[5]丁国盛,李涛.SPSS统计教程——从研究设计到数据分析[M].北京:机械工业出版社,2005.