闫大波?任淑红?王微微
基于SVM的高校财务困境预警模型是一种在小样本数据条件下预警高校财务困境的重要方法。本文选取了教育部64所高校中的7个财务评价指标进行分析,将其划分为三种类别,即轻警、重警与巨警,然后与误差反向传播( BP) 神经网络模型进行比较。经过系统研究,结果显示通过SVM预警模型可以更好地预警高校财务困境。因此,建立基于支持向量机的高校财务困境预警模型,强化高校财务困境预警管理,尤为必要。
高校财务管理由早期的无风险管理逐渐向现代化的风险管理转变,特别在2008年爆发金融危机后,建立财务困境预警非常有必要。六十年代到九十年代中后期,在传统的统计方法基础上又形成一些财务困境预警模型。然而,受模型对样本数量要求较高等因素限制,导致以上预警模型在面对小样本数据时,无法克服自身缺陷,不能有效解决财务困境预警问题。
通过研究国内外相关文献,对企业财务困境领域研究表现较为突出的,当属基于SVM的研究财务困境预警模型,上市公司在这方面的实证研究比较充分,但是关于非盈利性组织的研究较少,例如高校。本文在SVM算法基础上,通过建立高校财务困境预警模型,对各种实证进行分析,以证明该模型在高校财务困境预警中具有非常高的应用价值,值得进行大力推广。
一、SVM的原理和算法
SVM在一定程度上与概率测度和大数定律并不涉及,传统机器学习方法中存在的各种缺陷都能效解决,如维数灾难等。它可以有效发挥出自身独特优势,如非线性识别、有效解决小样本和高维模式等,如一般的回归问题和分类问题等在此基础上能够得到充分简化。
简单的描述SVM机理。首先选择最优分类超平面的一个,保证超平面和样本集转化之间得到最大化的距离,在此基础上最优超平面的构造可以将其朝着一个类似二次规划问题的方向进行转化。
(一)线性可分SVM
若样本,不仅是线性的且可分,分类超平面有且只有一个,即wTx+b =0,则可以正确分类训练样本且误差为零,即
之后再将拉格郎日函数引进来,通过优化解决二次规划问题,可以将最优的分类函数进一步得到。
(二)线性不可分SVM
若样本不是线性且不可分,则需要将非负松弛变量和惩罚参数C>0引入到方程式中,惩罚错误的分类随着C增大,以此便可以优化解决广义分类超平面问题。
(三)非线性SVM
针对非线性问题而言,只需要在一个非线性映射的基础上在某一特征空间内实现输入向量的映射,之后再将最优分类的超平面构造起来。
通过上述分析,在非线性函数的帮助下虽然可以在高维特殊空间内实现对样本数据的映射,且能够将最优分类超平面在特征空间中构建起来,然而在最优化问题求解和决策函数的计算过程中只需要对核函数进行计算即可,以此类似特征空间维数灾难性的问题就能够得到有效解决。
二、样本选取与变量设计
(一)样本选取
选取72所教育部直属高校作为空间样本,其中已知样本空间和需要进一步进行判别所属类别的高校分别有64所和8所,88.90%的高校参与了本次的分析判别,11.10%的高校在分類变量所能够控制的范围以外。
现将样本高校共64所根据警戒限分为三类。一类高校共有48所,财务状况良好,警戒限为轻警,;二类学校共有12所,财务状况一般,警戒限为中警;三类高校共有4所,财务状况非常差,警戒限为巨警。2.2变量设计
共划分为三种指标体系。即偿债能力指标体系、运作绩效指标体系和收益能力指标体系。考虑到财务风险的来源-负债,将偿债能力指标体系作为总评价指标体系的最重要主体,再在运行绩效指标体系和收益能力指标体系两种辅助指标的补充下,初步设置原始变量。
三、建立模型
选取径向基核函数作为SVM预测模型的内积核函数,再使用M
ATLAB工具箱将SVM预测模型建立起来并进行必要的测算。
(一)选择核函数
建立SVM模型,对应核函数g与惩罚参数C的选择是其中最为关键的。通过合理选择,一定程度上会对模型本身推广能力和精度造成直接影响。当下,几种比较常用的核函数形式如下:
1.多项式核函数;
2. 径向基核函数,在一定程度上与SVM相对应,主要是径向基函数分类器的一种;
3. Sigmoid核函数[K(xi,x)],SVM能够建立1个具备多层感知器的神经网络模型,再在自动算法的基础上确定网络权值域隐层节点的数目。
参数(C,g)在很大程度上可以直接决定1个基于径向基核函数的SVM性能,由于所选取的C与g不同,相应的所得到的SVM也会有显著的差异。所谓的K层交叉检验是将各类初始数据随机地划分成K组,然后选取其中1个作为检验集。训练集就是余下的K-1个。最后得到的模型共有K个,再对K个模型的最终检验集的平均参数当做是评价K-CV分类器性能的重要指标。基于K-CV能够有效避免欠学习和过学习状态,比较具有说服力,因此选择参数K-CV。计算后得知,核函数最佳参数g=0.345355,惩罚最佳参数C=45. 4825。
(二)建立模型
将自变量X[0,1],分类变量y[-1,1] ,惩罚参数C =45. 4825,核函数参数g = 0.345355,统一做归一化处理,由此得到SVM 模型。再使用SVM模型,预测和分析检验样本,最后得到检验样本SVM 模型。
结果显示,其具备较高的预警模型精度。当训练样本数为60和检验样本数为4个时,便需要预测检验样本,其判别的准确率高达100.00%,错误率为0.00%;当训练样本和检验样本的数目分别为58个和6个时,便需要预测检验样本,同时准确率为71.43%,错误率为28.57%,检验样本的预测分类与实际分类不相符的数目只有1个。简而言之,该模型能够取得较好的预测效果。
(三)比较应用效果
通过比较BP神经网络模型和SVM模型的判别结果,可以得出以下结果。
利用两种方法进行判别的结果是一致的,分类正确率都比较高。其中最高的当属SVM模型(1),检验样本判别正确率在分类1的情况下可以实现100.00%,SVM模型(2)比BP神经网络模型高3.33%。BP神经网络模型判别正确率与SVM模型相比,准确率下降的更快。由此得知,SVM模型预测精度非常高,具备很好的推广价值。
四、结语
经过各项实证研究证明,基于支持向量机的高校财务困境预警模型在样本数据比较小情况下能够准确进行科学预测,原因如下:
1.它能摆脱掉传统单元与多元判别模型方法本身的局限性,以线性函数为依据,突破判别模型的限制;
2.提高有限样本的针对性,利用BP神经网络模型和非线性函数对样本数据进行拟和;
3.在非线性变换的帮助下,促使输入向量朝着到高维特征空间方向转化,进而对原空间中的非线性函数进行科学判别,以此保障模型具有良好的推广能力;
4.在最小化样本点误差的基础上,保证模型泛化误差,提高模型泛化能力。
综上所述,本文从线性可分SVM、线性不可分SVM以及非线性SVM的角度出发,介绍了SVM的原理和算法,完成了样本研究和原始变量设置、筛选。并在此基础上进行深入思考,并得出重要结论:SVM模型具有较为简单的分类面、较强的泛化能力以及较高的拟合精确度。(作者单位:沈阳农业大学)