基于最优模糊SVM的财务危机预警研究

2015-06-27 17:43徐凯黄迅刘金彬
会计之友 2015年12期
关键词:支持向量机

徐凯 黄迅 刘金彬

【摘 要】 以我国成渝经济区上市公司为研究对象,将模糊方法(Fuzzy Approach)引入支持向量机(Support Vector Machine,SVM),构建了模糊支持向量机(FSVM)模型,并对四种不同核函数下的FSVM进行了性能对比研究,同时,也与传统统计模型和其余人工智能模型进行了性能对比研究。实证结果表明,Gauss径向基核函数下的FSVM模型不仅较线性、多项式和神经元的非线性作用三种核函数下的FSVM模型具有更为优越的预测性能,同时,也显著优于传统统计模型和其余人工智能模型。

【关键词】 成渝经济区; 财务危机预警; 模糊方法; 支持向量机; 核函数

中图分类号:F279.23 文献标识码:A 文章编号:1004-5937(2015)12-0073-05

一、引言

随着经济全球化进程的不断加快,上市公司的竞争日益激烈,使得财务危机爆发的可能性大大增加。而一旦爆发财务危机,不仅威胁着上市公司的生存与发展,同时还严重损害投资者的投资利益,甚至也给国家经济的发展带来严峻的挑战。因此,开展财务危机预警研究,以准确地预测并有效地防范和化解财务危机,对于促进上市公司的健康发展、优化投资者的投资决策、推动国家经济的稳定发展具有重要的现实意义(鲍新中和杨宜,2013),尤其是次贷危机、欧债危机等金融危机的相继爆发,使得财务危机预警研究成为了理论与实务界研究的热点问题之一。

成渝经济区作为长江流域三大经济区之一,既担负着承接中东部地区产业转型的重要任务,又肩负着国家振兴西部以及推进西部大开发的重要使命,对于促进区域经济的协调发展起着至关重要的作用(何雄浪和朱旭光,2010;江琴,2010)。而成渝经济区内的上市公司作为成渝经济区发展与建设的重要经济主体,在维持整个成渝经济区经济的稳定与发展中具有举足轻重的作用。因此,对成渝经济区内上市公司的财务危机预警进行研究,以维持上市公司的稳定运行与发展,从而促进成渝经济区的繁荣与和谐具有重要的现实意义。

财务危机预警模型至今已被大量学者广泛研究,较早的预警模型主要是以单变量分析(Beaver,1966)、多元判别分析(Multiple Discriminant Analysis,MDA)(Altman,1968)、逻辑(Logit)回归(Ohlson,1980)、改进Z模型(徐凯等,2014)等为代表的传统统计模型。然而,传统统计模型却存在较为明显的缺陷,如传统统计模型通常假设样本服从正态分布,事实上,研究所获取的样本往往难以满足正态分布的前提假设条件;又如传统统计模型属于线性模型,但现实中的财务预警样本却往往呈现出非线性特征(黄继鸿等,2003),如果仍然使用传统统计模型进行线性建模,就很可能会导致预测不准确。

由于传统统计模型存在上述缺陷,因而以人工神经网络(Artificial Neural Networks,ANNs)(Tam & Kiang,1992)和支持向量机(Support Vector Machine,SVM)(Vapnik,2005)为代表的人工智能模型应运而生。ANNs能够有效地克服传统统计模型存在的缺陷,被研究学者大量运用于财务危机预警研究中,取得了较好的效果。但ANNs仍然存在不足,如易陷入局部最优、可调整参数过多等,从而对模型的预测精度产生了较大的影响。而与ANNs基于经验风险最小化原则建模不同,SVM基于结构风险最小化原则进行建模,能够有效地获得全局最优而避免陷入局部最优。同时,SVM的可调整参数较ANNs更少,因而在危机预警中能够取得比ANNs更为优异的预测效果(杨毓、蒙肖莲,2006;Sun et al.,2009;Wu et al.,2014)。基于此,本文将构建成渝经济区上市公司的SVM财务危机预警模型,以求能够准确地预测财务危机。

但值得注意的是,当SVM处理包含较多噪声样本的数据时,十分容易受到奇异点或野点的干扰,从而导致预测精度较低。因此,为了减少这些奇异点或野点对SVM预测性能的干扰,Lin,Wang(2002);Huang,Liu(2002)将模糊方法(Fuzzy Approach)引入到了SVM中,提出了一个新颖的SVM模型——模糊SVM模型(FSVM)。FSVM通过对每个样本点赋予不同的隶属度(奇异点或野点被赋予较低的隶属度,而非奇异点或非野点被赋予较高的隶属度),从而减少了奇异点或野点对SVM预测性能的影响,进而能够有效地提升SVM的预测精度。因此,本文将运用FSVM对成渝经济区内上市公司的财务危机预警问题进行研究。

另外,SVM模型的预测性能是否优越还与核函数的选择息息相关(Zhao et al.,2011)。目前,SVM的核函数主要包括线性核函数、多项式核函数、Gauss径向基核函数和神经元的非线性作用核函数。然而,究竟选择上述何种核函数能够使得SVM预警模型取得最优的预测效果,尚且没有形成统一的定论(宋新平和丁永生,2008)。尽管有部分学者通过实证研究证明了基于Gauss径向基核函数的SVM模型的预测效果最优(杨海军和太雷,2009;夏国恩和金炜东,2008;赛英等,2013),然而,由于研究对象的非一致性,使得在进行成渝经济区上市公司财务危机预警时,基于Gauss径向基核函数的SVM模型不一定能达到最优的预测效果。基于此,本文将基于上述四种核函数分别建立不同的FSVM模型,并从中探索出一种最优的FSVM模型,从而为成渝经济区上市公司控制与防范财务危机提供有效的决策借鉴。

基于以上分析,本文以成渝经济区上市公司为研究对象,基于四种不同的核函数构建不同的FSVM财务危机预警模型,并对比研究出具有最优预测性能的一类FSVM预警模型,从而为成渝经济区上市公司的健康运行、成渝经济区经济的稳定发展起到重要的促进作用。

迄今为止,已有众多学者运用SVM对上市公司财务危机预警进行了研究。张晓琦(2010)运用SVM方法,对我国高新技术企业的财务危机预警进行了研究,取得了良好的预测效果;Ding et al.(2008)对中国高科技制造企业进行了SVM预警研究,并与传统统计方法和BPNN进行了实证对比,结果表明SVM具有最为优越的预测性能;杨海军和太雷(2009)将传统SVM改进为FSVM,并将其应用于上市公司财务危机预警的实证研究中,结果表明,与传统SVM相比,FSVM能够更为准确地预测上市公司的财务危机;Chaudhuri & De(2011)构建了FSVM财务危机预警模型,并探讨了参数对于FSVM模型预测性能的影响,同时,又进一步与ANNs进行了对比研究,实证结果表明,FSVM具有更高的预测精度。他们的研究都取得了较好的效果。

与他们的研究文献相比,本文存在着较为明显的差异:(1)就所掌握的文献而言,尚未发现有文献对成渝经济区上市公司进行财务危机预警研究;(2)本文不仅构建了FSVM财务危机预警模型,而且又通过实证研究进一步探讨了四种核函数下FSVM的预测性能,并从中获得了最优的FSVM模型。

本文的逻辑结构安排如下:第二部分,构建成渝经济区上市公司财务危机预警模型;第三部分,本文的实证结果与分析;第四部分是本文的结论。

二、研究方法

(一)财务危机预警的FSVM模型

假设成渝经济区上市公司的样本集为(yi,xi,si),其中,i=1,2,…,n,表示上市公司的样本数量为n,yi∈{+1,-1}为状态指标变量,表示i公司未来是否会发生财务危机,其中,“+1”表示发生财务危机,“-1”表示未发生危机,xi=(xi1,xi2,…,xip)是p维特征指标变量,表示上市公司i拥有p个财务危机预警指标,si=(s1,s2,…,sn)为每家上市公司样本所对应的模糊隶属度,且0≤si≤1。

为了达到对上市公司财务危机进行预测的目的,本文将其中的一部分样本(yk,xk,sk)划分为训练集进行训练,从而得到如下的风险预警模型:

yk=sgn(f(xk,sk)) (1)

其中,k=1,2,…,j,sgn(x)是符号函数,f(x)是一个与训练集中样本点的特征指标变量有关的决策函数。同时,又将另一部分样本(yh,xh,sh)划分为测试集,并对预警模型进行性能测试与评价。其中,h=j+1,j+2,…,n。

然而,通过样本(yk,xk,sk)来建立风险预警模型,就需要在yk((wTxk)+b)+ξk≥1的条件下求解以下最优问题:

min ■■ 2+C■skξk (2)

其中,w是可调权值向量,b是偏置向量,ξk是非负的松弛变量。为了求解上述最优问题,本文运用拉格朗日乘子法将上述最优问题转化为对偶问题:

■-■■■ykyqakaqK(xk,xq)+■aq (3)

s.t.■ykak=0, 0≤ak≤skC,k=1,2,…,j (4)

其中,a为拉格朗日乘子,(xq,yq)为a的一个正分量aq所对应的样本点,K(xk,xq)是SVM的核函数。目前常用的核函数主要分为以下四种:

(1)线性核函数(Linear Kernel):K(xi,xj)=(xi,xj)。

(2)多项式核函数(Polynomial Kernel):K(xi,xj)=

(a(xi,xj)+b)c,其中a、b、c为参数。特别地,当a=1、c=1,b=0时,它就成为了线性核函数。

(3)Gauss径向基核函数(Radical Basis Function,RBF):K(xi,xj)=exp(-γxi-xj2),其中γ为参数。

(4)神经元的非线性作用核函数(Sigmoid Kernel):

K(xi,xj)=tanh(a(xi,xj)+b),其中a、b为参数。

于是,通过求解上述对偶问题就能够得到最终的预警模型:

f(x)=sgn(■ak*ykK(xk,xq)+b*) (5)

然而,从前文分析可知,要得到上述最终预警模型,关键还在于模糊隶属度si的确定,因此,下文进一步探讨模糊隶属度si的求解方法。

(二)模糊隶属度的构造

目前,针对模糊隶属度的构造已诞生出众多方法,但迄今为止,还没有一个可遵循的普遍准则。然而,就所掌握的研究文献而言,运用最多的方法是通过样本点到类中心的距离来构造模糊隶属度。因此,本文也考虑运用该方法来构造模糊隶属度si。

首先,根据每个样本对应的状态指标变量,将训练集(yk,xk,sk)划分为两类,一类是正类样本集(y■■,x■■),另一类是负类样本集(y■■,x■■),定义正类样本集的样本中心为(y■■,x■■),负类样本集的样本中心为(y■■,x■■),则各类样本点到各类样本中心的最大距离分别为:

d+=max■ (6)

d-=max■ (7)

于是,模糊隶属度si就可以通过如下公式进行定义:

si=1-■ xi∈x■■1-■ xi∈x■■ (8)

其中,σ为一个任意小的正数。因此,将计算得出的模糊隶属度si代入式(2)中,就能够计算得到最终的FSVM预警模型,并进一步基于测试样本(yh,xh,sh),对训练得到的FSVM预警模型开展性能测试与评价。

三、实证结果与分析

(一)样本和特征指标选取

本文以成渝经济区所有上市公司(共77家)为研究对象,并以这些公司因财务状况异常而被特别处理(Special Treatment,ST)作为公司陷入财务危机的标志,从而将这些公司分为财务危机样本公司和财务正常样本公司两类。为了尽可能多地获得财务危机样本公司,本文将曾经被ST的公司都作为财务危机样本公司,以其最近一次发生ST事件的前一年财务指标作为特征指标,而剩余的其他上市公司作为财务正常样本公司,以其2012年度的财务指标作为特征指标,故最终划分出23家财务危机样本公司和54家财务正常样本公司。此外,为了尽可能地选取能够全面反映上市公司财务状况的特征指标,本文借鉴胡达沙、王坤华(2007);刘洪、何洪光(2004);李贺等(2006)的观点,选取出能够反映上市公司盈利能力、发展能力、偿债能力和营运能力的共20项财务指标(见表1)。样本公司的财务数据来源于华泰联合炒股软件以及深圳国泰安信息技术有限公司。

(二)数据预处理

由于财务危机预警样本的特征指标众多,而各类指标之间的量纲却并不相同,为了避免较大量纲的指标对于较小量纲指标的影响,本文采用标准差分法对样本数据进行无量纲化处理,方法如下:

x'i=■ (9)

其中,■i为指标xi的均值,SDi为指标xi的标准差。通过对样本数据进行上述无量纲化处理,就得到新的样本集(yi,x'i,si),从而进一步开展FSVM的构建工作。

(三)训练样本与测试样本的划分

由于财务危机预警模型的构建需要通过训练与测试两个步骤来完成,因而在构建FSVM预警模型之前,就需要提前划分训练样本与测试样本。借鉴刘碧森等(2007),李云飞等(2010),宋新平和丁永生(2008)等的观点,本文将所有财务危机样本公司和财务正常样本公司的70%划分为训练样本(共包含54家上市公司,其中,财务正常样本公司有38家,财务危机样本公司有16家),剩余的30%划分为测试样本(共包含23家上市公司,其中,财务正常样本公司有16家,财务危机样本公司有7家)。

(四)实验结果与分析

本文使用MATLAB2011b进行建模,SVM的参数C设置为1,其他参数采取默认设置。四种核函数下的FCM-SVM与SVM模型的对比结果见表2。从表2可以清楚地看到,不论是基于何种核函数,FCM-SVM模型的预测精度都大大高于SVM,说明模糊方法能够有效地减少样本中奇异点或野点对SVM预测性能造成的影响,从而大幅度提升SVM的预测精度。此外,发现不同核函数对FCM-SVM模型预测性能会产生不同的影响,在Gauss径向基核函数下,FCM-SVM的预测精度高达85%以上,大大高于其余三种核函数下FCM-SVM的预测精度,从而说明在成渝经济区上市公司的财务危机预测上,Gauss径向基核函数下的FCM-SVM模型具有最为优越的预测性能。

另外,为了更为充分地展示FCM-SVM模型优越的预测性能,本文还将BP神经网络(BPNN)、决策树(DT)、Logit回归和Probit回归四种模型与Gauss径向基核函数下的FCM-SVM进行对比研究,结果见表3。从表3可以看出,FCM-SVM具有最高的预测精度,表明FCM-SVM不仅优于传统的预警模型,如Logit、Probit,也优于其余的智能预警模型,如BPNN、DT,从而再次证明了Gauss径向基核函数下FCM-SVM模型具有最为优越的预测性能。

由于仅仅从分类准确率来评价模型的预测性能还缺少类似于数理统计检验所具有的科学性,因此,本文将引入McNemar检验方法来比较各预警模型的预测结果是否存在显著差异,从而更为科学准确地评价各模型的预测性能,结果见表4。从表4可以看出,FCM-SVM与其余四种模型的McNemar检验p值皆小于1%,表明通过显著性水平为1%的显著性检验,从而证明FCM-SVM与其余四种模型的预测性能之间存在明显的差异。

综上所述,在四种核函数下,FCM-SVM模型的预测性能优于SVM模型,尤其是Gauss径向基核函数下的FCM-SVM模型具有最为优越的预测性能,同时,还显著优于传统的统计模型和其余人工智能预警模型。

四、研究结论

本文以我国成渝经济区上市公司为研究对象,将模糊方法引入SVM,构建了FSVM模型,并基于四种不同的核函数进行了性能对比研究,同时,还与传统统计模型和其余人工智能模型也进行了性能对比研究。实证结果表明,Gauss径向基核函数下的FSVM模型较其余三种核函数下的FSVM模型具有最为优越的预测性能,同时,还显著优于传统统计模型和其余人工智能模型。

基于以上实证研究结果,本文认为,Gauss径向基核函数下的FSVM模型能够最为有效地预测我国成渝经济区内上市公司的财务危机,这对于维护成渝经济区经济的稳定发展能够起到良好的促进作用。

【参考文献】

[1] 鲍新中,杨宜.基于聚类——粗糙集——神经网络的企业财务危机预警[J].系统管理学报,2013,22(3):358-365.

[2] 何雄浪,朱旭光.成渝经济区产业结构调整与经济发展研究[J].软科学,2010,24(6):74-79.

[3] 江琴.低碳经济:成渝经济区的责任和未来[J].软科学,2010,24(3):52-55.

[4] Beaver W. Financial Ratios as Predictors of Failure,Empirical Research in Accounting: Selected Studies[J]. Journal of Accounting Research,1966(5):71-111.

[5] Altman E.I. Financial Ratios,Discriminant Analysis and the Prediction of Corporate Bankruptcy[J]. Journal of Finance,1968 (4): 589-609.

[6] Ohlson J. Financial Ratios and the Probabilistic Prediction of Bankruptcy[J]. Journal of Accounting Research,1980 (1): 109-130.

[7] 徐凯,邱煜,黄月娥.基于改进Z模型的财务危机预警研究——来自医药行业上市公司的经验证据[J]. 会计之友,2014(33):66-69.

[8] 黄继鸿,姚武,雷战波.基于案例推理的企业财务危机智能预警支持系统研究[J].系统工程理论与实践,2003(12):46-52.

[9] Tam,Kiang. Predicting bank failures: A neural network approach[J]. Management Science,1992(8): 926-947.

[10] Vapnik V. N. The nature of statistical learning theory[M]. New York: Spring-Verlag,1995.

[11] 杨毓,蒙肖莲.用支持向量机(SVM)构建企业破产预测模型[J].金融研究,2006(10):65-75.

[12] Sun A.,Lim E. P.,Liu Y. On strategies for imbalanced text classification using SVM: A comparative[J]. Decision Support,2009,48(1):191-201.

[13] Wu Z. N.,Zhang H. G.,Liu J. H. A fuzzy support vector machine algorithm for classification based on a novel PIM fuzzy clustering method[J]. Neurocomputing,2014,125: 119-124.

[14] Lin C. F.,Wang S. D. Fuzzy support vector machines[J]. IEEE Transactions on Neural Networks,2002(13): 464-471.

[15] Huang H. P.,Wang S. D. Fuzzy support vector machines[J]. IEEE Transactions on Neural Networks,2002(13): 464-471.

[16] Zhao Z. Y.,Zhong P.,Zhao Y. H. Learning SVM with weighted maximum margin criterion for classification of imbalanced data[J]. Mathematical and Computer Modeling,2011,54(3):1093-1099.

[17] 宋新平,丁永生.基于最优支持向量机模型的经营失败预警[J].管理科学,2008,21(1):115-121.

[18] 杨海军,太雷.基于模糊支持向量机的上市公司财务困境预测[J].管理科学学报,2009,12(3):102-110.

[19] 夏国恩,金炜东.基于支持向量机的客户流失预测模型[J].系统工程理论与实践,2008(1):71-77.

[20] 赛英,张凤廷,张涛.基于支持向量机的中国股指期货回归预测研究[J].中国管理科学,2013,21(3):35-39.

[21] 张晓琦.SVM算法在高新技术企业财务危机预警模型中的应用研究[J].科技管理研究,2010(6):147-149.

[22] Ding Y. S.,Song X. P.,Zen Y. M. Forecasting financial condition of Chinese listed companies based on support vector machine[J]. Expert System with Applications,2008,34(4):3081-3089.

[23] Chaudhuri A.,De K. Fuzzy support vector machine for bankruptcy prediction[J]. Applied Soft Computing,2011(11):2472-2486.

[24] 胡达沙,王坤华.基于PSO和SVM的上市公司财务危机预警模型[J].管理学报,2007,4(5):588-592.

[25] 刘洪,何光军.基于人工神经网络方法的上市公司经营失败预警研究[J].会计研究,2004(2):42-46.

[26] 李贺,冯天瑾,丁香乾,等.企业财务预警PCA-SVM模型研究[J].计算机工程,2006,32(9):233-235.

[27] 刘碧森,姚宇,王玲.基于支持向量机的企业财务预警模型[J].电子科技大学学报,2007(S1):445-447.

[28] 李云飞,鄢飞,张谦.基于GA-SVM的上市公司财务危机预警研究[J].西安工程大学学报,2010,24(6):822-826.

猜你喜欢
支持向量机
基于支持向量回归机的电能质量评估
基于智能优化算法选择特征的网络入侵检测
数据挖掘技术在电厂经济性分析系统中的应用Q
基于改进支持向量机的船舶纵摇预报模型
基于SVM的烟草销售量预测
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于熵技术的公共事业费最优组合预测
基于支持向量机的金融数据分析研究
管理类研究生支持向量机预测决策实验教学研究