孟繁星
[摘要]本文首先简要说明什么是神经动力学,然后简介神经动力学模型中的BSB模型和多层感知器(MLP)模型,再说明如何将神经动力学应用于信用评级问题,最后对这种应用做出评价。
[关键词]神经动力学 神经网络 BSB模型 MLP模型信用评级
[中图分类号]F224 [文献标识码]A [文章编号]1009-5349(2016)22-0255-02
一、引言
神经网络在最近20年中得到了迅速的发展,有关的论文及著作已有許多,而神经网络与数学中动力学系统理论的交叉结合(称之为神经动力学)虽也有所发展,但是在应用上却不是很广泛。
自然界中的现象,我们都可以用数学模型去描述,大体上分为两类,一类是确定性的数学模型,另一类是随机性的数学模型。而动力学模型是最普遍的确定型的数学模型。
在信用风险管理中,信用评级是其重要的组成部分。持续的评估可以帮助信用管理者监测客户的账户。对于现金充足的大公司来说,对银行的评估有助于帮助他们决定分别应在各家银行存入多少钱。对于寻求贷款的企业,几个银行的评估有时可以指导他们选择合适的银行来借款。
许多大的公司、银行、政府及政府机构现存的债务都有各自的信用评级。评级通常是由穆迪标准普尔和惠誉(IBCA)这样的专业机构完成的。根据企业评级结果,银行可以决定对该企业的贷款使用何种等级的贷款利率。例如,一个信用等级较低的企业贷款利率会比较高。企业可以利用银行评级来决定他们在银行的存款额度。
本文着重说明神经动力学模型能够在信用风险管理中得到应用,试图做到举一反三,而不做实证分析,为推动神经动力学在信用分析中的应用提供一些参考意见。尤其是在信用评级分类中,神经动力学模型对数据的要求没有传统的评级方法的要求那么高,且应用较其他领域更直接一些,下面我就来介绍几个比较典型的神经动力学模型。
二、神经动力学模型
(一)数学模型
一个神经网络包括n个处理单元,对于第i个单元,有三个相关的实数:网络的输入信号,行为的状态以及输出。输出是行为状态变量的函数,输入是所有状态和一个实参数矩阵——权重矩阵()的函数。一般假定 ,此处看成是从第j个神经元到第i
个神经元的传送线路的强度。
为了完成对神经网络的数学描述,我们通过指定表达状态随时间改变的方式的一种规则,即一种动力学使神经网络置于一个动力系统之中。
1.离散的单层反馈形神经网络的动力学模型
N个神经元排列成一个单层,如果它构成全反馈的网络,这其中的每个神经元的输出都与其他神经元的输入相连,又整个网络的输入与输出的神经元数是相同的,都为N。如果假设第j个神经元在时刻t的输出为,那么在时刻t的N个神经元的输出向量可表示为,又假设第i个神经元时刻t的内部状态为,即可得到时刻t的N个神经元的内部状态为向量,若
其中f可以是最简单的二值函数H,也可以S是形单调连续函数,那么得到离散的单层反馈神经网络。下面介绍离散的Hopfield神经网络。
假定在(1)中的f取二值符号函数,sgn形式,又第i个神经元在时刻t的内部状态
其中是权重,是内部状态值。如果,那么,即第i个神经元在t+1时刻兴奋;如果 ,那么,即第i个神经元在t+1时刻抑制。
我们的目的是先求出权重,然后求出,最后根据 的大小和权重对输出进行分类。
2.BSB模型
①BSB模型
设W是对称矩阵,且其最大的特征值有正的实部。记是模型的初始状态向量,表示启动一个输入。假设模型由N个神经元构成,状态向量的维数也为N,矩阵W是N×N阵,于是BSB模型的算法可以由以下方程完全给出:
其中β是小正常数,称之为反馈因子,是离散时间的状态向量,W表示单层线性神经网络。函数φ是一个分段线性函数依赖于,
其中是的第j个分量。
②模型的应用——分类
BSB模型的一项基本的应用就是分类,这是由于作为吸引子的超立方体的顶点和相应的定义完善的区域,于是BSB模型被用来作为一种无监护的分类算法,而每一个不动点代表一组相关的数据构成的分类,由正反馈产生的自我放大是分类方法的最重要的特征之一。
Anderson于1990年描述了利用BSB模型进行分类的方法,它可以从不同的放射射线中区分出辐射的信号。在这一应用中,权矩阵是通过误差纠正的线性相关的学习过程得到的。为了详细说明,假设有K个训练的向量
随机选择向量,于是权矩阵可以根据偏差纠正算法得到
其中η是学习率参数。根据计算,输入向量像其“老师”一样表现,因为线性结合会重新构造输入向量,而学习的目标是使得
由式(6)给出的纠偏算法在最小均方意义下接近于理想的条件(7)。学习的过程是为了促使线性结合器给出一组特征向量,相应的特征值等于1。为了模拟雷达分类,BSB模型应用上述方法给出了权矩阵。
3.感知器模型
感知器是由F.Rosenblatt于1957年提出的。设为输入量,y为输出量,输入与输出之间满足:
其中为权系数,θ为阈值,函数为分段常数函数,
令,那么
于是问题化为已知两个样本集分别为,要求权系数和阈值使得
如果A,B两类样本是线性可分的,即可用一根直线将两类样本分隔开来,而且有一段距离(参见图1),那么形如(8)式的解有无数个。我们采用单层感知器来求解这个问题。
又如图2所示的二维平面中,A类样本分布在原点的附近,B类样本分布在A类样本的外部区域中,两类样本不能用直线分隔开来。
对于图2的问题,就是寻找一个区域,使其内部为A类样本,其外部为B类样本。可以在二维输入空间中划出三根直线,因为他们的权系数和阈值各不相同,因此3根直线的斜率与截距也不相同(如图3所示)。将这三个单元所得到的直线作相应的逻辑运算。
其中z为输出单元,这样得到一个封闭区域即可正确划分两类样本。
(二)模型在信用分类评级上的应用
从理论上讲,以上两类模型都能解决分类问题,前类神经动力学模型是有导师学习的神经网络,是一种具有联想记忆功能的反馈动力学系统,能较好地逼近f,而多层感知器最适合解决分类问题,因为分类问题可视为求解静态的映射f,前向网络通过简单处理单元的复合可获得较强的处理输入输出关系的能力,能更好地逼近f。
三、对神经动力学模型在信用评级中应用的评论
1.准确性较高
在测试数据为线性关系可分时,则线性判别分析方法的准确性和多层感知器相当。但是在测试数据为非线性关系的情况下,准确性比较高。比如,在信用分类中加入了行业分析、发展潜力等因素的情况下,多层感知器分类的准确性明显地高于多元统计中的判别分析法。
2.适应性强
多层感知器有较强的适应训练样本变化的能力,当训练样本增加新的数据时,多层感知器能记忆原有的知识,根据新增的数据作适当的调整,使之表示的映射关系能更好地刻画新样本所含的信息。这一点不仅使多层感知器具有较强的适应样本变化的能力,而且还使得它具有动态刻画映射关系的能力,也克服了线性判别分析方法的静态特点。
3.健壮性
多层感知器对样本的分布、協方差等没有要求,对样本中存在的噪音数据、偏差数据不敏感。线性判别分析方法虽然对噪音数据不很敏感,但它对样本分布和协方差均有很高的要求。
4.神经网络的主要缺点
(1)对样本的依赖性过强,这就要求在选择样本时既要全面又要典型。因为它很少有人的主观判断的介入,所以它对样本的选择提出了很高的要求。
(2)解释功能差。神经网络被称为黑箱,即它仅能给出一个判断结果,而不能告诉你为什么。为了解决这个缺点,就应该将多层感知器和其他解释功能较好的方法结合起来,形成杂和系统,这样既可以保持神经网络的准确性高、适应性强、健壮性的特点,同时也增加了它的解释功能。
5.输入特征变量的确定
首先,要从所有的可能的指标中确定出关键指标,这同时也需要依赖于其他的统计方法。第二个问题是样本分成多少个种类,即分成哪几种信用等级比较合适。这些问题都是神经网络方法无法独自解决的,要依赖于其他方法。
【参考文献】
[1]阮炯,顾凡及,蔡志杰.神经动力学模型方法和应用[M].北京:科学出版社,2002.
[2]英国皇家银行学会布来恩.科伊尔(著),周道,许关伟(译).信用风险管理[M].北京:中信出版社,2003.
[3]石晓军,陈殿左.信用治理:文化、流程与工具[M].北京:机械工业出版社,2004.
[4]约翰.B.考埃特,爱德华.I.爱特曼,保罗.纳拉亚南(著),石晓军,张振霞(译).演进着的信用风险管理:金融领域面临的巨大挑战[M].北京:机械工业出版社,2001.
责任编辑:杨柳