陈 莹,武志伟,李心丹,翁炳辰
(1. 南京大学 工程管理学院,江苏 南京 210093;2. 南京大学 商学院,江苏 南京 210093)
基于MCLP模型的个人住房抵押贷款违约风险研究
陈莹1,武志伟2,李心丹1,翁炳辰1
(1. 南京大学 工程管理学院,江苏 南京210093;2. 南京大学 商学院,江苏 南京210093)
[摘要]个人住房抵押贷款一旦出现大规模的违约便会对金融体系的稳定和宏观经济的平稳运行带来很大的负面影响。通过对我国商业银行个人住房抵押贷款真实数据进行分析,分离出可能对贷款履约产生影响的个人基本情况、个人信用状况以及贷款合约等15项指标。在此基础上,使用MCLP模型构建了个人住房抵押贷款违约风险模型,并比较了MCLP模型与传统Logistic模型的预测结果,发现前者具有更高的准确度。最后,基于研究结论提出了相关建议。
[关键词]住房抵押贷款;贷款违约风险;MCLP模型;商业银行;贷款影响因素;个人住房贷款;房地产按揭贷款
一、 引言
近十年来,我国房地产市场经过了迅速的发展历程,房地产行业已经成为国民经济的支柱行业。进入2014年以来,我国房地产市场的走势出现了明显的变化,主要表现为很多城市的商品房成交量出现明显萎缩,以杭州、广州等城市为代表的房产商开始降价出售房屋,继而引发了国内很多城市房产商竞相跟风降价,持续上涨多年的房地产价格首次出现了主动回调的态势。
作为商业银行最主要的贷款品种之一,我国个人住房抵押贷款的余额从2003年的1.2万亿元上升到了2013年的9万亿元。由于我国个人住房抵押贷款开展较晚,对于个人住房抵押贷款的风险防控措施还比较有限,因此个人住房抵押贷款一旦由于房地产价格下跌而出现大规模的违约,便会给金融体系的稳定和宏观经济的平稳运行带来很大的不利影响。
本文通过对我国商业银行个人住房抵押贷款真实数据进行分析,分离出可能会导致贷款客户违约风险的因素,并在此基础上基于MCLP模型构建了个人住房抵押贷款违约风险模型,实证检验了影响贷款履约的因素,且对模型的有效性进行分析和比较,提出了有效识别个人住房抵押贷款违约风险的相关建议,以期对我国商业银行风险管理实践的改进有所裨益。
二、 相关文献与研究方法
(一) 个人住房抵押贷款违约风险的相关研究
国外早期的研究中,Morton分析了美国个人住房抵押贷款客户的违约情况,发现供养人数、职业以及贷款价值比对履约情况的影响比较大[1]。Campbell和Dietrich用多因素logit回归的方法发现抵押率、就业水平对于抵押贷款的违约情况有着显著影响[2]。Gardner和Mills发现,过去有过多次逾期经历的客户其违约可能性是普通客户的两倍,而过去出现多次逾期的原因也是值得关注的[3]。Lawrence和Arshadi也发现,如果客户违约所受到的惩罚小于不违约的机会成本,则客户会选择违约,当客户因短期的资金周转困难而出现逾期的时候,贷款延期对于客户和银行来说都是更好的选择,另外,他还认为贷款价值比(LTV,即抵押率和月还款额占家庭月收入的比率)是影响借款人还款状态的最主要因素[4]。Burrows通过对13个变量的研究,发现就业情况是客户是否违约的最重要因素,贷款金额的大小对违约可能性也有影响,而婚姻状况、是否有子女等也是不能忽视的因素[5]。Berry和Dalton在研究澳大利亚金融机构的客户贷款资料后发现,婚姻状况、家庭成员的长期失业、家庭收入的突然下降是导致违约风险的重要因素[6]。
国内的研究中,徐遥君定性分析了我国多家商业银行的住房贷款履约情况以及各大城市的个人住房贷款相关情况,指出商业银行贷款制度、居民可支配收入、房价水平和利率水平对住房抵押贷款违约风险有较大影响[7]。杨星和麦元勋采用Merton结构化模型对住房贷款的风险进行分析,发现住房价格的波动率、LTV与风险正相关,无风险利率与信用风险负相关[8]。胡鹏、钟叔平和苗维亚认为按揭比例、交易税费、房价跌幅与违约风险正向相关,已还款期数、按揭利率、按揭年限和新购置筹资比率与违约风险负向相关[9]。徐岩岩和赵正龙运用BP滤波法实证分析了交通银行不良贷款率的波动与GDP之间的关系[10]。龙海明、唐海龙和欧阳娟对中国银行某分行的个人住房抵押贷款数据进行分析后发现,学历、婚姻状况、贷款期限和利率是影响客户违约的关键因素[11]。王腾江对山东烟台和安徽亳州多家银行和信用社的数据进行研究,发现国家住房政策对个人住房贷款违约的影响很大,但就业率、利率、收入水平变化对违约率影响不大[12]。
(二) MCLP:信用风险判别的新方法
最早用来分析银行信用风险的常用工具是判别分析[13-14],其后的研究中,学者们开始使用多重线性回归和Probit分析等更为准确的方法[15]。进入20世纪90年代以后,Glover进一步扩大了线性判别分析模型的适用范围和灵活性,从此更多的方法被用于对信用风险的判别当中[16]。其中,多因素线性回归分析(MCLP)是一种被认为在信用评分领域有潜力可以超越现有方法的信用分析方法,并且这种方法已经被成功地用在了对信用卡客户的分析上。
相较于传统的模型,MCLP模型的准确性、灵敏度等各项指标都要更好。对于MCLP来说,b是区分“好客户”和“坏客户”的分界线,b的取值对于MCLP模型的准确率有着重大的影响。Li、YU和Liu使用了UCI数据库中的德国信用卡客户信息,对b的取值会如何影响分类准确率进行了敏感性分析,最后得出结论为:b=1是分类准确率最高的取值[17]。Shi、Wise和Luo等将MCLP运用于信用卡客户的违约风险研究,根据其存在违约风险的大小,把信用卡持卡人分为了“好客户”和“坏客户”两类[18]。Kou、Liu和Peng等扩展了这一方法,按违约风险的大小将客户进行了进一步细分[19]。上述研究都认为MCLP可以产生比其他方法更好的结果。Li、Shi和He采用了三种基于MCLP的方法来提高找出“坏客户”的准确率[20]。
(三) 小结
通过上面的分析我们可以发现,个人住房抵押贷款的各项影响因素与信用卡客户极为相似,因此将MCLP模型用于对个人住房抵押贷款违约风险的研究将有助于提升模型预测结果的准确率。
本文在使用MCLP模型分析影响个人住房抵押贷款违约风险因素的同时,也使用了Logistic回归模型对样本银行个人住房抵押贷款违约风险的影响因素进行了检验,然后通过对MCLP模型与Logistic回归模型的分析结果进行比较,试图证明MCLP模型对于个人住房抵押贷款违约风险研究的适用性。
三、 个人住房抵押贷款违约风险影响因素的描述性分析
本文选取了个人基本情况、个人信用状况和贷款合约等三类因素,通过分析其对个人住房抵押贷款违约风险的影响,最终筛选出对样本客户违约风险存在显著影响的因素。本文的数据来自某商业银行一级分行2006—2013年的个人住房抵押贷款数据和资料。由于样本银行的个人住房抵押贷款整体违约率较低,因此为了使违约客户数据不被正常履约客户数据所淹没,本文在样本抽取过程中提高了违约客户样本的抽取比例。本文最终抽取了210组客户数据,并根据违约率模型的最优样本配比要求,选择了违约客户59组,正常履约客户151组[21]。
(一) 个人基本情况及其对违约风险的影响
客户的个人基本情况包括年龄、性别、学历、工作情况、婚姻状况、户籍和家庭月收入7个方面。表1分析了样本银行贷款客户的个人基本情况对贷款违约率的影响。
表1 个人基本情况与违约风险统计
注:小分类项冒号前面的数字为之后实证分析中对各项定性指标的赋值情况,下同。
1. 年龄对违约风险的影响
从表1中可以看出,随着借款人年龄的增长,其贷款违约风险逐步升高。20岁以下的客户样本数只有1个,结果说服力不强;20—30岁的客户贷款违约率为20%;30—40岁的客户其违约可能性相对较高;40—50岁的客户违约的可能性是最高的;50岁以上客户,由于银行对此类客户的审批较为严格,故一般不会出现违约情况。
2. 性别对违约风险的影响
女性客户的违约风险要明显小于男性客户。
3. 学历对违约风险的影响
学历较高客户的收入稳定性一般更高,其还款来源相对稳定,且其受到更好的教育,对于个人信用的重视程度、风险的敏感性和投资的理性程度更高,其违约风险就相对较小。样本数据的分析结果也支持这一观点。
4. 工作情况对违约风险的影响
在样本银行的贷款客户中,国企、公务员及事业单位员工的违约率明显低于其他职业的客户。
5. 婚姻状况对违约风险的影响
婚姻状况对违约风险的影响不明显。
6. 户籍对违约风险的影响
户籍对违约风险具有明显的影响,本地城市人口的违约率比乡村及外来人口要低很多。
7. 家庭月收入对违约风险的影响
由表1中可以看出,随着收入的增加,违约客户占比逐渐降低。
(二) 个人信用状况及其对违约风险的影响
表2 个人信用状况与违约风险统计
个人信用状况是客户以往贷款行为的反映,也直接影响违约风险的水平。表2统计了个人信用记录和有无未还完贷款等因素对样本银行贷款人履约情况的影响。
1. 个人信用记录对违约风险的影响
从表2中可以看出,个人历史信用记录较好的客户违约风险相对较低,但由于银行对于历史信用记录的审查比较严格,有不良信用记录的客户很难贷到款,故数据中有不良历史的客户较少。
2. 有无未还完贷款对违约风险的影响
从表2可以看出,没有其他未还完贷款客户的履约情况明显好于有未还完贷款的客户。
(三) 贷款合约及其对违约风险的影响
本文尝试从贷款总额、期限、月还款额、月还款额占家庭月收入比重、首付比率和抵押率6个方面来考察贷款合约中的关键信息与样本银行贷款人违约风险的关系(表3)。
表3 贷款合约与违约风险统计
1. 贷款总额对违约风险的影响
一般认为,当贷款总额增大时,客户需要还款的金额也随之增加,其违约风险就相应变大。但表3结果显示,随着客户还款金额的增加,违约率反而随之降低。20万以下的客户履约情况最差,100万以上的客户履约情况最好。
2. 期限对违约风险的影响
从表3的实际数据来看,贷款期限在10年以内的客户违约率最高;11年至20年之间的客户履约情况是最好;21年至30年期限客户的违约风险显著高于11年至20年的客户。
3. 月还款额对违约风险的影响
一般而言,月还款额高的客户,还款压力较大,违约的可能性也会增加。但表3结果显示,月还款额和履约率之间并没有很明显的关联。月还款额最低的一组违约率反而最高,还款金额最高的一组履约情况反而最好。
4. 月还款额占家庭月收入比重对违约风险的影响
从表3可以看出,月还款额占家庭月收入比重高于50%的客户的履约情况明显不如比重低于50%的客户。但是值得注意的是,比重在25%以下的客户的违约率也相对比较高。
5. 首付比率对违约风险的影响
首付比率越高,客户需要贷款金额就越少,其违约风险也就小。但表3结果却与此不符,首付比例最低的一组违约率也最低,而首付在30%—50%的客户违约率是最高的。
6. 抵押率对违约风险的影响
表3中可以看出,抵押率最低的一组违约率最高,而抵押率在50%到80%之间的时候,客户履约情况是最好的。
(四) 小结
个人基本情况对违约风险的影响是比较显著的,学历、工作状况、户籍情况和家庭月收入对履约情况的影响最为明显;个人信用状况中,是否有其他未归还贷款对违约风险有一定影响;贷款合约对违约风险也存在一定影响,但情况相对来说比较复杂。因此,如何综合三个方面的影响因素,形成对个人贷款客户违约风险的综合判断,成为理论和实践中必须解决的重要问题。
四、 基于MCLP模型的客户违约风险综合判别分析
(一) MCLP的建模方法
MCLP模型主要用于分析客户信用行为分类问题。首先,本文假设所有客户可以被分为两类,B代表“坏”的客户,G代表“好”的客户。其次,本文给出一个关于客户的有r个变量的集A=(a1,a2,…,ar),对于客户i,Ai=(ai1,ai2,…,air)代表了其过去的行为或信息,比如ai1代表“收入”,ai2代表“是否有住房”等。定义X=(x1,x2,…,xr)为变量参数的子集,b为区分两组的分界。所以AiX是客户i的评分,b是评分的边界,通过两者的比较可以对客户进行分类。为方便研究,本文设定B区间在边界的左边,G区间在边界的右边。
当我们把噪音数据和现实情况纳入考虑时,经常会发现“好”客户和“坏”客户会出现重叠。所以我们采用放松的线性规划模型来反映有重叠的二分类问题。
设αi为重叠部分客户的分数到边界b的距离,其他情况下αi为0。βi为不在重叠部分客户的分数到边界b的距离,其他情况下βi为0。我们的目标是同时使αi最小,βi最大,于是可以得到:
min∑iαi,max∑iβi
s.t.AiX=b+αi-βiAi∈B
AiX=b-αi+βiAi∈G
(1)
其中,Ai是给定的,X,B是无约束的,αi≥0,βi≥0。
一般情况下,我们把多目标线性规划问题转化为单目标来解。我们设α*>0为-αi和的理想值,β*为βi和的理想值,得到:
(2)
进一步简化得
(3)
最后,得到简化后的MCLP模型为:
s.t.AiX=b+αi-βiAi∈B
AiX=b-αi+βiAi∈G
(4)
(二) 参数选择
本文使用SPSS软件对所有的210组数据进行处理,把“履约情况”作为因变量,其他各项参数为自变量,进行单变量Logistic回归,剔除显著性≥0.05与违约情况明显不相关的变量。回归结果如下页表4所示,学历、工作状况、家庭月收入、户籍以及是否有其他未还完贷款这五项指标与违约情况显著相关,而另外10项指标与违约情况不显著相关,应被剔除。
表4 MCLP模型参数选择
(三) MCLP模型分析
从所有210组客户中,本文随机抽取了180组客户作为训练集,用于建立模型,剩下30组客户作为测试组,用于对模型的准确率进行测试。把180组训练集中的数据里与履约情况相关的指标代入MCLP模型中。使用Lingo软件对模型进行计算,其中α*应取大于零的尽量小的值,这里设α*=0.001,β*应取尽量大的值,这里设β*=99999。根据Li、YU和Liu研究得出的b的最优取值为b=1[17]。
Lingo计算结果如表5。其中,D1为dα-,D2为dα+,D3为dβ-,D4为dβ+,X1为学历,X2为工作状况,X3为家庭月收入,X4为户籍,X5为是否有其他未还完贷款。结果表明,是否有其他未还完贷款与借款人履约情况没有明显的相关性。
表5 MCLP模型的分析结果
模型为:P=0.2X1+0.4X2+0.2X3+0.6X4
(5)
(四) 模型检验
1. 预测准确率
我们将之前随机选出的30组测试集中的数据代入模型,对模型预测的准确程度进行检验。若所得P值大于等于1,则认为该客户将会正常履约;反之,则认为该客户可能会出现违约的情况。结果如表6。我们发现对履约客户的预测准确率为83.3%,违约客户预测准确率为75%,总体准确率为80%,模型总体预测准确率较好。
2. ROC曲线
对MCLP模型的结果做ROC曲线(图1),其AUC值为0.868,远大于0.7,P值为0.001,说明MCLP模型对客户违约情况的预测准确率较好。
表6 MCLP模型检验结果
3. K-S检验
K-S检验中,MCLP模型的K-S值为0.583,大于0.4,P为0.002,小于0.05,说明MCLP模型对于履约客户和违约客户的区分度较好。
(五) 与Logistic模型的比较
图1 MCLP模型的ROC曲线
1. Logistic模型的分析结果
从下页表7中可以看出,通过五步选择,学历、工作状况、家庭月收入、户籍以及是否有其他未还完贷款等指标进入了模型中,说明这五项指标与客户履约情况显著相关。从结果来看,Logistic模型的结果与MCLP模型存在一定的差异,主要表现在进入Logistic模型的自变量数量多于MCLP模型,且是否有其他未还完贷款也进入了预测模型。
由分析结果得出,样本估计的Logistic模型为:
(6)
表8 Logistic模型的检验结果
表8为使用30组测试样本对模型预测准确率的检验,Logistic模型的预测准确率明显低于MCLP模型,说明本研究采用的MCLP方法能够更为准确地对个人住房抵押贷款的违约情况进行分析和预测。
五、 总结与建议
根据实证结果,住房抵押贷款者的学历、工作状况、家庭月收入和户籍等几个因素是导致客户违约的最主要因素。其中,借款人学历越低,越有可能出现贷款违约情况;国企、事业单位员工以及公务员的履约情况明显好于其他职业者;家庭收入越高,其违约可能性就越低;本地城市户口的借款人还款情况要明显好于其他借款人。特别是,本文将贷款合约的相关要素纳入违约风险的研究中,表明还款期限、月还款额占家庭月收入比重等因素对违约风险存在直接影响。
基于本文的研究结论,我国商业银行在个人住房抵押贷款审批过程中应着重注意借款人在以上几个方面的特征,从中筛选出违约风险较大的客户群予以重点关注,并采取相对应的措施,以便有效地降低贷款违约的风险。如在审批中银行应控制学历为高中及以下借款人的数量;适当提高工作状况较为不稳定、过去一段时间多次换工作借款者的贷款门槛;客户经理在还款期限、月还款额占家庭月收入比重等方面向客户提供合理建议将有效降低违约风险;此外,在贷款的后续管理中要重视对家庭月收入稳定性的调查,若借款人收入出现剧烈的动荡;在同等条件下,对本地区的借款客户可以适当提供优惠措施等。
与以往研究使用的方法不同,本文将MCLP模型引入对个人住房抵押贷款违约影响因素的研究中,发现MCLP模型预测的准确率明显高于Logistic模型等方法。因此,本文使用的分析模型对于准确把握我国个人住房抵押贷款违约风险具有重要的现实意义。基于本研究的结论,结合国外先进的信用评价模型,将有助于商业银行建立适合自身经营特点的信用评价模型,形成一套更加成熟合理的信用评价体系,从而提高风险评价和管理水平。
参考文献:
[1]Morton T G. A discriminant function analysis of residential mortgage delinquency and foreclosure[J]. Real Estate Economics,1975,3(1):73-88.
[2]Campbell T S, Dietrich J K. The determinants of default on insured conventional residential mortgage loans[J]. The Journal of Finance,1983,38(5):1569-1581.
[3]Gardner M J, Mills D L. Evaluating the likelihood of default on delinquent loans[J]. Financial Management,1989,18(1):55-63.
[4]Lawrence E C, Arshadi N. A multinomial logit analysis of problem loan resolution choices in banking[J]. Journal of Money, Credit and Banking,1995,27(1):202-216.
[5]Burrows R. Mortgage indebtedness in England: an epidemiology[J]. Housing Studies,1998,13(1):5-21.
[6]Berry M, Dalton T. Home ownership into the new millennium: a view from the margin[J]. Urban Policy and Research,2000,18(4):435-454.
[7]徐遥君.浅析我国商业银行个人住房贷款的违约风险[J].对外经贸,2013(3):93-96.
[8]杨星,麦元勋.个人住房贷款信用风险管理实证研究——Merton模型在信用评估中的应用[J].南方金融,2003(3):20-23.
[9]胡鹏,钟叔平,苗维亚.房地产按揭贷款违约风险分析[J].四川建筑科学研究,2003,29(4):125-126.
[10]徐岩岩,赵正龙.我国商业银行信用风险亲周期性的实证分析与对策研究[J].新金融,2011(2):40-44.
[11]龙海明,唐海龙,欧阳娟.住房抵押贷款风险控制实证研究——基于中国银行某分行的数据分析[J].财经理论与实践,2010(5):29-33.
[12]王腾江.个人住房抵押贷款违约风险的宏观经济分析[J].山东工商学院学报,2013,27(2):93-96.
[13]Nelson O.D, Pellegrino, Mary K. Using credit scorecards to assess the credit risk of consumer abroad[J]. The Journal of European Business,1991,2(1):22-26.
[14]Klein B, Leffler K B. The role of market forces in assuring contractual performance[J]. The Journal of Political Economy,1981,89(4):615-641.
[15]Myers J H, Forgy E W. The development of numerical credit evaluation systems[J]. Journal of the American Statistical Association,1963,303(58):799-806.
[16]Glover F, Laguna M. Tabu search[M]. US: Springer US,1999.
[17]Li A, Yu Y, Liu Z. Sensitivity Analysis of b in MCLP model for credit card-holders classification[J]. Procedia Computer Science,2013,17(1):1023-1031
[18]Shi Y, Wise M, Luo M, et al. Data mining in credit card portfolio management: a multiple criteria decision making approach[M]. US: Springer Berlin Heidelberg,2001.
[19]Kou G, Liu X, Peng Y, et al. Multiple criteria linear programming approach to data mining: models, algorithm designs and software development[J]. Optimization Methods and Software,2003,18(4):453-473.
[20]Li A, Shi Y, He J. MCLP-based methods for improving “bad” catching rate in credit cardholder behavior analysis[J]. Applied Soft Computing,2008,8(2):1259-1265.
[21]贾生华,李,航.噪声交易者预期与房地产泡沫——基于35个大中城市的实证研究[J].审计与经济研究,2014(3):85-92.
[责任编辑:杨志辉]
Loan Breach Risk of Personal House Mortgage Based on MCLP Model
CHEN Ying1, WU Zhiwei2, LI Xindan1, WENG Bingchen1
(1. School of Engineering Management, Nanjing University, Nanjing 210093, China;2. School of Business, Nanjing University, Nanjing 210093, China)
Abstract:As one of the main loans of commercial banks, it will bring about a great negative effect on the stability of financial system and stable operation of macro-economy if the large-scale of personal house mortgage loan breach takes place. By analyzing the real data of personal house mortgage loan of China commercial banks, we sort out about 15 indices on such factors as personal basic conditions, personal credit positions and loan contract which will affect the performance of the contract. On the basis of this, we use the MCLP model to set up a risk model of personal house mortgage loan and compare it with the prediction results of traditional Logistic model, and we find that the former has a higher degree of accuracy, and finally we put forward some proposals based on this conclusion.
Key Words:house mortgage loan; breach risk of loan; MCLP model; commercial banks; loan affecting factars; personal house mortgage; real estate mortgage loans
[中图分类号]C812
[文献标识码]A
[文章编号]1004-4833(2015)01-0105-08
[作者简介]陈莹(1977— ),女,江苏泰州人,南京大学工程管理学院副教授,博士,从事金融工程、家庭金融研究;武志伟(1972— ),山西太原人,南京大学商学院副教授,博士,从事实验经济学、计量经济学研究;李心丹(1966— ),湖南湘潭人,南京大学工程管理学院教授,博士生导师,从事公司金融、行为金融研究;翁炳辰(1989— ),江苏苏州人,南京大学工程管理学院硕士研究生,从事家庭金融研究。
[基金项目]国家自然科学基金项目(71173098;71203091,71203144)
[收稿日期]2014-07-07