关联规则在商业银行个人信贷审计中的应用
——基于Apriori算法的应用分析

2022-06-15 00:48林自立广东省农村信用社联合社广东广州515000
商业会计 2022年10期
关键词:关联信贷信用

林自立 (广东省农村信用社联合社 广东广州 515000)

信贷审计是商业银行审计的重要内容,目前,随着大数据技术广泛应用于商业银行个人客户信息搜集、贷款资格核准、授信额度审批等,个人信用贷款业务也逐渐向线上申请、线上审批、线上放款等方式转变,且随着信贷数据的量级增长,信贷审计方式也逐渐由现场审计为主向非现场审计为主转变。商业银行如果能够依托大数据分析技术,结合客户历史信用数据,构建审计分析模型,提高对个人信用评级异常数据的甄别分析能力,将有助于商业银行在信贷审计中识别挖掘潜在的关键变量和关联规则,进而快速锁定疑点客户、提前预判客户违约情况、发现信贷流程漏洞等,从而达到提高审计效率、加强信用风险预警、完善信贷工作规范的目的。

一、关联规则Apriori算法及其应用

关联规则是一个基于规则的机器学习算法,可以通过设置支持度和置信度进行关联规则的筛选,从大量数据中挖掘出潜在的关联关系,广泛应用于购物模式分析、推荐系统设计、交通事故因素探究、银行客户风险分析、网络入侵检测技术等领域中。在银行个人信贷分析中,若分析得知40%的信贷客户以往具有违约记录(用“X”标记),这些客户中的85%也在本次信贷中违约(用“Y”标记),该规则可表示为“X→Y”的蕴含式,其中X为前项,Y为后项。关联规则的强度可以用支持度和置信度衡量。支持度表示关联规则的前项在所有项集中出现的比例,用于衡量关联规则的重要性,最小支持度用于衡量规则需要满足的最低重要性;置信度表示在前项出现的情况下,后项同时出现的百分比,代表这条规则成立的概率,最小置信度表示关联规则需要满足的最低可靠性。在上述例子中,“X→Y”的规则支持度为40%,置信度为85%,如最小支持度为30%,最小置信度为60%,则上述规则为强关联规则。

Apriori算法是最常见的关联规则算法之一,于1993年由Agrawal和Srikant提出,为布尔关联规则挖掘频繁项集的原创性算法。使用频繁项集的先验知识,通过逐层搜索的迭代方法,运用k项集来生成k+1项集,不断重复直至不再有新的频繁项集产生为止,每找到一个k+1项集都需要扫描数据库一次。

关联规则挖掘过程,记录的全体构成了数据库D,或称记录集D。交易集D中包含交易的个数记为|D|。支持度和置信度相关计算公式如下:

运用关联规则挖掘方法,将商业银行个人信贷客户信用情况(是否违约)作为后项,将个人信贷客户的众多变量因素作为前项,可以挖掘潜藏在商业银行个人客户信贷行为模式中的关联规则,一方面,有助于商业银行内部审计透过商业银行个人客户的基本信息,把握影响信贷违约的关键因素,从而有效判别可疑客户,聚焦重点调查对象;另一方面,根据分析得出的关键因素,对照该银行的个人信贷客户评级方法,揭示个人信贷客户评级系统存在的漏洞和不足,为进一步完善个人信贷客户评级提供建议。

二、数据来源和数据处理

本文用于进行关联分析的银行个人信用数据来源于机器学习数据网站。该数据集包括某国某银行信用数据库中的1 000多条客户信用记录,涉及个人信贷客户定性及定量指标,根据能够按时还款涉及的风险状况的大小,将客户信用情况分为“好”和“坏”(分别对应信用情况编码为1和2),而“好”和“坏”客户的数据记录分别约占总体数量的70%和30%。

由于关联规则Apriori算法无法处理连续型数据,结合各指标的实际意义及数据特征,对部分指标进行统计学变换,最终选取其中16项指标,如表1所示。

表1 Apriori算法指标分类说明

三、构建关联规则Apriori模型

商业银行一般在审核个人客户申贷资料时,会综合对该客户多方面信息,包括基本身份信息、职业信息、财产信息、担保信息等,通过个人客户信用评级的方法,全面地评估该个人客户信用状况,从而为是否对该客户授信提供决策依据。而从审计人员的角度来看,立足已发放贷款的客户是否违约的结果,将该客户的其他信息与该客户违约倾向进行关联分析,有助于深入分析个人贷款客户的行为特征。

(一)网络图分析

在进行关联分析之前,运用Clementines软件对因素进行网络图分析,从而直观地展现各因素之间的关联程度,形成整体的感性认识。根据软件运行结果,通过设置显示400、500、600条链接数量的范围,从而直观地理解不同因素链接程度的强弱。如下页图1所示。

图1 网络图分析

从三种不同设置情况下的网络图可以看出,对个人客户信用结果产生影响的因素存在强弱差异,梳理后如表2所示。由表2可知,对客户信用情况影响程度最强的两个因素为:是否有其他担保人及是否国外工作者,其次是赡养人数及房屋情况,再次是工作情况、个人状况及手机号码状况。

表2 对客户信用情况影响的关键因素表

(二)Apriori模型分析

1.守约客户的Apriori结果分析。在网络图分析的基础上,运用Clementines软件对数据进行Apriori模型分析,选取数据库中的个人客户为“G”(信用“好”)的数据来建模,根据数据实际情况以及参考统计学原理,为了确保不会产生大量的无用关联规则,也不遗漏重要关联规则,经过多次分析实践,最终将最小支持度设置为min sup=10%,最小置信度设置为min conf=90%,其中部分关联规则如表3所示。

表3 贷款客户信用评估为“好”的Apriori结果参数表

下面对表3反映的相关规则进行解释:(1)当贷款客户的贷款用途是购置电视,没有支票账户及没有其他共同申请人的情况下,那么该客户有 95% 的可能性会守约按时足额偿还贷款;(2)当贷款客户的贷款用途是购置电视,没有支票账户且赡养人数仅为1人时,那么该客户有94.5% 的可能性会守约按时足额偿还贷款;……(6)当贷款客户现有的其他信用不在这家银行,没有支票账户且工作职务是技术熟练的雇员时,那么该客户有 94.12%的可能性会守约按时足额偿还贷款;(7)当贷款客户没有支票账户,本人为单身男性且工作职务是技术熟练的雇员时,那么该客户有 92.05% 的可能性会守约按时足额偿还贷款。

根据以上分析结果可知,客户的贷款用途、是否有支票账户、信用历史、工作职务、赡养人数、房产状态、是否外国人、个人状况与该客户能否守约存在关联关系,仔细分析各因素对客户信用的影响,大致可以推断:当客户贷款用途较为明确且金额较为可控(如购置电视等大型家用电器),客户守约的概率较高。同理可知,当客户赡养人数较少,财务负担相对较轻,客户倾向于履约还款;当客户职务为技术熟练的雇员,劳动收入相对较高,也有利于客户履约还款;当客户自己拥有房产时,财产担保更有保障,有助于客户兑现还款承诺等。

2.违约客户的Apriori结果分析。在网络图分析的基础上,运用Clementines软件对数据进行Apriori模型分析,选取数据库中的个人客户为“B”(信用“坏”)的数据来建模,根据数据实际情况以及参考统计学原理,为了确保不会产生大量的无用关联规则,也不遗漏重要关联规则,经过多次分析实践,最终将最小支持度设置为min sup=0.9%,最小置信度设置为min conf=80%,其中部分关联规则如下页表4所示。

表4 贷款客户信用评估为“坏”的Apriori结果参数表

下面对表4反映的相关规则进行解释:(1)当贷款客户存在延迟还清记录,支票账户小于100元且工作职务是技术熟练的雇员时,那么该客户有 88.89% 的可能性会违约;(2)当贷款客户的贷款用途是经商,住房状态是租赁且存款余额小于100元时,那么该客户有 88.89% 的可能性会违约;……(5)当贷款客户的贷款用途是经商,从事当前职业的时间大于4年且存款余额小于100元时,那么该客户有 81.82%的可能性会违约。

根据对违约客户分析结果可知,客户的信用历史、支票账户状况、贷款用途、房产状态、存款状况、工作职务、工作年限与该客户违约存在关联关系,仔细分析各因素对客户信用的影响,大致可以推断:当客户存在违约记录时,可以推测该客户的守约意识不强,因此该客户再次违约的概率也相对更大;当客户支票账户余额较小时,也可能意味着该客户所能得到银行的授信额度比较少,因此该客户资信可能较为一般,违约的概率也可能更大;当客户贷款用途为经商时,可能意味着该笔贷款投放之后能否收回将面临更大的不确定性,也会导致客户产生违约的概率较高;该客户住房状态是租赁,可以推测该客户缺乏房产等财产保障,因此贷款后违约的概率可能更大等。

四、研究结论及建议

(一)研究结论

1.商业银行内部审计可以通过关联分析,把握影响个人客户违约的关键因素和关联规则,有效锁定疑点客户。研究发现,在个人贷款客户的各种特征因素中,某些特征因素与客户信用情况具有紧密的关联关系,且存在着影响客户信用状况的重要关联规则。商业银行内部审计在开展信贷审计时,面对众多的个人客户和庞杂的个人客户信息,往往因为信息过度繁杂难以发现疑点所在,而通过关联分析找到影响个人客户信用的关键因素和重要关联规则,可以有效把握住重点,遵照分析得出的关联规则,将按照关联规则评估后信用为“差”但仍获得授信的客户列为疑点客户,进行重点审计,有助于提高信贷审计效率。

2.商业银行内部审计可以通过关联分析,评估验证该行个人信贷客户评级方法的科学性。研究发现,通过关联分析找到与客户守约、客户违约存在紧密联系的重要关键因素和关联规则,商业银行内部审计人员能够从整体去把握各个客户的信用情况,从另一个角度验证商业银行个人信贷客户评级系统是否准确和科学,如发现某些关键因素未纳入个人信贷客户评级系统,或者该行个人信用客户评级规则与研究得出的关联规则存在冲突时,须进行重点关注和辨析,从审计角度进行研判。

3.商业银行内部审计可以对照发现的关联规则,持续完善信贷流程和制度。研究发现,通过关联分析,商业银行内部审计人员可以找到影响个人信贷客户违约的关键因素以及关联规则,将分析得出的结论与该行信贷调查及审批流程和制度进行比对,评估该行在落实信贷调查和审批中,贷前调查是否囊括了对客户关键因素的分析,贷中审查是否符合关联规则所揭示的规律,评估商业银行的贷款调查及审批流程是否严谨、贷款调查及审批制度是否完善和科学,从而验证银行信贷调查和审批的有效性和科学性,并为银行持续完善信贷流程和制度提供方向。

(二)审计建议

1.积极运用大数据分析技术,有效提升审计能力、审计效率和审计精度。商业银行内部审计人员应当广泛运用关联规则等大数据分析技术,如,运用聚类分析判别银行财务疑点数据,解决成本费用审计问题;运用层次分析法对银行绩效数据进行综合评价,解决银行绩效审计问题;运用空间地理数据分析,解决网点效益与布局审计问题等,熟练掌握多种数据分析方法,提高处理不同审计问题的数据分析能力,全面提升审计效能。

2.加强对数据的挖掘分析与规律总结,发挥审计的参谋作用,助力经营管理提升。商业银行内部审计人员不仅要从防风险的角度,在数据分析中关注风险客户如何判别、风险行为如何避免、风险苗头如何干预等,而且要从促发展的角度,在数据分析中思考优质客户具有什么特征、经营效率如何提高、如何把控风险与效益的平衡点等问题,将数据挖掘得出的规律进行总结归纳,并与商业银行的经营理念、内部管理运行的普遍规则、公司制度的整体设计进行比对,从而起到启发经营思路、堵塞管理漏洞、促进健康发展的作用。

猜你喜欢
关联信贷信用
神秘的植物工厂
奇趣搭配
拼一拼
失信商人的悲剧
智趣
信用消费有多爽?
“信用山东”微信号正式启动发布
试论棋例裁决难点——无关联①