程 洁,莫琼辉
(江西财经大学金融学院,南昌330013)
互联网金融平台信用评级体系的设计
——基于熵权法
程 洁,莫琼辉
(江西财经大学金融学院,南昌330013)
近年来因互联网金融平台在发展过程中逐渐暴露问题,开始出现一大批的互联网评级平台。基于熵权法加入非财务指标,构造互联网金融平台信用评级体系,根据数据的正态性假定确定评级标准。对所选取的30家平台进行评级,结果与网贷之家数据对比,发现新的评级体系具有一定的可靠性。基于新的评级方法的诸多优点,对互联网金融平台的评级方法给予参考。
熵权法;互联网金融;信用评级
近年互联网金融业发展迅速,根据网贷之家数据显示,截止到2017年2月,中国网贷平台数量已经达到5 882家,历史累计成交量达到了38 544.26亿元。互联网金融发展规模越来越大。但其问题也逐渐暴露,截止2月份历史累计停业和问题平台已达3 555家。总出现问题和停业的平台占总平台数量一半以上。在互联网金融问题频出之际,慢慢涌现出一批互联网金融大数据平台和评级平台。处于刚起步阶段的互联网金融评级并不成熟,制定一个合理有效的互联网金融平台评级体系具有一定的研究价值。
目前,业界开始慢慢结合学术界的研究成果,引入学术界的研究成果进行机构的信用评级。如国内的网贷天眼与中国社会科学院金融研究所、融360和中国人民大学进行合作。其表明信用评级制度需要越来越科学化和专业化。
熵权法是一种客观赋权法,1948年由C.E. Shannon引入信息论,称之为信息熵。因其权重基于所给数据得出,和AHP对比而言,不会受到主观判断的影响。所以可用于任何评价指标的权重确定。基于熵权法的诸多优点,又因为互联网金融平台许多数据都能在相关平台上获得。在此,采取熵权法构建评级体系对互联网金融平台进行信用评级。
(一)指标体系的构建
1.指标选取原则
(1)可操作性。因需要通过大量数据对互联网金融信用进行测算,指标选取的最大的难题是数据的查找,因此指标需要能够在相关网站找到数据。
(2)可靠性。指标能够反映互联网金融平台风险,且其数据有正规的来源和公开的核算方法。
(3)全面性。指标体系需要全面包含互联网金融信用的各个方面,既要包括财务指标,也要包括非财务指标。
2.指标体系及指标说明
(1)平台背景
采用注册资本、股东构成和运营时间三个指标来考察平台背景。各指标的具体内容及测算方法如下。
注册资本:公司制企业章程规定的全体股东或发起人认缴的出资额或认购的股本总额,代表当前平台在工商企业登记的注册时填写申报的注册资金。
股东构成:根据股东构成将平台背景分成民营系、银行系、上市公司系以及国资系。根据风险关系将其量化,具体将民营系赋值为0,银行系为1,上市公司为2,国资为3。
运营时间:代表平台上线时间至今仍然处于正常营业状态的时间。
(2)平台热度
客户对于平台的热衷程度可以从参与人数、成交量等一系列指标体现。通过对已知数据进行整合,将其分为成交量、投资人数、借款人数、借款标数和满标用时等五个指标。
成交量:表示平台在某一时间段内满标并通过复审成交的总金额(包括债券转让;不包括新手标、体验标)。其具体测算公式如下:Mi:第i笔借款标的本金(元)
投资人数:该指标是指在平台有过至少一次借款行为的总人数,若同一借款人在某统计时间段内有过多次借款,均按1人来统计。
借款人数;表示某个时段端内发生过借款的人数。借款标数:实际发生借款标的数量。
满标用时:某笔借款最后一笔有效投资与第一笔有效投资对应的时间间隔。
(3)运营状况
将平均借款期限、人均投资金额、平均预期收益率和人均借款金额划入运营状况指标大类。
平均借款期限:该指标代表所有借款标的平均期限,其核算公式如下所示::第i笔借款的期限
人均投资金额:代表平台某一段时间的成交量除以投资人数。公式如下:
平均预期收益率:表示网贷平台在某一时间段内所有投资标的预期收益率的平均数。公式为::第i笔借款标的收益率
人均借款金额:平均每位借款人的借款金额。核算公式为:
(4)资金流动
平台的风险很大一部分收到资金流动性的影响,指标选取待还余额、前十大土豪待收金额占比、前十大借款人待还金额占比、资金净流入、借款分散度以及投资分散度。
待还余额:代表平台某个时间点平台上所有借款人或者项目尚未偿还的本息和。
前十大土豪待收金额占比:代表某个时间点平台待收金额前十大占总待收的比例。
前十大借款人待还金额占比:代表某时间点平台待还金额前十大占总待还的比例。
资金净流入:表示当天待收金额减去前一天待收金额。
借款分散度:类比基尼系数来表征借款金额分布的不均衡程度,核算方法为:借款人的待还在总待还中的占比的平方和乘以10000。
投资分散度:类比基尼系数来表征投资金额分布的不均衡程度,核算方法类比借款分散度。
(二)指标权重的计算
熵权法计算过程如下:
首先,设有n个评价指标,m个样本,Xij表示第i个受访者的第j项指标,据此构建待评估矩阵Rx。
其次,将指标进行无量纲化处理:在备评估指标中,数据全为正指标即数值越大越好。为了消除由于量纲和量纲单位导致的不可比较性,先应将评价指标进行无量纲化处理。对于正向指标,处理如下:
对于负向指标,处理如下:
第三,采用标准化法对数据进行平移如下:得到新矩阵RY。
第四,计算出第个样本第项指标所占的比重如下:
第五,计算出第项指标的熵值如下:
在此基础上定义差异性系数为:
最终定义熵权如下:
由于RY是m×n矩阵,而n个评价指标的指标熵权wj可构成n×1矩阵W,将两个矩阵相乘可得到所有样本的样本熵值的m×1矩阵R,计算如下:
为了降低信用评价过程中的成本,使得评价体系更为简洁有效。获取193家互联网金融平台数据,根据公式编写程序,将数据导入MATLAB2008a进行实验。对选取的指标进行进一步的筛选,剔除掉权重明显小的两个指标——满标用时和人均借款金额,得到最终指标体系。
(三)评级标准的建立
根据中心极限定理,大量随机变量积累分布函数将会逐点收敛到正态分布的积累分布函数的条件。如果数据过多,则其分布将会近似为正态分布,继而表现出一些比较好的统计性质。设所得信用得分数据为X,均值为E,标准差为σ。基于正态分布的良好性质,以及对所得评级数据做正态性假设。按照四级划分标准,制定评级标准如表1。
表1 信用评级标准划分
为了验证评价体系的准确性,选取30家互联网金融平台2017年2月份的数据,运用MATLAB2008a程序进行计算,输出得到30家互联网金融平台评级结果。
从总体来看,本方法做出评级得到优、良、中以及差级别的平台数量分别为:11家、6家、4家以及9家。总体而言评级结果不容乐观。将其与网贷之家评级数据进行对比可以发现,评级为优对应网贷之家A+评价的共有8家,一致率为72.72%;评级为良的一致率为83.33%;评级为中的一致率为75%;评级为差的一致率为77.78%。总体一致率达到76.6%。
从对比结果上来看,根据熵权法得出的30家互联网金融平台结果和网贷天眼数据进行对比一致率较高,认为结果具有一定的稳健性。
较之于其他的评级方法如AHP而言,熵权法根据平台披露的历史数据算出指标权重,更具有客观可靠性。加入新的非财务指标,使得评价指标体系更为全面。整体的评价方法易于操作,数据可得,可以作为互联网金融评级平台的借鉴方法加以推广。
[1]刘 玉.电商金融下信用风险评价体系的构建——基于层次分析法[J].现代商业,2015(14):147-148.
[2]张 超,朱维娜.基于层次分析法的互联网金融中小企业信用评价体系构建[J].征信,2014(10):25-29.
[3]章 穗,张 梅,迟国泰.基于熵权法的科学技术评价模型及其实证研究[J].管理学报,2010(1):34-42.
[4] Faming Zhang,R Pandu,Tadikamalla and Jennifer Shang. Corporate Credit-Risk Evaluation System:Integrating Explicit and Implicit Financial Performances,International Journal ofProduction Economics,2016.
[责任编辑:王 鑫]
F83
A
1005-913X(2017)08-0098-02
2017-05-12
程 洁(1997-),女,江西临川人,本科学生,研究方向:金融学;莫琼辉(1997-),男,湖南衡阳人,本科学生,研究方向:数理经济学。