基于组合客观赋权法的交通信用评级方法

2022-04-21 04:35许旺土文琰杰
关键词:赋权权重准则

许旺土,文琰杰

(1. 厦门大学 建筑与土木工程学院,福建 厦门 361005; 2. 中南大学 轨道交通安全教育部重点实验室,湖南 长沙 410075)

0 引 言

交通信用是指在交通运输领域中的信用,按照评级对象不同,包涵个人交通信用和交通运输企业信用。目前针对交通信用的研究还很少,尚未形成完整的交通信用评级体系。

计算交通信用评级的核心是计算各评级指标间的权重,大致可分为3类方法。① 主观赋权法,即根据决策者意图确定权重。XIN Zhongliang等[1]利用层次分析法对配电网规划方案进行了综合评价;胡又咏等[2]采用层次分析法结合三标度法确定了地铁站火灾风险评价指标体系及各评价指标权重;赵星等[3]采用层次分析法对城市交叉口信号控制策略进行了综合评价。主观赋权法能反映出决策者对不同指标的重视程度,但客观性差,结果受异常数据的影响较大。② 客观赋权法,即基于数据结构特征对各指标进行权重计算。ZHANG Zundong等[4]采用快速中间熵值法分析了运输网络的结构稳定性;BAI Pengrui等[5]采用因子分析法对陕西省道路客运影响因素进行了研究;李海莲等[6]基于区间数、模糊分析及粗糙集不完备系统建立了一种用于高速公路沥青路面使用性能的客观评价模型。客观赋权法不依赖决策者的主观性,只依赖单一模型,所计算的权重结果有可能与实际情况相反。③ 基于机器学习的赋权方法,该方法能将高维指标映射为非线性关系,从而得到合理的结果。M.J.SHAW等[7]采用决策支持系统对商业贷款模式进行了评估;A.LASISI等[8]采用决策树模型对混凝土结构的无损检测进行了评估;刘杰[9]采用支持向量机对轨道司机的驾驶水平进行了评价。基于机器学习的赋权方法为理解高维度空间下的数据关系提供了对策,为了获得性能优异的模型需要大批量的先验数据训练模型,然而交通信用评级数据不存在标签值,故该方法也不适用。

针对以上研究的不足,笔者引入客观赋权法避免了主观因素对权重结果的影响;同时考虑基于不同客观赋权法对交通信用指标权重结果带来的差异性,将多类赋权方法组合得到的评级指标权重体系,并结合连续式3-sigma准则确定了各项指标的信用得分;通过区间式3-sigma准则确定评级区间,获得交通运输企业的评级结果。

1 交通信用评级指标

交通信用评级的流程如图1。根据《部省交通运输信用信息交换指标(2020版)》的规定,交通信用评级指标可分为基本信息、履约能力和行业行为这3个大类,包含9项子指标,如表1。

图1 交通信用评级流程Fig. 1 Flow chart of traffic credit rating

表1 交通信用评级指标Table 1 Traffic credit rating indicators

表1中的2级指标说明如下:属性完整度为运输企业的基本信息(如地址、邮箱、简介、营业执照等),单位为%;企业行政许可数量为运输企业获得与道路运输相关的行政许可;企业监督检查为运输企业接受监督检查中获得优良的次数;企业信誉考评AAA、AA、A的数量分别为在一定时间内对交通运输企业进行考评结果优良的数量,该数值越大说明企业的交通信用越好;企业信誉考评B数量为运输企业进行考评结果较差的数量,该值越大则表示信用越差;一般行政处罚数量与严重处罚数量为一定时间内交通运输企业受到的行政相关处罚的条数。表1中一共包含考评指标9项,其中正序指标6项,逆序指标3项。

考虑不同指标之间存在的量纲差异及数据中的异常点(可能存在极大极小的情况)会对权重计算结果产生影响,在计算权重前应先对数据进行标准化处理,如式(1)。

(1)

式中:x为对应属性的数据集;u为均值;σ为标准差。

标准化处理后的数据集标准差为1,均值为0,如此可使得权重结果不被某些维度过大的特征值影响[10]。

2 组合客观赋权法原理

2.1 基于交通信用评级的组合客观赋权法

客观赋权法根据不同原理可以分为:基于信息浓缩的赋权法、基于数据信息量的赋权法和基于数据波动性的赋权法。

1)基于信息浓缩的赋权法:因子分析法。因子分析法利用信息浓缩的思想,通过共性因子观测变量,同时通过观测变量也能表达共性因子[11],其计算如式(2):

Xi=γi1F1+γi2F2+…+λinFn+εi

(2)

式中:下标i为交通信用评价指标索引,i=1~9;F为对应x的公共因子;γ为公共因子系数,即因子载荷矩阵中的元素。

2)基于数据信息量的赋权法:熵值法。熵值法根据数据携带信息量大小进行权重计算,熵值是不确定性的度量,信息量越小则不确定性越大,对应的熵值越大[12]。其计算如式(3)~式(6):

(3)

(4)

gi=1-ei

(5)

(6)

式中:j为交通运输企业指标数据;z为企业数量。

首先计算第j条数据的第i项指标比重〔式(3)〕;再计算第i项指标的熵值〔式(4)〕;最后计算第i项指标的差异系数并求出权重〔式(5)〕。其中:gi越大说明指标越重要,通过归一化即可求得各项指标的权重〔式(6)〕。

3)基于数据波动性的赋权法:CRITIC权重法。该方法是基于评价指标的对比强度和指标之间冲突性来衡量指标的客观权重,在考虑指标变异性大小的同时兼顾指标之间的相关性。通过指标的标准差σ反映指标的变异性,标准差越大则差异越大,对应指标包含的信息也越多,应该分配更多的权重[13]。指标冲突性用相关系数表示,如式(7):

(7)

式中:rv为指标v与其他指标的冲突性,相关性越强则值越小,分配的权重越低;riv为指标的i、v的相关性系数;i、v分别为不同的评级指标索引。

通过变异性和冲突性可计算信息量cv=σv×rv,则根据式(8)可求得各个信用评级指标的权重。

(8)

综合上述3类基于不同原理的客观赋权法可以求得不同交通信用评级指标之间的权重,如式(9)。

(9)

式(9)中:每一行代表不同客观赋权法的各个交通信用指标权重,每一列代表在该指标下的不同客观赋权法得出的权重。

为获得合理的交通信用得分,通过式(10)求得各项指标权重,其中下标i为权重算法索引,下标j为指标索引。

(10)

2.2 评级准则

根据相关管理部门对交通信用等级得分的规定:总分为950分,基本分为600分,加分项为350分。加减分法则参照3-sigma法则,其概率密度函数如式(11)。

(11)

式中:u、σ2分别为对应交通信用指标数据的均值与方差。

一般而言,数值分布在(u-3σ,u+3σ)之间的概率为0.997 4[14],在该区间外则被认为是奇异点,需要对该企业对应的信用指标进行重新评定。

笔者将3-sigam准则分为区间式和连续式准则。区间式3-sigma准则根据企业信用得分确定企业信用评级区间,如图2。

图2 交通信用评级区间示意Fig. 2 Schematic diagram of traffic credit rating interval

由图2可知:若得分落在指定区间有99%的置信度则被认为该数据正常。连续式3-sigma准则用于确定企业各项指标加减分,考虑区间算法会导致中间信息损失,各正序指标得分按照式(12)得出,对于逆序指标需将S取负数。

(12)

考虑对称性,笔者将信用评级分为6级(A~F),其中信用评级A最好,信用评级F最差。

3 实验结果与分析

3.1 交通信用评级指标权重

以厦门市为例,采集了7 601家交通运输企业的相关指标数据,其中包括上述指标数据的客观赋权算法在不同算法下各个指标权重,如表2。

表2 不同赋权方法下的交通信用指标权重结果Table 2 Weight results of traffic credit index under differentweighting methods

由表2可知:① 对不同客观赋权算法可得到交通信用指标存在的差异;② 基于因子分析法的赋权结果中行政处罚数量所占权重最高,而企业信誉考评A数量权重最低;③ 基于熵值法的赋权结果中企业基本信息完整所占权重最低,企业监督检查权重结果最高;④ 基于CRITIC权重的赋权结果中各个指标间的权重无明显差异;⑤ 组合赋权算法获得各项指标组合权重,根据权重大小,企业信誉考评中AAA数量依次高于AA和A的权重,行政处罚中,严重处罚数量权重高于一般处罚权重,表明组合客观赋权法获得的权重与实际主观理解相符。

以600分的得分为基础分并结合350分的加减分作为企业的最终得分。为确定不同企业各项指标的加减分数值,需对各个指标进行连续式3-sigam准则运算。各指标加减总分情况如表3,部分指标数据分布见图3。由图3可以确定对应指标参数u、σ;根据式(12)可以求得各企业不同指标的详细加减分,最后结合基础分就可以获得该企业交通信用得分。

表3 信用指标加减总分情况Table 3 Total scores of credit indicators

图3 部分指标数据分布Fig. 3 Data distribution of some indicators

3.2 交通信用评级

基于企业交通信用得分分布可获得企业得分相关参数(u,σ)=(598, 20),结合区间式3-sigma准则对交通信用进行评级区间确定,评级区间见表4。限于篇幅,笔者以5家运输企业为例(5家运输企业分别编码为a, b, c, d, e),其指标值见表5。

表4 交通信用评级区间Table 4 Traffic credit rating range

表5 运输企业信用评级指标取值Table 5 Credit rating index values of transportation enterprises

根据组合权重结合评级准则可得出各企业的交通信用得分及评级,结果见表6。

由表6可知:① 对于企业a,其正序指标对应值均为0,而逆序指标均较大,因此信用得分较低,对应信用评级为F;② 对于企业b,其逆序指标信誉指标评级为B的数量为0,信用得分略高于a,对应评级为F;③ 对于企业c,其正序指标数值为0,逆序指标较少,评级为D;④ 对于企业d,其正序指标信誉评级为A的数量为1,逆序指标值较少,评级为C;⑤ 对于企业e,其正序指标较多,逆序指标数值少,评级为A;⑥ 基于组合客观赋权的方法结合评级准则对企业交通信用进行评级,其结果符合各项指标数值大小分布。

表6 交通运输企业交通信用得分与评级Table 6 Traffic credit score and rating of transportation enterprises

4 结 语

笔者对交通运输企业的信用评级进行了研究。对无标签数据提出了组合客观赋权法,考虑不同赋权算法性能存在差异性,通过融合权重能获得符合数值标称意义的权重结果,将权重结合相关管理部门的打分规则,映射为各个指标的加减分总分;通过连续式3-sigma准则获得企业每项指标加减分情况,进而获得各企业的交通信用总得分,最后通过区间式3-sigma准则获得企业的评级结果。

此外,笔者提出的算法已运用于厦门交通运输信用管理系统,评级结果较为合理。但本研究也存在一定局限性,如采用单一客观赋权方法导致与主观决策不相符,在未来研究中考虑将主观赋权与客观赋权相融合,以此获得更加理想的权重结果。

猜你喜欢
赋权权重准则
赋权增能与边界拓展:博士生培养模式变革的逻辑建构与路径选择
权重望寡:如何化解低地位领导的补偿性辱虐管理行为?*
基于赋权增能的德育评价生态系统的构建
期刊评价中小同客观赋权法权重比较及其思考
在社会工作实务过程中的赋权理论
权重常思“浮名轻”
为党督政勤履职 代民行权重担当
权重涨个股跌 持有白马蓝筹
新审计准则背景下审计教学面临的困境及出路
探析夹逼准则在求极限中的应用