淳伟德, 文 章, 陈 粘
(1.成都理工大学 管理科学学院,四川 成都 610059; 2.成都理工大学 商学院,四川 成都 610059)
近年来,随着欧美国家陆续爆发主权债务危机,“政府债务风险”已成为各国面临的重大经济问题。而在中国,根据国家审计署公布的数据显示,从2010年至2018年财政赤字由6772.65亿元上涨到37554.23亿元,财政赤字率由0.0167上涨到0.417,财政依存度由0.075上涨到0.17,可以发现财政赤字、财政赤字率和财政依存度都呈现出显著增长趋势,并且截至2018年末,全国地方政府债务余额已高达183862亿元,因此债务风险已经成为了我国地方政府信誉与经济稳定发展的重要威胁[1]。尤其是在2015 年末,习近平总书记提出“供给侧结构性改革”这一举措,其中的“三去一降一补”政策会直接对地方政府财政收入和支出造成显著冲击,进而可能在短期内加剧地方政府债务风险,如不立即对地方政府债务风险加以控制,势必会阻碍我国经济的稳定与繁荣[2,3]。因此,在供给侧结构性改革背景下,构建适合于我国的地方政府债务风险预警模型,显得十分迫切与必要。
然而,地方政府债务风险预警的关键在于构建科学有效的债务风险预警模型。现国内外对债务风险预警研究经历了从 “离散控制法”到 “线性指数法”再到 “非线性先导法”的发展过程。虽然“离散控制法”、“线性指数法”在地方政府债务风险研究中取得了显著成效,但是这些方法存在指标选定主观以及需假定政府债务风险预警指标与风险综合值必须严格线性的缺陷,使得这些方法在地方政府债务风险预警中不具普适性[4,5]。有鉴于此,许多学者将“非线性先导法”引入到了地方政府债务风险研究领域,而常用的非线性方法为神经网络与SVM模型[6]。虽然神经网络模型在地方政府债务风险中具有较强的非线性拟合能力,但相较于SVM模型,神经网络模型存在局部最优与需要大样本的缺陷。因此,本文将基于SVM模型来对地方政府债务风险进行预警研究。
又由于金融数据分布不均衡性,使得传统的SVM模型在风险预警时更偏向于少数类样本数据,从而降低了风险预警研究的准确性。而针对不平衡数据的问题,主要有欠采样法和过采样法,由于欠采样是对部分多数类样本的删除,可能造成分类信息的缺失[7];但SMOTE方法是基于随机过采样算法的一种改进方案,克服了随机过采样采取简单复制样本的策略来增加少数类样本而产生模型过拟合的问题,即使得模型学习到的信息过于特别(specific)而不够泛化(general),其核心思想是对少数类样本进行分析并根据少数类样本人工合成新样本添加到数据集中,消除数据的不平衡[8]。因此,本文将构建基于SMOTE方法的SVM预警模型,以期能够提高对供给侧结构性改革背景下的地方政府债务风险进行预警研究的准确性。
迄今为止,国内外许多学者对地方政府债务风险预警进行了卓有成效的研究。世界银行专家 Hana[9]提出的债务风险矩阵为政府性债务风险的预警研究和全面有效检测奠定了理论基础。Ma[10]通过对已有地方债务问题研究进行案例分析,为一个假想的发展中国家设计了一套示范性的地方政府债务风险预警指标体系。Gimzauskiene等[2]介绍地方政府债务限额的决定因素与适用方法,并说明公共财政融资环境和成本显著影响债务占财政收入份额的增长。Miao[3]则认为债务风险是由于地方政府的“权力、责任和利益”之间不平衡关系造成的。沈雨婷和金洪飞[11]指出其他国家对地方政府债务管控严格或者举债制度完善,因此往往基于简单指标的预警体系就足以反映债务风险的规模与结构。由于受不同政治体制的影响,我国所面临的地方政府债务问题与国外存在较大差别。杨志安和宁宇之[12]采用层次分析法构建债务预警模型,将我国的财政风险划为四个影响因子,并赋予各因子各指标相应权重,综合分析我国当前财政风险。洪源和刘兴琳[13]基于我国9个县的数据样本,利用粗糙集理论、BP神经网络给出地方政府债务风险预警系统。其采用非线性研究方法,克服了当风险指标与风险综合值不存在线性关系所带来的偏差。但李斌等[6]首次提出将SVM用于地方政府债务风险预警研究,综合运用TOPSIS法和德尔菲法确定了样本的债务风险综合评价值,提出了基于结构风险最小化的地方政府债务风险预警模型并验证了其预测性能。虽然,他们对地方政府债务风险的研究都取得了较好成果,但是未考虑到数据非均衡对地方政府债务风险预警研究的影响,尤其是并未在供给侧结构性改革这一背景下对地方政府债务风险进行预警研究。由此可见,与已有研究成果相比较本文具有明显的创新性。
支持向量机(support vector machine,SVM)是由Vapnik和Lerner[4]首次提出的一种新的数据挖掘方法,具有结构风险最小化能够避免陷入局部最优、所需样本量较少操作简单以及基于少数支持向量避免了“维数灾难”的优点,被广泛应用于风险预警研究。
可将构建传统SVM的地方政府债务风险预警模型转化为如下形式的优化问题
(1)
s.t.ωTφ(xi)+b-yi≤ε+ξii=1,…,N
(2)
由于在现实的金融实践中样本数据是不均衡的,地方政府发生债务风险的是少数类样本。然而所需要关注的恰好就是这类少数类样本,倘若不采取改进措施,则会造成分类超平面畸变,使其向着少数类样本偏移,从而大大降低风险预警研究的准确性。结合Chawla等[14]提出SMOTE算法将SVM模型进行改进,并构建SMOTE-SVM来对地方政府债务风险进行预警研究。SMOTE方法通过对少数类样本过采样来扩展其样本数量,具体步骤如下:
步骤5不断重复步骤3至步骤4,直到生成的新的少数类的样本数量达到D,则终止样本的生产,从而获得新的少数类样本集合。
最后基于新构成的少数类样本使得少数类样本和多数类样本在数量上达成了一致,这样便消除了数据的不平衡,进而将新构成的训练样本集合用于预警研究,从而完成SMOTE-SVM模型构建,以提升对地方政府债务风险预警的准确度。
为了能够更加充分验证本文所构建的SMOTE-SVM模型对地方政府债务风险预警研究的可靠性,我们将采用薛薇[15]提出的G-means和F-measure指标对地方政府债务风险预警模型进行评价。
假定|FP|和|FN|分别为将非债务风险样本错划为债务风险样本和将债务风险样本错划为非债务风险样本的数量,|TP|和|TN|分别为债务风险样本和非债务风险样本被正确分类的数量,通常采用混淆矩阵来表示(见表1)。
表1 二分类数据集的混淆矩阵
由于地方政府债务风险本身作为一个非显性的数据指标,需要构建指标进行债务风险描述,因此刻画地方政府债务风险的特征指标对预警模型的预测精度可能产生重大影响。本文在梳理了国内相关文献以及基于数据可得性的基础上,借鉴洪源等[16]所提出“地方政府债务风险要着眼于债务全过程循环”和洪源等[5]所提出的 “风险链”的思想,将从举借环节、使用环节、偿还环节三个层次所构成的20个年度数据指标作为样本的特征指标。
举借环节选取贸易开放度、产业结构升级、各省GDP占比、居民储蓄水平、金融发展成熟度、债务率、债务负担率、新增债务率等8个指标,其中前四项指标反应地方经济发展潜力,与债务风险呈负相关。金融发展成熟度反应该地方金融发展程度,地方金融发展越好其偿债能力越强,因此其与债务风险呈负相关。而债务率、债务负担率、新增债务率均与债务风险呈正相关。债务率反映了地方财政收入对债务的依存度,该值越高表明当地财政对政府性债务依存度越高;债务负担率反映该地方生产总值对于债务的依存度,是评估债务风险的重要依据;新增债务率为年末债务余额增加额占当年可用财力增加额的比重,该值越高反映地方经济和债务规模就越失衡。
使用环节选取地方财政自给率、经济债务弹性、财政债务弹性等三个指标,地方财政自给率与债务风险呈负相关关系,经济债务弹性、财政债务弹性均与债务风险呈正相关关系。地方财政自给率为一般预算收入占一般预算支出的比重,该指标越低则代表该区域政府举债意愿越强烈;经济债务弹性为年末债务余额增长率与GDP增长率的比值,反映该地方GDP对于债务的依存度;财政债务弹性为年末债务余额增长率与一般预算收入增长率的比值,反映地方债务增长与财政收入增长是否具有可持续性。
偿还环节选取赤字率、刚性支出占比、土地出让收入比、税收征管能力、宏观负税水平、税收收入占比、财政压力、债务财政负担率、人均债务水平等9项指标,除税收征管能力、宏观负税水平、税收收入占比外,均与债务风险呈正相关。赤字率该值越大,则表明当年一般预算支出越高于一般预算收入,其地方政府偿债能力越弱;刚性支出占比该值越大,则地方剩余偿债能力越弱;土地出让收入比为地方一般预算收入中来源于土地出让收入的比例,该值越大,表明其地方政府一般预算收入很大程度依靠其土地出让收入;财政压力是财政收入与财政支出需求之间持续紧张的状态,该值越高表明财政收入更难以满足财政支出需求;债务财政负担率是年末债务余额与一般预算收入的比值,反映地方债务与预算收入是否平衡;人均债务水平为年末债务余额总额与年末常住人口总额的比值,反映地方人均承担债务的额度。税收征管能力为一般预算收入与一般预算支出的比值,宏观负税水平为税收收入与GDP的比值,均反映地方政府的税收征收和运行情况,该值越高表明税收征收运行情况越好,则债务偿还能力越强;税收收入占比为税收收入与一般预算收入的比值,反映地方税收收入占一般预算收入的比例。
依据已有研究成果将我国划分为四大经济区域,本文选取中部地区(山西省、安徽省、江西省、河南省、湖北省、湖南省)2010~2017年度数据为研究样本。其原因主要是中部地区承东启西,连接南北,是我国的人口大区、经济腹地和重要市场,在中国地域分工中扮演着重要角色;同时,这6个省份的经济发展状况较好,工业体系较为完善,具有较强的研究价值。此外,之所以选择时间段为2010~2017年,是因为该时间段内国家提出了供给侧结构性改革这一举措,可研究供给侧结构性改革前后地方政府债务的风险变化情况。
本文数据来源于国家统计局分省年度数据、各省份统计年鉴、各省份年度政府报告、各省份年度决算报告、各省份经济统计年鉴以及Wind数据库。本文主要使用SPSS24软件和MATLAB2014b软件进行数据整理和编程分析。
对于地方政府债务风险预警的关键在于预警模型的选取,同时为了更加明确地展现出本文所构建的SMOTE-SVM模型对地方政府债务风险预警性能优越性,本文将SVM模型、SMOTE-Logit模型、SMOTE-BPNN模型、SMOTE-Distance模型分别与SMOTE-SVM模型的预测性进行对比研究,以验证SMOTE-SVM模型对地方政府债务风险预警的有效性与可靠性(见表2)。
表2 模型性能评估
从表2的研究结果可以发现,SMOTE-SVM模型下的所有指标几乎都显著大于基于SMOTE模型下的其他预测模型。其原因可能是,SMOTE-SVM模型从基于结构风险最小化的视角来解决数据分类问题,因而相较于SMOTE-Logit模型、SMOTE-BPNN模型、SMOTE-Distance模型能够表现出更加优越的预测性能。由此可见,SMOTE与SVM各自具备的优势决定了SMOTE-SVM 模型在预测地方政府债务风险上不仅优于SVM 模型,而且还比SMOTE-Logit模型、SMOTE-BPNN模型、SMOTE-Distance具有更为优越的预测性能。
进一步分析表2的结果可知,SMOTE-SVM模型中除了F-measure值略低于SVM模型外,G-means和AUC值都显著地大于其他预警模型,从而表明SMOTE-SVM模型具有最优的预警性能。尤其是SMOTE-SVM模型下的G-means值远大于其他预警模型,表明SMOTE-SVM模型对不平衡数据处理的有效性,也证明了SMOTE与SVM模型结合下的SMOTE-SVM模型能够显著提升对地方政府债务风险预警性能。又由于F-meansure值,主要考察的是对少数类样本预测准确性,而在SMOTE-SVM模型下的F-measure略低于SVM模型,其原因可能是灵敏度和查准率这两个指标之间具有一定的互斥性,不能完全满足同时兼顾,并且SMOTE算法是通过合成少数类样本来达到两类样本的均衡,而该算法无法克服非平衡数据集的数据分布问题,进而可能模糊正类样本和负类样本的边界,导致SMOTE-SVM模型下的F-measure值略低于SVM模型,但从整体预测性能来看,SMOTE-SVM模型对地方政府债务风险预警性能仍是显著优于SVM模型,从而为供给侧结构性改革背景下开展我国地方政府债务风险预警研究奠定了模型基础。
3.4.1 测试样本数据说明
通过上述研究可知,在测试集下,SMOTE-SVM模型表现出了更优越的预测性能,因此本文将采用SMOTE-SVM模型对地方政府债务风险进行预警研究。基于数据的可获得性和指标的代表性获取了2010至2017年数据共为48个样本。首先,通过主成分分析法(PCA)和二分类方法处理样本数据,计算得出地方政府债务风险综合评价值(R)和风险阀值,当R<0.5时,表示未发生债务风险,记为-1;当R≥0.5时,表示发生债务风险,记为1;其次,将总样本的75%作为训练集,得到最优预警模型,并将样本的25%作为测试集,进行地方政府债务风险预警研究(见表3)。
表3 训练样本的债务风险综合评价结果
为准确客观地反映地方政府债务风险综合值的状态区间,有效避免人为划分债务风险阀值所带来的负面影响。从表3的地方政府债务风险综合评价结果来看,在2010~2015年期间,共发生债务风险12次,占比33.3%,表明在2010~2015年期间该6个省份具有高概率发生债务风险,尤其以湖南省的债务问题最为严重,出现了5次风险综合值超过0.5的情况;债务情况最优的是安徽省,均未发生债务风险。因此,构建我国地方政府债务风险预警模型是十分必要的。
3.4.2 检验样本预测结果分析
通过上面分析可知,SMOTE-SVM模型对地方政府债务风险具备最优的预警性能,并且得到了地方政府债务风险综合评价结果,以此为基础可采用SMOTE-SVM模型对地方政府债务风险进行预警研究(见表4)。
表4 地方政府债务风险预测值结果
从表4的地方政府债务风险预测值与测度值的对比分析可知,基于SMOTE-SVM模型下地方政府债务风险预测准确率达到91.67%,而误差均方差仅为0.0041,希尔不等系数也仅为0.0916,从而表明SMOTE-SVM模型能够较准确地对地方政府债务进行风险预警研究。此外,结果中仅有湖南省2017年的风险预测值与风险测度值不一致,这是由于二分类方法得到的风险状态划分界限为0.5,而该样本的风险预测值(为0.4669)与测度值(为0.6090),与风险状态的界限值差距都不大;同时,还由于地方供给侧结构性改革的影响,使得2017年湖南地方政府债务总量呈现出了较大变化,导致对其地方政府债务风险预警出现了偏差。但从整体预警结果来看,本文所构建的SMOTE-SVM模型能够较准确预测地方政府债务风险。
为了能够更加直观地展现出SMOTE-SVM模型对地方政府债务风险预警研究结果,本文还将地方政府债务风险预测值与测度值进行对比分析。从图1可以看出,SMOTE-SVM模型下的风险预测值和测度值具有较为一致的拟合度,因而在供给侧结构性改革背景下SMOTE-SVM模型能够对我国地方政府债务风险进行较准确的预警研究。
图1 测试样本预测值和真实拟合情况
从表4的风险预测值结果可以发现,在供给侧结构性改革提出后的两年中,除了山西省2017年债务风险综合值超出阈值外,其余省份均为未出现风险状态。可能原因是,山西省作为我国煤矿产出大省,而“去煤炭的库存”又是“去库存”重要手段之一,“供给侧结构改革”对煤炭产业而言,在一定程度上降低了产量,进而降低地方政府财政收入,从而可能导致地方政府发生债务风险。但从整体地方政府债务风险预警结果来看,在供给侧结构性改革背景下,各地方政府债务并未发生债务危机,也表明中国政府所提出的“供给侧结构性改革”行之有效,更证明了SMOTE-SVM模型对地方政府债务风险预警研究的可靠性。
本文在供给侧结构性改革背景下,从地方政府债务运行的举借环节、使用环节、偿还环节选取了具有代表性的风险预警指标,并在此基础上运用主成分分析法(PCA)和二分类的方法测算风险综合值和风险阀值,建立基于SMOTE-SVM的地方政府债务风险预警模型;针对SMOTE-SVM预警模型的预测能力的优劣,使用SVM、SMOTE-Logit、SMOTE-BPNN、SMOTE-Distance等模型进行对比分析。实证结果表明,SMOTE-SVM预警模型能够反映地方政府债务风险状态变化的情况,同时与上述模型性能对比来看,无论是从模型的预测准确性进行分析,还是从综合的预测能力评价指标G-means、F-measure和AUC分析,SMOTE-SVM预警模型在预测地方政府债务风险状态上都具有优越的预测性能。
本文的研究表明,SMOTE与SVM相结合可以较好地监测地方政府债务风险的变化,并且能有效地预测地方政府债务风险的状态,进而帮助地方政府风险监管者和政策制定者及时准确地前瞻性评估潜在发生地方政府债务风险的可能性,防范和化解债务风险,避免爆发地方政府债务危机。同时从研究结果可以看出在供给侧结构性改革提出后的两年中,有3个省份在2016年、2017年的债务风险综合值有较为明显的增加,这一结论验证了张同功和白飞野[17]提出的短期内供给侧结构性改革总体上对地方财政增加支出压力,缩减收入项目和比率使收入减少,加剧财政收支不平衡,在当前庞大的到期地方政府性债务下,无疑增加了地方政府债务风险的结论。但从长期来看,将供给侧结构性改革各方面都落实到位,能够有效地解决我国目前供需关系的错位,使我国经济实现持续增长。
值得一提的是,在有效推进供给侧结构性改革过程中,为防范地方政府债务风险增加,地方政府应从以下几个方面着手。首先,举借环节中,调整官员政绩考核机制,减少不必要的地方政府债务;应根据各个地方政府财政实际能力设定最高举债规模。其次,使用环节中,建立地方政府债务风险预警机制,有效地预测地方政府债务风险的状态,帮助地方政府及时准确地评估潜在发生债务风险的可能性;加强对受“补短板”政策保护企业综合能力的测评,让财政资金更好地发挥作用;建立完善的地方政府财政支出体系,确保每一笔债务资金的支出都是必要且有效的。最后,偿还环节中,实时监控地方政府的每一笔债务,按时归还应偿还债务,不能按期归还应作相应处理,充分保障地方政府的信誉;在保证“去产能”、“去库存”、“降成本”的正常推进下,要不断扩大地方政府财政资金来源,确保地方政府有足够的偿债能力。各地方政府只有加强对债务风险的监控,让其债务风险始终处于安全范围内,才能更好地为供给侧结构性改革保驾护航。