基于大数据分析软件SAS的外汇数据挖掘研究及应用

2021-01-30 05:30毕海波纪俊
电子技术与软件工程 2020年22期
关键词:决策树建模贸易

毕海波 纪俊

(1.中国人民银行乌鲁木齐中心支行 新疆维吾尔自治区乌鲁木齐市 830002)(2.中国人民银行昌吉回族自治州中心支行 新疆维吾尔自治区昌吉回族自治州 831100)

1 贸易融资异常企业分析思路

运用大数据分析软件SAS 对贸易企业历史数据进行有监督的学习,再将贸易企业样本数据导入进行预测,通过比对预测数据与实际信贷报告企业数据从而发现值得关注企业线索。即运用SAS数据分析软件对2018年发生跨境收支的名录企业使用决策树算法进行有监督的学习,再将2019年发生跨境收支的名录企业作为样本进行分析,预测出发生贸易信贷的企业名单,将预测发生贸易信贷企业与实际进行贸易信贷报告的企业进行比对分析,实际进行贸易信贷报告与预测发生贸易融资不一致的企业判断为行为异常,从而发现贸易融资异常线索。

2 数据的准备

2.1 数据的来源与提取

本文所使用数据均为外汇局自产数据,主要用到货物贸易信贷报告及国际收支相关货物贸易主题概貌、预收货款、延期付款、对公收入(含境内)、对公付款(含境内)等相关数据表,通过跨境资金流动监测分析系统提取具体明细数据,提取出2018年、2019年贸易融资相关数据各1538 条。如图1所示。

2.2 指标的选取

(1)影响企业贸易融资的因素及指标选取方向。企业发生贸易融资的行为取决于所处的行业、企业类型、采购频率、资金状况、与上下游企业合作关系、产品的销售状况等诸多因素。同时随着贸易投融资的不断深化,境内外贸易需求不断增加,资金往来频繁,贸易融资也易成为资金异常流动的通道,利用现有数据识别企业贸易融资的真实性显得很有必要。

(2)具体指标的选取。在数据可得性的基础上,本文重点考虑了企业所在地区、行业、机构类型、名录登记时间等基本特征,企业交易次数、金额、所选择币种个数等交易特征以及法人年龄等其他特征,选取了11 个指标作为输入变量,对已有交易样本选取是否进行贸易融资报告1 个指标作为目标变量,通过上述12 个指标刻画企业贸易融资行为。如图2所示。

3 企业贸易融资行为的预测

图1:数据准备

图2:指标的选取与设置

本文使用大数据统计软件SAS 进行贸易融资行为的建模分析,数据挖掘分析主要过程有前期数据的构建、运用建模分析模块进行数据分析和建模结果的识别两个步骤。

3.1 数据的准备及设定

3.1.1 数据的准备

以2018年发生贸易收支的企业作为学习样本,将是否发生贸易信贷报告作为企业是否实际进行贸易融资的衡量指标,通过对2018年已有数据进行分析找出企业发生贸易融资行为的规律,在SAS有监督学习的基础上进一步对2019年贸易收支企业进行判断,需对选取的指标做进一步处理。需要注意的是在2019年企业贸易融资行为样本指标中是否发生融资行为是我们需要判断的目标,因此判别样本较学习样本缺少此目标变量。如表1所示。

表1:企业贸易融资行为识别指标

图3:模型拟合统计量及变量重要性结果

图4:模型判别企业贸易融资行为结果

图5:判别结果

3.1.2 样本的设置

数据准备完后,通过SAS EG 将EXCEL 表格转化为SAS 表之后还需要对指标角色以及水平等进行相应设置。

(1)将学习样本指标中目标变量TARGET 角色设置为“目标”,将其水平设置为“二值型”;

(2)将2019年判别贸易融资样本表角色设置为“评分”。

3.2 模型的建立和识别

3.2.1 使用决策树模型进行分析

SAS 提供了14 种模型可用于数据的挖掘分析,包含了目前常见的回归、决策树、梯度模型、神经网络等模型,该软件也提供了可用于比较模型优劣的功能,由于本文的目的是在已有的样本基础上进行有监督的学习,再将判别样本导入进行判断,决策树模型能较好满足我们的分析目标,因此选择使用该模型进行建模分析。

3.2.2 结果的识别

将2018年贸易融资学习样本导入建模模块进行分析,决策树模型运算结果显示对已有学习样本是否融资的误分类率为9.95%,决策树模型对已有样本的拟合判断达到了较理想的水平。从模型分析出的变量重要性结果来看,收款金额(1.00)、行业属性(0.61)、法人年龄(0.58)、收款币种个数(0.40)是影响企业是否贸易融资的主要指标,其重要程度依次由强到弱。

3.2.3 2019年企业贸易融资行为的判别

使用SAS EM 评估模块中评分功能,将2019年企业贸易融资判别样本导入到已建立好的决策树模型中进行是否发生贸易融资的判别,模型判别出贸易融资行为的企业共19 家。如图3 和图4所示。

4 建模结果的运用

将2019年判别样本中实际报告预收、延付货款等企业与建模判别出是否发生贸易融资的企业进行比对,共发现实际进行贸易融资报告但模型未判别出有融资行为企业116 家,实际未进行贸易融资报告但模型判别出有融资行为企业11 家,共发现贸易融资报告与判别出贸易融资行为不一致企业127 家,我们认为通过模型判别与实际进行贸易信贷报告企业不一致行为值得关注,可进一步加强对上述127 家企业的事中事后核查,重点关注收款金额、行业属性、法人年龄、收款币种个数等特征,加强对企业贸易融资异常行为的排查。如图5所示。

5 结束语

本文探索运用金融科技理念,通过大数据思维及数据挖掘等科技手段强化对数据的分析,丰富了外汇金融领域的非现场监管方式和手段,有利于及时识别、控制和处置外汇金融领域风险,提升了监管效能。

猜你喜欢
决策树建模贸易
“2021贸易周”燃爆首尔
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
一种针对不均衡数据集的SVM决策树算法
贸易融资砥砺前行
基于PSS/E的风电场建模与动态分析
决策树和随机森林方法在管理决策中的应用
不对称半桥变换器的建模与仿真
贸易统计
基于决策树的出租车乘客出行目的识别
贸易统计