基于账户风险与交易关联约束的洗钱路径挖掘研究

2021-03-22 02:29熊建英
海南金融 2021年2期
关键词:反洗钱

熊建英

摘   要:从海量资金交易数据中识别出洗钱者账户,提取账户资金转移路径是洗钱犯罪侦查的关键。通过交易行为特征对账户进行风险评估,对交易行为风险进行异常分析找出洗钱可疑账户作为洗钱路径的关键账号。以关键账户为线索,对资金交易数据进行洗钱行为关联条件约束,构建资金流加权图结构模型,生成可疑洗钱路径。本文的实例表明,能够从大规模的资金交易数据中快速发现异常账号,形成可解释的洗钱资金流路径,辅助洗钱犯罪取证。

关键词:反洗钱;账户风险;异常账户;洗钱路径;资金流图

DOI:10.3969/j.issn.1003-9031.2021.02.005

中图分类号:F832.2             文献标识码:A          文章编号:1003-9031(2021)02-0045-09

一、引言

洗钱是指通过各种手段掩饰、隐瞒上游犯罪活动的违法所得,将其转为合法收入的犯罪行为。洗钱犯罪的上游犯罪涉及毒品犯罪、黑社会犯罪、恐怖活动、公职人员腐败等,与这些犯罪行为构成共生性,不仅影响了正常的金融秩序,也妨碍了司法活动,助长了更多上游犯罪份子的气焰。随着网络银行、第三方支付的发展,洗钱手段也越来越灵活、高效、隐蔽,这也造成了反洗钱工作的严峻形势。洗钱犯罪的侦查过程中,会获取大量资金交易的电子数据,犯罪侦查取证最为关键的是识别不同类别的洗钱节点,并挖掘洗钱资金转移路径。典型的洗钱过程分为放置、离析和归并三个阶段,不同阶段的资金交易行为虽存在差异,但实际犯罪实施过程中,多个洗钱活动是并行交叉的,各阶段的行为数据是混合在一起,不能分解。面对海量数据,采用传统方式锁定个别侦查账户进行人工查询比对的方法非常耗时、低效,同时不利于隐藏证据的发掘。洗钱者的资金交易行为会存在不同于正常交易的特征,为了有效地挖掘资金流网络中的洗钱线索,需要有效利用账户行为模式与交易关联信息,利用数据挖掘方法分析关键洗钱账户和洗钱路径。

二、文献综述

在反洗钱技术研究中,金融交易网络的复杂性使得传统网络理论已不适用于洗钱路径分析,很多学者将行为经济学、运筹学、数据挖掘等方法融入资金交易网络分析。在洗钱路径研究领域,薛耀文等(2016)依据行为经济学理论和复杂網络理论,提出一种成本约束条件下,效用最优的账户节点洗钱路径计算方法,在后续研究中融合资金衰减特征、用户风险偏好特征,模拟洗钱者进行多目标动态规划的洗钱路径计算方法。杨冬梅(2016)在资金转移路径上的以时间、资金成本及经济利益最大化为目标,提出洗钱资金异常转移路径的成本计算模型,分离洗钱资金转移的异常路径集合。张艳等(2017)结合运筹学理论,以公职人员洗钱犯罪为例,在不同洗钱阶段,构建了以洗钱量最大化、风险最小化及时间最短化为决策目标的多阶段洗钱网络路径优化模型。

目前数据挖掘技术已广泛应用于金融欺诈领域,分类、聚类、关联规则等方法应用于金融交易各阶段数据合规性分析,挖掘可疑洗钱行为。Mak等(2011)提出金融数据挖掘模型需要提取客户行为,通过更好的细分客户可以提高客户识别能力,从而增加金融系统决策支持的可用性。而交易网络中的洗钱者的行为也是与一般客户存在差异的,洗钱路径就表现为资金按照这些洗钱者的决策进行账号之间的流动,对交易网络中大量账户进行有效的过滤和识别,成为洗钱路径分析的重要环节。吴玉霞等(2010)通过用户交易特征进行提出大规模多级聚类方法,找出异常行为的账户,及异常账户的关联交易记录。Colladon等(2017)提出一种客户风险的分类和映射关系方法,基于不同风险因素构建社交网络,利用社交网络指标对客户进行风险评估,可以有效识别可疑的账户。Chao等(2019)提出通过监测监管信息、商业信用及行业信息等结构性指标和频度指标作为账户与资本流的回归关系模型,将客户多维关联信息融入资金交易网络计算账户的合理性。Kharote等(2013)认为交易流分析是核心内容,海量的交易数据中隐含着不同交易簇与交易集群,可以通过抽取用户交易网络聚集信息,即从资金交易网中找出满足一定异常约束条件的子图作为可疑交易行为。资金交易流也表现为资金流图,分析方法也广泛应用于金融网络监控系统中。张成虎等(2013)通过构建动态资金流图存储结构和更新机制,挖掘频繁子图从金融交易数据流中动态发现关联特征,识别可疑洗钱路径。Phetsouvanh等(2018)针对比特币洗钱问题,构建虚拟币流转图,根据路径长度和汇合度对邻域子图进行分析,以检测可疑比特币流和由犯罪嫌疑人控制的其他钱包地址。

已有研究成果为金融网络反洗钱甄别与治理奠定了技术基础。如果从洗钱者期望出发,以成本、效用、风险约束条件下,寻求最优洗钱路径组合为条件组合,设计洗钱路径分析规则,有利于从海量数据中分离可疑路径,对资金网络中洗钱路径进行预测,从而制定相应反洗钱策略。如果从资金交易数据出发,从海量数据中识别出可疑洗钱账户、可疑洗钱路径,则成为洗钱犯罪侦查取证的有效手段。当前数据挖掘技术的有效性和科学性可以满足现实需求,成为反洗钱技术研究热点方向。本文将在已有洗钱路径识别研究基础上,对账户交易行为属性进行刻画,通过账户风险特征与风险评估识别可疑账户集合。同时构建资金交易关系加权网络模型,在时间、资金、成本、异常度阈值约束条件下,从交易网中提取可疑账户资金交易行为,形成可疑洗钱路径。

三、可疑洗钱路径分析模型

(一)洗钱行为分析

犯罪分子通常的洗钱过程一般经过三个阶段(见图1)。放置阶段是洗钱过程的起始环节,是把犯罪收入投入清洗系统。在离析阶段,犯罪分子主要通过错综复杂的交易,反复频繁地转移资金,达到模糊犯罪收入的非法特征、掩盖犯罪收入的来源和去向等目的。归并阶段是资金被转移至与犯罪组织或个人无明显联系的合法组织账户或个人账户上,分散的资金被重新归拢,成为应纳税的合法收入。如在洗钱金融网络,V0节点为资金交易起始点,是转入到洗钱系统中非法资金的放置节点;资金想通过合法交易后重新汇集,中间则存在很多资金转移的节点(V1…Vx);归并节点Vn和V0节点存在关联性,可以将清洗后的资金重新汇集给洗钱人。从这个典型的洗钱网络中可以看到各种节点明显的特征是,起点V0的资金转出很高,汇集点Vn则是资金转入很高,中间节点(V1…Vx)则表现为高频、大量资金转入转出的特征。

(二)模型工作流程

基于账户风险与交易关联约束的可疑洗钱路径挖掘过程中(见图2)。首先需要按照模型要求对历史数据进行预处理和特征提取等准备工作,抽取交易数据中账户交易行为特征,进行账户风险评估,获取风险账户集合和账户风险值;按约束规则从资金交易数据抽取交易序列数据,通过相应的图数据存储结构,将交易项转化为图数据结构,构建资金流加权图,抽取可疑洗钱路径集合。该框架提出两种风险机制,账户风险和交易风险。这个风险机制可用于检测账户风险程度,主要取决于账户属性及其交易特征匹配度;交易风险取决于可用于获取账户之间每个可疑交易的严重程度。

在账户风险与可疑洗钱路径识别中,主要计算流程如图3所示,模型的输入数据包括:由各条实时交易记录组成的金融交易数据流;账户交易阈值;关联约束参数;待侦查账户数据。经过主要计算模块,获取的输出包括:关键异常账户及其可疑洗钱路径。其中,异常账户会显示其风险评估值、账户可疑类别,如可能为转出账户、中转账户、归并账户。

(三)可疑账户识别方法

1.账户资金交易风险属性

金融网络交易数据中,账户之间的金融行为类似于用户交易行为。一般的消费交易场所客户价值可通过RFM模型,即通过一个客户的近期交易行为、交易的频率及交易总额三项指标来描述该客户的价值状况。洗钱活动中存在有别于正常交易活动的异常行为,但账户所反映出来的交易行为活动也主要是与交易频率、交易时间、交易金额相关。将账户作为交易关系网的节点,结合交易行为特征,选择4个指标作为账户风险评估依据。

一是资金出度:节点的资金流出指标。以一段时间内资金转出次数、转出金额为计算依据。二是资金入度:节点的资金流入指标。以一段时间内资金转入次数、转入金额为计算依据。三是资金转移度:节点的资金流转速度指标。资金转入后,在一个时间阈值下(可能是即刻)转出或提现的概率。四是交易连接度:节点之间资金流转价值指标。洗钱网络中存在很多交易中间节点,连接很多账户进行资金流转。交易连接能力越强的节点,就有越多的节点需要通过它才能发生交易。

2.账户风险评估

如果不同节点间的行为度量值与常规值存在明显差异,则可能存在异常交易活动。如超出交易阈值范围,账户则有一定的风险性。不同閾值确定,可通过系统内同类账户的统计上四分位值或经验值来确定,各阈值设定规则定义见表1。

各个变量的异常度可以按阈值的倍数进行度量值,各个风险变量的风险值计算规则如下:

资金出度风险Mo:由于资金出账次数和资金转出量偏离阈值越大,账户的风险值越高,风险与两者存在正相关,计算方法如式(1),其中Mof是资金转出次数、Mom转出金额、Tof和Tom是相应的阈值。

Mo=(Mof /Tof )* (Mom /Tom) (1)

资金入度风险Mi:计算原则与Mo相似,计算方法为:

Mi=(Mif /Tif )* (Mim /Tim)                       (2)

其中,Mif是资金转入次数、Mim转入金额、Tif和Tim是相应的阈值。

资金转移度风险Mt:资金即刻转出的次数占总入账次数比值,计算方法为:

Mt=(Mtf / Mif)(3)

其中,Mtf为即刻转出次数,Mif为入账次数。

交易连接度风险Mc:资金入度和出度都其都有正向影响,但如果只是由其中一个值决定,就不能反映交易的连接作用,所以将该值用两指标的和与偏离度进行平衡。计算方法如下:

Mc = Mo + Mi-| Mo - Mi | (4)

计算得到每个账户的各维度风险值后,按各维度最高风险Riskmax进行归一化处理后得到四个维度风险值(VMo,VMi,VMt,VMc),计算账户风险积分计算如下:

VR= VMo+VMi+VMt+VMc (5)

此外,计算得到的四个维度风险值,可进行异常点检测,筛选出风险值异常的账户作为侦查的重点账户集合。

(四)洗钱路径提取

1.关联约束条件

在金融网络中,资金以实名方式存入银行帐户,账户之间的资金转移伴随着合法经济活动而发生,也可能是洗钱者为清洗黑钱而运作资金的结果。如果从大量交易数据中挖掘出洗钱路径,其路径上所有交易需要在交易时间、交易账户、交易资金量、交易成本等存在客观约束,这样抽取出来的洗钱路径才具有可解释性,形成有力的证据链。根据交易行为与洗钱特征,对主要条件定义约束规则如下:一是时间约束:在一条合理的洗钱路径上,交易时间有时序特征,有向图中下一个层级的转账时间开始于上一次转账结束。二是资金约束:一次转账层级的资金流转资金总额应该基本平衡,但因为存在洗钱成本,洗钱路径上的节点转入金额不应高于转出金额。三是成本约束:按照行为经济学理论,洗钱人追求洗钱效用最大,在洗钱路径层级存在一个阈值,降低洗钱成本。洗钱节点产生的手续费,也存在一个阈值。四是节点约束:洗钱行为会使节点产生很多异常交易行为,在账户风险评估中会具有较高的风险值。在还原洗钱路径时,如果存在很多资金交易节点时,转移节点按高风险值优先选择。

2.资金流图存储结构

账户之间的资金转移路径是有向的,与这些账户一起组成金融网络。在金融网络拓扑图中,节点表示金融网络中的账户,边为交易关系,权重通过交易明细内容计算,可以用邻接表进行存储。如果对所追踪的资金分析其洗钱路径,交易流数据还需要满足关联约束条件。图结构中节点、边及权值的设计如下:

图中节点的设计:令V表示账户节点,则V={Vi|i=1,2…n}, n表示图集中节点的个数,且V节点选择满足条件{ VR1> VR2 > …> VRn},VRi是Vi节点的风险值,即存在交易关系时按风险值序列选择V节点。

图中边的设计:资金交易图是一种有向结构,图中的边可记为E(Gfi)={(Vk,Vm)|k,m=1,2…n}。Gfi表示兩个节点账户之间发生过交易,且按路径方向,这次交易发生时间Tn需在上一次时间Tn-1前面,即满足条件Tn=Tn-1+△ t。

边的权值设计:边的权值W是资金转移价值指标,表示为一个二维向量(Time,Money),分别对应一个时间片,及一个时间片内的交易金额。对于交易金额需满足本次账户接受的金额,是所有转出节点总和并叠加一定成本,即满足条件如式(6):

其中,MVi表示Vi节点转入资金,MVj表示Vi节点所对应交易节点Vj所对应的金额。

图的设计:资金转移网络G=是一个加权图,对每一条边(U,V)∈E, W(U,V)表示节点U到V方向的转移权值,权值也将一起存储在邻接表中。整个链接表的层级也需考虑洗钱路径的长度成本,可根据经验设置层级阈值TLev。

四、实验分析

(一)数据准备

本文实验数据来源于违法资金分析案例提交抽取出相关的字段,将不同的原始数据导入到SQL Server2012中进行预处理,合并为一张交易流水信息表共180559条记录,筛选属性、剔出了一些非交易数据,经过去重、去除空行、去除100元以下的微小额交易预处理,共整理出了168507条数据记录,转入转出所涉及账号4660个,交易时间为2017年4月—2018年4月。资金流数据格式见表2。

账户资金流转频率设定按照系统中交易数据均值设定,其他阈值参照系统经验值设定,实际可根据交易特征调整。

(二)关键节点识别

以资金流数据中账户为实体,对每个节点计算4个维度的风险值(见表3)。对所有节点进行初步分类和风险值排名,从中识别出洗钱网络中的关键账户。

将账户各项交易风险值数据导出,利用SPSS Modeler进行异常点挖掘处理,找出交易行为异常的账户。按10%的异常点比例挖掘,得到45个关键账户,所有节点识别结果再做特异值分布散点图分析(见图4)。

由于资金数据流非常复杂,从海量的资金网络中发现线索是一件非常困难的工作,但完全从传统方法去查找,就要人工逐个指标,逐个账户排查,非常耗时,通过算法可以较好的筛选信息,辅助调查取证。这些找出的关键账户,将作为后面洗钱路径挖掘的待侦查账户。

(三)洗钱路径分析结果

将异常识别的账户作为待侦查账户,在关联约束条件下从交易数据中挖掘洗钱路径,将路径以洗钱流图的邻接表结构储存。账户间的交易关联如表4所示。其中,账户对应最终结果中的表头结点,关联账户数量为时间片段内资金转出所对应的账户数量,关联账户的选择优先高风险值账户、且满足账户交易金额、成本阈值。交易权值为交易账户、交易在交易时间阈值下的金额。

由表4所列结果可知,以账户64620作为关键洗钱,在交易网络中,64620是一个明显的资金源点,转出金额巨大,转入金额少。选取一个时间片段(2017年12月1日—2017年12月31日)的资金转出的交易数据开始分析,账户共有6个转出账户,该账户可疑洗钱总额为8174910。在第二次资金交易中,以其中账户12140,在这个时间片段共有152个交易账户,在全部交易数据中有268个交易账户,是一个明显的直接中转节点,对称的资金转入转出金额可疑特征值反映其在交易网中的功能单一,主要是将接收到的来自账户64620的汇入资金进行分散。在本次洗钱中,12140将转入的资金分散到3个关联账户。第三次资金交易中,00490账户有2个关联账户,第四次资金交易中,73000账户有6次资金转出,最后提现。逐步遍历、追踪每个账户在转入资金后的资金交易行为,可获得整个洗钱的网络路径。由此可见,基于关键风险账户可疑,及关联特征约束模型在发现金融交易数据流中的可疑洗钱路径是可行和有效的。

五、结语

洗钱路径的分析挖掘是洗钱犯罪侦查与取证的重要环节,通过洗钱的资金转移路径可以观察洗钱者的违法行为过程,从而实现违法行为取证与资金的追踪。在资金交易网络中,具有较大金额或较频繁资金流动的账户节点,包括资金流入节点和资金流出节点,通常是具有一定的风险性的账号。本文首先基于账户交易行为特征,从资金交易次数、金额、时间间隔等特征构建转入度、转出度、即时转移度、连接度四个维度风险指标,对账户进行风险评估和异常行为账户的离群点挖掘。将离群点作为关键可疑账户线索,对资金交易流构建图数据结构存储模型,并结合资金交易数据流的特点,以洗钱时间序列性、成本、高风险洗钱节点优先参与洗钱路径作为交易行为关联约束条件,从数据中分离资金可疑转移路径作为洗钱路径。研究可以实现通过账户风险值对账户进行监测、对不同维度风险值实现账户洗钱行为分析,从资金交易数据中可以找出异常交易路径、交易网络、交易账户的筛选提供有效依据。但现实中账户节点有个人账户、企业账户等,用户身份类型也有差异,这些都将影响账户交易行为风险评估,未来可进一步结合账户所关联的用户数据对账户属性进行更细粒度分析,提高异常交易行为识别准确率。

(责任编辑:王艳)

参考文献:

[1]张燕华,薛耀文.参与公职人员洗钱活动的利益关系人身份识别研究[J].金融发展研究,2016,(3):24-30.

[2]薛耀文, 张艳.具有资金衰减特征的洗钱路径算法及反洗钱应对策略[J].系统工程,2016(4):147-152.

[3]杨冬梅,吴冲锋,冯芸.金融网络中洗钱资金异常转移路径的经济成本模型[J].系统工程理论与实践,2006(5):25-31.

[4]张艳,薛耀文.多阶段多目标洗钱网络路径算法研究及反洗钱应对策略[J].系统工程理论与实践,2017(8):1992-2003.

[5]Lokanan M E.Data mining for statistical analysis of money laundering transactions[J].Journal of Money Laundering Control,2019,22(4):753-763.

[6]Mak M K Y,Ho G T S,Ting S L.A financial data mining model for extracting customer behavior[J].International journal of engineering business management,2011,3(3):59-72.

[7]吳玉霞,牟援朝.基于改进的两阶段聚类方法在金融可疑识别中的应用[J].统计与决策,2010(5):27-30.

[8]Colladon A F,Remondi E.Using social network analysis to prevent money laundering[J].Expert Systems with Applications,2017(67):49-58.

[9]Chao X,Kou G,Peng Y et al.Behavior monitoring methods for trade-based money laundering integrating macro and micro prudential regulation: a case from China[J].Technological and Economic Development of Economy,2019,25(6):1081-1096.

[10]Kharote M,Kshirsagar V P.Data Mining Model for Money Laundering Detection in Financial Domain[J].International Journal of Computer Applications,2013,85(16):61-64.

[11]张成虎,尹为.基于数据流频繁子图挖掘的可疑金融交易动态识别[J].系统工程,2013(7):5-11.

[12]Phetsouvanh S,Oggier F,Datta A.EGRET: extortion graph exploration techniques in the bitcoin network[C]//2018 IEEE International Conference on Data Mining Workshops(ICDMW).IEEE,2018:244-251.

猜你喜欢
反洗钱
浅析商业银行反洗钱内控制度建设
舞弊审计中的反洗钱问题探究
基于风险为本理念的商业银行反洗钱工作研究
风险为本反洗钱原则认知度调查研究