朱雪芬
关键词:大数据;欺诈风险; 解决方案
随着现代科技和信息技术的不断发展,我国支付活动中早已摆脱了传统的支付模式,移动支付等非现金式的支付方式,逐渐成了社会的主流[1]。随着业务的发展,欺诈频发,同时欺诈手法愈来愈隐秘,人工经验已达到极限,由简单的规则来进行欺诈防控已经不能满足行业的需求,急切需要从行级出发接入全渠道业务。如ATM、POS、电子渠道等,进行综合防控,一来可满足监管机构对于全渠道交易事中监控的监管要求,二来可以提升银行对交易的风险识别和防控能力,大幅度减少欺诈带来的严重影响。
一、银行渠道业务背景下的欺诈风险
(一)电子渠道风险
1. 传统电子渠道业务
包括来自不同电子渠道的交易,如网银、手机银行等。电子渠道的主要风险来自非面对面交易,无法确认交易者是否为持卡人本人。电子渠道业务面临的风险主要是账户被非法盗用。盗用电子银行账户的途径很多,如钓鱼网站、木马、病毒、骗取验证码等多种方式。欺诈者通过这种方式接管了持卡人的电子账户后,通过在线消费、转账等途径进行套现,给持卡人带来资金损失,给银行带来资金和声誉损失[2]。
2. 直销银行业务
直销银行是银行的新兴业务,旨在把传统银行的线下业务包括存款、贷款、结算、理财、投资等业务,转移到线上进行,一方面降低银行的运营风险,另一方面为客户提供更便利的服务。但是,由于线上业务的非面对面特点,直销银行同样面临较大的欺诈风险,主要的欺诈类型包括虚假注册、盗卡、营销欺诈等。这类风险一方面会给客户带来资金损失,另一方面也会严重影响直销银行的业务开展及产品竞争力。
(三)POS 收单风险
银行卡收单业务风险,主要可分为商户欺诈和持卡银行渠道业务背景下交易反欺诈解决方案人欺诈两大类风险,商户欺诈主要是伪卡盗刷、信用卡套现、伪卡盗刷、移机、伪冒交易合谋、商户信用风险、恶意退单等。①套现。使用信用卡进行非真实性交易,套取卡内额度,对发卡行产生逾期风险。②伪卡盗刷。通过侧录等方式盗取卡片磁条信息,并复制成一张或张伪卡,使用伪卡在多个商户处进行刷卡交易,一般多购买易变现的商品,并呈现出大额特征。③移机。商户将pos 机拿到非注册场所进行刷卡使用,往往伴随违禁场所风险、套现、伪卡盗刷等风险。④伪冒交易合谋。商户与不法分子合谋,在商户集中使用伪卡或失窃、被盗卡,或购买易变现商品,或享受相关服务。⑤商户信用风险。商户因经营不善破产或在收到大笔清算款项后立即关门,销声匿迹,使收单机构承担此后的退单损失。⑥恶意退单。持卡人在刷卡后不留存任何凭据,并一段时间内恶意发起退单,拒付交易,造成收单机构损失。
(四)扫码支付风险
掃码支付是近几年新兴的支付方式,扫码支付由二维码与支付两部分组成,二维码用于承载交易信息,客户app 端或商户收银端扫码后获得交易信息并校验通过后,由客户在app 端完成付款,付款方式一般是账户余额、预先绑定的银行卡等。扫码支付可以同时在线上和线下的场景中使用,对于线上扫码,风险较大的场景是电商网站、机票购买、信用卡还款、话费充值等,风险类型主要在于盗卡(卡片信息泄露被欺诈者进行扫码盗刷)和盗账户(账户信息泄露被欺诈者登录后扫码盗刷);对于线下扫码的场景,其风险除了与线上相同的盗卡、盗账户风险外,还存在套现风险,一般是个人用户申请获得码牌,并使用本人信用卡、花呗等透支工具完成扫码支付[3]。
(五) ATM 渠道风险
ATM 渠道主要防控欺诈者通过ATM 通道洗钱。主要两种形式,一种是欺诈者通过网络渠道把盗卡资金转移到银行卡中,欺诈者通过雇佣大量马仔银行卡以ATM的方式把资金分别提现出来。另一种常见洗钱模式是,把假币通过一个ATM 进行存款,通过另外一个ATM 机把资金取现,进而把假币转出真币。
二、银行渠道业务背景下欺诈风险的解决方案
(一)业务层
在当前银行欺诈案件频发的环境下,通过与行内业务人员不断沟通与交流,了解当前银行运营管理风险案件的主要发生场景以及此类风险案件对银行造成的深重影响。结合已有银行运营管理风险案件,深入分析案件的作案手法以及作案特征,从规则的角度出发,构建完整的规则- 指标体系,致力于解决银行运营管理风险案件问题。完整的指标体系业务流程包括数据分析、模型训练、智能决策三个部分,其中数据分析主要进行数据质量分析,指标分析等工作;模型训练主要进行专家规则模型、机器学习模型的训练、调优、评价等工作;智能决策主要进行风险识别与决策的工作,利用专家规、机器学习模型对风险数据进行识别,并自动将风险数据输出至核查平台[4]。
(二)分析层
1. 大数据采集
数据采集,又称数据获取,是利用一种装置,从系统外部采集数据并输入到系统内部的一个接口。在互联网行业快速发展的今天,数据采集已经被广泛应用于互联网及分布式领域。数据采集系统整合了信号、传感器、激励器、信号调理、数据采集设备和应用软件。在数据大爆炸的互联网时代,数据的类型也是复杂多样的,包括结构化数据、半结构化数据、非结构化数据。结构化最常见,就是具有模式的数据。非结构化数据是数据结构不规则或不完整,没有预定义的数据模型,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/ 视频信息等等。大数据采集,是大数据分析的入口,所以是相当重要的一个环节[5]。
2. 大数据存储和调度
在大数据时代,银行业务系统繁多,场景广泛,数据量巨大。银行业数据迅速膨胀并呈现出几何级数的增长态势,且由于行业特性,银行业在长期业务开展过程中积累了海量数据[6]。指标的加工、模型的建立都离不开数据的驱动,而面对如此庞大的数据,指建立大数据平台来支持各类型海量业务数据的存储、加工、 使用和数据价值的提炼。目前大部分银行都在大数据平台建设阶段,因此需要支持和银行大数据平台的无缝对接。通过大数据平台能够存储和调度大数据,大幅度提升可利用的数据范围,使得风险案件防控的覆盖面进一步提升。对于不规范或者不合理的数据,需要对其进行规范化处理,如缺失值填补、异常值替换、数据量纲消除等。数据预处理的目的在于将待分析的数据尽可能规范,提升数据质量,从而便于后续数据分析、指标化加工以及模型训练等工作的正常开展,同时也保障分析工作得到的结果尽可能最优化。
3. 指标预加工
业务需求分析在进行指标加工之前,不仅需要考虑指标是否可实现,还需要考虑指标所依赖的业务场景,加工出的指标能否完整地描述出当前的业务需求。因此在进行指标加工过程之前,需要明确业务需求,尽可能保证加工出来的指标能够被当前业务场景使用。这样一方面能够保证指标加工过程的准确性,另一方面还能够不断反思业务需求的合理性,从而保证生成的指标能够准确描述当前业务场景。业务指标分析在明确分析当前风险案件的业务场景以及业务需求之后,还需要分析风险案件的作案手法以及作案特征,并针对风险案件的作案特征制定具有明确业务含义的业务指标。一方面,业务指标必须逻辑清晰,能够通过科技手段完整实现,另一方面,业务指标必须能够反映并识别已有风险案件的作案特征,还原特征业务场景下的作案手法。业务指标分析依赖深入的业务分析与技术分析,业务指标的有效性是规则产生效果最基础的保障。
4. 数据分析
数据分析是贯穿整个工作流程的工作,数据分析是让我们认识指标生成、模 型调优必不可少的环节。一方面,在指标加工、模型构建过程中,要求科技人员 对数据表结构有全面的认识,熟悉表中每个字段的含义以及数据分布;另一方面,还要求科技人员对表与表之间的关联性有较为清楚的认识,保证表与表之间的关 联能够得到预期的结果。只有通过数据分析才能够对指标化工作有一个整体的认知,才能评估指标加工的合理性以及最终指标结果的可靠性。同时,数据分析的工作也能从数据的角度来说明业务需求是否合理、指标加工是否可优化,总而言之,数据分析是指标化工作的保障。无论专家规则、机器学习模型还是图规则,都离不开数据的支撑,在使用数据之前,必须对数据有一个清晰且全面的认识。而分析层主要供分析人员了解数据、分析数据使用,一方面,了解数据的质量及分布,从技术的角度确认数据是 否可用以及数据本身是否存在价值;另一方面,通过数据分析的工作,有助于分析人员深入了解当前的业务场景,以及当前业务下风险案件的作案手法,从而能够让分析人员对业务需求有一个更加完善的认识。数据质量分析的目的是了解数据的可用性,其主要通过描述性统计分析了解数据分布、发现是否存在不合理的数据。然后结合数据的业务意义判断其是否合理,对于高可用的数据,我们应充分挖掘其潜在信息,对于信息残缺或者没有价值的数据,应尽可能舍弃,避免噪声数据对结果造成影响。数据特征分析在对数据质量、数据分布有大体了解之后,还需要充分分析当前案件的业务场景以及业务需求,只有明确了业务场景的特点,我们才能够结合数据进行特征 分析,进而提取出具有代表性的指标。在指标加工时,提取出来的指标需要保证具有明确的业务含义,而且指标组合之后能够完整描述当前业务场景。因此,数据特征分析的工作不僅要求科技人员对业务有深入的了解,还要求科技人员对 数据结构、数据表之间的关联性有清晰的认识。
5. 指标加工层
指标是规则的最细粒度操作单元,指标包含明确的业务含义,其加工逻辑与案例规则和数据表结构有较强联系。一个案例中,指标的实现至少包括:指标设计、指标运算、指标存储、指标调用等步骤。
(1)指标存储
在指标计算过程中,SQL 指标由大数据平台加工,技术指标由时序处理技术加工,由于时序处理技术依赖内存的特有加工方式与传统的大数据平台不同,因此时序处理技术生成的指标与大数据平台加工的指标存储的方式也略有不同。大数据平台加工的指标以文件的形式存在,加工完成的指标不可更改,而基于时序处理技术加工的技术指标存放于系统的内存之中,随着时序的不断变化,指标的值也处于不断变化当中,当需要进行指标调用时,时序处理技术自动将最新加工的指标输出。
(2)指标调用
在指标加工完成后,对大数据平台加工的指标与时序处理技术加工的指标进行调用,设计特定的调用任务,对于大数据平台加工的指标进行批量调用,对时序处理技术加工的指标进行实时调用,并将调用的指标整合推送至智能决策平台,供智能决策平台判断、识别风险。
(三)决策层
决策层主要是对业务数据进行风险识别与决策的工作,通过专家规则和机器学习模型对风险数据进行识别,并自动将风险数据输出至核查平台进行核查,对应有风险的数据可生成案件进行研究。
1. 智能决策引擎- 双核引擎
通过 SQL 指标及技术指标对复杂案件规则指标化后,银行业务人员可在规则管理平台上对训练好的指标或者模型进行可视化配置,自由生成复杂的规则或组合规则,并支持规则训练、版本管理和一键上线功能。同时训练好的模型以及设置好的图规则可以同时上线,且双核引擎会分别订阅规则和模型,两者同步运行,互相补充,引擎可实时判断业务数据和规则和模型的匹配度。当触发对应的规则时,引擎会对规则进行汇总,并根据当初设置的规则处置策略和风险等级,选择优先级高的规则执行相应的处置动作,再将触发规则的数据生成核查单传送到核查平台。其中规则的风险等级决定了命中该规则的交易的风险等级,也会影响核查人员的处理优先级。规则的验证策略包含预警、阻断、放行、二次认证(人脸识别、位置认证、外呼确认、短信验证、界面问题验证)等,交易触发规则时系统能够 自动发起规则设置的验证策略。规则的管控策略定义了触发该规则对应账户的管控措施,如止付、冻结账户等。规则的名单策略定义了某些规则触发时,对该客户的名单行为操作,如将客户加入黑名单等。规则的通知策略定义该规则触发时,同时需要发起的通知策略,如短信通知客户等。核查平台引擎订阅规则后,当有业务数据进来后,触发了规则和模型的预警单将体现在核查平台上。业务人员可运用关联查询功能从大数据平台海量交易数据中查询相关信息、线索,运用外部数据辅助对涉案信息进行分析。核查平台的主要功能模块包括关联查询、核查单管理、案件管理、黑名单管理和系统设置。
2. 案件管理平台
对于已确认为有风险的业务数据,银行业务人员可根据核查单生成案件,后续再根据新增的案件进行分析,总结、优化规则和指标。
三、结束语
金融欺诈是近年来频繁发生在我国银行领域中的一种犯罪活动,给银行带来重大损失,欺诈风险已成为国内商业银行面临的主要操作风险。加强对商业银行欺诈风险的监控和防范,有效遏制欺诈案件的产生和蔓延,已经刻不容缓。