MPP技术在农村合作金融机构大数据审计中的应用

2024-04-08 02:08杨映希
理财·收藏版 2024年2期
关键词:贷方农信联社

杨映希

省级农信的大数据审计,即依托省级农信的整体数字化转型,从大量不同的业务系统中获取多样性的海量数据,再利用大数据技术进行存储和处理,形成具有审计价值的数据以指导和推进审计工作。2023年5月23日,习近平总书记在二十届中央审计委员会第一次会议上发表重要讲话,要求打造经济监督“特种部队”,对审计提出了“如臂使指”“如影随形”“如雷贯耳”的更高要求。在当前社会大数据技术应用不断拓展和深化、金融数字化快速转型的背景下,借助大数据技术提升审计的信息化水平,对于省级农信经营管理的全面提升,既是外在压力,也是内在要求。本文将以甘肃省农村信用社联合社(以下简称甘肃省联社)大数据审计为基础,研究省级农信应用MPP技术开展大数据审计的应用实践。

一、大数据技术在甘肃农信审计中的应用现状

审计作为风险防控的最后一道线,对于两级法人治理结构具有重要意义。省级农信行业审计是代表省联社对各独立法人行社的公司治理、合规经营、金融风险、国家方针政策落实、省联社部署执行等情况进行全方位监督的重要抓手。甘肃农信通过2020年至2022年的新一代信息工程建设,总体上完成了数字化转型,在此基础上,新一代审计系统于2023年3月建成投用。目前,甘肃农信大数据平台已集中主要业务平台的重要真实数据,包括月末等历史时点数据,总数据量已接近900T;大数据平台基于GreenPlum并行分析型数据库等技术建立,相比传统数据库,其在批量运行、高速查询、非结构化数据应用等方面具备明显优势。因此,甘肃农信目前的数据环境基本上能够满足大数据标准,并在此基础上建立新一代审计系统,开展大数据审计。甘肃省联社的大数据审计,正按照“数据先行、精准定位、快速实施、全面覆盖”的总体原则逐步推进。

二、MPP技术的审计应用模式

MPP是一种基于分布式数据库架构的大规模并行处理技术,它将计算任务分解为多个小的子任务,并将这些子任务分配到多个处理单元上并行处理。这种并行处理的方式可以显著提高数据处理的速度和效率,特别适用于对大规模数据集的分析和处理。甘肃省联社使用MPP数据库中的主流产品之一Greenplum数据库构建集群,建设了大数据平台。Greenplum数据库集群应用于审计,具有以下优势。

(一)分布式架构:相比传统的集中式数据库所有数据都存储在一个或多个高性能的服务器上,分布式架构将数据分散到多个节点进行处理。这种架构为处理大规模数据提供了极好的扩展性,因为可以通过增加节点来提高处理能力,同时它也提供了高可用性。由于审计全覆盖的需要,审计业务中需要不断接入大量新业务数据,同时也需要根据审计重点回溯历史重要节点的时点数据,这些都要求大数据审计能够灵活处理快速在线增长的大规模数据。因此分布式架构的数据处理更具优势。

(二)并行计算:基于MPP架构,可并行处理多个数据片段,每个节点都可以独立地处理分配给它的数据片段,从而加速整体处理速度。通过数据分片,可以更有效地管理和访问数据,减少单个节点的I/O压力,提高整体性能。对于审计业务而言,往往需要对大量数据进行关联查询以发现疑点线索,数据计算量将呈几何级数上升,并行计算可以将计算任务并行地分配到多个服务器上同时处理,极大地提升效率,在合理的时间内完成大数据审计任务。

(三)并行查询:支持在同一时间执行多个查询,并将这些查询分散到多个节点上。不仅提高了查询速度,还使得復杂的数据分析变得更快。同时支持复制表功能,对于频繁访问的数据集可以减少I/O操作和网络传输,查询性能得到显著提高。并行查询+复制表的功能,可以满足多任务处理的需要,满足甘肃省联社每日开展实时审计、进行监测预警的需要,同时满足各审计机关根据实际情况按需开展大数据审计查询的需要。

三、MPP技术下大数据审计模型应用实例

(一)信贷业务审计模型案例

信贷业务审计以“贷款资金回流至借款人关联人或关系人”模型为例。该模型揭示的主要风险点是疑似贷款资金用途不真实。贷款资金发放或受托支付后,资金通过一手或数手流转后重新回到借款人关联人或关系人账户,说明借款人可能并未将借款用于实际经营或消费用途,而是转移至其关联关系人挪作他用。为审计该风险点,使用如下模型思路建模:

从贷款借据表中提取未结清贷款明细→从贷款客户交易明细表中提取贷款客户放款交易明细→分别提取贷款客户的存款账户贷方交易和借方交易→未结清贷款明细和贷款客户放款交易明细关联,获取贷款放款交易流水号→贷款客户的存款账户贷方交易与贷款放款交易流水号关联,获取贷款放款核心流水明细→贷款客户的存款账户贷方交易与贷款放款核心流水明细关联,获取放款后资金一手流出明细→贷款客户的存款账户贷方交易与放款后资金一手流出明细关联,获取放款后资金二手流出明细→贷款客户的存款账户贷方交易与放款后资金二手流出明细关联,获取放款后资金三手流出明细→贷款客户的存款账户贷方交易与放款后资金三手流出明细关联,获取放款后资金四手流出明细→贷款客户的存款账户贷方交易与放款后资金四手流出明细关联,获取放款后资金五手流出明细→对以上五步中一手至五手资金流水的对手信息分别进行整理并合并流水明细→放款后资金一手至五手流出明细合并表与客户关联关系信息表关联,获取放款后资金一手至五手流出对手方为贷款客户关联关系人的信息。

该模型运行结果在信贷业务审计中进行逐笔查证,取得了较好效果,但也存在一些不足。一是客户关联关系信息表数据不全面,后期计划根据甘肃农信客户关系管理系统(CRM)建设和优化进度不断补充全面客户关联关系数据,扩大模型覆盖面;二是资金流出只覆盖五手信息,由于关系型数据库的特性,多次关联将导致数据量呈几何级数增长且难以解决关联回路的问题,后期计划运用图数据库技术加以解决。

(二)柜面业务审计模型案例

柜面业务以“网点现金申请状态异常”模型为例。该模型揭示的主要风险点是获行社现金管理流程和员工日常操作风险。为审计该风险点,使用如下模型思路建模:

从调拨申请记录表获取网点调拨申请记录信息,筛选出申请状态为未处理状态信息→从现金出入库状态登记簿获取现金出入库状态信息,通过现金申请编号对数据进行筛选,取唯一值→将网点调拨申请记录和现金出入库状态登记簿,通过现金申请编号进行关联→筛选出网点调拨申请有记录,现金出入库无记录数据。

该模型运行结果在柜面业务操作风险审计中进行了逐笔查证,查证结果与数据结果基本一致。未来将继续完善数据仓库现金出入库管理记录信息,结合现金出入库管理审计风险点,完善数据模型。

四、省级农信大数据审计展望

甘肃省联社大数据审计的发展,可为农村合作金融机构大数据审计的开展提供以下实例和借鉴:一是持续推进审计系统建设和优化。根据审计实践运用情况不断提出新的需求,将审计业务流程化、线上化、电子化,加强大数据技术应用水平,不断提升信息化审计能力。二是不断增强审计数据的应用能力。借助大数据平台技术优势,挖掘数据的审计价值,积极发现审计数据中存在的不足,促进甘肃省联社的数据治理水平不断提升。审计系统不断优化数据结构,提升查询分析效率。三是通过大数据审计转型提升审计价值。通过数字化转型,快速发现疑点线索,快速进行非现场查证,提高审计监督的及时性;对接内外部数据以及审计模型疑点筛查,追踪资金流向、关联贷款等信息,积极参与风险化解;运用大数据构建分析性模型,积极开展经营分析,促进甘肃农信业务持续稳健发展。

本文系甘肃省2023年金融学会重点课题《科创金融的实践与探索研究——大数据技术在省级农信审计监督中的应用》相关研究成果。

猜你喜欢
贷方农信联社
北京农信互联科技集团有限公司
北京农信互联科技集团有限公司
北京农信互联科技集团有限公司
山西农信今年将投放470亿元助力乡村振兴
平泉市农村信用合作联社
吉林省手工业合作联社第九次代表大会在长春召开
香港国际收支平衡表
岳池联社开办兴趣课堂
最佳策略
新高校基建并帐业务的会计处理