以大数据为基础 构建人工智能审计平台

2020-12-17 03:29王少宁贾俊
科教导刊·电子版 2020年17期
关键词:网络爬虫审计自动化

王少宁 贾俊

摘 要 随着计算机性能不断提高、互联网云计算和大数据的大量应用、神经网络和深度学习技术发展,人工智能得到了飞速的发展。政府审计如何利用人工智能技术取得创新性发展是一个全新课题,本文介绍了人工智能审计的内涵和构建人工智能平台的重要意义,并对利用人工智能的深度学习、网络爬虫等技术来发现审计线索,进一步提高政府审计效率和独立性,节省人力物力,进行了探索性思考。

关键词 人工智能 审计 自动化 深度学习 网络爬虫

中图分类号:F239.1文献标识码:A

近年来,随着计算机性能不断提高、互联网云计算和大数据的大量应用、神经网络和深度学习技术发展,人工智能得到了飞速的发展。党的十九大报告提出推动互联网、大数据、人工智能和实体经济深度融合。如果将人工智能与政府审计相融合,打造人工智能审计平台,利用人工智能的深度学习、网络爬虫技术来发现审计线索,就能够进一步提高审计效率和独立性,节省人力物力,打造反腐败的天网,开创政府审计的全新局面。

1人工智能审计的内涵

人工智能是对人的意识、思维的信息过程的模拟,生产出一种新的能以人类智能相似的方式做出反应的智能机器。实际应用包括 :机器视觉,指纹识别,人脸识别,视网膜识别,虹膜识别,掌纹识别,专家系统,智能搜索,定理证明,博弈,自动程序设计,自动驾驶,智能控制,语言和图像理解,遗传编程等。

人工智能审计,就是将大数据的理念、技术运用于审计工作,通过将普适性强、成熟度高的数据采集技术、数据整理技术、数据分析技术、数据挖掘技术及审计判断技术等以审计模板的形式固定下来,形成以审计模板为核心的审计软件,审计人员通过点击按钮及输入必要的条件,即可开展审计的技术。

人工智能审计突破传统审计所带来的新的技术手段和分析方法,以机器学习、深度学习神经网络等技术为基础,对审计数据分析能力,实现每个月几何级增长。随着人工智能技术进步,审计算法、算力迭代速度加快,审计部门利用积累的海量审计数据,采用机器学习、深度学习神经网络等技术,顶层设计不同行业电子审计标准和规范,训练形成不同类别审计的模板,进而形成审计知识库,从而实现智能提取这些知识库的自然语言文本中的客户关键审核要素,结合风险审计业务规则和审计要素之间的关联稽查关系,识别出异常点,提示异常虚假信息的风险。

2构建人工智能审计平台的意义

人工智能伴随着大数据的发展而发展,一方面,人工智能离不开大数据的支持;另一方面,人工智能也推动着大数据技术的发展。审计智能化的基础是大数据、核心是人工智能,人工智能审计平台将大大减小时间、地域等因素对审计项目的制约,将颠覆传统的审计组织模式,引领审计工作新的发展与变革。主要体现在:

2.1人工智能审计平台有利于实现审计全覆盖

当前,审计工作受审计时间和人力资源等因素的影响,审计组常采用重点抽查,重点抽查因“总体 > 样本”,存在可能遗漏重大问题的局限性。使用人工智能后,审计软件可以日以继夜、不知疲倦地工作,使审计工作摆脱审计时间、特别是人力资源的制约,从而使审计全覆盖得以真正实现。同时,人工智能还可以避免人为因素的影响,如审计人员判断失误,甚至故意“放水”等导致重大问题的遗漏。

2.2人工智能审计平台有助于审计工作自动化

利用人工智能,审计软件可以按审计模板(实质是审计人员预先设定的程序)自动进行数据采集、数据整理、数据分析,甚至还可以对被审计单位的常规性问题进行纠错查弊。同时,使用深度学习技术,还可以自动搜索、识别、归纳和总结被审计单位新出现的普遍性、倾向性异常问题,并自动形成可移植、“傻瓜型”的审计模板,其他审计组使用该模板,即可自动对该类问题进行审计。

2.3人工智能审计平台将大大减轻审前知识储备

随着经济的发展,社会分工将越来越细,同时,法律法规的完善也意味着其内容将更加丰富与多样。为更好地履行职责,作为“经济守夜人”的审计人员需学习的法律法规、行业背景等知识也将越来越多、越来越细。为此,传统审计模式下审计人员在审前阶段不得不花大量时间学习相关法律法规及行业背景等。运用人工智能,计算机可以实时更新現行法律制度,自动搜索行业背景和专业知识,且不会出现记不清、记不准、记不牢,更不会出现注意力不集中、精神疲惫等情况。

2.4人工智能审计平台将大大解放审计人员

审计智能化不仅可以缩短审计工作所需的时间,还可将审计人员从繁琐、重复的简单劳动中解脱出来。比如,传统审计模式下,审计组对某银行进行审计,一般需派七至八名审计人员专门对电子数据进行采集、整理,运用人工智能后,其工作均可由审计软件自动完成,因此,审计智能化相当于增加了审计力量。这样,审计人员就可以进一步发挥人的主观能动性,专心关注审计软件难以完成的重大事项,如查处重大违纪违规问题及从体制机制等角度分析问题产生的原因,并从更高层面、更广范围、更加综合的视角提供具有前瞻性的审计建议。

3构建人工智能审计平台的关键技术

构建智人工能审计平台是项较为复杂的系统工程,包括网络、数据库、审计平台软件等技术工程,归纳和总结审计方法和审计经验形成的审计模板,以及技术工程与审计模板的集成。从技术上看,构建智能审计平台以大数据为基础,并主要依靠自动化系统、深度学习、网络爬虫等三种技术。

3.1审计自动化

审计自动化是指审计软件在没有审计人员干预或较少干预的情况下,按照审计模板设定的审计程序,通过数据采集和数据整理自动化、数据分析和数据挖掘自动化及审计问题查处自动化,实现审计目标的过程。审计自动化的关键是审计程序的设定(或审计模板的固化)。

(1)数据采集和数据整理自动化。该技术是在摸清大部分被审计单位信息系统(如现有的数据库类型、数据结构等)的基础上,根据审计标准数据接口的要求,对传统的数据采集整理技术进一步进行归纳总结,最终形成数据采集整理模板。每到设定的数据采集周期(如一季度采集一次或半年采集一次),审计软件将自动接收相关单位的原始数据,形成审计标准数据,并存入指定的数据库。虽然形成模板的工作量较大,但一旦形成就能持续使用;同时,运用该技术,审计软件平时自动完成数据采集和整理,避免了原始数据提供慢、中间数据形成时间晚等问题。

(2)数据分析和数据挖掘自动化。数据分析和数据挖掘是审计自动化的核心,其目的是获得审计线索。传统审计模式下,数据分析和数据挖掘依靠审计人员手动进行,分析成果很大程度上取决于审计人员的业务能力,分析技术强、业务能力好,获得的线索就多、质量就高;反之,线索就少、质量就差。数据分析和数据挖掘的自动化,就是将成熟的、行之有效的数据分析方法、数据挖掘技术以分析模板的形式固定下来。对审计人员而言,具体的分析方法就类似于“黑匣子”——拿来即可用,而不用了解具体的分析过程。数据分析和数据挖掘自动化技术实质是将审计人员的成功经验和专业知识,以分析模板的形式透明地、无阻碍地分享给其他审计人员,达到减轻技术依赖和工作强度的目的。

(3)审计问题查处自动化。审计问题查处自动化是在数据分析和数据挖掘自动化的基础上,根据审计判断模板设定的程序和条件,判断分析发现的审计线索是否符合现行法律法规并直接获得审计问题的技术。本质上,审计问题查处自动化技术是数据分析和数据挖掘自动化的技术升级。相同的是:模板都是核心,模板质量很大程度上决定了审计软件能否尽可能地发现被审计单位存在的问题、决定了发现的问题是否是“真正违反现行的法律法规”;不同的是,审计问题查处自动化获得的是审计问题,进一步减少了审计人员的直接参与,但它对人工智能的要求也更高,需要審计软件具备人的判断力,而不仅是按预先设定程序执行某些操作。

3.2深度学习

实际上基于深度学习技术的人工智能技术早已应用到平时生活中,比如语音导航、实时翻译、苹果手机的SIR语音助手、交通违法摄像的车辆识别行人识别等。四大会计师事务所已将人工智能技术应用与阅读合同和文件并提取关键信息进行审计分析。结合到政府审计,我们也可以应用人工智能图像识别技术中的字迹识别来打开新的审计思路。比如与高校科研机构、笔迹司法鉴定中心和手机应用开发公司合作研制字迹识别手机应用APP。

例如根据以往审计经验,国家下拨的专项扶贫资金在基层乡镇使用中存在挤占挪用的情况,从乡镇到各职能部门编制虚假花名册虚假项目资料争取上级扶贫专项资金的现象屡见不鲜,审计组通过大数据联网审计也难以发现审计疑点,通过延伸审计到现场才能发现问题。审计组通过字迹鉴别发现扶贫项目花名册里面受益贫困户签字笔迹来发现造假线索。在财务收支审计中也可以利用字迹比对来发现是否存在冒用领导签名虚假报销的违法乱纪行为。

3.3网络爬虫

网络爬虫(又称网络机器人)是指按照一定的规则自动地抓取互联网信息的程序或脚本。未来人工智能审计系统可以利用网络爬虫技术,抓取联网大数据(网络数据、通信数据、监控数据、金融数据)实时监控实时预警,通过实时跟踪嫌疑人活动范围(图像识别功能)、接触人物、通讯通话记录(语音识别提取功能)、网络通讯记录、银行现金来往,综合分析有无贪污腐败行贿受贿的行为。

例如,某县按上级安排需要建设某惠民工程,资金来源是中央下拨扶贫资金,A县长想把该工程发包给有私下关系的B老板,通过虚假招投标B老板拿到该工程,后B老板给A县长某亲戚好处费。人工智能系统在中央资金下拨开始对这笔资金开始追踪,招投标开始扫描招标及合同文件,对合同姓名和公司进行分析,对比组织部和户口系统,工商系统,查找相关联人信息。锁定目标后对嫌疑人银行账号进行追踪,通过监控系统,人脸识别系统,车载GPS信号,手机通讯音频信息,综合分析,查找出利益交换线索。

4构建人工智能审计平台的探索

未来审计必将经过自动化到智能化的演变。结合到目前政府审计工作的实际,我们可以跟大数据公司、互联网公司、研究人工智能的高校合作,从以下几个方面进行探索:一是探索将人工智能运用到大数据审计中,根据大数据审计模版研制审计专家系统。二是创新审计调查手段,研制字迹识别系统识别会计原始凭证中的造假线索。三是运用互联网思维将审计数据实时联网,对财政资金动态实时监控,对审计发现问题进行初判,大批量数据自动处理,自动生成审计线索。四是利用公安视频监控系统、手机信号自动追踪分析识别系统、银行反洗钱系统共同打造反腐败的天网。此外,建议将人工智能审计纳入到金审工程中,结合大数据审计模版开发审计专家系统、字迹识别系统和联网审计系统整合到AO现场审计实施系统,以进一步提高审计震慑力,预防和打击腐败,为审计积极参与国家治理体系建设做出贡献。

猜你喜欢
网络爬虫审计自动化
炼铁厂铁量网页数据获取系统的设计与实现