Python数据分析技术在审计实践中的应用

2021-03-02 01:46林鹏孟砚怡房县审计局
审计月刊 2021年11期
关键词:文件名汇总调用

◆林鹏 孟砚怡/房县审计局

大数据的运用给包括审计在内的各行各业带来了前所未有的机遇与挑战。本文介绍大数据背景下,基于Python的数据分析算法在审计中的应用,探索了一种整合Python代码的方法,将审计人员使用的对数据进行整理、挖掘和分析的过程代码化,通过整合汇总成一个控制台,最后将Python语句打包成exe可执行文件。此方法解决了Python入门门槛的问题,不会Python语言的审计人员,也可以使用Python语句快速分析数据,提高审计效率。

一、建立Python的代码汇总平台

Python作为一种简洁、可扩展性强的面向对象的编程语言,已广泛应用于数据分析、文本处理等领域。采用Py⁃thon语言开发控制平台,实现常用数据分析方法的汇集,为大数据分析提供更多更好的工具。程序主体分为两个模块:控制台模块和数据分析工具模块。

(一)控制台模块

在程序开始时,首先进入的是系统主界面,这里做了一个简单的交互程序设计,显示可选择的功能菜单,可通过数字或上下方向键选择菜单。Python的代码汇总平台如图1。

图1

首先,导入默认库中的os类,利用os类中的input和re函数,获得使用者选项的过程代号。然后,将可用的Python语句封装成过程,再使用一个循环语句,通过代号调用该过程,实现数据分析。代码如图2。

图2

(二)数据分析工具模块

Python有丰富的扩展库可用于完成各种高级任务,为展示汇总平台的有效性,本文使用Python进行编程,实现不打开excel文件,就可以对excel进行查看的功能。

首先,也是利用os模块下的input函数,对用户输入的文件地址进行处理,自动列出文件的全路径和文件名。然后,通过选择序号的方式选中要查看的excel文件。

从待查看的excel文件中获取文件信息,首先,使用openpyxl库打开文件。由于openpyxl不支持xls文件,在数据准备阶段需要将旧版的xls文件全部转换为后缀名为xl⁃sx的excel文件。然后,利用openpyxl库中的load_workbook读出文件的表名、行、字段等基本信息。最后,使用双重循环,遍历文件中的前5行并打印。这样就实现了在不打开表格的情况下查看数据的功能。

(三)控制台和数据分析工具模块的整合

步骤一:将反复用到的代码定义为一个函数,使用处理后的返回值。这里定义了一个名为ch_one_file()的函数,用于获取文件的全路径和文件名,得到的结果使用return()返回。如图3。

图3

步骤二:采用函数调用的方式使用代码。调用ch_one_file()函数后,filename就是经过处理后的文件的全路径和文件名。如图4。

图4

步骤三:使用循环语句,打印界面给可调用的函数编号,方便用户使用。如图5。

图5

通过Python语句处理excel,不需要考虑平台、程序设计等方面的问题,同时,这种形式可以推广到更多的Python代码使用上。熟悉Python语句的审计人员,可以将日常收集到的代码集合在后面,让更好的经验被更多的人应用。

二、数据分析技术具体应用举例

在对某县民政救助资金审计中,审计人员采集到的银行发放花名册是以月为单位存储的。为了全面核对发放的人数和金额,审计人员需面对上百张结构相同的excel文件。在利用数据分析技术前,对这些文件的汇总、统计是一项重复而且繁琐的任务。因此,审计组利用平台中汇总的处理excel的Python代码,在不打开文件的情况下查看文件结构,并进行简单处理。具体步骤如下:

步骤一:获得银行发放花名册表格,将所有带汇总的文档集中到一个文件夹,在功能菜单中,输入数字“1”,Py⁃thon调用函数insert(),将进入查看excel文件里表格信息的功能。如图6。

步骤二:Python代码将文件夹下的所有文件进行编号,使用者选择编号就可以选择文件,避免了人工输入出现错误的情况。通过Python代码就可以一次性查到整个文件夹下的所有excel文件结构和前5行数据。如图7。

图7

三、代码汇总平台的拓展应用

Python具有脚本语言中最丰富和最强大的类库,这些类库覆盖了文件输入输出、数据库访问、文本操作等绝大部分应用场景。案例基于Python交互代码的使用,可以用来汇总好的代码。例如:写一段批量改文件名代码,命名为 rename(),在本案例后添加 option_int==2:rename(),运行后就可以通过编号调用该代码。

[图片新闻]

为弘扬中华民族爱老敬老的传统美德,咸丰县审计局组织开展了重阳节“爱老三部曲”系列活动,为退休老干部送关怀、送温暖、送健康。

(段寅雪 摄影报道)

猜你喜欢
文件名汇总调用
常用缩略语汇总
系统抽样的非常规题汇总
核电项目物项调用管理的应用研究
右键调用多重更名更方便
Excel轻松提取文件名
系统虚拟化环境下客户机系统调用信息捕获与分析①
把我的秘密藏起来
供应商汇总
供应商汇总
利用RFC技术实现SAP系统接口通信