SPSS在“一卡通”审计中的运用

2022-02-21 00:26林鹏孟砚怡房县审计局
审计月刊 2022年11期
关键词:数据文件编辑器字段

◆林鹏 孟砚怡/房县审计局

SPSS(Statistical Product Service Solutions),“ 统 计产品与服务解决方案”软件,是世界著名的统计分析软件之一,集大量成熟的统计分析方法、完善的数据定义操作管理、开放的数据接口以及灵活的统计表格和统计图形于一体。与我们审计人员常用的SQL SEVER等数据库软件相比,SPSS优势更加明显。在“一卡通”惠民惠农财政补贴资金管理使用情况审计过程中,笔者大胆使用SPSS技术,极大地提高了审计工作效率。

“一卡通”惠民惠农财政补贴资金的数据面广、数据量大,利用计算机软件筛选比对出疑点数据,已成为此类审计项目通常的审计方法。本次审计采集到最多的就是EXCEL数据,从十多个基础部门收集、汇总而来。由于各部门需求不同,数据输入者习惯不同,数据的格式存在很多差异。本文以某县医保局提供的某年度医疗救助数据为例,演示运用SPSS技术开展审计数据分析工作。

SPSS提供了两种合并数据文件的方式,分别是纵向合并和横向合并。纵向合并是将数据首尾对接,即将一个文件中的数据追加到另一个文件后面,依据两份数据文件中的变量名进行数据对接。横向合并是按照记录的次序或者某个关键变量的数值,将不同数据集中的不同变量合并作为一个数据集,新的数据中的变量数是所有原数据集中不重名的变量总和。

一、纵向合并数据

有两份关于医疗救助发放的EXCEL表(见图1),两个数据文件中数据项不尽相同,且同一数据项的变量名也不完全一致。现需要将这两份数据合并在一起。

图1 医疗救助发放明细表

操作步骤如下:

1.打开将要合并的数据文件;

2.选择菜单【数据】→【合并文件】【添加个案】(见图2);

图2 纵向合并数据文件窗口

3.选择打开的数据集,随后进入纵向合并数据文件窗口,【新的活动数据集中的变量】框中显示的是两个数据文件中的同名字段,SPSS默认它们有相同的数据含义,并将它们作为合并后新文件中的字段;【非成对变量】框中显示的字段名是两个文件中不同字段名,或者字段名相同但字段大小类别不同。其中,字段名后的(*)表示该字段是当前数据编辑器窗口中的字段,(+)表示该字段是待添加数据表的字段;在【非成对变量】框中可以将两个字段同时选中,再单击【对】按钮指定配对,表示它们的名称不同但数据含义是相同的,可纳入合并后的数据中。选择好配对的字段,单击确定即可将两表合并,得到合并后的新表(见图3)。

图3

二、横向合并数据

横向合并数据就是将当前数据表与另一个数据表进行左右对接,相当于SQL中的LEFT JOIN。但实际操作比SQL语句简单直观得多。

例如在采集民政局提供的低保数据表时,需要采集低保救助表(见图4)和春节慰问表(见图5)。

图4 低保救助表

图5 低保春节慰问表

两份数据中低保受助人的基本信息相同,只是在春节慰问表中受助人的信息少了。我们可以从低保数据中获取春节慰问人员的家庭住址。

操作步骤如下:

1.数据编辑器窗口中打开一个需要合并的表,如这里的春节慰问表;

2.选择菜单【数据】→【合并文件】【添加变量】(见图6);

图6 横向合并文件窗口

3.两个待合并的数据中所有字段名都显示在【新的活动数据集】框中,SPSS默认这些变量均以原有字段名进入合并后的新数据中;

4.指定提供合并数据的方式。SPSS有三种数据提供方式:【两个文件都提供个案】是SPSS默认的方式,指由原来两个表格共同组成合并后的数据文件;【非活动数据集为基于关键字的表】只在当前活动数据集的基础上,将其数据的字段合并进来,即合并后表格中的数据仅包含当前表中的数据;【活动数据集为基于关键字的表】指在第二个表格的基础之上,将数据编辑器窗口中的其他字段合并进来,即合并后表格中的数据包含第二个表中的数据。至此,春节慰问表中就新增加了字段“家庭地址”,统一了所有民政低保资金数据的格式,方便下一步数据分析。

SPSS界面操作简单、方便,拥有良好的帮助系统和自学系统,对于熟悉SQL等数据库系统的审计人来说,SPSS不仅同样拥有数据导入、合并、关联对比等功能,还有成熟的统计过程、完美的图形处理功能,可以更好地完成审计分析,极大地提高审计效率。

猜你喜欢
数据文件编辑器字段
图书馆中文图书编目外包数据质量控制分析
司空见惯感觉烦 锁屏画面快走开
你距离微信创作达人还有多远?
车辆段收发车运行图编辑器的设计与实现
数据文件恢复专题问答
数据文件安全管控技术的研究与实现
SQL数据文件恢复工具
CNMARC304字段和314字段责任附注方式解析
无正题名文献著录方法评述
关于CNMARC的3--字段改革的必要性与可行性研究