李城漳
税收征管作为财政收入的主要来源,直接关系到国库资金的安全。因此税收征管审计历来是审计机关年度审计计划中的重中之重。个人所得税作为地税系统中的重要税种,即便县级行政区域涉及的征管对象也是非常庞大。传统的审计方法诸如账簿基础审计和制度基础审计在这时候往往力不从心。个人所得税作为单一税种在税法中的相关规定有章可循,税收征管系统的数据库存储有字典表可以参照,因此以数据挖掘为基础的风险导向审计将成为个人所得税税收征管审计的最佳选择。
一、个税数据取得
个税相关数据主要来源于税收征管系统中的税收征收表、税收入库表、税收台账表、税收申报表、纳税人信息表等。取得上述表后首先需直接导入SQL数据库或AO系统中,接下来就是将个税数据从各个总表中分离出来以便进行接下来的具体挖掘。例如,征收表中的个税数据一般的取得方法就是:
select * from 征收表 into 个税征收表 where 税种='个人所得税'
二、个税数据的数据处理
1.判断真实性和完整性
分离出个税数据后,按照惯例,首先应判断数据的真实性和完整性。一般来讲,纸质税收征管报表中的个税征收额就是个税入库表中的入库金额汇总数。两相对比一致则显示个税数据的取得相比报表是完整的。
2.个税数据的表间对比
所有的税收数据的统计结果都来源于基本表,由于基本表间的勾稽关系在最初设计征管系统之初就已确立,如果通过表间比对显示有差异则预示存在重要的审计风险需要核实。例如个税征收表和个税入库表间关于税票的信息具有一定的重叠性,如果个税征收表中的已纳税额与个税入库表中的入库金额相一致则表示征收的个税已全部入库,如果不一致则需要核实清楚不相符的原因。如果有差额,一般的情况是征收金额大于入库金额,通过下述语句可以筛查出已征收税款却未入库的税票号:
Select * from 个税征收表 where 是否入库<>‘已入库。对于未入库的个税税票将作为重要的审计疑点需要采取其他的审计方法进行核查。
对于剩下的个税征收表中已入库的数据再进行和个税入库表的对比,如果还有差额则表示需要进一步的数据挖掘。这时可以按单张税票号以及税种税目税率分组比对入库情况明细:
select a.*,b.*,a.征收金额-b.入库金额 from (select 税票号,sum(实纳税额) 征收金额 from 个税征收表 where 税款所属时期起始 like '2013%' group by 税票号) a full join (select 税票号,sum(入库税额) 入库金额,征收员姓名 from 入库表 where 税款所属时期起始 like '2013%' group by 税票号,征收员姓名) b on a.税票号=b.税票号 where abs(a.征收金额-b.入库金额)>0
在一次对某区县的税收征管审计中,笔者通过上述语句发现几十张税票的征收金额与入库金额不符,但是税票的状态却显示已入库,而且皆为同一征管员征收,少入库金额上万元,显示出该征管员有重大的私吞税款的嫌疑,最终将该线索落实后移交给了相关单位进行进一步的处理。
以上是个税征收和入库表的表间对比,其实在纳税人信息表征收表、入库表、申报表等相关表间,如果勤于思考还有很多对比的方法来进行数据挖掘。
3.个税征收合理性、合法性、合规性的审定
个税的征管重在税率,税目的判定,例如税目就分为工资薪金所得、个体工商户的生产经营所得、企事业单位的承包经营和承租经营所得等十一项,其中工资薪金所得又遵循七级超额累进税率,以及其他税目大多也分为若干税率的情形。猛地一看貌似无从下手,其实依然可以采取先总后分,循序渐进的数据挖掘方法,满满剥离出重要的审计疑点。笔者采取的顺序一般是先分析个税征收表中的个税税目、税率生成个税税目税率表:
select 税种,税目,税率 from 征收表 where 税种='个人所得税' group by 税种,税目,税率 order by 税种,税目,税率
通过上述语句,基本上可以概览所有个税的税目、税率的种类分类。这使许多不符合个税征收管理办法的税目和税率就很简单地能通过第一步的筛查找出来。例如笔者在某次税收征管审计中就通过上述方式找出了十余种不可能存在的税目、税率种类。然后以这些税目税率的种类为关键字,就能直接的挖掘出不符合规定的个税征收税票就达几百张。将这些税票全部作为具有重要审计风险点的审计疑点进行审计核实。这种情况的产生可能的因素是多方面的,诸如税务人员套税率和税目的疏忽、小额多税目征管人为简化流程,个税征管暗箱操作等不一而足,其中不乏一些案件的重要线索。
对于个人所得税来说,存在个人申报和单位代为扣缴两种情形,在数据挖掘中最好区别开来。一般情况下,单位代为扣缴时纳税人名称为单位名称,而个人申报的纳税人名称为个人姓名,根据单位名称一般超过3个字而个人姓名一般为2至3个字的原理,可以大致把它们进行区别开来,将这个问题处理好。
对于个人申报来说,可能涉及的情况很多,比如税目的区别,单一税目中特殊情况处理的差异,以及各种超额累进因素的影响。此时如果按照常规的以票定税的思路去处理可能就显得比较难以着手,因为即使单一税票也可能出现若干不同的税目、税率特殊情况,语句的编写会显得过于复杂而且很难保证数据挖掘语句的完整性和逻辑性。这时如果反其道而行之,采用以税定票的方式会比较可行。将某一种特定情形的税票中的某条记录全部检索出来,再对这一单一情形的记录集进行逻辑性复核的话往往能起到立竿见影的效果。虽然总体工作量因为情形的种类多会增加,但是能稳扎稳打,确保审计结果的可信赖程度。例如,将个人劳务报酬的情形筛选出来,然后对其中的级差调节进行核实,找出未按照税法规定处理的税票,劳务报酬的个税征管规定是:20 000以下税率为20%,20 000~50 000的税率为30%速算扣除数2 000,超过50 000的部分税率40%速算扣除数7 000,按此要求:select * from 劳务报酬个税记录 where (应纳税额<>0.2*计税依据 and 计税依据<=20000) or (应纳税额<>计税依据*0.3-2 000 and 计税依据<=50 000 and 计税依据>20 000) or (应纳税额<>计税依据*0.4-7 000 and 计税依据>=50 000)
结果就是所有未按规定征收劳务报酬个税的条目记录,可以将其联合未按照其他个税征收要求发现的记录一并作为具有审计风险点的审计疑点进行审计核实。
对于单位代为扣缴的情况来说,一般的处理思路跟个人申报的处理思路基本一致,但是值得注意的是,单位有时候会采用对单位内部职工统一扣缴,在单一税票集中反映的处理方法,此时的数据剥离方法就会略显复杂,有时候对该征收数据的挖掘甚至会牵涉到与单位个税申报表、单位个税入库表、以及个人申报表、个人征收表的交叉关联。虽然可行,但难度仍然较大。这方面的工作仍然有待强化。为了避免这种情形的出现,如果审计人员能做到审前就与税务系统的充分有效的沟通,实现税收征管处理过程中单位集中扣缴数据的按照类别差异化处理的数据存储记录,将一方面有利于税务系统自身的专业化建设,另一方面也利于审计工作效率的进一步提高。例如对单位统一扣缴工资薪金个税时按照同一税率征收的员工进行单一记录的生成,同时加上该标准的人数记录,有条件的还可以考虑明细到单一员工来进行末级扣缴。
三、个税征管数据挖掘的展望
个税征管审计越来越依赖于计算机数据库技术的充分发展,随着计算机审计在税收征管审计中的介入越来越深,必然伴随着越来越多的审计方法的不断涌现,也给审计人员的工作提出了更高的要求。审计人员必须多看、多想、多查、多问,才能够在立足现在的同时,共创美好未来,永保国家的经济安全。
数据挖掘的方法不胜枚举,数据挖掘的工作永无止境,以上的一些方法也可以套在其他税种的数据挖掘上。上述的一些思考仅算九牛一毛,方法不辨不明,思路不理不清,真诚希望全国审计同仁一同交流,共同提高。
(作者单位:九江市浔阳区审计局)