武民刚 曹静波
如何加强金税三期数据分析
武民刚 曹静波
经济建设为中心的现代社会,经济活动的发生,业务数据在前台生成后,数据分析就成为十分重要急迫的头等大事。数据分析的作用有:数据质量监控。把住数据质量关,关系到整个数据分析工作的成败。数据抽取挖掘。在各种代码表、业务数据表的基础上,关联结合,抽取数据分析需要的相互关联印证的数据,挖掘出有用信息,是数据分析的基础。数据统计决策。对有用的数据进行再次的汇总统计,同期对比,供决策层面参考,提供日常业务预警、时段绩效考核、关键决策支撑,是数据分析的核心。当代计算机存储硬件的性能提升,数据集市、数据仓库、商业智能技术的发展,为税收数据分析提供了优良的硬软件基础。在本世纪头十五年金税一二期工作的基础上,国家税务总局整合各省市区、国地税的税收信息化,建设金税三期,为大规模更加及时、全面、友好、精确的数据分析工作提供了可能。探讨研究如何加强金税三期数据分析,是摆在我们面前的重要课题。
税收数据分析是一个老课题。很多数据分析相关的工作,以前依赖于纳税企业涉税人员素质、税务机关内部税务人员掌握税收政策业务水平,或者税务代理机构的业务水平。当代先进的计算机硬软件,可以把数据分析及时化,提供事中审核预警,及时反馈更正;事后监督考核,加强执法问责等,但目前税务机关在应用数据分析中还存在不足。
1.数据质量有待提升。纳税企业涉税人员待遇低、流动性大,税收法律和税收政策掌握执行水平参差不齐。普通的纳税企业尤其是占比相当大的中小企业,涉税财会人员待遇低,工作岗位变动快,和税收管理人员打交道的很多涉税人员都是新面孔。往往很简单的办税事宜,第二年要重新组织纳税人培训。纳税企业向税务机关报送的各种涉税报表,往往数据质量达不到基本标准。一是错报、漏报的现象相当突出。比如,免税销售收入的填报,企业所得税年报的填报,都存在错报、漏报,甚至瞒报的情况。二是表内表间业务数据逻辑关系的审核难以实现。很多表的数据要与后面的表的数据一致,不管是单机版填表工具还是网络申报平台,在解决这一问题上都存在不足。
2.数据提取有待完善。各种业务域的代码表、数据表存放在不同的数据库中,需要根据数据分析的需要,提前把数据提取挖掘,关联到一起,提供多层级、多维度的分析。目前各业务部门往往开发了很多业务系统,存在一些相互关联的数据,没有及时比对,造成一些信息“孤岛”。如果把各种数据库中的数据表、代码表的数据关联到一起,就可以进行大规模的数据比对,一旦发现数据质量问题,可以及时纠错,并为进一步数据分析提供可能。
3.预警平台有待建构。税收预警和风险防控十分重要。普通的数据质量,税收业务风险,甚至税收违法犯罪,都需要我们建构强大的税收风险预警平台。一是考核时间点之前的业务预警,二是考核时间点之后的过错追责,三是确定涉税违法线索,并移交稽查或移交公安经侦。不建构强大的预警系统,难以及时发现业务问题,跟踪业务流程,处理涉税违法犯罪。
要完善数据提取,要建构预警平台,完成涉税风险防控,就必须掌握金税三期的业务流程,监控数据流,分析数据形成的机制,分析各种数据的完整性、冗余性、存储在哪些具体的数据表中,各数据字段的含义,数据表与代码表之间的层级和维度。只有在充分了解掌握数据的基础上,才能实现复杂、及时、全面、准确、多维的数据分析。
(一)完善数据存储利用和备份机制
进一步完善数据省集中、信息市抽取模式。并建立起强壮的数据灾备恢复机制,为数据分析提供牢靠的硬件软件基础。
1.数据省集中。从税收征管实践多年的经验出发,决策层面将数据生产机和集中存储、备份、查询机统一集中到省一级。省一级有相当充裕的信息化建设经费、可以集中全省的技术精英,搜集全省的业务骨干,可以与省会城市的计算机硬软件公司建立长期合作关系,可以建设全省范围内最可靠的数据机房设施,性能优良的服务器硬件和数据仓库软件、商业智能软件,并建设一支作风过硬,技术过硬的数据分析队伍,完成各业务部门交付的各种数据分析建设项目。比如,省国税局抽调各地市区县信息中心的技术人员、各税种业务部门业务骨干、商业智能软件公司的数据分析专家,共同组成数据分析项目小组,研究讨论后,形成业务需求,完善业务逻辑,编制数据库脚本代码,生成各种预警指标,完善整体预警报表,或形成一整套涉税风险防控机制。
2.信息市抓取。一是以地市或区县为取数范围,从省级集中数据仓库中筛选关联数据,建设各种数据视图。以消费税申报为例,从消费税申报数据表和税务登记表中提取关联信息。二是层级信息抓取。在商业智能软件中,根据多层级的代码表,如税务登记表,行业代码表等等,进行层级信息抓取。如选中一个层级的税务机关,查询其管理的所有下级税务机关的数据。
(二)运用数据仓库和商业智能技术,大幅提升数据分析技术标准
1.建构事实表和维表。在调取数据仓库中的代码表、数据表,生成各种业务视图的基础上,我们把数据表、视图作为物理表。在物理表的基础上建立事实表,反映标准的业务流程。以代码表为基础,建立各种维表,反映单维、多维的复杂业务关系和归属关系。
2.建构数据查询报表。数据查询是直接服务于基层税收管理需要,做好数据检查、反馈、保障数据及时性、保障数据质量的基础。在给定的时间区间、地域范围、限定税收管理人员,或模糊指定纳税人,快捷方便地查询、展现业务信息。比如,查询税务登记、纳税申报、税款征收、发票领用存、税收优惠备案、行政许可和处罚、年度汇算清缴报表等。这些业务数据的查询,能够帮助基层管理人员监控、分析纳税人涉税数据是否及时填报,业务是否按时发生,从而督促纳税人及时完成税收义务,税收政策执行不走样。
3.建构数据审核预警系统。在中央和地方不断推行简政放权、税收政策日新月异的大前提下,做好数据审核预警系统的开发和修订,任务相当紧迫。每年的涉税报表都会有或大或小的修订,业务数据的口径比如税收优惠的上下限等种种参数,都需要经常做更改。这些情况都决定了数据审核预警系统是服务于税收政策和税收征管需要的,随着税收政策的变更,系统的开放完善也是一个长期的过程。对纳税人报送的涉税报表、税务机关内部各业务部门生成的各种业务数据、都需要根据法律法规和政策细则,及时建构和更新数据审核预警系统。
(三)企业所得税年度报表审核预警系统
以企业所得税年报审核预警系统为例,笔者简要说明一种数据分析技术的实现过程。
1.确定业务需求。省局召集各地所得税业务骨干、信息中心技术人员、软件公司数据库专业人员,多次会议,结合上级局下发的业务报表和征管实践中的难题和常见错误,形成第一个版本的业务需求。包括了460个表内、表间的审核规则,涉及30余种业务报表。
2.制定开发方案。信息中心和商业智能软件公司的技术人员一起,制定开发方案。(1)数据库选择。可以选择ORACLE甲骨文数据库,也可以在更高级的VERTICAL数据库的基础上上开发。最终选定普遍运用,与核心征管数据库相衔接的ORACLE,开发人员普遍能够掌握的ORACLE SQL脚本。(2)在数据库中生成审核规则表、审核结果表。业务需求被整合成460个审核规则记录,录入审核规则表,并且在审核规则表中预留存储SQL脚本的大字段。技术人员根据审核规则,编写460个审核脚本,正确运行,对业务报表的表内数据、表间数据开展全面的数据分析,就象“体检”一样,把不符合审核规则的报表数据,提取相关字段,生成一条审核错误记录,插入审核结果表。(3)服务器自动运行审核脚本,生成(刷新)审核结果表。利用审核规则表中的SQL脚本字段,编写指令,把SQL脚本自动调取出来,在每天的20点之后,完整执行,用时三到六小时,完成计算机服务器端的自动审核过程。(4)运用商业智能技术,完成数据分析展现。对审核结果表进行分层级的多维展现,自动统计更新审核错误统计表,既包括省级、地市级、区县级、基层税源管理单位的分级预警审核统计,也包括以税收管理员、纳税人限定的纳税企业报送的具体数据错误查询。
3.完成开发计划。经过业务人员和技术人员的共同努力,对460条审核规则进行了开发,在第一个开发阶段,完成440个规则的脚本编写,对全省数百万户纳税企业填报的年度申报报表,审核出四万余个错误结果,修订了5种审核规则,完善了110个脚本。第一阶段的开发结束后,由业务骨干对审核结果进行会审,对审核结果不符合审核规则的,进一步提出处理意见:脚本不准确的,修改脚本;规则本身不合理的(如未允许零申报),修改规则。
4.试运行和申辩纠错。审核规则和审核结果,本身的正确性,也需要业务部门初审,基层征管税务机关和纳税人的试用、申辩、纠错。具体的业务数据千奇百怪,有些数据要精确到小数点后两位的角分,纳税人填报数据差一分算不算错误?有些业务规则要求填报的数据大于零,审核结果把零申报全部列为错误,必须修订审核规则。在具体的数据分析中,允许错误的发生及错误的修改,反复地调试调整。
5.审核预警功能。经过试用单位的试运行,排除各种规则和脚本的错误后,开始在全省范围内开展审核预警。纳税企业集中在每年的4-5月报送企业所得税汇算清缴年度报表(主表和几十种附表),通过网络平台报表,年报数据进入金税三期省级生产服务器,生产服务器每天利用增量备份机制将数据备份到数据仓库,通过后台的服务器脚本运行机制,自动生成审核结果表,基层税收管理人员根据自动更新的审核结果预警,通知有错误信息的纳税企业,在指定时点之前重新报送。
6.绩效考核功能。审核规则生成的审核结果表,不仅在事中发挥预警监控、督促税收管理员和纳税企业提升数据质量的作用,而且在年报终结时间之后,要发挥执法考核,绩效考核的功能,对未能改正年报错误,未贯彻各项税收优惠政策的基层税务机关和管理人员,要加强过错追责和考核通报,奖勤惩懒,供决策层面参考,改进人事管理工作。
金税三期既是国家金字头信息化工程的重要组成部分,也是国家推行简政放权、依法治国方略的重要支点。税务部门通过金税三期数据分析,有两大促进作用:一方面,落实好税收优惠和便民服务措施,督促纳税企业提高申报质量和改进办税质效;另一方面,在税务机关内部加强税收法律法规的执法问责,压实税收管理责任,全面贯彻依法治税的思想,进一步加强税收征管。为此,税务机关要切实加强金税三期的数据分析,发挥其在税收征管中的积极作用。
武汉市东西湖区国家税务局征纳活动掠影
▲区局联合开展税法宣传。
▲区局召开国税收入过百亿暨第三届亿元企业恳谈会
▲区局智能办税服务厅。
▲区局开展“两学一做”支部主题党日活动。
▲区局组织参加“青春喜迎十九大,不忘初心跟党走”歌唱比赛。
(图/文:区局办公室)