张 翼,陈清晰
(厦门市同安区国家税务局,福建 厦门 361100)
关于税收大数据深度分析应用的探索
张翼,陈清晰
(厦门市同安区国家税务局,福建 厦门 361100)
近年来,随着大数据技术的普遍应用,国税机关结合税收工作也开始涉及大数据处理分析。国税系统将原来的单机报表逐步调整到现在的省局集中处理,实现了信息的充分共享,随之而来的就是数据的激增。在这种情况下,对税收数据进行大数据的深度分析应用,可以为决策者提供数据支撑,辅助决策。
税收;大数据;分析;思考
税收信息系统经过了四个发展时期,逐步趋于完善,分别是单机报表处理、分局集中征收、市局集中征收和省局集中征收处理(上海和西藏除外),目前正处于大数据集中管理这个阶段[1],随着税收数据的激增,其利用度将得到大大的提高。
进行税收大数据的深度分析应用需要满足两个基本条件:一是税收数据在数量上要形成规模,这样才能在大量离散的数据中找到规律;二是大数据的分析技术要成熟,可以对海量数据实现深度的分析应用。结合信息发展的情况来看,这两个条件已经具备,税收大数据实现了省局的高度集中,为深度分析提供了基础的海量数据;大数据分析挖掘技术的快速发展,为税收大数据的深度分析提供了技术保障[2]。因此,税收大数据深度分析应用是税收信息化发展的必然要求。
王向东和王文汇[3]等人指出随着大数据时代的来临,我国现行的“管事制”模式受到了严峻的挑战,逐渐陷入困境,面临转型压力。因此,数据处理成为了现阶段着重要解决的问题,沙亚清等[4]和张社安[5]在大数据的环境下,分别构建了税收应用的新格局和税收共治格局,对大数据分析有借鉴意义。孙开和沈昱池[6]更是将大数据看作是现代税收征管体系构建和完善的助推器,任东飚[7]和白子千[8]等人利用大数据的技术手段对税收管理进行了探析。除此之外,周咏琦[9]还对电子商务的税收管理进行了剖析,在大数据的背景下,不仅许多互联网企业信息都可得到共享,而且可运用大数据思维,对电子商务税收征管通过大数据进行统筹管理。
(一)内涵
大数据分析,不是采用抽样调查法来分析数据,而是分析所有掌握的数据,从中得到有序的、可信的、有效并能被应用主体理解的高级数据处理技术。大数据分析的过程主要包括前期的数据收集,数据整理和后期的定量和定性分析。
税收大数据的分析就是依照科学管理的要求,结合大数据分析技术,实现用数据来分析指导税收工作,通过对海量数据的挖掘,总结现有的税收管理现状和存在的问题,预测发展趋势,为税收管理提供数据支持,改进税收管理工作[10]。
(二)方法
1.数据质量检测分析。数据质量检测分析方法主要有关联分析法、聚类分析法等。关联分析法是根据数据之间的关系,建立数学模型,筛选出异常的数据,可以用在对纳税人申税情况、纳税人入库级次核定、逾期申报和办理税务登记等问题的分析。聚类分析法是对所有得到的数据进行归类,建立分析模型,从而发现有问题的数据,可以用在对纳税人进行年审时等问题的分析。
2.税收收入分析。税收收入分析方法主要有三种,分别是:回归模型预测、时间序列预测和对比分析,这三种方法相结合可以判断纳税人收入的相关增长情况与经济发展的协调关系,指导纳税组织收入工作。
3.宏观经济税收分析。宏观经济税收分析方法主要有三种,分别是弹性分析法、同行业税负比较法、宏观税负分析法,通过这三种宏观层面的分析,可以了解到较长时间内税负的变动情况,分析研究行业税负的不同,更好地把握税收来源情况,为宏观调控提供数据支持。
4.微观税收分析。微观领域的税收分析一般有三种,分别是:单一指标预警法、多项指标预警法和数量经济规模估算法。通过微观领域的税收分析,可以发现存在问题的企业,在税务稽查方面发挥了重要作用。首先是单一指标预警,为税收分析的各项指标设定预警值,然后用被分析企业的各项指标与预警值逐一对比,找到存在问题的数据,也就意味着被调查企业在这项指标所反映的税务方面存在问题。多项指标预警与单一指标预警的方法很相似,同时选取了多项分析指标建立综合分析体系,可以从多方面进行分析,并找到其中的关联性。数量经济规模估算是典型的定量分析法,利用微观经济学的相关数学模型对企业的经营情况进行模拟,估算出企业应缴纳的税额,与企业实际缴纳的税额进行比对,寻找存在偷税漏税情况的企业,但同时这种方法的工作量巨大,需要大数据技术的保障[11]。
(三)税收大数据深度分析的意义
税收大数据深度分析应用主要有四方面的重要意义:一是科学指导税收工作,通过税收大数据的深度分析与应用,可以发现税收工作中存在问题的薄弱环节,从而制定相应的改进措施,将以往靠政策监管的现状改为靠“数据说话”,提高税收管理的科学性。二是加强税源管理,通过微观领域的估算,可以对主要企业的税收总额进行估算,从根源上加强对企业的监控管理,为纳税评估和税务稽查提供基础数据,提高税源管理的精细化。三是加强执法监督,通过税收大数据的深度分析应用,可以及时总结税收工作中的不规范问题,从而实施责任追究,加强执法的规范性,提高税收服务水平。四是加强质量考核,通过税收大数据深度分析应用,可以对数据收集质量、处理质量和执法质量进行量化,使税收管理向数字化的方向发展,为税收评估和工作绩效考核提供依据。
(一)数据挖掘的主要步骤
1.数据收集。海量丰富的数据是进行数据挖掘的首要条件,所以数据收集是数据挖掘的第一步,数据可以从现有的税务系统中直接获得,也可以通过数据仓库获得。
2.数据整理。收集到的数据中,可能存在有问题的数据,所以要简单地进行处理,从而在原始的数据基础上得到更为可信的数据信息,为下一步的工作做准备。
3.数据挖掘。这是最重要的一个环节,要对收集整理后的数据通过各种方法进行深度分析,常用的方法有遗传算法、神经元网络、决策树和OLAP联机分析等。数据挖掘的的工具主要有两类:一类是专用数据挖掘工具,可以针对某个特定的领域充分考虑数据需求的特殊性,提供优化解决方案;另一类是通用数据挖掘工具,可以处理常见的数据类型,提供通用的处理模式,如回归模式、时间序列模式和关联模式等[12~14]。
4.数据挖掘结果评估。进过数据挖掘得到的结论很多,但是有些跟我们要研究的内容不符,所以要对结果进行评估,进而调整数据挖掘模型,重复进行数据挖掘。
5.分析决策。数据挖掘的最终目的是帮助决策者做出决策,决策者可以根据数据挖掘的结果,结合实际情况,做出战略决策。
(二)数据挖掘的主要任务
1.数据总结。数据总结是对数据的一个浓缩整理过程,对数据进行综合描述,将数据库中关联的数据从个体总结到总体层次上,实现对原始数据的总体把握。
2.数据分类。通过分类器(分类函数或者分类模型)将基础数据根据属性分到不同的组中,并找到同组数据的属性模型,利用该模型分析已有的数据并预测新数据将属于哪一组。
3.关联分析。关联分析可以找到一组数据隐藏的关联网,但这种关联度具有不确定性,所以在进行关联描述时要确定置信度,从而反映数据的关联强度[15]。
4.聚类分析。当某些数据通过分类器分不到任何已有的组中时,可以选择聚类分析,将这些数据按照某种相近程度聚类成一类有意义的子集合,每一个子集合的数据属性相似,但不同子集合之间的数据属性相差很大。
税收管理已进入大数据时代,要想在海量数据中寻求规律,为税收管理工作提供数据支撑,就必须掌握科学的分析方法,再结合数据挖掘技术和大数据思维模式,实现用数据说话,从根本上加强税源管理和税务监督。
[1]王海森.关于税收数据深度分析应用的思考[J].信息技术与信息化,2007,(8):25-28.
[2]和家凤,何少武.大数据时代的纳税评估信息采集模式[J].财经理论与实践,2015,(3):98-98.
[3]王向东,王文汇,王再堂.大数据时代下我国税收征管模式转型的机遇与挑战[J].当代经济研究,2014,(8):92-96.
[5]张社安.依托大数据,构建税收共治格局[N].中国税务报,2016-03-23.
[6]孙开,沈昱池.大数据——构建现代税收征管体系的推进器[J].税务研究,2015,(1):96-99.
[7]任东飚,费铭海,袁明昌.税收数据在大数据中的利用探析[J].税务研究,2015,(10):25-28.
[8]白子千,李晶晶,杜嘉.试析大数据时代的税收管理[J].企业改革与管理,2016,(4):11.
[9]周咏琦.大数据对电子商务税收征管的影响[J].经营与管理,2016,(4):15-17.
[10]李渊.大数据时代强化税源管理的思考[J].经济论坛,2016,(3):123-128.
[11]Power DJ.Using“Big Data”for analytics and decision support[J].Journal of Decision Systems,2014,(2):222-228.
[12]夏琰.基于数据挖掘技术的税务数据仓库应用平台建设[D].杭州:浙江工业大学,2012.
[13]许艺.基于数据挖掘的零散税收预测研究[D].武汉:武汉理工大学,2013.
[14]张升文,张少仲.数据仓库、数据挖掘和OLAP分析及其应用实例[J].危机发展,2002,(1):22-23.
[15]刘以堂,张述成.关联规则在税收征管中的应用[J].科技创新导报,2012,(17):27-28.
[责任编辑陈丽敏]
F810.42
A
1673-291X(2016)22-0073-02
2016-07-16
张翼(1966-),男,福建惠安人,局长,工程师,硕士,从事大数据开发与应用、税收理论、税收筹划研究;陈清晰(1974-),男,福建厦门人,政策法规科科长,硕士,从事大数据开发与应用、税收理论研究。