【摘 要】 随着移动互联网不断发展,大数据时代的到来,信息量不断增加,利用数据挖掘技术从大数据中实现对个人、企业有意义的信息挖掘具有重要的现实意义。本文介绍了数据挖掘技术的逻辑,结合我国现在税务管理发展存在的问题,对数据挖掘技术应用于税务管理的可行性进行分析。同时根据我国在税务管理发展过程中数据挖掘技术应用的实际情况提出了相应的对策与建议。
【关键词】 数据挖掘 大数据 税收管理
一、数据挖掘的逻辑
数据挖掘的逻辑结构是在数据挖掘过程中,首先对数据进行預处理,然后实现数据挖掘,并通过相应的算法对结果进行评估和表达,然后提取有价值的信息。
一般来说,数据挖掘的数据分析过程分为五个步骤:(1)数据准备。在此阶段,用户将从操作环境中提取和集成数据以解决语义歧义问题。(2)数据选择和预分析。对用户的历史行为数据和当前操作数据进行集成,删除无用数据并对其进行预处理以进行数据挖掘。(3)数据挖掘。在此阶段,综合使用四种数据挖掘方法来分析预处理数据并提取相关特征和规则。(4)表达。捕获的特征和规则以易于理解和观察的方式反映到系统中。(5)评价。可以评估数据挖掘后的情况。如果可以有效地评估它,则表明它是成功的。否则,可以重复上述过程直到获得满意的结果。
二、大数据时代我国税务管理中存在的问题
1. 纳税人数据收集意识淡薄。在大数据时代,经济社会的信息化水平高度发展,这虽然促进纳税人的生产经营活动,但是部分企业对税收数据信息收集的重要性的认识仍然不够,从而使得企业的财务管理部门对税收数据收集和组织意识不强,而且没有足够的税收数据统计、分析能力,从而对政府的税收管理能力提出挑战。
2. 专业从事税务管理人员的缺失。当今时代最缺乏的资源是人才,当今我国社会的高速发展使得对各种专业人才的需求力度加大。但是目前我国专业从事税务管理的人员数量与我国经济发展速度不匹配,从而不能有效、及时地贯彻最新政策。同时,信息化时代的发展,要求从事税务管理的人员要不断的学习新知识才能跟得上时代发展的要求。但是目前我国税务管理人员素质参差不齐,不能完全满足这一要求。
三、数据挖掘技术应用于税收征管的可行性分析
数据挖掘是在人工智能的基础上不断发展起来的。数据挖掘系统中使用的技术越多,结果就越准确,从而对问题的分析就越透彻,就越能抓住问题的本质和关键。然而,无论采用哪种技术,数据挖掘分析方法都可以在功能上分为四种方法:关联分析,序列模式分析,聚类分析和分类分析。
1. 关联分析。关联分析的主要目的是挖掘潜藏在数据之间未被发现的关系。在给定一组项目和记录集后,通过分析记录集来推断项目之间的相关性。金税工程和综合征管软件中的每个应用模块都有相应的管理关系,但不能直接相互间的关联比较。我们可以根据征管业务的不同需求,针对异常发票缴销,小规模纳税人备案状况,纳税人仓储类审批,纳税人逾期申报和办理税务登记等问题, 利用不同的工具软件和技术手段,将两组数据进行对比,从而增强对纳税人的管控能力。
2. 序列模式分析。序列模式分析的主要目的也是挖掘数据之间的潜在关系,但序列模式分析侧重于分析数据的前后关系。在做出决策之前,决策者通常需要从历史数据中了解相关对象的规律和趋势,并对未来做出预测。
3. 聚类分析。聚类分析的输入集是一组未标记的记录,即此时输入记录未被分类。目的是根据集群分析工具定义规则合理划分记录集,并以显式或隐式的方式描述不同的层次。由于聚类分析法可以采用不同的算法,因此可以将同一组记录划分为不同的类别。
4. 分类分析。分类分析以一组记录和一组标记作为假设。在分类分析时,首先为每个记录分配一个标记,即根据标记对记录进行分类,然后检测这些标记的记录以描述这些记录的特征。
四、对策与建议
为了更好地将数据挖掘技术应用到税收管理工作中,除了现有的各项物质和技术条件外,在大数据时代我国税务管理的发展应当从以下几个方向开展,以期发现各种税务数据深度蕴藏的价值信息,更好的支持税务管理工作。
1.加强数据质量管理,搭建数据挖掘平台。要想运用数据挖掘技术深化税务管理的改革与发展,就要保证被挖掘数据的真实性和完整性。针对我国税收征管信息系统数据库中现有部分数据不全不实的现象,要加强对数据质量的管理,为税务管理工作搭建有效的数据挖掘平台。
2.设计新型税收管理体系,使数据挖掘流程标准化。现行税收征管系统已经很难满足信息使用者对税务信息的一般使用要求。信息使用者往往需要对可以方便获得的税收信息进行再次加工和更深层次的挖掘。此外,由于不同的信息使用者之间的信息资源不能共享,造成了资源的浪费。因此从社会经济的角度出发,大数据时代的税务管理的发展应该要考虑到使用者对于税务信息的需求,在税收分析模块中引入适当的数据挖掘流程。
3.增加数据挖掘模块,完善税收信息系统建设。当前我国建设完成并推广使用的金税工程系统和税收征管信息系统均着眼于税收收入的征管监控,金税三期决策支持子系统中有关税收分析的模块有待加强。为了加强税收管理工作,在我国税收信息系统的不断完善和发展的过程中,包括税收分析在内的各个管理环节终将成为税收信息系统的重要组成部分。
从税收征管的角度出发,为方便税收征管工作人员,提高其工作效率,降低税收征管工作成本,可以在金税三期的管理决策平台中嵌入数据挖掘的子模块,装入适当的数据挖掘算法,需要时可调用其进行数据处理和管理。将数据挖掘算法固化到税收征管系统的模块中还有助于进一步标准化税收征管工作中的数据挖掘流程。
【参考文献】
[1] 朱林,周钰桐.大数据时代下企业税务管理工作创新研究[J].金融经济,2018(20):201-202.
[2] 陈星潼.区块链技术在税务管理中的路径分析[J].上海管理科学,2018,40(06):105-109.
[3] 邵铁如.试论企业税务管理中存在的问题及优化建议[J].现代经济信息,2017(23):208.
[4] 天津市地方税务局课题组,于众,陈杰,刘颖,张磊,于学深.数据挖掘方法在税收风险管理中的应用研究综述[J].天津经济,2016(06):51-60.
作者简介:陈静宇(1997—),男,江苏盱眙人,安徽大学经济学院硕士。