◆张 玮
内容提要:互联网和移动互联网络、终端、应用的“三浪”叠加,使得互联网数据呈现前所未有的爆发式增长,以“数据人”为驱动的自然人税收治理新时代已经来临。在2018年版《中华人民共和国个人所得税法》全面实施的大背景下,文章基于大数据思维变革带来的自然人税收治理新机遇,阐述了关于自然人经济行为痕迹追踪的涉税数据获取、数据整理与数据集成。在此基础上,从自然人风险管理、税务网站运营、税收宣传、涉税服务等方面,论证以自然人涉税数据风险管理为核心提升自然人纳税遵从。最后,文章强调将尊重自然人涉税数据隐私权作为数据利用的底线,从而实现数据红利与公民隐私权利平衡。
随着全球新一轮科技变革集中迸发,互联网与移动互联网络、终端、应用“三浪”叠加启动新经济,改变了人们的社会分工、职业形态、消费习惯与生活场景,每一个自然人被重新解构,互联网数据量呈现出前所未有的爆发式增长。数据是“一个或一组反映一个或一些特定概念的值”,大数据则定义为“对某个数据(或与其他数据联合起来)进行分析并从中获取其含义和提供语境,最终形成有用信息的数据集合”。对于自然人个体而言,其收入、支出、消费、投资等各种经济行为正在被用户商家、第三方机构、政府职能部门通过互联网和大数据追踪技术所记录、采集与锁定,每一个社会中的自然人已经逐步演变成“数据人”——这并非是人自身的改变,而是通过对个体的行为轨迹与行为特征数据不断抓取整合,最终映射还原其经济生活状态。大数据的5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)、Veracity(真实性),为推进自然人税收征管带来了新的机遇与挑战。
实施税收大数据战略不仅有助于对海量数据的占有与存储,还有助于对数据进行专业化分析后应用于实践,由此实现涉税数据的“增值”。自然人涉税数据涉及数亿计的纳税人,来源广泛、组成复杂,数据量巨大,同时自然人涉税数据是反映经济社会运转最为直接、粒度最细、覆盖最全面的数据,与其他第三方数据进行匹配关联后能够产生巨大的经济价值与社会价值。因此,深度挖掘利用自然人涉税数据,进而剖析自然人的从业状况、人口分布与流动、收入水平与差距等,将自然人涉税数据作为税收治理实践的重要支撑,有助于及时准确回应社会各界的普遍关切,提高社会的整体治理能力;有助于准确反映经济运行和国民收入分配情况,促进国家宏观经济科学决策;有助于真实反映社会管理水平,提高公共产品的供给效率与合意性。
根据现代税收治理理念,公民纳税是为了寻求更大的安全、自由与保障。自然人征纳税将更加体现出一种资源交换的关系与互利互让的行为,实质上就是属于政府和纳税人之间委托代理的契约关系。自然人作为推动经济发展的微观经济主体和税收增长的最终动力,既是税收管理的对象,必须依法遵从纳税,也理应通过提升纳税遵从度获得“以税授信”与差别服务待遇,实现个人社会权益最大化。自然人税收的征纳双方不仅是大数据的消费者与使用者,而且可以实际参与到数据信息的内容创造、需求定制、管理设计中,实现自然人税收治理的最大“公约数”。一方面,税务部门可以与自然人纳税人签订合作协议,纳税人主动提供完整的涉税数据信息,税务部门及时准确反馈涉税风险,降低纳税人因税法不遵从而造成的经济或名誉损失,用合作共赢代替相互对立;另一方面,按照互联网平台模式建立涉税数据服务云平台与应用广场,将纳税人作为税务部门的“用户”,向纳税人提供更加便利可靠的数据服务。
在自然人税收治理中衡量税收职能作用,应放眼更长时间轴,以更开放的理念、更包容的方式推进税收共治。构建税务部门、第三方部门、自然人纳税人之间的连通共享机制,打破部门间数据信息壁垒,建立健全涉税脱敏数据对外开放机制,打造涉税数据“生态圈”;纵向形成税务系统内部上下联动机制,聚焦涉税基础数据资源的智能获取、自动集成和关联分析,构建自然人涉税行为数据库,搭建自然人纳税人全维度、全生命周期的数据体系。通过建立统一共享的“数据中台”(自然人涉税数据资源平台)、一体化“数据语言”(数据定义与标准),促使税务主管部门向公共服务产业生态圈开放,不断释放自然人涉税数据在税收共治大格局中的价值红利,形成全社会协税护税的强大合力。
随着“万物智能”时代的全面开启,每个人成为组成这个世界的具体微粒,而不是作为一个标签代表的群体。一方面,个体时间与需求被进一步切分;另一方面,识别个体的成本将大幅降低。以建立在个体基础上的平均值作为判断依据,可能在大数据面前失去价值,而针对每一个“单体”的个性化分析和判断,将成为社会发展的新趋势。越来越多的互联网平台通过追踪“数据人”在互联网上留下的行为轨迹,来分析个体兴趣关注点以及平台运营效果,从而实现“所得即所需”——生产端到消费端精准的供需匹配。税务部门可以借鉴上述平台模式,通过平台赋能拓展自然人涉税数据获取范围与途径,更加注重自然人个体全面数据,而不是样本分析;更加注重自然人涉税数据之间的相关关系,而不是因果关系;更加注重包括自然人经济交易数据和交互数据集在内的所有数据集,实现“人—经济数据—税收征管”的模式重构。
税务部门掌握纳税人经济行为,是税收征管、纳税服务、稽查评估乃至税收政策制定的原点,它可以带动整个税收管理流程的有效运转,但长期以来,自然人税收管理粗放有余,精细化不足。税务部门传统掌握自然人涉税行为的方式,更多依据自然人自行纳税申报与付款方代扣代缴,对于自然人个体的实际收入与成本费用难以把握,更无法准确获知自然人纳税人在不同时段、不同地点所发生的不同类别的经济行为,从获得涉税数据到实施征管应对,也存在很强的滞后性,无法真正实现自然人税收治理信息现代化。随着新的个人所得税法全面实施,除了基本减除费用提高和税基税率调整优惠外,个人所得税专项附加扣除政策落地实施,将进一步减轻纳税人税收负担、增加可支配收入,进一步发挥个人所得税收入再分配的调节作用。同时,个人所得税新政也对自然人经济行为进行有效记录与分析,促使个人所得税税收地位与经济发展状态更加匹配,对解决税收收入流失率高、征管漏洞缺口大等问题提出更高要求。
图1 2018年6月相比2017年12月互联网各领域用户规模及增速
用户在网络上发生的任何行为都会留下数据痕迹,行为追踪(Behavior Tracking)就是通过对其网上行为痕迹的数据进行采集、量化与匹配。在“内容数据+算法推送”的环境下,平台搜索引擎模式已经开始向算法推送模式过渡。例如,当个人登录互联网后,平台会推送与之前浏览行为高度相关的标签条目,个体实时化、个性化、碎片化的需求被快速传递到生产端,使这些具体的颗粒状需求得到充分满足。将自然人纳税人集成演变为“数据人”,可以将自然人曾经的经济行为与个人数据身份识别信息,如网络ID账号、注册邮箱、移动终端号码等相关联,通过海量的涉税经济行为数据抓取,更有效地搜寻、了解特定目标人,对自然人纳税人进行痕迹追踪与精准定位。此外,税务部门可以通过基于定位的映射数据,抽取特定个人用户地理位置分享、浏览行为、图像文本文件传输等交互数据,追踪其经济行为周期与取得收入方式的特殊之处。
用户画像技术(User Profile)通过获取用户行为痕迹主要信息数据,准确分析出其社会属性、收入水平、消费习惯以及行为偏好,帮助平台场景捕捉“你是谁、你在哪里、你在干什么”,进行特征化、标签化的“数据人”画像,完成所谓“完整个人化”的数据整理。税务部门可以凭借用户画像技术汇集自然人基础数据、收入数据、投资数据、财产数据、纳税数据、信用等级、风险等级和专项扣除项目等多个成像要素,对静态的、历史的关系数据库进行结构化算法处理,分析特定个体日常收入、支出的模式与渠道,从而掌握其特定的经济行为,甚至预测到未来的经济行为发展动向,使税务部门可以对自然人税收风险的监控更加精准,使税收风险管理与纳税服务更加有的放失。
大数据的核心要点在于数据集成。通过从不同网站数据表中识别出有利用价值的数据,对零散的、没有要素化的数字化信息进行数据抽取(Structured Data Extraction)、信息集成(Information Integration)与观点挖掘(Opinion Mining),进行数据标准化(Data Standardization)后集成入库。因此,除了用法律语言对税收要素进行法律定义之外,也可以用数据语言对税收要素进行另一维度的定义。税务部门通过数据集成对自然人登记信息、扣缴申报信息、自行申报信息、备案信息、评估(稽查)信息、所在单位纳税信息等涉税数据全面要素化,将纳税人自行申报、依职权采集、第三方交换、互联网数据获取等不同来源、格式、特性的数据在逻辑上与物理上进行有机集成,维护数据源整体上的要素一致性。在此基础上,对自然人涉税数据分级分类管理,归类识别出高收入高净值纳税人与一般纳税人、资本(资产)投资者与交易者、单一来源与多元收入者、生产经营者与劳务提供者、居民纳税人与非居民纳税人等不同类型,为各层级税务部门与第三方机构提供自然人分级分类数据共享平台。
图2 自然人经济行为痕迹追踪涉税数据利用管理流程
新个人所得税法与个人所得税专项附加扣除办法实施对自然人税收管理提出更高的要求。在“数据人”时代,一旦实现对自然人涉税经济行为的痕迹追踪,对获取的数据信息进行深度分析利用,就能够进行有效的自然人税收风险管理,税务部门的征管与服务都将成为“有源之水”,困扰多年的粗放式自然人税收管理将实现逐步转变。
在税收管理实践中,可以将基于数据集成的风险画像技术(The Computer-based Risk Profiling),运用到自然人税收管理及其风险评估应对、利益相关方(第三方)参与等方面,通过建立朔源体系对自然人税收风险管理进行精准安排。①通过采集自然人纳税人身份数据,对其现时的经济行为网络痕迹数据进行追踪,分析自然人经济行为周期,进行自动风险分析;②以纳税人风险画像整体信息为基础,归集其行为特征,对潜在的不遵从情况进行标准化评估,评估哪些为高遵从度纳税人,哪些为较低遵从度纳税人和不遵从纳税人;③运用数据挖掘等技术揭示变化趋势,结合其股权生命周期、大额资产交易、跨境交易等风险特征分类,预判其大概率涉税行为动向,以及重点人群重点环节易发生的涉税风险点;④集成税收业务管理系统多部门遵从规则,对自然人纳税合规历史进行综合分析,在此基础之上制定出针对性策略,实现“数据人”的税收遵从度召唤与定向唤醒。
图3 纳税人税收风险管理流程
过去对于税务门户网站的运营,更多的是文字与图片内容的更新维护,几乎完全是税务部门“自娱自乐”式管理。在“数据人”的环境中,税务部门可以根据自然人纳税人在门户网站行为痕迹的追踪,有针对性地优化其网站营运。例如通过即时追踪自然人纳税人抓取每个时点从哪些平台和页面跳转到网站、点击了哪些页面、浏览了哪些条目、集中停留在哪些模块等,据此动态调整网站布局、页面规划、模块运营以及信息推送等,并且及时将相关信息反馈到各个部门,从而让税务门户网站信息投放更为精准,实现税收征管与纳税服务有效联动。
随着自然人的经济行为痕迹越来越多地体现和记录于互联网上,税收宣传效果也变得更具有可追溯性和更加精准。例如,通过线上的搜索量,来判断线下税收政策的宣传效果、执行效果与社会效应,从而可以优化宣传资源配置,将传统的“一对多”变成更具针对性的“一对一”,为纳税人“量身定制”政策宣传。一方面,税务部门推送信息时,以共性内容为基础,同时凸显个性内容,进行纳税人差别化宣传;另一方面,纳税人根据自身特点,选择性接受相关宣传信息,提高宣传效果实用性。通过强化“微终端”的涉税宣传力度,强调互动性交流,建立具有大数据时代特征的纳税人利益诉求表达机制。
互联网个体实时化、个性化、碎片化的需求偏好数据可以成为有效设计与生产的切入口,使平台对消费需求的洞察与对市场的理解表现出精准化。由此借鉴,大数据环境下的自然人涉税服务可以有针对性地利用互联网平台,汇集海量需求反馈数据,通过数据的可视化来判定分析不同纳税人的微粒化需求。根据纳税人性质、类型、风险管理等要求,采用点对点、双向交互、专用线路、数字认证等方式,有的放矢地优化涉税服务质效,提升纳税人遵从度。
在“数据人”时代,一极是作为大数据掌控者的政府、企业与第三方部门,另一极则是普通的网络用户,而普通用户既没有相关技术,也缺乏相关设备来利用和保护这些数据信息,自然人涉税数据信息的隐私权将会受到严重威胁。自然人税收治理虽然能够搭上时代的便车,但如果自然人的数据隐私权不被尊重,它们将成为纳税人心中的“蝗虫”,阻挡在纳税人与全社会公民群体的“心门”之外,自然人涉税合作遵从度从长远来看,可能会不升反降。那么,在大数据环境下,政府、第三方部门、扣缴义务人与自然人之间关于安全和自由的博弈如何平衡?究竟是要保有自己的隐私,还是享受技术所带来的便利,国家在制定法律和政策的时候,也应做出总体性的权衡。
实现自然人涉税数据的成熟运用,既要充分发挥出其经济价值和社会价值、释放数据红利,又要注重体现法治政府建设的时代要求、切实维护公民权益。一是搭建明确、完整而一致的法律框架。在大数据时代,个人意图与主观过错的边界,已经变得越来越模糊。数据的实际占有者与使用者之间的界限也越来越难以判断,必须将自律与他律两方面相结合。一方面,通过对税务部门有效的内部控制以消除公权力的滥用和不作为;另一方面,确保自然人纳税人明确知悉税法并且自身具有遵从意愿,以此在创新与保护、技术与隐私之间实现张力的平衡。二是构建安全可控的自然人涉税数据开放体系。建立与开放标准化、普遍化、公共网方式的自然人涉税脱敏数据查询系统,可以借鉴OECD国家经验,由税务部门与相关机构签订数据交换协议,在需求互动、工具支持、数据共享、数据传播等方面提供可靠的制度保障。明确数据开放的权利和义务,界定数据开放的范围和责任,规定开放数据的许可权属和应用权益,充分保护个人重要信息不被滥用,保障公民的知情权、监督权与增值利用权。三是鼓励提倡第三方机构与企业的有序参与。鼓励科研机构、代理机构、第三方产品服务商等参与到自然人涉税数据与其他经济社会领域大数据的关联性研究中来,通过有效分析预测社会经济运行状况、发展趋势、政策效应、价值洼地等,提高涉税数据的公共利用水平,逐步提升自然人纳税人的税收遵从度。