摘要:该文探讨了采用智慧专卖管理应用助手,通过融合卷烟投放策略数据、零售户信息、真烟外流数据、订单信息等数据,依据基本的概率理论和贝叶斯定理构建不同级别预警策略的方法。同时,基于真烟异流历史数据、零售户信息、预警信息等数据,该文分析了对零售户进行数字画像并通过星级评估策略量化零售户发生真烟异流风险的可行性。基于智慧专卖管理应用助手对多维度数据的综合、分析,可以为真烟异流的发生提供预测和依据,达到事前监管、精准查打的目的。
关键词:数据驱动;烟草专卖管理应用助手;真烟异流;预警策略
doi:10.3969/J.ISSN.1672-7274.2024.09.055
中图分类号:TP 3;TS 4 文献标志码:A 文章编码:1672-7274(2024)09-0-04
Research on Multidimensional Genuine Cigarette Diversion Warning Based on Data-Driven Approach
LI Feng1, ZHANG Yizhong1, HUANG Zhongjie1, CHEN Chi1, LIN Guanjun2
(1. Fujian Tobacco Corporation Sanming Branch, Sanming 365000, China;
2. School of Information Engineering, Sanming University, Sanming 365004, China)
Abstract: This paper discusses the method of constructing warning strategies at different levels by using a smart monopoly management application assistant, integrating data such as cigarette distribution strategy, retailer information, genuine cigarette outflow data, and order information, based on basic probability theory and Bayes' theorem. Meanwhile, based on historical data of genuine cigarette diversion, retailer information, and warning information, this paper discusses the feasibility of creating a "digital portrait" of tobacco retailers and quantifying the risk of genuine cigarette diversion by retailers through a star-rating assessment strategy. According to the comprehensive and analytical application of multi-dimensional data by the smart monopoly management application assistant, it can provide prediction and basis for the occurrence of genuine cigarette diversion, achieving the purpose of ex-ante regulation and precise investigation.
Keywords: data-driven; tobacco monopoly management application assistant; genuine cigarette diversion; early warning strategy"
1 研究背景
在烟草行业数字化转型的大背景下,构建数字化、智能化的监管体系很好地契合了当前烟草销售市场对高效专卖管理、精准查打违法、合理资源布局的需求[1,2]。根据专卖管理“六个体系”建设要求,提升信息应用能力、增加线索研判准度、提高违法查处效率是当前专卖管理工作的重心。为促使专卖管理工作向智能化、快速响应和精准化转变,福建三明市局计划在现有专卖“三统一”系统的基础上建设智慧专卖管理应用助手系统,以专卖管理信息化、数字化为抓手,抛弃传统的“扛枪巡逻”和“经验式”监管,构建“查打一体”的专卖数字监管模型,让专管人员带着准确信息“上市场”,实现精准监管,为涉烟案件尤其是真烟异流案件的查办实现了从手工到智能、从模糊到精准,从低效到高效的转变。
本文基于智慧专卖管理应用助手系统,通过汇集卷烟投放策略数据、零售户信息、真烟外流数据、订单信息等数据进行关联、综合和分析,设置不同级别的预警策略,并结合零售户信息和历史数据,构建零售户的多维度数字画像,为真烟异流的发生提供预测,即可以实现事前的有效监管和防治,也可以为事中查处提供依据,从而有效遏制真烟异流的发生。
2 真烟异流的危害
真烟的异常流动对我国烟草市场专卖专营制度体系造成严重冲击[3]。首先,真烟异常流通违反了《烟草专卖法》及实施条例的相关规定。其次,真烟的异常流动破坏了烟草专卖市场法律秩序。例如,异流的发生使得不法商贩可以人为炒作产生“紧俏产品”或“需求洼地”,成为个别人的牟利手段,损害了广大零售户的利益,扰乱了市场秩序。再次,真烟的异常流动会影响经营决策。异流的卷烟可能造成需求分化加剧,导致紧俏品牌广泛流通,而部分品牌甚至无法正常落地销售,从而影响品牌的营销决策,导致卷烟市场畸形发展。
3 治理难点与治理策略
3.1 真烟异流主要面临的治理难点
(1)隐蔽性强,难以发觉。基于现有数据,涉及真烟异流的零售户大多先前有过真烟异流的前科,且有不少是经营时间较长的资深零售户[4]。此类零售户或因之前的处罚经历或因长时间经营,往往对烟草专卖法律法规有所了解,具备一定的反侦查能力,使得真烟异流行为更加隐秘。还有位于偏远乡镇的零售户,由于法制意识薄弱,又缺乏规范经营意识,遇到不法分子前去收购卷烟,不拒绝、不汇报,在收购量少的情况下,则难以被专管人员关注和发现。此外,还存在持有烟草专卖许可证的人是亲属或朋友关系,在一方销售需求旺盛的情况下,另一方将其烟草转移至需求旺盛这一方,此种“串货”现象也具有隐匿性。
(2)异流形式多,难以查处。近年来真烟异流多呈现多批次、少批量的“化整为零”方式。在利益驱动下,不法分子可以随时随地、以多次购买的方式进行卷烟的非法收购。同时,不法分子的贩售方式也多种多样,可以涉及自运、异地携带等,在加上烟草的分散式存放,在无确切情报线索的情况下专管人员难以做到精准出击、及时查处。
(3)案情复杂,举证困难。在真烟异流过程中,不法分子往往通过自运、托运等多种方式,涉及多种交通、物流渠道等诸多运输单位,在查办此类案件的过程中,专管人员由于跨地域,会遇到执法权限、管辖权限等问题,存在调查难、取证难等情况。此外,如果遇到真烟异流动涉案零售户不承认、不配合,甚至阻扰调查的情形,这将导致调查人员陷入被动局面,极大地增加调查难度。
3.2 预警策略和客户画像
为应对以上问题,我们依托智慧专卖管理应用助手,采用基于数据驱动的预警策略,通过对数据进行关联和综合,分析出预警的可能性(初级预警);再依据具体的销售数据和规则提升预警等级(中级预警);同时,结合不同维度的数据,包括客户信息数据和历史数据等,并根据不同级别的预警,为客户生成数字画像,从中揭示出真烟异流端倪,为违法线索和规律的发现提供依据。
预警的级别分为初级、中级和高级。其中,初级预警分为策略预警和订单预警;中级预警为销售预警。初级和中级预警均为数据驱动式的预警策略,是基于数据关联分析和多点碰撞产生的预判。而高级预警依据的是固定的,基于经验、规则和线索,往往预示着真烟异流的发生。以下将着重对初级和中级预警策略进行描述和论证。
策略预警:针对具体的烟草品牌。依据经验分析,“之前出现过异流的品牌很可能存在再次异流的风险”。依据条件概率公式:
(1)
式中,表示在事件B发生的情况下事件A发生的概率;表示事件A和B同时发生的概率;表示事件B发生的概率。假设在某卷烟品牌发生异流的场景中,A事件表示某品牌卷烟发生异流,B事件表示某品牌投放市场。所以某卷烟品牌投放市场并且发生异流的概率依据式(1)可为P(异流|品牌)=P(品牌,异流)/P(品牌)。式中,P(异流|品牌)为在某品牌投放市场的情况下,该品牌发生异流的概率;P(品牌)是该品牌投放市场的概率;P(品牌,异流)是该品牌发生异流和该品牌投放市场这两件事情同时发生的概率。所以依据条件概率公式和历史数据,该品牌投放且发生异流的数据可以通过投放市场的品牌和异流品牌取并集得到(品牌投放品牌发生异流),而只要该品牌投放市场,那么P(品牌)=1,所以,我们把投放市场的品牌和异流品牌取并集并得到异流数量最多的前10个品牌,将它们认定为风险品牌,即存在较大概率发生异流的品牌,并生成一条初级预警。
订单预警:针对的是零售户。依据是贝叶斯定理,其可以表述为“支持某项属性的事件发生得愈多,则该属性成立的可能性就愈大”。在这里,我们把“某项属性的事件”定义为某个零售户发生某品牌真烟异流的事件。那么,基于贝叶斯推理,该零售户之前发生真烟异流的记录越多,同时,该品牌在近期发生异流的记录也越多,我们就可以推断该品牌在该零售户处发生异流的可能性则越大。依据贝叶斯公式:
(2)
式中,A事件表示某品牌在零售户处发生异流;B事件表示零售户预定了某品牌;那么零售户处发生该品牌异流的概率依据贝叶斯公式有概率P(异流|品牌)=P(品牌|异流)×P(异流)/P(品牌)。式中,P(品牌)是该品牌投放市场的概率;P(异流)为该品牌发生真烟异流的概率;而P(品牌|异流)是在a处发生真烟异流的情况下,恰好是这个品牌的概率。所以,根据贝叶斯公式,对于给定某品牌,其发生异流的概率为异流发生恰好是该品牌的概率P(品牌|异流)乘以P(异流)发生的概率,再除以该品牌投放的概率P(品牌)。如果零售户a订购了该品牌,则有P(品牌)=1,其发生异流的概率P(异流|品牌)就为P(品牌|异流)×P(异流)。因此,我们需要依据已有信息获取P(品牌|异流)和P(异流)。对于具体发生异流的品牌,即P(品牌|异流),我们可以得到零售户订单信息和存在发生异流风险的品牌信息,通过对订单信息上的品牌和有异流风险的品牌取并集,得到订单信息上存在异流风险的品牌,即P(品牌|异流),那么依据公式,我们就可以得出:该零售户之前发生异流的记录越多,则P(异流)越大,所以对于该品牌零售户a处发生异流的风险就大。
针对所有零售户,依据经验,“之前发生过异流的零售户很可能存在再次异流的风险”。所以,我们首先从数据库中拿到之前存在异流记录的零售户信息,并对其异流次数进行排序。其次,我们再对零售户的档位信息进行排序,取前3档的零售户信息。再次,我们将前3档的零售户信息与异流记录次数最多的零售户信息取并集,得到档位最高且存在最多异流记录的3个零售户信息。最后,根据得到的订单信息上存在异流风险的品牌和存在最多异流记录的前3档零售户信息,我们再取一次交集,就得到了之前存在异流的高档位零售户所订购的存在异流风险的品牌信息。基于这些零售户的信息,就可以生成一条订单预警,标明可能存在异流风险的零售户所在的地域。
由于策略预警和订单预警都是基于历史数据所推导出的“后验概率”,仅作为发生异流的可能性推断,所以我们还是将其归为初级预警的级别。我们还需要经验规则作为“先验知识”,对策略预警和订单预警的预测可能性进行事实补充。所以,我们制定了销售预警策略。
销售预警:该预警是基于实时数据,针对具体的零售户。通过外部系统-E福通数据,我们可以获取同一经营区域的零售户销售数据并根据销售量和时间判断是否存在某2小时内的销售量超过某一阈值(如50条)。如果超过了,我们则认为可能存在外流倾向,则生成一条销售预警。销售预警为中级预警,其所依赖的是当下实时的数据,与初级的策略预警和订单预警相比,提供给专管人员更具可能性的真烟外流预警线索。
高级预警:基于经验、规则和线下的情报线索,比如,“无烟草专卖品准运证进行烟草专卖品运输”等,其出现常预示着违法行为的发生。
客户数字画像基于零售户信息、历史数据和以上描述的预警策略,从多维度对零售户信息特征进行标签化表征,并结合传统的零售户分类方法,更好地了解和监管零售户群体分布,同时有助于将涉及真烟异流的影响因素剥离出来,更好地为真烟异流的发现提供依据[5]。传统的零售户分类方法通过以下标准将零售户分为以下四类:
(1)黑:发生过违法违规的零售户。
(2)灰:有线索指向涉嫌与烟贩子有接触和WiUF4t/7D0o4pFz/WfGQr+4GnO+AsokO1H7waPTwcrI=交流的零售户。
(3)黄:存在潜在危险的零售户。
(4)白:正常合法经营的零售户。
基于以上分类,我们通过零售户数字画像对其进行更细粒度的分类,并从以下三个维度进行构建。
(1)零售户身份信息维度。依据零售户个人信息,检查零售户是否存在历史异流记录,即是否是“黑”户,并进行重点关注。同时,可以检查持证人是否存在亲属关系,为后期出现“串货”等违法违规情况提供线索和预警依据。此外,整理和维护零售户的档位信息有助于有序地控制大户货源供应,严格监管大户的增长趋势,避免大户利用其资金、规模优势人为制造紧俏品牌的“需求洼地”,扰乱了市场秩序。
(2)零售户经营地址信息维度。通过收集和整理零售户地址信息,可以为合理布局零售户数量和分布提供数据支撑。通过借助地图将零售户地理位置信息在地图上进行标注,可以直观地可视化禁入区(学校周边)、成长区(可增加零售店区域)、饱和区(考虑减少零售点区域)和平衡区域,为有效的分析市场需求提供依据。
(3)预警信息的维度。针对“灰”“黄”零售户,通过历史异流数据、订单预警和销售预警数据“圈出”存在真烟异流风险的零售户。基于订单预警,我们可以获得存在某品牌真烟异流风险的零售户;通过销售预警,我们也可以得到具有真烟异流风险的零售户信息;结合订单预警和销售预警,我们就可以筛选出更具异流风险的零售户,从而加强监管。
基于零售户数字画像,我们就可以针对零售户不同的维度,引入细粒度的“星级外流风险评估”机制,来量化零售户发生真烟异流的风险级别。对于存在历史异流记录的“黑”户,依据记录的多少给予加两星或三星的操作;存在“夫妻”“父子/女”“母子/女”等近亲属关系,加一星;存在订单预警的,加一星;存在销售预警的,加两星;通过标记星级风险,并结合用户的地域信息,我们就可以十分便利的了解存在异流风险的零售户的区域分布,并基于零售户的星级数量和风险类别来制定不同级别的监管策略,制定走访计划,便于有序、有针对性地对零售户进行监管和走访,达到合理有效的监管目的。基于数字画像的真烟外流风险评估机制的工作流程如图1所示。
4 结束语
综上所述,烟草智慧专卖管理应用助手通过对零售户、订单、卷烟投放等多种数据进行关联、综合和分析,呈现零售户的多维度特征——零售户数字画像。从零售户信息维度,经营地址信息维度和预警信息维度“星级外流风险评估”机制,对零售户存在真烟异流风险进行量化评估,为不同监管策略的制定、走访任务的安排提供依据。同时,针对预警信息维度,可以基于不同的预警策略为违法线索和规律的发现提供依据。
参考文献
[1] 章惠民.福建烟草商业系统专卖管理“数字化”监管体系构建[J].中国烟草学报,2020,26(05):123-128.
[2] 章惠民.福建烟草商业系统大数据技术研究与应用[J].中国烟草学报,2019,25(06):98-104.
[3] 毕文杰.要素禀赋理论下真烟异常流动研究[J].现代商贸工业,2023,44(11):74-76.
[4] 高晓文,吴添.关于易发生卷烟外流零售户甄别方法的几点思考[C].广西壮族自治区烟草公司柳州市公司2020年学术论文汇编,2020.
[5] 吕晨峰.如何通过历史外流客户画像预警新客户真烟异常流动倾向[C].上海市烟草学会2020年度优秀论文集,2021.