文/郑聃
在国务院印发的《促进大数据发展行动纲要》中,“大数据”被定义为:“以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合。”不过,目前对大数据的通行定义是:“当前技术无法处理的数据集合”,即“无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产”。可见,大数据是一种以应用为目的,具有一定的信息处理难度的数据集合。
目前,关于大数据的应用似乎更多地体现在生产、销售以及娱乐服务等行业,“大数据”在行政执法中的角色定位即“大数据”是包含执法规律和未来违法趋势的巨量零散数据的集合,通过对历史数据的分析,行政执法部门可以获取以一般分析手段无法获取的且更清晰准确、更有预测价值的决策信息。
一是搭建数据平台,实现烟草专卖管理信息化。为提升利用信息化进行科学监管的水平,去年,国家启动了行业“专卖管理综合信息系统”建设项目,并在北京、山西、安徽三地启动“三统一”试点运行。根据《关于推进烟草行业专卖管理综合信息系统一期项目建设的意见》,于2016年年底前专卖管理综合信息系统全面上线运行。对此,行政执法部门可利用专卖管理综合信息系统建设的重要契机,开展数据采集标准以及数据种类、数据存储、传输、读取形式等方面的有益探索,在不断的实践和总结积累中,逐步完善数据资源管理体系,健全大数据采集制度,明确信息采集责任,从而提升对烟草专卖管理信息数据的采集、传输、提取效能。
二是重视开放共享,实现信息交流数字化。在“大数据”时代背景下,越是零散的数据信息利用价值越低,若不公开和分享数据,便可能造成数据间的割裂,无法产生深度价值和综合价值。只有通过开放共享,不断汇聚融合零碎数据,才能产生从量到质的飞跃,展现出零散信息无法提供的“隐含信息资源”。因此,整合数据资源实现互联互通是“大数据”应用的内在必然逻辑。同时,数据内含的“潜在信息”不会自动显示,需要通过信息公开让更多的数据使用者看到,集众人之智,实现对数据内在资讯的深度挖掘。
三是完善分类管理,实现监管数据标准化。对海量数据进行分类是“数据信息挖掘”过程中十分重要的一环,每一起专卖案件都含有众多类别的信息,从不同角度可以得出不同的案件线索,因此有必要完善数据在采集、共享、使用等环节的分类管理。例如一起真烟非法流通大要案,既可以从案件查获环节进行分类,也可以从案件涉及的卷烟品牌进行分类,还可以从案件发生的区域进行归类……越多角度的分类方法,其后的分析也将有越多维度的分析思路,从而得出更多、更精确的隐含信息。
四是推行数据分析,实现市场监管精准化。电商、快递潜移默化地改变着固有的消费行为乃至消费习惯,消费者越来越习惯“宅”在家里“点”需求。为做好烟草专卖行政执法工作,烟草专卖局应当关注物流快递渠道涉烟违法行为,利用快递大数据肃清“假私非”涉烟违法问题。网络制假贩假行为无孔不入,传统烟草专卖行政执法方式难以从根本上解决问题,需要从电商行为的主渠道供给中实施有效占领。淘宝、阿里巴巴官方对制假贩假行为无法做到彻底肃清。利用物流快递大数据肃清“假私非”涉烟违法问题,对于烟草网络打假将会是一个极大的促进。涉烟案件的查处中一个很重要的制约在物流快递的大数据信息不足和不充分,积累的经营者和消费者的信息、数据,在物流快递大数据中反复的提取、验证才是真实最有价值的资源。
所谓技术有限、应用无限,数据的规模不是目的,应用效果才是一切数据最好的归宿。业务部门的“大数据”用在精准营销上可产生“数字生产力”,那专卖部门的大数据如何应用呢?通过汇总分析违法行为相关数据,确定发生率最高的地域、时间段、卷烟品种、运输方向等信息,最终模拟预测出最有可能发生违法行为的目标,形成行业“黑名单”,提高打击精准度。当然,以上只是对显性关联数据的应用,真正的“大数据预测”还能通过寻找多个表面看似不相关的数据间的联系,发现信息间的“同步”信号。因此,对大数据的应用要多挖掘数据间的关系,才可能发现数据背后潜在的“秘语”。