王建琴
本文是作者从烟草专卖管理的角度深入研究探讨了当前信息化时代,大数据建设对于烟草工作的帮助和推动。系统阐述了行业大数据建设的调研情况和背景,就大数据建设的需求方向作了深入研究和探讨,结合实践工作提出了阶段性目标和路径,最后设计了数据流、管理流、技术流的建设规划,并对如何搞好大数据建进行了有益的探讨。
随着互联网的不断发展和信息产业不断升级,人们在生产生活中采集到的数据成几何级增长,数据大爆炸给人们提取和处理有效信息带来了巨大挑战,可以说,大数据使人类认识客观世界的能力有了大幅提升,认识客观世界的方式有了颠覆性的变化。数据化正在引领商业、军事、科研、经济、行政、教育、医疗等各个社会领域的变革,当然也包括烟草专卖管理这一特殊的领域。
烟草行业是我国经济社会发展中发挥重要作用的传统行业。随着信息技术的快速发展,在大数据建设过程中,当前专卖管理工作中已经积累了较多的数据信息,但都采用传统方式松散地存储于案卷、电脑文件及其它设备中。没有形成统一的数据收集、存储、分析体系,对情报数据共享和利用也非常有限。随着大数据、“互联网+”等新兴技术在烟草行业的起步与应用,专卖管理工作在多年的信息化建设基础上,遇到发展良机。
近年来,在数据平台搭建方面,2016年国家烟草专卖局启动了行业“专卖管理综合信息系统”建设项目,在开展数据采集标准,建立数据资源管理体系,健全大数据采集制度,明确信息采集责任,在数据种类、数据存储、传输、读取形式等方面进行了有益探索,分别构建了以APCD工作法应用、物流寄递环节情报预警、互联网+烟草专卖许可证办理为核心的软件系统。
上述工作仅仅对大数据及有关技术进行了初步尝试,尚存在许多不足。在市场监管数据利用上,在市场监管中收集到的零散数据缺乏深层次的整理和分析,更无法形成能够为市场监管提供方向的强大数据源;在情报分析研判上,收集到的数据之间缺乏碰撞、分析和总结的工具,特别是数据的可视化分析还没有着手研究。专卖管理尚有大量数据以纸质化信息存储,不利于专卖管理的高效运作。目前已有涉烟大数据以数据的收集、分类、加工、整理为主,重采集轻分析,满足于信息的简单罗列和描述性概说,缺乏深层次的信息处理、分析和挖掘,大数据的潜在价值没有获得有效挖掘和利用。
当前,要快速建立起烟草行业的大数据应用链,必须首先满足以下四个方面的现实需求。
第一,必须加强和完善大数据基础设施建设及服务功能,扩大大数据专业技术研究和引进力度。尤其是对于云储存和区块链的应用,急切需要研究,原因是烟草各项业务融合在一起必将是一个庞大的“数据基地”,如果各级各地区作为个体分别投入资金建设服务器,在资金使用上是一种浪费,对服务器的架设单位来说庞大的体积也是一种资产负担,更重要的是容易滋生“数据保护主义”,不利于信息共享。因此,利用云端和区块链技术的数据存储是建成烟草行业大数据应用链的前提条件。
第二,必须加快搭建统一平台,成立涉烟信息“大数据库”,贯通大数据的研发应用。根据实际情况,烟草行业对于基础数据的采集和录入已经做到的相当到位,但对于有深度、需要挖掘的数据还没有建立有效的采集渠道,特别是对于数据的流通、运转和应用,还缺乏统一标准和可分位开发的接口。因此,当前需求最明显的是搭建一个集合数据采集、管理、分析、应用的统一平台,成立一个融合各项业务或者主流业务的庞大数据库,清洗已有数据,建立数据标准,贯通各模块各环节的数据流转和运用。
第三,必须继续推进信息资源的横向协同,促進统一类型数据在业务部门内的整合,实现业务部门间的信息共享与交换。大数据的核心就是信息共享,只有数据量足够大、数据之间的互动频繁,才能准确地碰撞出所需的信息。信息共享需要两个维度的横向整合:其一,是各个业务部门之间,比如专卖管理既需要日常执法、案件信息等数据,同样需要销售部门、内管部门的营销数据、预警数据,这样才更够能精准地判断市场、发现线索;其二,是各级各单位之间,比如在物流寄递监管方面,郑州、漯河作为河南两个快递中转场,只有这两个地市把数据共享出来,才能够满足其它地市对于精准分析的需要,从中分析出各个团伙寄递包裹的转场规律,并准确地发现违法快递包裹单号。
第四,必须加速数据挖掘及运用,提高大数据在专卖管理决策中的支撑指导作用。就近几年对专卖管理工作方面的观察,可以发现,无论是管理层还是基层队伍,需求最为迫切的就是日常的电子化智能化执法、便捷化无纸化办证、快速准确地调取数据和碰撞信息,甚至对于市场评价、痕迹管理、人员考核的数据化标准化。归根结底,是大数据在管理当中的决策作用和在基础工作当中提供的高效工具。
笔者就多年的专卖管理工作经验,从理论研究和部分实践的角度分析了烟草系统关于大数据建设的方向和目标。主要应当从三个维度着手建设。
1.建立数据流:首先,是研究建立和不断完善数据开放及保护等方面的制度机制,实现对数据资源采集、流转、储存、应用、开放的规范管理,研究清楚各个级别各个单位之间对于数据的使用权限和保密等级,促进数据在风险可控原则下最大程度开放共享。其次,建立涉烟情报信息大数据库,通过三个层级的数据接口(分别是:对接“三统一”、营销系统、内管系统等现有的平台数据,智能识别自动抓取网络上的涉烟信息,通过手机端实时采集工作中产生的信息数据),打通与烟草相关各类数据的采集渠道。再次,建立基础数据、核心数据、关联数据三个层级的数据分类目录,建成包括基础信息、案件信息、人员信息、通讯信息、车辆信息、物流寄递、判决书等7大类数据为一体的大型数据库,实现涉烟信息数据的全方位收集和整理。
2.建立管理流:一是以实战为导向,围绕烟草专卖管理工作实际需要,细分人才队伍和定向领域,应涵盖数据清洗、数据建模、信息管理、分析研判等方面,借鉴阿里巴巴对大数据外派团队的组建模式,以3-5人小组的形式组建数据链管理团队,解决烟草实战中数据共享、模型算法和战法应用等典型问题,充分发挥人才的网络化规模和应用效应。二是建立大数据应用人才库,开辟和创新大数据应用评价机制,在系统内外通过横向、纵向两个层面创建人才协同协作平台。三是依托开发研究大数据的相关企业,利用网上、网下等方式全面开展教育培训,普及大数据知识,提高专卖执法队伍整体认知和应用水平;同时,鼓励基层同志积极建模,深层挖掘大数据涉及领域,将大数据串联在具体业务的方方面面。
3.建立技术流:利用智能技术驱动大数据采集挖掘,实现智能化分析研判和高端应用,推进“智慧专卖”建设。大数据时代,数据已成为战略资产,但数据自身不会自动产生价值,只有将算法和计算能力结合才能充分挖掘数据价值并发挥效用。可以说,智能算法是海量数据发挥效用的直接驱动力,人工智能更是大数据发展的创新引擎。只有推进大数据与人工智能、云计算等技术的有机结合,利用智能技术驱动数据挖掘和分析,才能实现大数据智能化研判和高端应用。一是应用深度检索技术,提高数据挖掘能力。通过数据分析、文本语义分析等,抽取出人、物、地、许可证号、案情关联等实体或标识,并根据实体的属性联系、时空联系、语义联系、特征联系等建立相互关系,构建一张具有烟草案件特性的实体与实体、实体与事件的关系网络。简单地说,就是要通过建立模型塑造大数据中的关键字词库和信息类目,方便在实战中快速提取调阅,在提取过程中同时与大数据库中的信息进行特征比对,迅速形成有关联、有指向、有价值的信息网络。二是应用移动终端技术,提高便携执法能力。重点是应在手机端研发出一款适合外出携带的终端APP,方便移动执法使用;同时,引入现场打印、电子签章、二维码追溯、身份识别、语音识别等相关技术,方便在案件执法和业务办理中快速完成相关工作。三是应用可视分析技术,提高系统研判能力。数据可视化可以帮助人们洞察出数据背后隐藏的潜在信息,提高数据挖掘的效率。应用在烟草专卖执法上,就是关于大小案件、人物之间、违法轨迹、活动规律等方面的关联关系挖掘,通过可视化技术将密集的关联关系转化为可视化图表,实现工作人员与数据的直观交互。更为重要的是,可视化分析对于案件串并、证件管理、市场监管、物流寄递监管、情报追踪、考核管理等领域,都能够提供精准的视觉信息和情报网络,可以包括热点分析、趋势分析、情报查询、多重比较、预警案件分析、区域碰撞、车辆分析、统计分析等诸多功能模块,应用场景也将涵盖指挥中心、情报中心、人员管理等。从根本上讲,深度检索、移动终端、可视化技术是跨越式提升大数据建设和智能分析研判的关键方法,引入并在實践中运用好这些技术,是推进烟草走向“智慧专卖”的捷径,也是推行烟草“智慧大脑”的潜力所在。
(河南省三门峡市城区烟草专卖局)
参考文献:
[1]张贤鑫.大数据在烟草商业企业精益管理中的运用[J].现代企业,2021(09):150-151.