[摘要]文章通过思考“互联网+”时代的烟草数据价值,运用数据抽取、数据集成、数据分析、数据展现和数据应用服务等方面的新理念新技术,根据地市级烟草商业企业业务场景需求,汇集业务系统相关数据,研究一套数据敏捷应用的智能解决方案,用数据赋能企业,提升企业竞争力。
[关键词]烟草商业企业;大数据分析;数据敏捷应用
[DOI]10.13939/j.cnki.zgsc.2020.04.065
1引言
按照国家局2019年度网络安全与信息化工作会议上提出的“建立‘用数据说话、用数据决策、用数据管理、用数据创新的机制和全面精准共享的数据管理机制”。文章将以地市级烟草商业企业数据敏捷分析应用为思路,把底层原始数据统一抽取上来,做数据处理、数据拉通和数据服务,向上支撑各个业务数据的运营,思考西安烟草数据集成分析敏捷应用的数据运营新模式。以数据为驱动,贯通营销、专卖、物流各业务数据体系[1],推进数据资源整合和开放共享,保障数据安全,推动数字业务化、业务数据化,并致力发挥数据的基础资源作用和创新引擎作用,推动数据智能化在烟草企业的广泛应用[2]。
2研究背景及意义
目前,根据对地市级烟草商业企业数据业务现状的洞察,每个岗位都希望得到数据的支撑,卷烟营销、专卖、物流等业务虽均有各自的应用系统,但数据指标被业务模式割裂,仅限于纵向分析,缺乏数据间的横向关联,也缺乏社会第三方数据资源,数据口径不统一、定义不清晰、视角不一致,致使难以形成真正意义上的大数据分析资源;各自应用系统无法满足地市级烟草商业企业与时俱进、快速迭代、按需定制的个性化多元化业务数据需求,部分关键指标分析仍需要依靠人工操作,且为重复性工作,对人力资源造成较大浪费,影响工作效率;此外,数据价值发掘不够,用数据指导经营决策与企业管理的情况仍不理想,难以为供应链上的相关利益者(包括工业企业、零售客户、消费者等)增利赋能,难以提升企业管理效能。
基于此,文章的研究旨在身体力行的落实习近平总书记“做大做强数字经济”的部署要求,及国家局2019年度网络安全与信息化工作会议上的重要指示。主动探索“互联网+”时代下的烟草数据价值[3],运用数据抽取、数据集成、数据分析、数据展现和数据应用服务等新理念新技术,根据地市级烟草商业企业各业务场景需求及痛点,以数据为驱动,思考地市级烟草商业企业数据敏捷应用体系建设方法,规范数据抽取、清洗、储存、建模、应用等标准,深度挖掘数据应用价值,解决企业数据应用的个性化实际需求场景。向下抽取业务数据,包括系统中的用户数据,内部大数据,外部大数据,进行数据的打通和互联;向上来做业务支持,进而有效地解决数据的“存——一切业务数据化”,“通——链接数据孤岛”,“用——一切数据业务化”等难题。赋能企业,为企业决策提供科学参考,为运营提供有效支撑,为监管提供全力保障。
研究的方向既需要有从现在看未来的正向思维,在烟草的各业务领域及管理运营上加快技术升级步伐,推动西安烟草向数字化、网络化、智能化转变;也具备从未来看现在的逆向思维,对云计算、大数据、人工智能、移动互联等新技术在烟草行业的应用和外部网络电商对传统卷烟零售的影响[4]等方面进一步加强基础性、前瞻性研究,为各级领导和业务部门提供丰富多样、及时准确便捷的信息服务,为供应链上的相关利益者增利赋能,为地市级烟草商业企业高质量发展提供数据保障和长远的谋划。
3关键技术
3.1数据采集技术
数据采集又称数据获取,是利用一种装置,从系统外部采集数据并输入到系统内部的一个接口。数据采集技术广泛应用在各个领域。比如摄像头、智能设备等都是数据采集工具。
3.2数据清洗技术
数据是信息的基础,好的数据质量是各种数据分析如OLAP、数据挖掘[5]等有效应用的基本条件。人们常常抱怨“数据丰富,信息贫乏”,究其原因,一是缺乏有效的数据分析技术,二是数据质量不高,如数据输入错误、不同来源数据引起的不同表示方法、数据间的不一致等,导致现有的数据中存在脏数据。它们主要表现为:拼写问题、打印错误、不合法值、空值、不一致值、简写、同一实体的多种表示(重复)、不遵循引用完整性等。数据清洗(DataCleaning)的目的是检测数据中存在的错误和不一致,剔除或者改正它们,以提高数据的质量。
图1数据清洗原理
3.3数据分析技术
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是进行数据模拟仿真的支持过程。进行数据分析可帮助管理者作出判断,以便采取适当措施。
对中心数据库[6.7]中的周期零消、批零卷烟大数据、社会第三方资源数据进行滚动清洗、整理、建模、分析(包括业务的纵向分析和横向分析),为企业的生产、经营、管理等提供分析报表及决策依据。
典型的数据分析可能包含以下三步:
第一,探索性数据分析:当数据刚取得时,可能杂乱无章,看不出规律,通过作图、造表、用各种形式的方程拟合,计算某些特征量等手段探索规律性的可能形式,即往什么方向和用何种方式去寻找和揭示隐含在数据中的规律性。
第二,模型选定分析:在探索性分析的基础上提出一类或几类可能的模型,然后通过进一步的分析从中挑选一定的模型。
第三,推斷分析:通常使用数理统计方法对所定模型或估计的可靠程度和精确程度作出推断。
3.4关联分析技术
关联分析又称关联挖掘,是在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。或者说,关联分析是发现交易数据库中不同商品(项)之间的联系。它是一种简单、实用的分析技术,发现存在于大量数据集中的关联性或相关性,从而描述了一个事物中某些属性同时出现的规律和模式。
3.5数据模型设计
维度建模是专门用于分析型数据库、数据仓库、数据集市建模的方法,维度建模以分析决策的需求出发构建模型,构建的数据模型为分析需求服务,因此它重点解决用户如何更快速完成分析需求,同时还有较好的大规模复杂查询的响应性能。
3.6数据展现技术
通过可视化技术、画像技术、智能算法及维度模型,进行个性化动态数据查询与展示、多元化的报表自定义展示、商圈分析、用户画像等研究,满足企业所有人员的查询与共享需求。
第一,可视化:可视化(Visualization)是利用计算机图形学和图像处理技术,将数据转换成图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。
第二,用户画像:又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。用户画像最初是在电商领域得到应用的,在大数据时代背景下,用户信息充斥在网络中,将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化,从而为用户提供有针对性的服务。用户画像所形成的用户角色并不是脱离产品和市场之外所构建出来的,形成的用户角色需要有代表性,能代表产品的主要受众和目标群体。
4从顶层到底层,思考构建地市级烟草商业企业数据敏捷应用体系
4.1规划地市级烟草商业企业数据敏捷应用体系建设方法
规范数据抽取、清洗、储存、建模、应用等标准。从业务架构设计到模型设计,从数据分析到数据服务,汇集业务系统相关数据,进行各种关联分析和对比碰撞,规划具备前瞻性、可持续性、可扩展性,能够为企业经营决策提供柔性技术支撑平台,为企业高质量发展提供决策依据,推动业务及管理决策向数据化和智能化发展。
4.2搭建数据管理需求场景,挖掘数据应用服务的价值
(1)通过对卷烟营销关键指标、市场调研数据、客户经理拜访数据进行抽取滚动清洗、整理、分析,自定义展示,形成一套科学合理的市场状态与货源投放分析研判标准,逐步建立“系统大数据+市场活情况”综合分析机制。帮助营销人员及时获取市场状态的变化信息,提升货源分配与客户销售能力匹配度,打破业务人员基于传统的统计思维,根据工作积累的经验和直觉对数据进行判断的工作方式。
(2)对终端卷烟零售数据进行深入分析应用,提升消费者感知能力,为科学经营决策提供数据支撑。通过对卷烟零售客户历史销量数据、各类零售终端进销存数据、货源数据以及消费者会员信息数据、消费数据等滚动清洗、整理,建立若干分析模型,包括数据监测分析预警模型、品牌推荐模型、品牌画像模型、终端画像模型等,以提升货源分配与客户销售能力匹配度,并经过长期良性循环,为一定程度抑制部分区域真烟非法流动提供决策辅助;通过商品消费画像锁定商圈,通过终端与消费者画像锁定品牌培育对象等,逐步探索一套完整的零售终端数据分析和应用模式。
(3)研究基于数据挖掘的品牌精准选点培育,借助数据驱动,通过数据标签以及终端画像选点投放,实现目标客户精准锁定、投放节奏张弛有度、区域市场错位发展、市场需求即时响应,提高品牌培育的精准度,为优化提升市场状态奠定提供支持。
(4)探索开展品牌“精准推荐”,通过模型构建、数据展现、逆向评价,将卷烟精准推荐给适销客户,帮助客户高效寻找畅销卷烟。整个过程以经营数据驱动,实现卷烟零售客户品牌精准推荐信息服务,为经营指导赋能,充分发挥数据在营销决策中的重要作用,以批零网上配货匹配度优化提升为突破口,实现卷烟零售客户品牌精准推荐信息服务。
(5)嘗试引入社会第三方资源数据(如非烟数据、区域人口流动数据等),利用数据挖掘、可视化技术、画像技术、智能算法、用户维度模型,初步形成社会数据与零售终端及消费者数据的关联分析模型,为优化提升市场状态和货源投放策略提供支持。
(6)探索物流类关键指标数据的综合分析研判展示。主要包括对物流业务运行、设备管理、安防监控、对标指标等数据的抽取、分类、分析和展现,构建物流基础数据模型。
(7)探索业务间关联性的数据分析研判场景。如卷烟销售数据与专卖涉烟违法案件概率、客户订单数据与物流分拣数据关联分析等。
4.3形成全面、多样化、可视化的信息汇总展示功能
实现个性化的动态数据查询与展示、多元化的报表自定义展示等,为大数据分析提供多样化数据形态基础,提升汇总数据的直观性,让业务人员与数据直接对话。
5结论
文章主要思考了地市级烟草商业企业数据敏捷应用体系建设方法,从规范数据抽取、清洗、储存、建模、应用等标准出发,解决企业数据应用服务的个性化灵活需求场景。通过向下抽取底层原始数据,做数据处理、数据拉通和数据服务,向上支撑各个业务数据的运营。以数据为驱动,贯通地市级烟草商业企业营销、专卖、物流、综合管理数据体系,推进数据资源整合和开放共享,保障数据安全,推动业务数据化向数据业务化发展,致力发挥数据的基础资源作用和创新引擎作用,推动数据智能化在烟草企业的广泛应用。
参考文献:
[1]金向阳,叶周良,叶群峰.大数据服务模式在烟草应用中的探索[J].中国有线电视,2019(6):649.652.
[2]王昌玲.大数据和数据挖掘技术在烟草行业的应用分析[J].科技风,2019(3):78.
[3]姜未冬.烟草商业企业“互联网+”经营策略研究[J].现代商业,2016(11):132.134.
[4]王保智.烟草商业企业引入“互联网+”路径浅析[J].全国商情,2016(7):4.5.
[5]张国宝,卞艺杰.一种面向闭环的数据治理平台与方法设计[J/OL].计算机技术与发展,2019(8):1.6.[2019.08.01].http://kns.cnki.net/kcms/detail/61.1450.TP.20190327.1624.040.html.
[6]林海.数据治理在合肥市政府大数据平台中的应用和实践[J].电脑知识与技术,2019,15(10):281.283.
[7]赵恩来.打造企业中台推动管理协同[N].国家电网报,2019.07.16(008).
[作者简介]通讯作者:刘佳(1989—),女,硕士研究生,现就职于陕西省烟草公司西安市公司信息中心,科员,研究方向:通信与信息系统、计算机信息技术等。