基于深度神经网络的卷烟智能投放模型构建方法

2021-03-18 03:57:26王露笛左少燕顾祖毅梁海玲
烟草科技 2021年2期
关键词:卷烟时序销量

邓 超,刘 颂,王露笛,龚 强,高 林,左少燕,顾祖毅,梁海玲

1. 广西中烟工业有限责任公司,南宁市北湖南路28 号 530001

2. 山东青岛烟草有限公司,山东省青岛市市北区南京路202 号 266034

3. 中国科学院计算机网络信息中心,北京市海淀区中关村南四街四号 100190

卷烟产品投放是我国烟草商业公司的一项重要基础性工作,由产品投放带来的卷烟产品销售订单将直接影响商业公司的经济效益。为响应国家关于产业链的供给侧改革号召,强化以市场为导向的产业布局,需要不断调整和优化卷烟产品销售和生产制造结构,以提供更加符合消费者需求的卷烟产品,同时保证税利的持续稳定增长[1]。烟草产业链发展的源头在消费端,一套科学有效的卷烟产品投放策略将有利于引导市场消费需求和减少浪费,实现供给端与消费端之间“稍紧平衡”的基本态势。因此,如何生成面向精准营销的卷烟产品投放策略已成为各烟草企业关注的热点。针对市场精准营销目前已开展了大量研究,邓超等[2-6]针对卷烟营销大数据分析问题,设计实现了面向烟草市场数据的可视分析系统,提出GRIDEN、Gridwave、K-DBSCAN 等时空大数据聚类算法,以及基于时空网格的烟草市场大数据可视分析方法;肖迎宾等[7]为解决营销移动办公应用问题,设计实现了烟草移动营销系统;许建等[8]针对传统数据仓库系统存在的问题,采用传统数据仓库与Hadoop 技术相融合的方式,设计了烟草海量数据分析系统;邢阳等[9]建立了卷烟市场运行状态智能评价模型;侯杰华等[10]基于O2O设计了一体化卷烟商业运营平台,用于为供应商、零售户和消费者提供电商运营服务;朱卫东等[11]根据零售户基本属性指标,采用自组织特征映射神经网络方法对零售户进行分类和分析。此外,在烟草行业卷烟销售系统中建立了“订足面、订足率、投放面、订单满足率、订购率”等多维度综合性评价指标[1],可对投放效果归纳总结,具有较好的业务指导作用。

但是卷烟投放工作的本质是对下一阶段卷烟销售工作进行销量预判和策略性引导。传统的卷烟投放策略主要由业务员根据不同卷烟规格和不同档位零售户的具体情况制定,投放策略数量达到几千条,工作任务繁重,由于人工在情感、记忆、计算等方面存在局限性,难以实现大规模精确计算,导致卷烟产品实际投放效果与市场需求出现偏差,直接影响烟草商业公司和卷烟零售户的经济效益。随着以深度学习为代表的新一代人工智能技术的快速发展,基于历史大数据计算的预测准确度得到大幅度提升,在自然语言处理、图像识别、基因组学、生物医药、医疗诊断、信息技术产业、金融、农业、工业制造等领域得到广泛应用[12-13]。为此,提出了一种基于深度神经网络的卷烟智能投放模型构建方法,以期实现卷烟产品投放策略的智能化生成,提高工作效率。

1 产品销量预测模型

产品销量预测是制定投放策略的先决条件,制定投放策略的目的是为了更好地匹配市场订单需求。因此,为制定下一个周期的产品投放策略,首先要对下一个周期的产品销量进行预测分析,这是典型的周期性时序预测问题。传统的时序预测包括支持向量机[14]、人工神经网络[15]、随机森林回归[16]、贝叶斯网络[17]、多元线性回归[18]等方法。人工神经网络算法主要采用BP(Back Propagation)神经网络,包括信号的前向传播和误差的反向传播两个过程[15],有效解决了多层神经网络隐含层连接权重学习问题[19]。

深度学习方法主要包括卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆神经网络(LSTM)等[12,19]。CNN(Convolutional Neural Networks)广泛应用于计算机视觉领域,用于识别发生位移、缩放、扭曲的特定图形。 RNN(Recurrent Neural Network)是一种时间递归网络,可以使用自身内部状态对输入序列进行处理,从而使神经网络拥有“数据记忆”,常用于处理语音信号、生物信号和自然语言等领域[12],当输入的序列过长时,RNN 可能会出现梯度消失问题。LSTM(Long Short-Term Memory)是一种特殊的RNN,在每一个单元内放置3 个门函数,分别被称为输入门、遗忘门和输出门[20],通过3 个门的相互协同作用,可以判断当前信息是否有价值,符合要求的信息被留下,不符合的信息则通过遗忘门被舍弃,见图1[21]。

本研究中采用一种多层神经网络构建预测模型,并以选取的数据特征作为全连接BP 神经网络中的输入神经元,而输出神经元即为预测的销量值。因此,特征提取是构建神经网络模型的关键步骤,分为机器特征提取和专家特征提取两大部分,见图2。

1.1 机器特征提取部分

主要采用LSTM 深度神经网络提取销售数据的时序特征,每次输入8 周的历史销售数据,由LSTM 计算后输出2 个时序特征值;然后将整个LSTM 网络结构视为BP 神经网络中的2 个神经元,将这2 个时序特征值输入到BP 神经网络进行推演计算。

1.2 专家特征提取部分

主要采用传统的数据统计分析方法,包括销量统计特征和非线性特征,以及与卷烟销量相关的民生数据特征和节假日信息特征。其中,销量统计特征含最大值、最小值、平均值、中间值、均方差、变异系数、均方根等;非线性特征含一阶偏度、二阶偏度、曲率、KL(Kullback-Leibler)散度等;民生数据特征是指从国家统计网站上下载的地区民生指数数据;节假日信息特征是将每周中存在的节假日及其类型[自然周(1~52)、法定节假日、特殊节日、传统节日]作为一个特征。

1.3 预测模型工作原理

将每8 周设定为一个时序周期,再以1 周为时序滑动窗口,从历史销售数据中提取连续8 周(假设是第1~8 周)内的机器提取特征及专家提取特征的所有参数值作为一个训练样本子集,输入神经网络模型中对应的输入神经元中进行计算,并将误差输入神经网络模型中进行反向计算以修正模型中各个输入神经元的权重,然后再将与第2~9 周对应的机器提取特征及专家提取特征的所有参数值作为一个新的训练样本子集,对神经网络模型进行训练和修正,以此类推,直到完成所有样本的训练。

由于卷烟产品的投放周期为每周,而卷烟产品的平均生命周期为几年,且会经历一个由兴起到衰落的过程,产品销量并不能始终保持恒定。因此,用于单个产品销量预测的历史销售数据样本数量有限,在神经网络模型训练时容易造成模型无法完全拟合,进而导致准确度偏低等问题。而本研究中所建立的模型训练方式可以解决训练样本数量不充分的问题,有效提高神经网络模型的稳定性和预测准确度。在进行预测时,只需要根据最近8 周内的历史数据分别计算机器提取特征及专家提取特征的所有参数值,再将这些参数值输入神经网络模型中对应的神经元,其输出值就是下一周的销量预测值,整个推算过程是一个“黑盒子”;之后再将下一周的实际销量值输入模型进行反向学习修正,使整个神经网络模型随着时间的推移不断进化,为下一次预测做好准备;最后针对每种卷烟规格分别训练并建立产品销量预测模型。

2 产品投放策略生成模型

该模型的作用是将目标销量值转化为不同类别零售户的产品投放值。行业内常规投放策略包括按“挡位”、按“挡位+星级”、按“挡位+地理位置”、按“营销部+地理位置”投放等。例如,采用按“挡位”投放策略,假设产品A 在第1 挡中投放3条,第2 挡中投放4 条,……,那么第1 挡中零售户的购买上限是3 条,第2 挡中零售户的购买上限是4 条,以此类推,由此可得产品投放策略生成模型的输入就是A 的下一周销量预测值,输出就是一个针对A 的所有档位零售户的下一周投放上限(即购买上限)的集合。在实际工作中可以对A 的计划投放量进行适当调整,模型会根据计划投放量生成相应投放策略。形成每个档位投放上限的算法实际上是一个“白盒子”,其规则是根据前8周数据中不同档位关于A 的订购比例进行推算。

第1 步计算第N档零售户下一周关于A 的投放总量:

式中:SN订购是第N档零售户在前8 周中关于A的订购总量,条;S总订购是所有档位零售户在前8 周中关于A 的总订购量,条;S预测是下一周关于A 的预测总销量,条。

第2 步计算第N档零售户中关于A 的重购户数:

式中:SN总户数是第N档零售户的总户数,户;RN订购率是第N档零售户在前8周中的平均订购率,%。

第3 步计算第N档零售户中关于A 的投放数值:

由于投放数值只能是整数,那么就会产生一个投放数值的上限TN上限和下限TN下限。假设TN=4.45 条,那么TN上限=5 条,TN下限=4 条。TN实际上是一个预测的市场平衡值,可以根据A 的市场状态进一步确定是取上限值还是下限值。如果选择上限值,那么A 在下一周的销量会略高于S预测;反之,则略低于S预测。假如A 本周市场状态处于“稍松”,那么下一周可以选择采取“稍紧”的策略,即下一周关于A 的第N档零售户的投放数值是4 条;假如A 本周市场状态处于“稍紧”,则可以选择采取“稍松”的策略,投放数值是5 条。

关于A 的市场状态,可以通过订单满足率、订购率、订足率、订足面(简称“三率一面”)等销售指标结合人工经验进行评估。“三率一面”的计算方法分别为:

订单满足率=(客户订购量÷客户需求量)×100%

订购率=(订购户数÷总户数)×100%

订足率=(订购量÷投放量)×100%

订足面=(订足户数÷订购户数)×100%

评价一个投放模型的好坏,其重要判断依据是产品的实际订购量与预测量之间的差值,差值越小则模型越优。另外,也可以预先设定理想的“三率一面”目标值,再通过实际投放后的“三率一面”指标来评估和调整投放模型。

3 实验验证

以山东青岛烟草有限公司为对象,结合实际工作对智能投放模型进行测试。将青岛烟草2016年1 月1 日至2020 年5 月10 日的1.18 亿 条 历史销售订单数据、841 万条访销数据、1 592 条万年历数据作为训练数据集,经训练得到模型并进行参数调整,然后按照模型结果进行卷烟投放,以验证模型的实际应用效果。

3.1 销量预测验证

首先对1.18 亿条历史销售订单数据进行数据清洗和标准化预处理,按照品种规格(以下简称“品规”)、时序(周)2 个维度将1.18 亿条销售数据进行统计聚合,形成189 个品规的销量时序数据,然后将数据集的前70%数据用于模型训练,将剩余的30%数据用于模型的模拟验证,并根据验证结果进行算法调整和优化,避免神经网络出现过度拟合和局部最优。同时,利用189 个品规的销售数据,对提出的深度神经网络模型与线性回归、支持向量回归(SVR)[22]、Lasso 回归[23]、L2 回归、随机森林[16]共5 种时序预测方法进行对比,计算每种方法的销量预测准确率并取平均值,结果见表1。可见,深度神经网络模型效果最优,平均预测准确率为95.67%。

表1 多种方法预测准确率对比Tab.1 Comparison of prediction accuracy among various methods

3.2 模型投放验证

采用人工选择的几种投放方式,根据模型生成的智能化投放策略,2020 年5 月11 日至15 日对“泰山(华贵)”等25 种卷烟主销规格进行实际模型投放验证,计算产品投放准确率并取平均值,结果见表2。可见,投入准确率最高达到100%,最低为77.74%,平均准确率为92.40%。

表2 投放模型实际验证效果Tab.2 Actual verification effect of release model

表2(续)

4 结论

针对卷烟产品精准投放问题,提出了一种适用于烟草商业公司的卷烟智能投放模型构建方法,分为产品销量预测和产品投放策略生成两个步骤。其中,产品销量预测采用一种由LSTM 时序特征提取和专家特征提取共同构成的BP 全连接神经网络模型;产品投放策略生成模型以产品销量预测值为输入,结合人工选择的投放方式进行模型推算,生成实际产品投放策略。以青岛烟草公司189 个品规的历史销售数据为对象对投放模型进行测试,结果显示销售预测准确率为95.67%;在25 种卷烟主销规格实际模型投放验证中,投放准确率为92.40%。

该智能投放模型的基本原理是基于卷烟消费市场的“需求守恒”规律,并依据销售数据中的“历史记忆”进行惯性推导,因此并不适用于新产品投放。考虑到不同地市级商业公司投放策略的差异性,以及影响卷烟消费市场的综合性因素较多,模型的构建应该结合实际情况对输入特征进行有针对性的选择,采取因地制宜的模型构建策略,制定适用于企业自身的卷烟产品市场状态评估机制,最终生成满足“一市一策”的产品投放策略。

致谢:本研究得到山东青岛烟草有限公司的帮助与支持,在此表示衷心感谢!

猜你喜欢
卷烟时序销量
基于时序Sentinel-2数据的马铃薯遥感识别研究
基于Sentinel-2时序NDVI的麦冬识别研究
同比增长130%!剑指3万吨销量,丰华黄颡料迎来大爆发
当代水产(2021年7期)2021-11-04 08:17:32
盘点2018年车企销量
汽车观察(2019年2期)2019-03-15 06:00:12
一种毫米波放大器时序直流电源的设计
电子制作(2016年15期)2017-01-15 13:39:08
上汽通用172万销量下的阴影
家用汽车(2016年4期)2016-02-28 02:23:37
卷烟包装痕迹分析
DPBUS时序及其设定方法
河南科技(2014年15期)2014-02-27 14:12:36
我国卷烟需求预测研究述评
卷烟引燃倾向测试方法的研究与改进