摘要:当前,电子商务发展迅速,竞争愈发激烈,准确的销量预测对企业降低库存成本、优化营销策略至关重要。付费流量成为电商平台商家追捧的对象,但关于付费流量对销量影响的研究较少,且不同渠道付费流量对销量影响的细分研究仍然空白,如何判断渠道流量优劣仍缺少解决方案。为了细化研究不同渠道的付费流量对销量的影响并提高销量预测的准确性,本文提出DCA-OLSTM模型。利用淘宝平台的真实数据进行实验,结果表明,加入付费流量特征可以提高销量预测准确性,且不同渠道付费流量对销量预测的影响程度不同,商家可选择高权重值的付费流量渠道,仅供参考。
关键词:付费流量;电子商务;销量预测;LSTM;渠道流量
中图分类号:F724.6;F713.36文献标识码:A文章编号:2096-0298(2025)01(a)--05
1引言
准确的销量预测对于弥合供需缺口至关重要[1]。通过及时、准确的销量预测,可以制定有效的库存管理策略以降低成本[2],同时还能优化营销活动[3]。传统的预测方法包括自回归综合移动平均线(ARIMA)[4]、指数平滑方法、支持向量回归(SVR)[5]等。这些方法主要依赖于历史销量数据,可能导致一定的滞后性。与传统算法相比,深度学习模型在捕捉复杂非线性关系[6]和自动特征提取方面表现出色。对于多变量时序数据,数据中不同变量之间可能存在复杂的动态相互依赖关系,而且不同影响因素对目标变量的影响大小也不尽相同。
输入特征也直接影响着模型的预测效果[1]。现有文献中影响电子商务产品销量预测的特征包括历史销量、产品特征、促销活动等变量[7]。当前,流量已成为线上营销策略的关键组成部分[8],付费流量对电商产品销量的影响日益增加。但现有文献主要集中在免费流量的优化和管理,例如搜索引擎优化(SEO)[9]、社交媒体分享[10]、口碑推广等。虽然一些研究也探讨了付费流量的基本概念和理论研究[11-12],但关于付费流量对销量影响的研究较少,不同渠道付费流量对销量影响的细分研究仍然空白。电子商务平台能够吸引海量用户访问,形成巨大的流量资源[13],入驻平台的商户可以向平台企业购买用户流量,把流量转化为订单来提升商品销量[14]。这种方式可以帮助商家快速获取大量流量。然而,不同的付费流量渠道对销量的影响各不相同,且随着付费流量的成本上涨[15],分析和管理付费流量投入产出比难度加大,产品的销售环境随之更加复杂,产品销量的不确定性也随之增加。受到付费流量的渠道、成本、时效性等影响的销量呈现出不稳定、复杂多变的特点,现实中电商企业做出的预测往往与实际值存在较大偏差。销量预测过低或过高可能会带来缺货成本、库存成本增加以及资源的浪费[16]。因此,探索付费流量及其细分渠道对销量预测的影响,不仅可以帮助商家择优选择渠道流量,还能提高销量预测准确性,有利于电商企业制定库存管理策略、优化营销活动和持续向上发展。
本文旨在探讨付费流量对销量预测的影响,同时深入分析不同渠道的付费流量在销量预测中发挥的作用,基于此提出了一个组合预测模型DCA-OLSTM(DilatedConvolutionAttention-OptimizedLSTM)以实现电商产品销量的精准预测。本文提出DCA注意力机制,能在较低计算成本下获取更优特征表达,赋予重要变量更高影响权重。利用并行的LSTM模型并结合门控机制提出OLSTM优化模型,使其更适合多变量单目标预测。在预测过程中,将注意力模型权重可视化,便于分析各类特征及不同渠道付费流量对销量的影响。最后,在真实的电子商务数据集上进行对比实验,验证模型的准确性。
2研究方法
2.1方法框架
本文所提模型框架如下:(1)DCA注意力机制,提高外部特征的提取效率和更优的特征表达、获取目标序列自身的历史变化规律;(2)OLSTM模块,利用两个并行的LSTM模型分别学习目标序列的时间依赖性和注意力模型获得外部序列的时间依赖性,以保持不同序列时间记忆的一致性[20],最后通过一个融合门来平衡两部分的信息冲突。结合两部分模块,得到DCA-OLSTM模型。图1所示为DCA-OLSTM模型的整体框架,图2为注意力DCA的模型结构。
图1DCA-OLSTM模型结构图
2.2DCA模块
DCA是基于ECA(EfficientChannelAttention)改进的一种注意力机制。ECA是一种高效通道注意力机制,其在多种计算机视觉任务中取得良好的效果,并且具有较低的计算和参数成本,因此受到广泛的关注和应用[21]。本文所提出注意力模型(DCA),其构建思路为:利用高效通道注意力(ECA)机制,在常规卷积后引入了膨胀卷积层,扩大感受野,保留较低计算成本优势的同时,更好地捕捉输入特征的全局信息。这一方法针对特征数量较多的情况下凸显出其优势,在众多数据中抓取有效特征,提升特征的表征能力。针对时序数据具有较多数据特征的情况,优化特征表达有助于提升数据预测性能。
2.3OLSTM模块
将目标序列和注意力获得的外部序列特征分别输入LSTM模型,得到输出结果h1和h2,通过门控权重加权后求和拼接,得到最终的预测结果。计算公式如下:
式(1)(2)中:ω表示门控权重,σ表示sigmoid激活函数,W是连接权重矩阵,b是偏置项。在模型的训练过程中,通过反向传播算法和梯度下降优化算法,优化门控权重的值,使模型能够自适应地学习到融合两个LSTM输出的最佳权重,从而减轻信息冲突,增强关键特征的记忆能力。
3实验数据
3.1数据集概述
本文以阿里巴巴旗下电商平台淘宝为研究对象,数据集来源于阿里云天池,数据名称为菜鸟-需求预测与分仓规划天池大赛,本文采用全国电商销售数据集。实验使用编号32084产品的销售数据,数据采样间隔为1天,共计332条数据。时间跨度为2015年1月30日至2015年12月27日。初始数据包括31个特征,涵盖产品的分类信息、用户行为、交易特征、付费流量、历史销量等。
3.2数据预处理
为剔除购物节(双十一、双十二)带来的大量自然流量对销量的影响,本文使用替换法将购物节当日数据替换为临近日期的数据值,以便分析付费流量对销量的影响。
为筛选重要特征,本文使用皮尔逊相关性分析法验证外部特征与目标特征的相关性,选择相关性大于0.3且对任务具有显著影响的特征,经过筛选保留21条外部特征及1条目标特征,数据集共22条特征。筛选后的数据说明详见表1,其中历史销量为目标特征。最后,对数据进行归一化,确保不同特征的数值范围一致,以避免某些特征对模型训练的影响过大,用于模型训练和测试的样本比例为8∶2。
3.3评价指标
为了衡量所提模型的预测性能,使用平均绝对误差(MAE)、均方根误差(RMSE)、平均绝对百分比误差(MAPE)作为评估指标。
3.4实验设置
本文使用以下实验设置来训练和评估模型。所有实验均基于Python3.9.15和TensorFlow2.15.0实现,实验平台为合肥工业大学高性能计算平台A40容器资源池,资源配置为3核CPU,30GB内存,0.5卡GPU。优化器和激活函数分别采用Adam和ReLU。模型的学习率设置为0.001,训练50个epoch,每个步骤的批处理大小为3。
4实验结果及评价
4.1付费流量权重分析
将外部特征数据输入DCA注意力模块中,使输出的注意力权重可视化,得到注意力权重热力图如图3所示。该热力图展示了DCA-OLSTM模型在不同时间步长(TimeSteps)和不同特征(Features)上的平均注意力权重。图3中的横轴代表特征,纵轴代表时间步长。颜色越深表示注意力权重越高,颜色越浅则表示注意力权重越低。
图3显示,特征12、13、15、16的权重值均大于0.1,在所有时间步长中均表现出较高的注意力权重,这意味着该部分付费流量特征对模型的决策具有重要影响。不过,特征14和特征17的权重值相较其他付费流量特征显著降低,表明特征14、17对应的聚划算渠道的付费流量对模型输出的影响较小,说明该渠道流量质量可能较低,商家需要慎重考虑是否采用聚划算渠道获得付费流量,而淘宝客和搜索引导渠道获得的付费流量对销量影响更大,商家可优先考虑此类渠道。
计算平均每时间步各类特征总权重,其中付费流量平均总权重为0.624,用户行为特征平均总权重为0.260,交易特征平均总权重为0.116。对比发现,付费流量权重值最大、影响力最高,表明付费流量特征在模型决策中起到了显著作用。
4.2实验结果与分析
为了客观评价所提模型的预测能力,本文使用六种基线模型进行对比实验。基线模型包括:SARIMA[19]、LSTM、GRU[20]、TKAN[21]、TSD[22],以及SelfAttention-LSTM的组合模型。
本文将所提出算法与基线模型进行对比,预测结果如表2所示,其中对比方法为将本文模型与其他基线模型预测结果求差值后,计算差值同基线模型的占比。显而易见,DCA-OLSTM模型的MAE、MAPE和RMSE值均为最低,优于其他六个基线模型。其中,机器学习算法SARIMA仅使用历史销量数据作为输入和输出,综合三个评价指标,预测性能最差。与SARIMA相比,GRU、LSTM的MAE、MAPE、RMSE值均有较大幅度降低,而LSTM和GRU的预测结果相差较小,其MAE、RMSE差距均小于0.2。加入注意力机制的模型则进一步提升了预测精度,使用自注意力的SelfAttention-LSTM模型的MAPE值下降为85.97%。同时与两种最新模型TKAN和TSD进行对比,本文所提模型具有更低的损失,表明所提模型预测效果更好。
4.3分析与讨论
与经典机器学习算法相比,深度学习模型在时序预测的准确性方面显著提高。组合模型集合两种算法的优点,处理多元时序数据时,其预测准确性相较单一深度学习模型又有进一步提升。与其他组合模型相比,所提方法在电商产品销量预测方面表现出较好的性能。改进后的DCA注意力模型通过两步卷积操作极大减少了计算量,在较低计算成本下进一步优化了时间序列数据的特征表达,算法的预测准确性也有所提升,这是算法最大的贡献和创新。将注意力模块的权重可视化,得到的热力图可以直接明了的展示不同渠道的付费流量的重要性,能够帮助商家更快地选择效果最好的付费流量渠道,减少试错成本的同时提高销量。实际应用中,电商环境复杂多变,付费流量应用情景会越来越复杂,围绕产品销量产生的特征也会增加,使用改进后的算法,可以在较低计算成本下获得更好的预测效果,为商家提供选择的依据。
5结论与展望
本文对付费流量对销量预测的影响进行了深入分析,并构建了DCA-OLSTM模型,以提高销量预测的准确性和稳定性。
5.1付费流量的重要性
本文发现付费流量对销量预测有着不可忽视的影响,而现有的销量预测研究往往忽视了这一点,且不同渠道的付费流量对销量影响各不相同,权重值高的渠道付费流量对销量影响越大,商家可据此选择合适的渠道付费流量,以减少试错成本。
5.2DCA-OLSTM模型的有效性
本文提出的DCA-OLSTM模型在销量预测任务中表现出显著优势。通过DCA模块和OLSTM模块,该模型能够更有效地捕获时间序列数据的特征,并提高预测精度和稳定性。
5.3实验验证结果
本文的实验结果证明DCA-OLSTM模型相对传统方法在销量预测中的优越性。该模型在真实数据集上取得较好的预测性能,验证了其在实际应用中的可行性和有效性。
本文的研究主要集中在电商平台内不同渠道的付费流量对销量的影响,针对其他渠道如第三方平台广告、直播等方式的影响未做研究,未来可将模型应用于直播电商平台,并进行更广泛的验证,以评估其在直播场景中的效果和可靠性。综上所述,随着进一步的研究和探索,相信付费流量对销量预测的影响将会得到更深入地理解,而本文提出的DCA-OLSTM模型也将在电商行业的实际应用中发挥重要作用。
参考文献
CHENS,KES,HANS,etal.Whichproductdescriptionphrasesaffectsalesforecasting:AnexplainableAIframeworkbyintegratingWaveNetneuralnetworkmodelswithmultipleregression[J].DecisionSupportSystems,2024,176:114065.
CUIL,CHENY,DENGJ,etal.AnovelattLSTMframeworkcombiningtheattentionmechanismandbidirectionalLSTMfordemandforecasting[J].ExpertSystemswithApplications,2024,254:124409.
HICHAMN,KARIMS.MachineLearningandMarketingCampaign:InnovativeApproachesandCreativeTechniquesforIncreasingEfficiencyandProfit;proceedingsoftheAdvancesonIntelligentComputingandDataScience,Cham,F2023//,2023[C].SpringerInternationalPublishing.
ZHANGGP.TimeseriesforecastingusingahybridARIMAandneuralnetworkmodel[J].Neurocomputing,2003,50:159-75.
CHENY,XUP,CHUY,etal.Short-termelectricalloadforecastingusingtheSupportVectorRegression(SVR)modeltocalculatethedemandresponsebaselineforofficebuildings[J].AppliedEnergy,2017,195:659-70.
JINM,ZHENGY,LIYF,etal.MultivariateTimeSeriesForecastingWithDynamicGraphNeuralODEs[J].IEEETransactionsonKnowledgeandDataEngineering,2023,35(9):9168-80.
ZHUANGQ,ZHANGX,WANGP,etal.ANeuralNetworkModelforChinaB2CE-CommerceSalesForecastBasedonPromotionalFactorsandHistoricalData;proceedingsofthe2019InternationalConferenceonEconomicManagementandModelEngineering(ICEMME),F,2019[C].IEEE.
MHIMEDR,BELKHIRM.Theroleofcontentmarketingstrategiesintrafficgeneration:Aconceptualmodeldevelopment;proceedingsoftheDigitalEconomyEmergingTechnologiesandBusinessInnovation:ThirdInternationalConference,ICDEc2018,Brest,France,May3-5,2018,Proceedings3,F,2018[C].Springer.
BAYEMR,DELOSSANTOSB,WILDENBEESTMR.SearchEngineOptimization:WhatDrivesOrganicTraffictoRetailSites?[J].2016,25(1):6-31.
DOLEGAL,ROWEF,BRANAGANEJJOR,etal.Goingdigital?Theimpactofsocialmediamarketingonretailwebsitetraffic,ordersandsales[J].2021,60:102501.
张芬芬.流量思维导向下企业电商精准营销的逻辑、困境及策略[J].天津中德应用技术大学学报,2023(2):79-84.
胡志鹏,许柏鸣.互联网流量经济背景下定制家具品牌推广研究[J].家具与室内装饰,2023,30(2):79-83.
ROCHETJ-C,TIROLEJ.Platformcompetitionintwo-sidedmarkets[J].Journaloftheeuropeaneconomicassociation,2003,1(4):990-1029.
王勇,刘乐易,迟熙,等.流量博弈与流量数据的最优定价:基于电子商务平台的视角[J].管理世界,2022,38(8):116-32.
陆玥妍.电商平台、私域流量与第三方商业策略选择研究[D].南京:东南大学,2022.
滕玥.B2C电商平台商品促销销量的预测方法[D].大连:大连理工大学,2022.
GENGX,HEX,XUL,etal.Graphcorrelatedattentionrecurrentneuralnetworkformultivariatetimeseriesforecasting[J].InformationSciences,2022,606:126-42.
YUE,XUG,HANY,etal.Anefficientshort-termwindspeedpredictionmodelbasedoncross-channeldataintegrationandattentionmechanisms[J].Energy,2022,256:124569.
KORSTANJEJ.TheSARIMAModel[M].AdvancedForecastingwithPython:WithState-of-the-Art-ModelsIncludingLSTMs,Facebook’sProphet,andAmazon’sDeepAR.Berkeley,CA;Apress.2021:115-22.
CHUNGJ,GüLçEHREÇ,CHOK,etal.EmpiricalEvaluationofGatedRecurrentNeuralNetworksonSequenceModeling[J].2014,abs/1412.3555.
GENETR,INZIRILLOH.TKAN:TemporalKolmogorov-ArnoldNetworks[J].arXive-prints,2024:arXiv:2405.07344.
DUONG-TRUNGN,NGUYEND-M,etal.TemporalSaliencyDetectionTowardsExplainableTransformer-BasedTimeseriesForecasting;proceedingsoftheArtificialIntelligenceECAI2023InternationalWorkshops,Cham,F2024//,2024[C].SpringerNatureSwitzerland.