基于XGBoost 算法的跨境电商备货预测研究

2024-03-30 13:11■李
太原城市职业技术学院学报 2024年1期
关键词:备货残差跨境

■李 融

(广东女子职业技术学院外语外贸学院,广东 广州 511450)

跨境电子商务是一种新兴的跨国贸易模式,以网络平台为媒介,在国内实现向国外销售产品。这一模式的兴起有效弥补了传统交易方式在实时货物追踪方面的不足之处[1]。伴随跨境电子商务的飞速增长,众多公司目光聚焦海外市场,纷纷在国际竞争舞台上竞逐。为在国际市场中保持竞争优势,企业迫切需改进策略。其中,核心对策包括提升产品质量,强化市场竞争力,增进企业竞争实力等。无论采用何种路径,对销售进行准确预测皆为必要。唯有精准预测销售,方可确保企业持有足够资金以维持生产与库存[2-3]。为此,本项目拟将XGBoost算法用于跨境电商的库存预测,以解决库存过多、过少等问题。该项目的创新在于,综合不同算法特征,着重提高海外市场竞争力,研究五种预测模型,根据不同消费品类型的跨境电商企业情境,强调制定全面决策以选择最佳预测模型,使得方法和模型更加符合电商领域的使用情境。

一、基于XGBoost 算法的跨境电商备货预测模型

(一)基于C-XGBoost 算法和需求特征的跨境电商备货预测模型

XGBoost 算法(Extreme Gradient Boosting,XGBoost)以其出色的泛化能力著称。通过融合多个决策树,XGBoost 能够有效避免过拟合现象,同时在预测精度方面表现出色。在此基础上,研究以商品聚类为基础,对各类别的商品进行深入聚类分析,构建多类备货管理策略,以提升跨境电商平台用户满意度。利用历史交易数据指标反映跨境电商用户需求特征[4-5]。为更准确反映备货影响因素,将该指标作为商品聚类依据。两步聚类算法中,首先,排除异常值,设定25%噪声比例,随后对数值字段标准化。其次,自动确定聚类数量,范围设置在3.5 至17.5 之间。最终,采用贝叶斯信息准则的对数似然距离进行距离测量。通过轮廓系数评估聚类效果,较高的轮廓系数值代表更优的聚类效果[6]。C-XGBoost 模型是一种用于电商备货预测的算法,其独特之处在于对商品聚类方法的改进,从而提升了预测的准确性。在面对电商领域庞大的数据量时,该模型通过商品聚类策略有效地减轻了每个群集内训练数据集的规模,提高了预测算法的运行效率[7-8]。

(二)基于XGBoost 算法和序列趋势的跨境电商备货预测模型

采用差分自回归移动平均模型(Autoregressive Integrated Moving Average Model,ARIMA)来分析时间序列趋势,模型的参数确定是利用载物之流的反馈(Accelerated Content Feedback,ACF)和用户访问一个网页时,从目标页面到网页上所需的资源(Page access content feedback,PACF)实现的。针对ARIMA 模型在参数选择的弊端,采用ACF、PACF 图的参数组合1,然后利用Toolboxes 中的ets()函数,确认ARIMA 模型的参数组合2,通过比较参数组合1 与参数组合2,最终确定ARIMA 模型的最佳参数配置[9]。该模式下对ARIMA 模型进行训练,利用最优参数组合的ARIMA 对序列趋势进行测算,以计算残差,如式(1)所示。

式(1)中,y0A(k)为预测值。利用假设检验来检验残差是否为白噪音,将残差序列视为随机噪声[10]。因其不符合已知分布,需收集足够多样本验证残差序列是否为白噪声。使用训练集平均残差序列,得到每个样本的平均值和在所有中位数中的位置[11-12]。结合XGBoost 算法的最优A-XGBoost 模型的流程图如图1 所示。

图1 确定最优A-XGBoost 模型

图1 中,首先对数据进行预处理和数据集的划分,并利用单位根检验时间序列的平稳性,以数据序列是否大于0.05 为界限,判定是否为平稳序列和白噪音序列。并识别和定阶A-XGBoost 模型的最优参数,以此生成残差矩阵。对参数最优选项提供筛选,并最终测试出预测结果。

(三)基于XGBoost 算法的跨境电商备货组合预测模型

在当下的物流环境中,储存环节充当着链接交易参与者的关键角色,此环节位置的决定将会对交易双方的益处产生直接影响[13-14]。其中,C-XGBoost 和A-XGBoostoost 两种方法的权值分别体现了需求特性和时序趋势对预测精度的影响。利用最小二乘方法对C-XGBoost 和A-XGBoost 进行优化,得到C-XGBoost 和A-XGBoost 的最优线性加权组合,并对其进行了改进。利用最小二乘原理,对各权值进行优化,得到各权值的最佳组合。对最小二乘算法进行导数计算,使其成为一种新的权值计算方法[15]。

二、基于XGBoost 算法的跨境电商备货预测模型的分析

(一)基于XGBoost 算法与需求特征的跨境电商备货预测模型分析

基于C-XGBoost 算法,列出备货销量与累计单品的分类管理表,将所有商品按照编号排序。记录每个商品的备货数量,再记录每个商品的销售数量,并计算每个商品的库存数量,并与备货数量和销售数量进行比较,记录每个商品的累计单品销售量,以及占据总销售额的比例,记录每个商品的销售额,以及占据总销售额的比例,基于C-XGBoost 算法预测每个商品的未来销售额。类产品对平台销量贡献显著,因此可优先将产品货源布置于国外仓库。为降低资金占用,A 类产品可在保障安全存货的前提下,依据预计备货量,采用多批次存储。B级产品建议存放于原产地仓库,订购后可通过合理运输方式,从原产地仓库运往国外仓库。C 型产品属长尾产品,仓库存货有限,可集中采购并适度增加库存。

(二)基于XGBoost 算法与序列特征的跨境电商备货预测模型分析

在数据选择方面,主要使用数据集中的销售数据和库存数据,由于跨境电商备货预测时会有许多的不确定性因素存在,因此需要用到随机抽样和不平衡数据处理方法。采用tsdisplay 函数,生成SKU_sales 的序列图如图2 所示。

图2 三种定位模式的定位误差

在图2(a)中,SKU_sales 在最初55 天内呈现明显波动,而在56 天后有轻微增长;图2(b)中,经过分解,SKU_sales 函数在接近0 的位置上变化。在R 中,使用ADF 测试,训练集合2 的P 值未超过0.01,暗示一阶微分序列平稳。通过Box-Pierce 检验,P 值低于3.331e-16,表明数据具有序列性,且P 值低于0.05,表明数据非白噪声。

(三)基于XGBoost 算法的跨境电商备货组合预测模型分析

运用SPSS 对此模型进行实证研究,5 种预测模型的评估指标如图3 所示。

图3 5 种模型预测结果的比较

由图3 可知,C-A-XGBoost 模型的预测曲线与实际值最为贴近,表明C-A-XGBoost 模型的预测精度高,其中真实销售量SKU sales 的拟合效果最好。对比ARIMA和XGBoost 方法,XGBoost 方法在多个预测指标上均显著优于ARIMA 方法,说明XGBoost 方法在融合多因素预测方面表现更为出色。将ARIMA 与A-XGBoost 进行对比分析,A-XGBoost 在对ARIMA 进行修正后的预测结果上有显著改善,特别在对时序趋势的预测精度方面,进一步凸显了A-XGBoost 相对于XGBoost 的优越性。

三、结论

研究结果表明,进行预先的客户细分能有效提升客户流失预测的效果,各预测指标均显著改善。结合XGBoost 算法进行预测模型建立,并运用C-A-XGBoost 进行预测。实证分析证实C 型产品属于长尾产品,其来源仓库仅有部分存货,适宜集中采购并适度增加库存,也可相应减少订单。利用R 中的Box 测试功能,进行白噪声度测试。Box-Pierce 测试结果显示P 值低于3.331e-16,表明序列非白噪声。稳定性与白噪声分析表明一阶微分的SKU_sales 序列非白噪声且稳定。A-XGBoost 与C-XGBoost 方法保持一致,相较于A-XGBoost和C-XGBoost 方法,该方法具有更高预测准确度。在未拆分的SKU_sales 序列图中,初期的55 天表现出明显波动,随后的56 天销量略有增长。随着跨境电商企业国际布局加深,市场竞争愈发激烈。未来研究可侧重于不同市场环境下备货预测问题,以协助企业更好地应对市场变化。

猜你喜欢
备货残差跨境
基于双向GRU与残差拟合的车辆跟驰建模
鱼粉:外盘持续高位成交积极,节前终端备货现货坚挺上涨
错过了这次大备货,可能明年春天才能用上RTX30显卡
基于残差学习的自适应无人机目标跟踪算法
水产料优惠10%!江苏好润饲料逆“市”推出饲料优惠政策,备货抓紧
跨境支付两大主流渠道对比谈
在跨境支付中打造银企直联
基于递归残差网络的图像超分辨率重建
关于促进跨境投融资便利化的几点思考
eBay卖家不得不看的备货清单:2017年度万圣节主题趋势