韦玉辉,唐 欣,许仲童,丁雪梅,吴开明
基于LSTM深度学习模型的羽绒材料价格预测研究
韦玉辉1,2,3,唐 欣1,许仲童1,丁雪梅*2,吴开明4
(1. 安徽工程大学 纺织服装学院,安徽 芜湖 241000;2. 东华大学 服装与艺术设计学院,上海 200051;3. 应急管理部 上海消防研究所,上海 200032;4. 安徽古麒绒材股份有限公司,安徽 芜湖 241300)
为解决目前羽毛绒材料定价主要依据经验而缺乏理论支撑和预测精度较低的问题,本文提出利用长短期记忆网络(LSTM)深度学习方法对羽毛绒材料价格进行自定义研究,以2015年-2020年6年的羽绒金网数据为依据,对其构建模型进行训练求解,并与线性自回归移动平均(ARIMA)数理统计模型和最小二乘支持向量机(LS-SVM)浅层机器学习模型预测效果进行对比分析。结果表明:在长期预测中,预测精度从高到低依次为ARIMA 模型、LS-SVM 模型、LSTM深度学习预测模型;在短期预测中,预测精度从高到低依次为LSTM深度学习预测模型、LS-SVM 模型、ARIMA 模型。同时还发现:无论长期短期预测中,不同种类的羽毛绒价格预测精度趋势相同,即预测精度仅与资本属性有关,与资本所述类别无关。研究结论既可为羽毛绒企业进行羽毛绒材料准确定价提供理论依据,也为人工智能技术广泛应用于量化投资领域提供实践经验。
羽毛绒材料;羽绒金网;深度学习;定价模型;预测评测
羽毛绒材料因其具有保暖、质轻、手感蓬松等优良性能,使其成为冬季御寒服装或者寝具的首选絮填材料之一,故其需求具有明显的季节性和易受气候影响特征,导致其价格也存在明显的非线性、季节波动等特点[1-3]。同时,我国每年填充羽毛绒材料年产量高达14万吨左右,占世界填充羽毛绒材料总产量的60%-70%,是当前世界上羽毛绒材料最大的原料生产国和出口国,且其产业属于制约我国出口贸易经济的重要支柱产业之一[2,4,5]。而且,羽毛绒材料既是养殖农户的主要经济来源,也是纺织服装的重要生产原料[1,3,6]。如果价格过低,影响养殖农户的经济收入,降低其饲养积极性,减少我国羽毛绒材料产量,影响世界羽毛绒材料市场的健康良性发展[1,3,5]。如果价格过高,导致下游纺织服装生产企业的原料成本骤增,企业利润下降,制品价格上涨,消费者权益受损[1,2]。因此,系统研究羽毛绒价格走势,准确预测其价格对养殖农户和羽毛绒材料生产或相关下游企业促进生产或降低库存成本,提高产品竞争力均具有重要意义[1,3]。否则很容易出现因羽毛绒价格的大起大落波动引发对养殖农户和羽毛绒材料或者相关下游生产企业的负面影响,甚至出现恶意操纵羽毛绒材料市场价格的现象,制约其产业良性发展[1,6]。
然而,目前关于羽绒价格制定主要依据经验,存在价格制定缺乏理论支撑、预测精度较低、滞后等问题,故对其准确合理定价开展研究显得尤为重要[1,3]。此外,随着人工智能技术、机器学习算法的不断发展,利用其应用于量化投资领域是近期研究热点之一,尤其是通过挖掘时间序列长短期依赖关系的长短期记忆网络(LSTM)深度学习模型在价格预测中极具优势[1,7,8]。另外,羽毛绒材料素有服装材料“软黄金”之称,在一定程度上,也属于投资期货产品[1,9,10]。
因此,本文提出以LSTM深度学习方法为基础,通过对羽绒金网上发布的2015年-2020年6年间的每天羽绒材料价格数据的研究分析,探究其变化规律,并在其基础上,构建其价格预测模型。引入线性自回归移动平均(ARIMA)数理统计模型和最小二乘支持向量机(LS-SVM)浅层机器学习模型作为参照,借助均方根误差(Root Mean Squared Error, RMSE)、平均绝对误差(Mean Absolute Error, MAE)、平均绝对百分比误差(Mean Absolute Percentage Error, MAPE)、校正决定系数(Adjusted Coefficient of Determination, R2)对三种模型的预测精度进行定量评测及对比分析。
为提出一种适用于羽毛绒材料准确定价的方法或预测模型,本研究以来自于羽毛绒材料价格的专业网站-羽绒金网上发布的2015年1月1日-2020年12月31日,6年间的羽毛绒每日的价格数据作为实验数据,分别采用数理统计方法、浅层机器学习方法和深度学习方法,构建羽绒材料定价的线性自回归移动平均(ARIMA)模型、支持向量机(SVM)模型和长短期记忆网络(LSTM)模型,并利用SPSS21.和 Python深度学习软件对模型进行求解分析。为进一步评测预测模型的长短期预测效果,提出分别采用30天(短期)和120天(长期)的羽绒价格数据作为短期、长期测试数据,预测未来1天的羽毛绒材料价格,再利用均方根误差(RMSE)、平均绝对误差(MMAE)、平均绝对百分比误差(M MAPE)、校正决定系数(R2)四个统计学评测指标对所构建模型的长短期预测效果进行综合评测。以期拓展量化研究方法在实体经济应用的科学性与合理性。
为准确预测羽绒价格,本研究所用的实验数据为羽毛绒材料价格的专业网站-羽绒金网上发布的2015年1月1日-2020年12月31日,6年间的不同品种(白鹅绒WGD、灰鹅绒GGD、白鸭绒WDD、灰鸭绒GDD)、不同含绒率(50%、60%、70%、80%、85%、90%、95%)的羽绒材料每日价格数据,共10220条数据。其中,前95%的数据作为输入的训练集数据,剩下的数据作为验证数据集。
此外,为消除因羽毛绒材料自身价格量纲差异导致的其预测精度下降和预测速度缓慢,故在建模过程中,所有数据均进行零-均值(Z-score)规范化处理,处理公式如下:
为准确评测所建模型的预测效果,选取了常用的均方根误差(Root Mean Squared Error, RMSE)、平均绝对误差(Mean Absolute Error, MAE)、平均绝对百分比误差(Weighed Mean Absolute Percentage Error, WMAPE)、校正决定系数(Adjusted Coefficient of Determination,R2)作为评价指标。各指标具体计算公式如下[8,11,12]:
首先,对2015年1月-2020年12月6年间,羽绒金网上公布的不同品种和含绒率的羽毛绒材料价格进行取对数处理和一阶差分处理,并利用增广迪基-富勒(Augment Dickey-Fuller,ADF)检验其数据是否符合模型的平稳性要求;其次,结合2015年1月-2020年12月6年间的羽毛绒材料价格数据,利用赤池信息量准则(Akaike Information Criterion,AIC)和贝叶斯信息准则(Bayesian Information Criterion,BIC)寻求ARIMA中的p,d,q最佳参数取值,即完成适合羽毛绒材料价格预测的模型的构建;最后再利用所构建模型,进行羽毛绒材料价格预测。具体模型如下[9-11]:
核函数选择RBF 核函数,具体表达式为:
首先,利用Hurst指数检验羽绒金网获取的羽毛绒材料价格历史数据其是否具有长时记忆特性;其次,依据权重和偏差值,将数据依次通过输入层输入到输入门、遗忘门、输出门,并分别借助sigmod 函数和tanh 函数,完成其数据的剔除、保留、更新、输出。具体计算过程及模型结构如下[11-13]:
为衡量ARIMA模型、LS-SVM模型和LSTM模型对羽毛绒材料价格的长期预测效果,选用2021年1月1日-2021年4月30日120天的羽毛绒价格数据作为测试数据集,预测结果如表1所示。由表1可知,在长期预测中,三种模型中,ARIMA模的预测精度最高、LS-SVM模型居中,LSTM模型预测效果最差,但三种模型的预测精度差异不大。这是因为羽绒材料属于季节性需求材料,易受环境温度和市场流行趋势等因素的影响,如果时间跨度太长会跨越不同季节,而不同季节间的气温差距较大(同一季节相对稳定),尤其是季节交换期,其气温变化较大,故LSTM模型的长期预测效果不佳。同时,流行具有稍纵即逝的特性,时间跨度太长也会进一步加剧羽毛绒价格产生较大波动,使得预测值滞后于实际波动值,LSTM模型的长期预测效果下降。这也在一定程度上说明仅仅凭借羽绒金网的历史数据进行羽毛绒价格的预测,会导致羽绒价格预测精度较低,故应考虑与其相关的需求与市场因素,才能提高其预测精度。同时,还发现:三种模型中,不论何种模型,同一种模型,不同材质的预测精度差异不大,整体趋势基本相同。说明所构建的模型不受预测对象自身特性(含绒率、品种)的影响,仅与预测对象本身的材料属性有关,与所述的种类无关。
表1 羽毛绒材料价格的长期预测效果
注:本表仅列出含绒率为90%的白鹅绒、白鸭绒、灰鹅绒、灰鸭绒的预测效果。
为衡量ARIMA模型、LS-SVM模型和LSTM模型对羽毛绒材料价格的短期预测效果,选用2021年5月1日-2021年5月30日30天的羽毛绒价格数据作为测试数据集,预测结果如表2所示。由表2可知,在短期预测中,预测精度从高到低均依次为LSTM模型、LS-SVM模型和ARIMA模。其中,ARIMA模型的预测效果最差,这是因为ARIMA模型属于多元线性回归的数理统计模型,其是以统计学为基础,只能捕获时间序列中的线性特征,对数据中的非线性特征较难提取,故对于时间跨度较大带来的数据随机波动较大、非线变化明显的预测精度较低;LS-SVM模型居中,这是因为LS-SVM模型属于浅层机器学习模型,虽然能对羽毛绒价格数据的非线性规律进行有效捕捉,相对于ARIMA模型提升了预测精度,但其特征学习能力有限,故其预测能力受到一定制约,即精度提高不多;LSTM模型预测效果最佳,这是因为LSTM模型属于深度学习模型,其具有更深层次的结构,且强调对特征的学习,能较为准确地描述输入与输出的复杂关联,故对时序数据的预测效果通常优于数理统计模型及支持向量机模型。但目前预测仅依靠历史数据,未考虑需求的季节性和流行因素等市场情绪对其的影响,故其对羽毛绒材料价格预测精度仍有可以提升的空间。同时还发现:不论何种羽毛绒材质,三种模型中,其短期预测精度趋势相同(LSTM模型均呈现最佳的预测效果,LS-SVM模型居中,ARIMA模型的预测效果最差)。 这说明LSTM模型是最适合作为羽毛绒材料价格短期预测的模型。
表2 羽毛绒材料的短期预测效果
注:本表仅列出含绒率为90%的白鹅绒、白鸭绒、灰鹅绒、灰鸭绒的预测效果.
综合比较表1和表2发现,对于ARIMA 数理统计模型而言,长期预测精度优于短期预测精度,这是因为统计模型的预测精度与样本的数量有关。在长期场景中,预测样本数据量较大,更符合统计规律,故其预测精度较佳。而短期场景中,预测样本数据较少,精度较低。这说明ARIMA 预测模型适用于时间序列的长期预测和处理具有一定规律性的平稳性数据场景。深度学习模型,在短期场景的预测效果明显优于长期场景,这说明在深度学习模型中,邻近数据的参考度更大。传统学习模型,在长短期场景中的预测效果差异不大,这说明期预测精度不受样本数据的影响,但整体的预测精度均低于深度学习模型。同时,还发现:不论长期短期预测中,三种模型,对不同材质的预测精度趋势相同,基本无差异,这说明预测模型的精度与预测对象的材质属性无关,仅与预测对象的资本属性有关。
为探求一种高效的适用于羽毛绒材料价格预测的最佳预测模型或方法,本文选取了目前金融投资预测领域较为常用的线性自回归移动平均(ARIMA)数理统计模型、最小二乘支持向量机(LS-SVM)浅层机器学习模型和长短期记忆网络(LSTM)深度学习模型,并以羽绒金网上公布的2015年-2020年6年间羽毛绒材料价格数据作为模型结构设计数据集,以2021年1月1日-2021年4月30日,及2021年5月1日-2021年5月30日作为长短期测试集,进行预测模型的长短期预测效果的分析评价。结果表明:在长期预测中,ARIMA 模型表现出最理想的预测精度,LS-SVM 模型稍逊色于ARIMA模型,LSTM深度学习预测模型则预测效果最不理想;在短期预测中,LSTM深度学习预测模型明显优于线性自回归移动平均(ARIMA)数理统计模型、最小二乘支持向量机(LS-SVM)浅层机器学习模型。说明在进行羽毛绒材料价格预测时,除需考虑历史数据及其特性,还应考虑与其相关的市场需求及流行因素。同时,还发现,无论长期短期预测中,不同种类的羽毛绒价格预测精度趋势相同(长期预测中,预测精度从高到低依次为ARIMA模型>LS-SVM模型>LSTM模型;短期预测中,预测精度从高到低依次为LSTM模型>LS-SVM模型>ARIMA模型)。说明预测模型的精度与预测对象的材质属性无关,仅与预测对象的资本属性有关。研究结论既拓宽了深度学习理论及其技术的实践应用领域,也为羽毛绒企业进行羽毛绒材料的准确定价提供一定理论依据。
[1] 姚澜. 我国羽绒企业出口营销策略研究[D]. 蚌埠:安徽财经大学, 2017.
[2] 陈浩. 基于网络销售的国内品牌女士羽绒服设计研究[D]. 上海:东华大学, 2017.
[3] 李会改, 张振方, 程浩南, 等. 睡袋用木棉/羽绒/涤纶填充料配比的优化分析[J]. 上海纺织科技, 2018, 46(09): 44-47.
[4] 胡美桂. 羽绒蓬松度检测方法对比研究[J]. 针织工业, 2018, (03): 75-77.
[5] 鲁婕. 萧山羽绒产业集群竞争力研究[D]. 杭州:浙江工业大学, 2012.
[6] 张立杰, 朱新杰. 我国棉花价格长期走势与短期预测--基于差分自回归移动平均模型(ARIMA)的分析[J].价格理论与实践, 2012, (06): 53-54.
[7] 张秀美, 孙永剑, 郭亮伟. 面向大批量定制的基于改进的LS-SVM服装需求预测模型[J]. 纺织学报, 2010, 31(05): 141-145.
[8] 唐甜甜, 周伟. 面向深度学习的商品销售额预测研究[J/OL]. 重庆理工大学学报(自然科学),1-7[2021-11-09]. http://kns.cnki.net/kcms/detail/50.1205.T.20210914.1808.012.html.
[9] 彭桐歆, 韩勇, 王程, 等. 基于混合深度学习模型的短时地铁客流量预测[J/OL].计算机工程, 1-13[2021- 11-09]. https://doi.org/10.19678/j.i ssn.1000-3428.0061 309.
[10] 张蕾, 孙尚红, 王月. 基于深度学习LSTM模型的汇率预测[J]. 统计与决策, 2021, 37(13): 158-162.
[11] 沈虹, 李旭, 潘琪. 基于深度学习长短期记忆神经网络的有色金属期货市场预测研究[J]. 南京理工大学学报, 2021, 45(03): 366-374.
[12] 洪小林. 基于LSTM+MIDAS深度学习模型的电力需求预测[J]. 能源与环保, 2021, 43(06): 229-235.
[13] 李国祥, 马文斌, 夏国恩. 基于深度学习的物流需求预测模型研究[J]. 系统科学学报, 2021, 29(02): 85-89.
Study on the Price Prediction of Down Material based on Depth Learning Model of LSTM
WEI Yu-hui1,2,3, TANG Xin1, XU Zhong-tong1, DING Xue-mei2, WU Kai-ming4
(1. College of Textile and Clothing, Anhui Polytechnic University, Wuhu Anhui 241000, China; 2. College of Fashion and Design, Donghua University, Shanghai 200051, China; 3. Shanghai Fire Research Institute of MEM, Shanghai 200032, China; 4. Anhui Guqi Down Incorporated Company, Wuhu Anhui 241300, China)
In order to solve the problem of the forecast-pricing of down material based on experience, due to the lack of theoretical support and low precision of predictive ability, self-definition study of down material price was proposed by the depth learning method of long-term and short-term memory network (LSTM), and was trained and solved based on the data of 6 years from 2015 to 2020, the forecasting results were compared with the linear autoregressive moving average (ARIMA) mathematical statistical model and the Least square support vector machine (LS-SVM) shallow machine learning model, The results show that in the long-term prediction, the order of prediction precision from high to low was ARIMA model, LS-SVM model and LSTM depth learning prediction model; in the short-term prediction, the prediction accuracy from high to low was LSTM depth learning prediction model, LS-SVM model and ARIMA model. And the results showed that the forecast precision of different feather price had the same trend in both long-term and short-term prediction and the forecast precision was independent of capital category instead of capital attribute. The research not only provides theoretical basis for down material pricing, but also provides practical experience for AI technology to be widely used in quantitative investment.
down material; gold mesh of down; deep learning; pricing model; prediction and evaluation
丁雪梅(1969-),女,教授,博士生导师,研究方向:纺织品护理.
安徽省纺织工程技术研究中心和“纺织面料”安徽省高校重点实验室2021年度联合开放基金项目(2021AETKL20);安徽工程大学校级科研项目(Xjky03201908);消防应急救援装备应急管理部重点实验室开放课题(2020XFZB09);2021年省级大学生创新创业训练计划项目(S202110363229);安徽省高等学校自然科学研究项目(KJ2020A0352);2022年安徽工程大学校大学生科研项目(2022DZ18);2022 年度安徽工程大学-鸠江区产业协同创新专项基金(2022cyxtb7).
TP391.9
A
2095-414X(2022)06-0054-05