赵茜茜 张洋溢 聂焱
摘要:现针对一种实用新型指纹锁拉链,研究其市场需求,即客户收入、喜好、年龄等对于该产品的需求度。使得该产品在投入市场之前,能有一个较准确的定位。现采用集成学习的思想,将两个基础预测模型,集成成一个较强的预测、分类模型,能够为数据集建立一个较为出色的分类模型和预测模型,能够用于预测一个新的案例是否对指纹锁拉链产品有需求。
关键词:需求预测;集成学习;指纹锁拉链
中图分类号:TN919.5 文献标识码:A 文章编号:1007-9416(2019)07-0050-02
0 引言
日常生活中人们使用的背包上的拉链基本上都是没有加锁的,或者是旅行箱上使用的密码锁,但是这种密码锁有两个明显的缺点,其一是经常会出现忘记密码的情况,给人们带来生活的不便,其二是会出现人们因为密码锁麻烦而很少去使用的情况,因此很多这样的密码锁没有起到其本质加强防盗系数的作用,成为一种摆设。
因此推出一种安全、便捷的指纹锁拉链装置。延伸加工拉链产业链,降低指纹锁成本,提高产品附加价值,切实提高箱包安全性能。该产品推向市场之前,需要对其进行市场需求分析。
目前对于需求预测的方法多采用单一预测算法。但是任何算法都有优劣,无法达到完美效果。因此可采用构建并结合多个学习器来完成学习任务的思想,即集成学习,来对调查问卷获得的数据集进行分类训练、学习。能够为数据集建立一个较为出色的分类模型和预测模型,能够用于预测一个新的案例是否对指纹锁拉链产品有需求。
1 数据特性描述
1.1 数据来源
数据来源于调查问卷。问卷调查采用重点对象的抽样调查形式,通过对城市的经济、人口、社会习俗、箱包消费、消费观念等方面分析,将大学生群体作为本次调查的代表人群。发放问卷800份,回收521份,回收率为65.1%,可利用125份,可利用率为15.6%。
数据集的全名为对于带有指纹锁拉链的背包(包括斜挎包)的需求调查。可利用实例共计125个。
1.2 具体数据阐述
数据集数据来自用户通过线上、线下问卷形式的调查。共有七个问题,分别如表1。
现将前六个问题回答结果用0和1表示,第七个问题回答结果用YES和NO表示。
2 采用个体学习器进行预测
2.1 基于误差逆传播算法的多层感知机模型
多层感知机(Multi-Layer Perception,MLP),也叫前馈神经网络,后文简称为神经网络模型。模型通常由一个输入层、一个或多个隐层和一个输出层构成。
使用100组数据训练,25组数据测试。训练的过程就是对参数进行不断的调整和优化,通常标准是均方根误差RMSE低于0.1或是训练达到一定的总周期数。经过不断学习训练,选取的隐层个数及其节点数、学习率和动量如表2,训练次数均为5000次。
当前BP算法训练并测试的结果显示有两个错误。该算法测试结果的混淆矩阵如表3。
2.2 向量机(SVM)
SVM(Support Vector Machine)中文名为支持向量机,是一个有监督的学习模型,通常用来进行模式识别、分类以及回归分析。SVM方法是通过一个非线性映射p,把样本空间映射到一个高维乃至无穷维的特征空间中(Hilbert 空间),使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题。
同样使用100组数据训练,25组数据测试。该算法的均方根误差如表4。
SVM算法用于此例,效果也不是很好。测试结果显示有4个错误。该算法测试结果的混淆矩阵如表5。
3 集成学习
集成学习基于反向传播算法的多层感知机和逻辑回归模型在测试集的效果表现欠佳,不能作为理想的需求预测模型。现在使用集成学习的思想来处理。集成学习就是训练多个模型,按照一定的结合策略进行集成。
当然并不是所有的模型都可以用于集成学习,基本条件是要个体模型有较高准确率,个体学习器间的相关性小。文中已经使用了BP神经和支持向量机模型对指纹锁拉链产品市场需求进行了预测,预测效果都较高,但是没有达到理想条件,且两个模型之间没有相关性,故可以用来集成。
现使用一种集成学习方法为预测融合法,通过基础模型分别进行一次预测,会产生两种不同的预测结果,将预测结果用來训练一个新模型来进行预测,从而生成一个最终的预测结果。新模型采用的算法是随机森林。表6给出模型集成后的结果。
融合后,测试发现,该模型测试结果准确达到100%。测试结果0个错误。新模型测试结果的混淆矩阵如表7。
4 结语
该集成学习的思想,将两个基础预测模型,集成成一个较强的预测模型,提高了预测结果的准确性。由测试结果看出,该新模型能较好的学习两个基础模型的正确预测结果,规避错误结果,使得最后分类结果正确率达到100%。因此通过基于集成学习的预测融合法能够较好地对案例进行预测得到更为准确的结果。
由测试结果分析发现,该方法仍存在很大改进空间,可以在具体的实施中可根据不同的实际背景对模型进行修改,根据模型的核心方法,能较为方便地解决问题。
参考文献
[1] Ferreira R P , Martiniano A , Ferreira A , et al. Study on Daily Demand Forecasting Orders using Artificial Neural Network[J]. IEEE Latin America Transactions,2016,14(3):1519-1525.
[2] 殷峻暹,陈守煜,邱菊.基于遗传与BP混合算法神经网络预测模型及应用[J].大连理工大学学报,2002,42(5):594-598.
[3] 齐志成.基于BP神经网络模型的商洛市卷烟需求预测[J].湖南农业科学,2017(1):86-89.
[4] 刘帅,曹国忠,张凤伟,等.基于多方法融合的需求预测与分析[J].包装工程,2019(4):221-226.