终端产品推荐预测模型

2020-08-06 15:01顾强
计算机时代 2020年7期
关键词:卷积神经网络深度学习

顾强

摘要:提出了一种用于手机终端产品推荐的预测模型。详细设计了用户特征提取模块和终端产品特征提取模块;结合多层感知机模型和基于文本的卷积神经网络模型对用户和终端产品的特征进行提取;利用提取到的特征,进行评分预测和终端产品推荐。实验结果表明,该模型在经过一定时间的训练后,参数得到优化,可以取得较稳定的预测推荐结果。

關键词:深度学习;卷积神经网络;推荐模型;预测算法

中图分类号:TP393 文献标识码:A 文章编号:1006-8228(2020)07-30-04

0引言

推荐系统在今天的网络平台中无处不在,无论是网络购物、社交平台、音乐、新闻网站等等,都能见到系统推荐的商品列表,并可针对个性化偏好进行推荐”。当今,随着智能终端产品的发展日新月异,面对纷繁复杂的终端产品,如何选择一个适合自己的产品,是许多消费者亟待解决的问题。

本文以终端手机品牌型号推荐为例,通过深度学习技术建立一个手机终端产品的推荐预测模型,研究消费者选购终端产品时的喜好,从而可以为终端产品厂商提供进一步研发的方向。

深度学习作为一个新兴技术,现已在图像识别、语音处理和交通控制等各领域取得了成功的应用。首先,深度学习可通过人工神经网络强大的非线性学习能力,从庞大的数据样本中抽象出用户和商品数据集的特征,获取用户和项目隐含的特征表示。其次,深度学习自动学习特征的能力是非常出色的,它能够将不同结构层次的数据特征提取出来,并统一量化特征,映射到一个抽象空间中。因此可以考虑将其与传统商品推荐算法进行结合,进而最大化有效利用海量的数据,避免了人工特征提取的繁琐与困难,在计算上具有一定优势。所以,本文提出了一种基于卷积神经网络的终端产品推荐预测模型。

1基于卷积神经网络的特征提取模块

在终端产品推荐预测模型中,首先要进行用户特征和终端特征的提取。基于卷积神经网络的终端产品特征提取模块可分为三个子模块:用户特征提取模块,终端品牌特征提取模块和基于神经网络的训练模块。

1.1用户特征提取模块

终端产品推荐模型的功能是通过学习用户、终端产品和评分三个数据来获取用户对不同类型终端产品的偏好,从而将符合相应用户偏好的终端产品推荐给用户。其中的核心模块:两大信息的特征提取模块本质上是一个筛选分类功能的选择器,通过神经网络的强大学习功能来从输入的用户信息和终端产品属性的组合中提取用户和终端产品的特征,之后推荐模块对这两类特征采取一定的处理策略来进行打分预测。用户特征提取模块图如图1。

在本文的推荐模型中,训练集所包含的数据有:用户的ID,性别,年龄和职业。当数据经过嵌入层后,分别量化为四个特征,然后经过神经网络的两个全连接层,用户的四个功能组件进行拼接和集成,以获得完整的用户功能。

嵌入层的功能是将用户ID,用户性别,用户年龄和职业设置了不同的嵌入矩阵。经过训练逐步调整各嵌入矩阵权值使得提取得到的局部特征向量越来越具有代表性。

全连接层的功能是将模型学到的分布式特征共同映射到一个大的特征空间中,由于该层使用之前获取的所有局部特征,因此称为完全连接层。用户的全连接层将之前提取到的四个局部特征通过加权处理获得完整的用户特征向量。

1.2终端产品特征提取模块

终端产品特征提取模块同样是以一个神经网络为框架,将终端产品ID、终端的型号类型作为嵌入层输入,终端的品牌作为文本卷积网络的输入,并且单独提取该特征。

如图2所示,终端的特征提取模块与用户模块类似,先对终端ID和型号类型分别进行嵌入层处理后,由于一部终端手机可能具有多个类型标识,所以先进行一次局部的全连接,之后再和品牌名称特征进行二次连接,最终得到完整的终端特征。

1.3基于文本的卷积神经网络训练模块

考虑到本文中的模型用于处理终端产品名称,因此将终端产品的名称用作卷积神经网络的输入。基于文本的卷积神经网络被分为四层:输入层、卷积层、汇集层和输出层。

(1)输入层:将终端的品牌型号名称转为相应的嵌入矩阵,方便后续特征提取。

(2)卷积层:在这一层中,模型选用了窗口大小不相同的众多卷积核对嵌入层输出结果做卷积操作,生成可变长度的特征向量。利用迭代更新的权重矩阵w对这些向量求加权和。接着,把结果输入到激励函数中。本文模型选用了Relu函数,记为:

(3)池化层:选取池化窗口中特征值最大的值作为特征来提取。可将其视作特殊的一次卷积运算,经过池化层后模型便获取到更加“浓缩的”输出结果。

(4)输出层:输出层接受上述经过卷积、池化的向量作为输入,并对其进行分析进一步完成对于语句的特征提取工作。

2基于卷积神经网络的推荐预测模型

2.1基于卷积神经网络的推荐预测流程

完成数据特征提取之后,就可以开始进行终端产品推荐预测模型的训练。模型中通过反向误差反馈调整权值矩阵,可以提高准确率和精度。模型的具体实现流程如图3所示。

基于卷积神经网络的推荐预测实现步骤如下。

(1)预处理用户数据、终端数据,以便后续的网络可以使用共享权值矩阵进行特征的提取。

(2)初始化神经网络。即经过实验确定神经网络数据矩阵的大小、维度,激活函数的确定,以及损失函数的计算方式等。

(3)对获取到的数据进行处理,之后利用随机数种子将预先获取到的数据划分成训练集和测试集。

(4)选取训练集的部分数据作为输入数据,根据嵌入层、文本卷积神经网络中的各层神经元的输入计算输出,直至达到全连接层II。

(5)提取出训练后的用户和终端数据的特征,实现待预测的终端产品评分。利用训练集的预测结果和实际评分结果,通过损失函数的计算,反向调整每一层卷积核的权值矩阵w与偏置向量b。

(6)当神经网络的评分预测结果与实际结果是在合理范围内,或者迭代步数完成到所预设的要求时,训练结束。

(7)完成上述操作后,推荐模型输入测试用例获取对应的终端产品推荐列表,算法结束。

2.2基于全连接层的评分预测算法

本文采取全连接层预测算法,来处理用户特征向量和终端产品特征的特征向量这两个特征矩阵。全连接层计算评分的算法如图4所示。

图4中,左侧为用户i特征向量,右侧为终端品牌类型j的特征向量,全连接层通过计算每一个特征分量给出最后评分预测。即采用一个全新的权值矩阵(训练学习得到)分别对用户特征和终端品牌类型特征进行累积、连接,相当于对经过筛选过滤的特征再次进行一遍特征提取,输出结果的打分范围是0-5分。用户特征矩阵和终端产品特征矩阵经过“再加工”后,可以得到用户对不同品牌及类型的终端产品的评分预测。

2.3终端产品推荐预测算法

现阶段终端品牌类型的主要推荐方向分为三大类:推荐同类型的终端产品,推荐该用户可能感兴趣的终端产品,和用过该终端产品的人还关注了哪些终端产品。根据公式(2)计算待测终端产品的特征向量与完整的终端产品的特征矩阵的余弦相似度。其中u;和mi分别代表待测用户终端产品的特征向量与完整的终端产品的特征向量。余弦值从-1到1变化,以表示相似性越来越高,从而说明两类终端产品之间的相似性更大。

本文通過处理待推荐用户的特征向量与完整终端特征矩阵来计算评分,获取评分最高的前k个终端用于推荐;然后分别计算出这k个用户最喜欢的终端是什么,来作为对应用户的推荐结果。

3终端产品推荐预测结果的分析与比较

本实验平台是在Anaconda集成环境下搭建的Tensorflow2.0。

本文选取四组有代表性的数据进行实验,其中,数据集合的数据量说明如表1所示。

本文选取推荐系统中常用的准确率和召回率作为评估指标,选用获取到的所有评分记录作为实际集合,将用户、终端产品数据和评分数据(0-5分)通过基于卷积神经网络的终端产品推荐预测模型,记录下每位用户对终端产品的预测评分,高于3分则视作推荐,否则视作不推荐。实验时基于推荐模型预测的打分结果和用户实际评分对应的标签对比,来确定准确率和召回率。实验中随机选择部分用户,该模型对他们进行终端产品推荐预测的准确率和召回率如表2所示。

本文提出的推荐预测模型在训练初期准确率较低,是因为在训练途中需要不断地调整相关参数,之后在进行了一定时间的训练后才对这一数据集的终端产品推荐有了一定的稳定结果,可见模型训练中的参数调整也是非常重要的。表2中,样本数为实验时所获取到的用户数据对应有多少条终端产品评分项。计算时以现有评分项作为终端产品推荐的评估标准。可以看出,本文中的终端产品推荐预测模型准确率大约在82%上下波动,召回率约在55%上下波动,预测结果是比较理想的。

4结束语

本文提出了一种基于卷积神经网络的终端品牌型号推荐预测模型,该模型首先提取用户特征和终端特征,然后进行学习和训练,随后得出推荐预测得分,从而可以在用户选择手机品牌和型号时,精准有效地进行推荐。随着5G技术的发展,精准地向消费者进行终端产品推荐,必然可以给用户带来更好的消费体验,也给商家带来更多的商机。

猜你喜欢
卷积神经网络深度学习
基于卷积神经网络温室智能大棚监控系统的研究
基于深度卷积神经网络的物体识别算法
有体验的学习才是有意义的学习
电子商务中基于深度学习的虚假交易识别研究
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
深度学习算法应用于岩石图像处理的可行性研究
基于卷积神经网络的树叶识别的算法的研究