刘春阳,申 莹,赵永翼
(沈阳师范大学,沈阳 110034)
在最近几年,随着互联网在各个领域的发展,将人类带入了快速网络经济时代,互联网+在各个领域的应用表现出很大优势,大数据在应用中有着很大的优势,会带给人类在网络社会飞速的发展,但也带来了很多问题,比如“信息过载”的问题,所以用户不得不从浩如烟海的信息海洋获取真正需求的信息。推荐系统能够成为缓解“信息过载”最有效的方法之一,已经应用到电子商务,电影,视频等很多领域。并取得了很大的进步。在个领域也有了一定的成果。我们利用协同过滤的方式的矩阵分解对用户构建喜好矩阵。得到隐性向量,组成推荐模型,其研究具有很大的学术价值以及商业应用价值,目前最经典的是协同过滤算法,同时也是应用最广泛的算法。
玻尔兹曼机是一种神经网络,由Hinton和Ackley两位学者作为研究学者在不同的领域不同的目的同时提出的BM学习机,通过从训练样本得到的隐层神经元状态上执行马尔可夫链抽样过程,隐藏的神经元和可见的神经元是组成BM的主要神经元。BM有很强的学习能力主要是能够学习数据规则,且较为复杂的。但是,受限玻尔兹曼机的训练时间很长。因为隐藏层神经元独立于给定的训练样本并且神经元之间不连接。这也让从属数据的期望值变得容易。其状态为1-2,状态1表示抑制下的神经元,状态2表示激活下的神经元。因此提出了一种受限玻尔兹曼机的结构。如图1所示,包括可见层v和隐藏层h,两层节点上下都是连接的,而左右相互之间没有连接。
图1 受限玻尔兹曼机示意图
我们通过学习深度学习学习到使用者表示的隐性和向量的低维矢量来实现建议的协同过滤算法经常面临可伸缩性不足的问题。但他们中的大多数现在推荐协同过滤应用程序。
我们利用使用者反馈给我们的隐式数据经过深度学习让模型输出等于输入。但要保证得到的隐式数据维度要一致,提取数据进行神经协同过滤,将隐性数据串联到一起组成使用者与项目关系。提高准确性,利用辅助信息,可以将推荐信息推荐给使用者,使用户能够在海量的数据中找到准确的信息。
基于受限玻尔兹曼机的协同过滤方法
受限玻尔兹曼机是玻尔兹曼机的一种特殊拓扑结构,基于RBM的协同过滤。推荐系统传统的定义可以理解为采集用户信息,结合推荐模型帮助用户选择商品或者提供建议的过程。这就需要数据得收集,预处理,推荐算法和产生推荐3部分组成。例如一个典型的电影推荐系统一般包括含有N个用户的用户集合U={u1,u2,u3,…,uN}和含有M个项目的项目集合I={i1,i2,i3,…,iM},使用者在对I评价时只有一小部分,这一小部分的会表示成RNM,得到的数据稀疏,所以推荐的信息不够准确,因此,我们采用一个0-1向量r表示电影是否被评过分,通过加入这种辅助数据得到了一种条件RBM。模型的结构如图2所示。
图2 基于RBM的协同过滤方法的模型结构
依据RBM模型可见单元和隐层单元之间的独立性质,当给定可见状态时,可见层单元A和隐层单元C的条件概率可以表示为:
式中,K和F表示用户和隐变量的数量。
本文对深度学习应用于推荐系统分析与研究,可以知道深度学习不仅可以应用到推荐系统中,还可以运用到各个领域,本文将深度学习技术融入推荐系统中,讨论了推荐算法的分类及算法的思想,并着重分析了协同过滤算法,阐释推荐算法所存在的问题,试验方法,和评测指标,通过对协同过滤算法的研究,可以反映出不同的用户不同的偏好度,同时也可以提高推荐的精确度。现在,在很多研究中使用深度学习来解决问题,尽管目前信任是个问题,但它终将被解决。我相信在未来深度学习会成为一项很重要的技术手段。