机器学习的个性化推荐算法

2019-12-03 07:04王晓佳

电子技术与软件工程 2019年15期

文/王晓佳

1 机器学习的个性化推荐算法的发展现状及意义

随着互联网的发展，一直存在着信息过载现象，在这个过程中有很多值得称赞的解决方案。从原来的分类信息网站,由网址之家表示,雅虎等为代表的搜索引擎百度和谷歌,个性化推荐系统的今天,它为用户提供了合适的选择商品,音乐,电影等,满足用户的需求是一个许多商业项目成功的关键因素。随着移动终端和智能可穿戴设备的普及，数据的获取变得越来越便宜，商家有条件获取大量的用户相关数据。据统计，淘宝每天产生数千万笔交易，产生的数据近20TB。随着谷歌Map Reduce算法的发布，大规模集群计算即云计算的性能变得越来越强大，为大数据分析提供了可能性。它们都成为了当前推荐系统的基石。目前，越来越多的电子商务企业开始关注推荐系统，研究用户的行为。本研究的目的是为了满足用户的需求，通常基于用户画像技术，描绘不同年龄、性别和职业的人。满足不同层次的需求。亚马逊主导的产品推荐，QQ音乐推荐，淘宝个性化商品推荐，豆瓣等网站的视频电影推荐，微博主导的社交关系推荐，都应用了多种类型的推荐系统。推荐系统通常通过发现特定的潜在用户、增加商品被点击的概率、延长用户停留时间、增加网站访问量等方式使企业受益。发现用户对商品感兴趣，进而提高满意度，增加关联销售等。根据Venture Beat的调查，推荐系统促进了许多公司的销售，比如亚马逊在推荐系统的支持下销售额增长了35%。对于用户来说，推荐系统的出现可以减少很多时间。在推荐系统上线之前，用户一般需要查看11.7个条目才能找到自己满意的产品，在推荐系统的帮助下，只需要查看6.6个条目，用户的工作量减少了50%。根据Choice Stream的一项调查，45%的普通消费者愿意通过推荐系统访问电子商务，而在高端消费者中，这一比例可以达到69%。因此，推荐系统对于用户来说，可以更方便、省时地找到自己喜欢的商品。

2 常用的推荐算法

在在线推荐系统中，广泛使用的推荐算法包括基于内容的推荐算法、基于协同过滤的推荐算法以及基于图形的推荐算法、基于融合的推荐算法等。在商业实践中，由于每种算法都有自己的优点和缺点，所以通常是多种算法进行交叉使用。

2.1 基于内容推荐

基于内容的推荐（Content-based Recomm endation）通过比较用户的爱好和项目属性之间的差异性来推荐。该技术涉及机器学习技术、自然语言的处理技术、概率与统计技术、分布式计算等。基于内容的推荐首先建立用户兴趣特征的模型，用户兴趣特征可以通过系统的显式反馈或隐式反馈获得，通常包括用户的在线浏览、点击商品、评价、购买等。信息通过一定的技术手段将用户的兴趣爱好和属性特征进行转化。项目由相关属性以及与用户交互的信息定义。推荐系统通过用户特征与属性特征的匹配过程进行推荐。常用的算法有逻辑回归算法、决策树算法等。

2.2 基于协同过滤的推荐系统算法

当前，市场上广泛使用并且由许多学者研究的推荐系统算法是协同过滤算法，该算法目前是最常见最常用的算法。这个算法正发挥着促进电子商务发展的作用。这个主要被分成两种技术。

（1）基于用户的联合过滤。

（2）基于项目的协同滤波。

主要程序是，首先基于用户的历史记录和用户的兴趣爱好以及其他数据反馈，计算各客户端之间相似性，然后对相似度的目标客户端进行排序，然后介绍他们。

3 机器学习的个性化推荐算法

具有多种正则化技术的逻辑回归算法可用于稀疏矩阵，训练和预测速度快，模型复杂度低的特点。其次，介绍了一种性能较好的积分算法——梯度迭代决策树算法。然后是因式分解机，它是隐式语义模型中的代表性算法。最后，卷积神经网络作为深度学习的一部分，具有自动提取数据特征的功能，近年来备受关注。

3.1 逻辑回归算法

在统计学中，有种算法叫做回归算法。实现起来比较容易理解，复杂性也相对较低。而且，还可以用于大规模的机器学习。也就是说，由于他的优点很多，所以可以长期使用，但他的缺点是非线。因为他是一个现象模型。

3.2 梯度迭代决策树算法

在上个世纪90年代，提出了一种新的融合性算法，叫做梯度迭代决策树算法。这是一种基于学习机器的框架，它可以提高任意算法的准度和精确度，他是受到近似模型的启发，而被研究出来的。它的优点也十分的多，它作为一种性能比较优良的分类器，很多人将它和增强框架相结合使用。在实验中也确实，实现了较为优异的实验结果。

3.3 因子分解机算法

现在有一种更通用的算法叫做因数分解机。这个算法在2010年被提案了，利用分解模型的特征进行变换。另外，通过因素之间的相互作用表示。也就是说，可以很好地模拟变量之间的相互作用。即使数据不足和数据不足，也能得到良好的训练效果。在任务的实际执行中较好的完成。

3.4 卷积神经网络算法

在20世纪60年代Hubel和Wiesel提出了卷积神经网络。Hubel和Wiesel对猫大脑皮层的局部敏感神经元进行了模拟。福岛提出的新认知是基于神经元之间的局部连接和层次结构，首次对图像网络进行转换。神经网络的结构可以大大降低神经网络模型的复杂性，提高神经网络的泛化能力。CNN是一种前馈神经网络，目前广泛应用于语音、图像等领域。

5 结束语

互联网技术不断发展，数据采集和计算变得越来越便宜，目前来看，大数据时代已经到来。国内外电子商务公司和研究机构越来越擅长于利用数据为用户提供个性化的体验推荐，特别是近年来，人们利用先进的机器学习算法对这一领域的问题进行了深入的学习和研究。从梯度迭代决策树到深度学习，从协同过滤到逻辑回归，这些算法都出现在各个问题领域的推荐系统中。这些推荐系统的商业应用不仅极大地改善了用户体验，还增加了企业的收益。

在推荐系统中还存在许多问题，另外技术需要进一步的改进。虽然本文对推荐系统做了一定的研究，但仍有很多地方需要改进:我们应该考虑多种特征处理和数据清理，比如使用聚类算法对用户进行聚类，然后统计每个类别的特征，或者使用协同过滤算法处理非交互式样本。在搭配推荐系统中，使用卷积神经网络的方法还是比较简单的，所以我们可以针对这种情况设计一个特殊的神经网络，我相信它会进一步提高效果。