魏天琦
摘要:在互联网高度发达的时代,信息过载的存在问题加速了个性化推荐系统的发展和应用。本文首先分析了个性化推荐系统的产生背景和发展历史,详细阐述了其进行推荐的原理,并介绍了推荐系统在电子商务、社交网络及信息内容等领域的应用情况,最后讨论分析了个性化推荐系统面临的隐私保护、数据稀疏性等问题。
关键词:推荐系统 个性化 电子商务 隐私保护
引言
随着信息技术特别是互联网技术的飞速发展,人们获取信息的方式越来越多,同时信息总量也在呈几何倍数的增长,人们获取信息的方式正在从主动查找变成被动接受。如何快速、准确找到自己感兴趣或需要的信息困扰着我们每个人,另
方面,人的需求有时是模糊的、时变的,对商家等服务提供平台而言,准确判断并推送用户可能感兴趣的内容,为用户提供个性化的服务可以提高平台的吸引力,增加用户的忠诚度。为解决这些问题,因而产生了个性化推荐系统。
个性化推荐的概念是由美国人工智能协会在1995年首次提出,随后Yahoo、IBM、NEC研究院等众多公司、研究机构纷纷加入这领域。近年来,人工智能以及大数据技术的发展进一步推动了个性化推荐系统在商品、音乐、视频、新闻等领域的应用。国内最早的推荐系统服务公司是北京百分点信息科技有限公司,该公司专注于推荐技术研发,为客户提供不同类型的推荐系统解决方案;百度公司总裁李彦宏在百度世界大会2011上将推荐引擎与作为公司未来的重要发展方向,希望能够为用户智能地推荐其可能感兴趣的新闻、网站、APP等信息。
一、个性化推荐系统的构成及原理
般的推荐系统结构如图1所示。获取用户的偏好是建立推荐系统的第一步,这些信息需要从用户的历史记录或注册信息中采集,之后利用这些信息建立用户模型,与此同时,根据商品、服务等对象的属性特征建立推荐对象模型,最后应用特定的推荐算法评价用户对推荐对象的兴趣度,据此对推荐对象进行筛选,将用户可能感兴趣或需要的内容呈现出来。可以看到,用户、推荐对象模型以及相应的推荐算法是推荐系统的核心要素。
(一)用户模型
用户模型是根据用户的领域、职位、年龄、性别、所在地等基本信息以及购买、浏览等历史信息表示和贮存用户偏好的数据库系统,该系统可以实现用户的分类管理、智能标记、定期或非定期更新等功能。用户模型是推荐系统的基础,精准的用户模型助于提高对推荐系统的准确性。
(二)推薦对象模型
推荐对象包括很多内容,例如书籍、电子产品、新闻、音乐、影视等信息对象。不同的对象具有不同的特征,如何准确描述这些特征并将其标准化是推荐对象模型需要解决的问题,与用户模型类似,推荐对象模型的质量对推荐结果也有重要影响。
(三)推荐算法
推荐算法是连接用户模型和推荐对象模型的桥梁,在推荐系统中起着至关重要的作用。根据推荐算法的实现原理,可以将推荐算法分为很多类型,如基于内容的推荐、基于关联规则的推荐、基于人口统计学的推荐、协同过滤推荐、混合推荐。在建立推荐系统时,应根据具体的使用场景进行选择,其中混合推荐算法融合了其它两种或多种算法,使用较为广泛。
二、个性化推荐系统的应用
目前,推荐系统现已广泛应用在电子商务、社交网络、信息内容等领域,在为用户带来便利的同时也提高了商家、平台的服务水平,是一个双赢的局面。
(一)电子商务推荐
类似淘宝、京东等电子商务平台都在其购物网站或APP中加入了推荐功能。平台根据用户的购买历史、个人信息及浏览记录学习用户偏好,应用推荐算法向用户提供购买建议,模拟销售人员帮助客户完成购买过程。智能商品推荐,能够节省用户从大量商品中挑选的时间,是电商平台的核心竞争力之一,能够在吸引客户的同时,通过增加用户的购买欲,提高商品销量。将人工智能技术应用于电子商务推荐系统,提高推荐系统的自动化、智能化程度以及开发针对销售方的推荐系统等问题是目前电子商务推荐研究的热点。
(二)社交推荐
微博、知乎、QQ空间、博客等社交媒体的激增使用户可以随时随地创作内容、发布动态、与好友分享照片、评论、点赞,参与各种形式的网上社交活动。对用户来说,每天需要花费大量时间与精力找到自己感兴趣的人或是事;另一方面,社交媒体也面临如何将用户希望看到的内容或关注的人推荐给用户的难题。为此,人们将个性化推荐技术与社交网络进行结合,产生了社交推荐系统。由于人是社交的关键因素,因此,社交推荐系统的范畴不仅包括内容推荐即帮助用户选择其感兴趣的信息,人的推荐也是社交推荐的重点,如向用户推荐好友、陌生人等。
(三)信息内容推荐
阅读是人们获取信息的主要方式,与社交网络中的内容推荐类似,人们也会面临选择难题,由此发展出了个性化阅读技术一将互联网中的大量信息根据用户的喜好进行定制、呈现。近年来,个性化阅读的互联网产品发展很快,许多新闻客户端、新闻网站或者商业网站,甚至浏览器、搜索引擎都引入了个性化阅读功能。
音乐、和视频是现代生活中不可或缺的娱乐内容,在线音频、视频服务商也开始利用推荐系统为用户进行歌曲、视频内容的定制。根据用户在平台上选择的“看(听)过”、“想看(听)”、“喜欢的明星”、风格等信息,为用户推送个性化的音乐和视频内容。
三、个性化推荐系统面临的问题
目前,虽然个性化推荐系统在众多领域得到了广泛应用,但也面临许多急需解决的问题。
(一)隐私保护问题
建立个性化推荐系统需要收集用户的个人基本信息和历史活动信息,要达到较好的推荐效果,收集的信息化就会越多、越全面,这些信息大多涉及用户的个人隐私,一旦泄露,后果不堪设想。另方面,对隐私泄露的担忧会使用户不愿甚至拒绝提供个人信息,缺乏足够的信息又会导致推荐系统准确性的下降,使用户和平台陷入两难的境地。近几年,移动互联网的快速发展和普及,使得个性化系统中隐私保护问题越来越迫切。
(二)数据稀疏问题
对于电子商务平台来说,其产品和用户基数属于甚至超过千万等级,而其中被用户打分的产品比例很低,一般不足1%,这就导致了数据稀疏性问题,特别是对采用了基于协同过滤算法的推荐系统,数据稀疏问题最为突出。一般来说,数据规模越大,数据就越稀疏,针对这个问题学者们提出了许多解决方案,如扩散算法、添加缺省打分等,但从本质上说,稀疏问题很难克服,因而人们更倾向于使用能够处理数据稀疏问题的推荐算法。
(三)多样性与精确性的矛盾
推荐系统的多样性是指推荐系统需要满足用户不同的兴趣。对商家而言,希望提高系统的多样性来覆盖更多的商品品类,激发用户的购买欲。为保证推荐的多样性,系统往往通过为用户制定更大的推荐列表,但结果包含的内容越多,用户会认为推荐的个性化程度不够,进而导致推荐的准确性下降。一般来说,推荐系统的多样性和准确性不能同时得到优化,提高某一方面就会导致另一方面的下降,二者相互制约。
此外,推荐系统还面临冷启动、大数据计算以及在移动终端服务的时效性等问题,这些问题有的是伴随推荐系统产生就有的,有的是推荐系统发展到一定阶段才有的,但都不可避免地制约着推荐系统的发展与应用。
四、结语
本文详细论述了推荐系统的原理及其在电子商务、社交网络以及信息内容方面的应用现状,分析了推荐系统需要解决的隐私保护、数据稀疏等问题。作为一个新兴领域,推荐系统帮助用户快速、准确的找到自己需要的信息,架起了用户和信息提供者之间的桥梁,相信在未来,推荐系统的进一步发展将会给人们的生活带来更大的便利。