[摘要]本文提出了全新的个性化旅游服务系统模型,对个性化旅游服务的两种常见的实现方法,即聚类分析与关联规则进行了讨论,并给出了个性化旅游服务系统引擎的设计思路与实现算法。
[关键词]个性化旅游服务系统;个性化推荐;模型
[中图分类号]F592 [文献标识码]A [文章编号]1005-6432(2010)35-0038-02
1 概述
时至今日,个性化的思想和技术在各个领域中已是无处不在。通过个性化的思想及个性化服务技术可以为不同的用户提供不同的服务。个性化服务通过收集和分析用户相关信息来学习用户的兴趣和行为,从而实现有针对性的推荐。在互联网领域,个性化服务能够大大的提高网站的服务质量。而在旅游服务领域,个性化服务能够提高用户满意度,有利于旅行社的发展。而现在的旅游服务,在给游客推荐出游地点时往往忽视了游客本身的兴趣和喜好,而游客自己在选择出游地点上带有一定的盲目性和随意性,这样游客在旅游之后往往发现目的地跟心中期望不符,这样对提高用户的满意度是非常不利的。
综上所述,为了满足游客个体差异造成的各式各样的需求,提出了个性化的旅游服务系统是很有必要的。本文第一章简要的介绍了系统的背景知识,在第二章中详细的介绍了个性化推荐系统的架构,第三章详细介绍了系统中个性化推荐引擎的结构和实现方法,最后在第四章中对全文进行了总结。
2 个性化旅游服务系统的结构
个性化旅游服务系统由客户端和服务器端组成,服务器端主要包括用户认证、用户建模、数据匹配、推荐结果封装四大模块,实现用户合法性认证、用户兴趣发现、个性化推荐以及产生推荐结果这一个完整的过程。而客户端的主要完成发送用户请求以及接受服务器端的信息,并且提供对个性化推荐结果的反馈信息。系统各模块详细介绍如下:
(1)用户请求。这一部分包括用户提交需求以及用户提交反馈信息两部分的内容。
(2)用户认证。这一模块主要功能是对用户身份进行验证,通过验证的用户才能合法的使用个性化服务系统系统。
(3)用户建模。不同的用户可能有不同的兴趣和要求,用户兴趣建模是一个能为用户提供个性化推荐系统的核心组成部分,它能够获取每个用户的不同需求。
用户兴趣建模的主要步骤分为:①在观察用户选择的基础上,记录、识别用户的目标;②在识别用户目标的基础上,分析用户的兴趣所在,为个性化的推荐提供依据。
(4)个性化推荐。根据不同用户的模型,考虑不同用户不同的兴趣倾向,按照一定的规则,在服务数据库中匹配关联信息,作出决策,给不同的用户提供不同的推荐结果。
(5)发送推荐信息。将推荐结构按照一定的数据结构和传输标准打包后发送给用户。
(6)用户反馈。该模块收集用户对收到的推荐结果作出的反应,并将收集到的信息发送到服务器端,以便于服务器端进一步调整用户模型以及推荐策略。
3 个性化推荐
3.1 个性化推荐过程
个性化推荐过程主要包括如下过程:①收集用户信息;②分析用户特性,根据在所有用户中统计出来的数据,找出若干个所有用户选择最多的景点,并以此为分组特性将用户分成若干个组;③对每个组的用户再进行统计,找出组内的关联情况,形成组内的若干条规则,从而得到组内成员的共同特性;④据实践的变化对所有用户的权重进行调整,突出用户对各种兴趣增长或减弱的趋势,反映最新的变化情况,如下图所示。
3.2 基于k-中心点思想的聚类算法
之所以采用k-中心点算法,是因为:①该算法通过簇内主要点的位置来确定选择中心点,对孤立点的敏感性小;②该算法对属性性类型没有局限性。算法描述:
输入:所有游客的兴趣模型数据库,期望得到的簇的数目k。
输出:是得所有对象与其最近中心点的偏差总和最小化的k个簇。
方法:①选择k个对象作为初始的簇中心;②Repeat;③对每个对象,计算离其最近的簇中心点,并将对象分配到该中心点代表的簇;④随机选取非中心点Orandom;⑤计算用Orandom代替Oj形成新集合前后的总代价Sj,S;⑥若S
表示j,km户兴趣度向量之间的距离。
3.3 基于聚类结果的个性化推荐
我们根据同一类别中其他用户的景点选择停留行为向单个用户推送景点,对于新用户,由于无法通过其行为计算出必须的用户兴趣度,所以不进行个性化推荐。
推荐过程:单个用户U。
①查找所属的分类类别K;②查找当年K中其他用户的景点选择记录,计算各景点被这些用户选择的总次数;③对上述的次数进行降序排序;④选取第一位U没有选择过的景点进行推荐。
3.4 应用个性化推荐的关联规则发现
应用数据挖掘技术,对log文件进行预处理得到用户会话文件(用户会话是指一个用户在特定的时间内所选择的景点、选择的顺序),所有的用户会话构成会话文件,从中可以挖掘得到下面形式的关联规则:
(1)选择景点Plaeeal的客户中,有a%又下载了Plaeecl。
(2)选择景点Placea2、Plaeea3、Plaeea4和Placea5的客户中,有b%又选择了Placee2。
(3)由选择景点Placea6开始进行一次景点选择的客户中,有c%紧接着选择了Placec3。
上述规则中,Placeai(i=l,2,3,4,5,6)和Plaeecj(j=1,2,3)分别为关联规则的前项和后项,a%、b%和c%为规则的置信度。根据关联规则的表述形式,表示为:①Placeal→Placeel,置信度为a%;本系统中该条规则发现阈值为75%;②Placea2Placea3 Plaeea4 Placea5→Plaeec2,置信度为b%;本系统中该条规则发现阈值为50%,滑动窗口深度为3;③Placea6→Placec3,置信度为c%;本系统中该条规则发现阈值为60%。
基于关联规则的个性化推荐过程如下:①每年12月和6月进行关联规则的发现;log日志时间限制为最近两年;②剔除一年时间内选择景点个数小于2个的用户记录;③根据系统两年内的日志,计算发现超过阈值的而产生的三条规则;④根据发现的规则,对于满足规则前项而没有选择后项的用户,主动推荐规则后项的景点。
3.5 关联规则和聚类分析互补的推荐决策
聚类分析和关联规则互补的推荐方法是,在挖掘时,分别采用关联规则和聚类分析得到规则和聚类结果;推荐时,如果当前用户访问模式能够与关联规则匹配,则优先推荐按照关联规则推荐的结果,然后再推荐基于聚类分析的推荐结果;否则,计算当前用户访问模式与聚类分析结果的匹配值,找到相似的类,按照聚类分析结果进行推荐。
与基于聚类结果的实验分析相比,基于关联推荐的推荐结果更加准确,但是只能对在行为满足关联推荐前项的用户才能做出推荐;而基于聚类分析的推荐能够为所有用户推荐景点,但是推荐的准确度有所不足。
4 小结
基于用户兴趣挖掘的个性化信息服务,能较好的利用已知的用户行为,扩展了系统提供信息服务的能力,是一个新兴的有着巨大应用前景的研究领域,经过众多研究^员的努力,已经取得了一定的进展。本文提出了全新的个性化旅游服务系统模型,随后文章对游客行为与兴趣之间的关联做了讨论和分析,由此提出了游客兴趣发现,接着结合游客兴趣发现提出了卜性化的推荐思路。在本文中,个性化旅游服务系统主要由游客兴趣挖掘与个性化推荐引擎两个部分组成。其中,游客的兴趣挖掘部分主要实现用户建模,发现用户的兴趣所在,为个性化推荐提供决策依据。个性化推荐引擎主要综合基于聚类分析与关联规则两种方法实现景点的推荐过程。个性化推荐服务技术是时下非常流行的一种技术,相信旅游个性化服务也将逐渐成为旅游服务领域的热门话题,而随着旅游市场的扩大和技术的发展,进一步的研究重点包括:①更加准确、高效的用户兴趣发现方法。考虑时序、空间因素对用户行为的影响将变得格外重要。②高用户满意度,如何建立更加准确、高效的推荐引擎仍是一个研究热点与重