曾令伟 王冬 吴蒋
摘要:该文的旅游线路推荐系统模型,核心推荐模块主要采用的是关联规则apriori算法,文中分析了该系统建立的平台,然后通过模拟数据验证该系统的实践意义。
关键词:旅游线路;推荐模型;Apriori算法;实践
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2013)08-1906-02
1 概述
本文的旅游线路推荐系统采用的是关联规则apriori算法,主要研究旅游线路的景点推荐,根据文献[3]设计的系统框架,推荐模块采用了关联规则相关技术来实现。由于该系统处在实验室阶段,并没有投入实际应用,所以在使用数据方面只能采用模拟数据来完成。
2 开发环境及应用技术简介
它以拥有“语法高亮”,IntelliSense(自动编译功能)以及高级除错功能而著称。比如,它允许用户进行远程调试,单步执行等。还有允许用户在调试期间重新编译被修改的代码,而不必重新启动正在调试的程序。其编译及建置系统以预编译头文件、最小重建功能及累加连结著称。这些特征明显缩短程式编辑、编译及连结的时间花费,在大型软件计划上尤其显著[1]。
2) Microsoft Office Access
MS ACCESS以它自己的格式将数据存储在基于Access Jet的数据库引擎里。它还可以直接导入或者链接数据。软件开发人员和数据架构师可以使用Microsoft Access开发应用软件,“高级用户”可以使用它来构建软件应用程序。和其他办公应用程序一样,ACCESS支持Visual Basic宏语言,它是一个面向对象的编程语言,可以引用各种对象 [2]。
3) 数据挖掘技术系统采用文献[3]介绍的数据挖掘技术中的关联规则算法Apriori 经典算法,来实现旅游线路推荐系统。
3 系统的实现
2) 推荐系统界面
4 系统实践分析
1) 推荐的结果为I1、I2、I3也即南山、西岛和亚龙湾。这些景点都是收到游客大力青睐的地点,推荐景点的结果和现实游客的需求符合度较高,说明该系统的科学性、合理性较强。
2) 在实践运用中,数据库内容的产生是取自电子商务网站的交易事务数据,然后,以这些数据为基础,使用上述的数据挖掘技术,产生频繁项集,然后挖掘出知识来,最后转换成推荐线路推荐给用户[6]。在这个过程中存在一些问题如下:
①从电子商务网站产生的数据十分繁杂,过于庞大,在数据处理中将会产生大量的频繁项集。
②选择的最小支持度要求要低,这势必使得计算机计算时间过长。选择较低的最小支持度原因在于客户的使用范围也很大,造成网站数据量太大,客户同时被推荐的几率就很少,这样,挖掘频繁项集只能选择较低的支持度。
③推荐出的线路可能存在偏差。数据挖掘出的知识也即推荐线路的产生是满足最小支持度和最小置信度规则的前提下产生的,这些知识未必都十分准确,可能存在少许错误,这对用户在使用过程中,置信度和忠诚度是一个不小的考验。
4.3系统应用的实际意义
本研究完成了一个简单的应用模型,虽然距离实践应用还有较大距离,但还是具备一定的实际意义。
1)对于各大旅行社而言,可以根据挖掘的推荐路线,进行风景区线路规划,推出合理的行程安排,从而提高经济效益。
2)对于用户(旅游者)而言,无需经过大量的比较,繁琐的咨询来获得合理、经济的旅游行程。通过使用系统,用户就可以很轻松得到满意的推荐安排,节省了大量的时间和精力。
参考文献:
[1] http://baike.baidu.com/view/2070966.htm?fromId=100377#ref_[1]_2070966.
[2] http://baike.baidu.com/view/1162845.htm?fromId=868282.
[3] 曾令伟.Apriori算法在旅游线路推荐系统中的应用[J].电脑知识与技术,2013.
[4] 陈京民. 数据仓库与数据挖掘技术[M] .北京:电子工业出版社, 2007.
[5] 佟强,周园春,阎保平.关联规则挖掘算法[J] .微电子学与计算机, 2005( 6).
[6] 李绪成,王保保.挖掘关联规则中Apriori算法的一种改进[J].计算机工程, 2010(7).