大数据挖掘:智慧旅游的核心

2015-05-30 10:48梁昌勇马银超路彩红
开发研究 2015年5期
关键词:智慧旅游数据挖掘大数据

梁昌勇 马银超 路彩红

内容提要:旅游业和大数据都是当前的热点,旅游业各类型复杂数据实时呈现爆炸式增长-旅游大数据。随着云计算、物联网、Internet以及移动智能终端等信息通讯技术(ICT)的飞速发展以及迎合更加优质的服务管理需求,智慧旅游成为全球旅游信息化建设和理论探讨的主要方向,有许多问题急待解决。旅游作为服务业只有充分挖掘分析旅游数据中的潜在信息,才能更好地进行决策管理以及为游客提供更加全面优质的服务。结合大数据方面研究认为大数据挖掘是智慧旅游的核心,在总结智慧旅游概念和发展的基础上并结合大数据挖掘全新定义了智慧旅游,分析了目前智慧旅游建设以及智慧旅游中大数据挖掘面临的问题和挑战,并探讨了大数据挖掘自身以及为智慧旅游创造的研究方向和发展机遇。

关键词:智慧旅游;大数据;数据挖掘;信息通讯技术

中图分类号:F590

文献标识码:A

文章编号:1003-4161(2015)05-0134-06

一、引言

21世纪以来,时代与经济的快速发展使旅游越来越成为人们生活的重要部分,由此旅游业也成为世界上增长速度最快、最大的服务产业之一。根据世界旅游组织的研究预测,全球的国际旅游人数到2020年将达到16亿,带来的收益也会超过2万亿美元,而在1999年却分别只有6.64亿人次和4550亿美元。世界旅游业的发展带动了中国的旅游业发展,中国由于是一个发展中国家,再加上幅员辽阔,人口众多,使得中国的旅游业发展虽然起步较晚,但发展得速度快,具有广阔的前景。2000年,中国的国内旅游和海外入境旅游人数总和为8.28亿,总收入4158亿元,但2010年增长至22.37亿人次和1.5708万亿元,年均增长率分别达到惊人的10.4%和14.2%。

全球旅游热促使旅游信息化快速发展。自20世纪80年代以来,信息通讯技术完全改变了旅游的商业模式和结构。特别是近10年以来,云计算、物联网、Internet和移动智能终端等信息技术的迅猛发展让旅游信息化进一步升级,同时也让传统的旅游管理模式、营销模式、游客需求和消费模式发生了颠覆式的变化。信息通信技术彻底改变了旅游组织的效率、旅游市场的驱动方式以及游客与旅游组织的交互方式。提供优质的决策服务管理、满足游客多元、实时的个性化需求、提高旅游的消费效率、提高旅游资源和社会资源有效配置和持续利用率等成为当前旅游业面临的最严重挑战。

近几年来,新一代信息通信技术的迅猛发展也导致全球各行业数据量呈现出爆炸式增长。国际数据公司(IDC)的数字宇宙研究报告称2011年全球被创建和复制的数据总量超过1.8ZB,按照其增长速度这一总量在2020年预计达到35ZB,而且数据形式不仅体现在量的庞大上,更重要的是它的复杂性:存在形式多样(文本,数字,图片,音频,视频等)和结构复杂(结构化的,非结构化的以及半结构化),信息价值密度低但总价值大(数据中包含大量的无关的,不准确的信息但总价值大,对社会和经济有重大影响),数据实时处理能力要求更强——这就是大数据。自然杂志在2008年9月推出了“big data”的专刊标志着大数据时代的正式到来。大数据时代的到来为制造业、服务业以及各学科带来了机遇和挑战,2011年2月,科学杂志联合其他一些期刊从数据处理的角度推出了一期专刊“dealing with data”,从各领域(生物医药工程,环境地理,物理天文,互联网等)数据处理(提取,存储、压缩,分类等)的多个层次解读了大数据带来的技术挑战。

旅游业作为当前炙热的服务业,其数据也具有大数据的所有特征,是大数据重要的来源之一。然而目前大数据在旅游业的应用远远落后于其他行业,诸如生物医药、航天科技、电子商务等。其原因在我们看来是多方面的,如旅游业的起步较晚,旅游行业相关新兴信息技术的应用没有其他行业广泛,目前旅游行业相对于其他行业影响人们生活和社会发展的程度较低,国家政府对旅游行业大数据的重视程度和相关经济技术投入少等等。智慧旅游时代的到来促进了除云计算、物联网、移动智能终端等信息通信技术在旅游业的发展之外,也正好迎合了大数据在旅游业的发展。但是至今为止几乎没有学者探讨大数据在旅游业的应用,正是如此,智慧旅游伴随着大数据有待于解决许多新的研究问题,在我们看来目前最根本的问题是智慧旅游的定义需要融合大数据,智慧旅游的相关体系架构需要融合大数据,智慧旅游的核心是大数据挖掘。

二、智慧旅游定义

智慧旅游是智慧地球以及智慧城市两个概念的延伸。智慧地球也称智能地球,2008年首次由IBM提出。2009年初美国总统奥巴马公开肯定了智慧地球战略,2009年8月IBM发布了《智慧地球赢在中国》计划书,通过近几年的发展,IBM智慧地球战略为全世界所认可。按照IBM定义,智慧地球是以一种更智慧的方法通过利用新一代信息技术来改变政府、公司和人们相互交互的方式,以便提高交互的明确性、效率、灵活性和响应速度。它具有三个特征:更透彻的感知,更广泛的互联互通,更深入的智能化。智慧城市是智慧地球的具体实践应用,智慧城市是由许多部分组合而成,通过多元化网络相互连接并实时提供人们活动和物体的信息数据,为城市的相关活动进行有效的实时决策。

智慧旅游作为智慧地球和智慧城市的延伸,其相关信息技术已得到广泛应用。然而目前国内外旅游方面研究上没有统一科学的关于“智慧旅游”的学术用语,如黄超等认为智慧旅游就是利用新兴信息技术和设备主动感知旅游资源、旅游经济、旅游活动等方面的信息,达到及时发布及时了解安排和调整工作与计划,从而实现对各类旅游信息的智能感知和利用。张凌云等学者指出智慧旅游是基于新一代信息通信技术为游客指定个性化需求,提高旅游管理水平,实现旅游资源的共享和有效利用等,提出了智慧旅游的CAA框架体系。可喜的是当前中国智慧旅游城市的建设取得了初步成效,建立了北京,上海等一批智慧城市和智慧旅游实验平台。然而上述关于智慧旅游的定义都是基于信息技术层面上的,偏向于智能旅游,而智慧旅游建设也侧重于信息化建设。

我们认为智慧旅游的本质是传统旅游的升级,还是一种服务。所有的旅游管理的信息化、旅游资源的信息化、旅游经济的优化运作等最终都是为旅游消费者和各利益团体服务,是为了给游客订制更好的个性化服务、提升各营利团体的利益、提高管理决策水平。而大数据时代的到来,也标志着大服务时代的到来,智慧旅游亦是如此。智慧旅游服务的过程就是大数据的收集、储存、管理、挖掘过程,而这个过程中最为关键的又是大数据挖掘,其他方面都是为数据挖掘服务。只有通过充分挖掘旅游各类型和所有来源数据的信息,才能更好进行各方利益团体的协作管理、旅游资源的开发和有效利用、人员物资和交通的调度协调、了解游客的行为并提供更优质的服务、促进旅游服务业持续健康发展。

结合上述阐述,我们将智慧旅游定义为:智慧旅游是通过新一代信息技术,充分收集和管理所有类型和来源的旅游数据,并深入挖掘这些数据的潜在重要价值信息,这些信息为旅游管理决策者进行有效管理决策提供服务、为各营利团体利益提升与协作能力提供服务、为充分满足游客个性化需求和更优旅游体验提供服务。图1给出了智慧旅游的概念结构,可以看出,信息技术及其数据的前期收集管理是智慧旅游的基础,旅游大数据的挖掘是核心,而最终所提供的三类服务是目的。智慧旅游是智慧地球的一部分,但从城市旅游的范畴上来讲,智慧旅游只是智慧城市的一部分,因为除了城市旅游,旅游还包括自然观光旅游、宗教文化旅游等。

三、问题与挑战

大数据与传统数据在数据量比例上具有巴列特定律“八二原则”特性,随着数据的爆炸式增长,这一比例可能更大。相反,大数据目前所产生的价值与传统数据相比却是“二八”,这一比例或许更小,其原因之一就是目前没有类似于传统数据挖掘的工具和方法对大数据进行深入挖掘分析,以发掘更多的重要的价值。怎样进行挖掘分析大数据,这是当前合理充分利用大数据面临的最大问题和挑战。除此之外,大数据目前还面临收集、管理、安全等问题,但是相比于大数据挖掘分析,这些问题趋于简单。由于智慧旅游目前尚处于萌芽阶段,因此作为智慧旅游的核心,旅游大数据的挖掘分析当前存在诸多问题和挑战,有待于将来研究解决。同时,目前的智慧旅游的建设发展也面临许多问题。

(一)旅游大数据挖掘

大数据成为热点以来,学者们尝试用传统数据挖掘方法对大数据进行分析挖掘,但是几乎无一成功。从目前的研究来看,大数据挖掘颠覆了传统数据的挖掘方法,由传统的因果关系分析转变为相关关系分析,在大数据时代,不再追求产生结果的原因,只关注产生结果的价值。成功案例诸如谷歌公司通过搜索记录的相关分析成功预测H1N1流感爆发时间和沃尔玛超市的捆绑销售等。旅游大数据挖掘目前所面临的问题和挑战除了没有有效挖掘方法之外还受到实验平台和数据安全的限制。

1.实验平台

实验平台是数据挖掘的基础,大数据挖掘更是如此。传统数据挖掘的数据结构简单,易于收集管理,挖掘工具对电脑的处理能力要求较低,通常在个人计算机上或小型计算机集群就能进行实验。而大数据的海量性、结构复杂性以及占用空间的巨大使得大数据对实验平台的要求高很多,不可能在传统实验平台上进行。有效的方法是在云平台或大规模计算机集成上进行大数据的收集管理和挖掘分析,这也是目前大数据挖掘分析在谷歌、亚马逊等大的互联网公司发展较快的原因,大多数学者也都是通过与大数据公司合作来研究大数据。

目前,对智慧旅游来讲,糟糕的是风景区或旅游部门的大数据实验平台建设相比其他行业更为缓慢,中国作为发展中国家与发达国家相比也更为缓慢。目前只有黄山和九寨沟等一些大的风景区基本实现旅游的数字化建设,但离智慧化建设还有一定距离,云平台、大数据实验平台建设几乎没有起步。我们知道大数据实验平台是一个数据共享平台,除了加大投入实验平台必要的硬件设施,旅游大数据实验平台的建设相比其他行业涉及更多部门。如图2所示,景区要建设大数据实验平台的数据中心,为了数据的完备性,这个数据中心必须要与景区政务、天气地理、交通、电子商务、政府管理部门、旅游社和旅游公司、旅游论坛网站等部门相关联,仅此就是一项巨大工程,协调各方利益是难点也是重点。由此可见,完整地建立大数据实验平台非常困难。造成困难的原因,一是旅游行业的发展起步较晚,它为国家地区带来的价值优势,利益优势还不太明显,不过随着生活水平的提高,人们旅游的白热化,旅游业带来的收益将会迅速增大;二是政府目前对旅游的建设投入不够,只初步建设了旅游景区和旅游部门的政务平台,但是随着旅游热,游客需求的提高,政府必定会加大对智慧旅游相关建设的投入。

2.挖掘方法

每个人的观点都局限于自己的认知区域,对大数据的探索如同盲人摸象,随着数据集爆炸式扩张,难度也与之俱增。数据挖掘的最大难点在于需要科学有效的数据挖掘方法,大数据颠覆了传统的数据挖掘,不得不探索新的挖掘方法。目前,在大数据挖掘方法方面,学者们取得了一定成效,不过这只是杯水车薪。如Sun利用结构分析方法有效地对半结构化,混合型的异构网络信息进行挖掘,指出大数据挖掘首当其冲是挖掘异构网络型数据,Kang利用Pegasus工具分析了大量社交网络的图片信息,Aral用体内随机试验法对facebook上130万用户从年龄,性别等方面进行了网络影响力和敏感性分析。目前很多文章都是研究与社交网络媒体有关的大数据,这一点正好与智慧旅游旅游相契合,旅游也是一种社交手段,很多数据也都来源于各种社交网络平台,如国外的facebook、Twitter,中国的QQ、携程网,微博以及各类旅游网站论坛。

大数据存在复杂的关系网络,要充分挖掘其价值信息,需要关联多个数据来源,这正是目前挖掘大数据的主要方法——相关性分析。但即使用相关性分析挖掘旅游数据的价值信息,难度也比其他领域更大,因为旅游数据来源更多造成冗余数据更多和数据存在形式更复杂。为游客提供满意的服务需要充分挖掘旅游数据,传统的数据分析可以分析出旅游风险直觉与旅游犹豫之间的关系和旅游质量及满意度对旅游忠诚度的影响程度。但如果要分析游客的旅游计划行为,可能就要关注他对天气,交通,景点等方面的搜索,他关注的某张图片,和朋友的微博互动都会影响他的旅游计划,需要对这些数据完全挖掘分析。另一方面,对大数据的实时性挖掘在旅游领域更加重要,游客实时需求特点使得对旅游数据的挖掘也必须具有实时性,这是更大的挑战。

不可否认,未来必然会出现更成熟科学的大数据挖掘方法,发掘出大数据更多价值。但是目前除了相关性分析挖掘,在大数据挖掘方法上我们也只能是摸着石头过河,幸好现阶段通过挖掘能创造更多社会价值。旅游大数据因其行业特殊性除了需要探索出与传统数据挖掘不同的方法之外,可能也有别于其他行业的大数据挖掘。

3.数据安全

大数据提倡的就是数据共享,数据共享程度越低,大数据挖掘难度就越大,但是数据共享程度越高,带来的数据安全风险越大。数据共享要求关联多个数据来源容易造成个人用户的个人隐私和公司企业的商业机密等泄露。从数据收集存储开始,我们的地理信息、手机通讯、邮件、网络聊天甚至电子医疗等都会在所关联数据中心留下痕迹,而这些痕迹会让黑客乘虚而入。大数据挖掘分析也会涉及大量的敏感信息关于客户和员工,以及知识产权、商业秘密和财务信息。旅游数据也不可避免地存在数据安全风险,如游客出行旅游,他的吃、住、行、购物、电子交易等都会存储到数据库。这些数据如果完全共享,游客如被放在显微镜下而变成透明人,完全没有了自己的隐私,不对数据加以安全管理,游客的人身财产安全受到影响,最终会导致满意度随之下降。旅游数据的安全从收集,存储到后期数据挖掘一直存在,要进行大数据挖掘,大数据的安全管理是首要前提。

目前大数据是以云平台作为存储管理中心,大部分关于大数据安全的研究都集中在云环境背景下。审计服务是保证数据完整性,可用性和避免数据泄露的有效手段,Lan提出一种基于代数特征的数据检查方案,能实时检查原始数据的完整性,这些方法都是考虑数据在存储管理阶段的安全性。挖掘使用阶段数据的安全性鲜有研究,这对旅游数据安全是一个大威胁,智慧旅游重在对于旅游数据的实时挖掘。旅游数据安全涉及多方群体,要充分挖掘旅游数据的潜在价值,旅游数据安全除了技术上的支撑,必须针对性的制定一套完善的数据共享机制、数据访问方式、数据安全协议。

(二)智慧旅游建设

智慧旅游建设特别是中国的智慧旅游建设主要存在两方面的问题:一是新一代旅游信息通讯技术的建设迫在眉睫,二是旅游的相关管理营运模式需要革新。信息通讯技术的发展能让旅游管理营运更智慧化,而管理营运革新必然促进信息通讯技术在旅游业的发展。

1.加强旅游信息化建设

从旅游信息化方面讲,智慧旅游是旅游信息化发展的最高模式。目前发达国家的旅游信息化建设已经到达数字化阶段,但是中国只有少数景区和管理部门达到这个阶段,这延迟了智慧旅游在中国的发展。旅游的信息化建设需要在完善原有数字化基础上进一步建设移动通讯网络,物联网和旅游云平台。

移动互联网络是链接游客移动智能终端与旅游云平台等数据中心之间的桥梁,是支撑物联网的基础设施。游客能实时享受到关于旅游信息的全程多样化服务、游客需求信息的实时传递、各类旅游数据信息的交互传递,都离不开优质的移动通讯网络。物联网实现了物与人、人与人之间的实时互动,可以不受时间地域限制对物体和人的信息进行收集传递、存储管理、感知利用,实现“一卡通”功能。例如风景区基于物联网建设通过使用RFID、二维码、传感等技术建立自然景观、文物等旅游资源信息库和讲解系统,最终游客利用移动终端设备能实时查看收听,管理部门能实时对旅游资源进行远程状态监控和管理保护。旅游云平台不仅是旅游大数据挖掘的实验平台,更是旅游信息服务平台,是旅游信息收集、存储、处理、查询等各种功能应用中心,是原来相互独立的旅游信息服务系统和数据中心的集成整合。通过旅游云平台的建立,能让旅游相关管理更加统一、数据信息更加完整、有效提高旅游信息服务水平,实现旅游资源信息的充分利用。

2.管理营运需要革新

智慧旅游的发展必然导致旅游管理营运从传统方式到现代方式的转变,其管理模式和营运模式更加智慧化。智慧旅游管理营运需要充分利用新一代信息通信技术,建立在旅游大数据的分析挖掘基础之上。

旅游的管理革新要求管理部门在原有数字化管理基础上进行智慧化管理,基于新一代信息通讯技术的信息管理系统整合能对各管理和协作目标进行远程管理协作,培养更有专业性的工作服务人员,建立新的评价体系,协调各方利益关系,引导游客和合作公司企业走向智慧化旅游。如景区的智慧化管理,主要包括:(1)为游客提供智慧化服务,设计满意的个性化旅游产品,建立快捷实时的旅游相关信息查询系统,对游客位置和游客流量实时监控。(2)旅游资源环境的实时管理,是将旅游资源信息进行整合,建立智慧化的监管体系,能实时对旅游资源环境的状态进行分析以便科学的开发利用。(3)突发事件的应急管理,突发事件的处理在反应了景区的智慧化管理水平,需要建立越来越智慧化的应急体系。(4)合作单位的合作协调更加智慧化,合作协调智慧化能减少人工干预,节约成本,提高效率。

新一代信息技术和大数据催生了各行业新的营运模式,对旅游业亦是如此,智慧旅游也需要开创新的营运模式。传统旅游游客在旅游目的地选择,查找旅游相关信息方式比较固定,都是靠旅行社或旅游公司安排其相关旅游活动。但智慧旅游时代游客的旅游行为更加多样化、自主化和个性化,更加注重对旅游产品的真实体验,这是由于新一代信息技术影响了游客的旅游行为模式,所谓“未旅游已先旅游”的方式已经形成。游客行为可能时刻发现变化,其生命周期变得越来越短,因此智慧旅游需要加强对游客和市场的洞察力。同时,在大数据环境下,旅游营运的策略和设计更讲究实时性,让游客“未旅游已先旅游”的体验更加丰富完美。传统的数据挖掘主要针对历史数据,而大数据讲究进行实时挖掘分析,了解游客的兴趣偏好,再结合心理学,营销学等理论知识,才能设计提供更有个性化需求的旅游产品和服务,以满足游客的实时需求。

四、研究方向和发展机遇

大数据作为智慧旅游的核心,在带来问题和挑战的同时,也产生了许多新的研究方向和发展机遇。数据是为我们服务的,旅游数据也不例外,怎样从海量的旅游数据中找出有价值信息为我们所用,是智慧旅游面临的新课题。大数据挖掘将在智慧旅游领域带来以下几方面研究方向和发展机遇。

(一)发掘旅游商业价值信息

通过大数据挖掘分析,我们能充分了解游客的消费行为和兴趣偏好,进而为游客设计个性化的旅游产品,推荐旅游目的地,优化旅游线路,挖掘潜在的旅游客户等。如通过浏览记录发现,某游客查看黄山风景区相关旅游信息的同时还浏览了黄山周围的小景区信息,表明该游客很有可能观光完黄山风景区再游览周围小景区,结合性别、年龄、职业等信息可以为他推荐合适的旅行计划。同时,这样的游客不止一个,是一个群体,因此黄山风景区有必要改善与小景区的交通状况,在其官网上增加小景区信息的链接等。

(二)开发保护旅游资源

旅游资源是旅游业的载体,充分合理开发保护旅游资源也是智慧旅游的目的之一,能提高游客的旅游体验,惠及多方利益,旅游资源开发保护的前提是旅游的可持续发展。在智慧旅游环境下开发保护旅游资源要充分利用新一代信息技术并借助大数据挖掘分析,必须要对自然景观、文物等旅游资源的状态实时掌握,对景区的承载力和影响旅游资源的各方面因素分析,而开发的最大化程度分析都离不开大数据挖掘。

(三)产生新的管理营运理论

如前面所述,智慧旅游必然遭遇面临管理营运革新的挑战,但从另一方面来看,智慧旅游必然会产生新的管理营运理论。如透过旅游大数据,容易发现智慧旅游环境下旅游供应链也不再是传统供应链模式。传统供应链是简单的上下游关系,但大数据环境下旅游供应链是一种复杂网状结构,具有多个层级且每一级包含多个群体,这些群体或竞争或合作。研究它们之间以及上下级的契约关系,协调关系等显然离不开大数据挖掘,这将不但产生不同于传统的供应链模型理论,也会产生新的管理营运理论。

(四)大数据挖掘自身的发展

旅游的白热化必然会同其他行业一道促进大数据挖掘相关理论方法的发展,而智慧旅游所具有的行业特性可能会产生有别于其他行业的大数据挖掘方法。一个小时音频中可能就几秒钟的内容有价值,设计什么样的工具和方法从海量的旅游数据中找到这些价值信息,大数据挖掘必须结合旅游的行业特性才能进行。

五、结论

智慧旅游和大数据时代都已经到来,我们经过手指,利用智能手机和相关设备就能了解世界,体验旅游。智慧旅游正在悄然的改变游客的旅游行为,然而智慧旅游尚处于萌芽阶段,大数据挖掘应用在旅游业也几乎没有涉及。但是大数据蕴含的巨大价值必将掀起一场管理革命,同样大数据将势不可挡的对智慧旅游产生影响,旅游的白热化让旅游市场竞争变得越来越激烈,通过建设智慧旅游和大数据挖掘,获得更多的潜在价值信息,将大大提高旅游市场的竞争力。目前大数据在智慧旅游的发展中虽然存在许多障碍,但大数据值得我们关注,旅游业对大数据态度应该由未雨绸缪转变为充分挖掘应用。

智慧旅游将会带来整个旅游产业进一步升级,新一代信息技术的推波助澜,使得游客对旅游信息依赖程度逐步提高,游客行为需求更加个性化、多元化,旅游市场的结构越来越复杂,旅游资源可持续开发利用凸显重要。这将促使旅游业需要整合共享多方面数据信息,创新管理模式,转换营运思维,都离不开旅游大数据挖掘。随着挖掘的深入,旅游大数据在旅游业的应用日趋广泛,所蕴含的潜在价值信息将不断为我们所用,旅游大数据必然会为智慧旅游发展输入新鲜血液,智慧旅游的发展前景充满活力,将比传统旅游更加丰富多彩。

责编:董积生

猜你喜欢
智慧旅游数据挖掘大数据
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
大数据时代黔东南州智慧旅游开发研究
京津冀休闲产业协同发展研究(一)
基于大数据背景下的智慧城市建设研究
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究