张军爱
(新疆财经大学商务学院,新疆 库尔勒 841000)
近年来,随着我国社会经济的不断发展与进步,旅游群体不断增长,给景区经营与管理带来了压力与挑战,而大数据及相关电子信息技术的发展为景区经营与管理提供了新的机遇。
大数据的名称来自于未来学家托夫勒所著的《第三次浪潮》,随后麦肯锡公司最早在2011年6月发布了关于大数据的报告,该报告对大数据的影响、关键技术和应用领域等都进行了详尽的分析,其核心理念是大数据就像货币和黄金一样,是一种新的经济资产。一般意义上,大数据是指无法在可容忍时间内用传统信息技术 (Information Technology,IT)和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合[1]。相比于传统的数据分析模式,旅游大数据分析具有以下 “4V”特点。一是多样化 (Variety)。旅游数据的内容与来源非常丰富,旅游数据涵盖了互联网时代数据形式的各种类型。二是快速性 (Velocity)。主要表现在数据处理速度快,这样大大节省了数据分析的周期成本,从而为科学合理的决策提供依据。三是价值高(Value)。数据存储成本低,数据获取方式便捷高效。四是体量大 (Volume)。大数据的首要特征是数据的储存量巨大,大数据分析将旅游行业的实时数据存储在固定的大数据库里,有的达到吉字节(GB)、太字节 (TB)甚至是帕字节 (PB)。
根据互联网数据中心 (Internet Data Center,IDC)报告,全球数据量大约每两年翻一番,预计2020年全球将总共拥有35 ZB的数据量,相较于2010年数据量将增长近44倍[2]。大数据时代的到来,正在改变着人们的生产方式与思维方式。2015年8月,国务院发布了 《促进大数据发展行动纲要》,这是我国官方发布的第一份权威性、系统性促进大数据发展的文件。文件强调,大数据业态能够激发商业模式创新,是提升企业核心竞争力的重要软实力。2016年,工业和信息化部制定了 《大数据产业发展规划 (2016—2020年)》,为大数据产业化做出了具体指示。文件要求,利用我国已有的大数据发展经验,加快建设大数据中心与公共服务平台;加大关键技术的研发,推进协同创新体制机制;加大政策扶持力度,推动我国大数据高质量高标准建设。预测2020年我国大数据相关产业和服务业收入突破1万亿元大关目标,年均复合增长保持30%的增速。大数据与旅游产业的结合将给旅游业高质量发展提供技术支撑与服务架构。大数据不仅能够储存海量的旅游数据,而且能够将数据进行整合,帮助人们分析旅游需求与市场发展趋势,为科学的决策提供依据。大数据还能带动旅游相关产业发展,为旅游业开拓新的市场与业务提供服务。
1)大数据在旅游产业中的应用使得景区管理更加智能化、高效化、便捷化。旅游产业大数据分析是将海量的结构化的数据 (数字、符号等数据),与非结构化的数据 (文本、图像、声音、视频等数据)进行整合,通过把复杂的数据转化为可以交互的图形,帮助用户更好地理解分析数据对象,发现、洞察其内在规律。依托旅游大数据的可视化平台,管理决策层可以直观地获取有价值的信息,通过对可视化数据进行实时的监测、分析与处理,从而为精准决策提供依据,实现景区管理的智能化、高效化、便捷化。例如,通过与互联网、运营商等第三方大数据整合,可以对未来几天人流量、车流量进行预测;通过智慧景区监控系统,可以对突发事件如踩踏、拥挤进行实时监测,及时预警;通过监控系统及数据分析,可以对景区人力、物力资源进行科学分配,加强市场违规行为管理;通过景区一卡通系统,可以对游客的属性、行为偏好进行分析,同时整合互联网大数据,可以针对全国市场范围进行客源地与目标消费者的精准定位等。
2)大数据提高了旅游目的地的营销效率,瞄准客源市场,实现精准营销。大数据精准营销通常又被称为数据驱动类营销,是指以驱动消费者高效率参与、对消费者实现一对一营销为目标,通过大数据分析技术、挖掘技术对企业从外收集或者已有的大量消费者数据进行分析,并根据分析结果优化企业营销策略的一种新型营销手段[3]。随着数据维度的不断丰富,应用场景的不断增多,尤其是移动化所带来的位置数据、物联网数据的日趋丰富,数据营销也在快速演进,中国的智能营销时代正在到来。首先,大数据技术在旅游营销领域的应用,不仅能够对旅游产业链和营销层面进行分析与预测,而且能够涵盖旅游需求者的精准挖掘与人群匹配。基于大数据对旅游消费者多接触点的行为数据采集,通过整合分析数据、精准用户画像等手段,能够精准找到所匹配的旅游群体。其次,在识别客源市场方面,随着旅游散客时代的到来,旅游需求更加个性化,旅游细分市场更加多元化,旅游方式由观光旅游正向休闲度假转变。大数据可以帮助识别游客需求,细分旅游市场。一般来说,大数据识别客源市场主要体现在4个方面:一是大数据能够提高客源市场转化率;二是判断景区重点客源市场;三是识别客源流失的原因;四是挖掘景区市场洼地。通过cookies大数据的积累,分析活跃数据的近期表现,依次给每一个活跃数据打上对应的属性标签。通过用户停留时间以及相关信息判定用户的兴趣,通过访客来源判定潜在用户所在的主要城市等。大数据实现精准营销模式见图1。
图1 大数据实现精准营销模式示意图
3)大数据能够帮助景区分析经营状况,预测景区经营趋势。传统的数据分析只能了解景区的某一业务或者某一部门的业务情况,很难从全局的角度去观测园区的经营变化。每逢节假日景区进入入园高峰期,都可以看到旅游景点游客排队或滞留的相关新闻。这些问题难以控制是因为各业态的数据没有进行统合。如果能把订票、交通、入园等数据结合并进行分析对比,就可以提前分析入园高峰期的具体时间,提前限流或者对重要的区域增加管控。利用景区大数据,通过分析游客的基本属性、预订行为、游玩轨迹等,构建游客画像,辅助景区制定精准营销策略,加强对游客二次消费行为的引导,从而预测景区经营趋势。例如,大数据可视化技术的应用。大数据可视化技术是对海量数据通过数学建模以及图形动画展示等效果加以可视化解释的一种技术[4],包括景区检测数据可视化分析、景区热力图等。一是景区检测数据可视化分析,通过模块化数据处理单元对景区客流状况实时监测,再把采集到的数据通过数据中心转化处理,从而呈现出可见的景区客流饱和度动态图景,为实现客流量的调控、景区运行评估与在线分析评价提供依据。二是景区热力图,通过GPS系统的分析定位功能,将采集到的数据通过Google Chart等可视化数据处理工具处理,在显示屏上呈现描述人流量密度的景区热力图,可以在短期内预测景区客流量的动态变化,从而为景区安全经营提供保障。
4)大数据能够检测景区网络口碑热度,为景区塑造良好形象提供依据。网络口碑是指消费者通过互联网向潜在消费者传递的有关商家产品或服务的正面或负面信息[5]。通过对网络口碑的研究,可以分析游客对景区的印象,了解游客需求偏好,为景区优化管理提供第一手资料,从而为景区开发适销对路的产品、改进服务质量提供依据。旅游网络口碑也是旅游地形象的风向标,一般而言,旅游地形象与旅游口碑成正相关关系,即旅游口碑好的景区,其旅游目的地形象也好,反之亦然。影响景区口碑热度情况的一个重要指标为景区评论量,景区评论量越多,说明景区的实际游客到访量越多,景区舆情热度越高;景区评论量过少,说明在网络口碑舆情方面表现平淡,景区受欢迎程度较小。表1为由网易旅游与大地云游联合发布的 《2019年上半年5A景区网络口碑舆情报告》全国景区满意度前20名的排名情况。该报告对全国258家5A级景区的口碑舆情进行大数据分析,收集926 130条口碑评论,较为客观地反映了2019年上半年全国各大景区游客满意度的评价。
表1 全国景区满意度前20名排名表
云计算是一种新型的超级计算方式,以数据为中心,是一种数据密集型的超级计算,在数据存储、数据管理、编程模式等多方面具有自身独特的技术[6]。云计算的分布式架构很好地解决了大数据获取与储存的需求,云计算的硬软件成本、管理与运营费用较低,其经济性与实用性使得云计算在旅游大数据方面的处理和利用成为可能。为了满足旅游大数据高效存储与传输需求,目前各IT厂商对旅游大数据的处理多采用谷歌文件系统 (Google File System,GFS)数据存储技术或BigTable数据管理技术。
1)GFS数据存储技术。GFS是一个管理大型分布式数据密集型计算的可扩展分布式文件系统[7]。GFS的新颖之处在于它采用廉价的商用计算机集群构建分布式文件系统,在降低成本的同时经受了实际应用的考验。GFS基本构架和工作原理见图2。一个GFS包括一个主服务器 (master)和多个块服务器 (chunk server),这样一个GFS能够同时为多个客户端应用程序 (Application)提供文件服务。GFS将服务器故障视为正常现象,通过软件的方式自动容错,在保证系统可靠性和可用性的同时,大大降低了系统的成本。
图2 GFS基本构架和工作原理示意图
2)BigTable数据管理技术。为解决关系数据库系统在系统伸缩性和数据存取性能方面的问题,谷歌公司开发出BigTable数据库[8]。与其他数据储存管理系统相比,BigTable具有以下优势:一是适用性高。Bigtable技术的开发是为了满足一系列产品应用的需求,具有较高的扩展性与兼容性,为旅游数据的分布式储存与获取提供高质量的服务。二是可用性强。BigTable技术在数据储存与获取上有优越的性能外,在任何情况下其系统都是可用的,这为旅游大数据不间断的计算处理提供了可靠保障。三是简单可操作性。BigTable底层系统的简单性减少了系统出错的概率,为上层应用的开发提供了便利。BigTable数据管理分布式存储子表地址结构见图3。
图3 BigTable数据管理分布式存储子表地址结构示意图
物联网是未来网络的整合部分,它是以标准、互通的通信协议为基础,具有自我配置能力的全球性动态网络设施[9]。物联网通过智能感知、识别技术与普适计算、泛在网络的融合应用,被称为继计算机、互联网之后世界信息产业发展的第三次浪潮。物联网技术工作原理见图4。
图4 物联网技术工作原理示意图
物联网技术在旅游业中的应用主要体现在以下2项关键技术:一是红外双向传感器技术。红外双向传感器技术主要应用于景区客流的流出与流入双向统计,其设计主要由红外传感设备、无线传输网络、调节控制器、电源与天线组成。每组红外传感器有两对红外感应装置,当游客走进传感器检测区域时,系统通过监测游客遮挡两对传感器中的一个来判断有其出入行为。可以在景区安装多组红外传感器,通过设定传感器的地理位置,再由无线网络把特定位置的游客流入与流出量数据传输到数据中心管理平台,可以实现全景区游客流量的监测与统计。二是射频识别 (Radio Frequency IDentification,RFID)技术,又称电子标签 (E-Tag)技术,是一种利用射频信号自动识别目标对象并获取相关信息的技术[10]。RFID技术在旅游行业应用广泛。例如,RFID电子门票技术的应用不仅能够实现景区门票防伪,而且便于操作管理简单,便于快速售票,游客直接刷卡检验门票,实现自动检票解决买票检票排队问题,实现游客服务数字化、人性化、高效化。旅游RFID技术整合导览、导游、定位、车流和人流数据采集等功能为一体,对景区各项数据进行实时的自动采集和分析,实现景区管理智慧化。
旅游大数据中心信息化服务平台以旅游信息化和旅游数据积累为基础,通过智能化的技术手段,高度融合旅游服务、旅游管理、旅游营销等各项数据,实现游客与景区各服务要素的相互感知,综合运用大数据搜索、分析、整合、优化景区管理的服务平台。信息化服务平台要求在计算机信息系统服务架构设计上,能为应对海量高并发数据访问和大量异构数据查询的挑战,要求数据中心需具有快速稳定性、灵活扩容性、安全防护性、节能环保性等特点。旅游大数据中心信息化服务平台在整体设计上分为基础硬件层与服务器层、应用数据库层、数据中心对外接口层,并且对外提供了统一数据库访问接口,以此为平台的其他应用系统提供数据支撑服务。旅游大数据中心信息化服务平台基础架构见图5。
图5 旅游大数据中心信息化服务平台基础架构示意图
1)基础硬件层与服务器层。基础硬件层是保障数据中心正常运行的基础硬件设施。主要包括磁盘 阵 列 (Redundant Arrays of Independent Drives,RAID)设备与不间断电源 (Uninterrupted Power Supply,UPS)设备,RAID设备保证少量硬盘损坏的情况下,仍可以支持数据恢复和数据存取;UPS设备保证在数据中心断电时将数据安全地存入硬盘。这些设备均为旅游大数据中心的稳定、快速响应提供安全基础保障。
2)应用数据库层。由于旅游大数据信息化服务平台数据量巨大、数据种类繁多、类型结构复杂,因此充分有效地管理和利用各类信息资源是保证平台流畅运行的前提条件。其主要特点是:一是实现数据共享。数据共享包含所有用户可同时存取数据库中的数据,也包括用户可以用各种方式通过接口使用数据库,并提供数据共享。二是减少数据冗余度。同文件系统相比,由于数据库实现了数据共享,从而避免了用户各自建立应用文件。减少了大量重复数据,减少了数据冗余,维护了数据的一致性。三是数据的独立性。数据的独立性一方面包括数据库中数据库的逻辑结构和应用程序相互独立,另一方面包括数据物理结构的变化不影响数据的逻辑结构。
3)数据中心对外接口层。数据中心对外接口层由数据计算与数据缓冲两部分组成,其中,数据计算融合各种异构数据源,完成复杂数据查询的统一工作,给出查询结果;数据缓存将部分数据在内存和硬盘中分别进行存储,保证了数据的快速获取,并且在系统冷重启时,不会由于缓存的清空而导致系统性能急剧下降。在物理位置上,旅游大数据中心信息化服务平台是建设在数据中心的终端,这个终端并不对系统外部人员公开,是决策人员和管理人员在数据中心进行统筹决策而使用的终端。旅游大数据中心信息化服务平台具有简化展示、统筹指挥、辅助决策等特点,起到维持景区稳定、提升应急能力、保障景区治安等作用。
旅游信息安全防护支撑服务的作用是通过构建多功能、多层次、全方位的安全防御体系,从而保证旅游上层应用的通信安全、应用安全及数据安全;通过构建智能化的信息预防系统,为相关部门做好旅游安全突发事件的预防工作赢得宝贵时间。旅游信息安全防护技术服务架构见图6。其防御的特点主要体现在主动防御、物理隔离两个方面。
图6 旅游信息安全防护技术服务架构示意图
1)主动防御。为了应对复杂多变的网络攻击,计算机主动防御日益受到业界的重视。主动防御是通过统计分析用户历史行为数据,计算用户的使用习惯,检测异常用户行为;使用具有学习和自适应能力的神经网络实现智能化的入侵检测;以最优的防御代价完成智能化的主动防御。例如,对用户异常用户行为的检测,根据行为危害级别追加不同处理;自动学习更新识别模型,可定制识别模型;提供多种可视化报表,录制攻击者攻击行为,可进行网络取证等。
2)物理隔离。为应对外部网络攻击,物理隔离技术越来越受到业界关注。物理隔离主要包括3个部分:一是客户端的物理隔离。这种方案用于解决网络客户端的信息安全问题。在网络的客户端应用物理隔离卡,可以使一台工作站既可连接内部网又可连接外部网,可在内外网上分时工作,同时绝对保证内外网之间的物理隔离,起到了方便工作、节约资源等目的。二是集线器级的物理隔离。可在客户端的内外双网的布线上使用一条网络线,通过远端切换器连接内外双网,实现一台工作站连接内外两个网络的目的,并在网络布线上避免了客户端要用两条网络线连接网络。三是服务器端的物理隔离。它通过复杂的软硬件技术实现了在服务器端的数据过滤和传输任务,其技术关键在于同一时刻内外网络没有物理上的数据连通,但又快速分时地处理并传递数据。