智慧旅游信息系统中大数据技术的应用

2016-03-26 16:22张占昭宋汉珍衡军山牟学鹏王立萍
承德石油高等专科学校学报 2016年4期
关键词:数据仓库海量信息系统

张占昭,宋汉珍,衡军山,牟学鹏,王立萍

(承德石油高等专科学校 计算机与信息工程系,河北 承德 067000)



智慧旅游信息系统中大数据技术的应用

张占昭,宋汉珍,衡军山,牟学鹏,王立萍

(承德石油高等专科学校 计算机与信息工程系,河北承德067000)

智慧旅游信息系统一端连接数据中心,另一端连接各种终端,为其提供各种与智慧旅游相关的服务信息。显然在智慧旅游信息系统中,大数据技术起着基础和关键的作用。在对传统数据和大数据以及大数据技术进行研究的基础上,进而着力分析了大数据技术在智慧旅游信息系统中的具体应用,力求为智慧旅游提供可行的研究思路和方法。

智慧旅游;大数据技术;信息系统

智慧旅游是将物联网技术、通信技术、互联网技术、大数据技术、云计算等现代先进技术运用到旅游的相关领域中,如旅游参与者、旅游产业、旅游行政管理部门等,其中大数据是实现智慧旅游各项功能的基础,起着至关重要的作用。智慧旅游信息系统一般由服务器端和客户端构成,而服务器端的重要支撑是大数据中心,服务器从数据中心获取数据,通过物联网、互联网、无线通信网等传输技术向客户端传送数据信息,用户通过数据信息在旅游中做出智能判断和决策,使旅游出行更加方便快捷。

1 大数据

1.1传统数据和大数据

数据承载的信息量小、信息处理能力低下、数据分析技术和软件有限是传统数据的重要标志,同时数据采集手段单一,导致随机采样分析在整个数据的处理过程中显得更加重要,这种数据分析方法是对少量数据进行随机采样,然后通过分析这少量数据来获取尽可能多的信息,信息本身和数据量没有多大关系。这种分析数据的方法不可避免地会出现致命问题,如随着数据量的不断增加,分析工作越来变得越困难;随着数据不断深入分析,分析结果误差越来越大,甚至出现错误;随着新数据的不断涌现,需要对新数据进行重新采集、处理、分析,这显然不能满足现代信息社会发展的需要。

随着物联网产业以及感知技术的迅猛发展,数据的内涵发生了本质的变化,大数据不仅仅是大量数据的简称,还包含了数据类型多、数据处理速度快、采集手段多样、数据存储和分析技术高效等相关内容。

1.2大数据技术

大数据技术的核心内容是将时间上、空间上产生的海量数据、非结构数据进行收集、分析、转换、存储、管理、挖掘、创新、利用等,其中为海量数据搭建数据仓库是数据存储的必要环节,然后按照各个信息系统的不同要求设计相应的数据库,进而形成每个信息系统的数据中心,为信息系统每个模块的智能决策提供支持[1]。数据仓库技术是大数据技术的核心技术,主要包括数据源的相关技术和海量数据存储两部分内容,而数据仓库的内涵是数据创新。

在大型信息系统中,数据的来源十分复杂,致使数据存储形态多样,所以存储之前要对数据进行有效的整合,数据整合技术是通过对海量数据(包括空间数据、属性数据、动态数据)进行集成,使之与不同的信息系统相对应,旨在通过数据整合,大大增加数据的利用效率,最大限度减少信息孤岛的出现[2]。空间数据主要包括采集和测量的数据、地图信息数据、地名和地址数据等,整合时需要将所有信息用诸如GIS通用软件将其转换成数字信号;对矢量数据进行数据格式整合,可以用FME等软件进行转换;数据坐标的优化可用点线面数学模型进行转换;数据属性格式化操作可采用编码方式将属性和地理位置一对一或一对多进行对应;动态数据如流量的测试、视频的监控等要利用物联网技术、互联网技术向指定服务器上传,服务器获取后用软件技术和算法进行存储,最后供管理人员进行如景区规划、景区建设、景区管理等方面决策时提供保障。

1.3数据挖掘Apriori算法

数据挖掘Apriori算法的设计思路是利用递推方法和逐层迭代搜索找到所有层次的频繁集,条件是支持度大于最小支持度,然后用找到的频繁集生成满足置信度的关联规则。其中迭代函数主要任务是生产i层候选集,方法是通过连接i-1层频繁集,候选集大大减少了数量的原因是判断频繁集的非空子集,方法是判断该超集项中所有 i-1 子项是否完全包含于 i-1层频繁集中,如果完全包含则该项为 i层候选集项,不包含就删除该超集项。

2 大数据技术在智慧旅游中的应用

2.1智慧旅游中数据的流程

在智慧旅游信息系统中,由于与旅游数据相关的实体种类繁杂,导致旅游数据具有多样性,这些数据要经历采集、分析、归类、挖掘、选取、装载等过程,这也是大数据技术具体运用的整个流程[3]。

数据采集就是将与旅游相关实体如吃住行游购娱等进行数据收集的过程,该过程既可以用传统方式如照相机、录像机、扫描仪、检测仪等进行采集,也可以用与物联网相关的感知技术如传感器、GPS等进行采集;数据分类和选取不仅要对传统格式数据如文字和图像进行归类选取,也要将超媒体和多媒体信息融入到信息系统中去,选取后还要进行属性的划分;数据挖掘不是直接采集的数据,不能停留在数据表达的表层意义,要对旅游数据进行选取和分类后进行,是对现有数据利用数据挖掘技术进行的二次、三次分析,这样的数据可以给旅游管理部门提供智能决策支持;数据仓库构建符合智慧旅游相关数据结构和关系的数据中心;数据处理是利用相关软件对数据仓库中的数据进行规范化处理,包含的内容有数据格式的统一、误差的消除、编码的唯一性、精度的提高等;数据加载是将处理好的数据装入到关系数据库中去的过程,如oracle数据库。

2.2智慧旅游信息系统中数据仓库的设计

智慧旅游信息系统的主要是向旅游参与者、旅游行政管理人员等提供智能决策功能,对数据信息提出了更高的要求,如对多样性的数据、实时动态数据、数据的准确性、数据格式的规范性等方面都提出了新的要求,这些要求也促使与大数据相关的技术也得到迅速发展。如数据分析技术由传统的采样分析转变为海量数据分析,由于分析结果基于全部数据,致使预测结果有着先天优势,为智慧旅游做出更可靠决策提供保证;数据处理技术由传统的单一计算机转变为云计算,使对海量数据、非结构数据等的处理成为了现实;数据存储技术则包含了数据仓库技术、数据存储结构和算法、视频数据的维护、磁盘阵列的设计等内容,目前海量存储技术的关键是用文件系统来构建共享的数据系统。

数据仓库是大数据技术在智慧旅游信息系统中最重要的应用,信息系统中每个子模块的数据流程都与数据仓库的设计内容、方法、结构有直接关系,影响数据中心中数据的利用效率。数据仓库的搭建是建立在不断对信息系统需求深入分析、不断细化,对数据主体不断抽象基础之上,进而加载到每个模块的关系型数据库中去,数据库的构建结构上力求功能齐全,如满足基本的增删改查询等功能。而数据仓库的着力点应在每个子模块的功能上,多从实际用户需求方面考虑结构该如何设计,将数据需求划分成不同的子模块,同时为了方便数据加载,也需要将数据库分成不同的子数据库,目的是满足功能的同时提高数据利用效率。总体来讲,我们可以将智慧旅游数据仓库设计成如图1所示。

3 结语

总之大数据技术将海量数据进行处理后,为旅游者、旅游管理部门、旅游产业等相关者提供高效、准确、规范的数据支持,在智慧旅游信息系统中,运用数据仓库技术和大数据整合技术等可以为构建智慧旅游提供数据基础,为信息服务和智能决策提供帮助,加强智慧旅游的内涵建设。

[1]马建光,姜巍.大数据的概念、特征及其应用[J].国防科技,2013(2):10-17.

[2]刘智慧,张泉灵.大数据技术研究综述[J].浙江大学学报,2014,48(6):957-972.

[3]张欣.智慧旅游感知体系和管理平台的构建[J].江苏人学学报(社会科学版),2013,13(6):67-75.

Analysis on Application of Big Data Technology in Intelligent Tourism Information System

ZHANG Zhan-zhao, SONG Han-zhen, HENG Jun-shan, MU Xue-peng, WANG Li-ping

(Department of Computer and Information Engineering, Chengde Petroleum College, Chengde 067000, Hebei, China)

The wisdom of tourism information system is connected with one end of a data center, and the other end is connected with a variety of terminal, to provide various service information related to intelligent tourism. Obviously in intelligent tourism information system, big data technology plays a fundamental and critical role. Based on the traditional data and big data as well as big data technology research, this paper focuses on the analysis of the specific application of big data technology in intelligent tourism information system, and strives to provide feasible research ideas and methods for intelligent tourism.

intelligent tourism;big data technology;information system

河北省高等学校自然科学青年基金项目(物联网技术在承德智慧旅游系统的应用研究):QN2016262

2016-03-08

张占昭(1978-),男,河北保定人,承德石油高等专科学校计算机与信息工程系讲师,硕士,主要研究方向为物联网技术、嵌入式系统。

F59

A

1008-9446(2016)04-0049-03

猜你喜欢
数据仓库海量信息系统
一种傅里叶域海量数据高速谱聚类方法
企业信息系统安全防护
基于数据仓库的数据倾斜解决方案研究
海量快递垃圾正在“围城”——“绿色快递”势在必行
基于数据仓库的住房城乡建设信息系统整合研究
基于区块链的通航维护信息系统研究
信息系统审计中计算机审计的应用
探析电力系统调度中数据仓库技术的应用
一个图形所蕴含的“海量”巧题
基于SG-I6000的信息系统运检自动化诊断实践