旅游地理本体模型设计与张家界实例研究

2016-06-01 12:19:21烨,康娟,李杰,2*,傅庆,2
地理与地理信息科学 2016年3期
关键词:旅游地理张家界实例

洪 烨,康 明 娟,李 仁 杰,2*,傅 学 庆,2

(1.河北师范大学资源与环境科学学院,河北 石家庄050024;2.河北省环境演变与生态建设实验室,河北 石家庄050024)

旅游地理本体模型设计与张家界实例研究

洪 烨1,康 明 娟1,李 仁 杰1,2*,傅 学 庆1,2

(1.河北师范大学资源与环境科学学院,河北 石家庄050024;2.河北省环境演变与生态建设实验室,河北 石家庄050024)

互联网中的海量旅游信息对于信息时代的旅游地理学研究具有重要意义,但新型旅游信息存在的多源、异构、非标准化、语义缺失或模糊等问题,成为旅游地理学研究的障碍。该文利用本体论知识,结合已有地理和旅游本体,提取传统旅游地理学科知识中的核心概念,整合互联网大数据时代的旅游地理相关新概念,考虑旅游地理相关的专题内涵、空间尺度和空间关系等特点,对旅游地理知识进行抽象表达,以“地理位置”、“旅游空间”、“旅游资源”、“旅游参与者”、“旅游行为”及“几何要素”为核心概念,通过定义旅游地理本体中类、属性及层次关系构建了能被共享、重用和适于计算机理解的旅游地理本体模型,以张家界旅游地为例进行实例填充,并进一步约束实例间属性关系。张家界旅游文本信息的语义标注实证研究表明,利用旅游地理本体挖掘与解读海量旅游信息具有可行性。该文为基于旅游地理本体的文本挖掘提供了理论和方法参考。

旅游地理本体;本体模型;旅游文本;张家界

0 引言

以携程网、途牛网、去哪儿网、微博和博客等为代表的新型社交媒体为旅游业发展提供了机遇[1],旅游者通过社交媒体网站发布的旅游文本与照片等媒体内容,也为旅游研究提供了海量数据[2,3]。旅游文本内含和附带的时空信息已经引起旅游地理学者的关注。然而,这些数据在有效使用之前还存在以下问题:多源、异构、非标准化造成知识分类和集成困难;旅游信息的时空语义隐藏于内容描述和组织结构中,造成语义分析困难。有效解决这两个困难,成为社交媒体中的旅游信息应用于旅游地理学的关键。

随着本体技术的成熟,本体在信息集成和知识发现方面具有的重要作用日益显现。在旅游本体研究方面,基于旅游本体的语义Web技术可以有效整合互联网异构信息,用于个性化推介和旅行规划[4];基于旅游本体的文本信息抽取研究经常采用旅游文本语料[5,6]或制定本体匹配规则[7],反映了本体在旅游信息挖掘中的潜在优势,而信息抽取则成为本体实例化和应用的重要环节。在地理本体研究方面,涉及地理本体建模与推理[8]、地理本体的集成和融合[9]、本体驱动的地理信息抽取[10]、地理知识与服务发现[11]等。随着本体技术的成熟,基于地理本体的大数据挖掘成为新热点,例如基于本体的遥感大数据挖掘[12,13],利用地理协作本体的专家知识和VGI集成等均受到学者关注[14],充分证明了本体技术在互联网时代信息时空语义挖掘的可行性和高效性。

旅游地理学以旅游者、旅游资源、旅游事件等相关要素为研究对象,特别关注多时空尺度下的旅游格局、过程与驱动机制研究,对学科本体描述的要素时空属性有特殊需求。当前,旅游本体集成主要服务于旅游电子商务信息分类和个性化推介,缺少要素时空属性及其相互间空间关系的表达;各类地理本体虽然关注地理知识分类与空间关系等概念,但缺少旅游专题语义内涵。在大数据时代背景下,旅游地理研究对特定旅游地理本体的需求已非常明确。本文通过继承发展已有的旅游与地理本体,构建了旅游地理本体表达模型,并以旅游文本为数据源,开展本体实例填充和应用实验,为旅游地理研究在大数据时代面临的数据应用障碍提供解决方法。

1 本体概念及形式化表达

本体是共享概念模型的、明确的形式化规范说明[15-17],以标准化、明确的方式描述概念内涵及层次结构,进而实现领域内的语义信息共享和互操作。为使计算机更好地理解和处理本体,需要将本体进行形式化处理。OWL语言(Web Ontology Language)是W3C推荐的本体描述语言,基础理论为描述逻辑思想,具有很强的知识表达能力。

本体包含类、属性及实例三要素,本文采用OWL DL作为旅游地理本体描述语言,以下对三要素形式化表达进行说明。

(1)OWL中将owl:Class表示为类信息,Class能够通过rdfs:subClassOf定义出一个特定的类层次。

表明“旅游空间”是一个类信息,rdfs:subClassOf表示类之间的继承关系,“景区”是“旅游空间”的子类。

(2)OWL本体中存在两种属性:一种是对象属性,用owl:ObjectProperty表示类与类之间的关系;另一种为数据类型属性,用owl:DataTypeProperty表示类到基础数据类型(XML datatype)之间的关系。rdfs:subPropertyOf可以声明属性层次关系。

表明“景区包含游览线”是“包含”对象属性的子属性,“景区包含游览线”的定义域为“景区”,值域为“游览线”。

(3)实例是类的一个具体的个体或对象,<游览线rdf:ID="十里画廊"/>表明“十里画廊”是“游览线”类的一个实例。

2 旅游地理本体

2.1 构建方法

目前,建立本体方法大多采用手工方式并且种类繁多,每种方法有各自的原则、标准和定义,比较流行的本体建模方法主要有骨架法、企业建模法和七步法[18]等。本文采用Stanford大学开发的七步法构建旅游地理本体,该方法较为成熟,包含领域概念分析、本体构建以及实例添加等方面。根据旅游地理本体的领域知识内涵和对时空尺度与空间关系的要求,在七步法指导下,旅游地理本体模型构建流程如下(图1):1)确定构建本体的相关领域范围,本文将对旅游、地理领域知识建立本体;2)旅游地理本体构建的宗旨是实现领域内的知识共享,因此,需要考虑现有旅游、地理本体是否可以重复使用;3)列出旅游、地理领域内重要术语,对其逻辑结构进行梳理并进行规范化描述,避免旅游地理本体构建出现概念及属性重复或数据冗余等问题;4)定义旅游地理本体中类及类之间的层次关系,创建类的框架体系有自顶向下、自下而上及混合方式,本文对旅游地理本体构建采用自顶向下的方式创建本体类的层次关系;5)定义旅游地理本体中属性及属性之间的层次关系,旅游地理本体领域中的各个概念、对象及实例等都不是各自独立的,而是相互联系,因此,需要定义属性约束关系,从而约束类及实例间的关系;6)定义旅游地理本体中属性的特征与限制约束,例如,为某个属性设置定义域与值域,属性旅游地包含景区,定义域为旅游地,值域则是景区;7)添加旅游地理本体实例,为旅游地理本体模型中的各个类创建实例,并对实例添加属性约束。

图1 七步法构建流程Fig.1 The construction process of seven steps

2.2 旅游地理概念分析

旅游地理本体是将旅游和地理的知识、信息及数据抽象成一个具有共识的对象,并按照其层次关系组成的知识体系,旅游地理本体模型的抽象表达必须依赖于对旅游地理相关概念系统分析的基础上。旅游是建立在一定社会经济基础上的社会经济活动,是集吃、住、行、游、购、娱六大要素于一体的综合性产业,涉及地理空间、旅游资源和旅游参与者等众多要素,受自然因素和人文因素的双重影响。一次旅游活动既是一种经济行为,同时也是一种地理现象。旅游地理学研究旅游活动、地理环境和社会经济发展之间的关系,特别关注旅游者、旅游资源、旅游事件等相关要素在多时空尺度下的格局、过程与驱动机制研究。

旅游活动产生的大量旅游文本、照片、视频、评论和旅行轨迹等信息是现代旅游地理学研究的重要数据源,能够承载旅游活动的多种特征:地理位置、旅游空间、旅游资源、旅游参与者和旅游行为等。根据本体形式化表达的基本要求及旅游地理学的核心内涵,旅游地理本体涉及的核心概念及层次关系应主要从以下五方面进行凝练。1)地理位置。任何一次旅游活动都具有地理位置信息,它记录了旅游者的出发地、目的地等;另外,地理位置也是旅游空间、旅游资源和旅游服务机构的载体。地理位置包括行政区划与非行政区划(指土地和海泽等信息)。2)旅游空间。是指涉及旅游活动依托的表现为点、线、面等地理形态的空间信息,包括旅游地、旅游路线、景区、游览线和景点等,是旅游资源的载体。如果以实体对象的形状来划分,旅游地、景区为面要素,旅游路线与游览线为线要素,景点为点要素。3)旅游资源。它是旅游地吸引旅游者的重要因素,可以是具有物质形态的自然实体,也可以是非物质的社会文化要素;旅游资源分布在一定的地理空间之上,其中包括风景名胜、遗址遗迹、建筑设施、旅游商品、民俗风情或人文艺术等。4)旅游参与者。是指直接或间接参与旅游活动的人或机构组织,影响着旅游地的发展和建设,包括旅游者、导游、社区参与和服务机构等信息。5)旅游行为。它通过旅游者的需要和动机产生,是在一定地域上产生的一种旅行和游玩的过程,反映旅游者的旅游动机,按动机分类,其内容包括观光旅游行为、体育旅游行为、修养旅游行为、政治旅游行为、文化旅游行为、社会旅游行为等。旅游行为的产生介于特定的旅游空间尺度范围,根据涉及空间的大小,空间行为可划分为大、中、小3个尺度[19]。

2.3 旅游地理本体模型

根据本体概念及形式化表达的基本要求和旅游地理概念的系统解析,以Protégé软件作为本体编辑和可视化工具。旅游地理本体模型可以描述如下:

(1)类及层次关系描述。旅游地理本体类及层次关系的设计采用自顶向下法。依据旅游地理研究需要,在概念分析基础上综合考虑旅游要素,建立“地理位置”、“旅游空间”、“旅游资源”、“旅游参与者”、“旅游行为”及“几何要素”六大概念类,体现旅游者在旅游地域上的各种行为活动,反映人地关系。在六大概念基础上,逐步细分建立各概念类的子类,使粒度精确到每一具体要素,最终完成旅游地理本体概念层设计(图2)。

图2 旅游地理本体(部分)类及层次关系Fig.2 Tourism geography ontology (partial) class and hierarchy diagram

(2)属性及层次关系描述。仅有类及层次关系的描述还不能保证旅游地理本体的完整性,需要添加属性对其进一步完善。旅游地理本体属性信息见表1。以对象属性为例,游览线与景点是包含关系,景区与景区管理机构是管理与被管理的关系;以数据类型属性为例,住宿机构自身的属性包括地址、星级和电话等,地址均为文字描述,例如城市名、区名和街道号等信息。属性层次关系表现为“包含”,属性包括“旅游地包含景区”、“景区包含游览线”、“游览线包含景点”等。

表1 旅游地理本体属性(部分对象、数据类型属性为例)Table 1 Tourism geography ontology property (part of object property, data type property)

(3)添加实例。旅游地理本体模型中对类和属性的定义,为旅游地理本体搭建了框架,要形成完整的旅游地理本体知识库,还要进行实例填充。

3 张家界本体实例

3.1 张家界实例填充

以张家界为例,通过整理张家界旅游官网、张家界旅游服务大全等资料和旅游文本数据库获得旅游地理本体实例信息,通过手工方式进行实例填充。张家界实例填充结果(部分)如图3所示,图3a为 “旅游空间”部分实例填充及属性约束结果,张家界实例通过属性关系进行约束,以“包含”对象属性为例,通过“包含”对象属性的子属性“旅游地包含景区”,定义“张家界”旅游地包含“森林公园”、“天子山”、“天门山”、“杨家寨”和“索溪峪”等景区;通过“景区包含游览线”定义“索溪峪”景区包含“百丈峡”、“宝峰湖”、“鹞子寨”和“十里画廊”等游览线;通过“游览线包含景点”定义“十里画廊”游览线包含“水绕四门”、“雄狮回头”、“古梓翠伞”、“九天银练”、“锦鼠观天”等景点。图3b为“旅游资源”部分实例填充结果;图3c为“旅游参与者”部分实例填充结果。

3.2 张家界实例语义标注

语义标注是本体实例化和应用的重要环节。旅游文本信息挖掘通常采用分词工具[20]和建立地名字典[21]等方法,忽略了旅游地理学对要素空间尺度和空间关系的应用需求。本文在张家界旅游地理本体约束下,对旅游文本进行语义标注,解析旅游文本中的语义关系(图4),通过对旅游文本中“旅游地”、“游览线”、“景区”、“景点”及“特种旅游交通”的实例信息进行分类标注(图4a),解读文本中各实例要素之间的语义关系(图4b)。

图3 张家界实例信息(部分)Fig.3 Part of Zhangjiajie instance information

图4 旅游文本语义标注及关系展示Fig.4 Tourism text semantic annotation and relationship

4 结论与展望

在继承已有旅游、地理本体基础上,整合互联网大数据时代与旅游地理相关的新概念,探索利用本体表达多时空尺度旅游信息的有效途径,以“地理位置”、“旅游空间”、“旅游资源”、“旅游参与者”、“旅游行为”及“几何要素”等为核心概念,采用本体建模语言构建了旅游地理本体模型。该模型考虑了旅游地理相关的专题内涵、空间尺度、空间关系等要素特点及应用价值,实现了对旅游地理本体语义的旅游和地理概念的完整描述。以张家界旅游地为例,在已有旅游和地理本体基础上,综合旅游官方网站、旅游实地调查和互联网旅游文本数据源,构建了包括275个类、71条属性和752个本体实例的张家界旅游地理本体模型。研究表明,旅游地理本体模型具有适用性及实例化的可行性。通过旅游地理本体中“旅游空间”的子集标注旅游文本,标注内容包括“旅游地”、“景区”、“游览线”、“景点”、“旅游参与者”及“特种旅游交通”的实例信息。测试表明,基于旅游地理本体可以进一步解读旅游文本中的语义关系,为基于旅游文本开展空间结构、特征与演化研究提供了基础。

本文的重点在于利用本体论思想,融合旅游与地理本体构建旅游地理本体模型,因此,张家界旅游文本的语义标注只是简单的测试性应用。旅游地理本体模型的构建将为旅游地理学提供以下三方面的潜在应用支持。首先,解析旅游文本中的空间关系节点,确定旅游者的出发地、目的地及旅游线路的动态组织关系;通过线路组织、旅游行为、旅游交通连接等关系,对游客流、物质流和信息流等流动性空间特征进行研究。第二,以旅游地理本体中“旅游行为”为基础,并结合旅游文本中的形容词描述的情感特征,对旅游环境、旅游意象、地方感知度与满意度等人地关系特征进行深入研究。基于旅游地理本体,可以挖掘旅游信息中表征的旅游热度分布、行程规划模式、线路组织关系,发现潜在的旅游空间结构、旅游地演化过程等。第三,探索旅游地理本体的智能维护与存储方式,实现旅游地理本体在跨学科与各领域中的信息集成与共享,基于旅游地理本体知识库可以实现互联网旅游文本的半自动化数据清洗,提高海量旅游文本的清洗效率,从海量旅游文本中快速提取旅游地理相关研究所需数据;另外,基于旅游地理本体知识库的旅游文本语义标注,可以有效解读文本中存在的时空语义内涵,为旅游地理信息的深度挖掘和知识发现提供基础。

[1] SPARKS B A,PERKINS H E,BUCKLEY R.Online travel reviews as persuasive communication:The effects of content type,source,and certification logos on consumer behavior[J].Tourism Management,2013,39:1-9.

[2] 王琨,郭风华,李仁杰,等.基于Tripadvisor的中国旅游地国际关注度及空间格局[J].地理科学进展,2014,33(11):1462-1473.

[3] 王守成,郭风华,傅学庆,等.基于自发地理信息的旅游地景观关注度研究——以九寨沟为例[J].旅游学刊,2013,29(2):84-92.

[4] MORENO A,VALLS A,ISERN D,et al.Sigture-destination:Ontology-based personalized recommendation of tourism and leisure activities[J].Engineering Applications of Artificial Intelligence,2013,26(1):633-651.

[5] VICIENT C,S NCHEZ D,MORENO A.An automatic approach for ontology-based feature extraction from heterogeneous textual resources[J].Engineering Applications of Artificial Intelligence,2013,26(3):1092-1106.

[6] FARIA C,SERRA I,GIRARDI R.A domain-independent process for automatic ontology population from text[J].Science of Computer Programming,2014,95:26-43.

[7] 陈立娜,张红,马莉,等.基于本体的旅游信息抽取[J].计算机应用与软件,2010,27(4):146-148.

[8] 李霖,朱海红,王红,等.基于形式本体的基础地理信息语义分析——以陆地水系要素类为例[J].测绘学报,2008(2):230-235.

[9] 王敬贵,杜云艳,苏奋振,等.基于地理本体的空间数据集成方法及其实现[J].地理研究,2009,3(3):696-704.

[10] JONES C B,PURVES R S.Geographical Information Retrieval[M].Encyclopedia of Database Systems Springer US,2009.1227-1231.

[11] 张立朝,潘贞,王青山,等.本体驱动的地理信息服务发现模型研究[J].武汉大学学报(信息科学版),2009,6(6):641-645.

[12] OLIVA-SANTOS R,MACI-P REZ F,GAREA-LLANO E.Ontology-based topological representation of remote-sensing images[J].International Journal of Remote Sensing,2014,35(1):16-28.

[13] FORESTIER G,WEMMERT C,PUISSANT A.Coastal image interpretation using background knowledge and semantics[J].Computers & Geosciences,2013,54:88-96.

[14] RICKER B A,JOHNSON P A,SIEBER R E.Tourism and environmental change in Barbados:Gathering citizen perspectives with volunteered geographic information (VGI)[J].Journal of Sustainable Tourism,2013,21(2):212-228.

[15] GRUBER T R.Toward principles for the design of ontologies used for knowledge sharing?[J].International Journal of Human-Computer Studies,1995,43(5):907-928.

[16]USCHOLD M,GRUNINGER M.Ontologies:Principles,methods and applications[J].The Knowledge Engineering Review,1996,11(2):93-136.

[17] STUDER R,BENJAMINS V R,FENSEL D.Knowledge engineering:Principles and methods[J].Data & Knowledge Engineering,1998,25(1):161-197.

[18] 徐安建,王海涛,尉伯虎,等.地理本体构建方法研究[J].测绘与空间地理信息,2013(7):38-40.

[19] 保继刚,楚义芳.旅游地理学[M].北京:高等教育出版社,2012.

[20] 李照航,傅学庆,郭风华,等.旅游地文本中的细粒度地名可视化方法[J].测绘科学,2015,40(1):58-62.

[21] 张雪英,朱少楠,徐希涛.基于Neogeography的中文地名词典维护和服务机制[J].测绘通报,2012(1):56-59.

Tourism Geography Ontology Model Design and Research of the Zhangjiajie Instance

HONG Ye1,KANG Ming-juan1,LI Ren-jie1,2,FU Xue-qing1,2

(1.CollegeofResourcesandEnvironmentScience,HebeiNormalUniversity,Shijiazhuang050024; 2.HebeiKeyLaboratoryofEnvironmentalChangeandEcologicalConstruction,Shijiazhuang050024,China)

A large amount of tourism information online is of great significance for the study of tourism geography in the information era.However,the problems of multi-source,heterogeneous,non-standardized,semantic missing of new tourism information,are becoming the barrier to the study of tourism geography.By using ontology knowledge and integrating new concepts related to tourism geography in the era of Internet big data,considering the special connotation,space-time scale,spatial relationships of tourism geography,the paper made some abstract expressions of tourism geography knowledge which contain geographic location,tourism space,tourism resources,tourism participants,tourism behavior,geometric elements and constructed the tourism geography ontology model which can be shared,reused,and is suitable for computer understanding.The attribute information is acquired by arranging spatial relations related concepts.Take Zhangjiajie tourist place for example,the paper filled instances for tourism geography.The results have shown that:using tourism geographic ontology mark tourism texts is feasible,which will lay a foundation for further tourism text semantic analysis,and provide the theory and method for further study on tourism geography ontology.

tourism geography ontology;ontology model;tourism text;Zhangjiajie

2016-01-22;

2016-04-19

国家自然科学基金项目(41171105、41471127);河北省杰出青年科学基金培育项目(D2015205208);河北省科学院高层次人才资助项目(2016022577-11)

洪烨(1989-),女,硕士研究生,主要从事旅游地理信息挖掘研究。*通讯作者E-mail:lrjgis@mail.hebtu.edu.cn

10.3969/j.issn.1672-0504.2016.03.017

F592

A

1672-0504(2016)03-0095-05

猜你喜欢
旅游地理张家界实例
中等职业学校中国旅游地理课程教学研究
探究新时代有效开展旅游地理教学的途径
张家界看山(外四首)
岷峨诗稿(2019年4期)2019-04-20 09:02:16
“醉美”张家界
旅游地理
电影(2017年1期)2017-06-15 16:28:02
人间奇景张家界
商业文化(2017年23期)2017-04-23 05:12:51
试论职业能力取向的高职中国旅游地理教材建设
文教资料(2016年3期)2016-03-16 20:12:26
看张家界的漫山红遍
完形填空Ⅱ
完形填空Ⅰ