基于铁路客票的旅客目的地出行服务本体模型构建

2017-06-29 09:02北京交通大学王莹
电子世界 2017年11期
关键词:客票餐饮店实例

北京交通大学 罗 王莹

基于铁路客票的旅客目的地出行服务本体模型构建

北京交通大学 罗 王莹

1 引言

我国铁路客运承载了全国大部分的人口流动,随着铁路的建设发展,铁路客运量也逐年攀升。2014年铁路发送旅客23.57亿人,2015年为25亿人次,20160年达27.7亿人次,连续三年实现10%增长。与此同时,铁路客运的电子化、信息化建设也在不断进行,如12306电子票务网站、铁路主数据管理平台等。利用旅客的客票信息构造模型,能够为旅客提供诸如酒店推荐、餐饮店推荐等有针对性的目的地出行服务,同时也可提供交通查询、景区推荐等功能。

目前,对铁路客票的研究集中在通过客票数据分析旅客的客票选择行为,从而为客运产品提供参考,以及制定客票的营销策略,尚未延伸到其他产品或服务。在高速铁路的旅客出行情况中,路途相对较短的客票,不同车种、席别之间价格差距小,旅客的价格敏感度不高。随着路途里程增加,由车种、席别带来的价格差距扩大,旅客的价格敏感度则相应增加;在更广泛的客运专线中,对票务数据进行分析,同样发现客票里程的长短与票价的影响程度成正比。

为了向旅客推荐同等消费水平的酒店与餐饮店,以路段及车种席别两个维度对旅客的消费水平进行衡量。1~200km为短途,200km~500km为中途,500km以上为长途;根据《中华人民共和国铁路客运》,筛选出载客量大并具有模型构建意义的客运车种为高速动车组列车、城际动车组列车、动车组列车、直达特快列车、特快列车和快速列车,并确定列车相应的席别,车种席别等级高且里程长的则具有相应高的消费水平。酒店的消费水平参考携程、去哪儿网的方法,以星级进行划分;参考《餐饮业消费的人群特征及趋势研究数据报告》,餐饮店以人均消费为标准进行划分为高中低档。

2 模型构建

目前最被人们接受的本体概念是“共享概念模型的明确的形式化规范说明”,即对现实世界的特定对象进行抽象,得到明确定义的概念模型,并能被计算机识别、可共享。通过对本体模型中类、属性、实例的规则编辑,可以实现模型的推理功能。选择本体作为构造模型的方式,可以使知识共享并重用,提高系统通讯、互操作、可靠性的能力。

以本体编辑工具protege4.3建立模型。

2.1 建立类

根据模型需要,抽象出如下概念:酒店、餐饮店、景区、城市、乘客、客票、公共交通、客运车站、车种、席别。在抽象概念的基础上建立类,并将酒店五星、四星、三星、二星与经济型酒店;餐饮店按人均消费水准划分为四类;客票也根据路途和车种席别两个维度划分为四类;公共交通分为地铁与公交;根据所选车种,席别子类包括特等座、商务座、一等座、二等座、高级软卧、软卧、硬卧、软座、硬座以及无座。

2.2 建立对象属性

对象属性用于描述类与类之间的关系,抽象出的关系属性如表1所示。

表1 抽象出的关系属性

2.3 建立数据属性

数据属性用于描述类自身的数据特征,建立数据属性如下:

hasAdmissionFee为景区属性,描述景区的门票费用,类型为整数;hasDepartureDate为客票属性,描述客票上的列车始发日期与时间;hasDistance为客票属性,描述从客票始发站距离客票到达站的里程,类型为整型;hasGender为乘客属性,描述乘客性别,类型为字符串;hasLocationInfo为酒店、餐饮店、景区属性,描述地点位置,类型为字符串;hasPerCapitaConsumption为餐饮店属性,描述餐饮店人均消费。

2.4 建立规则

在protege中,规则的建立采用SWRL(Semantic Web Rule Language),以语义方式表达规则。如hasPerant(?a,?b) -> hasChild(?b,?a),箭头前半部分为推理条件,hasPerant为属性,表达的意思为a有家长b,后半部分为推理结果,意思为b有孩子a。

模型中共建立四类规则,分别表达了酒店推荐、餐饮店推荐、景区推荐和交通查询的逻辑推理。

(1)酒店推荐规则。ticket_type_1(?x), (five_star or four_star) (?z), has_bought(?a, ?x), has_destination_city(?x, ?y), is_located_in(?z, ?y) -> is_recommended_for(?z, ?a)。

(2)餐饮店推荐规则。catering_type_3(?x), ticket_type_3(?z), has_bought(?a, ?z), has_destination_city(?z, ?y), is_located_in(?x, ?y) -> is_recommended_for(?x, ?a)。

(3)景区推荐规则。attraction(?b), has_bought(?a, ?x), has_destination_city(?x, ?y), is_located_in(?b, ?y) -> is_recommended_for(?b, ?a)。

(4)交通查询规则。has_bought(?a, ?b), is_available_to(?y, ?x), is_bound_for_station(?b, ?x) -> can_take_public_transit(?a, ?y)。

2.5 添加实例

添加实例,即为抽象的概念创建个体。假设乘客从上海虹桥站出发,乘坐G18次列车二等车席到达北京南站,并为北京的酒店、餐饮店、景区、交通分别添加实例:

城市类添加实例北京、上海;客运车站添加上海虹桥站和北京南站;客票添加ticket1客票;车种添加G18次高铁列车;席别添加G18次07车5排F座;乘客添加王小明;公共交通添加北京4号线和14号线北京南站,6号线平安里站以及20路公交车;酒店添加北京市西城区某二星级酒店;餐饮店添加北京市西城区某人均消费为114元的餐厅。

实例添加完成后,补充各实例的对象属性和数据属性。

2.6 推理

Protege4.3自带HermiT 1.3.8推理机可运行SWRL规则并实现推理。启动推理机后,查看客票以及餐饮店实例,发现客票实例已根据车种、席别、里程划分了客票类别,餐饮店实例根据人均消费划分了餐饮店类别。

查看乘客实例王小明的推理结果,发现已实现对王小明的餐饮店、酒店、景区推荐(may_be_interested_in推理结果),并显示目的地车站可搭乘的公共交通(can_take_public_transit推理结果)。

同样地,在酒店、餐饮店、景区、公共交通实例的推理结果中,也显示了推荐给乘客实例王小明的相应逆向结果。

3 模型分析

模型需要输入的主要信息为:客票信息,包括客票车种席别、始发站、到达站、始发城市、到达城市、站间里程、出发日期时间;乘客与客票之间的购票关系;酒店信息,包括所处城市、星级及附近公共交通;餐饮店信息,包括所处城市、人均消费和附近公共交通;风景区信息,包括所处城市和门票费用;客运车站公共交通信息。

从乘客的角度,输出的信息为推荐的酒店、餐饮店、景区及到达车站的公共交通,如果点击进入推荐的酒店、餐饮店、景区等实例,可进一步查看酒店的星级、地址和交通,餐饮店的人均消费、地址与交通,以及景区地址、门票费用和交通信息;从酒店、餐饮店、景区的角度,可以了解自己被推荐给了哪些乘客。

模型输入信息为各类下实例的基本信息,输出信息为实例之间的关系,对于不同的主体,还包括可查询的输出信息。

4 讨论与展望

(1)本文模型为轻量型,只构建了初步的思路和包含了大致的模型元素,还可以扩充数据来源,如订票网站中旅客填写的个人信息、在旅行网站中预定的产品等,达到添加拓展更多概念的目的,从而丰富模型中的类及关系属性。同时,每个类也具有丰富的数据属性可拓展性。如在模型分析部分所讨论的,不同的实例主体可查看与自己有相应关系的实例主体信息。乘客在酒店的推荐结果中,除了可以查看酒店的地址、星级及公共交通信息,还应能够查看酒店的联系方式、评价等信息,从而为乘客提供更多的决策参考信息。对于酒店方面,还可另外查看乘客的出发日期时间以及到达日期时间,为酒店的准备工作安排提供参考信息。

(2)模型从车种席别及旅客行程的里程两个角度划分旅客类型,为了使划分结果更加精确有保障,还可增加划分旅客类型的维度与方式:利用旅客出行时间,可划分为春节、寒暑假、劳动节、清明节等假期出行以及非假期的平日出行;根据民族、籍贯等因素带来的不同民俗文化与风俗习惯,可以进一步对旅客进行分类;同时,旅客的职业、年龄、性别等因素也可帮助对旅客在消费习惯和消费水平方面的细分。

(3)对营销产品也可进行对维度的划分及进一步细分。酒店的分类可增加好评度、酒店风格、酒店平均价格等因素;餐饮店可增加口味、好评度等因素。同时还可增加营销产品的种类。

(4)在本文中,对客票数据的利用是一次性的,而我国铁路客运售票系统每日有多达300万余条的客票数据存储在铁路系统的各级数据库中,铁路客票年销售量超过20亿,这些历史数据都非常有价值。通过大数据的分析方法,可以更为准确地定位每位旅客,从而更准确地实现精准营销。通过旅客客票的历史数据可以分析旅客的购票习惯和消费习惯,以及历史出行轨迹与出行时间等方面的出行习惯;同时可利用客票之间的关联性,分析旅客的家庭关系网,为当前出行给予家庭导向性的产品营销。

[1]骆泳吉,刘军,马敏书.客票数据“受限”条件下旅客选择偏好估计[D].北京:北京交通大学,2015.

[2]刘高原.基于客票特征数据的我国高速铁路旅客出行行为分析研究[D].北京:北京交通大学,2012.

[3]裴志远,刘万明.用模糊综合评价方法分析旅客城际出行的选择行为[J].交通运输工程与信息学报,2004,2(1):86-91.

[4]王莹,韩宝明,唐宝刚.基于既有线客票数据的客运专线旅客选择行为研究[J].铁道运输与经济,2008,30(12):35-39.

[5]餐饮业消费的人群特征及趋势研究数据报告[DB/OL].https:// wenku.baidu.com/view/237a167eb52acfc788ebc939.html.

本文受基金项目“中国铁路总公司科技研究开发计划课题(课题编号:2016X004-E);山东省社科基金(基金编号:14CGLJ20)”资助。

猜你喜欢
客票餐饮店实例
本期导读
浅谈哈尔滨局集团公司客票电子化通道强化与流量监测
一些连锁餐饮店为何会在此次危机期间加强会员优惠计划
中国铁路客票在跨境客运中的互通方案
西安市餐饮店分布与PM2.5空间分布的关系研究
航空公司客票直销的现状与分析
北京市房山区食药监管局错峰执法取缔无证经营餐饮店
完形填空Ⅱ
完形填空Ⅰ
云计算在中国铁路客票预订和发售系统的应用研究