基于马尔可夫决策过程的附加服务定价优化

2024-02-24 02:45杨明霞朱星辉

哈尔滨商业大学学报（自然科学版） 2024年1期

杨明霞,朱星辉

(南京航空航天大学民航学院,南京 211100)

航空公司附加服务是指航空公司在机票销售以外,提供给旅客的各种额外服务和商品.主要包括行李托运、座位选择、机上餐食、机上上网等.随着航空市场的成熟和竞争的加剧,航空公司附加服务已成为航空公司收入的重要组成部分.旅行咨询公司Ideaworks的研究报告显示[1],2019年全球航空公司从附加服务中获得的收入为1 095亿美元,相较于2012年的360亿美元的收入,总增长率约为204.2%,年均增长率约为17.2%.2020年和2021年,随着航班量的锐减和旅客需求的下降,全球航空公司的附加服务收入也大幅下降,但附加服务收入占全球航空公司总收入的比重仍然保持上升趋势,见图1,附加服务收入在影响航空公司收益水平层面的作用愈发凸显.

本文的研究主要关注于附加服务的定价,即如何对附加服务定价以增加航空公司收益.在以往研究中,任新惠[2]等基于旅客效用的角度研究了航班选座费的定价问题,将航班座位的效用细化为一级指标和二级指标,建立了一级指标和二级指标之间的函数关系式.根据不同座位的特点求出各座位的效用函数,最后以旅客满意度最大化为目标制定了定价模型.彭吴琦[3]等利用MNL模型分析了旅客选择附加服务的各服务等级的概率,提出了一个兼顾航空公司收益和旅客效用的附加服务定价理论模型.任新惠[4]等通过CE范式确定旅客对航班座位的心理价格,求解了测定旅客对航班座位的心理价格的模型的参数,建立旅客选座心理价格的测定模型.Chiambaretto[5]等利用问卷调查法和联合分析法研究了欧洲长航线旅客对于航空公司附加服务的购买意愿,研究发现休闲乘客附加服务付费意愿更高.Yong[6]等和齐微[7]等认为影响旅客购买航空附加服务因素包括供给因素也包括选择因素.Rouncivell[8]等采用SP调查探索英国国内旅客对航空公司付费选座的支付意愿,指出商务和非商务旅客对付费选座都有明显的支付意愿,且商务旅客的WTP大于非商务旅客,并且使旅客坐到其偏好的座位上有助于提高旅客满意度.江红[9]等在彭吴琦的基础上研究了基于旅客选择行为的升舱定价模型.Zhao[10]等基于效用最大化理论,使用二元logit模型分析了具体航线上旅客对附加服务的选择概率,并将得到的选择概率融入附加服务动态定价模型中,最后以航空公司收益最大化为目标求解最优价格.这些附加服务的研究中,学者大多使用了离散选择模型对旅客行为进行分析.基于选择的需求模型在运营管理和收益管理中越来越流行,由于它们能够捕获替代需求,即如果首选产品无法获得,客户可以购买可获得的产品之一.但是许多用于价格优化的离散选择模型,如MNL和probit模型,要么不产生逻辑价格,要么求解难度过大或者无法求解.Aydin[11]和Gallego[12]等人已经证明,对于一组联合优化价格的产品,如果所有产品的边际供应成本为零,在MNL模型下,所有产品都将具有相同的最优价格,单一产品的价格与包含该产品的捆绑产品的价格相同,这是不符合逻辑的.Ratliff[13]等人描述了如何使用从调查数据的联合分析中获得的支付意愿估计值来设计和定价品牌套餐.他们构建捆绑报价的方法涉及一个多维优化问题,求解十分复杂.本文将通过应用马尔可夫决策过程来解决附加服务的定价问题,是一种相对较新的离散选择模型,Blanchet[14]等人已经证明,在温和的假设下,马尔科夫链选择模型是任何基于随机效用理论的模型的良好近似,该模型可以产生符合逻辑的价格.Dong[15]等人指出,在马尔科夫链选择模型下,一组产品的最优价格可以通过一系列单一变量价格优化来解决,与其他离散选择模型相比,马尔可夫链模型在计算上是易于处理的.

1 问题建模

在建模之前做如下假设:1)只考虑垄断市场,即所有附加服务的价格由一家航空公司控制,定价目标是最大化单个旅客带给航空公司的期望收益;2)考虑所有可能的捆绑组合;3) 假设模型中预设的参数可以准确反映旅客的选择行为,在具体定价实践中可以通过旅客的购买数据来估计模型参数.

1.1 旅客选择行为的马尔可夫链模型

基于前面的假设, 本文采用马尔可夫链模型来描述旅客在所有可用产品的价格函数下如何选择产品,使用策略迭代的方法对该模型进行求解以获得最优价格.在该模型中,进入系统的旅客有一定的概率购买某个产品,此概率只依赖于该产品的价格,旅客将根据该产品的价格决定是否购买该产品.如果旅客购买了该产品,则离开系统;如果旅客没有购买该产品,则以一定的转移概率转移到另一个产品或者不购买任何产品并退出系统;如果顾客转移到另一个产品,则根据当前产品的价格决定是否购买该产品.通过这种方式,旅客在各个产品之间转移,直到购买一个产品或者做出不购买决策.

在这个马尔可夫链模型中,价格优化可以表示为一个马尔科夫决策过程,形式上马尔科夫决策过程被定义为一个元组(S,A,R,P),其中:S为状态空间,A为行动空间,R为奖励函数,P为状态转移概率函数.本文将状态空间定义为包括N个附加服务产品以及两个吸收状态(不购买和购买当前浏览的产品)的集合,动作空间定义为所有可能的价格点集.

下面定义状态转移概率和奖励:旅客首先以λi的到达率浏览产品i(i=1, 2, …,N),浏览产品i的旅客以短视化购买概率θi(pi)购买产品i且奖励为pi-ci,以1-θi(pi)的概率不购买产品i,此时不购买产品i旅客将以概率(1-θi(pi))ρij转移到产品j或以(1-θi(pi))(1-∑ρij)做出不购买决策,这两类状态转移的奖励均为0.

1.2 定义购买概率和短视化购买概率

在一个产品组合中,产品i的购买概率不仅依赖于产品i的价格,还依赖于产品组合中其他产品的价格,根据Dong[15]等人对产品组合中某产品的购买概率的定义,产品组合中产品i购买概率为:

Pi=vi(p)θi(pi)

(1)

其中:vi(p)为产品i在价格p={pi:i∈N}下的被浏览次数:

(2)

每种产品的被浏览次数可以通过N*N的线性方程组求解.

短视化购买概率是指在一个给定的产品组合中,顾客购买某个特定产品的概率仅仅取决于该产品的价格,而不考虑其他产品的价格,以θi(pi)表示产品i在价格pi下的短视化购买概率:

(3)

其中:φi是产品i对于不同类型行程的重要性参数,如行李托运服务对于商务旅客行程的重要性较小但对于休闲旅客行程的重要性较大,μi和σi分别表示旅客对产品i支付意愿的均值和标准差.

1.3 目标函数及求解算法

产品组合的总期望收益为∑Pi(pi-ci)(Pi为产品i的购买概率),为了最大化单个旅客带给航空公司的期望收益,那么附加服务产品组合定价优化的目标函数为:

(4)

该目标函数是非凸的,直接求解十分复杂而且可能陷入局部最优解,但Dong[15]等人证明了该目标函数的求解可以转化为一系列一维优化问题来求解全局最优值,见式(5):

(5)

2 实验与分析

2.1 实验设置

1)假设共有3个附加服务包括行李、餐食和选座,考虑各种捆绑组合共有7种产品,所有产品的成本ci=0;2)假设只有两个旅客细分市场,即休闲旅游市场和商务出行市场, 每个市场比重均为0.5;3)本研究主要关注附加服务定价模型在收益提升方面的性能表现,因此对模型参数进行了简化假设:λi=1/7,ρij=1/7(i≠j),表1是每种附加服务产品的旅客支付意愿参数设置.

表1 旅客支付意愿分布参数设置Table 1 Parameterization of travelers′ willingness-to-pay distribution

本文将短视化定价策略作为基准定价策略与基于马尔可夫决策过程的定价策略进行比较分析,短视化定价策略基于两个假设:1)航空公司知道旅客支付意愿分布;2)每个产品的价格是追求短视最优的,不考虑联合优化价格,每个产品的最优价格可以通过最大化每个产品短视化期望收益来确定:

(6)

2.2 实验结果与分析

将上文设定的关于旅客选择行为的参数分别输入到两个定价模型中,利用Python进行求解,表2、 3分别显示了两种定价策略下的每种附加服务的最优价格、不同细分市场旅客的购买概率以及客均期望收益,其中客均期望收益是由各细分市场期望收益的加权平均得到的.

表2 短视化定价模型输出结果Table 2 Short Visualization Pricing Model Outputs

表3 基于马尔可夫决策过程的定价模型输出结果Table 3 Pricing model output based on Markov decision process

由表2、3可以看出,基于马尔可夫决策过程的定价模型(MDP定价模型)输出的所有附加服务的最优价格均比短视化定价模型的输出结果高,此外不同附加服务价格增加的幅度也不同,相较于包含多个附加服务的捆绑产品,大多只包含单一附加服务的产品价格增长得更多.例如,只包含餐食服务的产品1的价格从38.7元增加到了57.6元,而包含全部附加服务的产品7仅从241元增加到246.1元.这表示MDP定价模型中蕴含着捆绑策略,即对只包含单一附加服务定价高以此激励旅客以捆绑折扣购买包含多个附加服务的捆绑产品,MDP定价模型相比于短视化定价模型,捆绑产品的价格相对于单独购买单一服务的价格之和提供的折扣更大.单一附加服务价格的增加和捆绑产品的折扣增大将提高旅客对捆绑产品的购买概率并降低旅客对单一产品的购买概率,这一点从两个细分市场都可以观察到,相比于短视定价模型,在MDP定价模型下包含多个附加服务的产品4、5、6、7在两个细分市场的购买概率均表现为增加,而只包含单一附加服务的产品1、2、3在两个细分市场的购买概率均表现为下降.相比于短视化定价模型,在MDP定价模型下每位旅客的平均预期收益从93.7元提高到102.1元,提升幅度约 8.96%.

3 结语

基于一个对两个旅客细分市场的仿真实验表明,相对于现行实践使用的短视化定价模型,本文建立的MDP定价模型显著提高了旅客对捆绑附加服务产品的购买概率,即使该模型的定价使旅客对单一附加服务产品的购买减少,但评估定价策略性能的关键指标即客均预期收益从93.7元提高到102.1元,提升幅度约 8.96%,说明该模型具有可行性和适用性.此外本文的仿真实验参数均基于假设,现实中这些参数可以从旅客购买数据估计得到,因此航空公司应该重视对旅客购买数据的收集和利用,以便更好地理解旅客对附加服务的需求分布情况,并利用这些信息来制定最优的定价策略.