共享单车监管三方博弈分析及策略评估

2022-09-21 09:25宋成举
交通科技与经济 2022年5期
关键词:监管部门参与者单车

宋成举,杨 光,赵 静

(1.东北林业大学 交通学院, 哈尔滨 150040; 2.交通运输部科学研究院 现代物流研究中心, 北京 100049;3. 黑龙江工程学院 汽车与交通工程学院, 哈尔滨 150050)

共享单车(互联网租赁自行车)是一种基于移动互联网的自行车分时租赁模式,是城市绿色交通系统的组成部分,是慢行交通的一种创新模式,作为共享经济的一种新形态,由于其具有方便快捷、低碳环保、缓解拥堵、经济灵活等优势,从2016年至今短短5年,在资本与市场的共同推动下取得了飞速发展。然而当前行业监管尚存在乱停乱放、藏匿私用、恶意破坏等诸多问题,严重制约共享单车发挥更大作用,不利于慢行交通体系的发展。

在我国,随着移动互联网技术的日趋成熟,共享单车取得了飞跃发展,但由共享单车而引发的各类交通问题、社会问题也日趋增多,多个部门逐渐聚焦共享单车运营监管,逐步脱离被动监管或多部门重叠管理方式,走向监管策略事前评估和多方联动监管方式。

事实上,共享单车在诞生伊始就存在各种监管问题,也引来了国内外学者的广泛关注[1-4]。Caggiani等[5]基于运营区域节点数据预测单车时空需求,采用动态单车分配算法提高用户满意度;Reiss等[6]利用GPS数据建立共享单车时空需求预测模型,建立了运营商和用户两种单车搬迁策略,以满足单车系统的时空需求,节约用户等待时间,提升服务满意度;Shui和Szeto[7]在战略、战术和运作决策层面对共享自行车监管问题展开分析,根据监管过程中存在的多样性、现实性、完整性和技术性四大类问题,有针对性地提出了三层决策应对等级;李琨浩[8]运用PEST模型和SWOT-PEST矩阵对共享单车内部因素和外部因素进行全面分析,从政府、单车平台和用户3个方面提出了解决对策;霍雯艳[9]通过对城市交通环境、公共自行车的使用需求和政府供给情况进行分析,并比较摩拜等共享单车的运营优劣势,为政府制定有效监管措施提供参考;王彦等[10]运用“囚徒困境”博弈描述共享单车平台之间的价格竞争机制,并提出价格监管建议;傅俊尧[11]结合城市治理方向,从政府管理、规划编制和学术探讨三个角度提出了相应建议;张一进等[12]建立了政府监管与共享单车平台策略选择的演化博弈模型,分析两者之间的动态演化过程,并提出了监管建议;何晓平等[13]在共享经济背景下利用演化博弈论分析描述了政府、私营企业、出行者三者之间的博弈关系,在动态博弈模型下逐渐演化形成稳定策略,分析博弈稳定条件,从而为进入市场的企业提供一定参考;文献[2]分析政府在共享单车交通安全监管方面存在的问题,提出完善共享单车交通安全的政府监管对策;周涛等[14]分析政府、企业和消费者三方相互作用的利益关系,构建动态博弈演化模型,验证三方动态博弈演变路径及各影响因素的灵敏度变化方向与强度;陈佳惠等[15]以调度车辆最少和调度成本最低为目标,构建多车场有时间窗要求的共享单车调度路径优化模型并求解。

综上所述,国内外针对共享单车监管模式、监管理论等方面开展了很多有益的研究与探索。对于共享单车监管模式,我国政府态度已经十分明确,但对于监管策略和监管效果,国内外均未有成熟的经验可供借鉴参考,监管策略仍然以被动制定、事后评估为主,缺乏对共享单车发展的科学引领。基于此,文中以共享单车监管过程为研究对象,应用博弈论和系统动力学理论分析共享单车监管过程中的博弈关系,构建共享单车监管策略评估环境,分别分析不同监管策略的实施效果,为规范引导共享单车行业的快速健康有序发展提供科学依据。

1 共享单车监管博弈关系分析

在共享单车监管过程中,存在多个利益相关者,考虑到相关性,文中重点剖析单车用户、单车平台和监管部门3个主体之间的博弈关系。在监管过程中,单车用户是出行服务的使用者,对单车平台服务质量开展直接评价;单车平台是出行服务的提供者,承担共享单车出行服务的实际运营行为,在接受监管部门监管的同时,也对单车用户具有一定的奖惩权限;而监管部门是单车平台的监管者,并接受单车用户和社会对自身满意度的反馈与评估。总之,三者之间的博弈关系如图1所示。

图1 共享单车监管博弈关系

监管博弈的监管对象,单车平台是单车用户的服务提供商,也是监管部门的管控对象,监管部门则承担单车平台和单车用户的规范与监管责任,并接受社会公众监督。

为描述共享单车在运营监管过程中的博弈关系,文中假定博弈参与者均为有限理性主体。其中监管部门对单车用户的检查概率为α(0≤α≤1),α值的大小表征了监管部门的检查力度,检查活动需要支付一定的成本,平均单次检查成本为C1;如果单车用户存在不规范使用情况,但未被及时检查出来时,社会公众的期望将受损,转移到监管部门的期望损失记为C2;当该不规范使用情况被检查出来,则监管部门对单车用户的罚款记为C3。同样,如果单车平台被检查出不严格管理情况,对单车平台的罚款记为C4;反之,如果检查后未发现单车用户和单车平台存在不规范使用和不严格管理情况时,需要对二者进行奖励,单车用户的奖励记为C5,单车平台的奖励记为C6。

单车用户以概率β(0≤β≤1)采取违规停放、故意破坏等不规范使用策略,β值的大小表征单车用户不规范行为的严重程度。当单车用户能够按照管理要求规范使用时,用户所得到的正常收益记为B1,而当单车用户通过随意停放等不规范行为而获得的额外收益记为B2。

单车平台以概率γ(0≤γ≤1)对单车用户的使用行为进行日常监管,γ值大小表征单车平台的管理严格程度。假定单车平台在遵循法律法规条件下获得的正常收益记为P1,但当单车平台的管理严格程度下降时,单车平台所承担的机会成本记为P2,当单车平台不严格管理时,所节约的管理成本记为P3;单车平台在严格管理时,需要对单车用户的违规行为进行惩罚,不存在违规行为进行奖励,其中惩罚收益记为P4,奖励收益记为P5。

策略空间是博弈参与者对应策略的集合,记为Si(i=1,2,3)。其中监管部门的策略空间为S1={S11,S12}={检查,不检查},单车用户的策略空间为S2={S21,S22}={不规范使用,规范使用};单车平台的策略空间为S3={S31,S32}={严格管理,不严格管理},每个参与者所对应的收益函数记为ui(i={1,2,3})。

根据上述假定,可求出不同策略组合下,各参与方的收益函数。对于博弈三方的参与者而言,其收益值取决于博弈三方的策略组合。

当监管部门采取检查策略,单车用户采取不规范使用,单车平台采取严格管理时,可知博弈参与者对应的收益值,其中监管部门的收益值由三部分组成,即检查所需支付成本C1,对于单车用户的违规罚款收益C3,对于单车平台严格管理的奖励支付C6。则其收益函数可表示为

u1{S11,S21,S31}=-C1+C3-C6

(1)

而对于单车用户而言,其收益值包括:正常收益为B1,不规范使用策略所获得的额外收益B2,所需要支付给监管部门的罚款C3,支付给单车平台的罚款P4。则其收益函数可表示为

u2{S11,S21,S31}=B1+B2-C3-P4

(2)

对于单车平台而言,其收益值包括:正常收益值P1,监管部门的奖励收益C6,对于单车用户的罚款收益P4。则其收益函数可表示为

u3{S11,S21,S31}=P1+C6+P4

(3)

同理,根据上述假设,给出监管部门、单车用户和单车平台三者之间在不同策略组合下的收益,汇总至表1。

表1 三方博弈收益矩阵

2 三方博弈模型构建与解析

文中采用Uα表征监管部门在选择检查策略时的期望收益,U1-α表征监管部门选择不检查策略的期望收益;Uβ表征单车用户选择规范使用时的期望收益,U1-β表征选择不规范使用时的期望收益;Uγ表征单车平台选择严格管理策略时的期望收益,U1-γ表征单车平台选择不严格管理策略时的期望收益。

根据期望定义,监管部门不同策略条件下的期望收益函数可表示为

Uα=βγu1{S11,S21,S31}+β(1-γ)u1{S11,S21,

S32}+(1-β)γu1{S11,S22,S31}+(1-β)(1-

γ)u1{S11,S22,S32}

Uα=β(C5+C3)-γ(C6+C4)+(-C1+C4-C5)

(4)

U1-α=-βC2

(5)

则监管部门的平均期望收益可表示为

U1=αUα+(1-α)U1-α

复制动态方程是对策略演化过程的描述,认为在演化博弈过程中,参与者选择策略概率的变化率只与上一时刻的策略比例和纯策略收益与平均期望收益之间的差值两个因素相关[14]。其算式可表达为

α)[β(C2+C3+C5)-γ(C4+C6)-C1+C4-C5]

(6)

将式(6)整理即可得到监管部门检查策略的概率变化率。同理,单车平台及单车用户的策略概率变化率可分别表示为

Uβ=B1+B2-αC3-γP4

U1-β=B1+αC5+γP5

β)(B2-αC3-γP4-αC5-γP5)

(7)

Uγ=αC6+β(P4+P5)+P1-P5

U1-γ=-α(P2+C4)+P1+P3

γ)(α(C6+P2+C4)+β(P4+P5)-P3-P5)

(8)

一般来说,演化稳定均衡的特征之一就是具有严格的纳什均衡,而缺乏演化稳定均衡在相当长的时间内将使得系统行为无法预测。另外,即使假设博弈过程中各参与者是完全理性的,虽然通过数学方法能够计算出纳什均衡,但计算所得纳什均衡在整个博弈过程中并不具有稳定性。

因此,共享单车监管的三方博弈过程使得结果具有明显的复杂性,很难直接预测,且随着博弈过程的持续和博弈时间的增加,各博弈参与者无法逼近甚至稳定于某一个策略。

3 仿真环境构建与分析

针对共享单车监管问题,文中应用系统动力学仿真软件Vensim PLE构建共享单车监管博弈演化策略仿真环境。依据建模,各变量间存在以下逻辑关系。

1)对于监管部门而言,社会期望损失为公众评价的量化描述,为体现社会反馈的积极作用,该值应大于各种奖惩支出;为进一步提升监管对象的行为规范性,对单车平台和单车用户奖励收益应小于惩罚收益。

2)对于单车用户而言,由于其不规范行为更多体现在违规停放、上私锁等行为上,相对于使用便利性带来的时间收益,违规收益应小于正常收益。

3)对于单车平台而言,平台不严格管理时所获得额外收益的总和应大于不严格管理时监管部门的惩罚值。

假设INITIAL TIME=0,FINAL TIME=100,其中,13个外部变量的名称、含义及初值汇总如表2所示。

表2 模型变量名称、含义及初值

模型中涉及到的水准方程如下:检查=INTEG(检查变化率);不规范=INTEG(不规范变化率);严格管理=INTEG(严格管理变化率)。

为分析博弈过程中策略的变化趋势,文中拟定纯策略:博弈参与者一定采用或一定不采用某种策略时的数学描述,即当博弈参与者以0或1的策略概率初始值参与博弈过程。同时,输入上述变量初始值,则博弈参与者策略变化曲线如图2所示。

图2 纯策略条件下各参与者策略曲线变化

图2中的3条曲线分别代表监管部门选择检查策略、单车用户选择违规策略和单车平台选择严格策略的概率变化曲线,从图1可以看出,各参与者策略在经过短暂的波动后达到稳定态,即在当前固定惩罚与收益条件下,参与者很容易选择符合自身最大收益的最优策略。

事实上,在博弈过程中,当参与者代表群体时,自身策略的选择就会呈现一定的概率分布。一方面,各参与者群体中的个体对奖惩与收益的衡量和比较不会呈现纯理性,且奖惩与收益值对于每个个体而言未必都是已知的;另一方面,为了引导参与者策略逐渐趋于稳定,高效的引导策略显得尤为重要。通常在管理中比较有效的引导策略包括阶梯策略和动态策略两种。

4 阶梯策略设计与评估

阶梯策略描述:在管理过程中,针对管理对象行为的不同策略概率而采取不同量化奖惩标准的管理策略,一般分为奖励分级和惩罚分级两种。

以共享单车运营监管为例,单车用户违规程度越严重,不失一般性,文中分别拟定的阶梯策略包括两部分,即阶梯策略部分一:当单车用户的违规概率<0.3时,监管部门对其惩罚收益C3为3,当违规概率介于0.3~0.6时,惩罚收益C3为5,当违规概率>0.6时,惩罚收益为10;阶梯策略部分二:当单车平台严格管理的概率<0.2时,监管部门对其罚款收益C4为8,当严格概率介于0.2~0.5时,罚款收益C4为5,当严格概率>0.5时,罚款收益为2。通过仿真得到博弈参与者策略变化曲线(见图3)。

图3 阶梯策略下三方策略概率变化曲线

图3中曲线分别代表监管部门、单车用户和单车平台的策略概率变化曲线,从结果可以看出,博弈参与者的策略概率总体呈现先收敛后震荡趋势,说明阶梯策略并不能让参与者的策略趋于稳定。

5 动态策略设计与评估

动态策略描述:为了更好地抑制参与者策略的波动性,在管理过程中,管理部门对于单车用户不规范策略的惩罚收益随着单车用户不规范使用比例的增加而增加。假定单车用户不规范策略下的惩罚收益与单车不规范使用比例正相关;单车平台不严格管理策略下的惩罚收益与单车平台不严格管理比例正相关;社会期望损失与单车用户不规范使用比例和单车平台不严格管理比例线性相关。为简化计算,假定其相关性呈线性,即可以采用单车平台不规范使用概率β和单车平台不严格管理概率γ分别表示社会期望损失C2、单车用户罚款收益C3和单车平台的惩罚收益C4,算式为

(9)

根据前文假设,分别取C2max=8,C3max=5,C4max=2,可得三方策略演变曲线,如图4所示。从图4可以看出,单车用户不规范策略的波动特性得到了明显抑制,但单车平台和监管部门的策略仍保持较大范围的波动,说明尽管该策略能够较好抑制单车用户不规范使用行为的波动现象,但对于监管部门和共享单车公司的效果并不明显。

图4 C3max=5,C4max=2条件下三方概率策略变化曲线

再分别取C3max=8,C4max=4,同样可得三方博弈曲线,如图5所示。从图5可以看出,随着C3max和C4max的增大,三方策略的波动均呈现一定程度的衰减,当三方策略均稳定在均衡值时,但继续增大C3max和C4max仅能在一定程度上缩短收敛时间,效果并不明显。

图5 C3max=8,C4max=4条件下三方概率策略变化曲线

从上面的仿真结果可以看出,动态策略对于稳定三方博弈行为具有较为明显的管理效果。此外,在动态策略下,适当增大对于共享单车和共享单车公司的惩罚收益最大值能够显著缩短三方博弈到达稳定态的时间。博弈过程中三方策略的动态变化如图6所示。

图6 博弈三方策略动态变化

从图6可以看出,动态惩罚策略条件下,博弈三方的策略曲线在三维空间中摆动,且三方策略的博弈曲线很快收敛到稳定值。博弈参与者的策略波动得到了很好抑制,缩短了收敛时间,取得了较好的监管效果。

6 结 论

针对共享单车运营过程中存在的管理问题,分析共享单车用户、共享单车平台和监管部门三者之间的博弈关系,给出收益矩阵,采用系统动力学评估不同策略条件下博弈参与者策略变化,主要结论如下:

1)共享单车监管过程中存在多个参与主体,主体之间存在复杂的博弈关系;

2)纯策略条件下,博弈三方都能在短期波动后迅速选择最优策略,但无法代表群体的行为概率;

3)阶梯策略条件下,部分参与者策略概率的波动呈现放大趋势,直至稳定态,但部分参与者的策略概率波动性则在一定范围内震荡;

4)动态策略条件下,系统波动很快呈收敛状态,直至稳定态,对于参与者策略的波动抑制具有很好效果,且增加惩罚收益能够提高收敛速度。

猜你喜欢
监管部门参与者单车
休闲跑步参与者心理和行为相关性的研究进展
共享单车为什么在国外火不起来
门限秘密分享中高效添加新参与者方案
浅谈市场监管部门在儿童青少年肥胖中的防控措施
飞吧,单车
对恶意破坏共享单车行为要“零容忍”
共享单车(外四首)
谈“魏则西”事件背后的制度问题
P2P网络借贷的风险与监管研究解析
基于完全信息静态博弈的二手车市场中监管部门与卖家的博弈