一类供应链中考虑公平关切的学习效应行为实验研究

2015-07-07 15:33陈俊霖赵晓波宋亚楠陈建铭
运筹与管理 2015年2期
关键词:制造商公平供应商

陈俊霖, 赵晓波, 宋亚楠, 陈建铭

(1.中央财经大学 管理科学与工程学院,北京 100081; 2.清华大学 工业工程系,北京 100084)



一类供应链中考虑公平关切的学习效应行为实验研究

陈俊霖1, 赵晓波2, 宋亚楠2, 陈建铭2

(1.中央财经大学 管理科学与工程学院,北京 100081; 2.清华大学 工业工程系,北京 100084)

大量经济学实验研究证实了公平关切和学习效应对决策者行为的影响力。本文研究三人组供应链系统,通过区别设计个体自我学习以及社会学习的实验环境,对比考察备用供应商的公平关切程度,以及制造商和备用供应商学习曲线的特点。实验结果支持了学习效应存在的假设:随着实验期数的增加,单期决策时间逐渐减少,备用供应商的整体拒绝率逐渐降低,制造商的策略逐渐集中。进一步构建了引入公平关切的强化学习模型。通过参数估计发现在个体自我学习和社会学习实验环境下,备用供应商的横向公平关切程度均较为显著,信息共享对备用供应商的横向公平关切偏好无明显影响。

管理科学与工程;学习效应;公平关切;斯坦克伯格博弈;强化学习模型

0 引言

标准经济学理论支持“经济人”假设,认为人是完全理性的、不动感情的、自私的、追求自身利益最大化的。行为与实验经济学将心理学的研究成果融入到标准经济学理论中,并认为人的行为是有限理性(Bounded Rationality)的、风险偏好的、关注公平、互惠和社会地位的。理性是解释人们行为目标的重要因素,但人们行为并不是无限理性的。由于环境的不确定性和复杂性、信息的不完全性、以及人类认识能力的有限性,人们的理性认识能力受到心理和生理上思维能力的客观限制,从而表现为非完全理性的[1,2]。

可以认为,人们的有限理性行为一方面是社会偏好类的感知有限理性,另一方面是由认知局限引起的决策有限理性。“公平关切”和“学习效应”正是该两大主流有限理性理论的衍生行为假说。“公平关切假说”通过涉他倾向(Other-regarding)修正完全理性的假设,也即认为决策者不仅关注自身的物质利益,其决策效用亦包含对他人利益获得的关注[3]。与此同时,“学习效应假说”认为决策者认知的局限性可通过逐渐地学习获得改进,进而追求最佳表现[4]。“公平关切假说”和“学习效应假说”均能解释实验数据偏离“经济人”假设引起的决策偏差,但是考虑到这两种方法所依赖的理论基础的差异性,通过实验研究决策者的行为偏差的主要成因,分析两种假说如何交互影响决策者的行为,是很有意义的研究专题。

本文基于文献[5,6]研究的三人组供应链系统,设计实验集成分析备用供应商的横向公平关切行为与系统中决策者的学习效应。通过区别设计个体自我学习以及社会学习的实验环境,对比考察了备用供应商的公平关切程度,以及制造商和备用供应商学习曲线的特点。实验结果支持了学习效应存在的假设:随着实验期数的增加,(1)被试的决策时间逐渐减少;(2)备用供应商的整体拒绝率逐渐降低;(3)制造商的策略逐渐集中。进一步构建了引入公平关切的强化学习模型。通过参数估计发现在个体自我学习和社会学习实验环境下,备用供应商的横向公平关切程度均较为显著,信息共享对备用供应商的横向公平关切偏好无明显影响。

1 文献回顾

实践中,公平关切影响决策行为的例子比比皆是。例如,销售商因非成本因素的提价降价行为总会引发购买方的埋怨,认为被不公平地对待,进而寻找别的替代销售商[7]。又如,日本丰田汽车十分注重与供应商的公平合作关系,而尼桑汽车则经常通过大订单向其供应商压价。结果显而易见,丰田汽车获得了供应商的信任,实现了稳定、高效、低成本的供应链交互,而尼桑汽车则苦恼于供货质量、交货期等问题,交互成本高昂[7]。

人们希望受到公平的对待,宁愿付出部分经济代价。这种现象不仅存在于个人行为,集体行为也是如此[8]。对供应商和销售商关系的部分研究发现,双方都更愿意与具有更强公平性倾向的伙伴合作,同时抵制不公平的待遇[9~14]。一些研究认为公平是品质合作中的先决条件,整个商品市场对公平性的考虑会促进成员间的信任、承诺、投资意愿和对商品的期待度[11]。目前,营销学、经济学等领域对公平关切行为的研究已经比较充分。然而,在供应链管理背景下相关研究还比较欠缺。在双方博弈冲突环境中,Cui等人[9]通过理论分析指出在供需双方均有公平偏好时,批发价格合同能在一定条件下使得一个两级供应链达到完美协调。Fehr等人[10]、Katok等人[11]通过开展实验研究,探索出公平关切行为会很大程度地影响决策者对合同的选择及合同的实施,理论上完全相等的合同在实践中则表现大为不同。杜少甫等人[12]基于报童模型在Nash讨价还价博弈背景下,从理论上探讨了公平关切行为倾向对供应链个体成员决策与协调的影响。丁川等人[13]在渠道合作定价问题中分析了公平关注行为对渠道决策的影响。以上研究均在双方博弈环境下进行。

在多方博弈冲突环境中,Ho等人[14]研究了包含两个无竞争的同质经销商的两级供应链,供应商依次通过批发价格合同与经销商合作。作者理论研究和实验结果均证实,比起纵向公平关切行为,经销商之间的横向公平关切行为对其决策的影响更大。Chen等人[5]在常规供应风险环境下,分析了备用供应商的横向公平关切对期权合同实施的影响。以上研究均未考察学习效应。

学习效应通常区别个人学习效应和社会学习效应。个人学习是指在学习的过程中完全通过个人不受他人影响的独立学习行为,社会学习是在学习过程中使用他人产生的信息进行学习的行为。学习效应实际上是个人学习和社会学习的并发学习的过程,人类同时具有这两种学习能力。一些学者如Mesoudi认为社会学习者通常比个人学习者学得更好[15]。对学习的研究始于19世纪的德国心理学家Hermann Ebbinghaus,他在研究中发现了“学习曲线”,即对于一项任务重复的次数越多每次需要的时间就越少。之后,大量反复实验论证了学习曲线实践的幂定律(Power Law of Practice),即学习曲线往往开始陡峭,而后渐趋于平坦,并且个体在过去某个决策带来的良好结果,在未来的决策中会更倾向于这个决策(Law of Effect)[16]。文献中关于学习模型的研究已经比较充分,例如自适应学习模型,强化学习模型,信念基础学习模型等[17~19]。

公平关切行为和学习效应的存在性已经毋庸置疑。David J. Cooper设计了公共物品博弈实验,提出了兼顾公平关切行为和学习效应的混合模型假设,并且发现该模型更好地解释了实验数据,显著提高了原有模型的适应度[20]。Biele等人在公共品博弈及社会网络困境博弈环境下设计实验并提出引入互惠性的强化学习模型在重复实验过程中能更好的解释人们的合作行为[21]。然而,绝大部分相关研究均只孤立地讨论公平关切行为或学习效应[5~19]。因此,本文通过实验方法在供应链环境中分析具有公平关切行为的决策者的动态学习模式。本文的创新主要体现在以下方面:(1)在供应链环境下兼顾公平关切行为和学习效应的研究还比较欠缺。本文基于三人组的供应链系统,运用实验的方法对备用供应商的横向公平关切偏好和系统学习行为进行了刻画和分析;(2)本文区别讨论了个体学习和社会学习环境下决策者的行为模式,对比分析了在不同学习环境下备用供应商的横向公平关切偏好特征。

2 问题描述

根据强化学习模型[32],决策者在t(t≥0)时刻选择策略h,在t+1时刻策略h的倾向度qh(t+1)(Propensity)更新为:

qh(t+1)=(1-φ)qh(t)+Rh(t)

(1)

在t+1时刻策略j(j≠h)的倾向度qj(t+1)更新为:

qj(t+1)=(1-φ)qj(t),j≠h

(2)

强化学习效用通常被定义为策略选择的效用。因此,对于M,Rh(t)=EPM(h),这里EPM(h)表示M选择策略h的期望利润h∈A1。对于S2,

Rh(t)=max{EPS2(h)-λ·max{ERS1(h)-ERS2(h),0},0}

(3)

其中,给定M策略为h,EPS2表示S2的期望利润,ERS1(h)和ERS2(h)分别表示S1和S2的期望收益。参数λ(≥0)表示S2的公平关切行为度,λ越大,S2越关注公平,反之亦然,λ=0表示S2完全利己,无公平关切行为[2]。由(3)式可见,S2的效用不仅依赖于自身的期望利润,还依赖于与S1的收益差*另外一种常见的衡量公平的标准为利润比较,如Cui等。考虑到利润计算涉及供应商的生产成本信息,而S2较难得到S1的生产成本信息,为了使模型更贴近实践,我们沿用Chen等人提出的S2公平关切的参照系为收益而非利润的模型。,即当M策略为h,S1的期望收益高于S2时,S2对公平的关注引发劣势不平等厌恶(Disadvantage Inequality Aversion),该厌恶体现为负效用项-λ·max{0,ERS1(h)-ERS2(h)}。若S2总效用大于0,则接受合同,Rh(t)=EPS2(h)-λ·max{ERS1(h)-ERS2(h),0}否则拒绝合同,Rh(t)=0。不失一般性,若总效用等于0,S2接受合同。

3 实验假设

根据文献研究,我们对供应链系统行为决策做如下假设:

H1 在三人组供应链系统的行为决策过程中存在学习效应,并通过被试的决策时间和备用供应商的拒绝率体现。被试需要花费一定时间来考虑和做出决策。通过不断反复积累经验,对各种不同情况的有效解决方案越发了解,因此,所需的决策时间越来越短。另外,被试会改善他们的决策选择。在下一轮中,积极的结果(不拒绝)更容易被再次选择。因此,学习效应会致使拒绝率将随着时间下降。

H2 在三人组供应链系统中存在横向公平关切。备用供应商是不纯粹的自我利益者。他们不会单单为了获得最大的报酬而接受制造商提供的所有合同。也就是说,他们会比较自己的收益和常规供应商的收益,判断合同的公平性,对于不公平的合同,即便是有利可图,也会拒绝。

H3 信息共享会对被试的拒绝率和决策时间有正向影响。信息不共享的情况下,被试只能通过自己的决策信息不断个人学习。信息共享在确保个人学习的前提下,还会促进被试们的社会学习。社会学习比孤立个人学习更加有效。因此,将对拒绝率和决策时间有正向影响。

4 实验设计

表1 预期支付表

在双供应商策略下(合同1~6),随着预付金比例的提高,S2的期望利润EPS2和期望收益ERS2显著增长,与S1的收益差由-18.75逐渐变为-6.9375。从而,S2对公平的关注所引发劣势不平等厌恶负效用呈下降趋势。由此,S2的公平偏好程度可从其接受(或拒绝)的合同进行体现,如S2是纯粹的自我利益者,则会因有正利润值EPS2接受包括k=0在内的所有双供应商合同,而公平关切的,则会对预付金比例有一定的要求,并拒绝其认为不公平的合同(负效用)。M在了解了S2的公平关切行为后,可通过调整合同的选择,甚至采用仅从备用供应商采购(a2)策略以获取S2的合作。

实验分两组进行:信息不共享组和信息共享组。在信息不共享组,被试仅能获取外部参数信息(如市场需求、常规供应商的可靠性等)以及个体决策的历史信息。在信息共享组,被试不仅能获取外部参数信息以及个体决策的历史信息,还能获取实验中其他被试决策的历史信息,即在第T期实验时,我们绘制第1期到第T-1期所有制造商提供的各类合同累积频次以及对应的备用供应商拒绝率的柱状图表,展示于被试决策界面的显著位置。在信息不共享组,被试仅能通过自身的决策历史进行个体学习,而在信息共享组,被试可通过阅读柱状图从他人处获取经验,进行社会学习。

实验通过计算机进行,常规供应商由计算机扮演,制造商与备用供应商由人扮演。在制造商的界面上,显示决策有关的外部信息及8个合同按键。被试可通过点击不同合同按键,在弹出框中查阅对应的计算结果,通过比较各个策略的结果,再做出最终的选择。备用供应商接受合同以及拒绝合同的结果会分别提供。值得注意的是,如果制造商采用仅从常规供应商进货策略,备用供应商则不参与交易,如果制造商采用仅从备用供应商进货策略,则常规供应商不参与交易,对备用供应商来说,这是最好的合同形式,在完全理解实验的基础上,不会拒绝该合同。制造商选定并提交策略时,在弹出框中确认后,提交策略成功。

扮演备用供应商的被试可在计算屏幕上看到制造商提供的合同信息,备用供应商接受合同所能获得的期望收益和期望利润、以及常规供应商在此合同下的期望收益。(需要注意的是,常规供应商的期望收益不受备用供应商的决策影响。)如果制造商采用双供应商策略,备用供应商基于所获的期望收益、期望利润、以及常规供应商的期望收益信息选择接受合同或者拒绝合同。如果制造商提交仅从常规供应商进货,备用供应商不需要做决策,直接进入下一轮实验。如果制造商仅从备用供应商进货,常规供应商的期望收益为0,备用供应商总是会接受合同。备用供应商决定接受或拒绝合同后则点击提交按钮,确认提交。

实验共招募了58名被试(均为清华大学本科生、研究生,学习经济管理、工程类专业),其中,参与信息不共享组28人,参与信息共享组30人。在两组实验开始前,随机决定被试扮演的角色(M或S2,S1由计算机扮演)并且一旦确认不再更改。每组实验持续60期,每期实验开始前,计算机对扮演M和的被试进行随机匿名配对,被试彼此对博弈对手身份不知情。每组实验第一期不限制决策时间,之后各期M的决策时间为60秒,S2的决策时间为40秒。被试每期博弈的实际利润以一定比率换算成收入,对后50期收入进行累加(前10期为预实验,确保被试熟悉系统并理解实验设置,不计入总收入),并在实验结束后现金发放给被试,平均每位被试收入约为50元人民币。

5 实验结果及分析

总体上,制造商各期合同分布与总样本的偏差随时间呈下降趋势。即随着实验的进行,制造商不断学习并积累了经验,其决策逐渐集中,决策选择能力逐渐提高。

进一步考察备用供应商策略分布随时间的变化趋势,如图2所示。两组实验结果均显示,随着经验的累积,备用供应商拒绝合同的比率呈下降趋势。引起拒绝率下降的主要原因在于备用供应商对公平的关注程度逐渐被制造商掌握,进而通过优化合同策略,获取了更多备用供应商的合作。

图1 制造商各期合同分布与总样本的偏差

图2 备用供应商拒绝率变化趋势

制造商策略的集中以及备用供应商拒绝率的逐渐下降正体现了强化学习模型的基本思想,即由于过去某个决策带来的良好结果,在未来的决策中人们会更倾向于这个决策(Law of Effect)。另一方面,学习曲线强调实践的幂定律(Power Law of Practice),即学习曲线往往初期陡峭,然后趋于平坦[28,29]。我们采用幂函数对拒绝率进行拟合分析,由于前10期收入不记入总收入,在两组实验下,仅取后50期正式实验的数据进行分析。 拟合结果显示,信息不共享组r=56.498t-0.173,信息共享组r=63.10t-0.375,拟合度R2分别为0.862和0.754。高拟合度表明负指数幂函数能较好的拟合两组实验下备用供应商拒绝率的变化趋势。并且,在信息共享组,备用供应商拒绝率随时间下降的速度更快(-0.375<-0.173),这表明社会学习效应能促使被试快速积累经验,使决策更快地达到平衡。综上,两组实验下,备用供应商的拒绝率数据符合实践的幂定律,拒绝率随时间减少的现象验证了学习效应的存在性,并且实验数据支持信息共享对被试的拒绝率有正向影响的假设。

图3 制造商的决策时间

另一个判断学习效应的标准是每期实验被试的决策时间变化。由于第一期实验设计为无时间限制,剔除第一期的实验数据,绘制制造商和备用供应商的决策时间随时间的变化趋势图,如图3和图4所示。

在两组实验下,制造商和备用供应商每期的决策时间随时间的推移逐渐降低,并且曲线初始时期陡峭,接着变得相对平坦,这符合学习效应实践的幂定律的特征。在信息共享组下,对于给定的t,制造商和备用供应商的决策时间均比对应的信息不共享组下的决策时间更长。由于在信息不共享组,决策界面更为复杂(提供了共享信息图表),被试需要更多的时间获取并利用这些信息。因此,不考虑决策时长的绝对值比较,转而分析两组实验的决策时长的变化率。

图4 备用供应商的决策时间

组别制造商备用供应商信息不共享组T=55.763t-0.389,R2=0.850T=19.640t-0.359,R2=0.721信息共享组T=50.615t-0.309,R2=0.821T=29.201t-0.351,R2=0.697

通过幂函数模型对决策时间进行拟合,结果如表2所示。两组实验数据均得到了较高的拟合度R2,据此推断负指数幂函数能较好的拟合决策时间的分布。随着时间的推移,被试的决策时间均呈逐渐降低的趋势,指数越小表示决策时间的下降速度越快。比较表2中的幂函数的指数值,信息共享组下,制造商和备用供应商的指数值均大于对应的信息共享组。因此,信息共享组下额外信息的提供不仅影响决策时间的长短,更会影响决策时间的下降率。综上,决策时间数据符合实践的幂定律,决策时间逐渐降低的现象验证了学习效应的存在性。然而,信息共享并没有如同预期那样加速学习效应的变化率,而是对学习效应的变化率有负向影响。因此,实验结果拒绝信息共享对被试的决策时间有正向影响的假设。

图5 合同选择频次及拒绝频次分布

接下来,针对系统中是否存在横向公平关切行为进行分析。如果备用供应商是纯粹的自我利益者,则会接受包括无预付金(k=0)双供应商策略在内的所有合同(合同7除外),以获取正的利润。然而,如图5所示,相当比例的备用供应商拒绝了较为不利的合同1,并且对于较为有利的合同(如2、3、4、5、6、8),拒绝的频次显著减少。在信息不共享组,不公平合同1被选择了92频次,拒绝率高达64.1%,大量的数据(501频次)分布在其余较为有利的合同2、3、4、5、6、8中。在信息共享组,不公平合同1被选择了266频次,拒绝率为33.5%,该组总体拒绝率达到了13.2%,且共有400频次分布在较为有利的合同2、3、4、5、6、8中。这些现象均显示备用供应商并不是纯粹的自我利益者,而是会通过拒绝有利可图的不公平合同惩罚提出合同的制造商。另一方面,从合同的分布来看,相当数量的制造商对于备用供应商的公平关切予以了重视,向其提供了较为有利的合同以获取备用供应商的支持。

基于前节构造的强化学习模型,我们通过极大似然估计方法评估备用供应商的公平因子λ及遗忘参数φ。将实验数据以(Cj,Ij)成对表示,Cj表示制造商提供的合同类别,j=1,2,…,8,Ij表示备用供应商的反馈,Ij=1表示接受合同,0表示拒绝合同。由式(1),(2),(3)可知,制造商和备用供应商在时刻t选择策略Cj,Ij的概率为该策略的倾向度与所有备择策略倾向度之和的比值,即

(4)

采用Matlab常规极大似然估计工具包,分别在嵌套模型与完整模型下极大化式(4)中LL=ln(L)。这里,在嵌套模型下,假设备用供应商纯粹的自我利益者。估计结果如表3所示。

表3 参数估计

在两组实验下,备用供应商公平关切参数估计值分别为λ=0.2623(p<0.01),λ=0.301(p<0.01),嵌套模型与完整模型的似然比检验分别为χ2= 311.6(p<0.0001),χ2= 90.1(p<0.0001)。因此,两组实验下完整模型均能更好地描述实验数据,备用供应商具有显著的公平关切偏好。 除此之外,在信息不共享组完整模型下,遗忘参数估计值φ=0,表明过往的经验对被试决策有同等重要性,遗忘效应并不显著。在信息共享组,遗忘参数估计值φ=0.01(p<0.05),表明被试决策更多地依赖于最近的经验,有显著的遗忘效应。遗忘效应的差异性与被试的经验学习环境密切相关。在个体自我学习环境中,被试仅通过查看历史数据进行决策,因此过往的经验对其同等重要,而在社会学习环境中,被试更多地依赖于每期更新的供应商合同选择及备用供应商决策统计图表进行决策,忽视了个体的历史数据,从而表现出显著的遗忘效应。

综上,我们不能拒绝假设H1。在本文研究的三人组供应链系统的行为决策过程中,存在学习效应,制造商策略的逐渐集中以及备用供应商拒绝率的逐渐下降正体现了强化学习模型的基本思想,即由于过去某个决策带来的良好结果,在未来的决策中人们会更倾向于这个决策。并且,被试的决策时间和备用供应商的拒绝率符合学习曲线的实践幂定律特征。我们不能拒绝假设H2。备用供应商体现出强烈的公平关切行为,并通过拒绝不公平合同以惩罚制造商。对于H3,我们不能拒绝信息共享对被试的拒绝率有正向影响的假设,但是对决策时间,却表现出负向影响的特点。

6 结论与讨论

本文通过实验研究公平关切行为与学习效应对决策者行为的影响。针对一类三人组供应链博弈结构,采用强化学习模型刻画决策者的行为特征。通过区别设计个体自我学习以及社会学习的实验环境,对比考察了备用供应商的公平关切程度,以及制造商和备用供应商学习曲线的特点。Chen等人从系统最优决策的角度分析了横向公平关切行为的影响。本文在此基础上,从学习效应的角度分析系统决策的变化,以及不同学习环境下横向公平关切行为的特点。

本文的实验研究结果支持了学习效应存在的假设。一方面,被试的决策时间和备用供应商的整体拒绝率符合学习效应中“实践的幂定律”的特征,另一方面,制造商的策略逐渐集中也体现了个体在过去某个决策带来的良好结果,在未来的决策中会更倾向于这个决策的学习特性。通过构建引入公平关切的强化学习模型对公平因子、遗忘效应参数进行估计,结果表明备用供应商的横向公平关切程度在两组实验环境下均较为明显,而遗忘效应仅在社会学习实验环境的实验环境下表现显著。

本文还有很多方面可以进一步扩展研究。首先,本文假设同质制造商和备用供应商,作为拓展,后续研究可进一步分析决策者的异质性;其次,本文假设常规供应商为计算机扮演,若对比分析常规供应商为人扮演的场景,可能会得到有趣的结论;最后,针对不同可靠度的常规供应商环境下分析备用供应商和制造商的学习行为也是未来研究的重要方向。

[1] Camerer C F, Loewenstein G, Rabin M. Advances in behavioral economics[M]. Princeton University Press, 2011.

[2] 陈俊霖,赵晓波.反S型权重风险偏好对一类两级供应链的影响[J].运筹与管理,2013,22(2):1-7.

[3] Fehr E, Schmidt K M. A theory of fairness, competition, and cooperation[J]. The quarterly journal of economics, 1999, 114(3): 817- 868.

[4] Roth A E, Erev I. Learning in extensive-form games: experimental data and simple dynamic models in the intermediate term[J]. Games and economic behavior, 1995, 8(1): 164-212.

[5] Chen J, Zhao X, Shen Z. Risk mitigation benefit from backup suppliers in the presence of the horizontal fairness concern[J]. Decision Sciences, 2014, forthcoming.

[6] Chen J, Zhao X, Zhou Y. A periodic-review inventory system with a capacitated backup supplier for mitigating supply disruptions[J]. European Journal of Operational Research, 2012, 219(2): 312-323.

[7] Dyer J H. Effective interim collaboration: how firms minimize transaction costs and maximize transaction value[J]. Strategic Management Journal, 1997, 18(7): 535-556.

[8] Güth W, Königstein M, Kovács J, et al.. Fairness within firms: the case of one principal and multiple agents[J]. Schmalenbach Business Review, 2001, 53(2): 82-101.

[9] Cui T H, Raju J S, Zhang Z J. Fairness and channel coordination[J]. Management Science, 2007, 53(8): 1303-1314.

[10] Fehr E, Klein A, Schmidt K M. Fairness and contract design[J]. Econometrica, 2007, 75(1): 121-154.

[11] Katok E, Olsen T, Pavlov V. Wholesale pricing under mild and privately known concerns for fairness[J]. Production and Operations Management, 2014, 23(2): 285-302.

[12] 杜少甫,朱贾昂,高冬,等.Nash讨价还价公平参考下的供应链优化决策[J].管理科学学报,2013,16(3):68-72.

[13] 丁川,王开弘,冉戎.基于公平偏好的营销渠道合作机制研究[J].管理科学学报,2013,16(8):80-94.

[14] Ho T H, Su X, Wu Y. Distributional and peer-induced fairness in supply Chain contract design[J]. Production and Operations Management, 2014, 23: 161-175.

[15] Mesoudi A. An experimental comparison of human social learning strategies: payoff-biased social learning is adaptive but underused[J]. Evolution and Human Behavior, 2011, 32(5): 334-342.

[16] Erev I, Roth A E. Predicting how people play games: reinforcement learning in experimental games with unique, mixed strategy equilibria[J]. American economic review, 1998: 848- 881.

[17] Salmon T C. An evaluation of econometric models of adaptive learning[J]. Econometrica, 2001, 69(6): 1597-1628.

[18] Erev I, Haruvy E. Generality, repetition, and the role of descriptive learning models[J]. Journal of Mathematical Psychology, 2005, 49(5): 357-371.

[19] Abbink K, Bolton G E, Sadrieh A, et al.. Adaptive learning versus punishment in ultimatum bargaining[J]. Games and Economic Behavior, 2001, 37(1): 1-25.

[20] Cooper D J, Stockman C K. Fairness and learning: an experimental examination [J]. Games and Economic Behavior, 2002, 41(1): 26- 45.

[21] Biele G, Rieskamp J, Czienskowski U. Explaining cooperation in groups: testing models of reciprocity and learning[J]. Organizational Behavior and Human Decision Processes, 2008, 106(2): 89-105.

An Experimental Study of Fairness and Learning in a Triadic Supply Chain

CHEN Jun-lin1, ZHAO Xiao-bo2, SONG Ya-nan2, CHEN Jian-ming2

(1.SchoolofManagementScienceandEngineering,CentralUniversityofFinanceandEconomics,Beijing100081,China; 2.DepartmentofIndustrialEngineering,TsinghuaUniversity,Beijing100084,China)

Experimental studies of behavioral economics have provided convincing evidences that people are not perfectly rational but are affected by factors such as fairness concerns and learning. We conduct laboratory experiments based on a triadic supply chain to examine the horizontal fairness concerns of backup supplier and the learning curves of both manufacturer and backup supplier. Both individual learning and social learning settings are considered. The experiment results support the learning effect hypothesis in the supply chain: As the experiment proceeds, the decision time for a single period decreases; the overall rejection rate of backup supplier is gradually reduced; and the strategies of manufacturers are gradually concentrated. Furrhermore, we construct a reinforcement learning model with horizontal fairness concerns. Parameter estimation results show that the horizontal fairness concern of backup supplier is significant in both experiments with individual learning setting and social learning setting.

management science and engineering; learning effect; fairness concern; stackelberg game; reinforcement learning model

2013-12-18

国家自然科学基金资助项目(71210002,71401195);科技部创新方法工作专项课题(2012IM040400);中国财经大学121人才工程青年博士发展基金项目(QBJ1412)

陈俊霖(1983-),女,四川巴中人,博士,讲师,研究方向: 行为运作管理、运筹学等;赵晓波(1962-),男,湖北嘉鱼人,博士,教授,博士生导师,研究方向:物流与供应链管理、行为运筹学与行为运作管理等;宋亚楠(1985-), 女,辽宁抚顺人,博士生;陈建铭(1988-),男,泰国曼谷人,硕士生。

C934;O225

A

1007-3221(2015)02- 0020- 09

Chen等人的Bernoulli模型(随机变量服从Bernoulli分布,下游需求D归一化为D=1)分析结论,针对备用供应商不同的公平偏好程度,制造商的最优策略可分为仅从常规供应商采购a1、仅从备用供应商采购a2、以及从常规供应商采购并从备用供应商预定期权a12(k)三大类。在此模型中,策略与订货量有直接简单的对应关系。单供应商策略表示q1= 1、q2= 0,q1= 0、q2= 1,双供应商策略表示q1= 1、q2= 1。令A1={a1,a2,a12(k)}表示M的策略空间。给定M的策略下,S2的策略空间A2={0,1}, 0表示拒绝,1表示接受。

猜你喜欢
制造商公平供应商
公平对抗
怎样才公平
一位制造商一架军机(欧亚篇)
一位制造商一架军机(美国篇)
笨柴兄弟
受挫的汽车制造商在通向全新未来的十字路口止步不前
高通24亿美元收购芯片制造商CSR
供应商汇总
供应商汇总
供应商汇总