日常违规的效应及其心理机制

2023-04-10 00:46刘长江王帆赤宏娟谢丽芹
心理技术与应用 2023年4期
关键词:惩罚学习策略

刘长江 王帆 赤宏娟 谢丽芹

關键词 规则违反;认知适应;他人影响;学习策略;惩罚

分类号 B849

DOI:10.16842/j. cnki. issn2095-5588.2023.04.006

在社会情境中,人们倾向于自觉遵守规则(Berns et al., 2005; Ruff et al., 2013)。然而,日常生活中,违反规则事例时有发生。人们甚至谋求机会去违反规则,进而频繁违反各种规则。规则违反有悖于社会秩序,给个人、群体以及社会造成损失。规则违反通常不为群体和社会所鼓励,常被视为一种组织不当行为或不道德行为,甚至是潜在的风险因素。规则违反可区分为日常违规、必要违规和优化违规(Reason,1995)。其中,日常违规最常发生,也常常与人们的人身安全密切相关(Chmiel et al., 2017)。因而,阐明规则违反可能导致的后果以及导致这一后果的心理机制,可以更好地理解人们如何遵守日常生活中的社会规则,进而有助于维护社会稳定。

1日常违规的认知与行为效应

1.1对违规者的知觉

通常,人们会对违规者产生负性知觉。例如,人们会将在电梯里涂鸦、在公园乱扔垃圾的违规者视为没有礼貌的人(Chekroun &Brauer, 2002)。人们对内群体违规者的看法比对外群体违规者的看法更为负面(Cranmer &Cranmer, 2013; Marques et al., 1988)。例如,他们会认为内群体违规者更不友善和更不受欢迎。

然而,也有研究发现,人们对违规者持有积极的认知:人们会认为违规者比守规者拥有更多的权力、更高的地位等。例如,那些私拿别人咖啡、违反记账规则、把烟灰掸在地上或把脚搭在桌子上的人被认为比那些未表现这样行为的人更有权势(Van Kleef et al., 2011);那些穿运动服而非精致讲究的服装进入奢侈品店的人以及那些穿红色运动鞋而非正装出席正式场合的人被认为拥有更高的地位(Bellezza et al.,2014)。由于违规行为代表着权力和地位,这一重要线索往往使得人们将违规者知觉为能按照自己意愿行动的高权力者或者高地位者(VanKleef et al., 2011)。

人们不仅认为违规者具有较高的权力和地位,甚至还可能将更大的权力和更高的地位赋予违规者。例如,当违规行为有利于他人和集体时,违规者更可能被赋予领导者角色(Popaet al., 2014)。这意味着人们赋予违规者更高地位或权力是有前提的,即个体违反规则能使他人或集体也获益。研究发现,相比于遵守规则的个体,人们会认为那些故意无视公交车上禁止倾斜座椅或关闭窗户标识的个体拥有更多权力,尤其是当这样的违规行为使他人受益时(例如给他人更多的腿部空间或新鲜空气)(VanKleef et al., 2012)。同样,如果有人私拿别人咖啡但同时也为在场他人提供咖啡,那么人们也会认为这样的违规者拥有更多权力(Van Kleefet al., 2012)。

违规者是否被知觉或赋予高权力地位还受文化差异和知觉者自身特征的影响。就文化差异而言,在个体主义文化里,违规者通常被认为比守规者更强大,而在集体主义文化里,他们则被认为拥有更小的权力(Stamkou et al.,2019)。这是由于违规行为与重视群体和谐与社会秩序的集体主义文化价值相悖,而与重视个体自主与自由的个体主义文化价值相一致。就知觉者特征而言,研究发现,相比于自身权力地位低的个体,自身权力地位高的个体更不可能赋予违规者更高的权力地位,更可能拒绝违规者获得更高的地位(Stamkou et al., 2016,2019)。高地位者有着更强的动机去实现并维持其社会地位,因而他们更不愿意分享其资源和特权地位,甚至还会与违规者争夺权力;低地位者则为了减少意识形态上的不协调而将系统合理化,从而认为违规者更有权力(Piff et al.,2010)。此外,如果知觉者认为他人违规所带来的机会大于其所造成的威胁,那么他们更可能做出积极回应,提升违规者的权力地位知觉;反之,如果威胁大于机会,那么知觉者更有可能做出负面回应,贬损违规者的权力地位知觉(Stamkou et al., 2020)。

1.2对违规行为的评价与判断

人们对于规则违反的判断不尽相同。尽管规则违反常被视为不道德,但有时人们并不认为这种行为违反了某种规则,只是认为违规者在打擦边球(Sekerka & Zolin, 2007)。如果违规行为并没有严重偏离典型的规范,仍在可接受的范围之内,那么人们可能认为这只是不适当的或怪异的偏离行为,不会引发严重后果(Popa et al., 2014)。这是由于规则的重要性影响了个体对规则违反的判断。如果某一规则对自己很重要,人们更可能严格按照规则行事,并期望其他人也遵守这样的规则(Chandonet al., 2011)。一旦其他人违反了这一规则,他们会对违规者表现得更为严苛。反之,如果某一规则对自己不那么重要,人们遵守规则的意愿就会减弱,并对违反这一规则的违规者更为宽容(Popa et al., 2014)。跨文化研究指出,与松散(loose)文化相比,在紧凑(tight)文化里,违反规则会被视作威胁社会秩序的主要因素,而在更严厉的文化里,人们的这种倾向更强。研究表明,与松散文化相比,在紧凑文化里,人们对违反规则的容忍度更低,会对违规者施加更严厉的惩罚,以此维持社会秩序(卢俊等, 2017; Gelfand et al., 2017)。这也说明,不同国家里的人们对违反规则的容忍度存在差异(G?chter & Schulz, 2016)。

如果违规行为可能给他人造成伤害或损失,那么人们常常会根据行为的意图和结果做出道德判断。例如,遵守交通规则的驾驶员认为闯红灯者不遵守交通规则甚至无视规则,会给行人和交通带来安全隐患,从而认为闯红灯行为在道德上是错误的(Yang et al., 2018)。人们会对在公共利益博弈中违反公平规则、做出搭便车行为的实验参与者给予道德谴责,并评判其具备不道德的品质(Cubitt et al., 2011)。此外,人们对道德违反解释也并不完全一致。道德规则不允许人们做出违反法律或道德且对他人造成伤害的行为,而道德理想则鼓励人们做一些能减少伤害发生的行为,或者减少他人遭受伤害的风险(Roberts, 2010)。

1.3行为结果

违反规则会诱发和导致欺骗、不信任和自利等诸多社会不期望行为。例如,回忆他人违反道德事件更可能使个体在之后的实验任务中作弊(Mullen & Nadler, 2008);当被试感知到违反规则的真实比率非常高时,他们会做出更多的违反行为(M?s & Opp, 2016)。违规者比守规者的行为更不诚实(Gross & De Dreu, 2021)。跨国研究发现,相比较于来自违规(腐败、政治欺诈、逃税)普遍性较低国家的人,那些来自违规普遍性较高国家的人表现出更低的内在诚实(G?chter & Schulz, 2016)。经济隐蔽程度更高、民主更缺乏、对腐败缺乏控制的国家更普遍存在违反规则的现象,而这些因素均与个体的欺骗和不诚实密切相关(Fell et al., 2017)。

违反规则会导致信任水平下降。研究者将被试随机分配到贿赂游戏组或最后通牒游戏组中,两种游戏参与流程相同但在语言描述和角色权利分配上有所区分,例如采用“贿赂”和“转移”两种表达方式(Banerjee, 2016)。结果发现,无论是贿赂游戏还是最后通牒游戏情境,违反社会规范都会对信任产生负面影响。并且,与参与最后通牒游戏的被试相比,参与贿赂游戏的被试更可能在随后的信任游戏中对他人表现出更低水平的信任。研究还发现,尽管尝试修复信任提高了信任水平,但恢复后的信任仍低于基线水平(Fallon et al., 2017)。这表明,在社会互动中,人们违反规则增加了信任恢复的难度。

违反社会规则使得个体在议价中表现更为自利。研究者首先邀请被试与另一位同伴一起完成一项可以盈利的实验任务,被试或者同伴完成这项任务会赢得10元(另一人则为0元),然后,这两人再拿这10元作为最后通牒游戏的初始代币进行分配(Ridinger, 2018)。研究者设计了四轮最后通牒游戏,在每个游戏中提议者的其中一个提议是(8,2),即自己得8元,而对方得2元。研究者还测量了被试的规则遵守倾向。结果发现,如果这10元是回应者(而非提议者)赚得的,那么遵守规则的提议者更不可能提供(8,2)方案;如果这10元是提议者(而非回应者)赚得的,那么遵守规则的回应者更不可能拒绝(8,2)方案。因而,遵守规则会使得人们更遵循公平原则进行分配;反之,违反规则的人则更可能占有别人更多的利益。

在合作情境中,规则违反常常意味着不合作。研究发现,守规者在与违规者一起完成公共物品游戏时比在与其他守规者一起完成该游戏时表现出更低的合作水平(Kimbrough &Vostroknutov, 2018)。这表明,守规者的行为更可能受到他人是否遵守规则的影响。因而,鼓励诚实的人不参与搭便车对于社会合作至关重要。合作有时也意味着人们一起做“坏”事。例如,腐败的参与者为了获得个人利益而选择与其他人共同违反规则(Gross et al., 2018)。违反规则导致更加腐败。当腐败广泛存在时,拥有资源的个体更可能表达规则违反的意图;那些不支持规则的个体则表现出更大的腐败效应(Sundstr?m, 2016)。

违反规则往往招致组织与社会的制裁,而施加惩罚是最常使用的制裁方式。根据行为主义的观点,惩罚能够降低违规行为发生的频率。近期研究考察了规则违反后采用不同类型惩罚的效应。集体惩罚比同伴惩罚更能促进违规后的群体合作(Chapkovskii, 2018);扣分策略比罚款策略更能阻抑驾驶员违反交通规则,并且当驾驶员仅剩较少交通分且面临驾驶证吊销时,扣分策略具有极强的威慑和约束作用(Liu etal., 2020)。

2日常违规效应的解释机制

综合而言,社会心理学研究提供了三种机制来解释人们在日常生活中违规后的心理与行为反应。

2.1认知机制

认知机制可以区分为社会认知与认知社会两种取向(Isen & Hastorf, 1982)。前者强调人类认知在社会情境中的作用,而后者强调个体对社会情境的认知解释。

社会认知取向的觀点认为,规则违反的认知发生过程包含两个相继发生的激活阶段,即人们在头脑中自动激活已有的规则,然后再“否定”这些规则,从而克服基于规则的反应倾向(Wirth et al., 2018)。据此,在人们面临可能违反规则的情境时,规则在其头脑中是最先自动激活的。研究表明,人们倾向于自动地遵守规则;而且,即使在没有惩罚的情况下,人们也倾向于遵守规则,有时甚至会盲目地遵循规则(Berns et al., 2005)。然而,如果人们要违反规则,他们会采用倒置、否定或转换等方式激活规则违反。规则违反激活的同时,先前的规则也保持激活状态。此时,两者会产生认知冲突:人们执行规则违反比规则遵守花费更长时间(Jusyte et al., 2017)。在执行时,人们会不断地注意基于规则的选项,在任务执行轨迹上表现出明显的偏离(Wirth et al., 2018)。

近期的多次违规经历将为后续的违规行为提供便利,会明显缩短对后续违规行为的响应和执行时间,这一现象也被称为“冲突适应过程”。研究者要求一组被试先完成一项低比例违规任务,然后完成一项高比例违规任务(低-高组);另一组被试完成这两项任务的顺序颠倒(高-低组)(Wirth et al.,2018)。结果发现,只有先执行高违反比例任务的被试(高-低组)才会在执行随后的低违反比例任务时加快对后续规则违反的响应速度,甚至还会缩短违规的执行时间,减少执行轨迹的偏离。这是由于后续的规则违反会得益于先前规则违反的残余激活,对最近违规行为在计划和执行上产生了适应。

另一方面,认知社会取向观点认为,规则违反是在社会情境中进行的动态过程,它依赖于行为后果的反馈,而这一反馈路径涉及合理化和归因两个认知机制(Ting, 2020)。首先,违反规则会使人们对自己的道德产生认知失调。由此,人们会采用合理化策略来缓解这一失调状态(例如,认为规则违反源自同伴压力)(Ashforth & Anand, 2003)。这种策略不仅适用于对过去行为合理化,也适用于未来事件。在人们采用合理化策略成功缓解过去行为引发的认知失调后,为避免再次遭受同样的失调,他们会将先前的合理化经验迁移到未来行为事件中去,从而预防或避免未来行为事件可能出现的失调。随着时间的推移,多次重复该模式会使人们坚定对过去违规行为合理性的认知,从而倾向于表现出更多违规行为。当违规行为频繁发生后,人们就会将其视为合理的常规行为,进而导致违规行为的常态化。例如,那些经常使用免责策略为自己过去的交通违规行为辩护的司机更容易违反交通法规(Holman &Popusoi, 2018)。

其次,当人们违反规则却没有受到谴责或制裁时,他们会将缺乏干预归因于当权者无能或违规监控机制的失效(Ashforth & Anand,2003)。随后的每一次违规都将增强这一信念,使个体忽视政策和规则,最终导致习惯性规则违反。研究表明,喜欢超速行驶的驾驶人认为这种行为是令人愉悦的,而慢速行驶的驾驶人则倾向于认为超速行驶是危险的(Rothengatter,1988)。当某种违规行为结果被认为是可接受的时候,这种态度更容易导致危险行为的发生(Forward, 2006)。

2.2社会影响机制

社会影响可区分为信息式影响与规范式影响两种(Deutsch & Gerard, 1955)。信息式影响强调个体没有外在的企图去施加影响,他们也没有觉察到自己被他人所影响;而规范式影响强调群体成员施加压力或者制裁,导致人们在态度与行为上从众。

信息式影响的观点指出,他人信息在规则违反(以及遵守)中发挥重要作用。如果得知多数其他驾驶员在路上均按规定速度行驶,那么这对驾驶员自己决定是否按规定降低行驶速度产生最大效应(Ryeng, 2012)。暴露在不遵守规则的同伴面前常常唤起青少年的规则破坏(Molleman et al., 2022)。在社会互动中,人们想要知道其他同伴是否遵守相同的规则。研究发现,如果参照群体中的个体遵守规则,那么被试也遵守规则;然而,那些不遵守规则的人在不知道他人行为时也会遵守规则(Desmet& Engel, 2021)。这与条件性合作有所不同:知道只有少数人遵守规则并没有导致规则违反。因而,社会信息甚至可能提高规则遵守的程度,尤其是对于那些不遵守规则的人。如果在群体中包含至少一名守规者,那么其他成员更少地违反诚实规则。人们对他人的信念同样也影响了规則遵守与违反。如果人们相信其他人会违反规则,那么自己也倾向于违反规则,包含交通规则、体育运动规则等(Forward,2009)。

行为决策领域研究者采用行为反馈来助推在重要领域里人们的行为朝向社会期望的方向发展(Gr?nh?j & Th?gersen, 2011)。研究发现,只是告诉人们所有人的收入并非同质,他们便更不愿意按照规则来纳税(Engel et al., 2020)。为了使农民减少违规行为,研究者比较了两种助推策略:策略A是提供图片信息强调因违反规则而导致的负面环境影响,策略B则还提供本地其他农民也遵守社会规则的信息。结果发现,两种助推策略都有效地减少了违规行为(Pethet al., 2018)。

规范式影响的观点指出,在社会中,人们有内在偏好去执行那些被集体认为是社会适当的行为,甚至愿意牺牲物质利益去遵守这样的规范(G?chter et al., 2017)。社会规范驱动着人们的社会行为,在独裁者游戏、礼物交换游戏、公共物品游戏、信任游戏、最后通牒游戏等合作情境中表现出更多合作行为。违规人数较多时,人们感知社会规范带来的压力将会变小(Zhou et al., 2016),更可能表现出不道德行为(杜林致, 2007)。此外,从众倾向较高的个体尤其容易受到他人遵守或违反行为的影响。例如,从众倾向高的行人更可能在其他人闯红灯的时候闯红灯(Zhou et al., 2009);从众倾向较高的电动车骑行者有更强的交通违规意图,但当他们感知到类似情境下家人和朋友会遵守交通规则时,其违反交通规则的可能性更小(Tang etal., 2021)。

观察到规范破坏(或规范遵守)会削弱(或强化)人们自己对是否遵守该规范的预期(Sugden, 1998)。规范性期望以及实证性期望都会决定人们是否遵守规范(Bicchieri, 2006)。研究者采用一个重复的、非策略性的拿或给捐赠任务,结果发现,被试在看到其他人违反规范后,自己也跟着违反规范(Bicchieri et al.,2020)。不过,这一效应主要适用于那些最初遵守规范的人,而最初便不遵守规范的人没有表现出这样的效应。

2.3社会学习机制

社会学习是指个体通过观察来复制和模仿他人行为的过程(Andras, 2018; Bandura,2008)。人类在早期阶段便通过模仿、言语说明、强化学习等习得遵守社会规则(Pullen et al.,2006)。同样,社会学习也可以导致更广范围的规则违反。

人们在规则学习中会采用不同形式的社会学习策略(或称为学习偏差),这进而决定其违规后的心理与行为。例如,依赖于频次的策略是对他人行为的学习,是指人们习得的行为与所在群体内多数人所表现出的行为相一致;基于结果收益的策略是对他人行为后果的学习,是指人们在观察到他人行为得到了最高的收益或者获得成功后,也会模仿他人的这一行为(Molleman et al., 2013)。研究发现,相比于观察到其他人表现出共同的行为,如果人们观察到其他人做出更低的贡献而产生更大的个人收益,那么他们的合作水平更低(Burton-Chellewet al., 2017)。这是由于人们复制了基于收益最大化的行为,而非共同的行为。关注他人成功的行为导致自利行为(Van den Berg et al.,2015)。跨文化研究还发现,中国被试比西方被试更可能基于同伴的信息选择合作决策;而且,他们也倾向于模仿那些能导致更高收益的同伴行为(Molleman & G?chter, 2018)。社会合作情境通常假定人们是自愿行为的。但如果外在地设置社会规则,比如在资源困境中成员索取量不得高于某个阈限值,那么这种自利行为便成了违规行为。个体使用社会信息来尽力使得自己“成功”,“成功”意味着自己的收益最大化,这导致了合作降低,也导致了违规行为(Burton-Chellew et al., 2017)。这说明,对他人违反后果的学习不利于规则遵守。

规则违反本身具有奖赏性。前已述及,违规者被认为拥有更大的权力和更高的地位,而人有追求这样的权力和地位的动机。通过社会学习,规则违反本身强化了违规者的规则违反,也为他人违反规则提供了“范例”(Ting,2020)。积极的结果预示着规则违反会得到奖赏,人们更可能表现出违规行为。不惩戒违规者或违规者逃避了惩罚具有同样的强化效应,进而鼓励了规则违反(Freeman & Rakotonirainy,2017)。人们可能会认为在某些日常事务中违反规则是正当合理的,因而违规不会危及他们遵守规则的自我概念(Gino et al., 2010)。此外,观察到其他违规者受到惩罚会阻碍规则违反的发生。元分析研究发现,替代性惩罚对观察者行为的效应达到中等偏上水平(Malouff et al.,2009)。在不确定环境中,个体要理解行为会带来什么样的奖赏和惩罚结果,预期潜在的奖赏或惩罚,以及奖赏或惩罚的确定性程度。可能面临的惩罚会降低规则违反发生的可能。研究发现,如果面临惩罚威胁,那么员工会减少为他人破坏规则的行为(Fleming, 2019);相比于外在强加实施管理或者完全缺乏管理两种情境,如果被试有机会逃避被管理,那么他们会做出更多的不道德行为(Gino et al., 2013)。但是,如果被试认为惩罚是为了试图阻止人们违反规则,那么这将降低惩罚效力。这是因为惩罚合理化唤起了人们对权威的不信任(Mooijman etal., 2017)。

3总结与展望

以往研究更多关注规则违反的原因及其内在机制,相比较而言,有关规则违反效应的研究并不多,而且尚缺少系统的理论整合(Lamba,2014; Misyak et al., 2014; Van Kleef et al., 2015)。未來研究可以在以下方面展开探索。

3.1 深入挖掘规则违反的认知机制有关规则违反的认知机制

仍存在诸多未解议题。例如,对结果的期待如何决定人们的规则遵守与违反?规则违反过程中产生的认知冲突究竟是由已有规则和违反规则同时激活所致还是由个体的遵守意愿和任务要求不一致所致?规则违反的认知机制适用于不同类型(例如日常违反、优化违反和必要违反)和不同程度的规则违反吗?在不同领域里人们觉察规则违反的认知适应机制是怎样的?宽泛地讲,人类的社会秩序是如何实现的?此外,当代社会心理学普遍将人类社会判断与行为区分为自动化和控制性两个心理过程(Evans & Stanovich,2013; Gawronski & Creighton, 2013)。这样,未来研究需要说明规则违反过程中直觉与自动化的作用与条件,解释违反规则所产生的情绪与非理性因素及对后续心理与行为可能产生的影响。

已有研究似乎并不能解释规则违反后人们认知与行为之间的一致性。如果人们认为违规者拥有更大的权力和更高的地位,他们在违规后会更多地表现出社会所不期望的行为,会更偏好违规行为,无论是自己违规还是他人违规。机会与威胁观点(Stamkou et al.,2020)仅仅解释了违规后人们产生不同社会认知的条件,但未能解释其产生的原因以及违规会导致何种行为。此外,未来研究仍需要揭示对情境的认知所发展出的信念(如侥幸)是否及如何决定人的后续行为。

3.2 以动态视角揭示规则违反的社会影响和学习过程

采用社会影响与社会学习的观点来解释人们为什么违规以及违规后会导致什么样的心理与行为并不新颖,但它们依然是当代不同领域研究规则违反的重要理论基础。不同情境中他人如何影响个体依然是研究的一个核心问题。例如,经历或观察到的逃避惩罚如何导致规则违反,什么样的他人逃避惩罚或者他人如何逃避惩罚更可能起到强化效果?自我强化与替代性强化哪个对规则违反的效果更强?除了依赖于频次的策略和基于结果收益的策略,其他的社会学习策略,例如基于名声或信心的规则等,仍有待检验。

人们违反规则可能会经历漫长而复杂的影响与学习过程。人们会将所违背的规则习惯化为需要学习的规则,也可能适应某种新的规则,因而在一种情境下被视为违反规则,而在另一种情境下则可能是学习规则,类同于皮亚杰的同化与顺应。而且,特定情境中人们可能同时激活不同的规则与规范(Kallgren et al., 2000)。近期跨文化研究似乎支持了不同文化下人们对规则违反有着独立的认识(Stamkou et al.,2019)。未来研究需要揭示在新的文化下人们在旧有文化下所形成的违规如何被激活,是否被抑制,以及如何被影响和学习。

此外,人们经历的心理与行为过程在违规前与违规后可能有着不同的关系。例如,Engels等(2004)在考察青少年对偏离行为的态度和实际行为之间的关系时发现,在开始偏离时,态度预测了行为;然而对于有经验者的偏离,行为反而预测了态度。这意味着,最初的态度可能引导最初的行为,但是,在人们体验到偏离行为时,行为模式开始设定,态度被代入进来,将行为模式合理化。未来研究可以在实验情境下检验规则违反的动态学习特征以及可能的他人影响过程。

3.3亟待提高实验研究的外在效度

社会判断研究通常要求被试对假想的情境做出判断,被试往往作为无关的第三方做出评判;研究材料通常为故事情境,或采用自我报告的方式。这样的研究缺少行为测量指标,同时存在社会赞许性。基于认知与行为的实验室研究则大多采用认知或行为任务,例如沃森选择任务、样本匹配任务、移动球任务、性别认同任务等。然而,这些任务往往使用非社会性刺激或者是在非社会情境(即每个人的决策彼此孤立)下进行的,因而它们缺少社会互动,这进而降低了研究的生态效度(G?chter et al.,2017)。

心理学与经济学为研究者提供了大量的社会或经济互动游戏。这样的游戏以行为为主要观测指标,同时游戏有多人互动,玩家是在更为真实的社会情境下完成决策(Mooijman et al., 2017)。基于社会或经济互动游戏的研究主要关注决策结果,往往忽视决策行为的内在过程(Rahal &Fiedler, 2022)。这样,未来研究可以基于社会互动任务,设置特定的规则,观察人们的违规行为以及违反规则后人们与之互动的心理与行为表现,从而提高实验研究的外在效度。

猜你喜欢
惩罚学习策略
应用型本科层次大学生网络在线学习策略及实践
神的惩罚
Jokes笑话
惩罚
快播案:应受惩罚的是作为抑或不作为?
高中生数学自主学习策略探讨
“惩罚”爸爸
一种使用反向学习策略的改进花粉授粉算法
多媒体教学条件下学习策略剖析
真正的惩罚等