徐 澍 刘嘉义 陈禹成
“游散”长期被认为是一种正强化手段。但是,在长期实践过程中,“游散”的实际使用产生了众多方式,这些对“游散”灵活多变的使用方式与单纯的正强化手段产生了某种偏差,更深入地厘清“游散”是否仅是一种正强化手段,其奖励原理究竟如何,彻底厘清“游散”的强化属性是“游散”手段正确使用的前提。
在2014版《警犬训练学》中,“游散”是指“通过满足犬的自由反射欲望使其随意活动的奖励方法”。从定义中看,“游散”至少有3个关键信息:一是要“通过满足犬的自由反射”的手段达成,这种手段可以是放出笼子、解开牵引带、打开犬舍门等多种形式,另外需要注意的是,想要“满足犬的自由反射”的基本前提必须是犬处于相对非自由的条件,若犬已经处于自由条件,则无法再次通过给予自由来“满足自由”;二是要“使其随意活动”,即允许犬自由嗅闻、奔跑、排便等行为;三是将“游散”作为一种“奖励方法”,加之现行版本的《警犬训练学》明确“奖励作为一种正强化的方法”,也就是说,现行理论体系认为“游散”的根本属性是一种正强化方法。
同时,在2014版《警犬训练学》中还对“游散”的作用原理阐述为“放犬自由或与犬玩耍,可以满足犬的运动或游戏欲望”,对效果阐述“放犬自由片刻,犬往往感到特别舒畅兴奋。这样既起到奖励训练的作用,同时也使犬的神经活动紧张状态得到缓和。”教材对该部分的补充简明扼要地指出了“游散”通过满足运动或玩耍欲望而实现强化目的的原理,同时强调了“游散”具有缓解犬的神经活动紧张状态的重要作用。
通过上述分析,可以明确现行理论体系将“游散”界定为一种正强化方法。那么,究竟什么是正强化呢?《犬行为学原理》教材中明确“操作性条件反射的基本条件是结果对某种行为的增减产生影响。凡是其结果可使行为增加的,就称为强化”。在行为心理学中,斯金纳按照强化的属性将它分为“正强化”和“负强化”两种类型。建立操作反应时,在有机体做出一个操作反应后,如果呈现某一后继的刺激物,有机体的操作反应概率增加,那么该刺激产生的作用称为正强化,该刺激物就是这一反应的正强化物;如果建立操作反应时,在有机体做出一个操作反应后,撤走某一刺激物,有机体的操作反应概率增加,那么该刺激产生的作用就是负强化,该刺激物就是这一反应的负强化物。
从上述定义来看,正强化应该是给予正向刺激或正向刺激强度增加,而负强化应当时撤销负面刺激或负面刺激强度减弱,二者的结果都是引发主体愉悦从而增加行为发生概率。根据“游散”的定义,“通过满足犬的自由反射欲望使其随意活动的奖励方法”,“游散”的结果会增加特定行为发生率,因此“游散”属于强化方法无疑,然而“游散”仅仅是给予自由的正强化方式吗?
根据斯金纳的理论,“游散”可以从两方面理解,一是给予犬自由,那么此时应当属于正强化方法;二是撤销犬不自由的状态,那么“游散”则是负强化的方法。根据现行教材对“游散”的定义中“通过满足犬的自由反射”的表述可以认为此时犬应当处于自由反射未得到有效满足的情况,而从这一状态到自由状态的手段,如解开牵引带、打开犬笼等皆可以理解为撤销控制手段,也就是撤销影响犬自由活动的负面刺激,因而从理论上看,此时“游散”的强化属性应当是负强化手段而非正强化手段。这又与现行教材的理论以及常规认知产生了冲突。
针对上述问题,通过理论与实践结合,笔者认为“游散”相比于其他奖励方式较为特殊,“游散”同时具备正强化与负强化的属性。“游散”在具体实操中会根据使用前提、使用方法等不同而体现为正强化或负强化。判断单次训练中所用的“游散”手段是正强化还是负强化,根本取决于“游散”前犬的状态:
(一)使用“游散”前犬承受的束缚状态强弱是判断“游散”性质的简单方法。使用“游散”前,若犬处于较强束缚状态,则“游散”属于负强化,比如执行巡逻任务的犬一直被要求处于随行位置,回到基地后使用“游散”手段使其放松,则此时是撤销犬不喜欢的长时间随行状态,应是负强化。再比如犬被关进狭小的笼子内,只有吠叫后才能被放出笼子自由活动的训练过程也是负强化;若犬不处于或处于的束缚状态较小不易被犬感知则此时“游散”大多属于正强化,比如犬在鉴别过程中基本无强制约束,结束鉴别后为缓解紧张状态而使用“游散”,则是给予更高强度自由,是正强化。再比如犬成功追踪并得到衔取奖励后,训导员又使犬“游散”一段时间,这一过程也属于正强化。所谓的束缚状态,是指非完全自由的状态,总体上包括牵引、拴系、环境束缚(犬舍、犬笼)等手段,同时也包括追踪、鉴别等作业状态。作业状态的束缚一般要小于牵引状态,犬舍的束缚状态一般要小于犬笼。
(二)犬承受束缚时的生理、心理反应是分析“游散”手段强化性质的根本方法。对于一些抗刺激能力强的犬,一般条件下的牵引、栓系等不会让其产生不适感,那么此时对大多数犬可能是负强化的“游散”对其则可能是正强化;而对于某些胆小敏感的犬,常规的牵引足以引起它较强的被动反应,则此时的“游散”无疑是正强化;对于部分科目训练存在问题的犬,在作业时可能会产生过度的抑制,那么此时的“游散”则很可能不是正强化而是负强化。究其根本,犬面对不同束缚状态时产生的不同生理、心理反应是分析“游散”手段强化性质的根本,面对现有束缚产生痛苦与不快,使用“游散”后这种痛苦与不快就会消失而引发的行为发生率增加,那么此时的“游散”手段就是负强化;反之,若面对现有束缚没有产生任何痛苦与不快,使用“游散”后会因得到自由而产生强烈愉悦和快乐并引发的行为发生率增加,那么此时的“游散”手段就是正强化。
对“游散”强化属性正确认识与判断,看似停留在理论层面,似乎脱离实训实战,实则不然。对理论的深入学习是实训实战的技术保障与验金石,不能吃透“游散”的强化属性,就无法真正了解“游散”这一重要训练方法,这种实践价值主要体现在以下方面:
(一)正确认知“游散”的强化属性是全面掌握“游散”方法的关键。“游散”的强化属性是“游散”手段最难以理解认知的部分,全面的了解这一方面能够深入增加对“游散”手段的原理、定义、使用范围、使用时机、使用技法、使用方式、使用技巧的认知,促进和丰富实践中的手段。
(二)能够帮助训导员丰富警犬训练手段。比如有些训导员在犬出犬笼或犬舍后会散放犬,但除了令犬排便并没有其他目的,如果正确理解“游散”手段的负强化属性,则可令犬在散放前吠叫,再予以“游散”的负强化达到训练的效果。
(三)能够帮助训导员厘清并解决“游散”使用的现实问题。许多训导员“游散”时机掌握不好,要么滥用“游散”导致犬变“散”、乱嗅、不前来等一系列问题,要么索性将“游散”仅作为排便科目使用而忽视其强化犬、缓解犬精神紧张的重要作用。如果正确理解“游散”的强化性质,以及正、负强化原理、使用方法,则大多数训导员能根据其他强化的使用,快速理解并熟练使用“游散”方法。