姜宁张亦文黄红陈善广李莹辉刘新民
(1.中国医学科学院北京协和医学院药用植物研究所,北京 100193;2.宁波大学新药技术研究院,浙江 宁波 315000;3.中国航天员科研训练中心人因工程重点实验室,北京 100094)
学习记忆是生物体基本的认知功能,是指大脑接受外界信息,经过加工处理,转换成内在的心理活动,从而获取知识或应用知识的过程,是生物生存与进化中的一种复杂的高级神经活动行为[1]。学习记忆的产生与注意、兴趣、判断、决策等因素密切相关,是一种复杂的生理生化反应涉及到众多的神经递质包括胆碱能、兴奋性氨基酸、神经肽等[2]。国际科学界已经认识到细胞、分子和组织器官水平的研究无法反映数以百亿计的神经元以及神经突触组成的神经系统对外界刺激后经过复杂的生理、生化加工过程后产生的综合整体效应[3]。从整体和综合的角度开展认知科学研究成为世界各国科学家关注的重点,基于动物行为实验的学习记忆能力评价方法已成为研究其发生机制和寻找有效防治措施的最可靠的手段,广泛用于认知功能障碍疾病(阿尔茨海默病、血管性痴呆等相关疾病)、改善学习记忆药物和保健品功效评价,以及航天等特因环境所致认知损伤及防护措施等研究[4-5]。
由于学习记忆发生机制复杂,产生过程涉及多个环节,记忆的信息多样,刺激因素也不同,科学家们设计了多种学习记忆行为实验方法用于学习记忆的评价。自1930 年Tolman 和Honziks 首次建立14 个单元的T 型迷宫学习记忆行为实验方法以来,斯金纳箱、巴恩斯迷宫、Morris 水迷宫实验、新物体识别实验、跳台实验、避暗实验、奖励性操作式条件反射实验等相继出现[2]。本文首次对大小鼠学习记忆行为实验方法的分类进行概述,在介绍相关定义、原理的同时,列举相对应的行为学实验进行说明,为研究者选择合适的行为学检测方法提供一些建议,以期为基于行为实验的学习记忆研究、相关的产品研发提供参考。
学习(learning)是神经系统接受外界环境变化获得新行为和经验的过程(获得新知识),而记忆(memory)是对获得的经验或行为保持的过程(对新知识的保留)。学习和记忆的过程包括获得、巩固、再现及再巩固4 个环节[2,6]。获得是指感知的内容在大脑皮层留下记忆痕迹的过程,巩固是指记忆痕迹由短时不稳定状态逐渐转化为长时稳定且牢固状态的过程,记忆再现则为记忆痕迹通过回忆或再认方式给以重现的过程,记忆再巩固是指已经巩固的记忆被提取激活后变得不稳定,需经过再次巩固阶段才能重返稳定状态的过程[7]。因此,可以通过设置获得、巩固、再现及再巩固等不同的实验模式对学习记忆的发生过程进行评价。如避暗实验中,动物由于嗜暗习性而偏好进入和在暗室停留(给予电击),动物为避免伤害寻找安全区而进入明室,经几次反复后,最终记住安全区域。实验过程中,首先获得的形成(获得模式),获得形成后(1 h 后,一般为24 h)进行巩固模式实验,动物形成巩固的记忆后可以进入再现模式的检测[8-9]。研究认为M 胆碱阻滞剂莨菪碱影响记忆的获得,蛋白质合成抑制剂及NaNO2脑缺氧会造成记忆巩固障碍,而40 %的乙醇则影响记忆的再现[10-11]。
根据信息保存时间的长短,记忆可以分为短时记忆(short term memory,STM)与长时记忆(long term memory,LTM)。短时记忆可以保持几秒到几小时,长时记忆则可保持数周甚至数年。有研究表明短时记忆只需对已存在的突触蛋白加以修饰、改变突触连接强度即可实现;而长时记忆则需要启动基因转录和新蛋白质的合成才能变得长久稳定。跳台、避暗、物体认知和迷宫类实验方法都可以评价短时记忆和长时记忆[6,12]。T 迷宫、Y 迷宫等行为实验评价的“工作记忆”(working memory)一般指“短时记忆”,是对“正在经历”的信息进行短暂储存和加工以指导下一步行动计划。背景条件性恐惧记忆行为学检测等方法已经用于研究长期记忆形成的分子神经生物学机制[13]。
学习分为非联合型学习(non-associative learning)和联合型学习(associative learning)两种。非联合型学习是一种在刺激与反应之间没有明确联系的简单学习形式,指对单一刺激做出的行为反应的改变。跳台实验中[14-15],通过给予一定程度的电刺激,动物为避免伤害而寻找安全区(绝缘跳台),经几次反复后,最终记住安全区域,这是一种对电信号刺激的反应,是一种典型的非联合型学习检测方法,其他常用非联合型学习检测方法还包括避暗、迷宫、物体认知实验等。联合型学习是刺激和反应之间存在确定联系的学习,联合性学习需要对不同条件刺激之间的相互关联与自身行为及其后果之间的因果联系进行学习。在20 世纪初,俄罗斯生理学家伊万·巴甫洛夫(Ivan Pavlov),最早建立了巴甫洛夫的经典条件反射。经典条件反射是利用奖励性物质的激励性质完成对不同条件刺激信号的辨识学习。给予动物条件刺激(视觉或声信号或符号)[16-17],接着给予奖赏物质,动物逐渐形成对刺激信号的条件性趋近行为,或者直接给予动物奖赏物质,动物形成对奖赏物质位置的条件性趋近行为[18]。
记忆分为程序性记忆(procedural memory)和陈述性记忆(declarative memory)。程序性记忆又称为内隐性记忆(implicit memory)或反射性记忆,是对运动技能、感知觉、程序和规则等的记忆,具有自主或反射的性质,这种记忆形成缓慢,需要多次重复和演习才能完成。程序性记忆的完成不需要有意识的回忆过程,一旦形成即可保持较长时间。常见的程序性包括斯金纳箱、触屏奖赏、穿梭实验等。在穿梭实验中[19],给予某一特定信号(如灯光、声音等),若动物在规定时间内对不发生反应,立即给予惩罚性刺激(电刺激为主),动物为了躲避电击会穿梭至对侧安全区(被动条件反射),经过反复训练后(一般连续5 d)则可形成将特定信号与惩罚性刺激结合起来的条件反射-主动逃避反应(主动条件反射),是一种高级、复杂的联想式程序性记忆的获得与巩固过程。
陈述性记忆又称外显性记忆(explicit memory),是对地点、事实等的回忆,需要有意识的进行,这种记忆形成迅速,但同时又容易遗忘[20]。陈述性记忆又进一步分为情景记忆(episodic memory)和语义记忆(semantic memory)。情景记忆是将特定事件与其发生的时间、地点相互联系形成记忆。语义记忆是对经验的抽象概括,一般通过多次经验形成。在Morris 水迷宫实验中,动物在多次训练中,学会了寻找固定位置的隐蔽平台,形成稳定的空间位置认知,这种空间认知是加工空间信息(外部线索)形成的,进入意识系统,属于陈述性记忆[21]。
空间记忆是学习和探索周围环境的基本认知功能,是一种获取空间布局信息的能力,使我们能沿着一条路径在环境中找到目标位置[22]。常用的评价啮齿类动物的空间学习记忆能力的行为学方法包括迷宫、跳台、物体位置实验等。迷宫类实验(Morris 水迷宫、T 迷宫和八臂放射状迷宫等)可以检测空间参考记忆,实验中,大鼠和小鼠经过多次训练,学会在各种类型的迷宫中寻找固定位置的隐蔽平台/出口/食物,从而形成稳定的空间位置认知,是一种以异我为参照点的参考认知,隐蔽平台/出口/食物的位置与动物自身所处的位置和状态无关[23]。这种空间参考记忆的储存机制主要涉及边缘系统(如海马) 以及大脑皮层有关脑区[24]。Morris 水迷宫是评价动物空间学习记忆能力的经典行为学实验,它能有效地分离动物空间辨认与其它能力[25-26]。物体认知-物体位置识别实验是利用啮齿类动物会对移动到新位置的物体表现出更多的探索活动,可用于检测动物对物体所在位置的空间记忆能力的检测[27]。而物体认知-新物体识别实验[28],利用动物在新奇偏爱性这种内在动力的驱动下,对新物体表现出更大的兴趣,会更多的接近新物体,对其进行探索活动,是一种用于检测动物非空间的物体识别记忆能力的认知行为检测方法。
按照刺激因素原理不同,可分为奖赏、惩罚、自主活动3 大类行为实验方法。以惩罚原理检测的学习记忆行为学实验是通过对动物施加以电、水刺激为重点的惩罚性刺激元素,在实验中设定可逃避惩罚性刺激的策略,让动物学会并记住避免这些伤害性刺激,主要包括跳台、避暗、穿梭、水迷宫等。
通过施加各种奖励性刺激,动物通过随机发现、主动探索和(或)操作、获得经验、巩固记忆并再现,最终使动物形成条件反射,属于基于奖赏原理的学习记忆行为实验方法。这类方法由于对动物的行为和心理伤害刺激小,对相关递质分泌和神经信号传导不产生与行为学本身无关的干扰,是评价动物空间定向、决策、反应、判断、联合型记忆、工作记忆能力的主要行为实验方法,主要包括操作奖赏、触屏奖赏、食物迷宫等。
基于自发活动原理的学习记忆行为实验方法是利用动物对新奇物体或者新环境好奇的天性,给予动物新奇事物,或者将动物置于新奇环境,动物由于好奇产生探索行为而检测动物对新物体、新环境的学习记忆能力,这类方法不需要学习训练,亦不用禁食禁水,或施加惩罚或奖赏刺激,几乎对动物不产生正向或者反向应激[2]。但是与动物运动机能状态密切相关,凡能影响动物运动机能的药物和动物本身状态均可能影响该实验的正常结果。基于自发活动原理的学习记忆行为实验方法主要包括物体认知、迷宫(T 迷宫、Y 迷宫、八臂迷)等。
1938 年心理学家斯金纳(B.F.Skinner)在经典条件反射基础上首次提出了操作条件反射的学习记忆行为实验方法。操作条件反射根据条件刺激的不同,可分为操作式防御性条件反射和奖赏操作条件反射。操作式防御性条件反射是给以刺激信号(如灯光或声音),随即给予动物足部电击刺激(惩罚性刺激),动物进行操作,踩踏板或拉杠杆,则能够断开电路以避免或终止电击,这样通过训练,使动物能够结合刺激信号,习得通过操作行为预防或终止伤害性刺激(如电刺激)建立操作条件反射。奖赏操作条件反射以能引起奖赏效应的物质(食物、糖水等中性强化物质)作为非条件刺激信号,动物通过对踏板的偶然触碰,发现了踏板操作能获得奖励物质(固体或者液体物质),多次之后,最后动物学会了踏板获得奖赏这一行为,形成简单的操作行为反应-结果之间的操作条件反射。石哲等[29]、陈铃铃等[30]在国内首次建立了高智能、高自动化的操作式条件反射检测系统-奖赏性操作条件反射,以能引起奖赏效应的物质作为条件刺激信号,并结合非条件刺激信号(灯光或声音),动物通过随机发现、主动探索、获得经验,巩固记忆并再现,最终使动物形成条件反射。并通过设计条件反射训练、固定比率操作训练、信号辨识和信号消退等组合实验方案,能更精准的研究动物对复杂操作方式与辨识信号的学习记忆能力。王克柱[19]在此基础上进行了改进,通过结合计算机、信息学等技术,依据动物心理学,建立了自由适应模式、单次和连续多次操作、位置识别、信号辨识、条件性强化贬值、消退等实验模式,实现了在动物复杂操作任务下的兴趣、反应、判断、学习记忆等认知行为的全面评价。此外,大小鼠触屏操作法作为一种新兴的、计算机自动化的奖赏性操作条件反射方法也逐渐被科学家们应用于学习记忆能力的检测[31-32]。大小鼠触屏操作与奖赏性操作条件反射相同,而两者的不同在于动物操作装置和信号呈现方式:前者一般通过操纵杆或操作踏板作为动物操作装置,信号一般是简单的灯光或声音等固定样式的信号;而后者则是通过在触摸屏上呈现任意样式、任意位置的图案作为信号,动物直接触碰屏幕进行操作而完成奖赏性操作条件反射。也有一些实验利用触屏操作装置进行操作式防御性条件反射,使用如底部电击等惩罚作为结果,通过学习预防惩罚建立条件反射[33]。操作性条件反射可通过设置多重复杂的操作任务、信号辨识和模式组合,用于执行操作任务时的复杂学习记忆能力的检测,可以模拟航天航空航海及高科技作业人群的反应、判断、决策和学习记忆的评价。
此外,不同的学习记忆行为学实验方法也包含着对不同信息(图象、场景、声音、嗅觉、触觉)的学习和记忆,也可按照对不同信息的学习记忆能力进行分类。物体认知-物体情景记忆实验是检测动物对物体所处实验背景的记忆能力的方法,可以评价动物对情景记忆能力[34]。条件性恐惧实验以可以场景和声音为线索评价动物的恐惧记忆[35]。评价动物的嗅觉记忆记忆能力的嗅觉辨别实验,可以检测小鼠对与食物相联系的气味的辨识粗略分析小鼠对不同辨识能力,嗅觉六臂迷宫实验可以用来分析小鼠嗅觉的空间引导辨识能力[36-37]。此外,像穿梭和奖赏实验联想式学习记忆实验方法可以以声音、图像、嗅觉为线索(刺激信号),同时也可以视觉与触觉结合、视觉与嗅觉结合等多信息组合去评价或者比较学习记忆的能力。
现代科技发展使得人类生存环境、生活模式和生存空间发生了重大转变,老年性痴呆等学习记忆障碍性疾病正逐步成为危害人类身心健康的头号杀手[2]。学习记忆行为实验方法为研究这些挑战人类生存发展的难题,寻找其有效的防治方法和手段提供了基础方法学支撑。在学习记忆行为实验研究中,大小鼠是最常使用的实验动物[38]。迄今为止,科学家已建立了多种大、小鼠行为实验方法用于学习记忆的评价,从最初简单的T 型迷宫实验(空间工作记忆)到可以评价精细操作能力的奖励性操作条件反射实验,从简单的人工观察计数到计算机智能化、自动化检测,从单一的评价指标的获得到系统的精细敏感指标评价体系的建立,学习记忆动物行为实验方法实现了不同学习记忆过程、不同刺激原理、不同操作任务等涵盖(见表1)。
表1 常见的学习记忆行为实验分类Table 1 Classification of common learning and memory behavior experiments
可以预计,随着人工智能、生物信息、材料等生命科学以外的新技术、新方法向动物行为实验方法领域的融合发展,动物行为实验方法学正逐渐转向三维行为信息的提取和分析,评价指标正逐步精细化、定量化和自动化。目前,适应航天等特因环境作业,执行操作任务时的认知作业评价方法已在我国成功应用。同时,学习记忆行为实验检测分析设备也日趋微型化、集成化和智能化。可用于评价包括特因环境(如高低温、高湿、低压等)应激在内的,复合多重刺激源条件,涵盖学习记忆的不同类型的动物学习记忆行为实时在线检测分析方法,也正成为国际实验动物学习记忆行为实验方法发展的前沿领域。