内侧前额皮层−伏隔核环路在决策冲动中的作用:基于动物模型的研究*

2023-04-10 03:10卓利楠曾祥玉牛荣荣王玮文
心理学报 2023年4期
关键词:冲动环路脑区

卓利楠 曾祥玉 吴 冰 牛荣荣 于 萍 王玮文

内侧前额皮层−伏隔核环路在决策冲动中的作用:基于动物模型的研究*

卓利楠1†曾祥玉1†吴 冰1牛荣荣1于 萍1王玮文2

(1北京市“学习与认知”重点实验室; 首都师范大学心理学院, 北京 100048) (2中国科学院心理健康重点实验室, 中国科学院心理研究所, 北京 100101)

注意缺陷多动障碍(attention deficit/hyperactivity disorder, ADHD)行为控制不足与决策冲动密切相关, 后者受内侧前额皮层(medial prefrontal cortex, mPFC)与伏隔核(nucleus accumbens, NAc)调节。为调查ADHD决策冲动与mPFC-NAc间功能耦合的关系, 研究采用ADHD模型SHR (spontaneously hypertensive rat, SHR)大鼠, 结合延迟折扣任务和在体电生理, 研究发现, 与对照Wistar (WIS)大鼠相比, SHR大鼠对延迟大奖赏的选择百分比降低; WIS大鼠mPFC-NAc的Theta频段相干值表现为延迟选择时显著大于立即选择时、首次选择时大于连续选择时、转换试次时大于连续试次时, 而SHR大鼠在上述条件均低于WIS大鼠。回归分析发现mPFC-NAc的相干差值与延迟大奖赏选择率显著正相关。结果表明mPFC-NAc间功能联系减弱是ADHD决策冲动缺陷的重要环路基础, 该缺陷与其深度信息加工以及策略转换能力受损有关, 扩展了ADHD决策冲动的认知和神经机制的认识。

注意缺陷多动障碍, 决策冲动, 内侧前额皮层, 伏隔核, 神经振荡

1 引言

注意缺陷多动障碍(attention deficit/hyperactivity disorder, ADHD)是儿童青少年及成人中常见的一种持续的神经发育障碍, 以过度活跃(即多动)、难以保持持续的注意力和冲动性增加为主要症状(DSM-5; American Psychiatric Association, 2013; Faraone et al., 2015)。行为控制不足被认为是ADHD症状的重要心理病理基础。决策冲动性(decision- making impulsivity)影响行为控制能力(Jackson & MacKillop, 2016; Marx et al., 2018)。其中, 人类和动物实验研究都发现ADHD存在明显的“等待”缺陷, 即行动前在权衡短期和长期的利益和成本做出决策的过程中, 不能容忍延迟满足, 在跨期决策任务中表现为偏好小的即时奖励而不能等待大的延迟奖励, 从而导致长期奖励损失(Aparicio et al., 2019; Marx et al., 2018; Orduña & Mercado, 2017; Somkuwar et al., 2016)。一项对成人、儿童和青少年ADHD患者的Meta分析结果表明, ADHD患者偏好从一个大的延迟奖励转变为一个小的即时奖励的决策冲动模式, 同时遗漏错误较多, 注意力较差(Marx et al., 2018)。

决策过程涉及奖赏价值计算、对结果的预期以及根据结果进行认知转换等多种信息的编码与整合加工(Robbins & Dalley, 2017)。内侧前额皮层(medial prefrontal cortex, mPFC)和伏隔核(nucleus accumbens, NAc)被认为是参与决策过程信息加工的重要结构(Floresco et al., 2015; Jenni et al., 2017; Kim & Lee, 2011; Pérez-Díaz et al., 2017; Starkweather et al., 2018)。神经解剖学研究表明mPFC和NAc之间具有双向神经纤维投射。mPFC发出的谷氨酸能神经纤维可直接投射至NAc (Bossert et al., 2012), 其中mPFC中的缘前皮层发出的谷氨酸能神经纤维主要投射至NAc的核部(Asher & Lodge, 2012)。NAc发出的神经纤维可以间接投射至mPFC (Li et al., 2020)。以往的研究表明mPFC与NAc均与决策冲动的控制有关。人类功能磁共振成像显示在DDT任务中腹侧纹状体、mPFC和后扣带回皮层区域的激活程度随着奖励延迟时间的增加而减少, 因此认为这些脑区与决策冲动控制有关(Kable & Glimcher, 2007; Scheres et al., 2007)。与此一致, mPFC和NAc参与调节大鼠选择大奖赏的延迟强化能力, 其结构和功能受损可以诱导显著的决策冲动(Gui et al., 2018; Sackett et al., 2019; Donnelly et al., 2014; Fox et al., 2008; Basar et al., 2010)。Sackett等人(2019)研究发现在DDT任务中高冲动性大鼠mPFC亚区缘前皮层中对“小/立即”线索反应的神经元比例显著高于低冲动性大鼠(Sackett et al., 2019), 提示高冲动性大鼠的冲动缺陷与mPFC活动有关。关于NAc及其神经环路在决策冲动中的作用, Wang (2019)等人发现在DDT任务中的延迟期和奖赏预期期, 高冲动大鼠的内侧眶额皮层-NAc核部神经通路在Beta (15~29 Hz)和低频Gamma (30~46 Hz)频段的gPDC (generalized partial directed coherence, gPDC)显著弱于低冲动大鼠, 提示高冲动大鼠脑区间的信息同步交流减弱可能是导致决策冲动的原因(Wang et al., 2019)。新近的一项研究通过将静息态功能磁共振与多模态分析相结合, 发现人类mPFC-纹状体(包括NAc)功能连通性与对即时奖励的过度敏感和较高的选择冲动性有关(Lv et al., 2019; Wang et al., 2020)。上述实验均提示mPFC- NAc神经环路是参与决策冲动的重要结构。

临床和基础研究发现, ADHD患者及动物模型在奖励失调的实验中倾向于立即而不是延迟奖励, 导致决策能力受损的行为结果与这两个脑区结构和功能损伤相关联(Hauser et al., 2014; Miller et al., 2014)。例如, 与健康对照相比儿童和成人ADHD患者执行功能相关的mPFC默认网络(default mode network, DMN)失活减少(Salavert et al., 2015), 内侧、背外侧和腹侧前额叶脑网络连接模式的改变扰乱对未来状态的预期和未来目标的制定, 倾向于次优决策(Sonuga-Barke & Fairchild, 2012)。ADHD青少年在奖赏预期期包括NAc在内的腹侧纹状体激活程度降低且与病人的高活跃/冲动症状呈负相关(Hauser et al., 2014)。然而, 目前对于这两个脑区的功能耦合与ADHD决策异常间的关系并不清楚。

跨期决策的双过程理论(Carpenter et al., 2015)提出, 在决策过程中神经网络存在两种不同的激活模式(两个系统):在决策的早期阶段, 需要习得不同选项与奖励大小之间的关系, 即行为−结果的关联, 这一过程是受意识控制的、目标导向的理性分析系统(Khader et al., 2016), 该系统的活动需要调用较多的认知资源, 需要大脑进行复杂的神经网络活动(Pérez-Díaz et al., 2017)。在决策的后期阶段, 在习得行为−结果联结后, 决策过程则是不受或较少受到意识控制的、习惯化的自动加工系统(Zhao et al., 2019), 这个过程需要调用的认知资源以及神经网络活动的复杂程度均要低于受意识控制的理性分析系统。在决策过程中这两个系统需要协调活动, 并随着行为−结果联结的变化随时进行策略调整(Balleine & O’Doherty, 2010; Erdeniz & Done, 2020)。基于这一理论, 决策冲动的神经环路机制可能与两个系统的功能活动尤其是协同活动有关。我们假设在DDT任务的不同试次中, 首次选择、连续选择和试次转换时大脑对信息加工的深度不同:大鼠在进行首次选择时, 因为需要习得决策任务因此需要调动更多的认知资源, 以理性分析系统的活动为主; 而连续选择只需要与前一个试次保持一致, 因此更多地以自动加工系统的活动为主; 试次转换是对前一个试次进行纠错并做出优势选项的过程, 则反映了策略调整的灵活性, 因此需要理性分析系统更多地参与。因此, 通过分析不同试次首次选择、连续选择和试次转换时神经环路的激活程度, 可以考察理性分析系统和自动加工系统功能活动的动态改变。目前认为, 双过程理论的神经基础主要与皮质−纹状体神经网络环路的活动有关, 受意识控制的目标导向行为主要依赖于皮质−纹状体神经网络的协同活动, 而不受意识控制的习惯性行为则主要与皮质下的纹状体活动有关(Khader et al., 2016)。我们假设如果ADHD的mPFC-NAc间的环路功能耦合异常, 则两个系统的活动尤其是协调性有可能受损, 进而导致决策冲动异常。

SHR (spontaneously hypertensive rat, SHR)大鼠是目前最广泛使用的一种高效度的ADHD模型动物。大量研究证实, 与Wistar (WIS)对照大鼠相比SHR大鼠表现出过度活跃、行为冲动, 持续注意力受损以及对延迟奖励的敏感性异常等ADHD核心症状(Aparicio et al., 2019; Fox et al., 2008; Orduña & Mercado, 2017), 以及脑内DA、去甲肾上腺素和谷氨酸系统功能紊乱等ADHD样病理生理改变, 并且临床治疗药物(如哌甲酯等)可以改善SHR大鼠的ADHD样行为改变(Gauthier et al., 2014; Miller et al., 2014; Somkuwar et al., 2016)。延迟折扣任务(delay discounting task, DDT)是一个跨物种的决策冲动检测范式, 广泛用于测量人类、灵长目类和啮齿类对延迟的容忍度(Aparicio et al., 2019; Orduña & Mercado, 2017; Sackett et al., 2019; Vanderveldt et al., 2016)。DDT是指奖励的主观价值会随着等待时间的延长而降低, 即由于奖励的延迟而使奖励的价值贬值, 当延迟变得太长时, 个体会将他们的偏好从一个大的延迟奖励转变为一个较小的、即时的奖励, 个体对延迟大奖赏的选择百分比通常被认为是一种决策冲动指数, 可以用来衡量个体在不同延迟时间下的决策冲动水平(Steele et al., 2018; Vanderveldt et al., 2016)。

结合行为学和电生理方法, 本研究采用ADHD动物模型SHR大鼠并特异性地在mPFC和NAc植入微电极, 利用多通道在体电生理技术记录清醒大鼠mPFC和NAc在DDT首次选择、连续选择以及试次转换过程中的局部场电位(local field potential, LFP)活动及其在Theta (4~12 Hz)频带中的相干值, 针对性地探讨mPFC-NAc神经环路活动在ADHD病理机制中的作用。局部场电位的相干值是指相同频率的两个振荡之间相位差的相对恒定性, 反映脑区之间的协同性活动。以往的研究证实, 前额皮层与皮层下结构之间在Theta (4~12 Hz)频段的协同振荡活动可以促进目标导向任务中脑区之间的通信(Donnelly et al., 2014; Moorman & Aston-Jones, 2015; Sackett et al., 2019; Womelsdorf et al., 2007)。因此, 本研究利用相干值计算mPFC-NAc局部场电位在神经环路中的功能联系紧密程度, 进而分析mPFC-NAc功能联系紧密程度与DDT任务选择的关键事件(包括编码整合、奖赏价值计算、对结果的预期以及根据结果进行策略转换等)的关系, 以探讨ADHD决策冲动异常的认知和神经机制。

2 实验材料与方法

2.1 实验动物及饲养条件

为了探讨内侧前额皮层−伏隔核环路在ADHD模型大鼠决策冲动中的作用, 本研究设计了模型组和对照组两组。根据常用的实验动物实验样本量测算方法(Charan et al., 2013), 通过方差分析的自由度(E)进行样本量估算:E = 各组实验动物之和 − 组数, E的取值范围应在10~20之间, 因此初步估算每组样本量应至少6只。同时考虑到本实验周期长, 在行为检测、立体定位手术准确性以及电生理检测等实验过程中可能出现的损耗情况, 为保证最终有效数据满足统计分析要求, 购买对照组大鼠14只, 模型组大鼠10只。

实验采用雄性WIS大鼠14只和SHR大鼠10只(鼠龄6周, 体重为250~350 g), 购自北京维通利华实验动物有限公司。动物到达后适应环境1周, 期间自由进食进水, 环境温度24 ± 1 ℃, 12 h光照/黑暗周期, 实验在光周期内完成。首先进行自发活动量测定, 然后WIS大鼠和SHR大鼠各10只进行DDT任务训练。WIS组有2只大鼠因饲养过程中死亡被剔除, SHR组有2只大鼠因脑定位不准确被剔除, 最后两组大鼠各有8只进行了电生理数据记录。所有实验程序均经过“首都师范大学心理学伦理委员会”审核(批准号:CNU-202007001), 实验程序的执行符合有关动物保护和使用条例。

2.2 实验装置

动物自发活动量测试在自发活动箱(locomotive activity)中完成, 活动箱尺寸:350 mm × 350 mm × 350 mm, 采用视频分析系统记录实时运动轨迹, 跟踪分析大鼠水平移动距离。

DDT行为学训练和术后电生理测试均在行为学操作箱(30.5 cm × 24 cm × 21 cm; MED Associates, Inc., 型号ENV 008-VP)中进行。操作箱置于隔音箱内, 隔音箱配有风扇以保持通风并提供背景噪音。操作箱内有两个可伸缩式杠杆, 杠杆对侧设有一个房灯和声音发生器(MED Associates, Inc., 型号ENV-224DM)。MED行为学操作箱系统和计算机连接进行刺激的呈现和数据的收集。电生理记录设备采用Cerebus 64导多通道神经信号采集系统(Blackrock, 美国), 包括放大器单元和信号采集单元。

2.3 实验程序

整个实验程序如图1所示, 主要包括以下阶段。

2.3.1 适应期

大鼠适应实验室环境1周, 适应期间实验人员每天抚摸捉拿, 减少实验时的焦虑和应激反应。自发活动测试和行为训练前, 将大鼠分别放入自发活动箱和MED行为操作箱各30分钟, 自由活动以适应箱体环境。

2.3.2 自发活动量测试

动物适应自发活动箱3天后, 第4天开始进行自发活动量测试, 测试时间为30分钟, 连续测试3天。

图1 实验程序 A. 实验流程图。B. DDT任务流程图。C和D. 分别为mPFC和NAc电极植入位点示意图和尼氏染色图。

2.3.3 行为训练期

自发活动量测试结束后开始限食, 每只每天进食数量随体重状况而改变(给食10~15 g/天), 限食过程中自由饮水, 当大鼠体重降至自由摄食时体重的80%~90%后开始行为训练。

压杆训练:训练大鼠学会按压左、右杠杆。操作箱房灯亮, 同时伸出左右杠杆, 大鼠按压任何一侧杠杆均可立即获得1颗食丸, 以连续5天在30分钟内左、右杠杆各按压50次(共100颗食丸)为达到标准, 任何一侧达到50次则杠杆缩回, 指示灯熄灭, 全部完成则房灯熄灭。

线索识别任务:训练大鼠习得不同的声音线索。将声音线索分别与左、右杠杆相匹配, 包括2种声音:78 dB、3000 Hz的纯音和80 dB、8000 Hz的纯音。MED箱房灯亮起后, 随机响起一种声音, 大鼠需要按压相匹配的杠杆才能获得1颗食丸, 若错误按压非匹配的杠杆则无食丸奖赏, 杠杆收回, 若在规定时间8 s内没有按压杠杆, 则杠杆收回, 计为漏选(omission)。每个试次持续20 s, 共计180个试次, 约60 min。同样的声音不会连续出现三次, 2种声音线索出现的次数相同。声音在大鼠之间被平衡, 左右按压正确率达到80%以上, 且连续5天达到该水平则可进入下一阶段。

2.3.4 电极植入手术期

待大鼠习得声音线索识别任务后, 对其进行开颅手术, 植入2组由直径25 μm的镍铬合金丝(California Fine Wire Co., Grover Beach, USA)组成的2×4微电极阵列, 两组矩阵中心之间的距离为1.41 mm, 两组电极的长度相差3.5 mm, 电极丝间距约为100 μm, 每组电极阵列的横截面积约为 0.6 mm × 0.8 mm。大鼠手术前限食12小时, 按 40 mg/kg的剂量腹腔注射戊巴比妥钠, 待大鼠麻醉后将头部固定在立体定位仪(Stoelting, USA)上进行开颅和目标脑区定位, 按照Paxinos和Watson的脑立体定位图谱(Paxinos & Watson, 2004), 以Bregma点为参考, mPFC中心坐标选取PL的位点:前囟前+2.5~3.5 mm, 旁开0.1~1.0 mm, 从大脑表面深入2.7~3.2 mm。NAc中心坐标为前囟前+0.7~2.7 mm, 旁开0.5~2.0 mm, 深入6.3~7.0 mm。通过电动步进式微推进器(Narishige, 日本)将电极缓慢推进到达目标脑区(100 μm/min), 每推进500 μm暂停5分钟, 参考电极置于目标脑区附近的组织内。在上述区域周围安置4~6个不锈钢螺钉用以固定并用牙托水泥将电极固定在颅骨上。

2.3.5 手术后恢复期

大鼠手术后为预防感染肌肉注射氨苄青霉素8万单位/天, 连续一周。手术后自由摄食给水。恢复期过后, 对大鼠进行声音线索识别任务的恢复训练, 若连续3天大鼠正确选择比率恢复到术前水平, 并且偏好相同、错选≤ 20%、漏选≤ 5%, 随即进入DDT任务训练阶段。

2.3.6 DDT训练阶段

DDT任务分3个组块(见图1B), 每个组块包括30个试次。每个组块的前10个试次是强迫选择(一种纯音对应一个正确杠杆), 后20个试次是自由选择(随机呈现白噪音, 大鼠在左、右杠杆中自由选择)。每个试次的流程如下:在迫选试次中, 声音1持续呈现3 s, 杠杆伸出, 按压左杠杆立即获得1颗食丸; 按压右杠杆则无奖励。声音2持续呈现3 s, 杠杆伸出, 按压右杠杆, 在延迟时间后才能获得3颗食丸(不同组块延迟时间分别为0 s、10 s、20 s), 按压左杠杆无奖励。在自选试次中, 声音3 (白噪音)持续呈现3 s, 两杠杆均伸出, 大鼠可以自由选择左或者右杠杆, 分别对应不同的奖励。大鼠做出选择后杠杆收回, 房灯熄灭, 试次结束。不同声音在大鼠之间进行平衡, 以伪随机序列呈现, 同样的声音不会连续出现3次。实验中, 非提示线索下的杠杆按压都没有奖励并算作错误试次。如果动物在8 s内没有对任何一个杠杆做出反应, 那么两个杠杆都会缩回, 该试次计为遗漏。每个试次的持续时间为35 s, 共90个试次, 持续时间为52 min。将每个试次按照时间顺序分为以下几个时间段(见图2):基线期(−3~0 s)、预期期(0~3 s)、动作期(3~6 s)、奖赏期(6 s ~)。

DDT任务训练达标的标准是:A. 大鼠在自由选择试次中按杆比例达到80%以上; B. 延迟时间为0 s时, 大鼠在自由选择试次中选择大额奖赏杆的比例达到70%以上; C. 训练成绩稳定:选取训练阶段最后3个实验周期的数据, 运用两因素重复测量方差分析考察不同实验周期和延迟时间对大鼠延迟大奖赏选择比例的影响, 如果延迟时间的主效应显著, 实验周期的主效应、实验周期和延迟时间的交互作用均不显著, 则表明训练成绩是稳定的。

2.3.7 电生理记录

大鼠学习DDT任务过程中, 利用MED行为学操作箱和Cerebus 64导多通道神经信号采集系统同步记录大鼠的行为学数据和电生理数据。脑电信号首先进入放大器单元, 进行5000倍的放大, 后经过A/D转换变成数字信号, 通过光纤传输进入NSP信号处理单元。局部场电位记录的采样率为1 K/s, 滤波范围为0.5~500 Hz。所采集到的信号被储存在计算机内以待进一步分析。

2.3.8 组织学处理

实验完成后, 将电极通道两两配对分别通正负双向的直流电流(4 μA; 20 s)对电极位点进行损毁标记。然后用0.1 mL 30%水合氯醛溶液麻醉(剂量0.5 mg/kg), 灌流取脑, 并将其置于10%的福尔马林固定液中进行后固定。固定10~14天后置于30%和20%蔗糖溶液中进行梯度脱水, 待脑组织完全下沉, 用O.C.T.包埋剂常温包埋, 用冰冻切片机(Leica, 德国) 将脑组织进行切片, 切片厚度为50 μm。将脑切片放入烘干机干燥8小时后进行结晶紫尼式染色。最后在显微镜下观察电极位点以确保是否准确定位到目标核团, 在显微镜下采集图像并保存。

将组织学切片观察结果与大鼠脑立体定位图谱进行对照, 确认电极位点是否准确。剔除电极定位不准确的SHR大鼠2只, 最终各有8只WIS和SHR大鼠的mPFC和NAc的电极位点位于核团内, 每个电极(2×4阵列)选取中间对角线的两个位点绘制电极位置图(见图1C、D)。经组织学检查有效的动物在DDT任务中的行为学和电生理数据进行进一步的分析。

2.4 数据处理与统计分析

使用Microsoft Excel、SPSS 22.0对行为学指标进行整理及统计分析, 利用独立样本检验分析比较两组大鼠自发活动量的差异, 重复测量方差分析对不同组块下的选择偏好进行差异分析。在每个延迟组块(0 s、10 s、20 s)中, 计算大鼠自选时选择延迟大奖赏百分比来表示大鼠选择偏好(如公式1), 选择延迟大奖赏选项的比例越低, 决策冲动程度就越高。

图2 WIS与SHR大鼠的行为学和电生理活动。A. SHR组自发活动量显著高于WIS组。B. (i)在DDT任务中, 随着延迟时间的增加两组大鼠对延迟大奖赏选择百分比逐渐降低, 延迟时间为0 s时, SHR大鼠对延迟大奖赏的选择率与WIS组大鼠相比无差异, 延迟时间为10 s、20 s时, SHR大鼠选择率均低于WIS组大鼠。(ii) 比较两组大鼠在延迟10 s条件下的直线下降斜率, 发现SHR大鼠下降幅度明显高于对照组WIS大鼠。C. 决策过程中两组大鼠的mPFC和NAc在6~12 Hz频段的功率谱变化。横坐标是频率, 纵坐标是功率谱大小, 单位是log of PSD (dB)。D. 两组大鼠的mPFC和NAc在基线期与预期期6~12 Hz频段功率谱比较。E. 两组大鼠的mPFC和NAc的时−频分析功率谱(WIS, n = 8; SHR, n = 8)。F. mPFC-NAc的Theta频段相干值随着时间的变化情况。横坐标以线索呈现时刻点为0点, 灰色方框表示预期期(0~3 s)。G. 预期期mPFC-NAc的Theta频段相干值统计直方图。H. mPFC-NAc的Theta频段相干值的时−频分析图(WIS, n = 8; SHR, n = 8)。M ± SE, *表示p < 0.05, **表示p < 0.01, ***表示p < 0.001。

根据行为学结果, 记录大鼠在延迟10 s的组块中mPFC和NAc脑电信号, 使用NeuroExplorer5 (Neuralynx, USA)和MATLAB (MathWorks, USA)对每个通道记录的局部场电位功率谱(Power Spectral Dentities, PSD)进行时间−频率分析, 形成局部场电位时−频功率谱, 利用配对样本检验比较基线期与预期期的功率谱差异, 时−频功率谱计算方法为以下公式:

公式2是在公式3基础上计算功率值, 公式3是对信号进行傅立叶变换, 将时域上信息转化为频域上的信息; 其中T是信号总时间, wt(k)是计算功率的窗口长度, xt是信号,代表该窗口函数序列,代表频率,为自然对数。

将分别位于mPFC和NAc两个脑区的2×4电极阵列的8个触点进行两两配对。配对完成后, 选取不相邻电极的部分配对结果进行统计, 并根据不同事件对两个脑区的局部场电位进行相干分析。使用MATLAB 2015a信号处理工具包Chronux; 参数设置为:window size = 1 s; time step = 50 ms; tapers = 5; bandwidth = 3 Hz。以50 ms步进式地取1 s窗口的局部场电位数据进行叠加平均, 这样形成以1 s为中心点并以50 ms步进的时−频相干值。相干值计算方法为以下公式(xy是公式3计算的功 率值):

SS分别代表两个通道经公式4计算得出的功率值, C代表的是两脑区的相干值。不同试次的预期期(0~3 s) Theta频段相干值均减去基线期(−3~0 s)的相干值均值进行基线矫正。利用两因素重复测量方差分析比较不同选择类型下两脑区Theta频段相干值的差异, 分析以下3种情况时的局部场电位信号:(1)首次选择:上一个试次为漏选, 下一个试次为延迟/立即选择时, 则为首次选择; 或连续两次选择相同时, 则第一个试次为首次选择。(2)连续选择:连续两次选择相同时, 则选择第二个试次作为连续选择。(3)试次转换:上一个试次选择立即奖赏, 下一个试次选择延迟奖赏时, 则选择延迟奖赏的试次为试次转换。

3 实验结果

3.1 WIS和SHR大鼠的行为表现

独立样本检验分析显示实验组SHR大鼠的自发活动量显著高于对照组WIS大鼠, 两组大鼠的自发活动量存在显著差异((20) = 6.82,< 0.001), 表明SHR大鼠自发活动量较多(图2A)。

3.2 WIS和SHR大鼠mPFC和NAc的功能耦合

3.2.1 mPFC和NAc局部场电位振荡活动

局部场电位功率谱密度分析发现, 决策过程中两组大鼠的mPFC和NAc局部场电位在6~12 Hz频段显著增加(图2C、D、E)。配对样本检验结果显示, 在决策任务的预期期, 与基线期相比WIS大鼠mPFC和NAc在6~12 Hz频段功率谱密度显著增强((300) = −513.27,< 0.001;(300) = −285.74,0.001)。同样的, SHR大鼠的mPFC和NAc功率谱密度也增强((300) = −86.31,< 0.001;(300) = −251.05,< 0.001)。结果提示在预期期mPFC和NAc 6~12 Hz频段的振荡活动均增加。

3.2.2 在立即和延迟选择时, 两组大鼠mPFC-NAc局部场电位Theta频段相干值差异显著

3.3 首次和连续选择时两组大鼠mPFC-NAc局部场电位的Theta频段相干值差异显著

选取DDT任务中延迟10 s组块的预期期mPFC和NAc局部场电位数据, 分析无论是选择立即小奖赏还是选择延迟大奖赏时, 大鼠进行首次选择和连续选择时mPFC-NAc局部场电位Theta频段的相干值, 探讨 mPFC-NAc功能联系在信息加工深度中的作用。

3.3.1 在选择立即小奖赏时, 两组大鼠首次选择和连续选择时的mPFC-NAc局部场电位Theta频段相干值差异显著

3.3.2 在选择延迟大奖赏时, 两组大鼠首次选择和连续选择时的mPFC-NAc局部场电位Theta频段相干值差异显著

图3 首次和连续选择时mPFC-NAc局部场电位的Theta频段相干值。A. 在选择立即小奖赏时, 两组大鼠首次选择和连续选择时的mPFC-NAc局部场电位Theta频段相干值随着时间的变化情况。横坐标以线索呈现时刻点为0点, 灰色方框表示预期期(0~3 s)。B. 两因素重复测量方差分析显示, WIS组和SHR组首次选择时的mPFC-NAc Theta频段相干值均显著高于连续选择时。首次选择时两组大鼠之间均没有显著差异, 而在连续选择时, SHR组的mPFC-NAc Theta频段相干值显著低于WIS组。C. mPFC-NAc两个脑区Theta频段相干值的时−频分析图(WIS, n = 8; SHR, n = 8)。D. 在选择延迟大奖赏时, 两组大鼠首次选择和连续选择时的mPFC-NAc局部场电位Theta频段相干值随着时间的变化情况。E. 两因素重复测量方差分析显示, WIS组和SHR组首次选择时的mPFC-NAc的Theta频段相干值均显著高于连续选择时, 无论是首次选择还是连续选择, SHR组的mPFC-NAc的Theta频段相干值均显著低于WIS组。F. mPFC-NAc的Theta频段相干值的时−频分析图(WIS, n = 8; SHR, n = 8)。M ± SE, *表示p < 0.05, ***表示p < 0.001。

3.4 试次转换时两组大鼠mPFC-NAc局部场电位的Theta频段相干值差异显著

根据上述结果, 大鼠在选择延迟大奖赏时的mPFC-NAc局部场电位Theta频段相干值比选择立即小奖赏时强, 提示在选择延迟大奖赏时mPFC与NAc之间功能联系更密切, 对决策信息进行了更深层次的加工, 此时大鼠的决策冲动性较低。在此基础上, 本研究进一步比较了大鼠在进行试次转换时(由选择立即小奖赏转换为选择延迟大奖赏)与不需要试次转换时(连续选择延迟大奖赏)的mPFC-NAc局部场电位在预期期的Theta频段相干值, 分析mPFC和NAc之间功能联系与决策的策略转换之间的关系, 从而进一步探讨mPFC-NAc神经通路与决策冲动性之间的关系。

3.5 两组大鼠mPFC与NAc局部场电位Theta频段的相干差值对决策冲动的预测作用

如图4D、E所示, 将大鼠在预期期选择延迟大奖赏时和立即小奖赏时的mPFC-NAc局部场电位Theta频段的相干差值与延迟大奖赏选择率做回归分析, 发现WIS组大鼠在预期期Theta频段相干差值与延迟大奖赏选择率之间存在显著正相关(= 0.65;(1, 22) = 15.46,< 0.001,² = 0.42), 说明mPFC-NAc在预期期的相干差值越大, 决策冲动水平越低。反之, SHR组大鼠的mPFC-NAc的Theta频段相干差值与延迟大奖赏选择率之间不存在显著相关(= 0.33;(1, 27) = 3.12,= 0.089,² = 0.11), 该结果说明SHR组mPFC-NAc在预期期的相干差值不能预测决策冲动水平。

4 讨论

与以往的研究结果一致(Aparicio et al., 2019; Marx et al., 2018), 我们证实SHR大鼠与WIS对照大鼠相比表现出自发活动性明显增加(多动), 以及在DDT检测中对延迟大奖赏的选择百分比明显降低(决策冲动)的ADHD样行为改变, 为进一步的研究提供了稳定的动物模型。伴随行为改变, 观察到决策过程中关键事件相关的mPFC和NAc Theta频段的局部场电位及相干值改变, 主要表现为:WIS组mPFC-NAc的Theta频段相干值表现为延迟大奖赏选择时显著大于立即小奖赏选择时、预期期首次选择时大于连续选择时, 以及转换试次时大于连续试次时, 而SHR大鼠在上述条件时的mPFC-NAc Theta相干值均低于对照组, 且这一不足在延迟大奖赏时尤为明显。进一步的回归分析发现WIS大鼠mPFC-NAc相干差值与延迟大奖赏选择率呈显著正相关, 而SHR大鼠的Theta频段相干值的改变不能预测冲动性。这些结果表明, ADHD动物模型大鼠决策冲动缺陷与mPFC和NAc两脑区的功能联系减弱有关, 可能是导致ADHD决策冲动行为的神经环路基础。

4.1 mPFC-NAc功能联系减弱是ADHD决策冲动缺陷的重要环路基础

本研究发现在行为水平, SHR大鼠在DDT中选择延迟大奖赏的比例更低, 即表现出更高的决策冲动水平。与此同时, 两组大鼠的mPFC和NAc局部场电位Theta频段振荡活动在预期期显著增强。进一步观察mPFC-NAc环路神经振荡活动在预期期的变化, 发现WIS大鼠在选择延迟大奖赏时mPFC-NAc局部场电位Theta频段的相干值显著增加并且高于选择立即小奖赏时。与此不同, SHR大鼠mPFC-NAc的Theta频段相干值的增加幅度显著低于WIS组, 且在选择立即小奖赏时两组之间没有差异。

图4 试次转换时mPFC-NAc局部场电位的Theta频段相干值。A. 试次转换时两组大鼠mPFC-NAc局部场电位Theta频段相干值随着时间的变化情况。横坐标以线索呈现时刻点为0点, 灰色方框表示预期期(0~3 s)。B. 两因素重复测量方差分析显示, WIS组和SHR大鼠在转换试次时的相干值均显著高于连续试次; 在转换试次和连续试次中, WIS组的相干值均显著高于SHR组。C. mPFC-NAc的Theta频段相干值的时−频分析图(WIS, n = 8; SHR, n = 8)。M± SE, ***表示p < 0.001。D. WIS组大鼠mPFC与NAc局部场电位Theta频段的相干差值与延迟大奖赏选择率呈显著正相关。E. SHR大鼠mPFC与NAc局部场电位的相干差值与延迟大奖赏选择率之间不存在显著相关。

在决策任务中, 线索呈现后至做出选择之前的这段预期期是个体对外界信息进行编码、整合以及价值预判的关键时期, 很多研究发现在这一阶段的mPFC和NAc的神经振荡活动加强(Donnelly et al., 2014; Sackett et al., 2019; Wang et al., 2019)。与我们的发现一致, Donnelly等(2014)采用5-CSRTT任务观察大鼠的冲动行为, 也发现在线索呈现后的等待期和正确反应后, mPFC和NAc局部场电位Theta (7.5~9.5 Hz)频段的振荡功率均瞬时增强(Donnelly et al., 2014)。结合本研究的结果, 这些一致提示在行为冲动和决策冲动中mPFC和NAc的Theta振荡参与了对奖励结果的预期。由于mPFC和NAc局部场电位Theta频段的功率谱密度同时在预期期增强, 提示两个脑区的Theta振荡可能存在某种协同关系, 所以本研究进一步分析了mPFC-NAc局部场电位Theta频段的相干值, 发现WIS大鼠在选择延迟大奖赏时mPFC-NAc局部场电位Theta频段的相干值显著增加并且高于选择立即小奖赏时, 而且SHR大鼠与WIS大鼠之间的Theta振荡相干值只有在选择延迟大奖赏时才出现差异。以上结果说明mPFC-NAc神经环路功能联系是控制决策冲动的重要结构, 两个脑区之间的密切联系可以更好地衡量成本和收益并有效地控制决策冲动。而且, mPFC-NAc之间联系的强度可能与认知任务的强度和对信息的加工深度有关, 选择延迟大奖赏时需要调用的认知资源要大于选择立即小奖赏时, 因此选择延迟大奖赏时, SHR大鼠mPFC-NAc两脑区之间的功能联系的降低对行为选择的影响更大, 导致SHR大鼠在预期期对信息的编码、整合、价值计算以及对结果的预期不够充分, 从而表现为决策冲动行为。

神经振荡是中枢神经系统中一种节律性的神经活动, 可以表现在各种频段, 以往研究发现在决策任务中Theta和Gamma频段与认知过程密切相关(Donnelly et al., 2014), 而各频段的振荡活动之间相互联系是不同脑结构之间进行信息传递与交流的神经机制(Friston et al., 2015)。局部场电位是局部脑区神经元突触后电位的总和, 局部场电位之间相干值的分析可以反映脑区间电压变化的方向一致性, 从而反映不同脑区之间活动的协同性(Donnelly et al., 2014; Wang et al., 2019)。以往研究认为, 前额皮层(prefrontal cortex, PFC)和皮层下结构之间的特定频率的协同振荡活动可以促进目标导向任务中脑区之间的通信, 其中mPFC神经元参与形成对即将发生的奖励事件的预测(Moorman & Aston-Jones, 2015; Sackett et al., 2019), 而NAc神经元参与对即将获得的奖励的价值计算以及提高等待延迟奖励的能力(Basar et al., 2010; Steele et al., 2018), mPFC-NAc之间的协同活动对于决策过程中信息的编码、整合、价值计算以及对结果的预期具有重要作用(Donnelly et al., 2014; Narayanan et al., 2013; Wang et al., 2020)。以往研究也发现在5-CSRTT任务中mPFC与NAc之间存在Delta (2~5 Hz)与Gamma (50~60 Hz)之间的相位振幅耦合, 在错误触屏时的耦合较正确触屏时减少, 说明选择错误时两脑区信息交流强度减弱(Donnelly et al., 2014 )。本研究针对mPFC-NAc之间Theta振荡的关系进行了分析, 发现mPFC-NAc神经环路Theta频段振荡之间的信息交流减弱是导致ADHD决策冲动缺陷的重要原因, 更进一步说明大脑网络活动异常是ADHD的重要病理机制之一。此外, 需要说明的是, 本研究通过计算mPFC与NAc两脑区局部场电位之间的相干值可以反映两脑区之间电活动的协同性, 但是不能说明信息的流动方向, 这也是本研究的不足之处, 未来可以进一步通过跨频耦合和格兰杰因果关系等数据分析方法进一步探讨mPFC与NAc在不同频率之间的调制关系以及两脑区之间的信息流动方向。

4.2 ADHD大鼠mPFC-NAc环路功能联系减弱导致其信息加工深度的不足

本研究发现在选择立即小奖赏时, 首次选择时SHR大鼠和WIS大鼠之间均没有显著差异, 而在连续选择时, SHR大鼠mPFC-NAc的Theta频段相干值显著低于WIS大鼠。但是在选择延迟大奖赏时, 无论是首次还是连续选择, SHR组的mPFC- NAc的Theta频段相干值均显著低于WIS组。

跨期决策的双过程理论(Carpenter et al., 2015)认为决策过程中神经网络存在两种不同的激活模式, 包括两个系统:受意识控制的、目标导向的理性分析系统和不受意识控制的、习惯化的自动加工系统, 前者主要依赖于皮质−纹状体神经网络的协同活动, 而后者则主要与皮质下的纹状体活动有关(Khader et al., 2016)。随后Piray等人(2016)进一步利用脑影像学和数学计算模型相结合的方法发现PFC和纹状体之间自上而下信息传递较强的个体在决策时能够更加准确地预测结果并且在目标导向性行为中可以更好地进行模块化加工, 也就是说受意识控制的理性分析需要PFC与纹状体通路有紧密的功能联系, 反之当PFC-纹状体环路连接强度较低时则主要进行非模块化加工, 此时主要是非意识控制的习惯化加工系统(Piray et al., 2016)。Pérez-Díaz等人(2017)的研究发现大鼠的mPFC和背侧纹状体分别在受意识控制的行为和条件刺激引起的自动化行为的信息处理过程中起到不同的作用, 如果mPFC损伤可对受意识控制的过程产生影响, 而纹状体病变则可导致自动加工过程受到损害(Pérez-Díaz et al., 2017)。

本研究发现, 不论是在立即小奖赏还是延迟大奖赏, 两组大鼠首次选择时mPFC-NAc在预期期的Theta振荡相干值均显著高于连续选择时, 这一结果与双过程理论(Carpenter et al., 2015)的观点相一致。根据双过程理论, 首次选择较连续选择时需要加工和整合的信息更复杂, 需要习得不同选项与奖励大小之间的关系并建立行为−结果联结, 这一过程需要大脑进行更加复杂的神经网络活动, 更多的是受意识控制的理性分析系统参与活动。而连续选择时更多的是习惯化的自动加工系统的参与, 此时行为−结果联结已经形成自动化的加工模块, 不需要预先考虑动作与结果之间的关系, 而是随着声音线索的提示, 无意识地重复上一次的选择, 当自动加工系统活动时大鼠会更多地选择立即小奖赏(Zhao et al., 2019)。因此自动化加工需要调用的认知资源较少, 相应mPFC与NAc之间的功能联结亦较弱。利用ADHD动物模型SHR大鼠, 本研究发现在选择立即小奖赏时, 首次选择时SHR大鼠和WIS大鼠之间均没有显著差异, 而在连续选择时, SHR大鼠mPFC-NAc的Theta频段相干值显著低于WIS大鼠, 说明在进行较简单的决策活动时, 并不需要调用过多的认知资源即可满足行为需求, 此时更多的是无意识的、习惯化的自动加工系统在起作用, SHR大鼠在连续的自动化加工系统中的脑功能联系也较低。但是在选择延迟大奖赏时, 无论是首次还是连续选择, SHR组的mPFC-NAc的Theta频段相干值则显著低于WIS组, 说明当需要对信息进行更复杂、更深层次的加工时, mPFC-NAc之间的功能联系就更加重要, 而SHR大鼠mPFC-NAc之间的协同性不能满足复杂决策任务的需要, 导致SHR大鼠因为对外界信息加工整合的缺陷而造成行为控制的不足, 从而进一步导致决策冲动行为。

4.3 ADHD大鼠mPFC-NAc环路功能联系减弱与其策略转换灵活性降低有关

本研究发现WIS组和SHR大鼠在转换试次时的mPFC-NAc Theta频段相干值均显著高于非转换试次, 说明mPFC-NAc神经网络的功能联系随着策略的转换而增强。个体行为需要从经验或试误中不断地进行策略转换以适应环境变化。以往研究发现, 大鼠NAc和mPFC中的神经元在执行交替奖励任务期间在奖励交付前的延迟中表现出活动的增加, 能够区分对即将到来的食物或水奖励, 提示NAc和mPFC在认知灵活性上发挥重要作用(Miyazaki et al., 2004; Narayanan et al., 2013)。大鼠在奖励标准发生变化的任务中做出决策, mPFC神经元中的表征转变先于行为的变化。结果提示, mPFC可能反映了动物的行动−选择策略。损伤大鼠的NAc可以导致对奖励大小和延迟时间的敏感性下降, 进一步造成策略转换的灵活性降低(Steele et al., 2018)。Bartolo和Averbeck (2020)最新研究发现, 在反转学习任务中, 记录灵长类动物PFC在反转试次的神经活动, 发现其放电特征与贝叶斯推理策略相一致, 可以随着任务的改变进行快速调整(Bartolo & Averbeck, 2020), 说明PFC参与决策策略转换的灵活性。

在神经振荡活动方面, 已有研究发现在选择错误后的输转赢试次中, 人类的PFC以及大鼠PL和前扣带回皮层出现12 Hz以下的低频振荡活动, 如果mPFC失活则大鼠进行输转赢的行为调整能力受损, 低频振荡消失(Narayanan et al., 2013)。目前认为不同的神经振荡频率与信息传递方式有关:自上而下或自下而上。由皮层发出的自上而下的信息传递形成的神经振荡频率较低, 如Theta振荡; 而皮层下发出的自下而上形成的神经振荡频率较高, 如Beta、Gamma波段振荡(Friston et al., 2015)。在人类概率反转学习任务中, 双侧NAc Theta (4~8 Hz)频段局部场电位在输转赢试次时增强, 提示Theta振荡是反映策略转换灵活性的重要指标(Cohen et al., 2009)。有研究表明ADHD患者(或者SHR大鼠)认知灵活性下降(Gauthier et al., 2014), 但其神经机制尚不清楚。本研究发现, 在转换试次中, SHR大鼠的mPFC-NAc Theta相干值仍显著低于WIS大鼠, 说明SHR大鼠mPFC-NAc环路功能联系不足, 这可能是导致ADHD策略转换灵活性下降等症状的原因之一。

4.4 预期期mPFC-NAc环路功能联系可以预测决策冲动

决策过程中的预期期是对信息进行加工的重要阶段, 包括编码整合、奖赏价值计算、对结果的预期以及根据结果进行策略转换等(Donnelly et al., 2014; Narayanan et al., 2013; Wang et al., 2020), 如果上述信息加工过程缺陷则可能造成决策冲动。我们前述研究发现在预期期的mPFC-NAc环路Theta相干与信息加工深度和策略转换有关, 因此mPFC-NAc环路Theta相干的变化可能与决策冲动有密切关系。基于此, 将mPFC-NAc环路Theta相干变化值作为衡量脑功能联结变化的电生理指标, 用延迟大奖赏选择率表示决策冲动, 将两者之间进行回归分析。线性回归分析显示, WIS组mPFC-NAc环路Theta相干差值与延迟大奖赏选择率呈显著正相关, 即相干差值越低, 决策冲动水平越高, 说明在预期期的相干变化值可以预测决策冲动的大小:相干增加的程度越小, 则动物的决策冲动性越大。Donnelly等(2014)利用广义混合线性模型分析5-CSRTT任务中预期期的皮质−纹状体局部场电位和过早反应的关系, 发现在预期期mPFC亚区缘前皮层Theta (7.5~9.5 Hz)频段振荡和NAc Gamma (50~60 Hz)频段振荡能够预测即将发生的过早反应(Donnelly et al., 2014)。最近, Wang等人(2020)利用fMRI发现正常成人在DDT任务中的前额叶与纹状体的功能联结可以预测决策冲动(Wang et al., 2020)。利用功能连接性分析与向量回归分析方法, 发现NAc核部与mPFC和背外侧前额皮层(dorsal lateral prefrontal cortex, DLPFC)之间的功能耦合可以预测个体的延迟折扣率, 两者呈显著负相关趋势, 即NAc核部与mPFC/DLPFC之间功能耦合越强, 延迟折扣率越低, 个体决策冲动水平就越高。这些研究均支持本实验的结果, 说明决策冲动可能在很大程度上依赖于NAc-mPFC环路的功能联系。本研究还进一步发现SHR大鼠mPFC-NAc环路Theta相干差值与延迟大奖赏选择率之间相关不显著, SHR大鼠预期期的mPFC-NAc相干变化值不能对决策冲动进行预测。说明SHR组在决策预期阶段mPFC-NAc的相干耦合较低, 反映了SHR大鼠在决策信息加工和交流过程中对奖励大小或延迟时间的信息收集不充分, 奖励价值计算过程中神经信号交流较弱, 这种没有在脑区间达到一定强度的功能联系可能是导致ADHD不良决策的原因之一。

SHR大鼠是一种高效度的ADHD动物模型, 行为学上可以表现出ADHD的核心症状, 脑内神经递质系统也呈现ADHD样病理生理改变, 并且人类常用的治疗ADHD的药物(如哌甲酯)可以改善SHR大鼠的ADHD样行为, 为开展ADHD发病机制的研究提供了重要的实验基础(Fox et al., 2008; Somkuwar et al., 2016)。利用该模式动物, 本研究发现mPFC-NAc间功能联系减弱是ADHD决策冲动缺陷的重要神经环路基础, 提示针对性地干预mPFC-NAc神经环路可能对ADHD的决策冲动异常具有改善作用, 为人类ADHD的治疗提供了新的思路。需要注意的是, SHR大鼠在10周龄以后会出现自发性高血压(Christiansen et al., 2002), 这是否可能影响冲动性等行为, 还需要在未来的研究中进一步探讨。

5 结论

mPFC-NAc间功能联系是参与控制决策冲动的重要结构。在决策过程的预期期mPFC-NAc局部场电位Theta频段的相干值改变可以预测决策冲动的高低。ADHD动物模型大鼠mPFC-NAc之间功能联系不足是导致决策冲动缺陷的重要原因, 该缺陷与其深度信息加工不足以及策略转换能力受损有关, 这些可能是导致ADHD决策冲动的认知和环路基础。上述发现扩展和加深了对于ADHD发病机制的认识, 为改进治疗和干预策略提供了心理和神经生理依据。

American Psychiatric Association. (2013).(5th ed.). Washington, DC: American Psychiatric Association.

Aparicio, C. F., Hennigan, P. J., Mulligan, L. J., & Alonso- Alvarez, B. (2019). Spontaneously hypertensive (SHR) rats choose more impulsively than Wistar-Kyoto (WKY) rats on a delay discounting task., 480–493.

Asher, A., & Lodge, D. J. (2012). Distinct prefrontal cortical regions negatively regulate evoked activity in nucleus accumbens subregions.,(9), 1287–1294.

Balleine, B. W., & O’Doherty, J. P. (2010). Human and rodent homologies in action control: Corticostriatal determinants of goal-directed and habitual action.(1), 48–69.

Bartolo, R., & Averbeck, B. B. (2020). Prefrontal cortex predicts state switches during reversal learning.(6), 1044–1054.

Basar, K., Sesia, T., Groenewegen, H., Steinbusch, H. W., Visser-Vandewalle, V., & Temel, Y. (2010). Nucleus accumbens and impulsivity.(4), 533–557.

Bossert, J. M., Stern, A. L., Theberge, F., Marchant, N. J., Wang, H. L., Morales, M., & Shaham, Y. (2012). Role of projections from ventral medial prefrontal cortex to nucleus accumbens shell in context-induced reinstatement of heroin seeking.(14), 4982–4991.

Carpenter, K. M., Bedi, G., & Vadhan, N. P. (2015). Understanding and shifting drug-related decisions: contributions of automatic decision-making processes.(8), 607.

Charan, J., & Kantharia, N. D. (2013). How to calculate sample size in animal studies?,(4), 303–306.

Cohen, M. X., Axmacher, N., Lenartz, D., Elger, C. E., Sturm, V., & Schlaepfer, T. E. (2009). Nuclei accumbens phase synchrony predicts decision-making reversals following negative feedback.(23), 7591–7598.

Christiansen, R. E., Roald, A. B., Tenstad, O., & Iversen, B. M. (2002). Renal hemodynamics during development of hypertension in young spontaneously hypertensive rats.,(5), 322–328.

Donnelly, N. A., Holtzman, T., Rich, P. D., Nevado-Holgado, A. J., Fernando, A. B., van Dijck, G., … Dalley, J. W. (2014). Oscillatory activity in the medial prefrontal cortex and nucleus accumbens correlates with impulsivity and reward outcome.(10), e111300.

Erdeniz, B., & Done, J. (2020). Towards automaticity in reinforcement learning: A model-based functional magnetic resonance imaging study.(2), 98–107.

Faraone, S. V., Asherson, P., Banaschewski, T., Biederman, J., Buitelaar, J. K., Ramos-Quiroga, J. A., … Franke, B. (2015). Attention-deficit/hyperactivity disorder.imers,, 15020.

Floresco, S. B. (2015). The nucleus accumbens: An interface between cognition, emotion, and action., 25–52.

Fox, A. T., Hand, D. J., & Reilly, M. P. (2008). Impulsive choice in a rodent model of attention-deficit/hyperactivity disorder.(1), 146–152.

Friston, K. J., Bastos, A. M., Pinotsis, D., & Litvak, V. (2015). LFP and oscillations-what do they tell us?, 1–6.

Gauthier, J. M., Tassin, D. H., Dwoskin, L. P., & Kantak, K. M. (2014). Effects of dopamine D1 receptor blockade in the prelimbic prefrontal cortex or lateral dorsal striatum on frontostriatal function in wistar and spontaneously hypertensive rats., 229–238.

Gui, D. Y., Yu, T., Hu, Z., Yan, J., & Li, X. (2018). Dissociable functional activities of cortical theta and beta oscillations in the lateral prefrontal cortex during intertemporal choice.(1), 11233.

Hauser, T. U., Iannaccone, R., Ball, J., Mathys, C., Brandeis, D., Walitza, S., & Brem, S. (2014). Role of the medial prefrontal cortex in impaired decision making in juvenile attention-deficit/hyperactivity disorder.(10), 1165–1173.

Jackson, J. N. S., & MacKillop, J. (2016). Attention-deficit/ hyperactivity disorder and monetary delay discounting: A meta-analysis of case-control studies.(4), 316–325.

Jenni, N. L., Larkin, J. D., & Floresco, S. B. (2017). Prefrontal dopamine D1 and D2 receptors regulate dissociable aspects of decision making via distinct ventral striatal and amygdalar circuits.(26), 6200–6213.

Kable, J. W., & Glimcher, P. W. (2007). The neural correlates of subjective value during intertemporal choice.,(12), 1625–1633.

Khader, P. H., Pachur, T., Weber, L. A., & Jost, K. (2016). Neural signatures of controlled and automatic retrieval processes in memory-based decision-making.(1), 69–83.

Kim, S., & Lee, D. (2011). Prefrontal cortex and impulsive decision making.(12), 1140–1146.

Li, Y., Wang, X., Li, N., Qu, L., Wang, P., Ge, S. N., & Wang, X. L. (2020). The NAc lesions disrupted the hippocampus- mPFC theta coherence during intravenous cocaine administration in rats., 134986.

Lv, C., Wang, Q., Chen, C., Qiu, J., Xue, G., & He, Q. (2019). The regional homogeneity patterns of the dorsal medial prefrontal cortex predict individual differences in decision impulsivity.,, 556–561.

Marx, I., Hacker, T., Yu, X., Cortese, S., & Sonuga-Barke, E. (2018). ADHD and the choice of small immediate over larger delayed rewards: A comparative meta-analysis of performance on simple choice-delay and temporal discounting paradigms.,(2), 171–187.

Miller, E. M., Pomerleau, F., Huettl, P., Gerhardt, G. A., & Glaser, P. E. (2014). Aberrant glutamate signaling in the prefrontal cortex and striatum of the spontaneously hypertensive rat model of attention-deficit/hyperactivity disorder.(15), 3019–3029.

Miyazaki, K., Miyazaki, K. W., & Matsumoto, G. (2004). Different representation of forthcoming reward in nucleus accumbens and medial prefrontal cortex.(4), 721–726.

Moorman, D. E., & Aston-Jones, G. (2015). Prefrontal neurons encode context-based response execution and inhibition in reward seeking and extinction.(30), 9472–9477.

Narayanan, N. S., Cavanagh, J. F., Frank, M. J., & Laubach, M. (2013). Common medial frontal mechanisms of adaptive control in humans and rodents.(12), 1888–1895.

Orduña, V., & Mercado, E. (2017). Impulsivity in spontaneously hypertensive rats: Within-subjects comparison of sensitivity to delay and to amount of reinforcement., 178–185.

Paxinos, G, A., & Watson., C. (2004).. San Diego: Academic.

Pérez-Díaz, F., Díaz, E., Sánchez, N., Vargas, J. P., Pearce, J. M., & López, J. (2017). Different involvement of medial prefrontal cortex and dorso-lateral striatum in automatic and controlled processing of a future conditioned stimulus.(12), e0189630.

Piray, P., Toni, I., & Cools, R. (2016). Human choice strategy varies with anatomical projections from ventromedial prefrontal cortex to medial striatum.(10), 2857–2867.

Robbins, T. W., & Dalley, J. W. (2017). Impulsivity, risky choice, and impulse control disorders: Animal models. In J-C. Dreher & L. Tremblay (Eds.),(pp. 81–93). San Diego, CA: Academic Press.

Sackett, D. A., Moschak, T. M., & Carelli, R. M. (2019). Prelimbic cortical neurons track preferred reward value and reflect impulsive choice during delay discounting behavior.,(16), 3108–3118.

Salavert, J., Ramos-Quiroga, J. A., Moreno-Alcázar, A., Caseras, X., Palomar, G., Radua, J., … Pomarol-Clotet, E. (2018). Functional imaging changes in the medial prefrontal cortex in adult ADHD.(7), 679–693.

Scheres, A., Milham, M. P., Knutson, B., & Castellanos, F. X. (2007). Ventral striatal hyporesponsiveness during reward anticipation in attention-deficit/hyperactivity disorder.,(5), 720–724.

Somkuwar, S. S., Kantak, K. M., Bardo, M. T., & Dwoskin, L. P. (2016). Adolescent methylphenidate treatment differentially alters adult impulsivity and hyperactivity in the spontaneously hypertensive rat model of ADHD., 66–77.

Sonuga-Barke, E., & Fairchild, G. (2012). Neuroeconomics of attention-deficit/hyperactivity disorder: Differential influences of medial, dorsal, and ventral prefrontal brain networks on suboptimal decision making?(2), 126–133.

Starkweather, C. K., Gershman, S. J., & Uchida, N. (2018). The medial prefrontal cortex shapes dopamine reward prediction errors under state uncertainty.(3), 616–629.

Steele, C. C., Peterson, J. R., Marshall, A. T., Stuebing, S. L., & Kirkpatrick, K. (2018). Nucleus accumbens core lesions induce sub-optimal choice and reduce sensitivity to magnitude and delay in impulsive choice tasks., 28–38.

Vanderveldt, A., Oliveira, L., & Green, L. (2016). Delay discounting: Pigeon, rat, human--does it matter?(2), 141–162.

Wang, Q., Lv, C., He, Q., & Xue, G. (2020). Dissociable fronto-striatal functional networks predict choice impulsivity.(8), 2377–2386.

Wang, Z., Yue, L., Cui, C., Liu, S., Wang, X., Li, Y., & Ma, L. (2019). Top-down control of the medial orbitofrontal cortex to nucleus accumbens core pathway in decisional impulsivity.(7), 2437–2452.

Womelsdorf, T., Schoffelen, J. M., Oostenveld, R., Singer, W., Desimone, R., & Engel, A. K. (2007). Modulation of neuronal interactions through neuronal synchronization.(5831), 1609–1612.

Zhao, W. J., Diederich, A., Trueblood, J. S., & Bhatia, S. (2019). Automatic biases in intertemporal choice.(2), 661–668.

The function of mPFC-NAc circuit in decision impulsivity: A study based on an animal model

ZHUO Linan1, ZENG Xiangyu1, WU Bing1, NIU Rongrong1, YU Ping1, WANG Weiwen2

(1Beijing Key Laboratory of Learning and Cognition, School of Psychology, Capital Normal University, Beijing 100048, China)(2Key Laboratory of Mental Health, Institute of Psychology, Chinese Academy of Sciences, Beijing 100101, China)

Insufficient behavior control in patients with attention deficit / hyperactivity disorder (ADHD) is closely related to decision impulsivity, which is regulated by medial prefrontal cortex (mPFC) and nucleus accumbens (NAc). In ADHD patients, the mPFC and NAc show abnormality both structurally and functionally, indicating that these two brain regions are involved in regulation of decision-making, especially impulsivity. Although extensive anatomical connections between mPFC and NAc have been found, the role of mPFC-NAc circuit in decision impulsivity remains to be investigated.

Wistar (WIS) rats and ADHD rats (SHR, spontaneously hypertensive rat) were used as subjects of this study. We recorded the local field potential (LFP) of mPFC and NAc using multi-channel electrophysiology during a delay discounting task (DDT). We further analyzed the coherence difference of Theta (4~12 Hz) oscillation in expectation period (0~3s) and compared this measure between the two groups.

Results: (1) SHR rats had higher decision impulsivity level than WIS group. Power spectral density between 6~12 Hz of LFP in mPFC and NAc increased in both groups. (2) When choosing large/delayed rewards, coherence of mPFC-NAc activity increased compared to small/immediate rewards in WIS group. This indicates that the mPFC-NAc circuit mediates decision impulsivity. (3) When choosing large/delayed rewards, mPFC-NAc activity in SHR group showed lower coherence than WIS group, indicating SHR rats have weaker mPFC-NAc functional connections. (4) Coherence of mPFC-NAc activity is higher during initial choice behavioral than continuous choice behavior. It indicated that stronger mPFC-NAc functional connections are required during controlled information processing (dominant in initial choice behavioral), rather than automatic information processing (dominant in continuous choice behavior). Coherence of mPFC-NAc activity is higher in WIS group than SHR group when choosing large/immediate rewards. It indicated that the decision impulsivity deficits in SHR rats results from mPFC-NAc weak functional connections. (5) Coherence of mPFC-NAc activity is higher in shift trials than continuous trials. Plus, WIS group showed an overall higher coherence than SHR group. This indicated that mPFC-NAc circuit heavily involves in controlled information processing, and SHR group has deficiency of this process. (6) Regression analysis showed that coherence difference of mPFC-NAc activity in prediction period has positive correlation with delayed large reward selection rate in WIS group, that is, the more coherence of mPFC-NAc Theta activity increased during prediction period, the less decision impulsivity WIS rats behaved during choice period. However, the coherence difference cannot predict decision impulsivity in SHR group.

Conclusion: mPFC-NAc heavily involves in decision impulsivity. Increase of coherence of mPFC-NAc theta oscillation in prediction period can predict impulsivity level. The study revealed that weak mPFC-NAc functional connections mediate decision impulsivity in ADHD and brought new perspectives in the treatment of ADHD.

attention deficit/hyperactivity disorder, decision impulsivity, mPFC, NAc, neural network oscillation

2022-3-22

* 国家自然科学基金(No.82071517, 31771217), 国家重点研发计划(2017YFE0126500), 中国科学院心理健康重点实验室(中国科学院心理研究所)开放课题(KLMH2020K06)支持。

† 卓利楠和曾祥玉为共同第一作者

于萍, E-mail: pingyu@cnu.edu.cn; 王玮文, E-mail: wangww@psych.ac.cn

B845

猜你喜欢
冲动环路脑区
脑自发性神经振荡低频振幅表征脑功能网络静息态信息流
“冲动”不是真担当
追求原始冲动和意念的自由释放
上海市中环路标线调整研究
说谎更费脑细胞
冲动
七氟烷对幼鼠MAC的测定及不同脑区PARP-1的影响
Buck-Boost变换器的环路补偿及仿真
单脉冲雷达导引头角度跟踪环路半实物仿真
莫斯科地铁计划于2019—2020年推出第三换乘环路