任艳萍 吴 涵 王 雯 金文青 李 人*
(1.首都医科大学附属北京安定医院 国家精神疾病医学中心 国家精神心理疾病临床医学研究中心 精神疾病诊断与治疗北京市重点实验室,北京 100088; 2.人脑保护高精尖创新中心,首都医科大学,北京 100069)
自杀是个体蓄意或自愿采取各种手段结束自己生命的行为。全球年自杀病死率约为16/100 000,即每年大约有703 000人死于自杀,自杀死亡占所有死亡人数的1.4%,是人类死亡的首位原因,已成为全球公共卫生问题[1-2]。我国年自杀病死率逐年上升,2019年约为13.4/100 000。自杀多发生于精神疾病患者中,最常见的为抑郁症(major depressive disorder,MDD)。据报道[3],3%~8%的抑郁症患者死于自杀,是普通人群发生自杀风险的20倍。研究抑郁症自杀的发生机制,对自杀的早期识别和预防、降低自杀病死率具有重要意义。
自杀是一个具有时空多维度复杂性的行为,按照阶段可分为自杀意念、自杀计划、自杀未遂和自杀死亡。虽然18%~58%的MDD患者出现自杀意念,但只有30%出现自杀行为[4],提示伴自杀行为的抑郁症可能具有独特机制。因此,研究抑郁症自杀行为发生的机制对于制定从自杀意念到自杀行为的预防措施可提供重要数据支持。自杀行为发生的相关因素包括社会、心理、生物遗传等多种相关因素,本文旨在针对抑郁症自杀行为在磁共振、神经认知、机器学习、生态瞬时评价及数字表型方面的研究进展进行综述,以期为开发自杀风险早期识别指标提供借鉴。
在结构磁共振研究方面,研究[5]显示自杀未遂的抑郁症患者大脑存在多处灰质、白质体积和皮质厚度异常及白质纤维受损。前额叶皮质(prefrontal cortex,PFC)灰质变化被认为与抑郁症患者自杀未遂有关,主要涉及脑区域包括双侧眶额叶皮质(orbitofrontal cortex,OFC)[6]和左侧背外侧前额叶皮质(dorsolateral prefrontal cortex,DLPFC)[7]灰质体积减小,左腹外侧前额叶皮质(ventrolateral prefrontal cortex,VLPFC)、DLPFC皮质明显变薄[8]。VLPFC在认知反应抑制中起着关键作用[9-10],当行为反应被调节以响应情绪或动机环境时,VLPFC被激活,可能导致血清素的异常。有研究[11-12]显示自杀未遂患者的正电子发射计算机断层扫描(positron emission tomography,PET)腹侧前额叶皮质(ventral prefrontal cortex,VPFC)包括腹外侧前额叶皮质(ventrolateral prefrontal cortex,VLPFC)和腹内侧前额叶皮质(ventromedial prefrontal cortex,VMPFC),在5-羟色胺(5-hydroxytryptamine,5-HT)合成、转运体和5-HT1a受体中发生改变,这表明VPFC结构异常引起的血清素合成转运等功能障碍是自杀行为的潜在生物标志物。伴自杀未遂的MDD患者在腹侧前扣带回皮质(ventral anterior cingulate cortex,VACC)和背侧前扣带回皮质(dorsal anterior cingulate cortex,dACC)体积均降低[9],且与自杀未遂次数具有相关性[13]。PET研究[14]显示,dACC中较低的局部脑葡萄糖代谢率(regional cerebral glucose metabolism,rCMRglu)与较高的致死性行为相关。海马和杏仁核是边缘系统的重要节点,伴自杀未遂的抑郁症患者海马体积减小[15],杏仁核体积增大[6],尾状核和苍白球体积减小[16],右侧小脑以及左侧角回的灰质体积减小[17]。与无自杀未遂的MDD患者相比,伴自杀未遂的MDD患者大脑经内囊前肢往返于左内侧额叶皮质、OFC与丘脑的白质纤维明显减少[18-19]。综上所述,MDD的自杀行为主要与额叶-纹状体-边缘系统结构异常相关,推测额叶-纹状体-边缘系统结构异常可能引起相关脑区血清素等神经递质合成、转运等功能障碍,造成情绪调节失调以及执行功能(如决策、反应抑制等)障碍,冲动和攻击性水平升高,继而发展为自杀行为[20]。近年来小脑在自杀行为中的作用也受到关注,一项采用弥散张量成像技术直接比较自杀意念和自杀行为患者的研究[21]显示,自杀行为患者右侧小脑的Ⅷ、Ⅸ区和左侧小脑的Ⅷ、Ⅸ区的各向异性(fractional anisotropy,FA) 增高,左侧壳核、尾状核和右侧前、中扣带回、尾状核平均扩散率(mean diffusivity,MD)增高。
在功能磁共振方面,Cao等[22]发现,与无自杀未遂的患者比,伴自杀未遂的MDD患者左侧颞上回和颞中回的低频振荡振幅(amplitude of low-frequency fluctuation,ALFF)值显著降低。而Fan等[23]研究结果相反,发现MDD自杀未遂患者较无自杀的MDD颞上回ALFF值升高。Wagner等[24]比较自杀未遂、自杀意念、无自杀抑郁以及健康对照四组患者,发现ALFF值在丘脑和海马体中升高,并可区分自杀未遂者。任务态功能磁共振研究[24-26]显示,在执行特定任务时,伴自杀未遂的MDD患者大脑出现异常激活。如情绪面孔识别任务中,MDD自杀未遂患者在观看愤怒面孔时,额下回(inferior frontal gyrus,IFG)、OFC[25-26]、DLPFC和dACC激活增加,前扣带回(anterior cingulate cortex,ACC)-DLPFC注意控制环路过度激活[27],表明伴自杀未遂的MDD患者对批评和社会排斥过度敏感[28-29]。此外,悲伤面孔引起ACC[25]激活减少,快乐面孔引起ACC激活增加,中性面孔引起ACC和右侧小脑激活[27]。情绪面部识别指正确识别他人情绪面部表情的能力(即社会认知),是人类社会互动所需的最基本技能之一[30-31],情绪面部识别包括自上而下的大脑皮质注意力调节和视觉刺激处理,以及自下而上的情绪唤起刺激评估[32-33]。综上研究,自杀未遂的MDD患者大脑呈现出对负性刺激的过度激活,对正性刺激的反应不足。一项关于自杀未遂患者自传体回忆的研究[34],在三种回忆状态(即精神疼痛、自杀行为和中性活动状态)下测量大脑的激活,结果显示与回忆中性活动相比,回忆自杀事件,即精神痛苦加自杀行为,与PFC失活相关,而与回忆精神痛苦相比,回忆自杀行为与内侧PFC(medial PFC,MPFC)、ACC和海马体的活动增加有关,这表明引发自杀行为的精神痛苦可能具有创伤性压力的性质,与PFC活动减少有关。然而,为应对精神痛苦而计划并表现出自杀冲动与额叶皮质活动的增加有关,这表明目标导向的自杀行为与减轻精神痛苦有关。在奖赏任务中,Dombrovski等[35]发现伴有自杀未遂时的老年MDD患者边缘旁皮质中预期奖励信号减弱。另一项研究[36]显示MDD自杀未遂患者在较小的即时奖励和较大但延迟的奖励之间进行选择时,海马旁回的激活减弱,考虑到海马旁回在展望中的作用,其对较长或较短延迟展望的迟钝反应可能代表了自杀未遂者展望受损的神经机制[37-38]。综上表明,MDD自杀未遂涉及到的结构和功能异常的脑区广泛,涉及额顶网络、默认网络和边缘系统等多个网络,表明自杀行为的发生是大规模脑网络异常交互作用的结果。
传统认知功能评估包括Stroop色词测验、Go/No-Go任务以及Wisconsin 卡片分类测验等,自杀行为的关系研究[38-42]表明,与无自杀行为的患者相比,自杀未遂者认知弹性较低、冲动性高、记忆力和注意力均较差。近年来,与行为学任务相结合的认知功能评估与自杀关系的研究受到关注,这些任务具有自杀特异性、不依赖于自我报告、易操作的特点。
研究[39-41]表明应用内隐关联任务(implicit association task,IAT)发现与死亡相关的内隐性能够预测被试者将来的自杀行为。有自杀未遂史的患者与无自杀未遂史的患者相比,自我-死亡/自杀关联性更高[42],死亡/自杀-自我关联能够预测将来的自杀行为[43]。在没有自杀史的健康志愿者中,自我-死亡关联与岛叶的激活[44]以及杏仁核和岛叶前部的γ振荡加强有关[45]。
与自杀相关刺激的注意力偏向试验一般由与自杀相关刺激的Stroop 任务完成,通过测量命名代表自杀词汇颜色的反应从而反映自杀相关语义线索的注意力固着。研究[46-47]结果表明,自杀相关词语干扰增加,表明自杀注意力偏向与6个月内随访期间或近期的自杀行为风险增高有关,既往有自杀行为的被试者反应时延长,在近期自杀未遂的被试者中更明显。另一项研究[48]采用点检测任务(dot probe task,DPT),旨在评估对中性、负性或正性情感刺激的注意力分配情况,结果[46]显示,对愤怒面孔的中性反应对应的数个前额叶脑区变化可以区分自杀未遂者与非自杀未遂者,在自杀未遂者中,愤怒与高兴面孔引起的杏仁核-海马区θ功率与自杀意念的正相关增高。
针对反应抑制和冲动性认知功能评估,采用Go/No-Go 任务,发现自杀未遂患者误报率高[49],未命中率增高可以预测严重自杀意念和既往自杀未遂者随后发生自杀行为的概率[50],一周内发生自杀未遂行为与既往发生自杀未遂行为(>1 年以上)的患者相比操作错误率更高[51]。另一项采用延迟折扣任务(delay discounting task,DDT)评估冲动决策的研究[46]表明,既往自杀未遂者表现为更高的延迟折扣,并且较高的延迟折扣与低致死性自杀企图有关,而较低的延迟折扣则与高致死性和计划自杀企图有关。
网络掷球游戏(cyberball task)可评估社会排斥,研究[47]显示与非自杀者和健康志愿者相比,自杀未遂者在排斥阶段催产素水平降低,并且在自我报告中对获得情感支持不抱希望,岛叶后部活动降低。疼痛敏感性任务(pain sensitivity tasks,PST)可评估疼痛敏感性,既往自杀未遂者与精神疾病患者和健康志愿者相比,疼痛耐受性增高[52],但也有相反结果的报道[53]。自杀未遂住院者与事故相关创伤住院者相比,对电休克所致疼痛的耐受性明显增高;负性生活刺激与疼痛耐受性正相关,但在事故幸存者和健康志愿者中相反[54]。另一项采用情感调节的惊吓反射任务(affectively modulated startle reflex task,AMSRT),用来评估对刺激的厌恶反应,结果显示,与自杀意念或只有一次自杀行为的受试者相比,多次自杀行为者对不愉快画面的惊吓增强,但在愉快的画面中没有观察到相似的发现[55]。既往有自杀未遂史的患者与无自杀未遂史的患者相比对预期的威胁惊吓增强[56]。
基于行为学的认知功能评估存在局限性,包括由于任务本身的复杂性,导致在阐明任务和特异神经环路的关系上存在问题,需要开发针对自杀风险评估的特异性任务操作特征的计算机化模型,如最近一项采用Iowa博弈任务的研究[57]中,决策Bayesian分析表明,自杀未遂者与无自杀行为的抑郁症患者和健康对照相比呈现更多的丧失厌恶水平。此外,有研究者[58]认为这些任务对自杀风险评估的效应量较小,与传统自我报告的测量效应量相比无明显优势,但是在鉴别自杀未遂者与未发生自杀行为的患者中尚具有一定价值,需要更大规模的研究证实。
自杀是涉及生物、心理、社会众多因素交互作用所致的复杂行为,Franklin等[59]对既往50年来的研究进行分析发现,传统研究方法对自杀行为的预测能力与机会水平没有区别。机器学习是研究计算机模拟或实现人类的学习行为,是人工智能的核心技术,与传统分析方法相比,在处理众多复杂的、具有相互关系的变量时具有一定优势。目前,机器学习主要基于电子医疗记录、社交平台活动、医保支付系统等数百级的变量数据进行自杀风险研究,并可在较长时间内跟踪预测因素的变化,增强了对自杀行为的理解和预测[60]。
Carson 等[61]应用随机森林(random forest,RF)法对电子健康记录采用自然语言处理的方法识别精神病住院青少年患者的自杀行为,发现与自杀企图高度相关的术语主要集中在与自杀、家庭成员、精神障碍和精神药物相关词语。一项收集17年的回顾性队列研究[62]利用RF分析诊断、人口统计学、药物治疗及社会经济因素等候选预测因素构建模型,并在多个时间点(1周~2年) 进行验证,结果发现自杀未遂组与抑郁组比较差异明显的相关因素排列为体质量指数、年龄、苯胺类药物(例如对乙酰氨基酚)、丙酸衍生物(例如非甾体抗炎药)、选择性5-HT再摄取抑制剂,抑郁症病史,情感发作病史,需要注意的是,在不同时间点预测因素的重要性可能不同,例如体质量指数对近期预测价值较大但对远期(2年以上)预测价值小。Miché等[63]发现,逻辑回归(Logistic regression,LR)、套索回归、岭回归和RF这4种算法在预测青少年和年轻人中未来发生自杀未遂方面均有较好的效应量,自杀风险的首位预测因素为既往自杀史;第二位预测因素4个模型不同,分别是受教育程度(LR和套索回归模型)、既往求助史(岭回归模型)、罹患精神疾病情况(RF模型);负性生活事件和精神病性症状在套索模型中未纳入,表明这两个因素在自杀行为预测中可能不是重要因素。利用决策树、LR、RF、支持向量机、人工神经网络和极端梯度增强等分类方法分析青少年自杀意念和自杀未遂案例,发现悲伤、暴力、吸毒和压力是自杀行为发生的重要影响因素[64],抑郁程度是最强预测变量[65]。一项纵向研究[66]显示,国外士兵精神科出院后12个月内自杀身亡的最强预测因素包括男性、入伍年龄、刑事犯罪、持有武器、既往自杀史、精神科住院和门诊治疗史,以及精神疾病诊断。一项应用监督机器进行自杀性鉴定的可行性研究磁共振成像数据的机器学习(machine learning,ML)方法综述[67]表明,前额叶-边缘系统的静息态功能连接和灰质体积异常在鉴别抑郁症自杀方面有较好的区分度,但是样本量较少,需要进一步地研究。然而,也有相反的研究结果,如Burke 等[68]发现,决策树和RF未能提高对年轻人既往或最近自杀未遂史进行分类的能力。
综上所述,机器学习为自杀行为相关的纵向临床数据提供了一个可扩展的方法,可用于自杀行为的预测及精准干预的指导。
近10年来,借助移动设备用来评估自杀风险快速变化的方法越来越流行。生态瞬时评估法(ecological momentary assessment,EMA)是在事件发生的自然情境下即时地获取被试的行为、态度、情绪或认知方面信息的研究方法,与既往研究工具不同的是,这种方法可以实时监测患者随着时间的变化[69]。在EMA中,在设备发出预定信号后,或在遇险时刻或特定想法和行为前后,会在一天中对特定项目进行多次查询。项目包括特定症状,如抑郁情绪、焦虑、自杀想法,以及躯体或社会因素,例如睡眠、躯体活动或社会交往[70-71]。因为评估是重复进行的,故能捕捉关于自杀的短暂变化,这是传统评估方法难以做到的。研究[71]显示,EMA发现一半以上的抑郁症患者报告自杀意念,但同阶段自杀意念量表评估未发现自杀意念,这也反映了回顾性临床评估的局限性。另外,EMA研究能够说明自杀危险因素之间的相互作用以及症状在一天之内甚至数小时之内波动的情况。在一项近期发生自杀行为的成年患者研究[72]中,自杀危险因素例如无望感、孤独感在一天之中波动明显,但是这些危险因素不能预测自杀意念在4~8 h内的变化。
EMA和生理学指标相结合可以捕捉更多自杀风险因素,因此可以更精确地评估自杀。一项使用体动记录仪、睡眠日记和EMA的研究[73]显示,睡眠时间短、睡眠质量差预示次日自杀意念增强。Rath等[74]采用网络分析方法发现每天10次EMA的短时间段内(30~120 min)的心理学危险因素和自杀意念存在相关性。另一项研究[62,75]使用循环神经网络模型和纵向电子病历记录以及EMA来预测自杀,结果发现,与单用电子病历记录相比其预测率提高。
数字表型是对从包括移动设备、全球卫星定位系统(global positioning system,GPS)、语音样本、互联网和社交媒体活动、键盘活动、EMA在内的各种来源提取的数据进行模式识别,是对大规模EMA数据库和实时监测资料的分析研究[76]。在一项识别自杀想法表型和近期自杀未遂表型关系的研究中,Kleiman等[77]使用潜在剖面分析方法(latent profile analysis)对受试者一个月内的EMA数据进行分析,结果发现有严重和持续存在的自杀意念的患者近期更可能出现自杀行为。另一个方向是预测自杀风险的元数据,例如评估问题的反应时间[78]。Mikus等[79]使用循环神经网络方法通过EMA数据库中的依从性和使用数据对短期情绪变化进行建模。
其他可收集的数据还包括受试者智能手机的移动情况、定位,环境光或文本信息等,通过分析该类数据反映患者自杀风险的变化[80]。一项研究[81]使用自然语言处理和深度学习的方法对基于社交媒体活动来评估自杀风险,发现长期变化效果较短期变化效果更好。Berrouiguet 等[82]结合移动健康和人工智能,利用机器学习和信号处理技术处理智能手机应用程序(MEmind) 捕获患者睡眠、食欲和自杀意念相关的EMA数据,并可根据每个患者的特点提供个性化预防策略。但Kleiman等[83]认为EMA研究数据过度拟合,提示机器学习方法可能不适用于实时监测的数据分析。
该领域需要更多的研究,并且被动收集这些信息也涉及伦理学的问题,包括隐私权、不恰当的临床使用(例如,强制性干预或证据不充分使用)、数据安全性和司法使用等。需要注意的是,当患者抑郁程度严重的时候,可能不愿意完成EMA记录,而这对于观察快速变化的风险是关键的。另外,如果在研究期间受试者没有发生自杀企图,这些记录对于受试者来说负担较重而且重复枯燥。EMA研究的依从性是需要长期关注的问题,特别是当研究持续时间超过数周的时候。近期关于自杀意念患者的EMA研究[84]表明每次评估的依从率为65%左右,研究时长、每天评估次数对于依从性都会有影响。
尽管存在局限性,EMA和实时监测的方法为研究自杀意念和行为、自杀风险以及相关症状的快速变化提供了可能,弥补了传统临床评估的不足。实时监测数据的数字表型和机器学习的方法对快速干预方法的研发有重要意义,包括疗效评估和疗效预测。未来的研究方向包括分析技术的发展,如快速识别治疗过程中的状态变化。虽然源于EMA和数字表型方法的结果可能不能像临床评估量表的结果那样可解读,但它们可能揭示潜在的自杀风险因素,这可能在未来的临床试验中作为治疗反应有价值的指标,从而推动精准精神病学的发展。
抑郁症自杀是多种因素综合作用的结果,发生机制尚不明确,尤其是自杀意念到行为的转化机制。目前研究报道的有关自杀行为的脑区广泛,缺乏特异性,可重复性差,这可能与样本量小,分析方法单一等有关。其次,自杀的机制与抑郁症的机制可能有重叠。第三,传统自杀风险评估方法,包括自我报告量表,在过去数十年的研究中取得的进展缓慢,应该通过机器学习、数字表型等技术来发展客观评估自杀风险分类的精确性。未来需要大样本、多中心纵向研究探索自杀行为的发生机制,更好地理解促发因素,例如应激暴露和危险因素如何相互作用引起自杀的可能性以及危险性,开发早期识别指标。在此基础上,结合不同发生机制,开发能够捕捉自杀风险快速变化的针对个体化、精准的新型干预方法,为建立MDD患者自杀精准干预方案提供依据及基础。
利益冲突所有作者均声明不存在利益冲突。
作者贡献声明任艳萍:提出思路,撰写文章;吴涵、王雯、金文青:检索文献,整理分析;李人:总体把关,审定论文。