陈熊鹰,朱 桦,吴 航,程 健,周晶晶,冯 媛,刘 瑞,王 赟,张志芳,丰 雷,周 媛,王 刚*
(1.首都医科大学附属北京安定医院,国家精神心理疾病临床医学研究中心&精神疾病诊断与治疗北京市重点实验室,北京 100088;2.北京航空航天大学生物与医学工程学院,北京 100191;3.北京大数据精准医疗高精尖创新中心,北京 100191;4.中国科学院心理研究所,北京 100101;5.中国科学院大学心理学系,北京 100049 *通信作者:王 刚,E-mail:gangwangdoc@ccmu.edu.cn)
抑郁症是一种以脑组织连接紊乱为特征的精神疾病,其病因复杂且临床表现异质性高,给诊断和治疗带来了巨大的挑战[1]。然而,现有的基于临床诊断的群体水平组间差异研究忽略了个体之间的生物学异质性[2-3]。神经影像技术为研究抑郁症的生物学异质性提供了新视角[4-5]。弥散张量成像(diffusion tensor imaging,DTI)技术和各向异性分数(fractional anisotropy,FA)已广泛应用于大脑白质研究,FA指标的变化可反映白质纤维束的生理特征受损情况[6-7]。现阶段关于抑郁症患者脑白质研究的结论并不一致。有研究表明,抑郁症患者在多个脑区中存在FA 值普遍降低[8],也有研究未发现患者与健康对照组之间的差异[9]。这些研究结果的差异可能涉及多方面原因[10],包括技术、样本和方法学等,生物学异质性也是其重要的影响因素之一[11-12]。
随着神经科学和生物学等领域的不断发展以及计算能力的提升,越来越多的研究开始关注并应用基于个体生物特征的亚型分析方法。生物学亚型分析是一种根据个体神经生物特征的相似性和差异性对人群进行亚型划分的新方法。在抑郁症的研究中,基于功能磁共振成像的亚型分析已经取得了一些进展[13-14]。例如,有研究使用静息态功能连接将抑郁症划分为四个亚型,这些亚型的患者在临床症状和对经颅磁刺激的治疗反应方面均存在差异[15]。另有研究聚焦于默认网络,也发现了具有不同功能连接模式的抑郁症亚型[16]。这些研究表明,个体的神经生物学信息可以为临床提供更多有价值的启示。相比于功能研究,目前基于结构磁共振的抑郁症亚型探索还相对有限。因此,本研究利用DTI 和半监督学习方法划分抑郁症亚型,以期从生物学亚型的角度为抑郁症的精准诊疗提供参考。
纳入2017 年9 月-2021 年8 月于北京安定医院就诊的抑郁症患者为研究对象。入组标准:①年龄18~65 岁,性别不限,汉族,右利手;②小学以上受教育程度,能够理解量表内容;③符合《精神障碍诊断与统计手册(第4 版)》(Diagnostic and Statistical Manual of Mental Disorders,fourth edition,DSM-IV)抑郁症诊断标准;④本次发作未接受抗抑郁药系统治疗或近14 天累计使用抗抑郁药治疗不超过7 天;⑤汉密尔顿抑郁量表17 项版(Hamilton Depression Scale-17 item,HAMD-17)总评分≥14分;⑥体内无金属植入物或电子设备等核磁扫描禁忌。排除标准:①既往有明确躁狂或轻躁狂发作;②既往或目前符合其他精神障碍诊断标准,如双相情感障碍、精神分裂症、分裂情感性精神障碍等;③有酒精或药物滥用史、急性中毒史的患者;④目前存在严重自杀风险(HAMD-17自杀风险条目评分≥3分)的患者;⑤患有严重的躯体疾病;⑥妊娠期或哺乳期女性。符合入组标准且不符合排除标准的抑郁症患者共127例。
表1 患者组与健康对照组基本资料Table 1 Demographic and clinical information between the patient group and the healthy control group
同期在医院附近社区通过广告招募与患者性别和年龄相匹配的健康人群作为对照组。入组标准:①年龄18~65 岁,性别不限,汉族,右利手;②小学以上受教育程度,能理解量表内容;③体内无金属植入物或电子设备等核磁扫描禁忌。排除标准:①既往或目前符合DSM-IV任何精神障碍诊断标准;②有精神疾病家属史;③有酒精或药物滥用史、急性中毒史;④患有严重的躯体疾病;⑤妊娠或哺乳期妇女。符合入组标准且不符合排除标准共80 例。本研究通过北京安定医院人类研究与伦理委员会批准[伦理审批号:(2017)科研第(24)号]。所有受试者均签署知情同意书。
采用自编调查表收集受试者的基本资料,包括年龄、性别、受教育年限和病程。
HAMD-17为他评量表,共17个条目,其中大部分条目采用0~4 分5 级评分,少量条目采用0~2 分3 级评分,总评分越高表明抑郁症状越严重。该量表中文版Cronbach’s α系数>0.70[17]。
16 项抑郁症状快速自评量表(16-item Quick Inventory of Depressive Symptoms Self-Report Scale,QIDS-SR16)为自评量表,共16 个条目,采用0~3 分4 级评分,总评分越高表明抑郁症状越严重。该量表中文版Cronbach’s α系数约为0.80[18]。
患者健康问卷抑郁量表(Patient Health Questionnaire-9,PHQ-9)为自评量表,共9 个条目,采用0~3 分4 级评分,总评分越高表明抑郁症状越严重。该量表中文版Cronbach’s α系数>0.80[17,19]。
由通过量表一致性培训和考核的专业精神科医师使用简明国际神经精神访谈中文版(Mini-International Neuropsychiatric Interview,MINI 5.0.0)对就诊者做出诊断,诊断明确后入组。为避免环境干扰,所有评估均在测评室内完成。患者在入组时和抗抑郁药物治疗12 周后完成HAMD-17、QIDS-SR16 和PHQ-9 评定。健康对照组在入组时完成QIDS-SR16 和PHQ-9 评定。受试者在理解主试指导语后自行完成QIDS-SR16 和PHQ-9 评定。量表评定耗时20~40 min。
磁共振数据在北京安定医院影像科完成采集,使用德国西门子3.0 T Prisma 磁共振仪采集T1结构像和弥散加权图像(diffusion weighted imaging,DWI)。T1结构像:使用3D梯度回波成像(Three-dimensional magnetization-prepared rapid gradient-echo imaging,3D-MPRAGE)序列进行矢状位扫描。TR(重复时间)=2 530 ms,TE(回波时间)=1.85 ms,层数=192层,层厚=1 mm,FOV(视野)=256 mm×256 mm,矩阵=256×256,翻转角=9°。
DWI 图像:采用单次回波平面成像(echo planar imaging,EPI)序列进行轴位扫描。TR(重复时间)=9 200 ms,TE(回波时间)=78 ms,层数75 层,层厚2 mm,无间隔,FOV(视野)=224 mm×224 mm,翻转角=90°;2次重复扫描,30个b=1 000 s/mm2的弥散加权方向的图像,6个b=0 s/mm2的无弥散加权方向的图像。
采用FMRIB Software Library(FSL v6.0.5.1)软件(http://fsl.fmrib.ox.ac.uk/fsl/fslwiki/)对DWI 数据进行处理。预处理包括:去除非脑组织、头动和涡流矫正、FA 指标计算。将所有受试者的FA 图像非线性配准到FMRIB58_FA 标准空间,得到平均FA图像,使用纤维束追踪空间统计(Tract-based spatial statistics,TBSS)方法以0.2 为阈值对其骨架化。然后,将所有受试者的FA 图像投射到该骨架上,生成每个受试者的FA 图像骨架。完成上述步骤后,根据约翰霍普金斯大学(Johns Hopkins University,JHU)脑白质概率图谱[20]提取48 个纤维束标签的FA平均值,并进行Z分数标准化。采用回归分析,将排除性别、年龄、受教育年限影响后的FA值作为下一步生物学亚型分析的特征。
采用半监督学习算法-HYDRA(Heterogeneity through discriminative analysis)划分亚型[21]。该方法基于患者组与健康对照组整体指标的差异,将患者组划分为不同数量的同质亚组。在本研究中,依据患者组和健康对照组在48条纤维束上FA 值形成的数据分布差异性,将表现出相似差异性的患者聚类为同质的亚型。预先假定存在2~5 种亚型,通过十折交叉验证计算调整兰德系数(Adjusted Rand index,ARI),将ARI 作为衡量划分不同数量亚型的稳定性指标。具体做法:每次选择90%的样本进行聚类,计算十次不同的样本选择方式中各样本是否被连续划分到某一个亚型。选择ARI最高的亚型数量作为划分结果。按照Kaczkurkin 等[22]使用的方式进行置换检验,以评估划分亚型的泛化性能。将健康对照组的50%作为伪病人,剩下50%仍作为健康对照组,通过上述流程计算ARI构建零分布,同时将抑郁症患者的50%作为患者组,与50%的健康对照组构建ARI的实际分布,比较实际分布与零分布的差异,差异越大则认为模型的泛化性能越好。参照与本研究样本量相近的研究,本研究选择进行100 次置换检验[14]。
使用R 4.1.3 进行统计分析。符合正态分布的计量资料以(±s)表示,两组比较采用独立样本t 检验,三组比较采用单因素方差分析;不符合正态分布的数据以[M(Q1~Q3)]表示,组间比较采用Mann-Whitney U检验。计数资料以[n(%)]表示,使用χ2检验进行组间比较。P<0.05认为差异有统计学意义。
对于全脑纤维束的FA 值,首先使用独立样本t检验比较健康对照组与患者组之间的差异并进行FDR 校正。再基于亚型分析结果,通过方差分析比较健康对照组与不同亚型患者组的差异并进行FDR 校正。对存在差异的纤维束进行事后检验并通过Turkey 检验进行校正,统计显著性水平设定为校正后P<0.01。
使用线性混合效应模型评估不同亚型患者组的疗效,将HAMD-17 总评分作为因变量,性别、年龄和受教育年限作为协变量,分析组别(亚型Ⅰ、亚型Ⅱ)和时间(基线和治疗12周后)的主效应和交互效应,将受试者作为随机截距加入模型。
基线时,患者组与健康对照组的受教育年限、PHQ-9 总评分以及QIDS-SR16 总评分差异均有统计学意义(P均<0.05),年龄和性别差异均无统计学意义(P均>0.05)。见表1。
将抑郁症患者划分为2、3、4、5 种亚型时,ARI分别为0.64、0.51、0.44、0.36。当划分为两种亚型时,ARI最大,且置换检验后与零分布差异有统计学意义(P<0.05)。故将患者划分为两种亚型:亚型I(n=76)和亚型II(n=51)。
亚型I 患者组和亚型II 患者组的年龄、性别、受教育年限、PHQ-9 总评分、QIDS-SR16 总评分、HAMD-17 总评分以及病程,差异均无统计学意义(P均>0.05)。对不同亚型患者组HAMD-17总评分进行分析,存在时间主效应(F=12.930,P<0.01)以及组别和时间的交互效应(F=4.288,P<0.05)。事后检验显示,两种亚型的患者HAMD-17 总评分在治疗后均降低(P<0.05),治疗12 周后,亚型Ⅰ患者组HAMD-17 总评分低于亚型Ⅱ患者组(t=2.410,P<0.05)。见表2。
表2 不同亚型的抑郁症患者基本资料比较Table 2 Comparison of demographic and clinical information among different subtypes of patients
患者组共有11 条纤维束的FA 值低于健康对照组(P<0.01,FDR 校正),包括双侧内囊豆状核后部、双侧前放射冠、左侧上放射冠、双侧后放射冠、双侧丘脑后放射冠、右侧上纵束以及右侧上额枕束。见图1A。
图1 患者组及各亚型组与健康对照组纤维束FA值比较Figure 1 Comparison of FA values among the patient group,subtypes,and the healthy control group
对不同亚型的患者组和健康对照组进行方差分析,结果显示,三组除穹窿、左侧内侧丘系、左侧钩束、左侧胼胝体神经毡外的44 条纤维束FA 值的差异均有统计学意义(P<0.01,FDR校正)。
事后检验显示,亚型I 患者组共有35 条纤维束的FA 值低于健康对照组(P<0.01,FDR 校正),包括小脑中脚、胼胝体膝部、体部、压部、右侧皮质脊髓束、右侧小脑下脚、双侧大脑脚、双侧内囊前肢、双侧内囊后肢、双侧内囊豆状核后部、双侧前放射冠、双侧上放射冠、双侧后放射冠、双侧丘脑后放射冠、双侧下纵束及下额枕束、双侧外囊、双侧扣带回、左侧海马、双侧终纹、双侧上纵束、双侧上额枕束、右侧钩束。见图1B。
亚型II 患者组共有3 条纤维束的FA 值高于健康对照组(P<0.01,FDR 校正),包括小脑中脚、左侧小脑上脚和左侧大脑脚。见图1C。
对两种亚型的患者进行比较,除穹窿、左侧内侧丘系、双侧钩束外和左侧胼胝体神经毡之外,亚型II 患者组其他43 条纤维束FA 值均高于亚型I患者组(P<0.01,FDR校正)。见图1D。
本研究结合DTI 技术和机器学习方法,将抑郁症患者划分为两种具有不同白质损伤模式的生物学亚型。其中,亚型I 表现为广泛脑区的纤维束FA值降低,亚型II 表现为少数脑区的纤维束FA 值升高。尽管两种亚型患者组人口学资料和基线期抑郁症状严重程度差异无统计学意义,但二者对急性期抗抑郁药物治疗的应答程度有所不同。
抑郁症脑影像学研究结果的可重复性受众多因素的影响,如不同的研究设计、样本量差异以及临床异质性等[23-25]。亚型分析有助于发现相同临床诊断标签下的不同生物学病理机制。本研究将抑郁症患者与健康对照组进行比较,结果显示,在内囊、上额枕束、放射冠等一系列纤维束上,抑郁症患者的FA 值更低,与既往部分研究的结论一致[8,26]。van Velzen 等[6]对ENIGMA 的公开数据进行分析,结果表明,成年抑郁症患者存在大面积的纤维束FA值降低。但也有研究报道了不同的、甚至相反的结果[27-28]。本研究将患者划分为两个亚型,亚型I患者组以在更为广泛的脑区中表现出纤维束FA 值降低为特征,这与ENIGMA 大样本研究结果的相似性更高,提示该亚型的抑郁症患者可能存在更严重的纤维束损伤和结构异常,推测可能与早期神经发育障碍、遗传因素、慢性炎症等机制相关。同时,这些受损部位与其他严重精神障碍(精神分裂症、双相情感障碍等)患者的白质损伤模式存在重合,如都存在扣带回、前放射冠、胼胝体体部和穹窿等部位的FA 值降低[9],提示这些受损脑区可能与更复杂的症状以及疾病的慢性迁延有关。而亚型II患者组大部分纤维束的FA 值相比于健康对照组没有改变,甚至少数纤维束的FA值更高,提示亚型II可能不具有以白质损伤为核心的生物学特征。
既往研究显示,不同生物学基础的抑郁症患者在临床症状、治疗反应等方面存在巨大差异[29]。本研究中,两种亚型的抑郁症患者也表现出不同程度的治疗应答。虽然不同亚型的患者组基线期抑郁症状严重程度差异无统计学意义,但推测可能在认知功能等其他维度上存在表型差异。Liang 等[30]的一项结构磁共振研究将抑郁症划分为三种亚型,虽然不同亚型患者的临床症状差异均无统计学意义,但在注意和记忆等认知维度上,患者表现出不同的认知缺陷模式,这提示在研究中开展多维度表型测量的重要性。一些研究显示,基线期右侧上纵束、右侧皮质脊髓束以及扣带回的FA 值越大,抗抑郁药物的疗效更好[31-32],终纹的FA 值与疗效呈负相关[31],本研究结果与之不一致,本研究认为,研究生物表现更同质的亚型患者组能够更好地反映治疗与生物标志物之间的真实关联。后续研究可以利用公共数据对此加以验证。此外,还有研究表明,未服用抗抑郁药物的患者其扣带回、右侧下纵束及下额枕束、外囊和穹隆的FA 值低于健康对照组,而服用SSRIs类药物的患者未观察到这种差异[6],基于这些结果,推测抗抑郁药物的疗效可能与修复抑郁症患者的白质损伤有关。在本研究中,亚型I 患者组表现出更好的治疗反应,可能是因为在接受抗抑郁药物治疗后,其受损的白质纤维得到了一定程度的修复,从而改善了临床症状,但这些推测同样还需要后续研究的验证。
综上所述,本研究为解析抑郁症这一复杂疾病的生物学异质性提供了新的证据,为临床的精准治疗提供了新的方向,未来的治疗策略可以考虑针对不同亚型采取个体化的干预措施。本研究局限性:①纳入的部分患者曾经服用过抗抑郁药物,但由于样本量的限制本研究未加以严格区分,后续研究应将药物因素纳入考量;②本研究只采用了FA 指标,未来可以融合多模态指标深度挖掘抑郁症的生物异质性;③亚型分析的稳定性和泛化性还有待在大样本研究中进行独立验证。