谷翔,彭明洋,陈宇辰,殷信道,陈国中,任军*
帕金森病(Parkinson's disease, PD)作为神经退行性疾病的第二常见疾病,其患病率随着年龄的增长而增加,致使患者的生活质量下降、死亡率增加[1]。因此,早期准确诊断PD并进行相应的干预至关重要。然而,PD 的临床表现具有较大的异质性,临床早期准确诊断困难。研究显示PD 的特征是黑质神经元的缺失[2]。神经成像尤其是磁敏感加权成像(susceptibility-weighted imaging, SWI)可评估黑质神经元的损失[3-5]。燕尾征消失,即在SWI上健康的黑质体消失,已被证明是诊断PD 的影像征象[6-7]。然而,由于较低的特异性和准确性及较强的主观性,使其临床应用受到限制。影像组学可从影像中提取肉眼无法识别的高通量信息,为临床决策提供准确信息[8-9]。本研究拟基于SWI 图像提取黑质影像组学特征,并应用机器学习方法,构建PD 的诊断模型,并与人工识别的燕尾征诊断PD 进行比较,旨在达到早期准确诊断PD的目的。
回顾性分析2020 年1 月至2023 年1 月在南京市第一医院接受脑部MRI(包括SWI 序列)的PD 早期患者的临床及影像资料。所有患者均符合英国帕金森病学会脑库帕金森病临床诊断标准,且Hoehn-Yahr分期为0~2 期[10]。有其他神经和精神疾病史以及继发性或非典型PD 的患者排除在外。同时招募年龄和性别匹配的健康受试者作为对照,所有健康受试者均接受相同的脑部MRI(包括SWI 序列)。本研究遵守《赫尔辛基宣言》,经南京市第一医院伦理委员会批准,批准文号:2022-664,所有患者及健康受试者均已签署知情同意书。最终共纳入80 例PD 患者和80 例健康受试者。将PD 患者和健康受试者按7∶3 的比例随机分为训练组(n=112)和测试组(n=48)。
采用西门子3.0 T MRI(Magnetom Prisma,Siemens Healthineer)扫描设备。扫描序列包括T1WI、T2WI、SWI。SWI 扫描参数如下:TR 27 ms,TE 20 ms,翻转角15°,FOV 220 mm×220 mm,层厚2 mm,层面内分辨率0.9 mm×0.9 mm×2.0 mm。
燕尾征表现为在SWI 序列上高信号结构,呈线性、逗号或楔形,两侧以低信号结构(紧密部黑质和内侧丘系)为边界[11]。由2名具有10年工作经验的神经放射学诊断医师采用双盲法对患者和受试者的SWI 评估是否存在燕尾征,双侧不存在、单侧不存在或微弱存在则认为燕尾征消失判定为PD,双侧存在则认为燕尾征阳性判定为健康受试者,评估结果存在分歧时由另一位具有20年工作经验的神经放射学诊断医师共同协定。
1.4.1 感兴趣区勾画
使用ITK-SNAP 软件(版本3.4.0,http://www.itksnap.org)逐层手动勾画SWI 两侧黑质区作为感兴趣区(volume of interests, VOIs)(图1)。由上述1 名具有10 年工作经验的神经放射学诊断医师进行VOIs的勾画,并由上述另一名具有10年工作经验的神经放射学诊断医师进行核对;(2)特征提取及筛选:使用PyRadiomics 软件(version: 3.0.1,https://pyradiomics.readthedocs.io/en/latest/)提取特征。影像组学特征包含形态学特征、一阶特征(first order)和纹理特征等共1132个特征。采用最小绝对收缩与选择算子(least absolute shrinkage and selection operator, LASSO)选取与PD 密切相关的影像组学特征。LASSO 通过构造惩罚函数得到一个较为精练的模型,压缩一些回归系数,并设定一些回归系数为零。采用10倍交叉验证对模型参数进行最优化。
图1 磁敏感加权成像黑质感兴趣区勾画示意图。1A~1B:帕金森病患者黑质感兴趣区勾画,左侧燕尾征消失(箭)(1A);1C~1D:健康受试者黑质感兴趣区勾画,双侧燕尾征存在(1C)。Fig.1 Schematic diagram of volumes of interest delineation of substantia nigra on susceptibility-weighted imaging (SWI) images.1A-1B: The volumes of interest delineation of substantia nigra on SWI images in Parkinson's disease patients, absence of the swallow tail sign in the left side (arrow) (1A).1C-1D: The volumes of interest delineation of substantia nigra on SWI images in the health controls, normal swallow tail sign on both sides (1C).
应用5 个常见的分类器[支持向量机(support vector machine, SVM)、逻辑回归(logistic regression,LR)、随 机 森 林(random forest, RF)、贝 叶 斯(Bayesian, Bayes)、K 近 邻(K-nearest neighbor,KNN)]对筛选的特征进行机器学习,构建模型。每个模型构建100 次,并计算相应的100 个曲线下面积(area under the curve, AUC)。使用以下公式计算相对标准差(relative standard deviations,RSD):
其中σAUC 表示100 个AUC 值的标准差,μAUC 是这100 个AUC 值的平均值。RSD 越小,模型越稳定。在上述过程中,选择最稳定的模型(AUC的RSD值最小的模型)作为最终模型,并在测试集中进行验证。
统计学分析均使用R 软件(4.0.3 版)。应用Kolmogorov-Smimov 检验计量资料是否符合正态分布,正态分布的计量资料以均数±标准差表示并用独立样本t检验分析;计数资料采用例(%)表示并用卡方检验分析。应用Kappa 一致性检验评估观察者间的一致性。应用pROC 软件包进行ROC 曲线分析。应用AUC、准确度、敏感度、特异度等评价指标评估模型。人工识别与机器学习模型效能间比较采用DeLong检验。P<0.05表示差异有统计学意义。
共160例研究对象纳入分析,经人工识别为PD的对象为60例(PD组),正常受试者为100例(对照组),观察者间一致性为k=0.80(95%CI: 0.76-0.83)。在训练集和测试集中,PD 组与对照组组间性别、年龄差异均无明显统计学意义(P>0.05)(表1)。ROC 曲线分析显示人工识别燕尾征诊断PD 的AUC 为0.750,敏感度和特异度分别为67.9%、82.1%(表2)。
表1 PD组和对照组的临床基线资料比较Tab.1 Comparison of basic clinical data between PD and controls group
表2 人工识别和五种机器学习方法诊断PD的效能Tab.2 Efficacy of visual analysis and five machine learning methods in diagnosing PD
SWI黑质区共提取的1132个特征经方差分析+秩和检验后剩下172 个,Spearman 相关性检验后剩下37个,最后使用LASSO降维后选择的特征数为7个,包含2个形态学特征、1个一阶特征、2个灰度共生矩阵特征(gray-level co-occurrence matrix, GLCM)、1 个灰度尺寸区域矩阵(gray-level size zone matrix,GLSZM)、1 个灰度相关矩阵(gray-level dependence matrix, GLDM)。影像组学特征的LASSO 逻辑回归、系数分布及最佳特征见图2。
图2 影像组学特征最小绝对收缩与选择算子算法(LASSO)逻辑回归、系数分布及最佳特征图。2A:LASSO模型中的调谐参数通过最小标准使用十倍交叉验证选择。绘制曲线下面积与log (λ)的关系,根据最小准则和最小准则的1标准误差,在最优值处绘制虚线;2B:在最佳λ值处绘制一条垂直线;2C:LASSO筛选后与帕金森病相关的特征及加权系数。Fig.2 Radiomics feature selection using least absolute shrinkage and selection operator (LASSO) logistic regression, LASSO coefficient profiles of the radiomics features and the optimum radiomics.2A: The tuning parameters in the LASSO model are selected using 10-fold cross-validation via minimum criteria.The area under the curve is plotted vs.log(λ).Dotted vertical lines are drawn at the optimal values according to the minimum criteria and the 1 standard error of the minimum criteria; 2B: A vertical line is plotted at the optimal λ value; 2C: The detailed features associated with Parkinson's disease and the weighting coefficients of different datasets after LASSO screening.
基于所得的最佳影像组学特征构建PD的诊断模型。五种机器学习的诊断效能见表2。在训练集中,LR 模型的诊断效能最好,AUC 为0.975,敏感度为94.4%、特异度为97.6%、准确度为95.6%。此外,用不同机器学习方法评估模型的稳定性,LR 模型最稳定(AUC的RSD为4%)。在测试集中,选择诊断效能做好、稳定性最高的LR模型作为最终的验证模型,其诊断PD的AUC 为0.938,敏感度为83.3%、特异度为95.8%、准确度为89.6%。经DeLong检验后,其诊断效能明显优于人工识别(Z=2.241,P=0.025)(表2,图3)。
图3 测试集中逻辑回归模型和人工识别诊断帕金森病的ROC曲线。Fig.3 ROC curve of test set for diagnosing Parkinson's disease using logistic regression model and visual analysis in the test set.
本研究对80 例PD 患者和80 例健康受试者的SWI 图像上黑质区域进行影像组学特征提取、筛选,共筛选出与PD 密切相关的7 个影像组学特征,包含2 个 形 态 学 特 征、1 个 一 阶 特 征、2 个GLCM、1 个GLSZM、1 个GLDM。经5 种机器学习方法建模后,结果显示LR 模型诊断PD 的效能最好且最稳定,且明显优于人工识别燕尾征的诊断效能。本研究结果可有效克服由于人工识别的主观性带来的低敏感度和低准确度。通过构建的模型可使临床医生能够通过模型快速准确地诊断PD,进而进行早期临床干预治疗。
PD 的病因目前尚不清楚,但黑质在其神经病理学中具有重要的作用,研究显示PD 中黑质多巴胺能神经元缺失[12-13]。Nigrosome-1 在SWI 上黑质的尾部显示为两个低信号,中间为高信号,在SWI 或T2WI 上显示为燕尾征[14-16]。因此,以往的研究显示[17-20],燕尾征的缺失可有助于将PD 患者与健康受试者区分开。BLAZEJEWSKA 等[21]在7 T MRI 高分辨率T2*加权序列上描述了原本低强度的黑质致密部后外侧区域内的高信号线性区域,即Nigrosome-1,而在10 名PD 患者中没有看到。SCHWARZ等[22]在3 T MRI上描述了与高分辨率T2*加权序列上的燕尾征消失类似的结构。该研究主要包括非PD 参与者,与对照组中燕尾征消失的存在相比,PD 患者中STS 缺失的敏感度(100%)、特异度(97%)和准确度(96%)非常高。COSOTTINI 等[23]的一项研究显示3 T MRI 的平均敏感度为79%,特异度为94%,诊断准确度为86%。本研究基于SWI 的燕尾征消失诊断PD,在训练集中的敏感度为67.9%、特异度为82.1%、准确度为75.0%;在测试集中的敏感度为70.8%、特异度为83.3%、准确度为77.1%,其诊断效能稍低于以往研究。可能原因为本研究纳入的PD患者均为早期患者(Hoehn-Yahr 分期为0~2 期),黑质改变不明显,导致医生通过燕尾征消失诊断PD 的准确性相对较低。由此可见,由于存在主观性强、一致性较低、诊断准确度相对较低的局限性,目前基于燕尾征消失诊断PD在临床应用中仍受限。
影像组学目前已广泛应用于医学研究中,与以往的研究类似[24-25],本研究也使用了影像组学的方法来提取并构建PD 的诊断模型。SHU 等[26]从SWI 图像上的黑质区域提取影像组学特征,可一定程度上反映PD的Hoehn-Yahr分期。本研究通过从SWI图像上勾画黑质区域并提取特征进行筛选,发现2个形态学特征、1 个一阶特征、2 个GLCM、1 个GLSZM、1 个GLDM与PD 诊断密切相关,具有较高的加权系数。本研究进一步应用5 种分类器方法构建PD 的诊断模型。不同的分类器模型在PD 的诊断中具有不同的效能,本研究显示LR 模型的诊断效能优于其他分类器方法。二进制的LR是一种基于一个或多个自变量估计二进制响应概率的传统方法,提供的不是离散输出,而是与每个观测相关的概率[27-29]。此外,本研究发现LR模型是所有诊断模型中最稳定的。因此,本研究选择LR 作为最终分类器,并用测试集进行验证。结果显示LR 模型在测试集中仍然具有较好的诊断效能,并明显优于人工识别燕尾征消失诊断PD的效能。由此可见,与传统的人工识别相比,基于LR分类器构建的PD 诊断模型临床适用性,且避免了人工识别主观性强、诊断准确度低的局限性。
本研究仍存在一些不足之处。首先,本研究为单中心研究,且样本量较少。其次,本研究仅根据影像方法进行诊断,未纳入临床量表。此外,本研究仅提取了SWI图像上的影像组学特征,后期需进一步加入T1WI、T2WI等其他序列的特征,以期进一步提高PD的诊断效能。最后,本研究未做外部验证。
综上所述,基于SWI 黑质的影像组学特征,应用机器学习方法构建的PD诊断模型能够较为准确地诊断PD,为临床早期干预治疗提供指导。
作者利益冲突声明:全体作者均声明无利益冲突。
作者贡献声明:任军设计本研究的方案,对稿件重要内容进行了修改;谷翔起草和撰写稿件,获取、分析或解释本研究的数据;彭明洋、陈宇辰、殷信道、陈国中获取、分析或解释本研究的数据,对稿件重要内容进行了修改,其中殷信道获得了江苏省自然科学基金的资助;陈国中获得了国家自然科学基金的资助;全体作者都同意发表最后的修改稿,同意对本研究的所有方面负责,确保本研究的准确性和诚信。