刘王亚, 郁磊, 任璐, 赵娅蓉, 李阳, 靳祯
(1.山西大学 复杂系统研究所,山西 太原 030006;2.山西大学 疾病防控的数学技术与大数据分析山西省重点实验室,山西 太原 030006;3.山西医科大学 第一临床医学院,山西 太原 030001;4.山西医科大学 第一医院,山西 太原 030001)
阿尔茨海默病(Alzheimer′s disease,AD)[1]是一种起病隐匿且病程缓慢的中枢神经系统退行性疾病,多发于65岁以上的老年人.据专家估计,到2030年全球的发病人数将达到十亿人[2].由于AD的早期症状比较隐匿,个人很难察觉,一般确诊后就已达到错过最佳干预期的中后期,所以要做到早期发现早期预防.AD患者早期可能会出现不同程度的障碍,譬如计算能力障碍、记忆能力障碍、结构能力障碍和言语能力障碍等[3],很多研究发现在AD早期甚至是在轻度认知障碍(mild cognitive impairment,MCI)[4]阶段患者就会出现结构能力障碍,这使得应用结构能力评测辅助诊断AD成为可能[5].
目前临床上对AD的筛查主要依靠由Folstein等[6]制定的简明精神状态量表(Mini Mental Status Examination,MMSE)[7],采取医生提问患者回答的方式,这样在很大程度上会受到双方情绪的影响,且需花费较长的时间.为了能在患病初期发现AD患者,本文设想将社区的老年人定期于社区集中,利用MMSE的结构能力部分进行初步筛查[8].然而当人数过多时,可能出现社区医护人员人手不够的问题,同时MMSE又要求评测医生具备丰富的经验,这使得社区一般工作人员无法对患者所作图形进行评测.为了解决上述问题,本文基于随机森林(Random Forest,RF)[9]建立了AD患者结构能力智能评测模型,并对模型的泛化性进行了讨论和分析.
图1 MMSE结构能力测试
表1列出了实验招募的109名AD确诊患者的基本资料,所有AD患者均来自山西医科大学第一医院,符合《阿尔茨海默病诊治指南》中的诊断标准[10].参与本次实验的所有AD患者均签署了知情同意书.
表1 AD确诊者的基本资料
部分AD患者的五边形复制结果如图2所示,其中前6个(第一行4个及第二行前2个)为得分为1的评测结果,后6个(第二行后2个及第三行)为得分为0的评测结果.从图中可以直观地看出,存在不同程度结构能力障碍的AD患者的五边形复制结果存在较大差异,即便是相同得分(均为0分或1分)的两名AD患者的五边形复制结果在图形的大小、五边形和四边形的角度及边长等方面亦存在较大差异.
图2 部分AD患者的五边形复制结果
从图2可以看出,当五边形及四边形的所有边长和所有角度都确定时,五边形复制结果也随之确定,因此实验提取了五边形复制结果的形态学特征,具体包括:两个五边形和四边形是否有效、两个五边形各自的长度、角度和交织形成的四边形的长度、角度等特征.在提取特征时规定采取分段近似的方式得到有波折部分的长度,两个端点未连接处的角度采用延长法,所有的边长与角度采用逆时针方向依次获得,边长或角度不存在时记此项特征为0,所得特征均经过归一化处理.
采用随机森林方法建立AD患者结构能力智能评测模型,算法的详细流程如图3所示.首先,利用Bootstrap随机抽样[11]从训练集中随机产生若干个样本子集;其次,针对每个样本子集建立决策树二分类(0分和1分)子模型;接着,采用投票的方法对各个决策树子模型进行集成汇总,从而建立随机森林模型;最后,将建立的随机森林模型应用于数据集样本的分类预测.
图3 算法的整体流程
从所有的实验对象(109名)中随机抽取92名(85%)作为训练集,剩余的17名(15%)作为测试集.随机森林中包含的决策树棵数为500.
表2列出了分别使用长度特征、角度特征、长度和角度特征作为输入时的模型泛化性能.从表中可以直观地看出,当同时提取五边形复制结果的长度和角度特征时,AD患者结构能力智能评测模型的泛化性能达到最佳,准确率可以达到97%以上.
表2 三种情况下的准确率的统计学意义
从表2可以看出,尽管模型的准确率达到97%以上,但仍然会存在一些识别错误.经过深入分析,总结出错误的情况大致包括如下两类:
(1)针对如图4所示的AD患者五边形复制结果,模型给出的预测值为0分,但评测医生给出的评测值为1分.根据评判规则,两个五边形必须交织构成一个四边形才可以得1分.尽管图中的每个五边形都相对标准,但交织部分右侧五边形的边与左侧五边形的顶点“重合”,导致四边形变为三角形.
图4 模型与评测医生结果相悖的情况1
(2)针对如图5所示的AD患者五边形复制结果,模型给出的预测值为1分,但评测医生给出的评测值为0分.由于规定在人工提取五边形和四边形的角度和边长特征时,忽略抖动的影响,导致忽略了右侧五边形的不规范问题.但实际上,评测医生在评测时认为右侧的图像是一个六边形,不是标准的五边形,因此判定为0分.
综上所述,尽管本文建立的AD患者结构能力智能评测模型准确率达到97%,但仍然有许多值得改进和深入研究的地方:
图5 模型与评测医生结果相悖的情况2
(1)特征提取均由人工提取,在一定程度上仍然存在主观性,在接下来的研究中将考虑采用深度学习方法建立无须人工提取特征的端到端(end-to-end)评测模型.
(2)为了精细刻画AD患者的结构能力,在接下来的研究中将考虑建立定量评测模型,构建连续打分体系,譬如:将AD患者的结构能力映射到0~100分范围,将定性评测方式推广至定量评测方式,弥补“天花板效应”和“地板效应”.
为了更早地发现AD,基于患者的MMSE结构能力测试结果,采用随机森林建立了AD患者结构能力智能评估模型,并利用109名AD患者对模型进行实验验证.实验结果表明,当同时提取五边形复制结果中五边形和交织形成的四边形的角度和长度特征时,评测模型准确率最高,达到97%以上,证实了所提出方法的可行性.研究结果为实现远程场景下无临床医生参与时的AD患者结构能力智能评测奠定了基础.