社区老年性痴呆筛选诊断的人工神经网络模型

2012-08-02 08:51黄河浪袁也丰周跃平
中国老年学杂志 2012年18期
关键词:对象建模变量

唐 俊 黄河浪 吴 磊 冯 江 袁也丰 周跃平 黄 鹏

(南昌大学公共卫生学院流行病学教研室,江西 南昌 330006)

随着我国人口迅速的老龄化,老年性痴呆(AD)的发、患病问题变得非常突出,该病目前在临床上无特殊治疗方法,如何早期发现、早期诊断显得尤其重要。传统的诊断方法主要依靠某些量表,临床表现或CT、核磁共振成像技术(MRI)等,这些诊断方法多存在不足,如简易智能状态量表(MMSE)干扰因素多、依从性差、费时、对中晚期患者难以适用;CT、MRI诊断价格昂贵,尤其不适用于社区大面积人群筛查。为此,本文利用流行病学和模糊数学的原理与方法,通过测量人体血液中AD相关的某些化学元素和神经递质等特征变量,并将其作为输入层变量,拟建立简便、快速、客观、稳定且适应于社区AD筛选诊断的人工神经网络模型(ANN),以对传统方法进行补充。事实上,本课题研究中期黄鹏等〔1〕采用危险记分模型预测AD进行了前期探索,为本模型建立提供了有价值参考。

ANN是建立在现代神经科学研究成果之上的一种抽象的数学模型,它可反映人类大脑的若干基本特征,不过并非逼真地描写,只是某种简化、抽象和模拟。神经网络的连接方式各异,通常采用3层结构,即输入层、隐含层和输出层,各层的基本单元为神经元(节点),相邻层神经元之间相互连接,且各有一定的连接权。

本研究使用的ANN是反向传播算法(BP)。BP网络算法由四部分组成〔2,3〕:一是输入模式顺传播(输入模式由输入层经隐含层向输出层传播计算);二是输出误差逆传播(输出的误差由输出层经隐含层传向输入层);三是循环记忆训练(模式顺传播和误差逆传播的计算过程反复交替循环进行,网络的实际输出会逐渐向期望输出值逼近);四是学习结果判断(判定网络全局误差是否趋向于极小值或满足迭代次数)。在多组分体系中,就是通过训练集样本体系对神经网络进行训练,在这个过程中,神经网络可以自动从已知的数据或条件中总结出定量规律,并将得到的信息表达在权重中,将未知样本的测量信息(特征变量)输入计算机,经过神经网络计算,可预测某种风险或事物发生的结果。见图1。

图1 神经网络模型示意图

图中的 X={x1,x2,x3,……,xn}为网络的输入,如 x1=Fe元素测量值,x4=Al元素测量值,x14=五羟色胺(5-HT)测量值,……;y是网络的输出,如y=0为非AD,y=1为轻型AD,……;Wij系输入层与隐含层间的连接权值,Vjk系隐含层与输出层间的连接权值,θi系网络的阈值;激活函数为Sigmoid函数,表达式为

1 对象与方法

1.1 ANN特征参数的提取

1.1.1 本研究的BP网络结构 输入层由17个节点组成,即元素铁(Fe)、铜(Cu)、锌(Zn)、铝(Al)、钙(Ca)、硒(Se)、锰(Mn)、铬(Cr)、镉(Cd) 含量、Cu/Zn、Cu/Fe、Mn/Zn、Cd/Zn、5-HT、多巴胺(DA)、抗乙酰胆碱受体抗体(AchR-Ab)含量、年龄;输出层为AD分型(非AD=0,轻型=1,中型=2,重型=3);隐含层经过神经网络计算拟定为若干个节点。

1.1.2 数据预处理 由于ANN的输入层限定为0~1之间的数值型变量,在建立模型之前,对所有数据进行归一化处理,即

1.1.3 建立模型及统计学分析 拟将120名建模对象(AD患者和非患者各半)分为两组,训练集100人,用于训练网络;测试集20人,用于检测网络收敛情况。所得全部资料由双人录入,采用SPSS13.0建立数据库,利用Clementine12.0软件初步建立BP-ANN,迭代终止条件由软件自行决定,同时采用Tchaban算法进行输入变量敏感性分析。在建模过程中,为了加速网络收敛,防止网络振荡或出现局部极小,采用多层(Multiple)训练法确定网络结构,训练初期拟采用较大的学习速率以加快收敛,定α=0.9,η=0.05;训练后期减少学习速率,定α=0.9,η=0.002。

1.2 研究对象

南昌市相关社区为主要现场,吉安、宜春部分社区为补充。采用整群抽样获取6个社区≥60岁者共4 616人为研究对象,先后进行了现况调查和实施AD疑似病人量表检测,在此基础上进一步确诊。最终选择AD患者和非AD者(对照)各60例为ANN的建模对象。

1.3 判断标准 病例的确诊均由临床医生完成。AD判断标准:①采用简易智能状态量表(MMSE),结合临床病史及体征进行初筛;②在此基础上,参照国际疾病分类第10版(ICD-10)、中国精神疾病分类(CCMD-3)诊断标准,对初筛的疑似病例进行确诊;③采用Haminsk缺血评分量表排除血管性痴呆(VD)和混合性痴呆(MID);④AD患者临床分型以MMSE量表评分情况:MMSE≥21分(轻度型)、10~20分(中度型)、≤9分(重度型);⑤有可靠知情者提供研究对象相关的健康背景资料。非AD选择标准:排除心血管疾病和神经性疾病、无先天性痴呆,同一城市社区居住,并与AD患者具有可比性,且本人和家属愿意配合。

1.4 样品采集和实验室检测 对120例建模对象除人口学特征和个人疾病史等问卷外,每人均静脉采血10 ml,抗凝处理并冷藏备测。其中 Al、Cu、Zn、Fe、Ca、Mn、Cd、Cr、Se 九种元素检测用血2 ml;5-HT、DA、乙酰胆碱(Ach)、GAD 四种神经递质检测用血8 ml。元素检测标准物均由国家标准物中心提供;HNO3(化学纯)、Mg(NO3)2和Ni(NO3)2(化学纯)、去离子水;测量仪器:TAS-990型原子吸收分光光度仪、日本岛津AA-680型原子吸收分光光度仪、GFA-4B石墨原子器。相关神经递质检测采用放射免疫分析法(RIA),AchR-Ab和谷氨酸抗体(GADAb)分析试剂盒来自英国RSR有限公司;DA和5-HT分析试剂盒来自比利时Biosource Europe S.A。

2 结果

2.1 现况调查情况 本研究先后在南昌、吉安和宜春三地调查≥60岁者4 616人,收集有效问卷 4 350份,应答率为94.24%。在4 350位被查者(男性2 073人,占47.66%,女性2 277人,占52.34%)中,最终确定AD患者214例,总患病率为4.92%。

2.2 建模对象基本特征及其元素、神经递质检测值 对建模对象年龄、性别和文化程度等基本特征进行了初步分析,60例患者中轻型所占比例为13.33%,中型为55.00%,重型为31.87%,患病年龄以75~80岁组所占比例最高(23.33%),男女性别比1∶1.22,文化程度以文盲最多(36.67%),见表1。建模对象的各项宏、微元素和神经递质的检测值见表2。

2.3 模型拟合结果 按照图2所示数据流,随机抽取100例对象作为训练集,另外20例作为测试集,选择多层训练法经过多次拟合,最终确定了预测AD分型的ANN;输入层有17个节点,隐含层为4个节点(1层),输出层为4个节点。BP网络算法提示,该网络对AD分型的预测精度为75%(即正确预测的样本占总样本的75%)。将120名建模对象作为待测样本进行AD预测,结果表明,该模型正确预测非AD者53例(53/60,正确率88.33%),中型AD者26例(正确率78.79%),重型 AD者9例(正确率47.37%),而对轻型AD者预测结果欠理想;灵敏度为76.67%,特异度为88.33%,见表3。

表1 120名建模对象基本特征(n)

表2 120名建模对象输入层17个节点测量值、比值结果(±s,n=60)

表2 120名建模对象输入层17个节点测量值、比值结果(±s,n=60)

?

图2 AD分型ANN拟合数据流

2.4 输入变量敏感性分析 采用Tchaban算法,公式为Qik=,t为 t时刻,根据Clementine软件的原理,选取输入变量为 0.00、0.25、0.50、0.75、1.00的五个不同值为 t时刻;关于公式中的 xi、yk、Wij、Vjk含意与图1所述一致。在该模型中,最终算得敏感性系数排在前四位的依次为Al(0.156 3)、Cr(0.120 6)、5-HT(0.109 0)和年龄(0.101 0)。见图 3。

表3 AD分型ANN预测结果〔n(%)〕

图3 输入变量敏感性系数排序图

3 讨论

ANN是用机器模拟人脑智能活动的杰出代表,它巧妙地将生物神经网络的结构及工作方式用数学形式模拟出来,用于解决实际问题(如数据的分类、预测和聚类等),已在众多领域获得成功的应用〔5〕。对于AD的病因目前尚不明确的情况,将AD可能的危险因素作为输入层(xi),拟合ANN进行AD发患病的预测在理论上具有一定合理性。已有的实践表明,采用神经网络方法不必经过繁琐的变量特征分析过程即可直接使用;另外,ANN具有大规模的并行处理方式的优点,可以对干扰信号(错误输入)具有一定的处理能力,并且还具有强大的自组织、自学习和自适应能力,可以较好地识别输入变量与输出变量间的关系而不需要人脑的参与。毫无疑问,在AD的诊断中,ANN可以克服传统量表检测中检查者的主观影响,在一定程度上提高了其诊断效能。

值得一提的是,ANN在某些慢病或肿瘤筛查中已经取得了骄人的成绩。例如在糖尿病的早期筛查中,钱玲等〔6〕通过输入年龄、糖尿病家族史、身高、体重等6个变量建立ANN对糖尿病和糖耐量受损个体发病预测的灵敏度分别为100%、90.32%。在乳腺癌筛查中,Ayer等〔7〕收集62 219名女性乳房X光检查结果,建立的ANN模型可有效地鉴别良恶性乳腺癌,并且可以准确地预测个体乳腺癌的发病风险(AUC,0.965)。在宫颈癌的涂片筛查中,Irwig等〔8〕应用ANN为基础建立PAPNET系统,并将其与人工阅片的方式进行比较,对21 747张宫颈涂片的分析表明,两者之间差异无显著性,说明ANN建立的判别方式具有人工阅片的同等优势。Hallner等〔9〕以心理因素为输入层建立三层BP-ANN,用于慢性下腰腿疼痛(LBP)患者的早期发现具有较高的准确度,6个月后83%的患者被证实正确预测,灵敏度为73%,特异度为97%。

正是基于上述成功的研究,作者应用ANN于社区AD的发、患病判断。众所周知,AD发、患病的影响因素较多,本文结合相关文献报道和课题组以往的实践研究〔10~14〕,选择了与AD相关的化学元素和神经递质等17个变量,作为ANN建模的输入层,就选择的这些参数和应用这些参数建立ANN以预测该疾病的发生,在国内外也尚未见报道。本研究中拟合的ANN,其预测结果的精度为75.00%,灵敏度为76.67%,特异度为88.33%,换句话说,应用该模型于社区人群预测AD患病与否的精度为75.00%;这个结果可能会低于钱玲等〔6〕预测糖尿病和Ayer等〔7〕预测乳腺癌的结果;但与本课题组黄鹏等〔1〕报道的risk score预测模型(精一致率为75.9%)和Lehmann等〔15〕基于脑电图建立的ANN(灵敏度85%,特异度78%),以及da Silva Lopes〔16〕所建ANN(灵敏度为82%,特异度为61%)对AD的预测效果相似。

为了验证该模型预测的可靠性,本文假设上述120例建模对象为待测样本,利用 BP-ANN预测 AD分型,总精度为73.33%,正确判断非AD者的能力较高,达88.33%,对中型AD者的判断能力也较高,达到78.79%,这种预测结果似乎提示,在社区人群中,应用BP-ANN排除非AD、判断中型AD患者是较理想的,而对轻、重型患者预测结果理想,出现这种结果不能排除研究对象在抽样时带来的影响。

综上,该模型具有操作简便、客观、适合大规模人群筛查的特点,这将为社区老年保健、AD预防与控制发挥作用。同时,也为社区人群其他慢性病的筛查方法研究提供了借鉴或思路。但从目前的研究结果看,该模式还存在某些值得高度重视的方面:(1)不同疾病所选建模的相关参数不同,而所得预测结果也会不同,本次选择的17个参数尽管在实施研究前进行了反复的权衡和分析,但尚未涵盖AD的所有影响因素,尤其是在分子医学和遗传学等技术的应用,使AD的发、患病因素显得纷繁复杂、扑朔迷离,给建模参数的选择带来了难度;(2)本次建模样本为120例,且对AD患者进行了轻、中、重分型,造成变量和信息的分散,难免会对结果带来影响,如本研究中,轻型AD者只有8例,而重型AD者也只有19例,显然偏少。为了进一步提高预测结果的可靠性,以使模型最终达到稳定状态,加大样本进行模型的反复训练仍有必要;鉴于上述情况,课题组下一步拟将模型直接应用于社区,增加样本含量(重点增加轻、中型患者),其进行反复训练,同时对现有某些参数做必要调整或修改,以便进一步完善BP-ANN,使模型最终达到稳定状态。

1 黄 鹏,谭红专,黄河浪,等.老年性痴呆的简易预测模型〔J〕.中国老年学杂志,2010;21(30):3041-4.

2 王 旭,王 宏,王文辉.人工神经元网络原理与应用〔M〕.沈阳:东北大学出版社,2000:55.

3 冯 江,冯宇川.人工神经网络分光光度法同时测定混合色素〔J〕.卫生研究,2003;4(32):389-49.

4 薛 薇,陈欢歌.Clenmentine数据挖掘方法及应用〔M〕.北京:电子工业出版社,2010:185.

5 黎衍云,李 锐,张胜年.人工神经网络及其在疾病筛查中的应用前景〔J〕. 环境与职业医学,2006;1(23):71-3.

6 钱 玲,施侣元,程茂金.人工神经网络应用于糖尿病和糖耐量受损的个体发病预测〔J〕.中国慢性病预防与控制,2005;6(13):277-80.

7 Ayer T,Alagoz O,Chhatwal J,et al.Breast cancer risk estimation with artificial neural networks revisited:discrimination and calibration〔J〕.Cancer,2010;116(14):3310-21.

8 Irwig L,Macaskill P,Farnsworth A,et al.A randomized crossover trial of PAPNET for primary cervical screening〔J〕.J Clin Epidemiol,2004;57(1):75-81.

9 Hallner D,Hasenbring M.Classification of psychosocial risk factors(yellow flags)for the development of chronic low back and leg pain using artificial neural network〔J〕.Neurosci Lett,2004;361(1-3):151-4.

10 叶冬青.华东地区第十次流行病学学术会议论文汇编〔C〕.合肥:中华疾病控制杂志,2010:20-5.

11 鲁琴宝,黄河浪,吴 磊.阿尔茨海默病与人体铝等四种化学元素及其相关因素的病例对照研究〔J〕.疾病控制杂志,2006;10(4):327-30.

12 刘勤勤,赵雪慧,黄河浪.老年性痴呆女性患者血液中九种化学元素分布特征与其患病关系的探讨〔J〕.中华疾病控制杂志,2008;12(6):587-90.

13 闫 冀,黄河浪,吴 磊,等.城市社区老年痴呆患者全血中9种化学元素分布特征探讨〔J〕.现代预防医学,2010;14(37):2700-3.

14 马永兴,俞卓伟.现代衰老学〔M〕.北京:科学技术出版社,2008:1292-9.

15 Lehmann C,Koenig T,Jelic V,et al.Application and comparison of classification algorithms for recognition of Alzheimer′s disease in electrical brain activity(EEG)〔J〕.J Neurosci Methods,2007;161(2):342-50.

16 da Silva Lopes HF,Abe JM,Anghinah R.Application of paraconsistent Artificial neural networks as a method of aid in the diagnosis of Alzheimer disease〔J〕.J Med Syst,2010;34(6):1073-81.

猜你喜欢
对象建模变量
涉税刑事诉讼中的举证责任——以纳税人举证责任为考察对象
抓住不变量解题
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
判断电压表测量对象有妙招
也谈分离变量
基于PSS/E的风电场建模与动态分析
不对称半桥变换器的建模与仿真
攻略对象的心思好难猜
区间对象族的可镇定性分析
分离变量法:常见的通性通法