基于机器学习算法的社区老年衰弱前期风险预测模型构建

2022-09-08 03:40李彩福赵伟叶秀春赵东丽邹继华董海娜周英许丽娟
护理学杂志 2022年15期
关键词:危险建模神经网络

李彩福,赵伟,叶秀春,赵东丽,邹继华,董海娜,周英,许丽娟

截至2020年底,我国60岁以上老年人口已达2.64亿,占总人口的18.7%[1]。研究显示,老年衰弱发生率为5.6%~11.1%,衰弱前期为37.7%~69.1%[2-4]。衰弱前期是指老年人机体生理功能进行性下降,为健康与衰弱之间的过渡阶段[5],衰弱前期老年人尚存在自理能力,对损伤、疾病或外界压力能作出适当反应,向健康逆转率为23.3%[6]。衰弱前期筛查和识别是衰弱防治干预的关键,可有效阻止老年衰弱发生发展,减轻社会和家庭医疗经济负担。据报道,年龄、性别、BMI、独居、文化程度、并存多病、跌倒史、抑郁、认知功能下降等是老年衰弱前期危险因素[7-9],但尚无衰弱前期风险预测模型构建相关研究。机器学习算法是利用计算机自身性能改善系统的行为,从数据中分析挖掘获得规律,并对数据进行预测,其中反向传播(Back Propagation,BP)神经网络在疾病危险因素、预测研究领域中较常用,其分析对变量分布、类型无要求,善于处理非线性数据[10],对数据拟合情况优于logistic回归模型[11-12]。鉴此,本研究基于机器学习算法构建衰弱前期风险预测模型,同时对其预测效能进行时间跨度验证,旨在为社区老年衰弱前期高危人群早期筛查提供参考。

1 对象与方法

1.1对象 应用病例对照研究设计,通过便利抽样选取2019年6~9月在丽水市莲都区4个社区卫生服务中心进行健康体检的665名老年人,采用Morley等[13]改良的FRAIL量表从中筛选无衰弱(283名)和衰弱前期(259名)老年人共542名作为建模组;2021年6~7月在丽水市2个社区卫生服务中心使用改良FRAIL量表[13]筛选无衰弱(106名)和衰弱前期(99名)老年人205名作为验证组。建模组和验证组纳入标准:①FRAIL量表评分0~2分;②年龄≥60岁;③在社区居住≥2年;④意识清醒,沟通无障碍;⑤自愿参与,并签署知情同意书。排除标准:画钟试验[14]筛查严重认知功能障碍者或存在严重躯体疾病者。本研究经丽水学院医学院伦理审查委员会同意批准。基于预测模型构建要求,研究对象中发生事件(衰弱前期老年人)人数应为预测指标的10倍以上[15],本研究18个候选危险因素,至少应纳入180名衰弱前期老年人;根据社区老年衰弱前期发生率的低限估计值37.7%[3],即180÷37.7%=478,按照10%的失访率计算,至少需要调查社区老年人526名。

1.2方法

1.2.1研究工具 ①一般情况问卷。包括年龄、BMI、性别、文化程度、婚姻状况、居住方式、人均月收入、吸烟和饮酒状况、运动量、住院史、跌倒史、多病共存、多重用药及睡眠状况。②日常生活活动量表(Activity of Daily Living scale,ADL)[16]。用于测量老年人的日常生活活动能力状况,共14个条目,采用4级评分法,“1”表示完全可以完成,“4”表示根本无法完成,总分14~56分,分值越高提示日常生活活动能力越差,总分>22分提示日常生活活动能力下降。③简版老年抑郁量表(Geriatric Depression Scale,GDS-15)[17]。用于评估老年抑郁症状,共15个条目,采用二分类计分,“0”代表否,“1”代表是,总分5分以上表示有抑郁倾向,得分越高表示抑郁症状越严重[18]。④画钟试验。认知功能通过画钟试验测量,试验中图形、数字、指针均正确,提示认知功能正常;1~2项错误,提示认知功能下降;若3项都错误,提示严重认知功能障碍[14],则被排除。⑤FRAIL量表。采用Morley等[14]改良的FRAIL量表,用于衰弱前期和无衰弱老年人群的筛查,包括5个条目。采用二分类计分,“0”代表否,“1”代表是,总分为0提示无衰弱,1~2分为衰弱前期,≥3分为衰弱期,则被排除。FRAIL量表能较好地预测老年人群的病死率和失能状态[19]。

1.2.2资料收集方法 资料收集前,统一对4名调查员进行老年衰弱前期诊断标准及危险因素培训,当面完成问卷调查及身高、体质量测量。

1.2.3统计学方法 应用SPSS21.0软件进行统计分析,数据中的缺失值,通过多重插补法(重复模拟5次)处理。基于Python平台进行预测模型构建(训练)和验证。①对建模组通过单因素回归分析筛选社区老年衰弱前期危险因素,按照8∶2将数据集随机划分为训练集和测试集,通过BP神经网络的选择梯度下降法优化模型,选出7层隐藏层,输入变量进行重要性分析,列出模型中衰弱前期各危险因素排序;多因素logistics回归分析采用Backward方法进行危险因素筛选,构建logistic回归预测模型。计算ROC曲线下面积AUC、灵敏度和特异度[20]。②以验证组为研究对象,进行预测模型效能外部验证。

2 结果

2.1建模组和验证组一般资料比较 见表1。

表1 建模组和验证组一般资料比较

2.2衰弱前期危险因素筛选 在建模组中,将18个候选危险因素作为自变量,以是否衰弱前期(无衰弱=0,衰弱前期=1)为因变量进行单因素logistic回归分析,分析结果见表2。

2.3衰弱前期预测模型构建 以表2中有统计学意义的10个变量为自变量,是否衰弱前期为因变量,进行多因素logistic回归分析,并构建logistic回归预测模型为:logistic(P)=-5.101+0.042X1+0.646X2+0.847X3+0.879X4+1.362X5+1.302X6+0.573X7+0.750X8+0.862X9+0.687X10,计算社区老年人发生衰弱前期的风险为:P×100=1/{1+exp[-(-5.101+0.042X1+0.646X2+0.847X3+0.879X4+1.362X5+1.302X6+0.573X7+0.750X8+0.862X9+0.687X10)]}。与此同时,单因素logistic回归分析中有统计学意义的10个变量作为输入层,“是否衰弱前期”作为输出层,中间设置n个隐藏层,采用反向传播算法的多层感知器构建BP神经网络模型。BP神经网络模型的隐藏层激活函数采用双曲正切函数,输出层激活函数采用Softmax函数,选择梯度下降法优化模型,选出7个隐藏层,统计结果显示衰弱前期影响较大的危险因素排序如下:年龄(100%)、跌倒史(82.1%)、运动量低(65.1%)、多病共存(64.9%)、住院史(62.7%)、抑郁倾向(58.2%)、认知功能下降(53.1%)、文化程度(48.6%)、日常生活功能下降(40.2%)、多重用药(31.4%) 。

表2 社区老年衰弱前期危险因素单因素logistic回归分析(n=542)

2.4衰弱前期预测模型验证 采用验证组数据对模型的预测效能进行评价,BP神经网络模型及logistic回归模型预测效能评价指标见表3。

表3 衰弱前期预测模型预测效能评价指标

3 讨论

3.1社区老年衰弱前期危险因素预测模型 本研究采用机器学习算法进行衰弱前期危险因素模型构建与验证,结果显示,BP神经网络模型AUC、灵敏度和特异度均高于logistic回归模型,对数据的拟合情况更好。老年衰弱前期危险因素众多,作用方式复杂,利用传统回归分析函数进行预测,无法处理多种因素间的非线性问题,存在一定局限性,BP神经网络对数据没有要求,在非线性拟合方面体现较大自由性和灵活性,适用于多种危险因素预测模型的构建[10]。与logistic回归模型相比,BP神经网络在模型预测准确性上存在优势,可自动处理非线性问题,可作为疾病风险预测建模的首选方法。本研究显示,基于BP神经网络构建的风险预测模型,可对社区老年衰弱前期高危因素进行识别,按照危险因素重要性排序分别为年龄、跌倒史、运动量低、多病共存、住院史、抑郁倾向、认知功能下降、文化程度低、日常生活能力下降及多重用药。同时,建模组与验证组性别、年龄BMI、文化程度、日常生活能力有差异,说明该预测模型应用性更广。

3.2社区老年衰弱前期危险因素

3.2.1年龄 BP神经网络分析结果显示,年龄是社区老年衰弱前期的最大危险因素,年龄越大发生衰弱前期风险越高,与以往研究一致[2-3,21]。随着年龄增长,身体器官不断发生退行性变化,机体生理功能进行性下降,即出现衰弱前期症状。研究显示,年龄70~80岁是社区老年人衰弱前期发生率最高人群,发生率高达62.5%[4,7]。衰弱前期是健康与衰弱之间过渡阶段,衰弱前期向衰弱转化率高达37.1%[22],因此,社区工作人员应定期对居家高龄老年人进行衰弱评估,及时筛查衰弱前期老年人,并进行干预,防治老年衰弱发生。

3.2.2多病共存 本研究结果显示,合并两种及以上疾病是社区老年衰弱前期的主要危险因素之一。Wu等[7]对5 301名社区老年人进行调查,结果发现与无慢性疾病或只有一种慢性疾病相比,合并两种及以上疾病老年人衰弱前期发生率较高,与本研究结果一致。当老年人患有多种疾病时,多器官功能衰退,机体平衡发生紊乱,对抗外界压力的能力会变弱。可见,社区卫生工作人员应密切关注患有多种慢性疾病的老年人,积极治疗并控制老年人慢性疾病,预防社区老年人衰弱前期发生发展。

3.2.3既往跌倒史和住院史 本研究发现,跌倒史和住院史是老年衰弱前期的危险因素。陈晓飞等[23]通过对1 400名老年人横断面调查,进行单因素分析显示,过去一年有跌倒史和住院史的老年人衰弱前期发生率较高。社区工作人员应加强老年人跌倒及住院状况的评估,高度重视有跌倒史和住院史的老年人。

3.2.4运动量低 研究发现,运动量<30 min/d的老年人群发生衰弱前期的风险较高。Rogers等[24]采用纵向队列研究设计,对8 649名无衰弱中老年人进行5年随访,发现与久坐或低强度运动组相比,中等强度及以上运动组衰弱前期发生率偏低。较低的运动量或久坐的生活方式能增加老年衰弱的风险,每天增加30 min的中、高强度运动能降低社区老年人发生衰弱的风险[25]。运动能有效预防老年衰弱前期的发生,为今后运动干预预防老年衰弱发生和发展提供了证据支持。

3.2.5抑郁和认知功能下降 研究表明,抑郁倾向和认知功能下降是社区老年衰弱前期发生的危险因素。杨帆等[26]采用多分类logistic回归分析,发现抑郁是社区老年衰弱前期独立危险因素,有抑郁倾向老年人缺少对社交活动和体育运动的兴趣,体力活动减少,增加老年衰弱前期发生的风险;同时衰弱老年人长期患病而丧失劳动能力、担心疾病状况造成经济压力等,成为精神压力来源,进而加重抑郁状况。既往研究显示,认知功能低下的老年人衰弱前期发生率较高[2],与本研究结果一致。衰弱与认知功能下降存在交互作用,两者相互影响,一方的变化可加重另一方的进展。社区医护人员应为社区老年人提供心理健康咨询,改善老年人心理健康及认知功能,防治社区老年人心理和认知衰弱发生,减少不必要的医疗资源消耗。

4 小结

本研究结果显示,社区老年衰弱前期的主要危险因素包括年龄、跌倒史、住院史、运动量低、多病共存、抑郁倾向及认知功能下降,考虑危险因素的可干预性,建议社区护理人员通过预防跌倒、运动干预、慢病健康教育、抑郁及认知干预等预防社区老年衰弱前期发生。基于Python平台,通过对衰弱前期预测模型时间跨度(建模组与验证组数据收集时间间隔2年)外部验证结果显示,BP神经网络模型预测效能优于logistic回归模型。本研究采用便利抽样方法,由于资料地区局限性限制,样本代表性差,模型还需要进一步验证和修订。关于BP神经网络分析方法,如输入层变量选择、结果解释等方面还需探讨。

猜你喜欢
危险建模神经网络
基于递归模糊神经网络的风电平滑控制策略
基于FLUENT的下击暴流三维风场建模
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
求距求值方程建模
神经网络抑制无线通信干扰探究
基于神经网络的中小学生情感分析
基于PSS/E的风电场建模与动态分析
喝水也会有危险
基于Q-Learning算法和神经网络的飞艇控制
拥挤的危险(三)