陈红爽,王琴潞,邹海欧
中国医学科学院北京协和医学院护理学院,北京 100144
衰弱通常表现为因各种因素导致多个器官系统的生理能力下降,从而出现机体易损性增加、抗应激能力减退的状态[1-2],常为多种慢性疾病、某次急性事件或严重疾病的后果[3],与病人不良结局的发生密切相关,可增加病人发生死亡、跌倒、失能等事件的风险[4-7]。已有研究显示,衰弱不仅限于老年人群,65 岁以下的人群,尤其是患有多种疾病的人群,也有发生衰弱或处于衰弱前期的可能[2-8],其严重程度是波动变化的[1]。及时预测发生衰弱的风险,能够早期识别发生衰弱的高危人群,制定针对性的干预措施,以帮助病人摆脱衰弱状态或避免衰弱的发生。近年来,衰弱风险预测模型研究明显增多,但各研究中预测模型的适用对象、预测因子等存在异质性。本研究对国内外相关预测模型的构建及应用状况、预测因子及性能进行范围综述,分析目前该领域相关研究存在的问题,以期为临床护理工作和未来研究提供借鉴。
1)目前存在哪些衰弱风险预测模型的研究?2)模型通常涉及哪些预测因子?3)目前衰弱风险预测模型的建模方法有哪些?性能如何?4)目前研究存在哪些不足及对未来相关研究的启示是什么?
检索的数据库为PubMed、the Cochrane Library、EMbase、CINAHL、Web of Science 核心集、中国生物医学文献数据库、中国知网、万方数据库,检索时限为建库至2022 年6 月30 日,采用主题词和自由词相结合的方式进行检索,中文检索词包括:“衰弱综合征”“衰弱”“脆弱”“预测因素”“预测”“预测模型”,英文检索词包 括:“frailty”“frailty syndrome”“frailness”“frail”“risk prediction”“risk assessment” “prediction”“nomograms”“prediction rule*” “prediction model*”“prognosis model*”“prediction*”。以PubMed 数据库为例,检索策略如下:
#1 "frailty"[MeSH Terms] OR "frailty syndrome"[Title/Abstract]OR "frailness"[Title/Abstract] OR "frail"[Title/Abstract]
#2 "risk prediction"[Title/Abstract] OR "risk assessment"[MeSH Terms] OR "prediction"[Title/Abstract] OR "nomograms"[MeSH Terms] OR "prediction rule*" [Title/Abstract] OR "prediction model*"[Title/Abstract] OR "prognosis model*"[Title/Abstract] OR "prediction*"[Title/Abstract]
#3 #1 AND #2
纳入标准:以构建或者验证衰弱风险评估工具为研究内容;中英文文献;原始研究(队列研究、病例对照研究、横断面研究等)、指南、专家共识等。排除标准:会议摘要、学位论文;未说明预测模型的内容或方法。
将检索到的文献题录导入EndNote X9 软件中去除重复文献。由2 名研究人员根据纳入及排除标准阅读文题和摘要独立进行初筛,再阅读全文进行复筛。筛选文献存在争议时与第3 名研究者讨论,最终确定符合标准的文献。
应用预测模型研究的偏倚风险评估工具(PROBAST)[9]对纳入文献进行质量评价。
由2 名研究者对纳入文献独立进行数据提取,有异议时与第3 名研究者讨论。提取信息包括作者、发表年份、国家、研究对象、研究设计、模型构建和(或)验证方法、模型预测因子、展示方式及性能等,并进行汇总分析。
初步检索获得文献8 846 篇,其中,英文文献8 174篇,中文文献672 篇,经过查重及阅读题目、摘要、全文后,最终纳入12 篇文献[10-21]。12 篇文献均为横断面研究,衰弱发生率为10.6%~68.2%,发表年份为2018—2022 年,其中中 国9 篇[13-21]、巴西1 篇[10]、泰国1 篇[11]、荷兰1 篇[12]。文献筛选流程及结果见图1,纳入文献基本特征见表1。
表1 纳入文献基本特征
图1 文献筛选流程及结果
根据PROBAST 对模型建立的研究对象、预测因子、结局、分析4 个方面进行偏倚风险评价,纳入研究整体的预测因子和分析部分偏倚风险较高,可能与预测因子统计分析方法选择、模型建立时是否考虑复杂统计问题等有关,评价结果见表2。
表2 纳入研究的偏倚风险评价
2.3.1 模型构建基本情况
模型研究人群主要集中于老年人,疾病种类多样,涉及术后病人、住院病人、门诊病人、社区人群等,样本量为145~14 314 例。模型构建方法可分为两类,其中Logistic 回 归 模 型11 项[10,12-21],人 工 神 经 网 络 模型1 项[11]。
2.3.2 模型预测内容及展示方式
纳入研究的预测因子数量为2~10 个,模型展示可分为两类,即根据各因子的回归系数得出风险评分公式;列线图、网页计算器的可视化展示。其中,根据各因子的回归系数得出风险评分公式的研究较多。模型预测内容及展示方式见表3。对结果进行汇总、分类,最终将预测因子分为4 类,分别为一般资料、实验室检查指标、疾病相关因素、其他因素,出现频次最高的3 项预测因子为合并症、年龄、多重用药。预测因子分类见表4。
表3 模型预测内容及展示方式
表4 预测因子分类 单位:个
2.3.3 模型验证及性能
12 个 模 型 中,7 个 模 型[10-11,13,15,17-19]未 报 告 验 证 方法,3 个模型[12,14,21]采用Bootstrap 自举重采样法,1 个模型[16]进行内部验证,1个模型[20]进行外部验证。在模型性能方面,7 个模型[13-14,16-17,19-21]应用Hosmer-Lemeshow拟合优度检验P>0.05,提示模型预测值与实际观测值差异不明显,模型校准度良好。10 个模型[12-21]报告了受试者工作特征曲线下面积(AUC)以展示模型的区分度,AUC 为0.727~0.940,显示模型区分度良好。部分模型报告了灵敏度与特异度,灵敏度为56%~89%,特异度为67%~97%,提示模型具有较好的判断能力。模型验证及性能见表5。
表5 模型验证及性能
近年来风险预测模型得到学者们的高度关注,研究数量明显增加[22]。衰弱风险预测模型能够辅助医护人员对病人衰弱发生风险进行评估,识别导致衰弱发生的个体化危险因素,进而为制定针对性的干预内容提供证据支持。风险预测模型是以疾病多风险因素为基础,利用数学公式计算病人未来发生某个事件的概率的一种统计性评估方式[22]。通过对预测模型的判断,可达到促进(共享)医疗决策和改善健康结果的目的[23]。此外,还可应用风险预测模型对发生衰弱的病人进行动态评估。本研究对纳入的预测因子进行频次排序,结果显示,合并症、年龄、多重用药在衰弱风险预测中应用较多。但本研究发现,纳入研究对建模样本选择存在一定异质性,同样是老年病人,年龄界限、疾病、来源情况不同,模型纳入的预测因子特点不同,如针对老年肺癌术前病人建立的衰弱风险预测模型预测因子包含肿瘤分期,能够体现一定的疾病特点;而在针对老年多病病人建立的衰弱风险预测模型预测因子纳入了具体的合并疾病。提示,即使对象年龄相似,其处于不同疾病状态时影响衰弱发生的危险因素也不相同,预测因子存在一定异质性,不同情形下需要针对性地识别衰弱发生风险,未来在构建预测模型时应充分考虑疾病相关特征,从而促进风险预测模型的准确性。
模型建立的偏倚风险分析结果显示,本研究纳入的研究偏倚风险较高,可能与应用Logistic 回归建模时存在将连续变量转换为分类变量有关。同时,研究中对于数据的复杂问题(如删失、竞争风险、对照抽样等)处理是否恰当缺乏详细的报告,可能增加分析阶段的偏倚风险。此外,本研究纳入的部分研究缺乏模型验证,仅有3 个模型[12,14,21]采用了Bootstrap 验证法,1 个模型[16]进行内部验证,1 个模型[20]进行外部验证,导致尽管相关预测模型的区分度、校准度良好,但适用性及外推性有待探讨,临床实用性可能不高。预测模型的有效性关键之一在于验证结果,这就意味着验证集的选择十分重要,在验证时应选择具有代表性的数据集建立模型并进行外部验证[24]。
Chumha 等[11]在研究设计时考虑避免模型过拟合的问题,选择人工神经网络进行建模。随着信息化技术的发展,机器学习算法在建模中的应用也越来越受到人们关注,机器学习具有强大的数据分析与探索能力,在疾病预测方面具有显著优势[25]。在其他领域中,机器学习具备优于Logistic 回归分析的优势,能处理建模过程中因子的选择及共线性问题[26-27],机器学习可使用大量数学运算更好地定义预测因子与结果间的复杂关系,能够契合实际临床工作全面性、复杂性的特点[25],但机器学习算法和传统统计学方法间的性能比较尚存争议,未来仍需对两种方法进行深入研究[28]。此外,本研究中有4 项研究[12,14,20-21]采用了可视化的模型展示方式,有利于临床应用并提高风险筛查的便利性和效率,未来可选择便于临床实际应用和模型更新的形式进行模型展示,如网页计算器、赋值、列线图等。
目前,越来越多的学者关注衰弱风险的早期识别并开发了预测模型,本研究共纳入12 个衰弱风险预测模型,综述了模型的基本特征,分析了目前模型建立中仍可进一步优化的部分。建议未来研究者进一步进行基于现有模型的多中心、前瞻性外部验证研究,经过临床实践验证后再推广使用,进而提高模型准确率。此外,未来可考虑尝试应用机器学习算法进行衰弱风险因素的建模,提高人工智能技术与研究的结合程度,并尝试应用可视化方式展示模型,方便医护人员直观预估风险、减轻工作负担。