林令君,郭俊,王俊伟,高杨,陈惠盈,万永丽
300134 天津市,天津医科大学朱宪彝纪念医院 天津市内分泌研究所 国家卫健委激素与发育重点实验室天津市代谢性疾病重点实验室
糖尿病足是指与下肢周围神经病变、周围血管病变相关的足部溃疡、感染或深部组织破坏[1-2]。我国糖尿病足溃疡患病率约为8.1%,有足部溃疡病史患者的患病率增加至31.6%[3]。糖尿病足是糖尿病严重的并发症,医疗负担重,预后差。糖尿病患者发生非创伤性截肢的概率比非糖尿病患者高20 倍[4],严重影响了患者的生活质量和身心健康。糖尿病足的预防大于治疗[5],早期识别糖尿病足高危患者,加强对糖尿病足高危患者的管理,及时采取预防和治疗措施至关重要,可减少糖尿病足的发生或减缓其进展。糖尿病足发病风险的预测模型可以帮助临床早期识别高危患者,目前关于糖尿病足发病风险预测模型的研究较多,但模型能否在临床推广应用尚不清楚。因此,本研究对糖尿病足发病风险预测模型的相关研究进行了系统评价,期望为临床选择性能良好的风险预测模型,早期发现糖尿病足高危患者提供参考。
以“糖尿病足、糖尿病足溃疡、预测模型、风险预测、预测因素、危险因素、预测工具、风险评分、风险评估”为中文检索词,以“Diabetic Foot/diabetic foot ulcer/prediction model/risk prediction model/risk prediction/risk factors/risk assessment/prognostic model/risk score/prediction tool/nomogram”为英文检索词,计算机检索PubMed、Cochrane Library、Embase、Web of Science、中国知网及万方数据知识服务平台发表的关于糖尿病足风险预测模型的相关文献,将主题词与关键词相结合的方式进行检索,并且手工检索纳入文献的参考文献。检索期限为建库至2023-05-15,检索语种仅限中、英文。以PubMed为例,具体检索式为:
#1 Search:"Diabetic Foot"[Mesh]Sort by:Most Recent
#2 Search:(((((Foot ulceration[Title/Abstract]) OR (Foot,Diabetic[Title/Abstract]))OR (Diabetic Feet[Title/Abstract])) OR (Feet,Diabetic[Title/Abstract])) OR (Foot Ulcer,Diabetic[Title/Abstract])) OR (diabetic foot ulcer[Title/Abstract])
#3 #1or#2
#4 Search: ((((((prediction model[Title/Abstract]) OR (prediction tool[Title/Abstract]))OR (prognostic model[Title/Abstract])) OR(risk prediction[Title/Abstract])) OR (risk assessment[Title/Abstract])) OR (risk score[Title/Abstract])) OR (risk prediction model[Title/Abstract])
#5 Search:risk factors[Title/Abstract]
#6 #4or#5
#7 #3and#6
1.2.1 文献纳入标准如下,(1)研究对象:确诊为糖尿病患者[6];(2)研究类型:横断面调查、病例对照研究和队列研究;(3)结局指标:以发生糖尿病足为结局指标,参照国际糖尿病足工作组发布的诊断标准[7];(4)研究内容:关于糖尿病足发病风险预测模型的研究(糖尿病足进展、复发、预后模型除外)。
1.2.2 文献排除标准如下,(1)仅探讨糖尿病足危险因素,未建立模型的研究;(2)综述、述评、新闻报道等研究资料;(3)根据系统评价、Meta 分析建立模型;(4)无法获得全文且摘要信息不全;(5)会议摘要、学术论文等未正式发表的文献;(6)文章语言为非中文和英文。
2 名研究者根据纳入和排除标准独立筛选文献并提取资料,若存在争议,则寻求第三方意见。确定纳入文献以后,根据预测模型研究系统评价的关键评估及数据提取清单(critical appraisal and data extraction for systematic reviews of prediction modelling studies,CHARMS)[8],制订标准化表格,根据表格内容提取文献数据,包括文献的第一作者、发表时间、国家、研究地区、研究类型、研究对象、随访时间、预测结果、候选变量、样本量、缺失数据及处理方法、建模方法、变量的选择、模型的性能[受试者工作特征(ROC)曲线下面积(AUC)及CI、校准方法]、模型验证方法、模型包括的预测因子、模型呈现形式等。
2 名研究者根据预测模型研究偏倚风险评估工 具(prediction model risk of bias assessment tool,PROBAST)[9-10],评估纳入文献的偏倚风险及适用性。若存在争议,则寻求第三方意见。PROBAST 从研究对象、预测因子、结果及数据分析4 个领域进行偏倚风险评估。每个领域的评估结果有“低”“高”和“不清楚”3 个等级。PROBAST 从3 个领域进行适用性评估,评估方法与偏倚风险评价方法类似。
应用Stata 17.0 软件对纳入文献模型的预测因子进行Meta 分析,应用I2和χ2检验进行异质性检验。如果I2<50%且P>0.05,认为研究间不存在异质性,则选用固定效应模型;如果I2≥50%或P ≥0.05,认为研究间异质性大,将进行敏感性分析,假如异质性无法消除,则选用随机效应模型。合并效应指标用OR 值及95% CI 表示。以P<0.05 为差异有统计学意义。
经过数据库检索获得相关文献3 337 篇,经过粗筛、细筛后,最终纳入文献13 篇[11-23]。文献筛选流程见图1。
图1 文献筛选流程图Figure 1 Literature screening flow chart
纳入的13 篇文献中来自中国8 篇[13-16,18-20,22],英国2 篇[12,21],美国、葡萄牙及日本各1 篇[11,17,23]。有7 篇[13-17,19,21]是回顾性队列研究,4 篇[11-12,18,22]是前瞻性队列研究,2 篇[20,23]是病例对照研究;有3 篇[12,21-22]是多中心研究,10 篇[11,13-20,23]是单中心研究。近3 年发表的文献有7 篇[13-16,18-20]。纳入文献的基本特征见表1。
表1 纳入文献的基本特征Table l Basic characteristics of included literature
纳入的文献共建立13 个模型,包括12 个模型开发研究和1 个[17]模型验证研究。研究的潜在预测变量为10~36 个,样本总量为316~17 053 例,结果事件数为10~1 127 例。在缺失数据方面,1 篇[13]文献将缺失数据进行了多重插补处理,3 篇[11-12,22]文献采用完整病案分析,4 篇[15,17,20,23]文献未报告缺失情况。在连续变量处理方面,有9 篇[11-12,14-15,17-19,21-22]文献保持了连续变量的连续性,1 篇[13]文献将部分连续变量转为分类变量,并事先明确分组依据,3 篇[16,20,23]文献将部分或全部连续变量转为分类变量。纳入的文献多采用Logistic 回归建立模型。变量选择方面,5 篇[15,18-20,23]文献基于单因素分析。预测模型建立的情况见表2。
表2 糖尿病足风险预测模型的建立情况Table 2 Construction of risk prediction model for diabetic foot
13 个模型均报告了模型的AUC,AUC 范围为0.650~0.966,除HEALD 等[21]研究显示AUC 为0.65 外,其余12 篇文献的模型预测性能较好(AUC>0.70)。7篇[13-16,18,20-21]文献报道了校准度,主要以校准图的形式呈现,3 篇[14-16]文献同时进行了决策曲线分析,2 篇[13,18]文献报道了Brier 得分,在模型验证方面,仅3 篇[13,17,20]文献对模型进行了外部验证,有5 篇[11,12,21-23]文献未报告是否进行内部验证。预测模型的呈现形式不一,7 篇[13-16,18-20]文献构建了列线图,根据分值预估风险率,详见表3。
表3 糖尿病足风险预测模型的性能及呈现形式Table 3 Performance and presentation of risk prediction model for diabetic foot
2.5.1 偏倚风险评价:1 篇[13]文献总体偏倚为低偏倚风险,其余均为高偏倚风险,见表4。
表4 偏倚风险和适用性评估Table 4 Bias risk and suitability assessment
2.5.1.1 研究对象领域:1 篇[18]文献为前瞻性队列研究,将失访的患者列为排除标准,另1 篇[14]文献将外周血管病或周围神经病患者列为排除标准,两项文献可能出现研究对象选择偏倚,为高风险偏倚,其余为低风险偏倚。
2.5.1.2 预测因子领域:1 篇[21]文献为高风险偏倚,1篇[23]文献偏倚风险不清楚,其余文献为低风险偏倚。HEALD 等[21]研究为多中心回顾性研究,可能没有按照统一标准评估预测因子,评为高风险偏倚;另1 篇[23]文献无法得知预测因子评估是否采用盲法,评为不清楚。
2.5.1.3 结果领域:1 篇[21]文献为高风险偏倚,2 篇[11,20]文献偏倚风险不清楚,其余文献为低风险偏倚。HEALD 等[21]的研究中研究对象结局的定义和测量方式可能不一样;2 篇[11,21]文献未明确指出结果是否在不知道预测因子信息的情况下确定的;JIANG 等[20]文献未明确指出结局是否使用了预先确定或标准的定义。
2.5.1.4 分析领域:1 篇[13]文献为低风险偏倚,其余12 篇文献为高偏倚风险。高风险偏倚主要表现在以下几方面,(1)8 篇[12,14,16-17,19-20,22-23]文献建模样本量严重不饱和,每个预测变量的事件数<10;还有1篇[18]文献建模组结果事件数量未说明;(2)3 篇[16,20,23]文献将连续性变量转换成分类变量,未事先说明分组依据;(3)4 篇[15,17,20,23]文献文中未说明有无缺失,3 篇[11-12,22]文献有数据缺失且采用完整病案分析处理;(4)5 篇[15,18-20,23]文献基于单变量分析筛选预测因子;(5)6 篇[11-12,17,19,22-23]文献未报告是否评估模型校准度。(6)5 篇[11-12,21-23]文献没有报告是否采用内部验证,仅有2 篇[13,20]文献同时进行内部验证、外部验证;(7)5 篇文献究[11-12,21-23]未考虑模型的过度拟合、拟合不足等问题。
2.5.2 适用性:在模型适用性中,仅有1 篇[16]文献由于研究对象仅选择60 岁以上患者来构建模型被评为适用性低,见表4。
ZHOU 等[22]的研究未提供相关数据,无法进行Meta 合并。将12 篇文献中预测因子重复出现较多者进行Meta 合并,预测因子分别是年龄、HbA1c、视力异常、足溃疡史、足截肢史、单丝试验敏感性减弱、足真菌感染、糖尿病病程、肾病。以年龄为例,因异质性大采用随机效应模型进行Meta 合并,结果见图2。并对年龄进行了敏感性分析,剔除任一研究后结果变化不大。分别对其他预测因子进行Meta 合并,其中病程、视力异常Meta 合并后P>0.05,无统计学意义;肾病异质性小,采用固定效应模型合并效应值;单丝试验敏感性减弱在剔除MONTEIRO-SOARES 等[17]文献后异质性变小,选用固定效应模型合并效应值;其余预测因子异质性均较大,逐一剔除每项研究后结果变化不大,采用随机效应模型。
图2 年龄合并效应值森林图Figure 2 Forest plot of age-combined effect values
结果显示,年龄、糖化血红蛋白、足部溃疡史、足截肢史、单丝试验敏感性减弱、足真菌感染、肾病是糖尿病足发生的独立影响因素(P<0.05),见表5。
表5 Meta 分析结果Table 5 Meta-analysis results
本研究经过检索国内外糖尿病足发病风险预测模型的相关研究,最终纳入13 篇研究,共13 个预测模型,包括12 个模型开发研究和1 个模型验证研究。AUC 范围为0.650~0.966,除HEALD 等[21]文献AUC 为0.650 外,其余12 篇文献的模型预测性能较好(AUC>0.70)。所纳入13 篇研究中,除谢晓冉等[13]研究外,其余12 篇文献存在高偏倚风险,主要原因包括:研究对象纳入及排除标准不够严谨、预测因子是否按统一制订的标准评估、阳性事件样本不足、连续变量与分类变量转换不恰当、缺失数据处理欠妥当、筛选预测因子方法是否得当、缺乏模型性能评估、无模型外部验证以及未考虑模型过度拟合等。国外学者较早开始探索糖尿病足预测模型,早期预测模型大多缺乏校准度和内外部验证。预测模型的内部验证用于检验模型的可重复性,起到防止过度拟合作用[24],而外部验证关注模型的可移植性及可泛化性[25]。我国对糖尿病足风险预测模型的研究起步较晚。在本研究纳入的文献中,8 篇来自中国,近3 年发表的有7 篇。可以看出我国糖尿病足发病风险预测模型的研究迅速增多,并且注重了检测模型性能及验证,模型的呈现大多以列线图形式,更加直观、方便,为患者提供准确和个性化的风险预测,便于临床医生有效筛查出高危患者,及时采取干预措施。
纳入的13 篇文献中,预测因子重复较多的是年龄、糖化血红蛋白、视力异常、足溃疡史、足截肢史、单丝试验敏感性减弱、足真菌感染、糖尿病病程、肾病。Meta 分析结果显示,年龄、糖化血红蛋白、足溃疡史、足截肢史、单丝试验敏感性减弱、足真菌感染、肾病是糖尿病足发生的独立影响因素。今后开展预测模型研究可重点关注上述7 个预测因子。病程、视力障碍合并后无统计学意义,可能与不同文献的数据类型、分组依据不同有关。
目前糖尿病足风险预测模型绝大多数存在高偏倚风险,未来预测模型的研究要参照PROBAST[9-10]尽可能减少偏倚风险,结合本研究结果,建议关注以下7 个方面:(1)研究对象的纳入、排除标准要慎重制订,避免排除合并其他疾病者。(2)研究对象的预测因子、结局指标要采用同一定义、相同的测量方法,测量时注意采用盲法,并且选择适当的时点。(3)样本量要达到要求,如果应变量事件数(events per variable,EPV)<10,可能会出现过度拟合[26]。(4)连续变量转为分类变量后可能导致重要信息丢失,模型预测能力下降[27]。连续变量要尽量保持连续性,如果连续变量需要转为分类变量,要事先明确分组依据,尽量不要到分析阶段再临时将连续变量转换为分类变量,否则应进行内部验证和收缩回归系数来调整过度拟合[28]。(5)对于缺失数据的处理,可采用多重插补或单一插补法,可以降低数据缺失对统计学分析、模型的稳定性导致的不利影响[29]。(6)避免依赖单变量分析,要结合专业知识和实际分析。(7)考虑模型进行校准度、内外部验证、过度拟合及拟合不足等问题。
我国目前糖尿病足风险预测模型内部验证表现出良好的预测能力,但缺乏外部验证。仅有2 篇[13,20]文献进行了内外部验证,外部验证样本量少,今后需大样本量的外部验证研究模型的可移植性和外推性。目前的研究多是针对单中心进行的,建议今后在国内进行不同地区、多中心、大样本量研究,探索适合我国人群的糖尿病足风险预测模型。
作者贡献:林令君提出研究思路,负责文献检索及文章撰写;林令君、郭俊、王俊伟负责文献筛选,资料的提取与整理;郭俊、高杨、陈惠盈负责文献偏倚风险和适用性评估;高杨、万永丽负责统计分析;万永丽负责论文的修订、质量控制及审查。
本文无利益冲突。