赵改云 王燕
康复大学青岛医院(青岛市市立医院)麻醉手术科,青岛 266011
髋部骨折(Hip Fracture,HF)是骨科常见骨折类型之一,据报道全球髋部骨折患者预计在2050年将达到626万〔1〕,中国每年发生髋部骨折的患者约100万,且发病率呈逐年上升趋势〔2〕。谵妄(Delirium)是髋部骨折术后常见并发症之一,是指以注意力缺损、思维紊乱和/或意识水平改变为主要特征的器质性精神障碍症状群〔3〕。随着髋部骨折手术率的急剧增加,术后谵妄(Postoperative Delirium,POD)发生率也随之增多,研究显示POD发生率高达20%~65%〔4-5〕。POD一旦发生,轻则延缓康复进程,延长住院时间,重则长期损害认知功能,增加病死率〔3,5〕。POD风险评估有助于医护人员直观评估各因素的不同水平状态,对患者POD风险的影响权重,以甄别高风险患者。本文旨在综述髋部骨折患者术后谵妄风险预测模型,以期为临床个体化防治髋部骨折患者POD提供科学指导。
近些年国内外文献报道的髋部骨折患者POD危险因素主要集中在以下几方面,①术前因素:年龄、既往谵妄史、痴呆症、白蛋白水平、其他伴随疾病、日常生活自理能力、饮酒史等;②术中因素:手术方式及时间、麻醉方式及深度、术中低血压、术中低氧血症等;③术后因素:是否输血、术后失血及输血量、疼痛程度及镇痛治疗、药物滥用等〔4,6-10〕。这些研究结果可为开发髋部骨折患者POD风险预测模型及防治方案提供参考。
2.1.1Zhang等〔11〕POD风险列线图预测模型 回顾性分析825例髋部骨折患者的临床数据,基于列线图建立模型的方法,建立了包含术前认知障碍(是:0;否:10分)、并发症数量(<2个:0;≥2:3分)、美国麻醉医师协会(American Society of Anesthesiologists,ASA)分级(Ⅰ~Ⅱ:0;Ⅲ~Ⅳ:4分)、输血量≥2 U红细胞(是:0;否:3分)、是否ICU(是:4;否:0)5个独立危险因素的预测模型,当总分分别为1、7、11、14、17、20、23时,POD发生风险概率分别从10%依次增加10%,直至70%。但Guo等〔12〕提出,该模型未将疼痛控制、贫血、手术复杂性等风险因素纳入,并且识别能力一般(ROC曲线下面积即AUC=0.67),认为此POD风险预测模型并不理想。此外,模型未进行内部验证和外部验证,使得临床适用性受限。
2.1.2Kim等〔13〕POD风险预测评分模型 Kim团队于2020年基于美国外科医师协会国家外科质量改进项目中8 871例患者数据,采用回顾性分析法,取70%患者数据研制了POD风险预测评分模型。模型包含9个变量:术前谵妄(8分)、术前痴呆(3分)、年龄(60~69岁:0分;70~79岁:2分;≥80岁:3分)、医疗管理(1分)、麻醉ASA分级(Ⅲ~Ⅳ级:1分)、功能依赖(1分)、吸烟(1分)、全身反应炎症综合征/脓毒症/脓毒症休克(1分)和术前使用辅助移动设备(1分),总分0~20分,预测POD发生概率相对应分别为4.5%~92.0%。模型AUC为0.77,选取剩余30%患者数据进行验证后模型AUC为0.79。该模型基于大样本多中心数据进行开发,推广性强,但未纳入如药物滥用、手术相关及术后可能会影响POD的因素。此外,模型尚未进行灵敏度和敏感度分析,后期可在临床中应用进行验证并探讨该模型如何影响术后谵妄的预防。
2.1.3王天沛等〔14〕个体化POD风险预测模型 采用回顾性分析法共收集333例患者作为训练集,以POD作为研究终点,基于模型训练集,利用Logistic回归筛选分析出术后谵妄的独立相关因素包括:痴呆、术前白蛋白水平、术中低血压。根据相关因素和回归系数建立得出预测模型,特异度和灵敏度分别为87.5%和62.2%,AUC为0.827。经60例患者数据作为验证集进行验证,该模型特异度和灵敏度均为80%,内部验证AUC为0.831,外部验证AUC为0.836。经临床决策曲线分析,认为该模型预测的术后谵妄发生概率与实际发生概率一致性较高,具有较好的临床适用性。此模型纳入的危险因素均为客观指标,便于医护人员在临床实践中直接获取,但模型纳入的危险因素不够全面,缺乏人口统计学因素和手术麻醉因素,并且该模型研制时间尚短,还未在临床上得到跨中心大样本的验证,因此应用尚受限。
2.2.1王树相等〔15〕个体化POD风险列线图预测模型 通过调查分析257例老年髋部骨折患者POD的相关危险因素,基于年龄(65岁=0分,每增长5岁列线图得分增加16.75分)、2型糖尿病(是:29分;否:0)、麻醉ASA分级(Ⅰ级:0;Ⅱ级:8.8分;Ⅲ级:33.5分;Ⅳ级:41分)、麻醉方式(椎管内麻醉:0;全身麻醉:26.8分)及手术时间(60 min=0,每延长10 min,列线图得分增加4.1分)5项独立危险因素多因素回归分析,建立了个体化预测老年髋部骨折患者POD风险的列线图模型。经过验证,此模型AUC=0.818,提示区分度良好,并且预测老年髋部骨折POD风险与实际发生风险一致性良好,是国内首个针对髋部骨折患者POD风险的预测模型。但该模型目前仅进行了拟合优度分析,并且仅纳入1所医院数据,因此在临床推广应用前还需更多资料进行灵感度和特异度分析,进行外部验证。
2.2.2石冲〔16〕POD风险预测模型 纳入200例髋部骨折患者进行观察评估,统计分析发现年龄、术前视觉模拟评分(VAS评分)、老年痴呆、抑郁症和术中低血压是POD的影响因素,利用Logistic回归建立POD风险预测模型。该模型采用ROC曲线进行方程验证,得出灵敏度和特异度分别为65.2%和88.8%,AUC为0.848。将此模型应用到临床实践中,纳入30例患者数据对模型效果进行检验,灵敏度和特异度分别为75%和100%,准确率为93.3%。但该模型同样样本量较少,导致无法扩展预测模型来识别谵妄的亚型,尚需进一步多中心大样本验证。
2.2.3张明媚等〔17〕POD列线图预测模型 纳入205例髋部骨折行手术治疗的患者,基于多因素分析显示年龄、手术时长、合并心脑血管疾病、麻醉方式、衰弱程度、麻醉ASA分级是POD的独立影响因素,构建老年髋部骨折POD列线图预测模型。模型的灵敏度和特异度分别为78.49%和85.97%,AUC为0.915。经80例患者临床数据进行模型外部验证,结果显示模型灵敏度和特异度分别为90.48%和91.53%,准确度为91.25%,表明该模型预测老年髋部骨折POD风险与实际POD风险一致性较好。但同样此模型仅采用小样本队列进行验证,尚需纳入跨地区多中心样本验证后才能在临床上推广应用。
2.3.1RD模型(The Risk Model for Delirium)〔18〕RD模型于2004年由荷兰学者Vochteloo基于多项髋部骨折POD危险因素的前瞻性队列研究开发,纳入因素包括:既往住院谵妄史(5分)、痴呆症(5分)、拨钟图(小错误:1分;大错误或无法辨认:2分)、年龄(70~85岁:1分;>85岁:2分)、听力损伤(1分)、视力减退(1分)、日常活动障碍(家人帮助下饮食:0.5分;帮助身体护理:0.5分)、应用吗啡等影响精神状态药物(2分)、过量饮酒(日均≥4次,2分)9项因素,总得分在4分以上被评估为谵妄高风险患者,经验证模型最佳截断值为5分,AUC为0.722,灵敏度和特异度分别为71.6%和63.8%。2012年学者Moerman去除“应用吗啡等影响精神状态药物”和“过量饮酒”因素,并增加“男性”和“股骨粗隆间骨折”两项标准〔19〕,经验证此时模型最佳截断值为4分,灵敏度为81.4%,特异性为56.2%,识别能力较为理想(AUC=0.73)。国内有学者使用RD模型汉化修订后进行研究发现,“男性”和“股骨粗隆间骨折”并未对模型产生影响,且汉化后的模型灵敏度和特异度分别为75%和91.7%〔20〕。
2.3.2DEAR(the Delirium Elderly At-Risk)模型〔21〕Freter等〔21〕在2005年开发了DEAR(At-Risk)模型来预测择期骨科手术患者POD风险。模型基于132例患者中18例发生POD的临床数据,经Logistic回归分析纳入包括认知障碍、感觉障碍、生活自理依赖、药物/酒精滥用、年龄≥80岁共5种危险因素,每种危险因素评为1分,总分0~5分。据验证,模型最佳截断值为2分,分数越高,POD风险越高;灵敏度和特异度分别为61%和76%,AUC为0.77。2015年该学者团队将DEAR应用于283例髋部骨折患者中探讨该模型预测术前和术后谵妄的能力,结果发现当最佳截断值为3分时,POD预测的灵敏度和特异度达到最佳,分别为67.8%和73.3%〔22〕。就谵妄风险预测而言,高灵敏度较特异性更为重要,而该模型验证结果提示特异度更高,即模型可主要用于排除发生POD人群,但不排除与模型所纳入的样本量较少有关,因此可进行大样本进行验证。
2.3.3Goldenberg等〔23〕POD风险分层模型 将年龄>81岁、用药史、ST认知功能得分<20、MMSE精神检查状态得分<24、白蛋白<3.5 g/dl及红细胞压积水平<33%,术前6项预测因子纳入回归模型。为简化应用,该团队开发了谵妄预测量表(Delirium Predicting Scale,DPS),依据模型相关参数进行四舍五入为6项因素进行赋分:年龄>81岁=1分,多种药物=4分,ST评分<20=3分,MMSE评分<24=2分,白蛋白<3.5 g/dL=2分,红细胞压积<33%=2分。该量表的总得分为0 ~ 14分,得分越高,谵妄风险越高;同时,为谵妄风险高低进行分层:0~3、4~6、7~10、11~14分别为低、中、高、极高危谵妄。简化后的DPS可以让临床工作者简洁明了的判断患者术后发生谵妄的风险概率,但量表研制仅纳入了77例患者,尚需大样本进行验证。此外,量表未经过信效度的验证以及灵敏度和特异性的探索,且研究仅在社区医院开展,因此,在临床实践中应用还有待进一步验证。
2.3.4Liang等〔24〕POD风险预测模型 Liang等〔24〕开发了两种预测模型,模型1主要是基于人口学因素和手术相关因素,包括:年龄≥75岁、Charlson共病指数≥2、是否输血、麻醉分级4项因素,总分0~11分。在模型2中,增加老年综合评估内容,最终进入模型2共6项因素:男性、Charlson共病指数≥2、MMSE<24、营养不良风险、是否输血、手术类型,总分0~15,分数越高,发生谵妄的风险越高。经过验证,发现模型1识别能力低于模型2(AUC1=0.763,AUC2=0.814)。模型2以5分为截断值,敏感性和特异性分别为83.8%、65.3%。但此模型是基于仅有8%的术后谵妄发生率的基础上开发,在一定程度上会影响统计结果,其次模型纳入的患者包括膝部手术、髋部手术和脊柱手术患者,缺乏髋部骨折手术患者的针对性。
从研究设计层面分析,不同研究者分别基于回顾性研究〔11,13-14〕、横断面研究〔15-17〕、前瞻性研究〔18,21,23,24〕构建了髋部骨折患者POD风险预测模型。回顾性研究是从以往积累的病例资料中进行选择、整理分析,从中总结经验、找寻规律并指导实践的研究,研究较其他设计方便,耗时少,但有临床资料收集不全的可能,进而对模型预测能力产生影响〔25〕。基于横断面研究设计的预测模型不易确定髋部骨折患者危险因素与POD发生的时间关系,仅观察患者住院期间发生的谵妄,一部分患者可能存在远期出现谵妄状态,存在一定偏倚。前瞻性研究指以时间顺序向前发展一段时间后,通过观察研究对象的状态及结果〔25〕,此研究设计可让研究者探索危险因素与POD发生的关系,但研究耗时,可能存在患者失访或POD病例过少的问题。
从纳入危险因素层面分析,多数研究者在构建预测模型时纳入了POD的术前和术中危险因素,仅少数研究考虑到术后危险因素〔11,18,24〕。由于谵妄发生发展可能是多因素共同作用的结果,若模型仅纳入术前、术中因素对POD的影响,未考虑到术后危险因素的存在以及护理层面因素、多学科共同管理等因素,可能造成模型的预测能力减弱。值得注意的是,在本研究综述的10种不同研究类型所构建成的风险预测模型中,多种模型共有因素包括年龄、ASA分级、痴呆史、术前认知功能状态、合并其他疾病、身体功能状态、术中低血压、术前白蛋白水平、手术时间、输血、麻醉方式分别在8项〔13,15~18,21,23-24〕、5项〔11,13,15,17,24〕、4项〔13,14,16,18〕、4项〔11,13,21,23〕、4项〔11,13,17,24〕、3项〔13,18,21〕、2项〔14,16〕、2项〔14,23〕、2项〔15,17〕、2项〔11,24〕、2项〔15,17〕研究中出现,提示在POD评估时应重点观察具有以上危险因素存在的髋部骨折患者。此外,部分研究者提出的风险预测模型中,纳入了其研究中的特有因素,如Kim等〔13〕纳入吸烟因素,石冲团队提出抑郁症因素〔16〕,RD模型中纳入的听力和视力减退因素以及过量饮酒〔21〕,Goldenberg等〔23〕纳入红细胞压积水平作为预测危险因素之一等。可见不同研究纳入的危险因素也有所差异,而所纳入危险因素构建的模型是否能够预测POD的发生,尚有待考证。
从预测模型的构建、验证与预测能力分析,多数研究者采用Logistic回归〔13-14,16,18,21,23,24〕和列线图〔11,15,17〕进行预测模型构建。列线图预测模型能通过将Logistic回归结果量化、图形化、可视化,旨在计算每一项因素的风险评分,从而实现对事件发生风险的个体化预测,是建立风险预测模型的良好统计方法〔25〕。从内外部验证层面分析,多数研究〔13-15,18,21,24〕进行了内部验证,仅2项研究〔14,17〕进行了外部验证。模型的验证是避免模过度拟合和决定模型适用性的重要环节,内部验证是基于模型开发队列数据进行的验证,旨在检验开发的可重复性;外部验证利用模型开发中未使用过的数据来评估模型在新数据中的预测能力〔26〕。然而,相比较内部验证,外部验证是检验预测模型是否能被广泛应用且体现模型更加科学有效的必要条件〔26〕,这可能也是没有POD风险预测模型被常规应用于临床实践的原因,因此也无法评价模型的预测能力孰优孰劣。
POD已成为髋部骨折患者术后需要重点关注的问题之一,针对其风险因素进行早期识别并给予预防措施,可有效降低POD发生率。风险预测模型逐渐成为髋部骨折患者POD预防的重要工具和研究热点,目前仍缺乏经过广泛验证和临床适用性较好的预测模型。综上所述发现各个模型各有其优缺点,不同模型的研究设计、纳入危险因素、样本量有一定程度差异,且大部分预测模型缺乏严格的内部与外部验证,何种预测模型更好尚无统一意见。尽管现有风险预测模型并未被广泛应用和验证于临床实践,但大部分模型显示高龄、既往谵妄史和痴呆症是髋部骨折患者POD的危险因素,提示医务人员需重视对高龄髋部骨折患者谵妄史和痴呆症状的评估。此外,需要借鉴国外经验,建立一套本土化的、针对髋部骨折患者术后、简单实用的谵妄风险预测模型,并进行多中心大样本验证,以第一时间为谵妄高危患者提供干预,预防和减少术后谵妄,促进患者康复。
利益冲突所有作者均声明不存在利益冲突