围术期低体温风险预测模型的研究进展

2021-01-14 00:03李玉梅张宏晨陈晓东王晓燕王志平

护理研究 2021年17期

李玉梅，张宏晨，陈晓东，王晓燕，王志平 *

1.兰州大学护理学院，甘肃 730030；2.兰州大学第二医院

围术期低体温是指各种原因导致机体核心体温低于36℃，也被称为围术期意外低体温，但应与以医疗为目的的控制性降温相区别。低体温发生率很高，有20%～90%的手术病人发生低体温[1⁃3]，围术期低体温可导致病人麻醉苏醒延迟，增加术后疼痛、寒战、躁动等不良反应，严重时会诱发术中及术后突发性的心脑血管事件，如脑卒中、心律失常等,甚至可能引发术后电解质紊乱、术后感染等问题[4]。围术期低体温是可以预防的[5]，而风险预测评估是围术期低体温预防的第一步，风险预测结果的准确与否将直接影响预防措施的选择和预防效果。现对围术期风险预测模型的研究进展进行总结分析，为临床护理实践提供依据。

1 围术期低体温风险预测模型

风险预测模型是以病因研究为基础，经过多因素分析，结合多种预测因子来评估特定情况的存在或某一事件在未来发生的风险[6]。预测性能和一致性是评价预测模型优劣的主要指标，预测性能常用灵敏度(sensitivity)、特异度(specificity)、约登指数(Youden index)、受试者工作特征 (receiver operating characteristic,ROC)曲线下面积(area under the curve,AUC)等指标评价，一致性常用拟合优度(goodness of fit,GOF)评价，它体现了检验模型与样本观测实际值的差距；灵敏度是指模型能将实际有病的人正确判定为病人的比例；特异度是模型能将实际无病的人正确判定为非病人的比例；约登指数是表示模型发现真正的病人与非病人的总能力，指数越大，筛选实验效果越好,真实性越高；AUC是评价预测模型最常用的一个综合指标，取0.5～1.0表示预测模型具有应用价值[7]。因此，良好的预测模型需具有较高的灵敏度、特异度和AUC。

2 国内围术期低体温风险评估预测模型

2.1 腹腔镜手术病人术中低体温预测模型腹腔镜手术病人术中低体温预测模型由普鹰等[8]采用便利抽样法，选取396例各类腹腔镜手术且年龄＞18岁的病人作为研究对象，从264例各类腹腔镜手术治疗的病人中获得116例(44.10%)发生围术期低体温病人的相关临床资料，采用Logistic多因素回归分析纳入5项预测因子，即麻醉手术时间、基础体温、手术类型、室温、术中补液量。使用Hosmer⁃Lemeshow对模型的拟合效果进行验证，采用ROC曲线检验病人模型预测实际低体温的灵敏度与特异度,以约登指数最大值为预测模型的最佳临界值，该模型的灵敏度、特异度、AUC、约登指数、Hosmer⁃Lemeshow检验分别为0.600,0.867,0.791,0.867,0.123，该模型预测性能较好。但该研究的局限性为：该预测模型的研究对象为腹腔镜手术治疗的病人，且排除体质指数＞35 kg/m2、美国麻醉医师协会(American Society of Anesthesiologists,ASA)评分Ⅲ级以上的病人，普适性差；该研究样本量小，仅对其做了内部验证，缺乏外部验证结果的支持，可能存在模型过度拟合的偏倚，而过度拟合会使模型预测性能结果偏高，今后尚需扩大样本量进行外部验证，以验证其适用性、预测性能及一致性结果，缩小偏倚，进一步完善该预测模型。

2.2 围术期低体温风险概率评分表(Predictors Score) Predictors Score由Yi等[9]采用观察性研究方法，选取全身麻醉手术病人作为研究对象，但不包括年龄＜18岁和有体外循环的心血管病人，从全国范围3 132例全身麻醉手术病人中获得1 387例（44.3%）发生围术期低体温病人的相关资料[10]，采用Logistic多因素回归分析纳入7项预测因子，即手术时间，麻醉持续时间、体质指数、基线核心温度、手术室环境温度、输注的静脉输液量以及病人加温的方式。该模型的Hosmer⁃Lemeshow检验得分为0.561 1分，表明该模型的拟合度较好，Brier分数为0.21分，内部验证及外部验证的AUC分别为0.789，0.771，表明该模型具有良好的预测能力。该预测模型是我国第一个量化病人体温风险的评估工具且研究样本量大，但仍具有局限性：首先，低体温数据未纳入18岁以下及全身麻醉以外的病人，因此风险评估仅适用于采取全身麻醉的成年围术期病人；其次，风险评估模型是从全国调查低体温数据产生的，但仅纳入北京地区数据而未纳入其他地区调查数据进行外部验证，模型是否具有良好的外推性需进一步进行验证，由于调查围术期低体温数据量大且范围广泛，在全国调查中未随机选择病人，调查结果可能会存在偏倚。未来需要扩大研究范围对该模型进行前瞻性外部验证，进一步完善、验证该模型的适用性和预测性能。

2.3 成人手术病人术中低体温风险等级评估量表（Intraoperative Hypothermia Risk Factors Assessment Scale）成人手术病人术中低体温风险等级评估量表由于海洋[10]于2020年研制。研究对象为≥18岁的外科手术病人，该研究采用Meta分析纳入24种低体温危险因素构成量表，危险因素包括手术室温度、麻醉时间、麻醉方式、手术方式、手术时间、术中失血量、术中输血量、术中冲洗液量、术中补液量、术中新鲜冰冻血浆输注等。该量表的风险评估最低分为13分，最高分为26分，分值越高表示病人发生术中低体温的风险程度越高，本量表Cronbach'sα系数和折半信度检验均在0.7以上,量表具有较好的内在一致性。该风险评估模型的局限性为：研究采用Meta分析进行量表条目池构建时，受纳入和排除标准影响，纳入14篇中英文文献，文献数量较少，不能进行发表偏倚等分析；研究采用德尔菲法进行量表条目筛选时，受研究时间限制等影响，仅纳入来自全国4个地区专家,可能会使咨询结果存在一定的局限性；研究样本量较少且仅局限于某三级甲等医院，初步形成的正式评估量表有待通过多中心、大样本研究进行检验，增加量表的适用性和可靠性。

2.4 术中低体温危险因素评价指标体系术中低体温危险因素评价指标体系由黄一乐等[11]采用德尔菲专家咨询法和层次分析法，对手术病人术中低体温危险因素评价指标进行筛选、论证并确定指标权重构建，该评价指标体系由2项一级指标和21项二级指标构成，2轮专家咨询的权威系数分别为0.83和0.84，均＞0.7，可认为专家咨询具有权威性。专家意见的协调程度可以判断专家对指标评价是否存在较大的分歧，可通过肯德尔协调系数来反映，2轮咨询结果的协调系数分别为0.586和0.601，显示专家意见的协调性较好及专家咨询具有代表性和可信度。该研究的局限性为：该研究围术期低体温危险因素的收集是基于德尔菲法而非循证，无法确定危险因素是否与围术期低体温高度相关，且其未进行临床实测，无法验证其临床效果，需进一步研究检验其临床可行性及实用性。

3 国外围术期低体温风险评估预测模型

3.1 瑞士低温分期模型(the Swiss Staging Model for Hypothermia) 瑞士低温分期模型由Durrer等[12]将低温病人的意识程度、有无颤抖、心脏活动和核心温度作为低体温临床分期标准进行编制，最早被建议用在欧洲阿尔卑斯山地区及院前低体温受害者，为实际的救援工作和非医疗救援人员提供指导，该模型将低体温分成5个阶段并进行区分，既低体温Ⅰ期(hypothermia,HTⅠ)：意识清醒、寒战，核心温度32～35℃，但寒战不可作为唯一的临床判断指标；低体温Ⅱ期(hypothermiaⅡ,HTⅡ)：意识障碍、无寒战，核心温度28～32℃，要严密监测生命体征，将病人转入重症监护室（ICU）治疗；低体温Ⅲ期(hypothermiaⅢ,HTⅢ)：无意识，核心温度24～28℃，避免危及生命的心律失常；低体温Ⅳ期（HTⅣ）：明显死亡，核心温度13.8～24.0℃，一旦确诊，立即实施心肺复苏；低体温Ⅴ期(hypothermiaⅤ,HTⅤ)：不可逆性死亡，核心温度≤13.7℃。Deslarzes等[13]采用文献回顾法通过病例报告中的183例低体温病例对瑞士低温分期模型进行了验证，通过Logistics回归分析纳入病例的性别、年龄、原因和测温地点与临床分期的准确性之间的相关性无统计学意义，通过3次ROC分析以区分4个临床分期的最佳温度阈值，3次AUC的值分别为0.79，0.73，0.69，表明瑞士低温分期模型有良好的区分临床分期的能力，但通过探索性分析，4个阶段组之间的核心温度有重叠现象，这表明对低温阶段的准确诊断不能仅仅基于温度，且该模型各阶段估计的体温范围高于实际体温，易延误病人病情的判断。Pasquier等[14]后在Deslarzes等[13]的研究基础上采用回顾性分析纳入瑞士两家医院的122例病例进一步对瑞士低温分期模型进行验证，区分4个临床分期3次AUC的值分别为0.87，0.78，0.70，结果与Deslarzes等[13]的研究结果相似。虽然这两种外部验证方法均为该模型的临床阶段与核心温度之间的联系提供证据，但该模型研究的局限性为：采用回顾性病例研究无法保证数据的质量和完整，发表的病例可能并不完全代表临床实践，存在回顾性偏倚及发表偏倚；不同的病例研究采用不同的温度测量方式，无法保证温度测量的可靠性；样本量较少，不能准确反映模型的预测性能；该模型主要适用于创伤入院急诊手术病人，对于择期手术病人尚缺乏特异性。后期应开展大样本的前瞻性研究进一步对该模型进行评价并应用。

3.2 术中低体温预测模型术中低体温预测模型由Rincon等[15]通过病例对照研究从全身麻醉手术200例病人中获得93例（47%）发生术中低体温的手术病人的相关资料，采用Logistic多因素回归分析纳入5项危险因素，既年龄、体重、预计手术时间、环境温度以及麻醉诱导前的基础体温，后通过64例外科全身麻醉手术病人对其验证。研究给出了两个预测模型，既完整模型与简化模型，完整模型的AUC、灵敏度、特异性分别为0.85，0.83，0.73，简化模型的AUC、灵敏度、特异性分别为0.83，0.84，0.73，均表明该模型具有良好的预测性能。本研究的局限性为：未报告拟合优度检验结果，仅对模型进行了内部验证并报告了灵敏度和特异性的结果，未对其进行临床外部验证会增加模型过度拟合的风险；有研究表明，麻醉方式、术中输液量[16]是术中低体温的主要危险因素，但该研究并未纳入模型；样本量较少且预测因子中的手术时间是估计的，手术时间不够准确会降低模型预测性能，模型的预测性能和一致性还有待于进一步临床验证。

3.3 冷不适量表（Cold Discomfort Scale,CDS）CDS量表由瑞典的Lundgre等[17]基于数字评估法进行编制，该量表使用0～10的整数值评估病人的冷感受，其中0表示没有任何冷的感觉，10表示难以忍受的寒冷。CDS为主观判断量表，在院前难以获得诸如身体核心温度、皮肤温度和耗氧量等客观测量值，其是现场抢救场景中是评估病人体温状况的重要辅助工具，对帮助早期识别低体温病人，降低发生低体温的风险具有重要意义。研究者通过对22名健康受试者在−22℃的环境中持续60 min以验证该量表的信效度，结果显示量表的重测稳定性为0.84，CDS评分在10 min、15 min、30 min的每个时间间隔显著增加，此量表具有良好的预测性能。CDS量表根据病人的主观感受，可早期识别发生冷刺激的病人，有助于降低低体温发生的风险，适用于围术期病人所有阶段的评估。该研究的局限为：研究人群量少、受冷暴露的时间以及周围环境限制，而且模型未在实际临床环境中应用，尚无法确认该模型的临床预测性能。CDS量表是基于主观感受评估，今后应考虑变化的环境条件和各种临床上重要的混杂因素对该量表进行临床验证，结合客观参数评估，例如呼吸频率、心率、身体核心和皮肤温度等，进一步提高量表的可靠性及有效性。

3.4 全身麻醉大手术术中低体温预测模型全身麻醉大手术术中低体温预测模型由日本学者Kasai等[18]通过回顾性研究，从862例全身麻醉开腹手术中分别选取200例最低体温大于36℃和最高体温小于35℃病例纳入研究，基于Logistic回归分析结果纳入5项危险因素，既年龄、身高、体重、术前收缩压和心率，构建术中低体温模型预测术中低体温发生的风险，通过收集50例全身麻醉开腹手术病人对模型进行验证，模型预测敏感性及特异性分别为0.81，0.83，表明该模型对低体温病人有良好的辨别能力。该模型的局限性为：建立该模型选择回顾性研究会存在病人信息获取不全的风险，对回顾性研究结果的依赖可能导致选择偏倚；研究仅纳入术前低体温的危险因素，未纳入术中低体温危险因素，无法将术中情况作为危险因素进行评估，会导致危险因素的选择偏倚；对模型进行验证时未对模型进行拟合度检验且样本量少，未来需对模型进一步验证。

4 围术期低体温风险预测模型的比较分析

4.1 围术期低体温风险预测模型的研究方法比较从研究设计方法，有3项前瞻性[8⁃9,15]研究，其余均为回顾性研究[8,20⁃21]，回顾性研究只能从既往医疗记录中获取围术期低体温病人的相关资料，方便快捷、耗时少，但可能获取相关资料不全，数据的完整性和同质性无法保证，研究质量不高，若处理不当，模型的预测性能将会受一定影响；而前瞻性研究是先进行研究设计再收集资料，克服了回顾性研究的缺点，它可以反映研究者感兴趣的危险因素与围术期低体温发生的关系，可获得较全面的临床资料，但研究耗时耗力且可能存在病人失访、病例数量过少的风险，如于海洋[10]研究样本量较少、Kasai等[18]研究围术期发生低体温例数较少。

从纳入危险因素分析，研究大多采用Logistic多因素回归分析，研究对象主要以成人全身麻醉手术为主，分别是成人手术病人[9⁃10]、腹腔镜成人手术病人[8]、腹部全身麻醉手术病人[8]及创伤入院的急诊病人[12]，研究将手术室温度、麻醉时间、麻醉方式、手术方式、手术时间、术中失血量、术中输血量、术中冲洗液量、术中补液量、术中输注新鲜冰冻血浆量、基础体温、术前收缩压及心率等纳入危险因素分析，不同研究在不同人群中纳入的危险因素不同，由此可见，每个危险因素在不同人群中发挥的作用也是不明确的，因此，无法明确危险因素与围术期低体温发生风险之间的关系。

4.2 压力性损伤风险预测模型的内部和外部验证比较从内部验证分析，有多项研究[8,13⁃15,19]进行内部验证，内部验证可减少模型过度拟合，从而得到更为可靠的模型预测准确性评估值，据此分析，未经内部验证的模型其预测准确性无法得到保证。从外部验证分析，2项研究[18⁃19]报告了外部验证结果，外部验证主要是通过临床应用评价模型预测性能，并且利用外部验证新收集的资料和原有累积资料进行分析后重新建模，使模型动态更新，为模型的优化定型和大范围使用提供基础[19]。仅有1项研究[9]进行内部验证及外部验证，由于大部分模型未经外部验证和内部验证，因此，无法评价模型的预测性能和优劣。

5 展望

由于研制模型的目标人群和研究方法不同，获得的临床资料不同；使用的统计方法不同，最终筛选的危险因素不同，今后应进一步采用大样本、多中心的临床研究方法，继续探索不同类型手术的危险因素对低体温的影响。构建模型中缺乏内部验证和外部验证，有待进一步验证模型的预测性能，今后构建模型不仅要对其进行内部验证，还应在具有代表性的人群中进行多中心、前瞻性的外部验证，以提高模型的稳定性和外推性；纳入新的围术期低体温危险因素，在临床实践中对模型持续校准。临床医护人员在应用模型预测围术期低体温发生风险时，需要考虑模型的适用人群、模型的预测性能及一致性，任何预测模型需结合临床问题具体分析，切忌完全依赖模型。