冯雅笛,杨芳宇,李京连
1.首都医科大学附属北京天坛医院,北京100050;2.首都医科大学
谵妄是一种急性意识和认知功能障碍,在重症监护室(ICU)中经常发生,根据对超过16 000 例ICU 病人的大型荟萃分析发现,其发生率接近1/3,机械通气病人的发生率为80%或更高[1‐2]。ICU 谵妄的影响也很大,研究已显示与短期和长期的不良后果有关。在短期内,发生谵妄病人的机械通气时间明显延长,ICU的住院时间也延长,并且医院内死亡风险也高出两倍以上[3]。从长远来看,入住ICU 时出现谵妄的病人在住院后长达12 个月的死亡率也更高,并且更可能出现长期的认知障碍[4‐5]。由于谵妄带来的一系列严重的后果,谵妄的早期观察、预防和管理至关重要。2018年,疼痛(pain)、躁动/镇静(agitation/sedation)、谵妄(delirium)、制动(immobility)及睡眠紊乱(sleep disrup‐tion)指南发布,简称PADIS[6]。新版本指南仍然推荐ICU 意识模糊评估法(Confusion Assessment Model for Intensive Care Unit,CAM‐ICU)为ICU 谵妄的常规评估工具,但是在临床应用中存在谵妄的诊断正确率不太高、护士感觉其操作复杂、需要系统培训、病人意识的基线状态查找不便等问题[7‐8]。智能化谵妄评估系统(智能化CAM‐ICU)为解决这些问题,以纸质原版CAM‐ICU 为蓝本,通过综合运用移动智能终端、计算机网络、数据库等智能化手段开发而成,并已完成雏形阶段的可用性评价[9]。本研究采用前瞻性队列研究设计,评价智能版CAM‐ICU 与纸版CAM‐ICU 对谵妄评估结果的一致性,验证智能版CAM‐ICU 评估结果的准确性,为未来推广ICU 护理人员应用智能版CAM‐ICU 监测危重症病人谵妄状态提供参考。
1.1.1 纳入与排除标准 纳入标准:入住ICU 的病人;预期入住至少达到24 h;年龄50 岁以上;急性生理与慢性健康状况评分系统Ⅱ(APACHEⅡ)10 分以上。排除标准:有会影响谵妄诊断的神经系统疾病病史或精神疾病病史;不能听懂普通话,无法进行有效交流;严重视力障碍或听力障碍;持续昏迷3 d 或镇静程度评估表(RASS)评分为−4~−5 分;拒绝参与研究者。
1.1.2 样本量 采用非劣性试验比较两组计数资料的样本量计算公式:n=2×(Uα+Uβ)2×P(1−P)/δ2,估算样本量。采用单侧检验水准α,允许二类误差概率不超过β,假设智能版与纸版CAM‐ICU 的灵敏度相同,取灵敏度P=0.90,检验界值δ=0.09(一般取P的1/3~1/10,这里取1/10),α=0.05,单侧U0.05=1.645,β=0.2,单侧U0.20=0.845,计算得到样本量为137 例。
1.2.1 纸版CAM‐ICU 纸版CAM‐ICU 是Ely 等[10]根据《精神疾病诊断与统计手册(DSM‐Ⅳ)》对意识模糊评估法(Confusion Assessment Method,CAM)进行改良而成的谵妄评估工具,主要用于对ICU 病人的谵妄评估。该工具为纸质形式,评估者需要按照培训手册所示流程实施评估并填写,将病人的各特征情况进行累计,最后判断病人是否发生谵妄。该工具中文版本的灵敏度和特异度分别为93.4%和90.8%[11]。该工具分别对病人的意识基线状态波动(特征1)、注意力障碍(特征2)、意识水平改变(特征3)以及思维混乱(特征4)4 个特征进行评估,并依据以上特征的评估结果做出是否发生谵妄的判断。①特征1:需要观察病人精神状态是否与基础水平不同或过去24 h 内是否出现意识状态的波动,即与基线状况相比,或多次用RASS 评估的得分不等或有波动,如果出现上述任意1 种情况则特征1 评定为阳性;②特征2:注意缺损,让病人在听到特定字母时捏手示意或选出正确图片,如果错误超过2 个,则特征2 评为阳性;③特征3:思维紊乱,分为两部分考察,一部分为4 个常识性是非问题,共有两组问题可以交替使用,每答对1 个问题计1 分,另一部分要求病人依次完成两个指令动作,完成全部指令计1 分,两个部分总分相加<4 分则特征3 评定为阳性;④特征4:意识清晰度改变,根据病人的RASS评分判定,RASS 得分只要不为0 分则评为阳性。谵妄阳性诊断标准:谵妄阳性指特征1 和特征2 均为阳性,加上特征3 或特征4 的任意1 条为阳性。否则为谵妄阴性。
1.2.2 智能化CAM‐ICU 智能化CAM‐ICU 是一款以谵妄评估工具CAM‐ICU 为蓝本,运用计算机编程实现的交互式应用程序。评估者通过人机交互页面对病人是否发生谵妄进行评估,其页面和流程由登录界面、谵妄评估界面组成。其中,评估界面又包括3 个子界面:意识评估、注意力评估和思维评估。评估者根据系统的提示进行评估,在系统界面上依次点选病人的意识、注意力和思维评估结果,系统自动完成对病人的谵妄诊断,无须人工计算和判断评估结果[9],评估结果中,谵妄阳性指特征1 和特征2 均为阳性,加上特征3阳性或特征4 阳性则为谵妄阳性,否则为谵妄阴性。智能化CAM‐ICU 谵妄评估系统通过基线提前输入、评估时系统自动对比结果、整合RASS 量表进入系统(不需要另外查找)、自动计算病人的出错次数、自动弹缩每步的评估指导语、自动输出评估结果等智能设计,实现能用、易用、易学、可信赖的设计目的。该系统经过智能化方案设计、美工设计和雏形可用性评价等工作,已形成正式版安装于安卓系统的掌上电脑(personal digital assistant,PDA)上进行使用。
1.3.1 研究者收集纳入病人的基线资料 ①人口学资料:性别、年龄、文化程度、职业、婚姻状况、医疗费用支付方式。②临床资料:既往疾病史和手术情况,既往疾病史包括高血压、糖尿病、慢性阻塞性肺疾病(COPD)、肝功能不全、肾功能不全、心脏疾病、甲状腺功能亢进、甲状腺功能减退、痴呆、谵妄、脑卒中、抑郁症、高脂血症及其他精神或躯体疾病病史。
1.3.2 谵妄评估 按照CAM‐ICU 规定的使用方法和培训手册对3 名护理研究者进行培训后,3 名研究者按照研究对象的纳入标准和排除标准选择病人,每天09:00~11:00 评估病人。其中1 人使用纸版CAM‐ICU,另外2人使用分别安装在两个PDA中的智能版CAM‐ICU(以下简称为智能版A 和智能版B)对同一病人进行评估,由于谵妄具有波动性,因此规定3 人的评估在2 h内完成。3 名资料收集者每人只知道自己的评估结果,不知道对方的结果,填写好的纸版评估单放入信封由第4 个人保管,智能版评估结果由后台直接发送到第4 人电子邮箱中,评估结果的历史记录由系统自动进行屏蔽。
1.4 伦理审查和知情同意 ①本研究获得首都医科大学伦理委员会的审查并通过。②向研究对象承诺本调查仅属于研究性质,所有资料和结果仅用于本次研究,取得病人同意并与病人签署知情同意书。
1.5 评价指标 Kappa 值是评价临床测量结果一致性的重要指标,其主要用于评价定性测量结果的一致性,两者的值愈高,说明测定结果的一致性愈好。一般而言,Kappa 值≤0.40 时,表明一致性较差;0.41~0.60时,表明中度一致;0.61~0.80 时,表明有较高度的一致性;>0.80 时,表明有极好的一致性。
1.6 统计学方法 采用Epidata 3.1软件建立数据库,进行双人数据录入,系统逻辑检错,采用SPSS20.0 软件包进行统计分析。计量资料采用均数(x)、标准差(s)、中位数(M)、四分位间距(Q)表示;采用单样本Kolmogorov Smirnov 检 验(one‐sample Kolmogorov Smirnov test)进行正态性检验。计数资料采用百分比(率)进行描述,智能版与纸版CAM‐ICU、两智能版之间评估结果的关联性采用一致性Kappa 值进行统计分析。以P<0.05 为差异有统计学意义。
2.1 研究对象的基本特征 本研究共纳入符合入选标准的病人263例,排除57例,入选206例;入选的206例病人中,剔除12 例缺失评估结果及中途退出的病人,最终进行统计分析的病例为194 例,研究对象纳入过程见图1。纳入统计分析的194 例病人年龄(69.24±10.34)岁;其中男109例,已婚184例,住院天数4(3,6)d,中学/中专文化程度84 例,已退休143 例,术后病人146 例,医疗费用支付方式为医疗保险118 例,日常生活能力(ADL)得分为80(35,100)分。见表1。
图1 研究对象纳入流程图
表1 入选病人的基本特征(n=194)
2.2 谵妄评估结果一致性的比较
2.2.1 纸版与智能版CAM‐ICU 谵妄评估结果的一致性 在评估的194 例病人中,纸版CAM‐ICU 检测出谵妄阳性病人47 例,智能版A 检测出谵妄阳性病人49 例,其中纸版CAM‐ICU 检出阳性而智能版A 检出阴性者2 例,智能版A 检出阳性而纸版CAM‐ICU 检出阴性者4 例。Kappa 一致性检验结果显示,纸版CAM‐ICU 与智能版A 评估结果具有较高的一致性,Kappa 值为0.916,P<0.001。见表2。
表2 纸版CAM‐ICU 与智能版A 的评估一致性 单位:例
智能版B 检测出谵妄阳性病人47 例,其中纸版CAM‐ICU 检出阳性而智能版B 检出阴性者3 例,智能版B 检出阳性而纸版CAM‐ICU 检出阴性者3 例。通过Kappa 一致性检验,纸版CAM‐ICU 与智能版B 评估结果具有较高的一致性,Kappa 值为0.917,P<0.001。见表3。
表3 纸版CAM‐ICU 与智能版B 的评估一致性 单位:例
2.2.2 智能版A 与智能版B 谵妄评估结果的一致性
在评估的194 例病人中,智能版A 检测出谵妄阳性病人49 例,智能版B 检测出谵妄阳性病人47 例,其中智能版A 检出阳性而智能版B 检出阴性者2 例,而智能版B 检出阳性而智能版A 检出阴性者0 例。通过Kappa 一致性检验,智能版A 与智能版B 评估结果具有 较 高 的 一 致 性,Kappa 值 为0.972,P<0.001。见表4。
表4 智能版A 与智能版B 的评估一致性 单位:例
2.3 谵妄不同类型评估结果的一致性 谵妄根据临床表现不同分为不同类型[12],本研究依据Spronk 的分类方法[13]将谵妄评估结果分为:①活动减弱型(hypoactive state),RASS 得分为−3~−1 分;②活动型(active state),RASS 得分为0~1 分;③极度活跃型(hyperactive state),RASS 得分为2~5 分,比较智能版与纸版以及智能版A 与智能版B 之间对谵妄不同类型评估结果的一致性。
2.3.1 纸版CAM‐ICU 与智能版A 对谵妄不同类型评估结果的一致性 纸版CAM‐ICU 与智能版A 评估结果均为阳性者有44 例,二者对谵妄不同类型评估结果存在一定差异,详见表5。通过Kappa 一致性检验,纸版CAM‐ICU 与智能版A 评估结果的一致性Kappa 值为0.405,P<0.001。
表5 纸版CAM‐ICU 与智能版A 对谵妄不同类型评估结果的一致性 单位:例
2.3.2 纸版CAM‐ICU 与智能版B 对谵妄不同类型评估的一致性比较 纸版CAM‐ICU 与智能版B 评估结果均为阳性者有45 例,二者对谵妄不同类型评估结果具有较高的一致性,详见表6。通过Kappa 一致性检验,纸版CAM‐ICU 与智能版B 评估结果的一致性Kappa 值为1.00,P<0.001。
2.3.3 智能版A 与智能版B 对谵妄不同类型评估的一致性 智能版A 与智能版B 评估结果均为阳性者有47 例,二者对谵妄不同类型评估结果存在一定差异,详见表7。通过Kappa 一致性检验,智能版A 与智能版B 评估结果的一致性Kappa 值为0.407,P<0.001。
表6 纸版CAM‐ICU 与智能版B 对谵妄不同类型评估结果的一致性 单位:例
表7 智能版A 与智能版B 对谵妄不同类型评估结果的一致性 单位:例
3.1 智能版与纸版CAM‐ICU 谵妄评估结果具有很高的一致性 一致性指对同一个体用两种工具或从两种角度进行观测,测量值之间接近程度或测量效果相似性的一个指标。Kappa 值是评价临床测量结果一致性的重要指标,一般而言,Kappa 值≤0.40 时,表明一致性较差;Kappa 值为0.41~0.60 时,表明中度一致;Kappa 值为0.61~0.80 时,表明有较高度的一致性;Kappa 值≥0.80 时,表明有极好的一致性。本研究采用前瞻性队列研究设计,评价纸版与智能版CAM‐ICU 对谵妄病人评估结果的一致性,推测和验证智能版CAM‐ICU测量结果的准确性。
CAM‐ICU 是Ely 等[10]根据DSM‐Ⅳ对CAM 进行改良而成[14],该量表依据CAM 的4 个主要标准,制定了具体的评估方法,并且在谵妄评估之前加入了RASS 量表,量化意识水平的评估,CAM‐ICU 量表不需要评估者具有神经精神科知识背景,适合非精神科医护人员使用,且对病人意识状态的评估不依赖于病人的言语能力,增加了评分的客观性,尤其适用于ICU机械通气言语受限的病人[15‐19]。目前,国外多数国家已经广泛使用CAM‐ICU,CAM‐ICU 被翻译成了多种版本,例如泰国版本[15]、葡萄牙语版本[20]、瑞典版本[21]以及中文版本[14]等,经验证均具有较高的灵敏度和特异度。
智能化CAM‐ICU 依据以用户为中心的理念,以纸质原版CAM‐ICU 为蓝本,综合运用智能移动终端、计算机网络、数据库等智能化手段开发研制的交互式运用程式,旨在通过人性化、智能化、交互化的技术,解决纸版CAM‐ICU 在评估过程中便利性不强、对记忆和判断等认知资源消耗过高等方面的不足。该智能系统虽改变了纸版工具的表现形式,调整画面配色和界面布局,自动计算病人出错次数和判断结果,降低了纸版工具对护士记忆和计算能力的高要求,但未对量表的4 个特征的内容及评估流程进行改动,诊断结果的判断标准也未进行变动。因此,从理论上,智能版CAM‐ICU 应该具有纸版CAM‐ICU 的诊断准确性和可靠性,智能版与纸版CAM‐ICU 的评估结果应该具有很高的一致性。
本研究所有评估者均经过统一培训,掌握CAM‐ICU的评估方法,并且在研究正式开始之前进行了评估者间一致性检验。在研究进行过程中严格按照纳入标准和排除标准选择样本,采用连续入组法降低选择性偏倚。同一研究者对同一病人在规定的时间点只进行1 次评估,尽量避免多次重复评估,以免病人对同一问题产生记忆而影响正确的判断。所有评估者之间保持盲法,填写好的纸版评估单放入信封由第4 个人保管,智能版评估结果的记录由后台直接发送到第4 人电子邮箱中,评估结果的历史记录由系统自动进行屏蔽。通过以上质量控制措施,尽可能地避免选择偏倚和信息偏倚,保证了评估结果的真实性。结果显示,智能版A 与纸版CAM‐ICU 评估结果的一致性Kappa 值为0.916,智能版B 与纸版CAM‐ICU 评估结果的一致性Kappa 值为0.917,智能版A 和智能版B 评估结果之间的一致性Kappa值为0.972,三者均具有统计学意义(P<0.001)。以上结果表明,纸版与智能版CAM‐ICU 的评估结果具有较高的一致性,说明智能版CAM‐ICU评估谵妄病人结果的准确性不低于纸版CAM‐ICU。智能版CAM‐ICU 与纸版CAM‐ICU 的评估结果未完全一致,例如纸版CAM‐ICU 检出阳性而智能版A 检出阴性者2 例,智能版A 检出阳性而纸版CAM‐ICU检出阴性者4 例。纸版CAM‐ICU 检出阳性而智能版B检出阴性者3 例,智能版B 检出阳性而纸版CAM‐ICU检出阴性者3 例。可能的原因为3 名研究未同时评估病人,由于谵妄具有波动性,不同时间点评估会有差异。但从总体结果来看智能版和纸版评估结果的一致性很高。
3.2 智能版与纸版CAM‐ICU 对谵妄不同类型的评估结果有一定差异 智能版与纸版CAM‐ICU 以及智能版A 与智能版B 之间对谵妄不同类型评估结果的一致性结果显示,纸版CAM‐ICU 与智能版B 对谵妄不同类型评估结果具有很高的一致性,而纸版CAM‐ICU 与智能版A 对谵妄不同类型评估结果存在着一定的差异,可能原因为临床谵妄病人存在混合型谵妄,国内研究显示,临床混合型谵妄病人占34.3%[22]。混合型谵妄的特征是活动减弱型和极度活跃型表现在同一病人交替出现[23]。而由于不同版本评估者评估时并非同时进行,由于混合型的这个特征,导致不同评估者评估时,病人的谵妄类型可能已转换,从而导致了智能版之一在评估谵妄类型上与纸质版的一致性不够高。另外,两个智能版评估者之间一致性也存在差异,其可能的原因也与上述推断相同。再者,由于谵妄阳性的病人在数量上还不够多,对不同类型的评估一致性判断上还存在一定限制。
另外,评估结果显示,虽然纸版与智能版CAM‐ICU以及智能版A 与智能版B 的RASS 评分不完全一致,但是谵妄最终评估结果仍然都为阳性,此现象应是CAM‐ICU 对谵妄是否阳性的判断规则所致。在其判断规则中,RASS 评分只是CAM‐ICU 评估谵妄的特征之一,CAM‐ICU 评估谵妄的最终结果是由病人的意识基线状态波动、注意力障碍、意识水平改变以及思维混乱4 个特征决定,判断病人谵妄阳性需同时满足特征1(意识基线状态波动)和特征2(注意力障碍)均为阳性,加上特征3(意识水平改变)或特征4(思维混乱)的任意一条为阳性。RASS 评估的结果主要代表意识水平的改变情况,无论病人是活动减弱型还是极度活跃型,只有同时再满足意识基线状态波动和注意力障碍均为阳性,其谵妄最终评估结果才为阳性。本研究中,纸版CAM‐ICU 与智能版A 以及智能版A 与智能版B 之间对谵妄不同类型评估结果还存在一定差异,这可能与病人为混合型谵妄有关,未来可扩大样本量、增加谵妄阳性病人例数进一步进行验证。
3.3 本研究存在的局限性 本研究存在一定的局限性,由于评估者在1 d 内未对病人进行多次评估且采用的谵妄分类方法中无混合型的分类,因此单凭1 d的1 次评估结果来对比两种方法在不同类型上的评估一致性,可能造成评估结果的一致性不高,未来可扩大样本量、增加谵妄阳性病人例数进一步进行验证。
本研究采用前瞻性队列研究设计,评价智能版CAM‐ICU 与纸版CAM‐ICU 对谵妄病人评估结果的一致性,进而验证智能版CAM‐ICU 评估结果的准确性,为未来推广ICU 护理人员应用智能版CAM‐ICU监测危重症病人谵妄状态提供参考。研究结果得出,智能版A 与纸版CAM‐ICU 评估结果的一致性Kappa值为0.916,智能版B 与纸版CAM‐ICU 评估结果的一致性Kappa 值为0.917,智能版A 和智能版B 评估结果之间的一致性Kappa 值为0.972,智能版与纸质版CAM‐ICU 谵妄评估结果具有很高的一致性。