护理本科生临床推理能力评估工具的研究现状

2024-04-22 07:20石国凤卜梦兰梁远俊陈宗梅
全科护理 2024年7期
关键词:效度信度条目

彭 娟,石国凤,卜梦兰,饶 柳,梁远俊,陈宗梅

临床推理(clinical reasoning,CR)是指将已收集的信息与专业人员的知识和既往经验相结合并用于做出高效决策的智力活动,是临床判断、适当决策、提高护理质量、元认知意识和护理专业能力的认知过程[1]。临床推理是医疗保健专业人员的基本特征,被认为是专家护士的标志[2]。我国新入职的护理人员普遍缺乏临床推理能力,这可能会增加护理不良事件的风险,从而影响护理工作质量和病人安全[3-4]。有效的临床推理能力与病人预后呈正相关,新护士缺乏临床推理或识别和管理危重病人情况的能力,可能是阻止他们及时提供评估和做出决策的主要原因[5-7]。国外研究者调查了5 000余名毕业护理本科生(以下简称护生),发现23%的护生在大多数情况下缺乏识别病人病情变化的能力,尽管54%的护生能够识别此类问题,但也未能完全对病人病情变化做出及时、准确的决策[8]。护生作为未来临床护士的主力军,在校期间培养并评估其临床推理能力颇为重要,选择合适的工具准确评估其临床推理能力对于管理识别和预防此类问题具有重要意义。因此,本文通过对护生临床推理能力评估工具的内容、特点、有效性及适用性进行综述,以期为护生选用合适的评估工具,尽早制订针对性干预措施提供参考。

1 传统临床推理能力评估方式

传统临床推理能力是在查房、实习等过程中以口述的方式进行非正式评估[9]。由于这些评估方式在不同程度上存在缺乏结构、缺乏标准化、主观评分、案例选择偏差和评分者之间可靠性低等问题,进一步降低了此类方式作为临床推理衡量标准的可靠性和有效性。因此,传统的临床推理评估方式并不适用于当前医疗环境复杂的情况下进行评估。

2 国内外护理本科生临床推理能力评估工具

2.1 批判性思维工具(Critical Thinking Instruments,CTI)

目前,国内外应用的批判性思维工具主要包括加利福尼亚批判性思维倾向问卷(California Critical Thinking Dispositions Inventory,CCTDI)、加利福尼亚临床思维技能测试问卷(The California Critical Thinking Skill Test,CCTST)以及沃森-格雷瑟批判性思维测试量表(Watson-Glaser Critical Thinking Appraisal,WGCTA)等,其中CCTDI在国内应用最为广泛。CCTDI是Facione等[10]于1992年基于美国哲学学会提出的批判性思维理论编制而成[11]。该量表共75个条目,由7个不同维度组成,即寻找真相、开放思想、分析能力、系统化能力、批判思维的自信心、求知欲和认知成熟度,采用Likert 6级评分法,非常同意计1分,非常不同意计6分,总分越高表示批判性思维能力越强,其内部一致性系数Cronbach′s α系数为0.90,具有良好的信度与效度[12]。CCTDI由彭美慈等[13]修订汉化,共有70个条目,总分最高为470分,批判性思维能力与最终得分结果成正比。由于该量表的条目数过多且结构的复杂不稳定性不利于评估医学生的批判思维能力,因此杨光媚等[14]对该量表进行了简化,包括6个维度(与未简化的量表相比删减了开放思想维度),31个条目,每个条目赋值1~6分,总分31~186分,内部一致性系数Cronbach′s α系数为0.865,重测信度为0.813,具有良好的信度与效度。胡婧[15]研究表明,批判性思维量表与临床诊断思维问卷各因子的相关系数较高,是临床推理的重要组成部分[16]。因此,批判性思维量表也可作为临床推理的评估工具之一,CCTDI的优点在于量表的内容趋于中性且不受学科、专业和文化背景的限制[10]。

2.2 脚本一致性测试(The Script Concordance Test,SCT)

SCT是Charlin等[17]于1998年基于脚本理论发展而来的一种测评工具,旨在不确定的情况下评估临床技能不同方面的临床推理[18]。SCT最初是以笔试的方式进行评估,测试的标准内容通常包括20个案例以及根据案例所编制的60个项目,在评分前需要各专家在未接受临床推理能力训练的情况下进行预测验,并根据学生与专家所选择的答案是否一致来进行评分[19-20]。SCT的基本步骤包括:1)测试的内容需要为考生提供几种典型的临床案例,其中每个案例都需要3个或4个项目进行评估,且给出临床情景的信息是模糊、复杂或不完整的。2)评分需要建立一个参考小组,在选择参考评分小组时需要10~20名相关领域富有经验的研究专家[21]。3)测试项目的得分由选择该题的专家数决定,选择的专家越多则得分越高,据文献报道[22],测试所得的分数与临床经验成正比。SCT在评估护生临床推理能力方面具有良好的信度与效度,其Cronbach′s α系数为0.855[19]。

Ross等[23]研究表明,SCT是一种可靠有效的评估临床推理能力的测评工具,可用于评估护生和临床经验丰富的护理人员。SCT的优点在于:1)提供了一种更可靠、更客观的评估临床推理的方法;2)更易于管理和评分;3)与其他评估工具相比更节约成本。尽管SCT在国外已经广泛应用于医学领域,如临床医学、护理教育、口腔医学、药学等都已得到有效验证[21-25],但SCT在护理教育领域还尚未引入国内。

2.3 临床推理与反思自评量表(Self-Assessment of Clinical Reflection and Reasoning,SACRR)

SACRR最初是由Royeen等[26]于2001年基于Roth[27]提出的推理理论编制而成,后由Seif等[28]进一步修订编制。该量表共有26个条目,采用Likert 5级评分法,1分表示非常不同意,5分表示非常同意,总分为180分,得分越高表示临床推理能力越强,内部一致性Cronbach′s α系数为0.92,具有良好的信度与效度。SACRR是通过一个在线调查工具软件来进行管理,主要评估学生的临床推理能力。中文版SACRR由俞杰等[29]修订汉化,汉化后与前者的区别在于将该量表的26个条目划分成4个维度,分别是信息系统化、分析问题、寻找真相和反思能力,其4个维度Pearson相关系数分别为0.711,0.653,0.546,0.923,内部一致性Cronbach′s α系数为0.754,重测信度为0.785,具有良好的信度与效度[29]。相比于现有的测评方法,中文版SACRR具有以下优点:1)避免了在改善教学方法过程中评价者间一致性的影响;2)省时省力、简单易行便于使用。适用范围:1)评估护生临床推理能力;2)在情景模拟教学中,作为护生的自评工具;3)对教学方法的自我评价与反思。

2.4 Lasater临床判断量表(The Lasater Clinical Judgment Rubric,LCJR)

LCJR是Lasater[30]于2007年基于Tanner[31]提出的临床判断模型与Benner[32]提出的新手到专家模式编制而成,旨在评估护生在模拟病人护理情景中的临床判断。LCJR共11个条目,由4个维度组成,即观察、解释、反应和反思,采用Likert 4级评分法,1分表示非常不熟练,4分表示非常熟练,总分11~44分,得分越高表示临床判断能力越强,其内部一致性Cronbach′s α系数为0.974,重测信度为0.908,具有良好的信度与效度[33]。LCJR由王敏等[34]修订汉化,各维度Cronbach′s α系数为0.615~0.722,总量表的Cronbach′s α系数为0.896,重测信度为0.901,具有良好的信度与效度。研究发现,LCJR不仅适用于模拟情景中对护生临床判断行为的评价,也适用于临床综合实践能力的评价[34],其优点是基于临床判断理论融合质性与量性的研究方法[35],在评估护生临床判断方面更具有可靠性与有效性。

2.5 护士临床推理量表(Nurse Clinical Reasoning Scale,NCRS)

NCRS是由Liou等[36]于2016年编制而成,以临床推理模型为导向,能准确、简便地评估护理人员及护生的临床推理能力。该量表最初产生了24个条目,后经专家的评审减少到15个条目,通过让学生进行自我报道,如“我知道如何快速收集入院病人的健康信息”和“我可以应用适当的评估技能来收集病人当前的健康信息”等项目来调查护生的临床推理能力[37]。采用Likert 5级评分法,1分表示非常不同意,5分表示非常同意,得分为15~75分,得分越高则表示临床推理能力越强,其Cronbach′s α系数为0.9,具有良好的信度与效度。NCRS由王玉静[38]修订汉化,各项条目效度均在0.8~1.0,Cronbach′s α系数为0.867,量表总效度为0.987,具有良好的信度与效度。修订后的条目更加符合中国大陆的语言形式,更有利于大陆医学生使用。NCRS的局限在于研究群体均是来自同一所大学护理本科预毕业生和同一所医院非随机抽取的临床护理人员,其临床推理能力结果可能会受到一定的影响[39]。因此,考虑到样本的局限性,还需进一步扩大研究群体和地域,以证实NCRS的有效性和可靠性。

2.6 临床推理评估模拟工具(The Clinical Reasoning Evaluation Simulation Tool,CREST)

CREST是Liaw等[40]于2018年基于Levett-Jones等[41]提出的临床推理模型编制而成,旨在评估护生在模拟环境中识别和应对病人病情恶化的临床推理技能。临床推理模型分为8个过程,即收集线索、处理信息、确定问题、计划、行动、评估结果与反思和学习,这些过程被用作CREST的分量表。CREST共11个条目,采用Likert 5级评分法,1分表示非常不同意,5分表示非常同意。研究者在证明CREST的信度与效度时,选取了30名护生在关于低血容量性休克病情恶化的模拟情景中进行验证,其分量表组内相关系数(ICC)在0.63~0.88之间,内部一致性Cronbach′s α系数为0.92,具有良好的信度与效度[40]。CREST的局限性在于进行信效度检验时,只选取了一个模拟情景对其进行验证,研究的样本量也仅选取了30名护生,需进一步扩大研究样本量,以证实CREST的有效性和可靠性。目前,CREST尚未汉化。

2.7 临床推理量表(The Clinical Reasoning Scale,CRS)

CRS是Huang等[42]于2023年基于护理专业学生临床推理能力[43]的框架编制而成,其概念框架由临床推理的4个领域组成,每个领域包括2~4个指标,总共构成了13个相互关联、相互交织的临床实践能力指标。第1个领域:“临床线索的认知”包括4个指标,即“拥有敏锐的观察力、应用过去的生活经验、掌握专业的知识与技能以及为病人提供便利的意愿”;第2个领域:“临床问题的确认”包括4个指标,即“寻找临床线索、解释临床线索的含义、将理论与实践相结合和识别重要的临床信息”;第3个领域:“行动的确定与实施”包括3个指标,即“确定优先问题、验证假设答案和解决病人问题”;第4个领域:“评价与反思”包括2个指标,即“解决问题有效性的评价和自我评价与改进”。CRS共16个条目,采用Likert 5级评分法,1分表示非常不同意,5分表示非常同意,总分16~80分,分数越高表示临床推理能力越强,4个领域Cronbach′s α系数分别为0.801,0.789,0.830和0.839,总量表的Cronbach′s α系数为0.894,具有良好的信度与效度[42]。CRS的优点在于评价的领域广泛,能够较全面评估护生的临床推理能力,也可应用于教育者对教学方法的改进以满足护生的学习需求。此外,CRS的研究对象包含1 504名护生,表明CRS在护生中具有较高的适用性,但此量表尚未汉化。

3 评估工具的基本特征比较

本文纳入的评估工具以不同的理论为基础,其中NCRS与CREST来自相同的理论模型。CREST、LCJR与SACRR均可在模拟情景中对护生临床推理能力进行评估[44]。在这些评估工具中,每个量表各有其优点及适用性,相比于其他评估工具,LCJR、CREST条目数更少,但LCJR应用更为广泛,目前已被翻译为西班牙[44]、荷兰[45]等多个版本。CCTDI、SCT及NCRS适用人群分别为医学生、护生及临床护士,其余量表研究对象均为护生,国内学者在引用国外评估工具时应综合考虑其文化的差异性及适用性,尽可能选择本土化的评估工具。此外,CREST与CRS尚未汉化。见表1。

表1 护理本科生临床推理能力评估工具的基本特征

4 评估工具存在的问题及启示

本文纳入的评估工具尚存在以下不足:1)尽管批判性思维工具可作为临床推理能力的评估工具之一,但目前少有相关文献对其针对护生临床推理能力的评估是否具备有效性与适用性,国内研究者可从这一角度进行验证。2)国内少有针对模拟情景中评估护生临床推理能力的特异性评估工具,后续研究中可针对特殊情景开发本土化的评估工具。3)CREST、CRS尚未检索到中文版本,其信效度在国外均已得到有效验证,国内学者可进一步汉化并验证其有效性与适用性。4)国内缺失原创的高质量护生临床推理能力评估工具,国内学者应重点关注并积极开发适合我国国情和本土化的评估工具。5)本文纳入的一部分评估工具在验证其信效度时对研究对象与地域具有选择性,其信效度还需进一步验证。

5 小结

护生临床推理能力的培养与评估日益成为护理教育的重点和核心,如何准确、有效的评估其发展水平仍是持续存在的挑战[19]。本文介绍了国内外护生临床推理评估工具的应用情况,着重探讨、分析了不同工具的优点、适用性及评价内容与评价方法上的差异。在众多护生临床推理评估工具中,少有报道关于其金标准的评估工具。后续研究中,国内学者可将未汉化的量表积极引入、汉化,编制适合我国国情和本土文化的评估工具,以准确识别、评估护生的临床推理能力,及早制定针对性干预措施,降低护生在未来工作中带来的负面影响,提高护理工作质量。

猜你喜欢
效度信度条目
《广东地区儿童中医体质辨识量表》的信度和效度研究
慈善募捐规制中的国家与社会:兼论《慈善法》的效度和限度
《词诠》互见条目述略
Can we treat neurodegenerative diseases by preventing an age-related decline in microRNA expression?
科技成果评价的信度分析及模型优化
耳鸣残疾问卷中文版的信度和效度检验及其临床应用
被看重感指数在中国大学生中的构念效度
外语形成性评估的效度验证框架
中文版脑性瘫痪儿童生活质量问卷的信度
复杂图形测验对区分阿尔茨海默病与非痴呆的诊断效度