苗 壮,逯欣宇,吕正帅,王 芳,闻庆平
(大连医科大学附属第一医院,辽宁 大连 116011)
客观结构化临床考试(Objective Structured Clinical Examination,OSCE)又称临床多站考试(Multiple-station Clinical Examination,MSE),是由Harden R M等于1975年提出的一种考核模式[1],考核者可根据被考核者的专业以及考核目的自行设计考核内容。医学OSCE考站包括病史采集、体格检查、临床沟通、病例分析等,采用标准化病人(Standardized Patient,SP)模拟临床真实场景,能更客观评价医学生或临床医生的职业技能,被认为是评价知识、技能和沟通能力等临床综合能力的“金标准”,被广泛应用[2]。
大连医科大学麻醉学专业本科临床实习考核包括3部分:临床实习准入考试、实习阶段考核及出科考试。2018年,麻醉学系首次将OSCE引入麻醉学专业本科临床实习考核,以期综合评价学生临床能力,通过以考促改的方式提升临床教学质量。1对象与方法
研究对象为大连医科大学麻醉学专业四年级本科生,刚刚通过麻醉临床技能培训、临床麻醉学考试及外科临床技能OSCE。
本科临床实习准入考试为百分制,60分为及格,通过者可进入临床实习。OSCE内容涉及外科及麻醉临床技能操作和临床麻醉学,共设5个考站,包括技能操作(3站)、临床问诊(1站)和病例分析(1站)。其中临床问诊考站为SP考站,SP由麻醉科临床医师扮演。病例分析考站为理论答题,内容涉及辅助检查报告阅读与分析、病情分析和急诊处理等。每个考站6分钟,总考核时间为30分钟,每站满分100分,将各考站成绩换算成百分制即为考生总成绩。
共有两个班62名学生参加考试。每个班按学号分成6组,无缺考。
考试结束后举行考试总结会,由考官对各考站存在的问题进行分析。对所有考生进行问卷调查,获得考生对本次考试的主观评价,了解其对考核方法的认可度。所有问卷均由经培训的专业调查员现场调查、收回并录入数据库。
描述性分析:计量资料采用Kolomogorov-Simirnov进行正态分布检验,根据资料类型选择均值、标准差或中位数、四分位间距、最大值和最小值进行描述;计数资料采用合格率及构成比等描述。
信度和效度分析:各考站内部一致性信度采用Cronbach’s α系数评价,效度采用Spearman相关分析评价。
难度和区分度分析:试卷难度以P表示:P=X/M(X为试卷平均得分,M为试卷满分);试卷区分度(D)=2(XH-XL)/W,其中D为试卷区分度,XH为高分组(前26%的考生)平均分,XL为低分组(后26%的考生)平均分,W为试卷总分。
采用SPSS 22.0软件进行统计学分析,检验水准α=0.05,P<0.05表示差异有显著性。
本次考试合格率为100.0%,OSCE总成绩呈正态分布(P=0.200),为(79.81±6.43)分,各考站平均成绩及合格率见表1。
表1 临床实习准入考试各考站平均成绩及合格率
对各考站成绩进行正态性检验,结果显示,除第一站外,其余各站成绩均呈非正态分布(P<0.05),故本研究用中位数描述其集中均势,用最小值、下四分位数、上四分位数和最大值描述离散程度,见表2。
表2 临床实习准入考试各考站成绩正态性检验和描述性分析
2.2.1 信度 各考站内部一致性信度Cronbach’s α系数为0.240,提示OSCE内部一致性信度一般;技能操作类考站内部一致性系数为0.675,说明内部一致性信度较好。
2.2.2 效度 对考生OSCE总成绩与麻醉临床技能考试成绩进行Spearman相关性分析(r=0.263,P=0.039),两者显著正相关。除SP临床问诊考站外,各考站成绩与总成绩之间均显著相关。不同考站间Spearman相关分析结果见表3。
表3 临床实习准入考试各考站间Spearman相关性分析结果
5个考站的难度系数为0.71~0.92,OSCE总体难度系数为0.80,说明试题偏简单。5个考站的区分度为0.37~0.81,OSCE总体区分度为0.30,说明本次OSCE对不同能力学生的区分度较高。各考站难度系数及区分度见表4。
表4 临床实习准入考试各考站难度及区分度
发放调查问卷62份,回收有效问卷62份,有效回收率100.0%,问卷调查结果见表5。
表5 问卷调查结果
98.4%的学生认为开展OSCE非常必要,88.72%的学生认为考站数目设置合理,91.94%的学生认为考站时间设计比较合理,96.77%的学生认为有助于了解自身薄弱环节,提高对临床技能和临床思维的重视程度。
临床实习是培养医学生逻辑思维和实践能力的重要阶段,对学生理论知识和基本技能有一定要求[3]。实行临床实习准入制度有利于提高学生对实习的重视程度,发现学生薄弱之处,使学生在实习过程中有目的和针对性地进行学习与训练。本次研究对象刚刚通过麻醉临床技能培训、临床麻醉学考试及外科临床技能OSCE,对于临床麻醉学的基础知识和基本技能以及OSCE形式均有一定了解,不会有畏难情绪,因此本次考试时间点选择适宜。
本次考试各考站合格率为79.00%~96.80%,说明考生临床技能操作掌握较好,但缺乏临床思维。
信度是指测验结果的精确度、一致性和可重复性,是评价考试成绩可靠性的一个重要指标[4],目前最常用Cronbach’s α系数判断。Cronbach’s α系数与考试结果的关系为:α<0.3时结果不可信,0.3≤α<0.4时结果勉强可信,0.4≤α<0.5时结果可信,0.5≤α<0.7时结果较可信(最常见),0.7≤α<0.9时结果很可信(次常见),α≥0.9时结果十分可信[5]。
本次考试所有考站内部一致性信度Cronbach’s α系数为0.240,前3站技能操作类考站内部一致性信度Cronbach’s α系数为0.675。
OSCE的内部一致性信度通常较低,且由于各考站侧重点不同,考生技能掌握程度也不尽相同,因此信度系数范围较大,已报道的 OSCE 的 Cronbach’s α 系数多为 0.100[6]~0.929[7],国内相关研究认为OSCE考站信度在0.12~0.9为可接受信度[7]。2014年,一项Meta分析显示,国内OSCE的Cronbach’s α系数为0.648,国外为0.745,略高于国内[8]。本次考试结果处于可接受的信度范围。影响本次考试信度的因素主要有以下两方面:第一,考站数目较少。为减少财务支出,减轻考生、考官负担,本次考试仅设置5个考站,较其他研究少。第二,考站内容涉及范围广,影响考试信度。影响OSCE信度的因素主要有考站设计和考生表现两方面。若提高考试信度,可缩小考核范围,适当增加考站数量或考核内容相似的考站数量,也可通过细化评分表、延长考试时间、增加考官数量、设置书面测验考站等手段提高OSCE的可靠性[9-12]。
效度是评价考试有效性的重要指标。本次OSCE总成绩与麻醉临床技能考试成绩显著正相关。除SP临床问诊考站,其他考站成绩与总成绩之间的相关系数较高,考站内部相关系数也较高,说明本次考试结构效度尚可。但由于OSCE各考站内容的关联程度不高,且考生掌握程度也不尽相同,因此OSCE结构效度一般都不高,国内外相关研究也较少。
难度和区分度是检验试题及试卷质量的主要指标。本研究中,5个考站的难度系数为0.71~0.92,OSCE总体难度系数为0.80,难度不高,这与本次OSCE以基本知识和技能考查为主有关,提示在未来应适当增加试题难度。
区分度反映考试对考生学习能力的区分情况。区分度(D)的评价标准为:D<0.2时区分不好,0.2≤D<0.3时区分尚可,0.3≤D<0.4时区分良好,D≥0.4时区分非常好[13],<0.2的试题区分度不好应被淘汰。本次考试5个考站的区分度为0.37~0.81,总体区分度为0.30,说明对不同能力考生区分度较好,适宜性尚可。
问卷调查结果显示,大部分考生认为开展OSCE非常必要,并对考试时机选择、考站内容及数目设置比较满意,对SP认可度较高,认为OSCE能够较好地评价学生理论知识、临床思维能力和技能水平,提高学生对临床技能及临床思维的重视程度。然而问卷调查也发现一些问题,如7名学生反映SP临床问诊考站时间太短,还有的学生建议可将OSCE应用于毕业考试等。
总之,本次研究通过分析OSCE成绩以及问卷调查,证实OSCE的适宜性及有效性,即全面评价学生临床综合能力,反馈学习的薄弱环节,可针对性地指导后续教学工作,是一项有效的测评方法。未来将优化考试方案,逐步将OSCE应用于临床麻醉实习阶段考核、出科考试及毕业考试。
本研究也存在一些问题,比如SP临床问诊考站仅由SP一人打分,信度相对较低,未来可增设一名考官,取两者平均值。此外,还应细化评分标准,加强考官和SP同质化培训,优化考站时间和考站数目等,提高考试信度和效度。