姜超++李国春
摘要目的本研究对南京中医药大学选修《医学统计学》课程的2013级本科生的188份期末考试试卷进行评价分析,为评定教学效果和教学质量提供依据。方法运用教育测量学理论和教育统计学方法对试卷进行评价,采用难度、区分度、信度(Cronbachα系数)对188份《医学统计学》期末考试试卷进行质量分析。结果该试卷的笔试平均成绩为74.63±12.20,最低分为43分,最高分为96分,平均难度为0.74,区分度为0.31,信度系数为0.73。结论该考卷平均难度适中,具有较好的区分度、信度,适合进行本科生医学统计学的期末测评。制卷时侧重于应用的考察将会获得更好的效果。
中图分类号:G71 文献标识码:A 文章编号:1672-3791(2016)10(c)-0000-00
医学统计学是运用概率论与数理统计的原理和方法研究医学科研中的有关数据的收集、整理、分析和推断应用性学科[1],也是提高医学高等院校学生水平的必修课程。为了了解本校此门课程的教与学的效果,给教学和制卷工作提供重要的反馈信息。本文通过对2013级选修此门课程学生的期末考试试卷进行分析,希望借此评价试卷质量,了解各专业学生知识的掌握程度,为进一步提高教学质量和制卷水平提供参考。
1. 材料和方法
1.1 材料
我校2013级本科生选修《医学统计学》的学生期末考试试卷,采用整群抽样的方法,从中选取了3个专业5个班级,共188分试卷。试卷严格遵守教学大纲和教材,注重对学生基本知识、基本理论、基本技能的考核,并注重对学生简单应用能力的考核。
1.2方法
试卷分析采用目前国内较为常用的指标,包括试卷信度、难度、区分度等指标[2-4]。
信度是指考试的可靠性或可信程度,它指的是采取同样的方法对同一对象重复进行测量时,其所得结果相一致的程度。从另一方面来说,信度就是指测量数据的可靠程度。信度高的试题很少受到外部因素的影响,对不同学生的多次测试都会产生相对稳定和一致的测试结果。
常用的信度指标为Cronbachα系数,计算公式为。k为测试的题目个数, 为所有被试者在第i道题上的分数变异, 为测试总分的变异。
难度是指试题的难易程度,它作为衡量试题质量的主要指标之一,是衡量试题质量的一个重要指标参数,与区分度共同影响并决定试卷的鉴别性。难度的计算一般采用某试题的通过率或平均得分率。较好的测验大部分的难度P值应介于0.2~0.8之间。
难度的计算方法为:
客观题 (k为答对该题的人数,N为参加考试的总人数)
主观题 (x为试题的平均得分,M为该题的满分)
为进一步计算区分度采用极端分组法计算难度,其具体步骤为:1、将考生的总分由高到低排列;2、从高分开始向下取全部试卷的27%(即188*27%=50份)作为高分组;3、从最低开始向上取全部试卷的27%(即188*27%=50份)作为低分组;4、分别计算出高分组的难度PH及低分组的难度PL;5、最后计算出PH和PL的平均值
区分度是指一道题能多大程度上把不同水平的人区分开来,也即题目的鉴别力。区分度越高,越能把不同水平的受测者区分开来,该题目被采用的价值也就越大。区分度D的取值范围-1~1。一般要求试题的区分度在0.2以上。当D>0.4时,说明该题目能起到很好地区分作用;当D<0.2时,说明该题目的区分作用很差。
1.3统计分析
利用SPSS 18.0统计软件和Excel對成绩的分布特征及试卷的信度、难度、区分度等指标进行统计分析。
2.结果
2.1 试卷内容与结构
本张试卷内容涵盖了医学统计学的基本概念、t检验、方差分析、卡方检验、秩和检验、相关和回归分析等。由选择题、名词解释、简答题、案例分析等部分组成,题量与分值设置见表1
2.2考试成绩的基本分布特征
用SPSS18.0统计软件对总分进行统计描述。结果显示考试成绩呈负偏态呈分布,参加考试188名学生中,最高分96分。最低分43份,平均分74.63分。各分数段人数见表2
2.3各专业成绩比较
本次调查共选出3个专业共5个班级,各专业考试成绩见表3
由表可见三个专业的学生考试成绩差别有统计学意义(F=25.87,P=0.000)。两两比较发现营养专业与护理专业分数有统计学意义(P=0.000)与中医班分数也有统计学意义(P=0.000)。
2.4试卷质量分析
2.4.1 信度分析利用Excel作信度分析,得到本卷的Cronbachα系数为0.73。普通试卷要求α>0.5,标准试卷要求α>0.7,说明整体考试结果可以信赖,该试卷能够反映学生的真实能力。
2.4.2 难度与区分度分析 分别计算各种题型的难度系数和区分度,结果见表4。四种题型的难度均介于0.2~0.8之间,试卷整体难度为0.74,难度适中。其中案例分析题难度最大,名词解释难度最小。试卷总体区分度为0.31,其中简答题区分度为0.15<0.2,较差;单选题、名词解释区分度分别为0.32、0.20介于0.20~0.29之间,一般;案例分析区分度为0.5>0.4,优秀,整体试卷质量较好。
2.4.3试卷质量分析运用教育测量学理论,计算所有试题的难度系数和区分度对试题质量进行综合分析,结果见表5。本试卷良好试题占比为66.6%,可以认为试卷质量比较令人满意。
3.讨论
由试卷质量的分析可见本套试卷信度指标Cronbachα系数为0.74,可信度较高,试卷较真实地反应了学生的真实情况;难度系数0.74、区分度0.31。试卷难度设计适当、覆盖面广,试卷质量较高。但是在制卷过程中还有需要注意的地方。名词解释的题型对于学生考核的区分度不高,学生也较易得分。这由于部分学生在应试的过程中主要是通过死记硬背的方法,因此并不能很好的反应学生真实掌握的情况。需要在以后的制卷工作中加以调整。
此次考试学生发热平均成绩为74.63±12.20,成绩曲线成负偏态分布,从学生成绩看有接近40%的同学在80分以上,取得了较理想的分数,从中反映出这些同学对于基本知识、概念掌握较好并且能灵活应用解决实际问题。但也有部分同学成绩较差,主要原因是案例分析题失分较多,这反映出这部分同学虽然对基本概念和知识掌握较好,但是对统计分析方法的运用以及解决实际问题的能力还有待提高。通过不同专业学生成绩的比较,我们发现营养专业的学生获得了更加理想的成绩。这部分得益于我们新的教学尝试,对于营养专业的学生我们在讲授理论课的同时适时的增加了SPSS软件操作步骤和结果解读的讲解。更丰富也更接近实践的锻炼有效的提高了他们灵活运用统计知识解决实际问题的能力。
对于提高解决实际问题的能力,我们认为将理论课与SPSS实践相结合,教学过程中甄选案例,适时的补充SPSS软件的操作步骤和对结果的解读将会取得不错的教学效果。这样的方法可以帮助学生从繁杂的公式记忆和计算工作中解脱出来,从而使其注意力转移到对统计学方法的应用条件的理解和对统计结果的判断上,角色从计算的执行者转变成为对结果的决策者。让同学们充分体会到统计学解决问题后所带来的快乐和成就感,有助于提高学生对医学统计学的学习兴趣及动手能力、实际解决问题能力的提高。
参考文献
[1]孙振球.医学统计学[M].北京:人民卫生出版社,2010:1.
[2]许志强,周华东,李静等.试卷分析系统在神经病学教学中的应用[J].重庆医学,2010(10):1311-1312.
[3]熊石龙,王前,郑磊等.临床医学八年制实验诊断学试卷分析与思考[J].中国实验诊断学,2011(3):563-565.
[4]蔡琳,许能峰,何保昌等《流行病学》试题库的应用与分析[J].福建医科大学学报(社会科学版).2010(3):30-32.