□陈蓓琴 史玉凤 韩艳
近年来,普通话测试的人群不断扩大,其中包括聋人这一特殊群体。本文采用全国首期特教学校听障从教人员普通话水平替代性测试为分析对象,使用经典测量理论重点分析了听障人员普通话水平测试的难度、区分度、信度、效度,发现各指标均在合理的范围内,可为当前听障人员普通话水平测试提供统计和测量理论的数据支持。
目前,越来越多的职位已经实行普通话持证上岗制度,普通话登记证书成为获得职业的必要条件。近年来,参加普通话测试的人群不断扩大,其中包括聋人这一特殊群体。长期以来,由于听障原因,绝大多数听障人员(俗称聋人)很难通过现行普通话水平测试。所以,聋人一直强烈希望和呼吁能够有一种适合聋人的替代性的普通话水平测试方式来真实反映他们的普通话水平(吴月芹,2015)。2015年4月17日,在南京特殊教育师范学院首次举行全国首期特教学校听障从教人员普通话水平专场测试。听障人员普通话水平测试作为国家对特殊人群实施汉语语言能力的测试,要求测试必须科学、客观、准确、公正的反映听障人员掌握和运用普通话的真实水平。当前,听障人员普通话水平替代性测试,在测试的手段形式、测试内容、题型构成、量化评定上需要统计和测量相关理论数据的支撑。
本文基于经典测量理论,采用统计学方法对听障人员普通话水平替代性测试中的信度和效度分别进行量化分析。林海燕和赵寰宇(2009)指出,题型的选择、试题的难易程度、主观试题评分都会影响语言测试的信度和效度。重点分析听障人员普通话水平测试的难度、区分度、信度、效度,为当前听障人员普通话水平测试提供统计和测量理论的数据支持。
本研究所涉及的对象为江苏省特殊教育学校听障从业人员,以2017年江苏省南京市特殊教育师范学院为考点的67名听障应试者测试得分为样本。
听障人员普通话水平替代性测试试卷由四部分构成:读单音节字词(10分)、读多音节词语(20分)、朗读短文(30分)、命题说话(40分),满分为100分。对每道题的得分进行详细登记,各题目得分描述性统计如表1所示。
表1 各题目得分描述性统计
全部听障教师普通话水平达到“三甲”以上,其中,达到“三甲”(70-80分)共有6人,占比8.96%;达到“二乙”(80-87分)共47人,占比70.15%;达到“二甲”(87-92分)共14人,占比20.90%;达到“一乙”以上水平,共0人。普通话测试平均分为83.11分,标准差为4.02,最低分为70.30,最高分为89.70,偏度为-1.01,峰度为1.69,说明分数的分布呈现负偏态,分布大多集中在中等分数阶段。
难度是衡量试题与试卷难易程度的指标,试卷的难度系数是测验总分的平均得分率;试题的难度系数是试题的平均得分率。难度系数越大,试题越容易。
在教育测量中,难度常采用如下公式:
试卷难度公式:
具体测算结果如表2所示,听障人员普通话水平替代性测试第一题“读单音节字词”的难度为0.89;第二题“读多音节词语”的难度为0.85;第三题“朗读短文”的难度为0.84;第四题“命题说话”的难度为0.80;试卷整体难度为0.83。难度系数越大,说明题目越容易。根据考试难度的判定标准:难度大于0.9,考试过容易;难度在0.75~0.9之间,考试较容易;难度在0.55~0.75之间,考试难度中等;难度在0.4~0.55之间,考试较有难度;难度小于0.40,考试较难。
试卷难度应取决于测试目的和试题的形式而定。听障人员普通话水平替代性测试,考虑听障人员的特殊性以及测试目的,该试卷难度为0.83,测试较容易,发挥测试评价激励功能。赵立新等(2004)提出,试题的难度应该为“0.3~0.7”之间,结合听障人员自身特点和考试目的,“读单音节字词”、“读多音节词语”、“朗读短文”、“命题说话”这四类题目难度均为0.8以上,相对容易。考虑到普通话水平测试不是测验应试者掌握普通话系统知识的程度,也不是考察应试者的文化水平,更不是对应试者口才的评估(林海燕和赵寰宇,2009),考试内容为日常生活中经常使用的字词,听障人员普通话测试主要考察听障应试者使用手法、词汇、语法表述的规范程度和自然流畅程度,是听障应试者的汉语标准语测试,虽然普通话水平测试有提高国语语言文字的任务,但提高文化素养不是它的主要目标,因此题目设定应相对容易。“命题说话”的难度与其他三题相比较,难度稍微大一些,主要是由于该题答题采用“书面语+手语”形式,考核学生的书写能力和手语表达能力。
区分度是利用试题或者试卷对应试者加以区分,是试题或者试卷是否有效的“指示器”,试卷中的每一道试题都应该具有这一功能。语言测试区分度的高低意味着测试对于应试者语言能力的强弱是否能很好地鉴别。试题区分度常采用极端分组法,对应试者试卷依总分由高到低排序,将全部试卷的27%,作为高分组;从低到高排序,将全部试卷的27%,作为低分组(赵立新等,2004)。
主观试题的区分度:
试卷区分度:
根据1965年美国测验专家艾贝提出用区分度指数评价题目性能的标准,D≥0.40,评价优良;0.30≤D<0.40,合 格;0.20≤D<0.30,尚可,需修改;D<0.20,应淘汰。表3结果显示,第一题“读单音节字词”、第二题“读多音节词语”、第四题“命题说话”的区分度分别为0.33、0.34和0.31,达到合格的要求;第三题“朗读短文”的区分度为0.4,区分效果优良,可以有效区分不同水平的考生;第四题“命题说话”难度值0.80,相对其他试题难度稍微高些,该题属于主观性很强的试题,83.58%的考生得分集中在30-34分,区分度较小。试卷整体区分度为0.35,区分效果合格,基本达到了考试要求。2000年9月发布的《教师资格条例》实施办法中规定:“申请认定教师资格者的教育教学能力应当符合下列要求:普通话水平达到国家语言文字工作委员会颁布的《普通话水平测试等级标准》二级乙等以上标准,其中语文教师、对外汉语教师不低于二级甲等,语音教师不低于一级乙等”,符合试卷测试目的。听障人员普通话水平测试群体主要是特殊教育学校的听障从业人员,主要目的是通过普通话测评而获得教师资格证,具体区别“一、二、三级”水平不做严格要求。
表2 试卷各题及试卷整体的难度
信度是对整个测量进行优劣的评价指标。语言测试的信度高说明应试者分数不易受偶然因素产生的误差的影响,能够反应试者真实的语言行为。本文信度采用常用的内在信度系数--克朗巴哈系数,
通过测算发现,听障人员普通话替代性测试的信度系数为0.55。在我国一般大规模标准化考试要求信度系数在0.9以上,一般高校课程结业考试信度系数要求在0.4~0.7之间。由于残障人员普通话测试处于刚开始阶段,参加考试人员较少,用于计算信度的样本量仅有67个,若按照高校课程结业考试信度要求,本次测试的信度处于合理区间。随着听障应试者范围进一步扩大,听障应试者越来越多,用于计算信度的样本进一步扩大,预计信度会进一步提升。
效度是衡量测试结果对考试目标实现程度的指标,语言测试的效度表示了一种关联性,即测试与测试目标的关联程度,也就是反映测试的有效程度、测试的内容及形式是否符合测试目的(邹申,2005)。本文采用求平均区分度的方法来代替:
一般认为,效度在0.3以上的试卷即为良好。此次听障人员普通话水平替代性测试的效度系数为0.35,虽符合试卷合格标准,但不具有较高的效度。本次测试的信度为0.550,处于合格区间,由于信度不高的测试不可能有较高的效度,符合其规律。随着听障应试者范围进一步扩大,听障应试者越来越多,用于计算信度的样本进一步扩大,预计信度和效度都会进一步提升。
通过对67名听障人员普通话水平的统计分析,可以发现试卷的难度、区分度、信度和效度均在合理的范围内,从数据上回答了听障人员普通话替代性测试“为什么这样考”或者“这样考是有依据的”。
表3 试卷各题及试卷整体的区分度