浅谈计算机自适应测试研究进展

2014-08-08 17:27郑洁张艳华

无线互联科技 2014年6期

郑洁张艳华

摘要：计算机自适应测验(Computerized Adaptive Testing，简称CAT)是近年来发展起来的一种新的测验形式。这种测验以项目反应理论为基础，以计算机技术为手段，并由计算机根据被试能力水平自动选择测题，最终对被试能力作出估计的一种新型测验。

关键词：计算机自适应测试；项目反应理论；试题库1什么是计算机自适应测试

计算机自适应测验是利用项目反应理论建立题库，并由计算机根据被试能力水平自动选择测题，最终对被试能力作出估计的一种新型测验。

相对于传统的测试计算机自适应测试是一种动态的测试。这一点上计算机自适应测验也不同于一般的计算机化测验，计算机在测验过程中不光是呈现题目，输入答案、自动评分、得出结果，而且根据被试对试题的不同回答，它能自动选择最适宜的试题让被试回答，最终达到对被试能力作出最恰当的估计。因此，计算机自适应测验是因人而异的测验。

2计算机自适应测试的发展

在上世纪80年代末国家有关人士开始对计算机自适应测试进行了相关的尝试，至2008年全国四六级考试业已经尝试使用计算机自适应的方式进行测试。2011年北大研制成功全球首个商务汉语自适应测试系统。由此可见计算机自适应测试正越来越被国家和社会所接收，也有着越来越蓬勃的发展。

3计算机自适应测试的流程

3.1 测试流程

计算机自适应测试有着与一般测试不同的流程，见图1：

3.2 应试者

计算机自适应测试能够利用题库的不同来区别不同的人才，因此可以对不同应试者进行测试，从而对应试者进行区分。同时，随着互联网的普及可以对不同地区的应试者在同一时间进行测试，甄别。

传统的考试测量模式则是应试者独自面对着考试试题，每个人可能面对的题目不同但是没有一个闭环的反馈过程，也就是说每个人都独自面对着一个不同的题库。

3.3 题库的选择

计算机自适应测试系统中最为关键的就是题库的设置以及题库的曝光率。

在题库的设置中初始难度设置在0.5~0.6之间，当应试者答对一定题目后之后可进入高一难度的题库进行选择，若错一定程度后可以降到一个难度进行测试，从而进行分级测试。

一个大型考试的试卷通常要经过这些环节：第一要预测，预测好了之后才知道一个题目可用不可用。第二是题库的使用和管理。考题的好坏，从统计学的角度讲，有难度系数和区分度系数，太难和太容易都不行。第三是考后要有数据分析和诊断，使考分具有跨时间、区域的可比性，这都需要开发各类应用软件。国内近年来开发了不少题库，但由于缺乏应用软件，这些题库仅仅成为“题堆”，而非具有应用价值的题库。

传统的测试通过笔试或者计算机测试，它们的题库是固定的，固定的题库就会导致题目的曝光率十分高，一段时间之后基本上就是對记忆力的比拼，而不是能力的测试，而采用计算机自适应测试则不同，是动态的题库，每个人选到的题目都不相同，这就会让题库在比较长的时间内保持秘密性。

3.4 测试后的处理

计算机自适应测试与普通测试有着一个本质的区别，在自适应测试之后有一个对结果的测量。

由于题目是动态的题目，难度有区别，那么结果也不相同，通过对结果的分析可以对将不同人员的特点区分出来，有的人擅长某一项，那么他在这类题的分数就会很高，而不擅长的那些就可能分数不是很好，从而对人进行不同的培养，以达到因材施教的目的。

3.5 结果的反馈

不同的测试结果也不相同，在对结果的反馈过程中不同人员甄别之后进行归类存档，同时可以将结果保存，以作为资料进行整理。

4前景

计算机自适应测试是一个不算新的概念，但是对于中国来说仍然处于发展的初期，从目前情况看来，大部分的时候还在使用传统的测试手段，计算机仍需要大力的宣传普及。

同时计算机自适应测试不仅仅可以应用在考试上，也可以应用在其他领域，比如说人力资源的管理，工作能力的评估等方面。在这些领域的中已经或多或少的使用了自适应的测试。

[参考文献]

[1]袁健.基于Web的自适应上报系统技术的研究与实现.计算机工程与设计，2007，（19），4810-4812.

[2]张默.项目反应理论与计算机化自适应考试研究.黑龙江科技信息,2010，（09），25-26.

[3]徐信叶,丁树良.结合认知诊断的计算机化自适应考试在高校教改中的作用探讨.福建电脑，2008，（01），191-192.