计算机自适应测验技术

2011-06-13 06:36黄勇

科技传播 2011年20期

关键词：施测被试者题库

黄勇

广东湛江麻斜91640部队，广东湛江 524064

计算机自适应测验技术

黄勇

广东湛江麻斜91640部队，广东湛江 524064

目前，对于计算机考试与水平的评价，国际、国内均广泛的采用CAT应用模式。但是对于在应用范畴内同等重要的自适应测验则重视不足。这样导致了计算机的测验无法明确表现出应用水平，造成测验失准或者测验评价的含金量降低等问题。本文从自适应测试的技术关键、测试难点及其作用等角度来讨论计算机测试的改革。

计算机；自适应检测；考试

1 自适应测验相关概念

自适应测试作为考试的一部分被作为一种测试计算机应用能力的手段而广泛应用。随着计算机的不断发展与应用的不断深入，考试对自适应测试要求也越来越高。从我们通常采用的传统笔试考试（P&P）、以及平常依赖计算机的考试（Computer Base Test）到现在推行的计算机自适应测验（CAT，ComputerAdaptive Test），考试的客观性和准确性在很大程度上不断得到改进和提高。在20世纪初期的法国比奈智力测验中，产生了自适应测试（Adaptive Test），其目的是用来匹配考试成绩与考生能力的测试。进行测试的时候，以考生的作答情况作为参考，选取和利用在考生能力范围的题目，能够在最短的时间内准确的测量出来考生的知识和能力水平。当今计算机技术进行不断革新，计算机完全可以控制和推行自适应测试的过程，计算机自适应测验于1971年由学者Lord提出，此后在美国各地发展相当迅速。

2 自适应测验的主要步骤

2.1 自适应测验系统的主要功能

自适应测验系统首先应详细学习项目反映理论，并深入了解计算机自适应测验系统的每个环节。在把《近代海军史》公共课作为题库来源开发成小型的计算机自适应测验系统中，可以很好的利用该系统的实施，在沉重的测验工作之中把《近代海军史》公共课的老师解脱出来，并将被测者的能力值准确高效的显示出来。

2.2 计算机自适应测验系统的流程图

前文中详细描述了计算机自适应测试的相关概念，在对该概念的分析和深入研究的基础上，我们得到了该系统的流程图(如图1所示)，用以表示整个计算机自适应测验的具体过程：

图1 计算机自适应测验系统的流程图

3 计算机自适应测验的关键环节

计算机自适应测验由一系列环节组成，各个环节都是相互联系、缺一不可的。为了使该系统可以获得参考价值较高的被测者的能力值，首先，我们需拟合检验模型和数据，正确选择项目反应模型市准确测量被试能力的前提；其次，应建设高质量的题库，题库质量高才能使测验结果得到保证；最后，对计算机自适应测验的项目选择、被试能力估计、终止条件的确定等每一个环节都要认真执行。

3.1 模型和数据的拟合检验

项目反应理论所包含的模型有很多，如等级反应模型、拉稀模型以及逻辑斯蒂模型等，每种模型都存在各自的优缺点，万能的模型是不存在的。很高的数学性质以及对难度和能力参数可以充分计量等是拉稀模型的优点所在，其缺点是无法使用猜测度和问题区分度，所以只能在较小的范围内使用该模型。而逻辑斯蒂模型，三参数和双参数都包括在内，则有较广的适用范围，但其未能充分计量参数，导致诸多不变存在于估计过程中。

3.2 建设题库，确定项目

题库的性能和质量好坏与否关系到测量结果的准确性，是实施计算机自适应测验的前提，所以题库建设必须加强。在建设题库的过程中，有两个环节相当重要，就是所谓的估计项目参数以及等值测验。我们说的等值测验，就是在同一个量表上把不同时间得到的项目的参数进行转化，使得施测和比较更加方便，这里我们主要对项目参数的估计进行讲述。

3.3 对被试的能力参数施测估计

一个质量高、容量大的题库建好之后，“因材施测”即可开始，这是自适应测试的特点，施测要选择与被试者能力匹配的项目，进而快速判断出被试的能力，即在项目参数确定的前提下对被试的能力参数进行估计。计算机自适应测验的主要施测过程就是这样，它大体上可以分为两个极端，即试探性探查以及对真值做精确的估计。第一阶段，试探性探查，即对被试者的能力做初步的了解。从理论上讲，被试能力的真实情况我们在测验支出并不了解，选择何种难度的试题对被试者进行测试都是可以的，不过Wanine（1990）研究指出，若第一个测试项目的难度与被试者的能力想接近，则通过较短的测验就可以得到稳定的能力估计值，所以，为了方面初步了解被试者的能力水平，在正式对其进行测试之前，我们可让被试者作答从题库中抽取的少量项目。第二阶段，对真值做精确的估计，在计算机自适应测验中，该部分最为重要，其目的就是获得被试能力的真值，“因人施策”是该阶段应始终遵循的思想。在试探性探查阶段，对于被试者的能力水平我们通过从题库中抽取的少量项目做了初步估计，可以使能力估计值的说服力更强，到了精确估计真值的阶段，施测还需继续进行，需要注意的是，此时就不可能只在题库中抽取简单的、少量的项目了，对项目的选择要遵循合适的选题策略，直至被试的能力被精确估计出来。

[1]Bryce Thomas Bsttisti, Nikki Hanegan, Richard Sudweeks and Rex Cates.Using Item Response Theory to Conduct a Distracter Analysis on Conceptual Inventory of Natural Selection [J]，2009，11.

[2]Stefania Mignani, Silvia Cagnone, Giorgio Casadei,and Antonella Carbonaro.An Item Response Theory Model for Student Ability Evaluation Using Computer-Automated Test Results[J].Mignani et al，325-332.

[3]Michael A.Young, Ira S.Halper,David C.Clark,William Scheftner, and Jan Fawcett.An Item-Response Theory Evaluation of the Beck Hopelessness Scale[J].Cognitive Therapy and Research，Vol.16，No.5，1992：579-587.

TP39

1674-6708（2011）53-0159-02