王勤云
山东师范大学传播学院 济南 250014
计算机自适应测验中基础数据模拟方法
王勤云
山东师范大学传播学院 济南 250014
在计算机自适应测验中,利用计算机来模拟生成被试和题库,对于选题策略的实验模拟是非常重要的。主要叙述均匀分布、正态分布样本的生成算法以及正态分布的检验方法。
计算机自适应测验;均匀分布;正态分布
计算机自适应测验(Computerized Adaptive Testing,简称CAT)是在测验过程中,根据考试者的当前测试估计能力值,自适应地选择合理难度的题目。CAT被广泛地应用于GRE、 TOEFL等各类考试。随着CAT的广泛应用,测验安全性成为研究重点。选题策略作为CAT中一个重要环节,对测验的安全性有很大影响。合理的选题策略可以有效控制项目曝光率,提高测验安全性。
一种新型选题策略必须经过大量实验才能实际应用。如果每次实验都选取大量的被试和搜集大量项目来组建题库,需要花费大量财力、物力与人力。但如果利用计算机来模拟这些被试和题库,可以节省大量资源,使实验高效、便捷。本文主要阐述被试与题库的生成算法以及正态分布的检验方法。
在CAT中,被试的能力取值在理论上是(,)−∞+∞,但是在实际中,取值范围一般在(-4,4)之间,被试通常服从标准正态分布N(0,1)或者某一区间上的均匀分布。题库中每一个项目都有3个参数a、b、c,其中a为项目的区分度,b为项目的难度,c为项目的猜测系数。项目参数一般来说服从标准正态分布N(0,1)或某一区间上的均匀分布,具体服从何种分布是由研究者自己确定的。本文主要阐述标准正态分布N(0,1)、均匀分布的生成算法。
在C/C++语言中提供的rand()函数可以产生一个0到32 767之间的正整数A,(double)A/32 767,得到一个(0,1)区间上的随机数 ri。为了得到U(a,b)随机数,令为[a,b]区间上均匀分布随机数。在使用rand()时,需要给该函数提供一个种子,一般采用系统的当前时间作为种子,目的是保证每次得到的伪随机数都不相同,而且相互独立,互不影响。
服从标准正态分布N(0,1)随机数是在(0,1)区间均匀分布随机数的基础之上产生的。设在(a,b)区间上服从均匀分布的随机变量为X,其期望与方差分别为: E ( X)=因此,在(0,1)区间上服从均匀分布的随机变量X,其期望为,方差为。取n(一般取n=12)个在[0,1]均匀分布的随机变量X1,X2,X3...Xn,根据中心极限定理可知,新的随机变量y=X1+X2+...+X12-6可以满足一般精度下的标准正态分布N(0,1)的要求。设z=μ+σy,则可将z看成来自正态分布N(μ,σ2)的一个随机数。
为了检验样本X1,X2,X3...Xn是否来自一个正态总体,先计算偏度(G1)和峰度(G2)的估计量:
以上是(0,1)区间均匀分布随机数、任意区间均匀分布随机数、标准正态分布随机数N(0,1)的生成方法以及正态分布检验的方法。
在计算机自适应测验中,一种新型的选题策略的提出不可能直接应用于实际,必须经过无数次的模拟论证,最后再决定是否具有可行性。那么这些随机数的模拟生成对于选题策略的模拟实验阶段是非常重要的,而利用计算机来模拟被试和题库,可以节省时间以及减少资源的浪费等。采用上述方式,可以快速且可重复地生成被试和题库供试验使用,极大地降低实验成本,提高实验效率。
[1]Chang Huahua, Ying Zhiliang. a-Stratifed Multisage Computerized Adaptive Testing[J].Applied Psychological Measurement,1999,23(3):211-222
[2]茆诗松,程依明,濮晓龙.概率论与数理统计教程[M].北京:高等教育出版社,2004
[3]高慧旋.统计计算[M].北京:北京大学出版社,1995
[4]张忠华,谢小庆,郑日昌.计算机自适应测验(CAT)选题策略的新进展[J].心理发展与教育,2002(4):91-95
[5]余嘉元.项目反应理论研究中的计算机模拟方法[J].心理科学,1991(2):47-49
[6]付聪.计算机自适应测试研究进展[J].现代情报,2005(1):61-64
[7]余嘉元,汪存友.项目反应理论参数估计研究中的蒙特卡罗方法[J].2007(1):87-91
TP273+.2
B
1671-489X(2011)06-0079-01
10.3969 /j.issn.1671-489X.2011.06.079