多维二参数Logistic项目反应模型的Gibbs抽样法

2014-05-16 07:28付志慧
关键词:正态参数估计测验

付志慧,李 斌

(沈阳师范大学 数学与系统科学学院,沈阳 110034)

0 引 言

项目反应理论在心理与教育测量领域中具有广阔的应用前景[1-2]。它以潜在特质理论为基础,核心内容是研究潜在心理特质和反应行为之间的关系,在此基础上,可以分析出被试潜在心理特质(即能力)与项目特性(难度、区分度等)之间的相互影响。项目反应模型按照能力维度可分为单维和多维。单维项目反应模型假定测验的所有题目只考查同一种潜在特质。但是实际心理过程是非常复杂的,且考试(教育测验)通常考查多个能力。本文主要研究多维二参数Logistic(2PLM)的Gibbs抽样方法。

项目反应理论参数估计方法有4种[4],条件极大似然估计(CMLE:condition maximum likelihood estimation),边际极大似然估计与EM 算法[4-5](MMLE/EM:marginal maximum likelihood estimation and an EM algorithm),联合极大似然估计(JMLE:joint maximum likelihood estimation),Bayes估计。CMLE以一种参数已知为条件,即项目参数已知求能力值或能力参数已知求项目值。能力的条件估计适用于抽取题库项目来估计被试能力,若在题库未建立前,项目参数和能力参数皆是未知,CMLE不再适用。Birnbaum提出了联合极大似然估计。JMLE可在一定假设下,转化为项目参数的估计和能力参数的估计。两种估计是一个不断互相校正的过程,反复迭代求取稳定值,可以看成是两步估计的过程。但联合极大似然估计有其固有的缺陷:给定长度测试中(即项目个数是固定的),随着被试人数的增加,能力参数的个数也相应增加,称之伴随参数;不随被试人数增加而增加的项目参数,称之为结构参数;当同时估计能力参数和项目参数时,伴随参数可能不存在充分统计量,因此得出估计不一定满足相合性。消除JLME固有的缺陷只有消除伴随参数的影响。MMLE/EM算法将能力参数边际化,给定能力的先验分布,对能力参数进行积分,从而来消除能力参数,在一般条件下该算法可以收敛,计算比较简单,但它对能力需要进行数值积分近似计算,在能力维数较高时,会给计算带来很大困难[6]。为了提高估计的质量,除了当前样本数据,还可以利用客观信息和经验积累的信息,先验信息的加入,参数估计更加稳定,也更合理和符合实际。Albert(1992)给出了二参数正态卵形的一种Gibbs抽样方法[7]。Sahu(2002)将其推广到三参数正态卵形模型[8]。Van der Linden(2007)针对结合反应时间和反应速度的测验,用对数正态模型来拟合被试的反应时间,用三参数正态卵形IRT模型拟合反应得分,将二者结合后给出了Gibbs抽样方法[9]。本文考虑更为一般的多维2PLM,给出了一种基于增加数据的Gibbs抽样方法,易于求出每个参数的后验分布,从而直接给出参数的Bayes后验估计。

1 模型介绍和先验假设

假定有N个被试,n个项目,yij表示第j个被试对第i个项目的反应,答对取值为1,答错取值为0。令pij表示第j个被试对第i个项目正确反应的概率,我们采用多变量Logistic反应函数,形式为:

其中,i=1,2,…,n,j=1,2,…,N,θj=(θj1,…,θjk,…,θjm)为被试j的能力,各维度能力取值范围均为-∞<θjk<∞,j=1,2,…,N,k=1,2,…,m;ai=(ai1,…,aik,…,aim),aik>0,i=1,2,…,n,k=1,2,…,m是由项目i在各维度能力上的载荷aik生成的向量,称为区分度参数;bi=(bi1,…,bik,…,bim).-∞<bik<∞,i=1,2,…,n,k=1,2,…,m,为项目i的难度参数向量;特别地,当m=1时,模型(1)退化为单维2PLM。

令ζ=(θ,a,b,σ),其中a=(aik)n×m,b=(bik)n×m,且(·)n×m表示n×m矩阵。多维2PLM 下,参数ζ的后验分布为:其中D为比例常数。

2 潜在变量的引入及Gibbs抽样过程

对应于反应数据yij,引入2个相互独立的随机变量uij。其中uij服从均匀分布,uij~Uniform(0,1)。由模型(1)易知,潜变量μij要受到yij取值的约束,令

令u=(uij)n×N,y=(yij)n×N,随着潜变量u的引入,(ζ,u)的联合后验密度为:

进而,由式(3),有

首先,在给定反应数据和其他参数的情形下,抽取uij。在算法的每一步都要满足式(2)。1)uij的满条件分布为

2)给定a,b,σ2的满条件分布为

由式(3),对于任意i,k,令

3)则给定其他所有参数和u,r,y,,i=1,2,…,n,k=1,2,…,m的满条件分布为

4)同理,θjk,j=1,2,…,N,k=1,2,…,.m的满条件分布为

其中,θj(k)是向量θj将第k个元素θjk删除后得到的余向量,即

N(vk,)是θjk在给定θj(k)下的条件分布,条件均值和条件方差分别为

(关于vk和的详细计算过程见附录),且

5)给定其他所有参数和u,r,y,aik,i=1,2,…,n,k=1,2,…,m的满条件分布为

其中

以下给出了具体的Gibbs抽样步骤(具体程序由Matlab软件编写)。

第1步 从式(5)中抽取u;

第2步 从式(6)中抽取σ2;

第3步 从式(7)中抽取b;

第4步 从式(8)中抽取θ;

第5步 从式(11)中抽取a。

3 结 论

以上讨论了多维二参数LOGISTIC模型的Gibbs抽样问题,采用本文讨论的方法,可简单解决该模型的参数估计问题,这一结果对IRT的发展,对多维项目在测验中的应用是很有意义的,在此基础上,还可以进一步讨论多维项目反应模型的其他问题,如纵向测验[10-11]、多层IRT测验[12]、参数估计优化问题[13-15]等。

附录

条件均值及方差的详细计算过程

若要计算θjk的条件均值vk和条件方差(公式(10)),首先对θj进行置换。令

Pk1=(pst)m×m为置换阵,第(s,t)个元素为

由θj~Nm(μ,Σθ)有(k)~Nm(μ*(k),(k)),其中

为了求θjk的条件分布,将向量(k)分成两块,因此得:

(μj(k)为θj(k)的数学期望,即μj(k)=E(θj(k))。且

因此在给定时的条件分布为:

[1]BEAUJEAN A A,STEVEN J O.Using item response theory to assess the flynn effect in the national Longitudinal study of youth 79children and young[J].Adults Ddata Intell,2008,36(3):455-463.

[2]CHANG C H,REEVE B B.Item response theory and its applications to patient-reported outcomes measurement[J].Eval Health Prof,2005,28(3):264-282.

[3]BAKER F B,KIM S H.Item response theory:parameter Estimation Techniques[M].2nd Ed.New York:Marcel Dekker,2004.

[4]BOCK R D,AITKIN M.Marginal maximum likelihood estimation of item parameters:An application of an EM-algorithm[J].Psychometrika,1981,46(3):443-459.

[5]DAVIER M V,SINHARAY S.An importance sampling EM algorithm for latent regression models[J].J Educ Behav Stat,2007,32(3):233-251.

[6]FIEUWS S.High dimensional multivariate mixed models for binary questionnaire data[J].Appl Stat,2006,55(4):449-460.

[7]ALBERT J H.Bayesian estimation of normal ogive item response curves using Gibbs Sampling[J].J Educ Stat,1992,17(3):251-269.

[8]SAHU S K.Bayesian estimation and model choice in item response models[J].J Stat Comput and Simul,2002,72(3):217-232.

[9]LINDEN V D.A hierarchical framework for modeling speed and accuracy on test items[J].Psychometrika,2007,72(3):287-308.

[10]JANNEKE M.Application of multidimensional item response theory models to longitudinal data[J].Educ Psycho Meas,2006,66(1):5-34.

[11]FU Zhihui,TAO Jian,SHI Ningzhong.Analyzing longitudinal item response data via the pairwise fitting method[J].Multivariate Behav Res,2011,46(4):669-690.

[12]FOX J P,GLAS C A W.Bayesian estimation of a multilevel IRT model using Gibbs sampling[J].Psychometrika,2001,66(2):271-288.

[13]甘源媛,余嘉元.改进3PL模型参数估计的 MCMC算法[J].心理科学,2010,33(5):1212-1215.

[14]涂冬波,漆书青,蔡艳,等.IRT参数模型估计的新方法——MCMC算法[J].心理科学,2008,31(1):177-180.

[15]PATZ R J,JUNKER B W.Applications and extensions of MCMC in IRT:multiple item types,missing data,and rated responses[J].J Educ Behav Stat,1999,24(2):146-178.

猜你喜欢
正态参数估计测验
基于新型DFrFT的LFM信号参数估计算法
一种GTD模型参数估计的改进2D-TLS-ESPRIT算法
《新年大测验》大揭榜
双幂变换下正态线性回归模型参数的假设检验
Logistic回归模型的几乎无偏两参数估计
两个处理t测验与F测验的数学关系
基于竞争失效数据的Lindley分布参数估计
基于泛正态阻抗云的谐波发射水平估计
半参数EV模型二阶段估计的渐近正态性
你知道吗?