基于统计学变量筛选方法的心理测验题目的维度识别

2016-12-23 08:03孙佳楠杨武岳
统计与信息论坛 2016年11期
关键词:测验弹性准确率

孙佳楠,杨武岳,陈 秋

(北京林业大学 理学院, 北京 100083)



【统计应用研究】

基于统计学变量筛选方法的心理测验题目的维度识别

孙佳楠,杨武岳,陈 秋

(北京林业大学 理学院, 北京 100083)

近年来多维心理测验被广泛应用于各类评估,虽然编制测验时知道整个测验考察的潜在特质(或称为维度),但是测验题目具体考察的维度仍需确定。借助多维项目反应理论模型与广义线性模型的关系,使用LASSO和弹性网两种变量筛选方法,可解决测验题目的维度识别问题。模拟研究发现,LASSO方法比弹性网方法具有更好的维度识别效果,前者对不同类型的多维测验具有较高的维度识别准确率。

维度识别;多维项目反应理论;变量筛选;LASSO;弹性网

一、引 言

随着中国社会的发展进步,人们越来越多地使用心理测验或量表来衡量特定人群在某方面的潜在特征,这些特征可以代表人的各种能力素养等不易直接观测的信息。被测者的某种重要的能力素养往往由多个潜在特质(或称维度)构成,而因此编制的心理测验往往包含多个维度。迄今为止,多维心理测验的应用已拓展到工商业、医学、教育等多个领域的研究及社会生活中。

应用多维测验的前提是明确每个题目考察的具体维度,以便解释作答结果。在编制多维测验时,需要根据心理学理论确定测验考察的所有维度,各个题目具体考察了哪些维度只能粗略估计,而要确定测验的题目和维度间的对应关系,往往需要多次预试和判断。在统计学和信息科学快速发展的今天,数据驱动方法可以服务于这类问题的实际应用。本研究探讨在已知多维测验较少信息时,如何根据测验的作答数据,并从统计学变量筛选的角度,确定多维测验题目所考察的维度,从而帮助测验编制者和使用者更好地使用测验[1]118-130。

自20世纪70年代,基于多维项目反应理论(Multidimensional Item Response Theory, MIRT)开发的模型逐渐成为心理测验的热门统计模型[2]79-110,它可以拟合具有分类选项题的多维心理测验数据。MIRT模型的代表性模型是多维两参数Logistic模型,这里简称M2PL模型。该模型的自变量是潜变量,代表潜在特质或维度,并被视为服从正态分布。当M2PL模型的自变量取固定的数值时,该模型即变成0~1响应的logistic广义线性模型。

本文基于M2PL模型,使用变量筛选方法中流行的压缩估计法——LASSO(Least Absolute Shrinkage Selection Operator)方法和弹性网方法[3-4],识别多维测验题目与维度间的对应关系。LASSO近年来应用十分广泛[5-7],它最初是对线性回归模型和广义线性模型提出的变量筛选方法,通过对传统参数估计方程增加L1范数的惩罚项构造筛选变量的优化问题。弹性网方法使用混合L1和L2范数的惩罚项构造筛选变量的优化问题。研究者发现坐标下降法是可以快速实现上述方法的便利算法[8],并给出了相应的R软件程序包:glmnet[9]。

本文简要介绍M2PL模型、LASSO方法和弹性网方法,并在其理论基础上针对题目为单项选择的常见多维心理测验,提出借助多维项目反应理论模型和统计变量选择方法的测验题目的维度识别方法;进一步设计模拟实验开展研究,并具体假设当M2PL模型拟合测验数据时,分别使用LASSO和弹性网方法对多维测验的题目与维度间考察关系进行识别,比较它们的识别效果;设计不同的测验情境,以深入考察LASSO方法的效果。

二、文献综述与研究方法

(一)多维两参数Logistic模型

(1)

(二)0~1响应广义线性模型下的变量筛选

(2)

(3)

弹性网优化问题:

(4)

(三)基于LASSO或弹性网方法的多维心理测验题目的维度识别

三、模拟研究

本节使用统计模拟方法[12]40-92,首先比较LASSO方法和弹性网方法对三维测验的维度识别准确率;再针对效果较好的LASSO方法,分别对在二维和三维测验的不同情境下的维度识别准确率进行比较。具体使用R软件实现模拟实验的程序编写和程序包调用[13]3-73。

(一)LASSO和弹性网方法对测验维度识别的比较

1. 研究设计与方法。本研究分别采用LASSO和弹性网进行变量筛选,比较两种方法的效果。具体考虑题目数为J=21的测验考察K=3个维度的被试能力,针对三维M2PL模型,这里采用研究者惯用的方法产生模型参数的真值。

最后,根据“最小deviance的一倍标准误准则”选取合适的λ及其对应的变量选择结果。

表1 两种三维测验下两种变量选择方法的维度识别准确率表 单位:%

(二)LASSO方法对不同情境多维测验的维度识别

2.研究结果。表2、表3分别为二、三维测验的结果。由表2知:在6种测验下,数据集的平均值普遍比较高;应用潜变量真值的维度识别准确率均达90%以上,而用估计值的准确率也达80%以上,效果比较好。比较测验间的判准率平均值发现,在真值情况下测验四、五达到最高99.17%;估计值情况下测验五达到最高90.00%。

比较测验一、二、三后发现,对相同的W1而言,三种潜变量的协方差结构下第三种的识别效果更好;比较测验四、五、六发现,对相同的W2而言,潜变量的协方差结构下第二种的维度识别效果更好,说明潜变量的维度具有较小相关时的识别效果更好;比较测验一和四、测验二和五发现,W1的识别效果比W2的略差;比较测验三、六发现,W1的识别效果比W2的稍好。

表2 LASSO方法获得的不同类型二维测验的维度识别准确率表 单位:%

由表3知,在六种测验的每种情境下,用潜变量真值的维度识别准确率均达95%以上,用估计值的准确率也达70%以上,总体效果仍较好。

对测验四、五、六,W4的识别效果整体较好,不同潜变量协方差结构中前两种的维度识别效果较好;测验一、二、三的W3识别效果整体稍显逊色,不同潜变量的协方差结构的识别效果不分伯仲。三维测验考察的维度较二维增加的同时,必然导致估计值下的识别准确率下降,但整体实验结果仍比较理想。

表3 LASSO方法获得的不同类型三维测验的维度识别准确率表 单位:%

四、总结与讨论

本文从多维项目反应理论的M2PL模型出发,借助统计变量选择中的压缩估计类方法,探索多维测验的维度识别效果。通过模拟实验,比较了LASSO和弹性网方法对三维测验的维度识别效果,得出LASSO方法优于弹性网方法的结论;对二维和三维的六种不同的测验情境运用LASSO方法筛选测验题目的维度,并从识别准确率的角度衡量该方法的效果。结果表明:本文的方法能够从统计分析的角度较好地解决多维测验的维度识别问题;本研究的特色是借助测验作答数据,从统计学变量筛选的角度,借助多维项目反应理论模型和广义线性模型间的关系,通过处理潜变量的取值并应用变量选择方法来筛选变量,在一定程度上可节约人工分析的时间和成本;在本研究基础上,未来可进一步探索:针对实际的多维测验及所收集到的作答数据,进行维度识别的实证研究;将该方法推广到多级评分的多维测验的维度识别问题中;使用压缩估计类的其他变量筛选方法,如SCAD方法做测验的维度识别研究[15]。

[1] 高惠璇. 应用多元统计分析[M]. 北京: 北京大学出版社, 2011.

[2]ReckaseMD.MultidimensionalItemResponseTheory[M].NewYork:Springer, 2009.

[3]TibshiraniR.RegressionShrinkageandSelectionviatheLasso[J].JournaloftheRoyalStatisticalSociety, 1996(1).

[4]HuiZ,TrevorH.RegularizationandVariableSelectionviatheElasticNet[J].JournaloftheRoyalStatisticalSociety, 2005, 67(2).

[5] 方匡南, 章贵军, 张惠颖. 基于Lasso-logistic模型的个人信用风险预警方法[J]. 数量经济技术经济研究, 2014(2).

[6] 李子强, 田茂再, 罗幼喜. 面板数据的自适应Lasso分位回归方法研究[J]. 统计与信息论坛, 2014(7).

[7] 李强, 王黎明. 基于LAD-LASSO方法的逐段常数序列中的变点估计[J]. 统计与信息论坛, 2015(5).

[8]FriedmanJ,HastieT,HöflingH,etal.PathwiseCoordinateOptimization[J].AnnalsofAppliedStatistics, 2007(2).

[9]FriedmanJ,HastieT,TibshiraniR.RegularizationPathsforGeneralizedLinearModelsviaCoordinateDescent[J].JournalofStatisticalSoftware, 2010(1).

[10]AgrestiA.CategoricalDataAnalysis[M]. 2nded.NewYork:Wiley, 2002.

[11]BrowneMW.AnOverviewofAnalyticRotationinExploratoryFactorAnalysis[J].MultivariateBehavioralResearch, 2001(1).

[12]RossMS. 统计模拟[M]. 北京: 机械工业出版社, 2013.

[13]汤银才.R语言与统计分析[M]. 北京: 高等教育出版社, 2008.

[14]CaiL.High-dimensionalExploratoryItemFactorAnalysisbyaMetropolis-HastingsRobbins-MonroAlgorithm[J].Psychometrika, 2010(1).

[15]FanJ,LiR.VariableSelectionviaNonconcavePenalizedLikelihoodandItsOracleProperties[J].JournaloftheAmericanStatisticalAssociation, 2002,96(456).

(责任编辑:郭诗梦)

Item Dimension Identification of Psychological Tests based on Statistical Variable Selection Methods

SUN Jia-nan, YANG Wu-yue, CHEN Qiu

(School of Science, Beijing Forestry University, Beijing 100083, China)

Multidimensional psychological tests have been widely used to evaluate examinees' latent traits in all kinds of subject assessment. Although the possible latent traits or the so-called dimensions of the tests can be known to some extent, the dimensions probed by each item of the tests are still needed to identify for the application purpose. Based on multidimensional item response theory and the shrinkage estimation methods of statistical variable selection, this research explored to statistically identify the item-dimension correspondence relationship in some typical psychological tests. Simulation studies were conducted to investigate the performance of the proposed method and the results showed that the method based on LASSO did better than that based on the elastic net in terms of correctly identifying the dimensions of test items.

dimension identification of psychological tests; multidimensional item response theory models; variable selection; LASSO; elastic net

2016-03-25;修复日期:2016-07-18

中央高校基本科研业务费专项资金《心理与教育测评中新兴统计模型的变量选择方法的研究与开发》(BLX2014-31);北京林业大学北京市大学生科学研究与创业行动计划《基于LASSO和弹性网方法的多维测验项目的维度识别》(S201510022094)

孙佳楠,女,吉林长春人,理学博士,讲师,研究方向:概率统计与应用统计。

C912.6∶O212.4

A

1007-3116(2016)11-0054-06

猜你喜欢
测验弹性准确率
为什么橡胶有弹性?
为什么橡胶有弹性?
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
注重低频的细节与弹性 KEF KF92
弹性夹箍折弯模的改进
高速公路车牌识别标识站准确率验证法
《新年大测验》大揭榜
两个处理t测验与F测验的数学关系