哈尔滨医科大学公共卫生学院卫生统计学教研室(150081) 刘 丹 包 含 苏少飞 张慧敏 刘美娜
多维项目反应理论模型在疾病治疗质量评价中的应用*
哈尔滨医科大学公共卫生学院卫生统计学教研室(150081) 刘 丹 包 含 苏少飞 张慧敏 刘美娜△
目的利用多维项目反应理论模型评价医院急性心肌梗死和慢性心力衰竭的治疗质量。方法基于多维项目反应理论建立医院急性心肌梗死治疗质量、慢性心力衰竭治疗质量和评价指标使用概率三者的函数关系,利用贝叶斯估计法和马尔可夫链蒙特卡洛(MCMC)方法估计模型参数。结果建立了评价急性心肌梗死和慢性心力衰竭治疗质量的多维项目反应理论模型;通过模型获得了两个相关疾病治疗质量的估计值,同时进行治疗质量的排序;两个相关疾病治疗质量估计值的相关系数为0.789,P<0.0001。结论多维项目反应理论模型适用于相关疾病的治疗质量评价,模型能同时估计多个疾病的治疗质量,并将不同疾病治疗质量间相关性整合进模型,估计更可靠、准确。
急性心肌梗死 慢性心力衰竭 治疗质量 多维项目反应理论
治疗质量评价是改善治疗质量重要的部分,合理有效的治疗质量评价不仅可以为医院管理服务,也可以满足患者和社会的需求[1]。目前,疾病诊治各个环节的治疗质量评价、相关疾病的治疗质量评价都是治疗质量评价关注的问题。评价疾病诊治各个环节的治疗质量能够提供更多的质量评价信息,更有利于促进治疗质量改善。某些疾病的治疗存在相关性,如急性心肌梗死和慢性心力衰竭,对相关疾病的治疗质量同时评价更为合理。本研究拟应用多维反应理论模型,阐述应用多维项目反应理论模型评价医院疾病治疗质量的一般过程,并对医院急性心肌梗死和慢性心力衰竭的治疗质量进行评价。
多维项目反应理论(multidimensional item response theory,MIRT)是基于单维项目反应理论和因子分析发展起来的新型测量理论,以研究被试潜在的多种能力和项目反应概率之间的关系为核心[2]。多维项目反应理论模型是单维项目反应理论模型的拓展模型,本研究介绍的模型都是两参数logistic模型。
1.单维项目反应理论模型
假设有K个用于评价医院治疗质量的指标,H家医院参加了治疗质量评价,定义ykh为:
单维项目反应理论模型假设第h家医院对患者使用第k个指标的概率p(ykh=1)仅由一个潜变量θh决定:
其中αk、βk分别为第k个指标的区分度参数、难度参数,称为项目参数;潜变量θh为第h家医院的治疗质量,称为能力参数。
项目反应理论模型最大的特点是建立了能力参数、项目参数和反应概率的函数关系,此函数称为项目特征函数(item characteristic function,ICF)。对于单维模型,指标使用概率相对于医院治疗质量水平的变化形成一条成中心对称并单调递增的S型曲线,称为项目特征曲线(item characteristic curve,ICC),曲线的形态和位置完全由评价指标的特征决定,每个评价指标对应一条项目特征曲线,对于第k个指标,区分度参数αk的值越大,曲线拐点处的斜率越大,曲线越陡,对医院治疗质量的区分能力越强;难度参数βk值越大,曲线越向右移[3]。
2.多维项目反应理论模型
项目间多维模型(between-item-multidimensionalmodel)是结构简单的多维项目反应理论模型[4],将全部评价指标分为几个子集,每个子集内评价指标使用概率的大小只由一个潜变量决定,假设K个评价指标被分为I个子集,第h家医院对患者使用第i个子集内第j个评价指标的概率p(yijh=1)由医院的第i个能力参数θih决定,i=1,…,I,模型如下[5]:
αij、βij为第i个子集内第j个评价指标的项目参数。
假设nijh为第h家医院适合使用第i个子集内第j个评价指标的患者数,随机变量Yijh为第h家医院实际使用第i个子集内第j个评价指标的患者数,则随机变量Yijh服从概率为p(yijh=1)的二项分布:
1.数据收集与整理
基于Donabedian的结构-过程-结局治疗质量的理论框架,利用改进的Delphi法制定治疗质量评价指标体系,结构指标定义了医疗机构、医疗专业人员的内在特征,过程指标反映了医疗技术人员是否将适宜的治疗提供给所需患者,结局指标反映了患者接受治疗后健康状态的变化,各维度评价指标均是评价和改善医院治疗质量的重要部分;本研究急性心肌梗死评价指标包含10个过程指标、1个结局指标,慢性心力衰竭评价指标包含7个过程指标、1个结局指标。
利用病例调查表收集20家医院评价指标的使用情况。整理数据见表1和表2。nkh为第h家医院适合使用第k个指标的患者人数,ykh为第h家医院实际使用第k个指标的患者人数,k=1,2,…,19,h=1,2,…,20。
表1 急性心肌梗死的评价指标及数据
表2 慢性心力衰竭的评价指标及数据
2.构建多维项目反应理论模型
多维项目反应理论模型能有效地建立被试的多种能力(潜变量)和其在特定项目上反应概率之间的函数关系,为评估医院急性心肌梗死和慢性心力衰竭的治疗质量,本研究的模型如下:
其中pkh为第h家医院对第k个指标使用的概率,潜变量θ1h、θ2h分别为第h家医院急性心肌梗死和慢性心力衰竭的治疗质量,为能力参数;α1k、α2k和βk为第k个参数的项目参数。
3. 模型参数估计
结合贝叶斯估计法和MCMC方法估计本研究模型中的参数,应用OpenBUGS3.2.3进行数据分析,项目参数的先验分布设置为βk~N(0,0.5),k=1,2,…,19;α1k~N(0,0.5)I(α1k>0),k=1,2,…,11;α2k~N(0,0.5)I(α2k>0),k=12,13,…,19,其中I()为示性函数。能力参数的先验分布设置为θh~每个参数模拟1条马尔可夫链,所有参数初始值设置默认初始值,每条马尔可夫链设置重复迭代1000000次,模拟退火500000次。
1.模型参数的收敛性
所有基于MCMC的统计推断都是建立在马尔可夫链已经收敛的情况下,本研究模型中的每个参数,分别模拟了1条马尔可夫链,图1为能力参数θ11的后验均值在默认初始值下历史迭代的时间序列图,可见序列收敛,其他参数马尔可夫链也已收敛,图略。
图1 能力参数θ11的时间序列图
2.急性心肌梗死治疗质量、慢性心力衰竭治疗质量评价结果
表3为20家医院能力参数θ1h、θ2h的后验均值和急性心肌梗死、慢性心力衰竭治疗质量排序结果,h=1,2,…,20。急性心肌梗死治疗质量排名较前的医院,其慢性心力衰竭治疗质量的排名居前;急性心肌梗死治疗质量排名居后的医院,其慢性心力衰竭治疗质量的排名也居后。对急性心肌梗死治疗质量与慢性心力衰竭治疗质量的估计值进行相关分析发现二者间相关系数为0.789,P<0.0001,具有统计学意义。
表3 20家医院急性心肌梗死与慢性心力衰竭治疗质量评价结果
针对已有的急性心肌梗死和慢性心力衰竭评价指标数据,可以选择对两种疾病分别拟合两个单维项目反应模型,各潜变量分别代表医院急性心肌梗死和慢性心力衰竭的治疗质量,也可选择拟合一个项目间多维模型,本研究为二维模型。项目间多维模型能同时估计多个维度的潜变量,并将不同维度潜变量间的相关性直接整合进模型中,能有效利用潜变量间的相关性[6]。
有研究[6]表明项目间多维模型优于多个单维项目反应理论模型,优势主要体现在以下方面:项目间多维模型对实际数据的拟合优于后者;项目间多维模型得到的多个潜变量估计值的可靠性优于多个单维项目反应理论模型,当评价指标数目较少时,应用项目间多维模型分析会显著增加估计值的可靠性,因项目间多维模型能够考虑各子集评价指标的相关性,从而得到更多的信息。
目前疾病治疗质量评价关注于单个疾病,但实际上一些疾病的发病机理相似、治疗模式相仿,治疗存在共性,治疗质量间存在相关性,将多个相似疾病的评价指标数据综合起来评价疾病治疗质量更为合理。本研究尝试将多维项目反应理论模型应用于医院急性心肌梗死和慢性心力衰竭的治疗质量评价,构建的模型能同时获得医院急性心肌梗死治疗质量和慢性心力衰竭治疗质量的估计值,并得到每个疾病治疗质量排序结果和两个疾病治疗质量估计值间相关性的大小。实例分析显示,急性心肌梗死治疗质量较好的医院,慢性心力衰竭的治疗质量也较好,即急性心肌梗死评价指标使用率较高的医院,慢性心力衰竭评价指标的使用率也较高,模型估计得到的相关系数r=0.789,进一步提示应用多维项目反应理论模型对急性心肌梗死和慢性心力衰竭进行治疗质量评价具有合理性。
[1]Avedis Donabedian.Evaluating the quality ofmedical Care.The M ilbank Quarterly,2005,83(4):691-729.
[2]Johannes Hartig,Jana Hohler.Multidimensional IRT models for the assessment of competencies.Studies in Educational Evaluation,2009,35:57-63.
[3]戴海琦.基于项目反应理论的测验编制方法研究.考试研究,2006,4:31-44.
[4]Johannes Hartig,Jana Höhler.Representation of competencies in multidimensional IRTmodels with within-item and between-item multidimensionality.Zeitschrift für Psychologie/Journal of Psychology,2008,216(2):89-101.
[5]Sheng YY,Wikle CK.Bayesianmultidimensional IRTmodelswith a hierarchical structure.Educational and Psychological Measurement,2008,68(3):413-430.
[6]Diane D,Allen,Mark Wilson.Introducing multidimensional item response modeling in health behavior and health education research.Health Education Research Theory&Practice,2006,21(Supplement 1):73-84.
(责任编辑:郭海强)
The Application of M ultidimensional Item Response Theory in the Evaluation of Quality of Care
Liu Dan,Bao Han,Su Shaofei,et al.(DepartmentofBiostatistics,HarbinMedicalUniversity(150081),Harbin)
ObjectiveUsing multidimensional item response theorymodel to evaluate the quality of care of acutemyocardial infarction and chronic heart failure.MethodsBased on the multidimensional item response theory,we established a functional relationship among quality of care of acutemyocardial infarction and chronic heart failure along with the usage probability of quality indicator.Bayesian estimation method and Markov chain monte carlo(MCMC)method were used to estimate model parameters.ResultsWe established themultidimensional item response theorymodelwhich was used to evaluate quality of care of acutemyocardial infarction and chronic heart failure;and attained the estimators of quality of care for the two diseases,then ranked the hospitals by quality of care.The correlation coefficient of quality of care estimators between the two diseaseswas 0.789(P<0.0001).ConclusionMultidimensional item response theory model is appropriate for evaluating quality of care,it can estimate quality of care for several related diseases simultaneously and integrate the correlation between quality of care of different diseases,and can getmore reliable and accurate estimators.
Acutemyocardial infarction;Chronic heart failure;Quality of care;Multidimensional item response theory
国家自然科学基金资助(81273183)
△通信作者:刘美娜,E-mail:liumeina369@163.com