经典测量理论与概化理论结合评价卵巢癌患者生命质量测定量表中文版的信度研究

2013-04-20 02:38罗家洪万崇华李高峰卢玉波杨宏英
中国全科医学 2013年7期
关键词:重测信度卵巢癌

李 微,罗家洪,万崇华,李高峰,卢玉波,杨宏英,孟 琼

2003—2007年我国肿瘤登记地区资料表明:卵巢癌合计发病率为8.28/10万,占我国女性恶性肿瘤发病的3.49%,居中国第8位。卵巢癌合计死亡率为3.31/10万,在我国女性恶性肿瘤死亡中占2.51%,居中国第12位。由于其发病隐匿,病死率高,已严重威胁妇女健康[1]。近30年来生命质量已发展为全球的概念,满足了评价患者整体良好感觉及其与疾病、治疗的关系的认知需要,生命质量研究形成了国际性研究热点[2]。国外已开发了不少量表,但鉴于生命质量具有很强的文化依赖性,国外量表不能直接翻译过来使用,必须对西方量表进行汉化处理。鉴于此我们将美国结局、研究和教育中心(CORE)研制的卵巢癌患者生命质量测定量表 (functional assessment of cancer therapy-ovary cancer,FACT-O)进行翻译、回译及文化调适,形成相应的中文版。FACT-O由面向所有癌症患者的核心量表FACT-G和专门针对卵巢癌的12个条目的附加关注模块两部分构成,分为5个领域共39个条目,即生理状况(7条)、社会/家庭状况(7条)、情感状况(6条)、功能状况(7条)和附加关注(12条)。量表采用5等级式条目设置,正向条目直接计分(0~4分),逆向条目则反向计分,将各领域的条目得分相加即可得到该领域得分,各领域得分相加得到总量表得分[3]。目前附加关注(OCS)计分中没有包括条目BMT7。该量表在国外已得到广泛应用[4-8]。FACT-O中文版是经过一系列量表汉化方法[9]研制而成的专门针对卵巢癌患者的生命质量测定量表。本研究就其信度考评结果进行报道。

1 对象与方法

1.1研究对象选择云南省肿瘤医院妇瘤科为调查点,入选标准:(1)临床上已确诊的卵巢癌患者;(2)具备一定读写能力,有较好依从性的住院患者;(3)自愿参加测评。排除标准:(1)文盲;(2)神志不清、无法清楚表达内心感受者;(3)危重患者。

1.2调查方法FACT-O中文版为患者自评式量表,调查者以医生的身份出现,作简单的解释和说明后将量表发给患者填写,并等待其完成后收回检查有无漏项。对每个调查对象在入院时进行第一次测定,并抽取其中的部分患者在第2~3天进行一次重测以便评价重测信度,在患者出院时再进行第三次测定以便评价反应度。

1.3信度评价方法采用经典测量理论(classical test theory,CTT)中的信度考评方法,重测信度:第一、二次测定结果各领域得分和总分做配对t检验,领域间得分做相关性分析;内部一致性信度:计算各领域的克朗巴赫α系数。

此外,我们还采用现代测量理论中的概化理论(generalizability theory,GT)进行信度评价。采用第一次测量数据进行分析,用相对误差、绝对误差、概化系数、可靠指数等指标评价量表信度[10]。

GT是一种把干扰测验分数的无关变量或因素引入测量模型之中,然后用统计技术分别估计出这些因素或因素之间的交互作用对测验分数的影响程度,从而较好地控制测评误差的现代测量理论[11]。GT分析一般包括G研究和D研究两个过程,其中G研究主要是尽可能多地估计测量过程中所有误差来源的变异分量,D研究为了某种特殊的决策需要,以G研究得到的变异分量估计值为基础,调整测量过程中各方面的关系,使得测量误差最小。

本研究属于随机单面交叉设计模式,测量目标为患者水平(person,记为p)、测量侧面量表条目(item,记为i),本研究主要考虑量表设计多少条目才能反映出患者的生命质量状况。G研究:采用试验设计的方法分解总变异,利用ANOVA软件将测量目标及测量侧面的效应及它们之间的交互效应一估计出来。D研究(决策研究):以量表5个不同的领域各自作一个概化全域来分析,根据概化全域各侧面样本个数,在样本均值基础上重新估计G研究中各个因素效应或因素之间交互作用,并求出各因素的均方值(MS)。然后在各个概化全域上分别估计出各自的相对误差变异〔σ2(δpi)〕、绝对误差变异〔σ2(Δpi)〕,进而估计整个测验的概化系数(Eρ2)、可靠性指数(Φ)。重新确立概化全域,重复上述步骤,最后比较各概化全域上测验的估计精度,从中获得相应的分析结果。

2 结果

2.1一般情况本研究对73例卵巢癌患者进行了测定,所有患者均为女性,年龄13~68岁,平均年龄为(49.4±12.7)岁,中位年龄52岁。民族以汉族居多,共62人(占84.9%)。婚姻状况:已婚66人(占90.4%)、未婚6人(占8.2%)、其他1人(占1.4%)。文化程度:中学及以上者50人(占68.5%)。职业:农民9人(占12.3%),工人19人(占26.1%),教师9人(占12.3%),干部9人(占12.3%),个体2人(占2.7%),其他25人(占34.3%)。

2.2重测信度利用第一、二次生命质量测定结果做重测信度分析,FACT-O中文版共性模块(FACT-G)四个领域和特异模块(附加关注,OCS)相关性分析结果见表1。结果显示除附加关注外,其余两次相应领域的相关系数均在0.8以上(P<0.05),经配对t检验两次测量间差异无统计学意义(P>0.05),表示重测信度好。

2.3内部一致性信度FACT-O中文版共性模块(FACT-G)四个领域和附加关注的内部一致性分析见表1,除了附加关注外,其余领域克朗巴赫α系数均大于0.7,从此分析可认为量表的内部一致性比较好。

表1各领域内部一致性与重测相关分析结果

Table1Internal consistency and test-retest correlation coefficients for each domain

领域条目数克朗巴赫α系数重测相关系数r值   P值生理状况(PWB) 7 08210888<0001社会/家庭状况(SFWB) 7 07650827<0001情感状况(EWB) 6 08470890<0001功能状况(FWB) 7 07600847<0001附加关注(OCS)1106400366 0002总量表(TOTAL)3908490828<0001

注:附加关注(OCS)中BMT7不参与计分

2.4GT分析G研究结果显示,各领域中患者与条目的交互作用的变异分量估计值最大,各领域在总方差中占的比重分别为:生理状况55.17%、社会/家庭状况50.76%、情感状况42.63%、功能状况60.73%、附加关注63.58%。在生理状况、情感状况、功能状况领域中患者在测量中所占变异分量估计值居中,而在社会/家庭状况、附加关注领域所占变异分量估计值最少。见表2。

D研究结果显示,当固定被试者以后,在生理状况、社会/家庭状况、情感状况、功能状况领域,随着条目数从4增至10条时,各领域的相对误差、绝对误差都逐渐减小。从概化系数和可靠性指数变化趋势来看,随着条目增加概化系数和可靠性指数逐渐增大,且条目数为4条时,除社会/家庭状况领域可靠性指数为0.553外,其余各领域概化系数和可靠性指数均在0.60以上。生理状况、社会/家庭状况、情感状况、功能状况领域均显示出较高的系数水平。对于附加关注领域,当条目数从11增至17条时,相对误差、绝对误差的变化趋势亦是逐渐减小,概化系数和可靠性指数逐渐增大。当条目数为17时,概化系数为0.733,可靠性指数为0.661,可以考虑适当增加条目以提高量表的信度。见表3。总的来说,FACT-O中文版各领域条目信度较好。

表2各领域概化理论G研究结果

Table2Results of G research of generalizability theory (GT) on each domain

注:p为患者,i为条目,p×i为患者×条目

表3 各领域概化理论D研究结果

注:σ2(δpi) 为相对误差,σ2(Δpi)为绝对误差,Eρ2为概化系数,Φ为可靠性指数

3 讨论

卵巢癌是女性3大恶性肿瘤之一,其发病率呈逐年上升的趋势,严重影响女性的生存质量[12]。研制能有效测定卵巢癌患者生命质量的量表成为改善患者生命质量的关键。为此,我们将应用广泛的美国CORE研制的FACT-O进行汉化,形成中文版,便于对卵巢癌患者的生命质量进行研究。

在本次研究中,我们采用CTT与GT相结合来进行量表信度分析。CTT中,采用了重测信度与内部一致性信度等信度评价方法,由于FACT-O量表条目不是随机分配的,我们在进行信度评价时没有计算其分半信度系数。除特异模块外,第一、二次测定结果的其他相应领域的重测相关系数均在0.8以上,克朗巴赫系数α值均大于0.70。目前,对于信度系数还没有公认的标准,Hays等[13]认为相关系数达到0.7以上信度就比较好,Schünemann等[14]研究的量表内部相关为0.77~0.91,而重测信度为0.73~0.95,他们认为这个结果比较好。因此,可以认为量表的重测信度和内部一致性信度都比较好。应用GT对量表信度进行分析,各领域的概化系数和可靠性指数均在0.60以上,从结果可以看出,量表具有较好的信度,这与重测信度、内部一致性信度结果基本吻合。在GT D研究中,生理状况7条、社会/家庭状况7条、情感状况6条、功能状况7条均适宜,而特异模块领域条目增加至15条时,概化系数和可靠性指数均在0.60以上,提示在保证可行性的前提下,可以适当增加特异模块条目。

在CTT中信度是一组测验分数中真分数方差与观察分数方差的比率,信度系数往往随测量设计的不同而不同。而事实上,误差变异并非单一的结构,CTT对误差来源的笼统划分与控制成为它在实际应用中最为突出的缺陷。CTT的另一个突出的局限在于“严格平行测验”(strict parallel test)的理论假设,这在实际的测验情景中很难满足[15]。GT弥补了CTT的不足之处。首先,以“随机平行测验”为理论假设,使分析问题的条件较容易得到满足。其次,GT利用方差分析技术将变异进行分解,更便于测量误差的控制。最后,GT最显著的特点是强调测量的具体情境,它认为,测量的根本目的并不是为了获得特定条件下的测量结果,而是要以此来推断更广泛的条件下可能得到的测量结果,以寻求最优化的测量设计,改进并指导实际的测量工作。但GT也存在一定的局限性。若数据结构过于复杂,方差分量估计有时会出现负值,这是一个困惑人心的统计理论问题,在时间测量研究中就将更难解释。GT理论的可靠性严重依赖于实测数据的完备性[16]。因此,研究者必须有较高的测验设计水平和实测控制能力。即便如此,在将预测数据分析的结果应用到实际测验的编制时,也应充分注意到随机误差的影响[10]。基于以上考虑,我们建议采取CTT与GT相结合,从不同角度、用不同方法对量表进行系统评价。

我们严格按照量表汉化的一套程序研制成卵巢癌患者生命质量测定量表FACT-O中文版,并将其应用于临床卵巢癌患者生命质量的测定以评价其信度、效度、反应度及可行性。经过一系列分析,该量表具有较好的信度,其效度、反应度考评将另文报道。

1杨念念,严亚琼,龚洁,等.中国2003—2007年卵巢癌发病与死亡分析[J].中国肿瘤,2012,21(6):401-405.

2万崇华.生命质量测定与评价方法[M].昆明:云南大学出版社,1999:224-227.

3Basen-Engquist K,Bodurka-Bevers D,Fitzgerald MA,et al.Reliability and validity of the functional assessment of cancer therapy-ovarian[J].Clin Oncol,2001,19(6):1809-1817.

4Le T,Hopkins L,Fung Kee Fung M.Quality of life assessments in epithelial ovarian cancer patients during and after chemotherapy[J].Int J Gynecol Cancer,2005,15(5):811-816.

5Pokrzywinski R,Secord AA,Havrilesky LJ,et al.Health-related quality of life outcomes of docetaxel/carboplatin combination therapy vs.sequential therapy with docetaxel then carboplatin in patients with relapsed,platinum-sensitive ovarian cancer:Results from a randomized clinical trial[J].Gynecol Oncol,2011,123(3):505-510.

6von Gruenigen VE,Huang HQ,Gil KM,et al.Assessment of factors that contribute to decreased quality of life in Gynecologic Oncology Group ovarian cancer trials[J].Cancer,2009,115(20):4857-4864.

7Canada AL,Parker PA,de Moor JS,et al.Active coping mediates the association between religion/spirituality and quality of life in ovarian cancer[J].Gynecologic Oncology,2006,101(1):102-107.

8Le T,Hopkins L,Kee Fung MF.Quality of life assessment during adjuvant and salvage chemotherapy for advance stage epithelial ovarian cancer[J].Gynecologic Oncology,2005,98(1):39-44.

9万崇华,罗家洪,杨峥,等.癌症患者生命质量测定与应用[M].北京:科学出版社,2007:84-200.

10杨志明,张雷著.测评的概化理论及其应用[M].北京:教育科学出版社,2003.

11杨志明,张雷著.测评的概化理论及其应用[M].2版.北京:教育科学出版社,2005:2.

12张晓磬,施琼芬,万崇华,等.癌症患者生命质量测定量表体系之卵巢癌量表的研制及初步考评[J].中国全科医学,2012,15(10):3233.

13Hays RD,Anderson R,Revicki D.Psychoometric consideration in evaluating health-related quality of life measures[J].Quality of Life Research,1993,2(2):441-449.

14Schünemann HJ,Sperati F,Barba M,et al.An instrument to assess quality of life in relation to nutrition:Item generation,item reduction and initial validation[J].Health Qual Life Outcomes,2010,11(8):16.

15金瑜.心理测量[M].上海:华东师范大学出版社,2001.

16敖勇前.概化理论研究综述[J].皖西学院学报,2008,24(2):49-52.

猜你喜欢
重测信度卵巢癌
miR-181a在卵巢癌细胞中对顺铂的耐药作用
井下精确人员定位系统定位重测机制研究
《广东地区儿童中医体质辨识量表》的信度和效度研究
作为数学教育研究质量分析的信度
反馈与重测对二语测试效应的影响
平衡损失函数下具有时间效应和通胀因子的信度估计
尼泊尔拒与印度共测珠峰 印媒怀疑“中国背后干预”
CXXC指蛋白5在上皮性卵巢癌中的表达及其临床意义
卵巢癌脾转移的临床研究进展
卵巢癌、输卵管癌和腹膜癌FIGO2013分期和临床意义的解读