倪飞霞 黄跃师 顾艳荭 蔡婷婷 黄青梅 吴傅蕾 袁长蓉
(1.复旦大学护理学院,上海 200032;2.复旦大学附属肿瘤医院,上海 200032;3.复旦大学附属上海市第五人民医院,上海 200240)
世界卫生组织发布的《全球癌症报告》[1]中显示, 我国2020年新发癌症患者457万人,占全球23.7%,癌症发病率为204.8/10万,高于全球平均水平。在漫长的治疗及疾病进展过程中,超过半数的癌症患者会出现身体功能方面的问题,影响其生活质量[2]。此外,身体功能的缺陷与跌倒的风险增加等密切相关[3]。因此,对患者进行身体功能评估,并及时给予相应的干预及跟踪随访将有利于改善其预后。患者报告结局测量信息系统(patient reported outcome measurement information system,PROMIS)基于项目反应理论(item response theory,IRT)开发并经过大样本的测量学检验,可用于慢性病人群和一般人群自我报告的症状及功能评估[4]。其中,身体功能简表8b(PROMIS physical function short form 8b,PROMIS-PF-8b)是PROMIS生理健康领域被应用最广泛的量表之一。等级反应模型又被称为塞姆吉玛等级反应模型,该模型为双参数模型,包含区分度和难度2个参数,在该模型中,每个条目在各个等级上的难度呈单调递增,适用于Likert型量表。本研究以IRT为指导,分析中文版PROMIS-PF-8b在癌症患者群体中的测量学属性,了解该量表在癌症群体中的适用性。
1.1一般资料 采用方便抽样法,选取2020年11月-2022年8月复旦大学附属肿瘤医院和复旦大学附属上海市第五人民医院的癌症患者为研究对象。纳入标准:(1)确诊为恶性肿瘤。(2)年龄≥18岁。(3)认知功能正常,可独立进行阅读及书写。(4)知晓病情并自愿参与本研究。排除标准:病情危重或合并其他严重疾病,影响进行问卷调查者。基于等级反应模型的量表检验要求样本量应>1 000例[5],故本研究共发放1 200份问卷。
1.2研究工具
1.2.1一般资料调查表 采用自制的人口学及疾病特征采集表,收集患者的性别、宗教信仰、年龄、文化程度、婚姻状况、子女数量、主要照顾者、工作状况、常住地、支付方式、吸烟史、饮酒史、患病时长及癌种等资料。
1.2.2中文版成人PROMIS-PF-8b PROMIS-PF-8b是PROMIS生理健康领域中最常用的量表,身体功能主要涉及上肢功能、下肢功能、躯干功能及日常活动能力[6]。本研究团队根据慢性病治疗功能评价(functional assessment of chronic illness therapy,FACIT)翻译方法,严格遵循其步骤,已完成中文版成人PROMIS-PF-8b的翻译[7]。该量表共8个条目,采用Likert 5级评分(前4个条目:1=无法做到、2=非常困难、3=有一些困难、4=有少许困难、5=没有任何困难;后4个条目:1=非常、2=相当、3=有些、4=有一点、5=一点也不)。总分为8~40分,按PROMIS对于简表的计分要求,原始得分经转换后采用标准T-score(50±10),得分越高表明身体功能越好[8]。英文版PROMIS-PF-8b的Cronbach′s α系数为0.950,分半信度为0.920。
1.3.1单维性 单维性是指量表所有条目测量的都是同一潜在特质,即量表所测量的特质是影响研究对象对条目做出相应回答的主要因素[9]。本研究采用主成分分析方法判断量表是否满足单维性,若量表满足第1因子特征根与第2因子特征根之比超过4且第1因子特征根所解释的方差>20%时,则表明该量表符合单维性[10]。
1.3.2单调性 单调性是指研究对象正确作答的概率应随着其潜在特征水平的增加而增加,本研究通过量表各条目的项目特征曲线(item characteristic curve,ICC)来判断条目的单调性[11]。若曲线单调递增,则表明该条目符合单调性。
1.3.3区分度、难度及信息量 通过拟合模型估计各个条目的区分度、难度及信息量等,并根据其估计值评价条目质量[12]。(1)区分度参数:条目区分不同能力水平研究对象的能力,值越大表示条目对不同研究对象能力水平的鉴别能力越强。在ICC图中,区分度反映了ICC曲线的斜率,一般认为条目的区分度应>0.50。(2)难度:又被称为位置参数,表示正确作答条目的概率为0.5的能力值点,也就是ICC曲线的中间点落在能力量尺(X轴)上的位置。一般认为条目的难度应在区间[-3.00,3.00][13]。(3)信息量:反映各条目在估计研究对象能力时所能提供信息的确定性水平,与信度密切相关[14]。量表的信度越高,其信息量越大,测量标准误差就越小,一般要求整个量表信息量≥16,即要求测量误差≤0.25[13]。
1.3.4项目功能差异 项目功能差异是指具有相同能力水平但属于不同群体的被试答对某一项目的概率有所不同,即群体关系这个变量对被试的表现产生影响,从而影响了测试的有效性[15]。本研究采用R4.2.1软件的软件包scDIFtest和使用multi Group 函数检验量表各个条目在性别与年龄上是否存在项目功能差异,P<0.05则认为该条目存在项目功能差异。
2.1研究对象一般资料 本研究共发放1 200份问卷,回收有效问卷为1 024份,有效回收率为85.3%。见表1。
表1 研究对象一般资料(n=1 024例)
2.2量表条目得分 量表各条目的得分及条目-总分相关系数,见表2。条目PFA23得分最高(4.65±0.92),条目PFA23得分最低(2.48±1.37),条目-总分相关系数为[0.68,0.88],相关较好(P<0.05)。量表的天花板效应(0.3%)和地板效应(2.8%)较低,可忽略。
表2 中文版PROMIS-PF-8b条目得分
2.3单维性检验 主成分分析结果显示,第1因子的方差贡献率为65.1%(>20%),且第1因子特征根与第2因子特征根的比值为4.38(>4),符合单维性。
2.4单调性检验 基于量表各个条目的项目特征曲线判断其单调性,以条目PFA11的项目特征曲线为例,曲线单调递增,图中横轴为患者的身体功能水平,纵轴为患者的选项回答情况,身体功能越好的患者,越倾向于选择更高级别的选项。量表的所有条目均符合单调性的假设。各条目的ICC图,见图1(扫后文二维码获取)。
2.5条目区分度、难度和信息量 各条目的区分度较好,为[1.11,7.42],其中,条目PFA11和PFA53的区分度最好。各条目难度为[-1.44,2.30],条目难度适中。量表各条目的区分度和难度,见表3。Y轴表示的是信息量,X轴表示的是难度水平,量表最大信息量为34.768,最大信息量所对应的潜在能力参数值为-1.4,量表信息量理想。
表3 各条目区分度和难度
量表整体及各条目信息量,见图2,扫二维码获取图1和图2。
2.6项目功能差异分析 项目功能差异分析结果显示,条目PFA53和条目PFA4在性别上存在项目功能差异,PFC12和条目PFA4在年龄上存在项目功能差异,见表4。
表4 量表项目功能差异分析
3.1中文版成人PROMIS-PF-8b在癌症患者中具有理想的测量学属性 本研究基于等级反应模型对量表进行测量学属性分析,结果显示,量表符合单维性和单调性的基本假设,在区分度、难度及信息量等测量学属性上表现较好。主成分因子分析结果显示,第1因子的方差贡献率为65.1%(>20%),且第1因子特征根与第2因子特征根的比值为4.38(>4),量表符合单维性。也可采用验证性因子分析检验量表的单维度因子结构,模型拟合良好,则表示量表符合单维性[16]。本研究量表区分度范围为[1.11,7.42],难度范围为[-1.44,2.30],整体信息量为[0.10,34.77],最大信息量所对应的潜在能力参数值为-1.4,信息量较好[17]。Feng等[6]在慢性病群体中检验了英文版成人PROMIS-PF-8b,指出该量表具有较高的内部一致性(Cronbach′s α=0.95)和折半信度(r=0.92,P<0.001)。Van等[18]使用PROMIS-PF-8b及简明生活质量量表中身体功能维度评估腹部手术患者在术前(T0)、术后1周(T1)、术后3周(T2)以及术后5周(T3)的身体功能状况,通过计算Spearman相关性分析发现,2份量表在T0、T2和T3时间点得分高度相关(r>0.7),PROMIS-PF-8b具有较好的校标效度及反应度。
3.2中文版成人PROMIS-PF-8b在癌症患者中的部分测量学性能尚待进一步改善 虽然中文版成人PROMIS-PF-8b在癌症患者中的区分度和难度等测量学性能较好,但部分条目在癌症患者群体中存在项目功能差异。本研究检验了量表在癌症患者性别及年龄上的项目功能差异,结果显示,量表的条目PFA53和PFA4存在跨性别的测量不等价,条目PFC12和PFA4存在跨年龄的测量不等价。Feng等[6]研究结果与本研究采用条目打包技术的多组验证性因子分析(multi-group confirmatory factor analysis, MGCFA)模型,验证了英文版成人PROMIS-PF-8b在患有慢性病患者中的测量等价性,发现量表8个条目均未出现项目功能差异(P>0.05)。原因可能是中西方文化的差异,使得患者对这些条目表述的理解不相同。尽管前期中文版的引进严格按照 FACTI的翻译方法进行,但也可能存在部分条目用词不够准确的问题,提示今后可能还需要对以上条目开展认知性访谈,再次进行中文用词上的修订和完善。
3.3本研究的局限性 (1)本研究的横断面设计仅收集了癌症患者单个时间点的测评数据,今后应增加患者不同时间点的症状评估数据收集,以评价量表在不同时间节点的反应度。(2)本研究样本来自华东地区,具有明显的区域特征;研究对象均为住院患者,未进行治疗期和非治疗期癌症患者的已知组别效度分析。(3)在今后的研究中可进一步完善以上不足,丰富样本,提高中文版成人PROMIS-PF-8b的适用性。(4)跨文化等价性是PROMIS这一国际标准化的量表进行国际推广应用的重要前提,中文版成人PROMIS-PF-8b的跨文化测量等价性的检验有待完善。
综上所述,本研究通过大样本的资料收集,在癌症患者群体中评价了中文版成人PROMIS-PF-8b的测量学性能。总体上,量表在癌症患者中的测量学性能较好,适用于中国癌症患者人群,也可尝试用于其他慢病人群,并借助PROMIS统一的度量标准实现与不同国家及地区相关研究数据的比较。