患者报告的临床结局研究述评*

2011-09-18 01:56万崇华黄新萍林岳卿
郑州大学学报(医学版) 2011年4期
关键词:量表测量评价

万崇华,黄新萍,常 巍,林岳卿

1)广东医学院人文与管理学院暨生命质量与应用心理研究中心 东莞523808 2)昆明医学院公共卫生学院流行病与卫生统计学教研室昆明650031 3)中山大学公共卫生学院流行病与卫生统计学系广州510089

(2011-06-09收稿 责任编辑 王 曼)

1 患者报告的临床结局(patient reported outcomes,PRO)的概念及意义

随着疾病谱、健康观的改变以及人们对“以患者为中心”理念的重视,人们对健康的定义也从原有的身体无疾病转变为身体、心理及社会适应均要求达到良好。患者的主观感觉在健康状况评价中的作用越来越重要。但心理及社会适应的测量并非像身体健康那样具有一定的客观指标,它们是患者自身的主观感受,只有患者自己才能给出真实的答案。临床医学用传统方法如死亡和缓解来评价某一疾病的结局,忽视了患者对疾病和治疗在心理状态、主观感受、生理功能、家人关系和社会角色等方面的影响[1]。另外,由于健康具有多维性和动态性,传统上仅关注生命的保存与局部躯体功能改善的一些方法和评价指标体系面临严重挑战[2]。在临床研究中,研究者渐渐意识到应注重评价患者最期望改善的自觉症状以及这些症状对患者日常生活的影响,使其作为选择治疗手段的一种工具。为此,有学者先后开始了生命质量(quality of life,QOL)[2]与 PRO 的研究[3-6]。

PRO是一个含义很广又未完全统一的术语,它是指直接来源于患者的主观评估,包括对其症状、功能、健康、健康相关生命质量等方面的感知以及对于治疗和医患关系的满意度[3],通过访谈、自评问卷或其他数据捕捉工具(如有关患者日常生活、健康状态和治疗措施等方面的日志)得到的直接来自于患者报告的相关资料[4]。上世纪70年代初期,人们已开始对PRO进行研究,随着研究的不断深入,早期的PRO目前已被分化成了健康相关的生命质量和患者报告的症状性指标两大领域[5],也包括患者对保健治疗措施的满意度、与临床结局直接相关的治疗的依从性以及其他通过各种方式询问患者获得的结局评价信息[3,6]。一般PRO量表包含9个大的方面,即躯体功能、症状、全面健康评估、心理健康、社会交往、认知功能、个人职能、个人建构及治疗满意度。

PRO测定工具所测量的概念、事件、行为或感受可以是容易观察或证实的(例如行走),也可以是不可观察、只有患者自己知道而不容易证实的(例如感觉抑郁)。PRO量表作为一种正规化、结构化的访谈技术,可以使测量误差达到最小,确保测量的一致性。它以患病的“人”为中心,重视患者的主观感受,通常以自评量表的形式出现,这种自评形式没有医生的干预,往往比临床医生访谈或打分等方法更可取。没有第三方的干扰,可直接获得患者对治疗效果的反应,不会受到调查者变异性的影响,比医生报告的临床测量更可靠。绝大多数非器质性疾病如神经官能症、抑郁症、更年期综合征和失眠等,实验室检查指标可能出现阴性结果,而此时患者提供的自觉症状是诊断这些疾病的惟一证据。PRO以患者的利益为出发点,可以解释生理指标的变化对患者健康状况的影响。PRO可以提供治疗疾病的额外信息,反映患者的综合健康状况,更重要的是可用于药物疗效和治疗方案的评价与选择。

PRO现在更多地还是应用在新医药产品的临床试验中,主要原因是[7]:①只有患者才知道某些治疗效果。对于某些治疗效果,患者是数据的惟一来源。例如疼痛程度和疼痛缓解是开发镇痛产品过程中使用的基本测量。对于这些概念,没有可观测的或物理的测量方法。②患者对治疗有效性提供独特的看法。可以开发PRO测定工具,用于测量患者从治疗中想要和期待什么、什么对他们最重要。当用PRO测定工具来测量研究终点时,可在临床医师的观点或生理检测结果之上增加对产品性能的了解。这是非常重要的,因为某种疾病状况临床测量结果的改善不一定对应于患者功能或感受的改善。例如,临床有意义的肺功能改善(肺活量测定法)并不与哮喘相关症状以及症状对患者日常生活能力的影响密切相关。③正式评估可能较非正式访视更可靠。在临床实践中,为了得到只有患者才知道的信息,临床医生常通过非正式提问对患者进行评估,例如“您睡觉用几个枕头”或“您夜间咳嗽吗”。在临床试验中,要使用特定的问题进行正式的临床评估,因为结构性访视技术可将测量误差降到最小,并确保一致性。与临床医师进行访视和评定的方法相比,人们更愿意采纳将问卷直接发给患者,在没有临床医师干预的情况下,由患者自我完成问卷的方法。与观察者报告的方法相比,自我完成问卷能在没有第三方干预的情况下,直接获得患者感受到的对治疗的反应,可能更加可靠,因为它不受观察者间变异性的影响(通常只有通过观察者的强化培训才能降低这种变异性)。但另一方面,如果 PRO测定工具不易被患者理解和完成,PRO测量可能受到患者间变异性的影响。尽管存在这些问题,许多精心研制、充分验证的PRO测定工具仍显示出与大多数专家评估结果相吻合(实际上,这就是验证PRO测定工具效度的常用方法),而且,特别适用于有许多研究者参与的研究。当治疗对生存率无太大影响而对生命质量有显著影响时,或者治疗对功能和健康状况造成负面影响(或出现不良反应)时,或者治疗决策需考虑客观指标和患者主观感受时,PRO将可能是临床研究的主要终点指标。已经有不少学术机构、专业组织推荐在临床研究中应用PRO进行治疗效果评价,也有不少学术组织将以PRO为治疗效果评价指标的研究结果列入治疗指南之中[8-10]。慢性病由于其自身的特点(病程长,难治愈),真实反映患者情况的自我报告资料将是十分合适也是重要的评价指标。例如梁兆晖等[11]采用PRO原则对针刺治疗颈椎病的短中期疗效进行了评价,采用Northwick Park颈痛量表(NPQ)作为主要疗效指标,采用SF-36生活质量量表作为次要疗效指标。

2 PRO与QOL的关系

QOL是个人对他/她生活的各个方面和总体的主观评价。过去几十年中,人们多注重QOL研究,近年来也开始将症状性指标作为QOL量表中的一部分来评价临床疗效。PRO与QOL之间有联系也有区别。对患者而言,首先两者都是从患者的角度看待疾病和疗效等;其次,在临床范围内,QOL评测主要靠患者自我报告,其所使用的评测工具通常是患者自评量表,这是PRO的内容之一。当然,两者也有明显的区别(表1)。QOL是一个广义的概念,可以包含健康状况的各个方面(与健康相关的生命质量,HRQOL),也可以包括与健康无关的内容(如社会公平性、环境等),既可用于健康人群,也可用于患者;而PRO只针对患者,可以比较集中地针对记录一个单独的症状,比如疼痛,或者患者对治疗的满意度。PRO表述的是关于健康状况和治疗的患者的报告,而HRQOL则表述了患者关于健康状况和治疗对日常生活的影响的自我评价。总而言之,从获得的资料看,QOL得到的太过于广泛,不够特异,而PRO不仅可以得到总体结果,也可以根据需要得到具体结果,其测量内容既可以是“患者症状”这样的简单信息,也可以是像QOL这样包含了身体、心理和社会因素在内的多维信息。

表1 PRO与QOL的区别

3 PRO量表的开发及应用

3.1 国外量表开发 在PRO量表开发方面,著名的Nottingham健康调查表(Nottingham health profile,NHP)[12]、疾病影响调查表(sickness impact profile,SIP)[13]、生命质量指数(quality of wellbeing index,QWB)[14]等,奠定了PRO研究的雏形。随着研究的不断深入,量表开发也随之增多,以胃食管反流病为例,就有症状调查量表Gastrointestinal Symptom Rating Scale(GSRS)[15],用来测量该病烧心感、反酸及消化不良的 Reflux Disease Questionnaire[16],消化系统特异问卷Gastrointestinal Quality of Life Index(GIQLI)[17],侧重于症状测量的 Gastroesophageal Reflux Questionnaire(GORQ)[18],侧重于生命质量测量的Gastroesophageal Reflux Disease Health Related Quality of Life Scale(GERD-HRQL)[19]和 Quality of Life in Reflux and Dyspepsia(QOLRAD)[20],主要针对烧心感症状的Heartburn Specific Quality of Life(HBQOL)[21]。其他慢性病的PRO量表也比较多,例如成人哮喘生命质量问卷(the Adult Asthma Quality of Life Questionnaire,AQLQ),肾脏病生命质量问卷(the Kidney Disease Quality of Life Instrument,KDQOL),国家眼科研究所视觉功能问卷(National Eye Institute Visual Functioning Questionnaire,NEIVF),癫痫手术清单(Epilepsy Surgery Inventory,ESI),偏头痛的特异生活质量问卷(Migraine Specific Quality of Life,MSQOL),强直性脊柱炎生命质量问卷(the Ankylosing Spondylititis Quality of Life Questionnaire,ASQOL)及西雅图心绞痛问卷(the Seattle Angina Questionnaire,SAQ)等,但是基本上都是侧重于生命质量方面的。此外,还有一些不是针对特殊疾病的PRO量表,如Basel Extent of Rationing of Nursing Care(BERNCA)Instrument,这份量表重在由患者来评价护理情况,该问卷的克朗巴赫α系数为0.93[22]。随着研制的临床结局相关量表的迅速增多,国际上已经成立了PRO和QOI量表数据库(PROQOL ID),目的是通过网络为那些从事健康评估的研究者提供较广泛和深入的关于PRO和QOL量表的信息,促进临床研究中PRO量表的合理使用。这个数据库目前有470多个以结构化形式设置的PRO量表,并定期与量表作者密切协作校正量表内容,每年有50多个新的量表补充到数据库中[23]。

3.2 国内量表开发 在国内,有关量表的开发研究也比较多。张天嵩等[24]开发了基于不明原因慢性咳嗽PRO中医证候量表并对其进行了考评:该量表有6个维度、28个条目,总克朗巴赫α系数为0.84。李建生等[25]开发了肺炎患者PRO量表,初步考核量表克朗巴赫α系数为0.75,健康满意度0.87,疗效满意度 0.77,疾病症状 0.77。唐旭东等[26]研制了慢性胃肠疾病PRO量表,该量表有6个维度、35个条目,总克朗巴赫α系数为0.89。张艳宏等[27]研制了中风痉挛性瘫痪PRO评价量表,量表的分半信度为0.94,克朗巴赫 α系数为 0.90。陈新林等[28]研制的重症肌无力PRO量表,总量表以及各领域的分半信度系数大于0.70,各领域克朗巴赫α系数大于0.80。刘宏潇等[29]建立了基于类风湿关节炎(RA)的PRO测量量表,该量表内部一致性信度克朗巴赫α系数为0.88,分半信度系数为0.79;效度分析中,利用主成分的方法进行因子分析,得出躯体功能和社会健康、心理状态、躯体功能及躯体感觉4个领域。王杨[30]在中风痉挛性偏瘫PRO量表研究中,由量表前后两次填写的数据得到的克朗巴赫α系数为0.73和0.78。症状、心理、社会功能3个领域前后两次的克朗巴赫α系数分别为0.71、0.85、0.87 和 0.84、0.87、0.89,两次填写的分半信度分别为 0.82 和0.88。

4 问题与展望

PRO起步较晚,其相应研究还不是很成熟完善,具体可以总结为以下几点。①侧重QOL研究:QOL往往侧重于一些宏观领域(如生理、心理)的测量,而对患者诊治方面的关注不够多,比如说对于医疗护理、疗效等的满意度、知晓度等。在今后的研究中,PRO不应该只局限于一个总体结果,而应该兼顾总体与局部,开发的量表应既能反映患者的总体评价,又可以分析患者在某个方面的感觉。②相关研究都是各自为政:从查阅的文献来看,目前有关PRO量表开发的研究都是非系统的,零散的,没有一个统一的量表研制方法,一个研究者只是用其自己的方法开发研制一个量表,量表的实用性与适用性都较小,一般开发出来后很少被外界推广使用。③对每一种疾病都开发独立的测定量表:这样不仅浪费了大量的研究工作,而且开发出来的量表没有系统性和连贯性,也无法反映各种患者之间共同的QOL及症状与副作用变化情况。此外,由于疾病数以万计,每种疾病都单独开发一个量表势必出现大量零散的量表,造成研究和应用上的极度不便,既不现实,也无必要。④主观与客观相独立:临床疗效评价应包括4个方面的内容[3],临床医务人员报告资料、生理报告资料、照顾者报告资料和PRO资料,目前的研究一般只是将PRO的结果进行分析利用,并未将其与临床资料相结合。量表得分与临床客观指标之间关系的研究,尤其是结合临床指标对量表得分的临床意义的探寻与解释非常重要,是未来的一个研究热点。⑤研究集中于中医治疗:目前国内在这一方面的研究多数集中于中医方面,尤其是中国中医科学院刘保延领导的团队和广州中医药大学刘凤斌领导的团队做了大量的工作,而西医方面的有关研究相对还是很少。中西医面对的共同对象是患者和疾病,但中西医对同一患者或疾病的看法不同,其诊断、治疗等均不相同,因此二者缺乏可比性。但是PRO强调的是患者自己的主观判断。患者并不关心治疗方法是中医还是西医,他只关心他的问题(如疼痛)是否还存在。由此可见,通过PRO这一患者的主观判断,中西医可以以此为比较和结合的共同点。基于以上问题,PRO量表的研究有很现实的意义,同时也有相当的空间。⑥量表研究方法基于经典测量理论:目前在PRO量表的开发上,研究者基本上是在经典测量理论(classical test theory,CTT)的指导下进行的,而极少或未充分应用现代测量理论(modern test theory,MTT),但CTT存在测验结果拓广的有效性、统计量的样本依赖性、误差含糊和信度估计的不精确性、能力与难度量尺的不一致性等问题,鉴于此,一些现代测量理论如概化理论(generalizability theory,GT)、项目反应理论(item response theory,IRT)应运而生,这些理论在量表开发领域能够很好地弥补CTT的不足,但现在其应用仍十分有限。

在以后PRO相关研究中,应该有针对性地解决和避免以上问题,这样才会使得PRO的研究更完善,更有意义。

[1]靳艳军,赵根明.生命质量测定量表在我国的应用[J].中国医学寄生虫病杂志,2006,33(6):333

[2]万崇华.生命质量测定与评价方法[M].昆明:云南大学出版社,1999.

[3] Margaret L,Rothman,Joseph C,et al.Patient-reported outcomes:conceptual issues[J].Value Health,2007,10:66

[4] Acquardro C,Berzon C,Dubois D,et al.Incorporating the patient’s perspective in to drug development and communication:an ad hoc task force report of the patient-reported outcomes(PRO)harmonization group meeting at the food and drug administration,Fuebruary 16,2001[J].Value Health,2001,6(5):522

[5]刘凤斌,赵利.建立中医疗效测评量表体系研究的设想[J].中国临床康复,2004,8(1):164

[6] McKenna SP,Doward LC.Defining patient-reported outcomes[J].Value Health,2004,7(Suppl 1):S4

[7] FDA.Guidance for Industry-Patient-Reported Outcome Measures:Use in Medical Product Development to Support Labeling Claims,draft guidance[S].2006:2

[8] Boers M,Brooks P,Strand CV,et al.The OMERACT filter for outcome measures in rheumatology[J].J Rheumatol,1998,25(2):198

[9] Strand V,Gladman D,Isenber D,et al.Endpoints:consensus recommendations from OMERACT Ⅳ[J].Lupus,2000,9(5):322

[10]Recommendations for the registration of drugs used in the treatment of rheumatoid arthritis[J].Br J Rheumatol,1998,37(2):211

[11]梁兆晖,朱晓平,符文彬.基于病人报告结局测量的针刺治疗颈椎病疗效评价及相关性分析[J].中华中医药杂志,2010,25(8):1229

[12]Hunt SM,McKenna SP,McEwen J,et al.The Nottingham Health Profile:subjective health status and medical consultations[J].Soc Sci Med,1981,15(3 Pt 1):221

[13]Bergner M,Bobbitt RA,Pollard WE,et al.The sickness impact profile:validation of a health status measure[J].Med Care,1976,14(1):57

[14]Kaplan RM,Bush JW,Berry CC.Health status types of validity and the index of well-being[J].Health Serv Res,1976,11(4):478

[15]Yacavone RF,Locke GR 3rd,Provenzale DT,et al.Quality of life measurement in gastroenterology:what is available?[J].Am J Gastroenterol,2001,96(2):285

[16]Shaw M,Dent J,Beebe T,et al.The Reflux Disease Questionnaire:measure for Assessment of treatment response in clinical trials[J].Health Qual Life Outcomes,2008,6:31

[17]Eypasch E,Williams JI,Wood-Dauphinee S,et al.Gastrointestinal Quality of Life Index:development,validation and application of a new instrument[J].Br J Surg,1995,82(2):216

[18]Locke GR,Talley NJ,Weaver AL,et al.A new questionnaire for gastroesophageal reflux disease[J].Mayo Clin Proc,1994,69(6):539

[19]Eloubeidi MA,Provenzale D.Health related quality of life and severity of symptoms in patients with Barrett’s esophagus and gastrointestinal reflux disease patients without Barrett’s esophagus[J].Am JGastroenterol,2000,95(8):1881

[20]Glise H,Wiklund I.Health-related quality of life and gastrointestinal disease[J].J Gastroenterol Hepatol,2002,17(Suppl):S72

[21]Young TL,Kirchdoerfer LJ,Osterhaus JT.A development and validation process for a disease specific quality of life instrument[J].Drug Information J,1996,30(2):185

[22]Schubert M,Glass TR,Clarke SP,et al.Validation of the Basel Extent of Rationing of Nursing Care instrument[J].Nurs Res,2007,56(6):416

[23]Emery MP,Perrier LL,Acquadro C.Patient-reported outcome and quality of life instruments database(PROQOL ID):frequently asked questions[J].Health Quality Life Outcomes,2005,3:12

[24]张天嵩,唐斌擎,张素,等.基于不明原因慢性咳嗽患者报告临床结局中医证候量表的编制与考评[J].辽宁中医药大学学报,2010,12(8):113

[25]李建生,余学庆,李素云,等.基于疗效评价的肺炎患者报告结局量表的初步研制[C]//中华中医药学会内科分会.中医内科临床科学研究专题研讨会论文汇编.杭州:[出版者不详],2009:85

[26]唐旭东,王萍,刘保延,等.基于慢性胃肠疾病患者报告临床结局测量量表的编制及信度、效度分析[J].中医杂志,2009,50(1):27

[27]张艳宏,刘保延,何丽云,等.基于中风痉挛性瘫痪患者报告的临床结局评价量表的信度、效度分析[J].中医杂志,2008,49(8):698

[28]陈新林,刘凤斌,郭丽,等.重症肌无力患者报告结局指标量表的研制——计量心理学测评[J].中西医结合学报,2010,8(2):121

[29]刘宏潇,姜泉,刘保延,等.基于类风湿关节炎患者报告的临床结局测量量表的初步构建[J].中医杂志,2009,50(6):503

[30]王杨.“中风痉挛性偏瘫PRO量表”修订及信度、效度、反应度检验[D].北京:中国中医科学院,2009.

猜你喜欢
量表测量评价
网络服装虚拟体验的概念模型及其量表开发
中药治疗室性早搏系统评价再评价
把握四个“三” 测量变简单
胸痹气虚证疗效评价量表探讨
滑动摩擦力的测量和计算
滑动摩擦力的测量与计算
测量
三种抑郁量表应用于精神分裂症后抑郁的分析
慢性葡萄膜炎患者生存质量量表的验证
基于Moodle的学习评价