何泽慧 张 戈 欧爱华
广州中医药大学第二附属医院,广东 广州 510120
临床疗效是中医学赖以生存和发展的基础,中医临床疗效的评价一直是研究的热点问题。然而,目前尚未建立规范可行的中医临床疗效评价的方法学,成为中医学广泛应用与国际化进程中的短板[1-4]。
在几千年的中医临床实践中,疗效评价的方法主要是由医生主导来获得患者报告的四诊信息,结合医生个人经验来判断临床疗效的优劣。这种疗效评价方法的特点是将疾病主要症状的改善作为疗效的判定标准[5-7],医生运用“望闻问切”四诊方法对患者治疗前后的病情进行评估,以及疗效进行判定,判定方法为症状的改善,甚至消失,以及证候的转归等[8]。总之,这种传统上中医疗效评价的方法聚焦于症状和证候的疗效评价,侧重患者的痛苦与不适,侧重医生个人经验,因此具有很大的主观性,缺乏客观统一的疗效评价方法。
随着时代的发展,中医临床疗效评价方法与时俱进,其借鉴大量西医疗效评价中的客观量化指标,同时结合中医自身特点,制定规范的临床疗效评价方法、过程和指标,包括证候量化评分、患者报告的症状积分等疗效评价指标,纳入中医证候指标的体现中医特色的临床疗效评价体系正在形成。在2002年卫生部制定了《中药新药临床研究指导原则》(试行)[9],较全面的对证候诊断和疗效评价指标进行了规范。其在借鉴西医的疗效评价体系基础上,纳入中医证候指标,对证候诊断的主要症状进行半定量化,将症状积分不仅用于证候诊断,而且用于治疗前后疗效的评价。此指导原则已在许多中医临床研究中广泛使用。然而,此指导原则也存在许多问题[10-11],如对证候主要症状的量化是否规范且具有权威性,症状分解和赋分信度、效度如何,证候主要症状能否同时作为疗效评价指标等问题。这不仅是此指导原则存在的问题,而且是目前整个中医临床疗效评价方法研究所面临的问题。中医与西医从本质上来源于不同的理论体系,将西医疗效评价方法照搬过来衡量中医疗效,存在盲目性,但如何寻求新的、符合中医理论的疗效评价方法仍需进一步研究[12-13]。
关于中医临床疗效评价的研究可分为两部分[14],第一部分中医临床研究,第二部分中医疗效评价的基础性问题研究。第一部分中医临床研究随着现代预防医学中的临床流行病学的发展,出现了大量借鉴或照搬西医临床设计的中医临床观察、试验[15-17]。此类中医临床研究从病例纳入排除标准、盲法和随机分组、疗效评价指标、干预手段安全性、患者依从性、质量控制和监督等临床研究过程环节均借鉴于西医同类临床试验,仅在干预手段上将西医变为了中医药。此类研究在一定程度上客观反映了中医药疗效,促进了中医药疗效被国际认可,但尚存在许多问题,例如,中医的“同病异治、异病同治”理念如何体现,西医疗效评价指标是否适用于中医。这类中医临床研究存在的问题以及解决对策已有许多研究成果[18-20]。下面本文对第二部分中医疗效评价中的基础性问题进行详细阐述。
中医与西医在思维方式、诊断和治疗措施上存在较大差异,因此在中医临床疗效评价研究上有三个基础性问题需要面对,即研究方法、评价指标和分类标准3个问题。
首先,研究方法上,虽然目前中医临床疗效研究涌现出大量的随机对照试验、病例对照研究、队列研究、观察性研究等,但是否有新的研究方法更适合中医学特点、更能体现中医个性化诊疗特点、更能体现中医“同病异治、异病同治”理念、更能凸显中医天人相应的思想,这些都值得我们深入研究。
其次,在评价指标上,中医在治疗疾病过程中关注的症状、角度和环节与西医学均不同,其疗效评价指标能否完全照搬西医指标,尤其是一些医生或患者报告的主观指标作为主要疗效评价指标时。在过敏性疾病、失眠、痛症、皮肤病等以主观评价指标为主要结局的疾病中,如何有选择性地纳入医生或患者报告的主观指标,既能与西医临床评价指标相接轨,使疗效具有可比性,又能额外凸显中医治疗效果的特色,这需要我们充分利用测量学理论与技术,引进和考评西医疗效指标,同时创造中医特色的疗效指标。
最后,在分类标准,如辨证标准、证候诊断标准和证候相关症状标准化等方面,是中医药特有的问题[21],中医“辨证论治”的核心思想,使得此类标准问题与中医治疗措施和临床疗效密切相关,因此标准相关的研究属于中医临床疗效评价研究的基础问题之一。
上述三个基础性问题中,笔者认为评价指标是其中的关键环节,下面就中医临床疗效评价指标的现状及思考进一步阐述。
中医临床疗效评价指标是中医临床研究中的关键环节之一,评价指标是否全面且准确、是否具有优良的测量学特性,成为中医临床疗效评价的重要问题[14,22]。在近年来的中医临床研究中,所采用的疗效评价指标复杂多样,经梳理后可观察到几个显著特点:①客观与主观指标并存,以主观指标为主,多是基于证候诊断的主要症状体征;②有些中医临床研究照搬西医背景下研制的患者报告结局(Patient-Reported Outcome, PRO),生存质量量表(Quality of Life questionnaire, QoL)等;③针对个别病种,依托中医理论,设计具有中医特色的条目或量表作为疗效评价指标,但规范化和量化不足,信度和效度未知。
大多数中医临床研究基于证候诊断的症状体征,通过症状积分治疗前后的变化来进行疗效评价[1,9],此方法存在诊断指标与评价指标的混淆及赋分量化不规范等问题,难以得到国际公认。并且,在多达几十个甚至上百个的中医症状中,究竟哪些对疗效的评估和测量是可靠的、准确的,这些都是亟需解决的问题。笔者认为,对于主观指标的信度(可靠性)、效度(有效性)等的研究,需要借助心理测量学领域的经典测量理论(Classical Test Theory, CTT)和项目反应理论(Item Response Theory, IRT)来对条目进行考评。
经典测量理论由于直观易懂、理论条件宽松等得到广泛应用。但不可否认,其在理论体系和方法体系上均存在严重缺点:①测量真值与观察值的线性关系这一假设难以成立;②信度只代表整个量表的平均测量精度,而不能反映单个条目的精度;③信度与效度一样严重依赖于样本,当样本的能力水平不同时,计算出的信度效度就会不同[23]。项目反应理论为克服这些缺点而被提出,并逐渐成为量表考评的热门和主流方法。其在中医领域的应用也越来越多[24-26]。美国国立卫生研究院自2004年以600万美元启动了以项目反应理论为基础的患者报告结局测量信息系统(Patient-reported Outcomes Measurement Information System, PROMIS)的构建研究,力图涵盖并用于大多数慢性病的疗效评价,成为利用项目反应理论研究患者报告结局这一领域的领跑者[27]。其中的Rasch模型是最常用的项目反应理论模型之一。Rasch模型是项目反应理论中的单参数logistic模型,由丹麦数学家Rasch提出,是目前被广泛应用的模型之一[28-30]。
Rasch模型建立了被试者潜在能力(横轴)与对条目的回答(纵轴)之间的非线性关系,并以条目特征(难度difficulty)为模型参数[30-31]。具体到应用于中医疗效评价指标的考评,疗效指标即为条目,被试者即为目标疾病人群,潜在能力即为健康水平,因此,利用Rasch模型可以考评疗效指标的难度是否与目标人群的健康水平相匹配。Rasch模型还能考评在治疗前后两次或多次测量中,疗效指标的模型参数有无差异,即是否存在条目功能差异。若疗效指标在治疗前后功能存在差异,则不具备测量目标人群健康水平改变的能力。因此,项目反应理论中Rasch模型可以用于中医临床疗效评价指标的考评之中,来提高中医临床疗效指标对疗效的测量精度。
随着现代流行病学在中医学中的应用,中医临床疗效评价研究得到了长足的发展,已有许多专科专病构建了具有中医特色的疗效评价工具或量表,并用于临床疗效评价,如银屑病[32],冠心病心绞痛[33],肝癌[34],帕金森病[35]等。但仍未形成公认的中医临床疗效研究的方法学。笔者认为,如何在遵循中医学自身诊疗特点基础上,创新性地构建能够科学评价中医药临床疗效的方法和标准,是中医药现代化发展中的关键问题。特别地,疗效评价工具或量表的可靠性、有效性和适应性是疗效评价中的关键环节,应充分利用流行病与卫生统计学、心理测量学中的先进方法和技术,对疗效评价工具进行考评,有利于提升中医疗效评价研究的科学性和先进性。