李建生,冯贞贞,谢洋,王佳佳
“提高中医药核心竞争力的临床疗效评价创新方法与技术”“中医临床个体化疗效如何实现智能精确评价”被确立为中医药行业发展的工程技术难题[1-2],因此亟须构建能体现中医特色且客观、规范的疗效评价方法。证候是中医临床疗效评价的重要结局指标之一,研制证候疗效评价量表可实现证候疗效评价的定量化、客观化、规范化。近年来,不少学者开展中医证候疗效评价量表的研制工作,取得系列成果,并为后续研究提供思路[3-11]。然而,目前尚缺乏统一、规范的证候疗效评价量表研制方法。借鉴国际量表研制规范及中医量表研究思路[12-13],依据中医证候特点,已研制出慢性阻塞性肺疾病稳定期证候疗效评价量 表(Syndrome Therapeutic Evaluation Scale of Chronic Obstructive Pulmonary Disease,COPD-STES)并进行考核,具有良好的信度、效度、反应度及可行性。本文通过梳理当前证候疗效评价存在的相关问题,总结现存证候疗效评价量表,结合已完成的COPD-STES研制相关工作,初步提出中医证候疗效评价量表研制策略,以期为相关研究提供参考。
根据疾病与证候的关系,可将现有的证候疗效评价量表分为两类:普适性证候疗效评价量表及疾病特异性证候疗效评价量表。在中医“异病同治”“以证统病”诊疗思维指导下,不同疾病发生、发展过程中的某个阶段可能出现相同的病机特点及相似的证候要素,有学者研制出针对多种疾病同一证候的证候疗效评价量表,即普适性证候疗效评价量表。郭盛楠等[14]通过构建量表维度、筛选条目及赋权,研制出《肝郁化热证证候评价量表》;王阶等[15]参照国际量表制定原则,研制出《气滞血瘀证基于患者报告的临床结局评价量表》;王虎城[4]通过临床调查、专家咨询、条目赋权等环节,研制出《火热炽盛证(实热火毒)评价量表》。
病证结合是当前中医诊治疾病的主要模式,以西医辨病结合中医辨证模式最常见,基于病证结合模式,研制疾病特异性证候疗效评价量表具有重要意义。王鸿琳[5]探索编制了《冠心病稳定型心绞痛(痰瘀互结证)疗效评价证候计分表》;赵国青[7]通过文献研究、专家咨询及临床流行病学调查等环节,初步建立了《强直性脊柱炎肾虚督寒证中医疗效评价量表》;张杨[16]基于经典测量理论及项目反应理论研制出《中风病证候要素评价量表》。
行业贡献:
(1)基于病证结合模式,以基础证候为切入点,研制的慢性阻塞性肺疾病稳定期证候疗效评价量表(COPD-STES)既适用于基础证候,也适用于临床常见复合证候。
(2)探索条目赋权方法,形成基于随机森林法、因子分析法及百分权重法的综合赋权法,为证候疗效评价量表条目的赋权提供新思路。
(3)首次提出病证结合模式下证候疗效评价量表研制与考核的基本流程与关键技术,为相关研究提供参考依据。
上述量表可为中医临床疗效评价提供思路方法,但也存在一定不足:(1)普适性证候疗效评价量表多针对多种疾病的单一证候,疾病特异性证候疗效评价量表多针对特定疾病的单一证候,临床实践中患者常出现兼证或发生证候转变,实际应用具有片面性。(2)部分量表未明确区分证候的诊断属性与疗效评价属性,将证候诊断指标直接作为疗效评价指标,混淆了二者的区别。(3)同一症状在不同疾病中的权重可能不同,多数证候疗效评价量表忽视赋权问题[17]。针对相关问题,引发如下思考。
2.1 以基础证候为切入点“降维”“升阶”,为量表研制提供思路 基础证候是介于证素与临床常见证候之间的中间环节,至少由1个或2个以上证素组合而成(如血瘀证、肺气虚证、肾气虚证等)[18]。很多慢性病会出现复合证候,如肺脾气虚证、肺肾气虚兼血瘀证等,其中蕴含肺气虚证、脾气虚证、肾气虚证、血瘀证等基础证候,若以复合证候为研究对象,则面临种类繁多且应用局限等问题。因此,以基础证候为切入点研制疾病特异性证候疗效评价量表,不仅适用于疾病的基础证候,而且适用于多个基础证候组成的复合证候,更具有灵活性、全面性、实用性。
2.2 界定证候的疗效评价属性与诊断属性,突显疗效评价属性 证候具有诊断、治疗等多维属性,部分现存量表将二者混淆,这是目前证候量表研制的最大误区[19]。有学者指出证候疗效是对适应证候的症状效应指标变化的综合评价,证候属性指标不参与证候疗效评价[20-21],如失聪、牙齿脱落是诊断肾气虚证敏感性指标,在疗效评价方面特异性不强,再如口不渴、无汗、无痰等症状在证候诊断时尚可使用,在疗效评价时便失去价值。因此,证候的疗效评价属性与诊断属性应清晰界定,筛选具有疗效评价属性的指标是证候疗效评价量表研制的重要环节。
2.3 重视证候疗效评价指标的权重问题,建立适宜的量表条目赋权方法 证候疗效评价是对构成该证候的症状、体征的定性和定量判断[22],不同的症状在证候疗效评价中的权重不同,同一症状在不同证候中的权重也不同。证候疗效评价量表条目的权重问题会直接影响评价结果,现有量表多忽视条目权重问题,亟需探索适宜的证候疗效评价量表条目赋权方法。
针对上述特点并结合量表研制流程,本文以临床常见疾病——慢性阻塞性肺疾病(COPD)为示范,在建立COPD证候诊断标准的基础上[23],进行以下尝试:一是基于文献研究[24]及专家问卷调查,筛选COPD常见基础证候及具有疗效评价属性的症状,建立理论框架及条目池;二是开展临床调研,动态观察COPD患者基础证候及症状的演变,联合应用经典测量理论与项目反应理论分析并筛选条目,初步形成COPD证候疗效评价量表;三是联合应用随机森林法、因子分析法及百分权重法,对量表条目进行赋权,明确计分规则;四是基于临床调查数据,对量表的可行性、信度、效度、反应度进行考核。证候疗效评价量表研制的基本流程主要包括成立研究小组、预设量表基本特征、构建理论框架及条目池等7个主要环节,见图1。
图1 证候疗效评价量表研制的基本流程Figure 1 The general process of developing a TCM-based syndrome treatment effectiveness assessment scale
3.1 成立研究小组 成立包含多学科成员的条目管理小组、数据管理小组及专家议题小组,不同小组间协调合作,遵守严格的操作流程,可保证研究过程的规范化。
3.2 预设量表基本特征 预先设定量表的适用人群、量表类型、量表目的、反应尺度、计分规则、回忆时间、管理方式等基本特征,可进一步明细研究内容,保证研究方向的稳定性。
3.3 构建理论框架及条目池 构建理论框架及条目池是量表研制的基础环节。首先,通过文献研究,初步总结疾病的基础证候分布规律及临床特征,为专家问卷的制定提供依据。其次,通过专家问卷调查,筛选疾病常见的基础证候及其症状构建理论框架和条目池。证候具有多维非线性特点,这决定了证候疗效评价量表的理论框架与一般生存质量量表不同[25-26]。证候疗效评价量表的理论框架由常见基础证候组成,条目池由常见基础证候对应的症状构成,以基础证候为切入点可起到“降维”“升阶”的作用,提高量表应用的灵活性。
3.4 筛选条目 联合应用经典测量理论(重复测量法、离散趋势法、Cronbach's α系数法及相关系数法)与项目反应理论(区分度参数、难度参数、项目特征曲线、项目信息曲线),从条目的疗效评价属性、代表性、内部一致性、与基础证候的相关性、难度、区分度等多方面分析并筛选条目,为形成证候疗效评价量表提供依据。
3.5 初步形成量表 根据条目筛选结果,为方便患者理解条目含义,优化条目呈现形式,将中医症状术语转化为较为通俗的问题形式,初步形成证候疗效评价量表,该量表可适用于基础证候及复合证候的疗效评价。
3.6 确定条目权重 条目权重的确定是量表研制的必要环节。基于临床调查及专家问卷调查数据,结合、运用随机森林法、因子分析法、百分权重法的条目赋权法确定条目权重,3种方法相互结合,从不同角度阐释条目对证候疗效评价的重要程度,从而形成证候疗效评价量表。
3.7 考核量表的信度、效度、反应度及可行性 为保证量表的真实性及可靠性,对量表的信度、效度、反应度及可行性进行考核。
4.1 基于关联规则、隐结构分析的数据挖掘技术 数据挖掘是指通过对大量、有噪声的模糊数据或随机的实际应用数据进行自动和半自动化分析探索,从而发现其中有意义的模式和规则[27]。多种数据挖掘技术的应用可为研究结果提供强有力的技术支撑。关联规则是从大量的数据中挖掘、发现项集之间有意义的关联,并寻找数据集中项之间的有趣联系的一种算法[28];隐结构分析是为辨证而建立的一种客观、定量的研究方法,可对西医所定义疾病进行中医辨证分型指导,较好地模拟中医医生诊病时从患者的症状推导出证候的过程[29-30]。基于文献研究,联合应用关联规则与隐结构分析,可从证素、症状2个角度总结常见基础证候及其症状分布,为量表理论框架及条目池的构建提供依据[24]。
4.2 基于经典测量理论与项目反应理论的条目筛选方法 经典测量理论具有较成熟的理论基础,且数学模型简单,被广泛应用于量表条目的筛选[31-33];项目反应理论可将被试能力与题目特性放在同一尺度,被试参数与项目参数具有不变性[34]。经典测量理论(重复测量法、离散趋势法、Cronbach's α系数法及相关系数法)与项目反应理论(区分度参数、难度参数,条目特征曲线,条目信息曲线)的应用,可为从多角度分析与筛选条目提供方法。近年来,经典测量理论和项目反应理论的结合应用已广泛应用于国内外量表条目的筛选,为量表的形成提供技术支撑[35-37]。
4.3 基于随机森林法、因子分析法及百分权重法的条目赋权法 机器学习算法可弥补人类认知和思维的局限性,充分体现中医整体观、模糊性、非线性的特点,从而寻找大数据下隐藏的中医知识和规律。随机森林法是机器学习算法之一,具有预测准确率高、不易出现过度拟合等优点[38]。多元统计分析可反映指标间内在关系,不受主观因素的影响,具有较强的客观性,其中因子分析法已被广泛应用于权重的确定[39-40]。百分权重法是基于专家经验的主观评分法[41-42]。3种方法联合应用为条目赋权提供技术支撑。
国内外研究现状:
目前国内外有关证候疗效评价量表可分为两大类:一是普适性证候疗效评价量表,郭盛楠等通过构建量表维度、筛选条目及赋权,研制出《肝郁化热证证候评价量表》,共包含3个维度、13个条目;王阶等参照国际量表制定原则,研制出《气滞血瘀证基于患者报告的临床结局评价量表》,共包含4个领域、37个条目;王虎城通过临床调查、专家咨询、条目赋权等环节,研制出《火热炽盛证(实热火毒)评价量表》,包含10个条目。
二是疾病特异性证候疗效评价量表,赵国青通过文献研究、专家咨询及临床流行病学调查等环节,初步建立了《强直性脊柱炎肾虚督寒证疗效评价量表》,包含9个条目;王鸿琳探索编制了《冠心病稳定型心绞痛(痰瘀互结证)疗效评价证候计分表》,包含2个维度、10个条目;王海军在肝气逆证辨证规范研究基础上建立《经前期综合征肝气逆证症状严重程度医生评价表》,包含13个条目,用于该病证诊断和疗效评价。张杨基于经典测量理论及项目反应理论研制出《中风病证候要素评价量表》,包含内风证7个条目、内火证21个条目、痰湿证14个条目、血瘀证8个条目、气虚证14个条目、阴虚证9个条目。
这些研究可为证候疗效评价提供一定方法,但也存在以下不足:(1)普适性证候疗效评价量表多针对多种疾病的单一证候,疾病特异性证候疗效评价量表多针对特定疾病的单一证候,临床实践中患者常出现兼证或发生证候转变,实际应用具有片面性。(2)部分量表未明确区分证候的诊断属性与疗效评价属性,将证候诊断指标直接作为疗效评价指标,混淆了二者的区别。(3)同一症状在不同疾病中的权重可能不同,多数证候疗效评价量表忽视了赋权问题。
近年来,不少学者开展中医证候疗效评价量表研制工作,但仍缺乏统一、规范的证候疗效评价量表研制流程。本文根据已研制的COPD-STES,分析其中的相关工作,首次提出中医证候疗效评价量表研制策略,包含7个主要环节、3项关键技术。7个主要环节包括成立研究小组、预设量表基本特征、构建理论框架及条目池、筛选条目、初步形成量表、确定条目权重及量表的考核;3项关键技术包括基于关联规则及隐结构分析的数据挖掘技术、基于经典测量理论与项目反应理论的条目筛选方法以及基于随机森林法、因子分析法及百分权重法的条目赋权法;以COPD为示范,初步提出证候疗效评价量表研制策略,可为其他相关研究提供参考。
作者贡献:李建生、冯贞贞进行资料收集整理、文章的构思与设计、撰写论文,对文章整体负责、监督管理;冯贞贞进行文章的修订;谢洋、王佳佳对文章进行质量控制及审校。
本文无利益冲突。