王章林,赖新梅
(福建中医药大学中医证研究基地,福建福州 350122)
证素辨证是近年来中医辨证领域热门研究方法之一。其主要原理在于通过计算症状对病位、病性证素的诊断贡献度,准确辨识现阶段证素分布规律,由证素组合而作出证名诊断。证素辨证理论与方法的提出,在一定程度上改变了传统中医辨证方法繁杂、证型诊断结果各异的局面,也为中医学与数学、计算机等多学科深度交叉融合提供良好范式。时至今日,该理论与方法正日渐为中医界所认可,并广泛运用于临床诊疗,切实发挥实践指导作用。现就近年来证素辨证理论体系与方法学发展情况及存在问题概述如下。
1.1 首创者——朱文锋教授 作为体系的创立者,朱文锋教授系统阐释证素的概念,明确指出“证素即证的要素,是中医辨证诊断的最小单元”[1],论述证素特征[2-3]与确定原则[4],提取通用证素53 项(病位证素20 项,病性证素33 项);提出“根据证候,辨别证素,组成证名”的证素辨证思维规律与方法论[5];设计三阶双网结构以及能够确定证候诊断权值的频权剪叉算法[6-10];通过证候对证素、证型的贡献度,建立中医辨证基本数学模型——“加权求和浮动阈值运算”[11];并出版《证素辨证学》《实用中医辨证手册》等专著,自主开发中医证素辨证诊疗系统,即“WF 文锋-Ⅲ中医(辅助)诊疗系统”[12],实现理论创立、方法创新与实践应用有机融合。
在朱教授创建的证素辨证系统中,尤其是在症状-证素映射关系方面,症状、体征信息对证素积分的诊断贡献度是固定不变的。因此,要预先对所有症状的证素诊断贡献度赋值。这种原始赋值的方法,存在一定主观性,无法根据不同病种、时空环境而动态变换,灵活调整。同时,中医症状的全集目前在业内尚未形成共识。这些因素促使该理论体系亟需进一步完善。
1.2 重要参与者——王永炎院士 作为该体系的重要参与者,王永炎院士同样认可“降维升阶”作为证素辨证理论体系的核心思想,在系统复杂性科学理念指导下,中医复杂病机与证型均可通过“降维”分解为最基本的诊断单元,即证候要素,而证候要素又可以相互组合“升阶”形成复杂的病机[13-14]。
与朱教授不同之处在于,王院士最终确立6 个病位要素和14 个病性要素,证候要素数量明显较前者减少。同时,其认为“以象为素,以素为候,以候为证,病证结合,方证相应的原则,是辨证方法体系的理论依据”,将证候要素界定为病因,证候靶点定义为病位,就此提出构建以证候要素与证候靶点应证组合为核心,具有非线性特征的多维多阶辨证体系研究思路[15]。但是,关于证候要素与病因、病位要素,以及证候要素与证候靶点之间相互关系的认识,稍显模糊,有待进一步深入研究。
1.3 主要发展者——李灿东教授 作为该体系的主要发展者,李灿东教授创造性地提出状态要素概念,将证素辨证中的病位、病性分别归属于状态要素中的部位和性质[16];同时状态要素又涵盖证素所未涉及的未病态、欲病态的辨识要素;基于证素辨证原理,系统提出健康状态辨识理论,拓展了证素辨证理论体系的内涵与外沿,将传统中医病证诊断延伸到对人体生命全周期健康状态的动态辨识,出版专著《中医状态学》《中医健康管理学》,进一步丰富与发展中医证素辨证理论体系。
目前,证素辨证理论与方法日益得到众多学者关注,并广泛运用于院校科研、临床诊断、健康管理等众多领域。
2.1 揭示疾病证素分布规律 李灿东等[17-21]运用证素辨证方法,深入挖掘代谢综合征、围绝经期综合征、2 型糖尿病肾病、寻常痤疮等多种疾病的证素分布规律,并对吸毒特殊人群的生理、病理变化进行证素识别[22]。陈淑娇等[23-26]通过采集围绝经期肥胖患者病情资料,发现围绝经期肥胖主要病位证素为脾、肝、肾,病性证素为痰、气滞、湿、血瘀、阳虚、气虚、阴虚、血虚。疾病是一个动态变化的异常生命过程。在疾病发生、发展不同病程阶段中,患者的证素同样也是在动态变化着。春柳等[27]通过贝叶斯网络,分析新型冠状病毒肺炎不同分期证素分布的条件概率,结果显示:疾病初期病性证素以湿、寒、热(火)为主,病位主要在肺、卫分;进展期(中期)病性证素以毒、热(火)、湿、痰为主,病位主要在肺;危重期病性证素以毒、热(火)、气脱为主,病位主要在肺、心神(脑);恢复期病性证素以气虚、阴虚为主,病位证素主要在肺、脾。符丽等[28]运用描述性分析和方差分析等统计学方法,发现支气管哮喘慢性持续期患者以表、肺为主要病位,寒、热、风等病性证素错杂相间,病机复杂。
目前,运用证素辨证方法,主要是发现不同疾病证素分布的一般规律,尚未深入研究证素之间兼杂、主次、缓急的复杂关系。而正确处理证素之间的复杂关系,对提高证素辨证结果的准确性具有重要意义。
2.2 挖掘证素诊断规则 诊断规则的挖掘与制定,是实现中医智能化辨证诊断的核心与关键。虞海虹等[29]选取751 条收载于中医各科临床教材的病证数据,采用IBM SPSS Clementine 14.1 挖掘平台探寻证候到证素的分类关联规则,共挖掘出证素诊断规则25 条,其中病位证素诊断规则5 条,病性证素诊断规则20 条。黄文金等[30]对《中医妇科学》的辨证分型数据采用Apriori 算法进行关联规则挖掘,得出证素之间、证素与证候之间的关联规则,共挖掘病位证素→病性证素24 条规则,病性证素→病位证素9 条规则,证候→证素25 条规则。瞿麟等[31]通过对9 730 篇文献进行证型术语规范及证素拆解后,同样采用Apriori 算法,挖掘出证素组合规则24 条。
由于研究数据来源不同,数据规范化程度参差不齐,不同研究者所挖掘的证素诊断规则也是各不相同。中医界尚未就证素诊断规则达成一致认识。不同诊断规则,有可能导致患者在同一时间节点,出现差别较大,甚至相互矛盾的证素辨证结果。
2.3 构建证素辨证智能化诊断模型 利用大数据、现代统计分析技术与方法,发现患者症状、体征以及各项理化指标对中医证素的诊断贡献度,从而构建证素辨证智能化诊断模型,是当下研究趋势之一。吴冬梅等[32-33]采用证素计量辨证法,建立宫颈上皮内瘤变证素计量辨证的相关标准;同时,通过观察宫腔粘连患者宫腔镜下宫腔微观征象,发现宫腔镜下子宫内膜颜色、子宫内膜血管颜色及形态、粘连程度等局部征象与中医证素有关[34]。王嘉祺等[35]以中医证素辨证理论为核心,结合2 型糖尿病中医证型分布规律,将中医证素作为神经网络的输入,证型作为神经网络的输出,建立16 输入、单输出的BP 神经网络模型,能够准确揭示中医证素与证型之间的对应关系;同时纳入身高、体质量、糖化血红蛋白、空腹胰岛素、空腹血糖、空腹C 肽等理化检查数据,建立多元回归模型,结果发现2 型糖尿病西医指标与中医证素有关系,与部分中医证型也存在相关关系。
目前,学者开始普遍关注微观检查指标对中医证素辨证的参考价值,认识到现代理化指标与中医证素、证型存在相关关系,要将其纳入证素辨证智能化诊断模型中。但对其所蕴含的中医病理诊断意义的认识,以及对证素积分的诊断贡献值具体如何,尚且有带进一步深入研究。
人工智能技术在中医药领域中的应用是近年来新兴的研究热点,基于数据驱动的新一代人工智能算法更是当前研究主流。目前,学术界已经注意到证素辨证方法体系尚存在不尽如人意之处,尤其是在证素诊断规则制定、证素诊断阈值的动态修正以及症状与证素、证名之间复杂映射关系的确定方面,并开始着力对其进行优化研究,业已取得一定进展。
3.1 证素诊断规则优化 许强等[36]通过采用有向图这种数据结构形式,对《中医临床诊疗术语 证候部分》前400 条数据进行证型拆分,利用ISO-R法则进行验证,发现ISO-R 法则是证素组合的普遍法则,可用于判定任意给定的一组证素集合是否能够构成某个证型。徐佳君等[37]提出围绕证候要素阈值、一(少)元论、伴随表征的共同指向、三因制宜、重视“辨病”、重视“主症”“重症”、重视“辨病机”7 条规则,并借助人工智能算法加以转化,实现由证素组合形成完整证名的逻辑推理过程,提升中医诊断辨证的客观性和准确性。石英杰等[38]提出证候层次划分方法和证候要素多层次表示方法,将证候名称组成要素划分为病位要素、病性要素(包括基本物质、病因、病理状态)、连接词的两层五类结构,系统梳理证候拆分流程。并通过对《中医临床诊疗术语 证候部分》证候名称的批量处理,计算机批量处理的准确率为71.4%。
证素诊断规则众多,但缺乏统一的判断标准,规则的科学性与普适性尚无法得到充分验证,未能得到普遍推广应用。
3.2 证素诊断阈值的修正 杨雪梅等[39-41]借鉴机器学习系统模型,研制若干中医证素辨识算法及模型(如人工神经元网络、决策树、最小二乘线性拟合等),在实现症-证素诊断权值动态修正同时,进行多个模型证素辨识准确率的大样本临床实验验证和比较;进一步采用装袋法和推进法来汇总多个模型的辨识结论以达到提高中医证素辨识准确率的目标。当应用中模型集合辨识准确率急剧降低时,则激活算法集合重运行,构建新模型,实现模型集合及知识库的动态修正。
证素诊断阈值的修正,有利于实现证素诊断标准更加动态、精确,但也不可忽视基线标准的重要作用。同时,不能将病证截然分割,不考虑具体疾病诊断而修正证素诊断阈值,有可能影响证素辨证方法的准确性。
3.3 症状与证素、证名之间映射关系研究 辜伟科等[42]将中医证素辨证与机器学习方法相结合,构建智能化的失眠症中医证素辨证模型,对失眠症的中医症状与证素之间复杂的对应关系进行精确地分析,从中筛选出具有典型特征的病位证素与病性证素,实现在失眠症的诊疗过程中症状-证素-证名的智能化辨识。于婧等[43]利用矩阵运算技术,将医案数据作为研究对象,以联合度为评价指标,构建“症状-证素-证型”异质关联网络,探索“症状-证素-证型”两两元素之间的组合规则,并与Apriori 关联分析算法进行比较,分别对1 164 条肝癌医案的辨证规律进行分析,发现HAN 算法提取结果和计算效率优于Apriori 算法,HAN 算法能高效精准地挖掘医案中症状、证素、证型之间的潜在关系。
虽然在证素辨证方法学层面,目前已取得一定进展。但就多个证素如何形成完整证名、证素之间相兼错杂关系的计算机处理过程的研究稍显不足。
针对证素辨证存在的问题与研究现状,笔者认为,下一步可以:①利用健康体检大数据,构建未病状态人群证素辨识积分模型,分析该特殊人群生命表征参数对证素辨识的影响,进一步明确人体未病状态下,中医证素积分的基线水准,从而为已病、欲病状态人群的证素辨识提供重要参照;②坚持中医病证结合模式,结合具体中医病种的病理特点与发生、发展规律,深入研究患者症状、体征以及理化指标对证素的诊断贡献度,扩大参数范围,修正原有的证素赋分,形成动态、灵活的证素诊断阈值;③以中医理论为指导,制定由证素组合到规范证名的多元知识诊断规则,准确揭示多种证素之间主次、相兼、重叠关系。进一步完善该理论体系,优化证素辨证方法,有效提高证素辨证诊断结果的准确性与预见性,任重道远。