证-熵-方——中医药研究的新领域*

2010-12-01 02:13唐仕欢陈建新杨洪军黄璐琦
中国中医基础医学杂志 2010年4期
关键词:方证互信息中风病

唐仕欢,陈建新,杨洪军,黄璐琦△

(1.中国中医科学院中药研究所,北京 100700;2.北京中医药大学,北京 100029)

证候、方剂是中医药研究中的两大关键科学问题,二者密切相关,研究方剂必然涉及证候,研究证候又必然与方剂关联。如何将二者作为整体,研究其相关的科学规律,成为中医药发展的瓶颈问题之一。随着现代科学技术的发展,复杂性科学、信息学等学科的提出,为方证相关的研究支起了广阔的理论空间。复杂性科学中的熵方法在自然科学和社会科学的研究中已经被广泛应用,将熵的理论方法引入到证候、方剂相关性研究中,有望发现它们各自内涵和其关系的实质,对中医辨证论治的科学阐述具有重要的理论意义和实践价值。由此,证-熵-方——中医药研究的新领域也应运而生。

1 证-熵-方产生的背景

随着中医证候、方剂等关键科学问题的提出,国家科技部先后启动了国家重点基础研究发展计划(973计划)项目“方剂关键科学问题研究”、“方剂配伍规律研究”、“证候规范与疾病、方剂相关的基础研究”。应用多学科的方法开展中医研究,主要经旨在于通过中医理论与现代科学的交叉,用现代科学方式来阐释中医理论的科学内涵。

辨证论治是中医理论的核心,“方证相关”是中医辨证论治学术体系中的重要命题,其所蕴含的方与证之间的相依互动性,不仅是认识方剂学特征、临床用方的逻辑基础,也是中医方证现代研究中思路取向的重要逻辑依据,具有多维数性、多参数性、多关系性、多判据性、多功能性、所用知识的多学科性,构成了复杂系统。面对证候和方剂之间的这种高度复杂关系,传统统计的相关性系数分析方法已无法准确刻画它们之间的关系,由此统计方法的局限性影响了中医方证的现代化研究。

为揭示方证相关的现代科学内涵,寻找合适的相关性度量方法势在必行,鉴于此,用复杂系统的方法理论来研究中医方证呼之即出。2002年,“证·熵·方相关科学规律的研究——中风病之体现”项目得到了国家自然基金委的资助;2004年,该课题组在《中国中医基础医学杂志》发表了“‘熵’在中医方证研究中的运用”一文,在总结熵理论的基础上,首次提出运用熵理论进行中医方证相关研究的设想,并探讨了证、熵、方结合的原理与前景[1]。随后,该研究组成员以中风病为范例,通过实践表明[2、3],该方法不仅可以应用证候与方剂之间的相关性研究,还可以研究证候与证候之间、证候与症状之间、方剂中药物与药物之间、配伍中成分与成分之间的关系。至此,一种研究中医证候、方剂及其相关性的新领域——证-熵-方初步形成。

2 证-熵-方的数理基础

熵最初是一个热力学概念,它经香农(C.E.Shannon)之手与信息紧紧相连,为熵的热力学进入信息科学、生命科学等当代前沿科学铺平道路,并产生了生物信息学、神经信息学等一批新学科。研究实践表明,熵是刻画复杂系统复杂性的非常好的度量,用熵来度量证候和方剂之间的相关性,能精确刻画证候和方剂之间高度非线性的关系。

在证-熵-方研究领域中,揭示证候、方剂及其相互之间的内在相关性的熵方法包括无监督聚类方法、相关分析方法、综合评价方法等。无监督聚类方法又有常用的k均值聚类方法、复杂系统熵聚类方法、基于扩展熵的无监督聚类、无监督高阶Boltzmann机等;相关分析方法有常用的相关分析方法、贝叶斯参数估计方法、离散变量与连续变量的互信息、关联度系数法等;综合评价方法有主成分分析方法、熵值综合评价方法、非线性主成分分析法等。以下简要介绍证-熵-方领域中最常用的几种方法。

2.1 复杂系统熵聚类方法

复杂系统熵聚类方法是一种改进的聚类方法,它不但能快速聚类,而且能够实现一个变量在不同的类里面出现,实现“柔性”分割,改进了传统聚类方法“刚性”分割的缺点,使之更符合中医药的理论。其工作原理是基于改进的互信息,改进成公式(1)所示:

其中Po(i,j)表示2个变量Xi和Xj的阳性出现频率,b是大于1的实数,是惩罚系数。δ是阈值。选取合适的阈值不但可以把正相关和负相关分开,而且可以避免一些错误数据带来的干扰。基于改进的互信息,我们提出了变量的“亲友团”的概念。

我们这里只算出两两变量之间改进的互信息,这样就形成一个 N ×的矩阵,记为 T=(Δμ′(i,j))。对角线的元素表示变量自己与自己的互信息,设置为0。一般的方法都是选择一个全体的阈值来确定是否相关,但是这种做法有点“刚性”,而且这个阈值的确定带有太大的主观性而且太绝对。所以我们这里采取一种相对的做法,选定一个特定的变量i,在集合 Set(i)={Δμ′(i,j),j=1,2,…,j≠i,…,N}中取出值最大的前Z1≤Z≤N-1)个变量,形成一个有Z个元素的集合,记作D(i)。Z一般相对N来说是很小的,所以这个集合可以叫做变量i的“亲友团”,因为其中的每个元素都与i很相关。

得到每个变量的“亲友团”,就可以通过熵聚类算法获得聚类。

对每个变量,我们都取它们各自的“亲友团”D(i),i=1,2…N。如果2个变量互相在各自的亲友团里面,那么我们就认为这2个变量是强相关的。

数学描述就是:变量i和j是强相关当且仅当i∈D(j)且 j∈D(i)。

只有强相关才能聚在一起。以此类推,3个变量聚在一类里的当且仅当任意2个变量都是强相关的。由于Z是有限的,所以这个算法肯定收敛。类的个数是算法自动确定的,是变量个数N和“亲友团”个数Z的函数。

2.2 离散变量与连续变量的互信息方法

系统有n个特征变量X1,X2…Xn,所有的特征变量被映射到J类,类变量用C表示。统计推理的一个重要的任务就是在只有随机样本的情况下确定连续变量的概率密度函数。当条件概率被指定为某种概率分布后,问题将简化很多。概率分布的参数可以根据贝叶斯估计方法利用随机样本来确定。

离散变量的密度函数可通过统计得到,即

变量Xi和C=j的联合概率密度函数为:

变量Xi的边缘概率分布为

变量Xi和C的互信息为

其中,H(Xi)根据式(4)计算。

2.3 关联度系数法

关联度系数法主要用基于Shannon熵的互信息表示,其数理基础如下:

设n个特征变量用 X1,X2,…,Xn表示,其概率密度函数分别为 p(x1),p(x2),…,p(xn),Ωi是变量Xi,i=1,2,…,n 的定义域,Xi和 Xj的联合概率分布密度是 p(xi,xj),i=1,2,…,n,j=1,2,…,n,当变量Xi,i=1,2,…,n 是离散变量时,变量 Xi的 Shannon熵可写成

当变量 Xi,i=1,2,…,n 和 Xj,j=1,2,…,n 都是离散变量时,联合熵为

联合熵可以推广到N≤n个变量的情况。

则Xi与Xj之间的互信息表示为

3 证-熵-方的研究进展

证-熵-方领域中的方法不仅可以研究证候与方剂之间的相关性,还可以研究证候与证候、证候与症状等之间的关系。目前,运用熵理论方法进行研究的证-熵-方领域主要体现在证候研究、方剂研究、方证相关研究和疾病、证候、方剂相关规律研究等几个方面。

3.1 证候研究

证候研究一直是中医理论研究的热点和难点,以往大多属于定性研究,定量的相关性研究也都是基于统计学的线性相关研究,而证候与症状之间不是简单的线性关系,因此必须用非线性方法对证候与症状、体征的相关性进行定量研究,为中医辨证提供客观标准。

将复杂系统熵聚类方法应用到中医证候诊断标准的研究中已经得到广泛开展,并呈现出良好的发展前景。该方法遵照数据的内在联系,不对数据做刚性先行分割,依据数据内在关联进行自主聚类,可以无监督地处理多变量、多层次上的复杂数据,对于提取中医证候相关症状并分析症状之间的非线性相关关系具有重要应用价值。如有学者将493例临床短暂性脑缺血发作患者随机分为运算组(370例)和考核组(123例),以基于熵的复杂系统分划方法提取运算组患者症状信息,确立了不同症状对证候诊断的贡献度,建立了诊断阈值[4]。以同样的方法对动脉硬化性脑梗死中医证候量化诊断标准进行了研究,得出同样相似的结论[5]。应用此方法对脑络瘀阻临床数据进行分析,结果表明眩晕、肢体麻木、头痛、健忘是脑络瘀阻的基本症状,同时,证候之间关联度分析还显示,痰浊与血瘀也存在关联性[6]。该方法还成功应用到冠心病心绞痛[7、8]、血管内皮功能障碍[9]、中风病[10]、动脉硬化闭塞症[11]等疾病的中医证候量化诊断标准研究中。

证候的宏观子集指对证候辨证有关的四诊信息,即医生通过望、闻、问、切4个手段获取到的病人的宏观信息,包括症状、舌象、脉象等信息。与宏观子集对应,证候的微观子集指理化指标或分子、细胞层次的指标,如基因组学、蛋白组学和代谢组学等。如何探讨证候与宏观子集、微观子集以及通过这些子集反映出证候与疾病的相关性是中医基础研究和临床应用丞待解决和深入研究的问题。有学者利用离散变量与连续变量的互信息方法,根据900例血瘀证临床病历数据,在这些病历中,记录了23个理化指标,利用这些临床病历定量分析这些证候亚型与理化指标之间的相关性[12]。

3.2 方剂研究

古今临床医家记载了数以万计的疗效确切的方剂,这些方剂仍然在中医临床中大量应用,而且成为中药新药研发的主要来源。如何有效利用古今文献资料,既可继承名医、名家、名方的精髓,又可确保临床疗效的准确性,是中医药行业普遍关注、期待解决的问题。引进新方法,从浩如烟海的数据中快速挖掘出针对病证具有疗效确切的中药核心组合是解决这一问题的前提和关键。

由于中医药文献数据中的方剂数据同样具有离散型的,又有连续型和混合型的特点,因此基于复杂系统的熵方法非常适合作为中药新药处方发现的筛选方法。此方法具有两方面的显著优势:一方面,可以定性、定量地挖掘出药物之间、病-证-症-药之间的相关性;另一方面,可以挖掘出名医名家经验的核心组合,还可以挖掘出隐藏于方剂配伍之中被临床医家所重视的核心组合。我们运用熵方法定量描述中风病方剂中每2味中药之间的关联度。结果表明,有341对中药组合的关联系数在0.1以上,其中185对中药组合具有明确的中医理论依据,提出熵方法能有效分析中药之间的关联度[13]。在此基础上,对关联度较高的药物进行了相应分类及中医药学理论阐述,与中医临床实践吻合,并具有指导意义[14]。后续的研究进一步证实表明,证-熵-方领域中的熵方法将是中药新药处方发现的有力工具,呈现出良好的发展趋势。

3.3 方证相关性研究

“方证相关”是中医辨证论治学术体系和方剂学中的一个重要逻辑命题,经过近几十年的努力,取得了一定进展。但是由于涉及面广、因素复杂、层次多等特点,一直没有突破性进展。这就促使人们寻求并引进新的理论工具,揭示方证相关的现代科学内涵。

熵可以度量任意形式变量的不确定性,基于熵的关联度法可以度量任意统计相关性,包括线性和非线性可以有效解决证候与方剂的相关性问题。为此,有学者运用信息熵的方法,对中国古代中风病的中医文献进行证候与方剂相关性的定量分析,确定证候与方剂之间的关联度。结果表明:用基于熵的关联度法来定量分析证、方之间的相关性是可行的。用同样方法对389例中风病人古代医案进行研究,采用现行的中医证候诊断标准进行对比分析,结果进一步表明其应用的可行性。

3.4 疾病、证候、方剂关联规律研究

病证结合是目前中医证候规范化的主要方法,即把中医的核心——证候放在具体的西医疾病背景下研究。中医是通过方剂对证候的干预达到治疗疾病(指西医疾病)的目的。方剂、证候、疾病在辨证论治体系中密切相关,解读三者的相关性是揭示辨证论治科学内涵的关键。

已有学者选取缺血性中风病为范例进行了相应的研究。如根据此疾病中存在着“风,火,痰,瘀,虚”的确切的证候类型,通过文献研究确定纳入的方剂,通过Foxpro软件录入数据库,然后利用基于熵的互信息方法分别算出证候与方剂之间的关联系数,组成方剂的中药之间的关联系数,以及各个中药与证候之间的关联系数[2]。在收集临床病例的基础上,应用信息熵的概念分析了中风病证候、治法随时间变化的过程,并详细研究了中风病证候与证候、证候与治法、证候与药物、药物与药物之间的相关性。

传统中医重视的是证候疗效,而现代西医学重视疾病疗效,因此评价方剂的疗效应该从证候效应与疾病效应两方面着手。以方剂为切入点,进行方剂证候效应与疾病效应关联规律的研究,不仅可以筛选出对方剂敏感的证候、疾病指标,而且可以定量描述证候指标与疾病指标之间的关联性,避免指标的泛化,容易发现规律[1]。对众多的因素或指标进行科学的综合,形成合理的综合指标,才有利于实现系统的客观描述和评价。“证-熵-方”的方法可以针对评价过程中出现的大量非线性数据进行定量描述,从而揭示方剂证候效应与疾病效应的关联性,为阐述疾病、证候、方剂之间的关联规律奠定基础。

4 展望

随着现代科学技术的进步,多学科交叉研究的不断开展与融合,复杂性科学和信息学等介入中医药研究之中,为疾病、证候、方剂及其之间的相关性研究提供了广阔的发展空间。证-熵-方领域中的方法具有信息全面、可靠性高、能进行定量比较等优点,已经广泛应用于中医证候、方剂及其相关性研究,并取得了一定的研究成果。在研究进一步深入的过程中,一方面,证-熵-方领域中方法的不断改进将拓展熵方法理论的应用范围;另一方面,证-熵-方领域的不断扩大,不仅更多地应用于证候、方剂及其相关性研究,还将在中医临床经验继承、中药新药处方发现、配伍的核心成分组合、组分效应规律、中医临床疗效评价等方面开展研究,相信一定会呈现更加广阔的应用前景。

[1]杨洪军,赵亚丽,刘艳骄,等.“熵”在中医方证研究中的运用[J]. 中国中医基础医学杂志,2004,10(9):16-19.

[2]赵亚丽.一类复杂系统的熵方法研究[D].中国科学院研究生院博士论文,2005.

[3]孙占全.复杂系统建模——一类智能计算模型及其应用研究[D].中国科学院研究生院博士论文,2007.

[4]袁国强,李叶双,吴以岭,等.短暂性脑缺血发作中医证候量化诊断标准研究[J].上海中医药大学学报,2007,21(3):23-27.

[5]袁国强,吴以岭,贾振华,等.动脉硬化性脑梗死中医证候量化诊断标准研究[J].江苏中医药,2008,40(5):67-71

[6]吴相春,吴以岭,高怀林,等.“脉络-血管系统病”脑络瘀阻证候量化诊断标准研究[J].浙江中医杂志,2007,42(11):625-627.

[7]贾振华,李叶双,吴以岭,等.变异型心绞痛证候要素提取及其组合与分布规律[J].中西医结合学报,2007,5(6):616-620.

[8]贾振华,李叶双,吴以岭,等.基于熵的复杂系统分划方法在冠心病心绞痛中医证候量化诊断标准研究中的应用[J].中国中西医结合杂志,2007,27(9):804-806.

[9]高怀林,吴以岭,贾振华,等.血管内皮功能障碍中医证候量化诊断标准研究[J].中国中医基础医学杂志,2008,14(4):288-290.

[10]刘强,陈建新,陈静,等.通过动态关联度系数聚堆的临床证候要素提取方法初探[J].中国中医药信息杂志,2007,14(10):100-102

[11]高怀林,吴以岭,贾振华.基于熵的复杂系统分划方法在动脉硬化闭塞症中医证候量化诊断标准研究中的应用[J].中华中医药学刊,2007,25(11):2254-2256.

[12]陈建新.中医证候的复杂系统建模及其与疾病的相关性研究[J].中国科学院研究生院,博士论文,2008.

[13]杨洪军,赵亚丽,唐仕欢,等.基于熵方法分析中风病方剂中药物之间的关联度[J].中国中医基础医学杂志,2005,11(9):706-709.

[14]唐仕欢,赵亚丽,杨洪军,等.中风病方剂中常用药对的研究[J]. 中华中医药杂志,2007,22(1):30-33.

猜你喜欢
方证互信息中风病
缺血性中风病复发危险因素中西医的研究进展
《伤寒论》“方证辨证”思想探讨
基于改进互信息和邻接熵的微博新词发现方法
基于互信息的贝叶斯网络结构学习
基于增量式互信息的图像快速匹配方法
补肾活血祛瘀方治疗中风病恢复期100例
中风病机及用药分析
张圣德主任中医师治疗中风病经验介绍
李发枝谈方证辨证*
感悟经方的魅力(下)