信息熵及其在中医“证症”关联中的应用研究

2016-12-15 20:35王元茂杨松涛
电脑知识与技术 2016年27期
关键词:信息熵

王元茂+杨松涛

摘要:中医证侯规范化是中医向科学化和国际化迈进的先决条件,而证侯与症状的关联度分析对证侯规范化具有至关重要的作用。针对证侯及症状数据量庞大且多呈现非线性复杂结构的特点,通过引入复杂系统中的“信息熵”分划理论,对三个实际应用案例进行综合分析,以“证症”关联度作为证侯规范化的研究重点,对熵分划在“证症”关联分析中的作用和意义进行了深入探讨。

关键词:复杂系统;证症关联;信息熵

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2016)27-0229-03

Abstract:Syndrome standardization is prerequisite for the internationalization of Chinese Medicine, meanwhile, the association analysis of syndrome and symptom plays critical role in syndrome standardization. Information in Chinese Medicine usually present complexity and nonlinear, in order to normalize the complicate system, introducing a dividing theory of information entropy by three case studies, analyzed the association of “Syndrome & Symptom” by how information entropy works in this process.

Key words:Complex System; Syndrome&Symptom Association;Information Entropy

中医是我国传统文化的优秀组成部分,它以“整体观念”和“辨证论治”的独特思想,在医学界中产生了深远影响。中医理论博大精深,相对于西医单一的“还原论”而言,中医思想更具有整体性、动态性以及建立在辨证论治基础上的个体化诊疗方法等特点,受到人们越来越广泛的关注[1]。在传统中医诊疗过程中,“证”是立法立方的基础,医者将通过四诊收集得到的临床信息进行综合分析以用来对证候进行判断,这种非线性的思维方式使得中医相较于西医能够更全面的观察疾病的发展和机体的状态,从而在诊断和治疗的思路上更为广阔。然而,正是由于中医的特殊思维模式使其具有复杂性、整体性和不确定性等特点,也导致辨证的过程具有模糊性和不确定性,缺乏客观的生化指标,阻碍了中医与国际医学学术接轨的进程。因此,证候的规范化研究是中医学从主观到客观,从非线性到线性,从定性到定量研究的重要步骤,是将中医诊疗技术向世界推广的必经途径。

1 影响中医证侯规范化的要素及本文研究方法

中医证侯规范化包括“症状规范”和“证侯规范”两部分,其中四诊收集到的“症状”、“体征”、“舌脉”等信息是综合判断证侯的基础,因此,症状的规范是证侯规范的前提,如症状名称以及症状程度等。与之相比,证侯规范包括“证侯分类规范”、“证侯名称规范”以及“证侯诊断标准规范”三大模块[2],涉及的研究范围也相当广泛。在此过程中,很难寄希望于以一种“万能”的模型或者算法适用于证侯量化工作的所有模块或进程。因此,对证侯规范量化的不同步骤、不同变量、不用关系,应该对应采用适应性强的更具有相对性的方法,使得整个规范化过程由繁到易、由整到零、各个击破。通过对证侯规范化三大模块进行分析不难发现,每一个模块都要求将证侯和与其对应的症状集进行关联,通过将较易量化的症状变量与较难量化的证侯信息进行联结作为证侯量化的引线。如张春和[3]在提及证侯名称规范化的研究重点时指出“证侯是疾病发生过程中某一阶段机体对内外致病因素的综合反映,在宏观上表现为特定的症状、体征(舌象、脉象)的有机组合”,以及在讨论证侯诊断规范化时认为“主症”、“次症”以及“舌象、脉象”是中医证侯构成的三大要素。由此可见,证侯的规范化离不开症状,而中医症状与证侯是多对多的关系,即多个症状组合对应一个证侯,同时多个证侯也可能包含同一个症状,加之不同患者的体征体质的不同,使得通过预先设定模型的方式进行证症关联分析变得困难。另外,根据中医对疾病和证侯的关系认识,同一种疾病也可表现为不同的证侯,每一个证侯又可能出现于不同疾病的发展过程。因此,不同于传统的线性研究方法,本文将证候以及与之相关的症状、体征等数据看作离散变量,通过引入复杂系统中的“信息熵”分类方法将中医复杂系统看做若干离散的变量,从中研究证侯变量及症状变量之间的非线性复杂关系,并结合已有的三例以熵分划方法为研究方式对具体中医病症证候分析的应用案例,总结出熵分类在研究证症关系中的作用。

2 信息熵分划方法

在关于生物、医学、人脑等研究领域中,复杂系统是由任意多个子系统组成的具有任意结构的系统,其中以“熵”定义的关联度是复杂系统的核心概念,同时也是研究中医证候复杂系统的子系统相关性的主要衡量度。在我们的世界中,有包括长度、质量、温度等诸多对客观事物的度量单位,而“熵”可以看作是信息的一种度量,是随机变量不确定性的测度。以熵定义复杂系统中子系统间的关联度,对于一个复杂系统,若将其看做由离散随机变量构成的离散信息源,并组成了若干子系统,则可以将其表示为一个矢量[4]:

S = (S1,S2,…,Si,…,Sp)

其中Si={Sia ,i=1,2,…,p ;a=1,2,…,q}是描述系统特性的变量。我们令Ci(i=1,2,…,p)为Si分类的集合,其中Ci的第a个元素Cia=a,即Ci={1,2,…,a,…,k},k≦q,并令na为Si属于Ci第a类的数量,则在S中,Si的熵H(Si)为

H(Si,Sj)为Si与Sj的联合熵,nab表示Si属于Ci的第a类且Sj属于Cj的第b类的数量。若S中任意两个子系统,则为Si和Sj之间的关联度。在此基础上,西广成[5]又提出了对于复杂系统分划要求的最低准则:

并引入关联度系数从而消除Si与Sj的分类数或量级对于的影响,取值0和1之间。结合关联度矩阵画出信息连通图,通过宽度正比于的有向线,将大的Si和Sj进行连线,从而得关联度较高的变量集,即关联度较高的子系统。依照该方法将原系统S进行处理,使原本离散的变量通过关联度相互之间产生了联系并形成一个子系统,子系统与子系统间继续进行关联度测算,得出子系统间的关联分析,最后以此为依据分划整个复杂系统S。

3熵分划方法在证症关联分析中的应用

在中医证侯数据系统中,“证”与“症”数据离散混杂在一起,若采用信息熵分划算法应用其中,则无需提前设计分划模型,只需计算各数据变量Xi的H(Xi)以及H(Xi,Xj),其中(i,j=1,2...n),通过关联程度形成对应子系统,如某个症状集S1,以此为基础对应分析与其关联度最高的另一个子系统,如某个证侯或兼证集Sj,从而可以得到症状与证侯的关联。本章将以此为研究方向,对三例已有研究成果进行分析,并最终讨论熵分划方法在证症关联分析中的作用。

3.1 熵分划方法在抑郁症症状与证侯关联分析中的应用

西广成[6]等在熵分划算法的基础上,采用分级定量的方法,对604例采集到的抑郁症病例进行症状关联分析实验。在该实验中,共收集症状变量100个,包括精神症状如“悲观”、“胆怯易惊”等18个,躯体症状如“手足心热”、“自汗”、“烘热”等52个,舌象症状如“白苔”、“少苔”等19个和脉象症状如“脉浮”等11个。通过综合分析,对抑郁症数据中的两个症状变量进行关联度系数的运算,得到两两症状间的关联度系数矩阵。以自汗、烘热症状为例,得出自汗症状属于烘热症状的关联集合且关联度排位第二,同样烘热症状也排在自汗症状的关联集合第三位。根据N级变量的进一步分析,发现手足心热症状同自汗及烘热症状关联度也很高,从而认定这三类症状是抑郁症症状系统的一个有效分划,并属于证侯中的热证。依照该模式,将所分划的大部分集合对应连线至中医证侯中的相关证,从而将分划结果与中医理论的辩证意义联系起来。

3.2 熵分划方法在慢性肾功能衰竭症状与证侯关联分析中的应用

王天芳[7]等人在研究慢性肾功能衰竭“证症”关联分析时同样采用信息熵关联度系数法,从证侯要素入手对提取的患者四诊症状进行分析。在该研究中,共选取病例样本601例,涉及“乏力”、“胸闷”、“腰膝酸软”等16个症状变量,采取两两变量及多变量之间的关联度系数的大小比较,将关联度程度最高的变量聚成一个集合,从而得出关于慢性肾功能衰竭症状的簇集并对应至相关的病位及可能所属的证侯。例如症状:“胃寒”、“乏力”、“腰膝酸软”,病位:“肾”,病性:阳虚,可能的证侯:“肾阳虚证”,并以此将数据集中的症状与证侯进行分类。

3.3 熵分划方法在血瘀证症状体征规范化中的研究

王阶[8]等人将中医诊断与复杂系统熵分划算法相结合,以血瘀证为研究对象,通过探索复杂算法研究中医证侯诊断的新思路,提升中医诊断方法的客观性和规范性。在本研究中,共提取血瘀证460例,疾病分类有“心绞痛”、“类风湿”、“脑梗死”、“肝硬化”、“月经病”等5类常见病,血瘀兼型有“气虚血瘀”、“气滞血瘀”、“阴虚血瘀”和“痰浊血瘀”4型。通过对症状与血瘀兼证证型的关联度数据统计,发现气虚血瘀症状的总体贡献度要明显高于其他3类血瘀兼型,气虚证的贡献度也大于其他三类亚型,因此判断气虚证是伴随血瘀证的主要证侯,在临床用药治疗血瘀证的同时,可以适当添加补气药会提高疗效。另外,不同的血瘀兼证有各自的特点,也有公共的病症和体征,然而即使如“舌质紫暗”此类公共症状,在各自不同的血瘀部位所占的权重也不同。因此,在治疗过程中需注意不同部位血瘀证的不同症状,从而针对性的用药治疗。此研究不仅发现了证候与症状的关联度,同时将疾病、部位、以及兼证证型作为子系统进行熵分划研究,使得熵分划方法在证侯规范化研究中的应用更加全面,也进一步验证了熵分划在面对多维离散数据时的分划准确度。

3.4 研究结果

数据挖掘与中医药结合是近年来的研究热门,在一般的数据挖掘办法中,一个变量往往只能隶属于一个变量集,反映到证侯变量中即一个中医临床症状只能属于一组症状群,通过证侯与症状群的联系,这就意味着一个症状只可以对应一个可能的证侯。中医证侯与症状以及体征之间不是简单的一对一关系,而是一种多对多,集合对集合的非线性关系。在这种情况下,引入信息熵分划方法可以有效地分析疾病、证侯、症状之间的复杂关系,原因在于使用该方法对原系统进行的划分是完全按照离散变量之间的关联度系数大小划分,没有固定的线性公式,分划算法与数据的适应性良好。如案例一中将三种症状变量通过熵关联度分析集合为某一个症状集(子系统),并通过症状集和对应联结度较高的证侯系统进行比较,得到关联度较高的证侯集,从而达到症状与证侯的多对多关联比对;在案例二中,通过多变量间的关联度分析,不仅得到了症状与证侯的关联度分析,同时在熵分划过程中产生了表示病位的子系统,并得到了该系统与证侯间的关系;案例三则将兼证作为新的子系统加入分析,通过提取贡献度最高的子系统,发现气虚证是伴随血瘀证的主要证侯,从而达到证侯与证侯之间的关联分析,使临床用药治疗更加全面。

4 结束语

综上所述,如图1左所示,在信息离散度和复杂度较高的中医证侯系统中,症状变量与证侯信息混杂在一起,而熵分划的作用是将左图的离散转化成右图的关联,即将症状变量通过关联度集合成多个症状集合,并将症状集合与关联度较高的证侯要素进行联结。在疾病发展的不同阶段,以及患者体质的不同,同一个证侯可能对应不同的症状集,而同一个症状集又可能是不同的证侯的症状集的一部分,另外根据原始数据集信息维度的不同,通过熵分划也可分划出如病位、体征等不同的子系统,使之与病症和证侯相互作用,进一步精确某种证侯所包含的量化要素,为中医证侯的规范化起到至关重要的作用。

参考文献:

[1] 钟涛.基于复杂系统方法的慢性胃炎中医问诊证侯建模研究[D].上海:华东理工大学,2014.

[2] 李方玲,梁嵘.对中医证侯规范化研究的探讨[J].辽宁中医杂志,2006,33(4):386-387.

[3] 张春和.证侯研究规范化与中医全球化[J].云南中医学院学报,2011,24(5):4-7.

[4] Pal N, Pal S. Object-background segmentation using new definitions of entropy.IEEE proceedings on Computers and Digital Techniques,1989,136(4):284-295.

[5] 西广成.复杂系统分划的熵方法[J].自动化学报,1987,13(3):216-220.

[6] 西广成.复杂系统方法学与中医证侯建模[M].北京:科学出版社,2010:91-95

[7] 王天芳,吴秀艳,陈建新,等.基于信息熵关联度系数法的证侯要素提取研[J].天津中医药,2009,26(4):274-276.

[8] 王阶,李海霞,孙占全,等.基于复杂算法的中医证侯研究[J].北京中医药大学学报,2006,29(9):581-585.

猜你喜欢
信息熵
基于信息熵可信度的测试点选择方法研究
基于信息熵模糊物元的公路边坡支护方案优选研究
基于小波奇异信息熵的10kV供电系统故障选线研究与仿真
基于信息熵的实验教学量化研究
基于信息熵赋权法优化哮喘方醇提工艺
一种基于信息熵的雷达动态自适应选择跟踪方法
改进的信息熵模型在区域水文站网优化布设中的应用研究
基于信息熵的IITFN多属性决策方法
基于信息熵的循环谱分析方法及其在滚动轴承故障诊断中的应用
泊松分布信息熵的性质和数值计算