基于隐树模型的40岁~65岁妇女原发性骨质疏松症中医证候要素分析*

2011-03-01 11:01谢雁鸣易丹辉李建鹏支英杰
中国中医基础医学杂志 2011年7期
关键词:骨质疏松症证候问卷

谢雁鸣,杨 伟,田 峰△,易丹辉,虞 鲲,康 树,刘 峘,李建鹏,支英杰

隐类分析(latent class analysis)是一个基于隐类模型的聚类方法[1]。作为隐类分析的一种工具,隐树模型(latent tree model),即多层隐类(hierarchical latent class,HLC)模型,已经被探索性地应用于中医证候的定量化研究领域中[1-3],比较适合于中医证候的定量研究分析。本文拟对611例北京和上海社区40岁~65岁妇女原发性骨质疏松症(primary osteoporosis,POP)中医证候相关调查数据进行隐类分析,建立隐树模型,探索社区40岁~65岁妇女 POP中医基本证候要素特征。

1 资料与方法

1.1 资料来源

2009年3月~8月期间,在上海市徐汇区和北京市东城区社区医疗服务中心开展POP高危人群筛选,对符合纳入标准的人员进行现场问卷调查,并指导被调查者分别到上海市大华医院和北京市东直门医院进行骨矿物质密度(bone mineral density,BMD)检测。在上海社区共发放筛检问卷1101份,返回问卷1027份,经核实排除不合格问卷26份,得到合格问卷1001份,占发放问卷数的90.92%。在北京社区共发放筛检问卷800份,返回问卷763份,经核实排除不合格问卷24份,得到合格问卷739份,占发放问卷数的92.38%。应用“骨质疏松症健康管理系统”网络数据采集平台,将合格问卷独立双录双核后,进行一致性检验后,共获得1740例合格筛检问卷和BMD检测数据。

1.2 研究方法

1.2.1 筛检问卷的设计 在课题组前期设计的《原发性骨质疏松症中医证候调查问卷》[4]的基础上,结合问卷信度、效度分析[5]和中医证候分析[5、6]结果,根据量表学和临床流行病学方法,结合骨质疏松症专家的临床经验以及专家反复论证,基于已完成的520例POP中医基本证候研究[7]的结果,《中医内科常见病诊疗指南·西医疾病部分》[8]的中医证候辨证内容,制定“社区40岁~65岁妇女骨质疏松危险因素及证候调查问卷”。整个筛检问卷包括一般信息、生活习惯、发病相关因素、躯体状况、临床体征等5个领域的内容,共65个条目,为封闭式设计。筛检问卷在调查前由独立的中国中医科学院中医临床基础医学研究所伦理委员会对其内容进行医学伦理论证并同意使用。

1.2.2 被调查者选择标准 (1)纳入标准:①女性;②年龄 40岁~65岁;③意识清楚,可用言辞表达,有阅读能力,与调查人员沟通无障碍者;④愿意接受筛检问卷调查和BMD检测,并在“卷首页”签名同意者;(2)排除标准:①药物或其他疾病引起的继发性骨质疏松症;②有恶性肿瘤、痛风、类风湿性关节炎等疾病影响中医证候判断者;③精神障碍、认知障碍者。

1.2.3 诊断标准 根据2008年中华中医药学会发布的《中医内科常见病诊疗指南·西医疾病部分》[8]中以BMD检测T值为指标的POP定性诊断标准,T值 >M-1SD为骨量正常,M-1SD~-2.0SD为骨量减少,<M-2.0SD以上为骨质疏松。

1.2.4 统计分析方法 隐树模型是一种含有多个隐变量及隐结构的树状形贝叶斯网,其中所有叶节点是可观测的变量,称为显变量;所有内节点是不可观测的变量,称为隐变量(如图1)。

图1 一个HLC模型:X 1,X2,X3是隐变量,Y1,Y2,…,Y7 是显变量

Zhang[9]给出了如何从给定的数据中挑选出最匹配数据的HLC模型方法,文中通过实证研究选用最合适的贝叶斯信息准则(Bayes information critedon,BIC)[10]进行模型学习。隐树模型的BIC评分计算公式为:

其中,Σ是1组数据,m是Σ中的样本个数,G是1个隐树模型,而Θ*是G中参数的1个最大似然估计,d(G)是G中独立参数的个数。

2 数据分析

611例符合“骨质疏松”定性诊断标准的数据纳入分析。躯体症状共49个条目,分析时首先排除身痛、腰痛、背痛、足跟痛等疼痛的性质和时间8个条目、其他部位疼痛及其性质和时间3个条目,其他症状1个条目,对剩余的37个条目分析其发生频率,将低于15%的7个躯体症状条目进行排除,最终纳入隐树模型分析的有30个条目,即筛选30个躯体症状变量纳入分析。躯体症状的程度分为“没有”、“偶尔有”、“时有时无”、“经常有”、“总是有”5级,即每个症状变量都有5个可能的取值。运用Lantern 1.5软件(由香港科技大学张连文教授授权)隐树模型分析,通过BIC评分准则找到所有可能模型中BIC评分最高的隐树模型。

3 结果

3.1 POP隐树模型结构

利用启发式单重爬山(heuristic single hillclimbing,HSHC)算法[11]学习得到 BIC 评分最高的隐树模型 M(见图2),其 BIC评分为-22950.125。模型M中,V0~V29是来自原始数据的症状显变量,Y0~Y13是数据分析过程中引入的隐变量,每个隐变量后面括号里的取值表示对应隐类的取值个数。

3.2 POP隐树模型中隐变量的诠释

图2显示,隐变量Y0可以当作是40岁~65岁北京、上海社区POP人群,直接依赖于Y0的隐变量有Y1、Y7、Y9和 Y13。把模型 M 与 POP的中医证候理论作比较,对这些隐变量作具体的定性诠释。

3.2.1 隐变量Y1的诠释 隐树模型 M中,隐变量Y1直接影响着足跟痛这个症状的出现及其轻重程度外,还通过隐变量 Y2、Y5、Y4间接影响着相关症状的出现及其轻重程度。隐变量Y2直接影响着腰膝酸软、气短、乏力、健忘、易怒5个症状的出现及其轻重程度,Y2还通过隐变量Y3间接影响着腿软和下肢困重2个症状的出现及其轻重程度。肾主骨生髓,若肾精不足,骨髓生化乏源不能营养骨骼,便会出现腰膝酸软、腿软、乏力症状。肾主纳气,肾精充足,肾气充沛,摄纳有权,则呼吸均匀和调。若肾精亏虚,肾气衰减,摄纳无力,肺吸入之清气不能下纳于肾,则会出现气短症状。“肾藏精,精舍志”,脑的记忆主要由肾主司,若肾精不足,无法荣养脑髓,灵机失运,可见健忘症状。肾主水,肾气对于水液代谢具有调节作用,肾气亏虚,水失运化,日久生湿,阻滞经脉,气血运行不畅,可见下肢困重。腰膝酸软、气短、乏力、健忘、腿软和下肢困重是 POP肾阳虚证的主要症状,隐变量Y2可以诠释为肾阳虚情况。

图2 隐树模型M结构图

隐变量Y5除直接影响身痛和背痛的出现及其轻重程度外,还通过隐变量Y6影响腰痛和遇寒痛甚的出现及其轻重程度。肾精不足,日久阳气亏虚,气的推动和温煦功能减退,致使血行不畅,日久成瘀,瘀阻脉络,不通则痛,可见身痛和背痛症状。腰为肾之府,肾中阳气不足,温煦失司,不能温养腰府,故可见腰痛和遇寒痛甚。身痛、背痛、腰痛和遇寒痛甚是POP血瘀证的主要临床症状,隐变量Y5可以诠释为血瘀情况。

隐变量Y4影响着耳鸣、齿摇、下肢转筋的出现及其轻重程度。肾开窍于耳,肾精不足,耳窍失养,故见耳鸣;“肾主骨”,齿为骨之余,肾中精气亏虚,骨骼失养,可见齿摇和下肢转筋。耳鸣、齿摇、下肢转筋是POP肾精不足证的常见症状,隐变量Y4可以诠释为肾精不足情况。

隐变量Y1所影响的症状可以诠释为肾虚(兼有阳虚、肾精不足和血瘀)证候。可以这样理解,对于40岁~65岁女性骨质疏松人群而言,肾虚是根本的病理基础,不同的人群在此基础上可能在阳虚、精气不足和血瘀3个方面有所侧重,故而在临床症状表现上也有不同偏重或兼夹。隐变量Y1在某种程度上体现了40岁~65岁女性骨质疏松人群中医证候的复杂性。

3.2.2 隐变量 Y7的诠释 隐变量 Y7直接影响着畏寒、头晕、纳呆的出现及其轻重程度外,还通过隐变量Y8间接影响着失眠和多梦易惊的出现及其轻重程度。脾主运化,脾阳不足,运化失司,可见纳呆;肾阳为一身阳气之本,若肾阳亏虚、阳气温煦不足,可见畏寒;脾肾阳虚,气血不能上荣头窍,可见头晕。心肾水火升降互济,才能维持两脏生理功能的协调平衡。若肾阴亏虚,阴不制阳,肾中虚火上扰心神,故见失眠和多梦易惊。畏寒、头晕、纳呆、失眠和多梦易惊等症状属于阴虚和阳虚并见,故隐变量Y7可以诠释为肾阴阳两虚兼夹脾阳虚情况。

3.2.3 隐变量 Y9的诠释 隐变量 Y9通过隐变量 Y10、Y11、Y12影响着相关症状,隐变量 Y10直接影响着恶热、手足烦热和盗汗的出现及其轻重程度,隐变量Y11直接影响着视物模糊和目睛干涩的出现及其轻重程度,隐变量Y12直接影响着便秘和脱发的出现及其轻重程度。肾阴亏虚、阴不制阳、阳热之气相对偏盛而生内热,可以出现恶热、手足烦热和盗汗症状。肝开窍于目,目受血而能视,“肝肾同源”,肾阴亏虚容易导致肝阴亏虚,目窍失养,可见视物模糊和目睛干涩症状。“发为血之余”,肝主血,若肝阴血不足、头发失养,可见脱发症状。肾阴不足、阴液亏虚、肠道失润可见便秘。恶热、手足烦热、盗汗、视物模糊、目睛干涩、便秘和脱发皆属于POP肝肾阴虚的临床表现,因此隐变量Y9可以诠释为肝肾阴虚情况。

3.2.4 隐变量Y13的诠释 隐变量 Y13直接影响着尿频和小便清长的出现及其轻重程度。肾阳亏虚,肾气和膀胱之气的固摄作用失常,致膀胱气化失司、关门不利,可出现尿频和小便清长的症状。隐变量Y13可以诠释为肾阳虚影响膀胱气化功能的情况。

就骨质疏松人群而言,隐树模型M中的显变量(躯体症状)所展现的隐变量与POP常见的肾虚、肝虚、阳虚、阴虚、血瘀等基本证候要素特点相吻合,病变部位以肝肾两脏为主,病性以虚证为主兼见血瘀。

3.3 POP隐树模型中隐类的解释

下面从两个方面对模型M作定量解释。一方面,模型明确规定隐变量的取值个数;另一方面,模型用条件概率分布来定量刻画变量之间的依赖关系。这里以模型M中隐变量Y5为例说明。Y5直接影响V25、V27的轻重程度,通过隐变量 Y6间接影响V26、V29的轻重程度。从定性分析的角度,可以把Y5解释为血瘀证。在定量层面,Y5有2个不同取值,分别记为s0和s1,即按照 Y5这个隐变量,模型M把数据样本对应的骨质疏松人群聚成2个大类。由于这些类不是直接观察到的,因此称为隐类,其特性可以通过类概率分布(class probability distribution)来刻画。

例如,Y5与 V25和 V27的定量关系分别由条件概率分布P(V25|Y5)和P(V27|Y5)给出。各症状变量在Y5的2个不同取值下的条件概率分布情况见表1。就“身痛”症状具体而言,在Y5=s0这个类中,“没有”、“偶尔有”、“时有时无”、“经常有”、“总是有”身痛的人群比例大约分别为79%、18%、1%、2%和0%;而在Y5=s1这个类中,对应的人群比例分别为19%、40%、18%、19%和4%。“身痛”在隐类Y5=s1这类人群中“偶尔有”、“时有时无”、“经常有”、“总是有”的比例明显偏高,而在隐类Y5=s0这类人群中“没有”的比例偏高。

表1 隐变量Y5与相关症状的条件概率分布表

为直观地展现隐类的特性,可以把上面的类概率分布数值用直方图的形式展示。在类概率直方图中,每个显变量所对应的柱状图反映了其在相应隐类中的条件分布。柱状图中颜色由浅至深各段的长度分别对应于显变量第1个状态、第2个状态、第3个状态等等的条件概率大小。图3给出模型M中隐变量Y5的2个类中,各症状显变量的概率直方图。图中柱体分别表示在类Y5=s0、Y5=s1中,症状变量 V25、V27、V26和 V29的概率分布。很明显,隐变量Y5取值隐类s1中的各个症状变量出现的程度要比隐类s0中的重,从中医理论来讲,可以解释为血瘀证越重,则相应症状出现越多且程度越重。

图3 隐变量Y5两个隐类下各症状变量的概率直方图

通过这样的定量方法还可以对模型M中其他的隐变量进行一一分析。由此,可以刻画人群处于隐变量下某个特定隐类时,或者说证候处于某个特定轻重程度时,相应症状出现的动态变化情况。

4 讨论

4.1 POP的基本中医证候要素

证素是对病变当前的位置与性质等本质所作的判断,是辨证的基本要素[12]。《中医内科常见病诊疗指南·西医疾病部分》中指出,POP的基本病机是由于本虚,病位在骨,证属本虚标实,以肝、脾、肾三脏虚弱,尤以肾虚为本、寒湿、血瘀为标[8]。导师开展的研究表明,POP的基本中医证候要素为阴虚、阳虚、气虚、气滞、湿浊和血瘀[13]。这表明,运用隐树模型进行POP中医证候要素的分析结果是基本可靠的。隐树模型提示,肾虚、阳虚、阴虚等证候要素只与部分症状变量直接相关,而不是与全部症状变量直接相关,而且不同证候要素影响不同的症状变量,这是符合中医理论和临床实际的。

4.2 隐树模型在中医证候研究中的优势和不足

4.2.1 聚类分析方法在中医证候研究中的不足 中医辨证是一个多维同时分类问题,聚类分析在原理上是建立客观定量的辨证标准最自然的方法,但是现有的聚类方法是单维的,在处理中医证候的多维性方面具有先天不足之处[1]。通过对骨质疏松人群进行多维聚类,得到的每一个类都是数据在某一特征上的反映,构建的隐树模型可以显示中医证候的客观性。通过分析模型中具有中医辨证意义的隐变量或隐类,明确疾病证候要素;通过模型中相关显变量的类概率分布可以了解症状对于相应证候要素的贡献度[14]。隐树分析方法可以从多维和定量的角度,弥补聚类分析在中医证候研究方法上的先天不足。

4.2.2 现有隐树模型算法在中医证候研究中的局限性 隐树模型分析所用的HSHC算法在数据变量处理上有一定的限制性要求,不宜将太多的变量纳入分析,而且所要求的样本量较大。本分析仅纳入与POP常见证候相关的30个症状变量,样本量为611例,模型M中有个别症状变量在证候归类上与中医理论存在一定的差异,部分症状变量在证候诠释上比较困难,给模型解释带来一定的困难。可以认为,本研究建立的隐树模型M是与611例骨质疏松人群数据最匹配的、最可靠的模型,但并非完美无缺,模型中所有隐变量反映出来的数据特征的中医临床意义,需要结合中医理论和临床专家经验来综合考虑和判断。这些问题有待今后通过改进模型算法和增大样本量继续深入研究。

[1] 张连文,袁世宏.隐结构模型与中医辨证研究(I)——隐结构法的基本思想及隐结构分析工具[J].北京中医药大学学报,2006,29(6):365-369.

[2] 张连文,袁世宏,陈 弢,等.隐结构模型与中医辨证研究(Ⅱ)——肾虚数据分析[J].北京中医药大学学报,2008,31(9):584-587.

[3] 袁世宏,张连文,陈 弢,等.隐结构模型与中医辨证研究(Ⅲ)——模型辨证与专家辨证[J].北京中医药大学学报,2008,31(10):659-663.

[4] 朱云茵.原发性骨质疏松症系统评价及中医基本证候研究[D].北京:中国中医科学院毕业论文,2005.

[5] 谢雁鸣,朱芸茵,于 嘉.原发性骨质疏松症中医证候调查问卷信度与效度分析[J].中国中医药信息杂志,2006,13(12):21-23.

[6] 朱芸茵,谢雁鸣.原发性骨质疏松症中医证候特征探析[J].亚太传统医药,2006,2(2):54-57.

[7] 谢雁鸣,朱芸茵,葛继荣,等.基于临床流行病学调查的原发性骨质疏松症中医基本证候研究[J].世界科学技术-中医药现代化,2007,9(2):38-44.

[8] 中华中医药学会.中医内科常见病诊疗指南·西医疾病部分[G].北京:中国中医药出版社,2008:242-245.

[9] Zhang N L.Hierarchical latent class models for cluster analysis[J].Journal of Machine Learning Research,2004,5(6):697-723.

[10] Schwarz G.Estimating the dimension of a model[J].Annals of Statistics,1978,6(2):461-464.

[11] Zhang N,Kocka T.Efficient Learning of Hierarchical Latent Class Models[Z].Boca Raton,Florida:2004585-593.

[12] 朱文锋,张华敏.“证素”的基本特征[J].中国中医基础医学杂志,2005,11(1):17-18.

[13] 谢雁鸣,朱芸茵,葛继荣,等.基于临床流行病学调查的原发性骨质疏松症中医基本证候研究[J].世界科学技术-中医药现代化,2007,9(2):38-44.

[14] 王天芳,张连文,赵 燕,等.隐结构模型及其在中医证候研究中的应用[J].北京中医药大学学报,2009,32(8):519-526.

猜你喜欢
骨质疏松症证候问卷
肥胖中医证候动物模型研究进展
QCT与DXA对绝经后妇女骨质疏松症检出率的对比
骨质疏松症为何偏爱女性
问卷网
骨质疏松症患者种植治疗的研究进展
昆明地区儿童OSAHS中医证候聚类分析
问卷大调查
问卷你做主
基底节区出血与中医证候相关性研究
滋肝补肾法治疗肝肾亏虚型骨质疏松症40例