基于隐结构模型和聚类分析的2 907例支气管扩张症中医证型研究

2022-06-09 14:09屈云艳熊周璇张婷婷曲蒙蒙余海滨
安徽中医药大学学报 2022年3期
关键词:证型肺气证候

屈云艳,王 伟,许 宁,熊周璇,张婷婷,曲蒙蒙,高 梅,余海滨

(1.河南中医药大学,河南 郑州 450000 2.河南中医药大学第一附属医院,河南 郑州 450000)

支气管扩张症是由于遗传、继发感染、免疫等原因引起支气管树病理性、不可逆性扩张,进而反复发生化脓性感染的气道慢性炎症。病情持续进展会严重损坏患者正常肺组织及其功能,严重降低患者生活质量,无论是对个人还是社会,都造成了沉重的经济负担[1]。中医药在缓解支气管扩张症临床症状、降低发作频率、改善肺功能等方面有显著疗效。然而缺乏规范的证候诊断标准是限制中医药充分发挥疗效的重要原因之一,因此对支气管扩张症常见证候及症状分布特点进行研究,对支气管扩张症证候诊断标准的建立尤其重要[2]。本研究基于有关支气管扩张症患者的病历记录,运用不同的统计学及数据分析方法,探究支气管扩张症的常见证型及其症状分布特点,为支气管扩张症中医证型标准的建立提供客观依据。

1 资料与方法

1.1 数据提取 基于医院信息数据系统,提取2012年1月至2019年12月于河南中医药大学第一附属医院呼吸科住院的2 907例支气管扩张症患者的电子病历,利用人机协同表型谱标注系统对所需阳性症状及证候词条信息进行抽取[3]。

1.2 症状及证候术语规范 对症状及证候类数据的规范化替换、拆分主要参考《中医临床诊疗术语》[4]、《中医证候鉴别诊断学》[5]等。如“咳痰,色黄”规范为“咳黄痰”,“口、鼻、咽干燥”拆分为“口干,鼻干,咽干”,“形体消瘦”和“近期体质量下降”统一为“消瘦”,证型“痰浊壅肺证”“痰湿蕴肺证”统一规范为“痰湿阻肺证”。

1.3 统计学方法 使用频次描述统计规范化之后的临床常见证候分布情况;采用Lantern 5.0软件构建隐结构模型[6],应用爬山法(LTM-EAST)算法建立支气管扩张症隐结构模型,结合医学专业知识综合聚类并分析判断常见证型;运用SPSS 20.0软件,开展因子分析降维及系统聚类分析[7],用最大方差法得出旋转因子载荷矩阵,提取公因子,设置平方欧氏距离计算各类之间的距离,组间联接方法进行维度分类,进行系统聚类分析,结合树状图及专业知识推断出支气管扩张症的常见中医证型。

2 结果

2.1 2 907例支气管扩张症症状及证型分布情况 纳入的2 907份病例记录中涉及43个给定证候,其中频率大于5%的有痰热蕴肺证、痰湿阻肺证、肺气阴两虚证、痰瘀阻肺证、肺脾气虚证、肺肾气虚证,频次≥10次的证型见表1。涉及219个症状,其中频次>30次的症状有67个。见图1。

表1 支气管扩张症中医证型分布

2.2 症状隐结构模型分析

2.2.1 构建隐结构模型 应用Lantern 5.0软件,对频次>30次的症状,共计67个显变量(X1、X2、X3……X67)进行隐结构模型构建,得出23个隐变量(Y0、Y1、Y2……Y23),每个隐变量有2个到多个隐类,共54个隐类。见图1。

注:每条边的粗细显示两个节点之间的互信息大小,边越粗代表两节点关系越密切,括号内数值为隐类个数

2.2.2 综合聚类及模型诠释 在构建的隐结构模型基础上,依据医学专业知识,综合考虑某证候多个侧面信息,选取能反映其所有侧面的显变量,进行综合聚类及模型诠释,得到该证候的综合聚类模型。例如,隐结构模型图(见图1)中Y6中易感冒、乏力、面色白等,Y12中口渴、手足心热、胸痛,Y13自觉发热、口干、咽干,Y23自汗出、盗汗、腰痛,都与肺气阴两虚有关,因此对隐变量Y6、Y12、Y13、Y23进行综合聚类分析,结果见图2。对23个隐变量进行综合聚类后,得到8个聚类即推出8个证型(记为Z1、Z2……Z8),见表2。对其他综合聚类结果进行类似的诠释分析,得到Z1—Z8共8个综合聚类结果,具体对应证候见表2。

表2 隐结构综合聚类

图2 Z1综合聚类结果

模型诠释以Z1(肺气阴两虚证)为例,信息曲线图显示了累计信息覆盖达到95%的症状特征分布情况,从图3中可见咽干、口渴、口干、易感冒症状信息覆盖率已达到95%。类概率分布表中隐变量Z1把数据分为S0、S1两个隐类,其中S0占总人群的71%,S1占29%。每个症状有两种表现形式,其中S0列代表症状不出现的概率,S1列代表症状出现的概率,见表3。以Z1为例,S1类人群中咽干、口渴、口干、易感冒、自汗出、盗汗、手足心热症状出现的概率依次为0.8、0.63、0.81、0.78、0.54、0.16、0.10,而S0中出现上述症状的概率依次为0.08、0.03、0.13、0.17、0.15、0.01、0.07等,对比可知,症状在S1类人群中出现的概率较高,可认为是肺气阴两虚证的表现,S0则是没有肺气阴两虚证表现。

注:红色曲线表示各症状与Z1两两互信息(关联程度)高低;蓝色曲线表示各症状对Z1的互信息的累积覆盖度

表3 Z1(肺气阴两虚证)概率分布表

2.3 系统聚类分析 使用SPSS软件对频次大于60次的52个症状进行因子分析。首先,对各变量之间的相关性进行检测,检测结果KMO值为0.711,Bartlett的球形度检验对应的P值小于0.001,表示各变量不独立存在,相互之间有明显关联性,可进行因子分析,使用相关性矩阵方法分析,用最大方差法获得旋转因子载荷矩阵,最终提取18个公因子(记作F1、F2……F18),保留因子载荷系数≥0.3的变量。

对所提取的公因子进行系统聚类分析,并绘制聚类树状图(见图4),在选择阈值为12.5的情况下,得到10类变量组合(记为C1、C2……C10),根据各公因子所代表的症状(因子载荷系数≥0.3),结合专业知识,推导出10个证型,其中C1由公因子F6、F13、F15组成(阴虚内热兼血瘀证);C2由F4、F5、F7、F10、F18组成(肺脾气虚兼外感证);C3包括F16(痰热蕴肺证);C4包括F9(痰湿阻肺证);C5包括F1、F11(肺气阴两虚证);C6包括F8(兼证络伤咳血证);C7包括F2、F3(肺肾气虚证);C8包括F17(脾气虚证);C9包括F14(风热犯肺证);C10包括F12(阴虚肺热证)。见表4。

表4 因子分析与系统聚类分析结果

图4 聚类分析树状图

2.4 支气管扩张症中医常见证型 综合以上结果,痰热蕴肺证、痰湿阻肺证、肺气阴两虚证、肺脾气虚证、肺肾气虚证在隐结构及系统聚类结果中均出现,证型频次统计中占比也较高,而风热犯肺证、痰瘀阻肺证及阴虚肺热证在两种分析结果中出现,但证型频次占比相对较低。参考中医证型标准的制定原则,3种数据分析方法中重复出现至少2次的有痰热蕴肺证、痰湿阻肺证、风热犯肺证、痰瘀阻肺证、肺气阴两虚证、阴虚肺热证、肺脾气虚证、肺肾气虚证8个证型,可认为是支气管扩张症的临床常见中医证型,见表5。

表5 支气管扩张症常见证型及症状分布

3 讨论

中医证候数据具有非线性、复杂性、非定量性等特点[8],需运用与中医辨证理论相贴合的现代数据分析技术,从海量数据中发掘其中隐含的有意义的联系[9]。目前常用的证候数据分析方法可大致分为有监督和无监督数据分析方法两大类[10],不同的分析方法各有优缺点,为形成优势互补提高研究结果的可信度,本研究采用3种不同的数据分析方法,其中隐结构模型、系统聚类分析均属于无监督的分析方法,频数描述性分析属有监督的分析方法。隐结构模型基于证候数据的多维多阶性[11],为中医辨证建立的一种客观、定量的研究方法[12-13],本研究提取临床中真实的电子病历中记录的支气管扩张症症状(显变量),构建隐结构模型,结合专业知识综合聚类后,推出8个临床常见证型。总模型及各综合聚类模型的贝叶斯信息标准(BIC)评分均较好。本研究在进行因子分析及系统聚类时发现,若选取的症状频次过低,则因子分析时旋转成分矩阵无法收敛,或聚类树状图不能归纳出有实际意义的证型,当提取频次>60次的52个症状变量时,可得到较为理想的聚类结果,结合专业知识,进而推断出各聚类所代表的10个潜在证型。综合有监督学习方法中的频数描述分析结果最终推出支气管扩张症8个临床常见证型。

支气管扩张症病程长且病理改变不可逆转,临床表现为持续或反复性咳嗽、咳痰,或伴有痰中带血、咯血,在中医学中归属于“咳嗽”“咯血”“肺痈”“肺痿”范畴[14]。支气管扩张症多因禀赋不足、外邪侵袭、久病虚损、癥积阻塞,病性为本虚标实,急性发作期偏于邪实,慢性迁延期偏本虚,实邪为痰热、痰湿、瘀血,正虚多为气虚、阴虚、气阴两虚[15]。本研究总结出支气管扩张症8种常见证型,包括痰热蕴肺证、痰湿阻肺证、风热犯肺证、痰瘀阻肺证、肺气阴两虚证、阴虚肺热证、肺脾气虚证、肺肾气虚证,以上证型在既往文献研究中均有报道[16-19]。根据病程演变,本病初期因外邪侵袭肺卫、风热为主,内郁于肺,或肺脏蓄热,又受外风,热伤肺气,肺失宣降,临床可表现为风热犯肺证;急性发作期即感染期,总属邪热蕴肺,蒸液为痰,热毒浸淫及血,热伤血脉,血为之凝聚,临床表现为痰热蕴肺证、痰瘀阻肺证;缓解期以正虚或正虚邪恋为主,因病程迁延不愈,肺气损伤日久,累及脾土,脾为肺之母,子盗母气,导致肺脾气虚证;脾失运化,无以化生、疏布津液,聚生痰液,则见痰湿阻肺证;肺虚损日久,母病及子,累及肾脏,致肾不纳气,则可见肺肾气虚证;肺体受损,伤阴耗气,致肺气阴两虚,或阴虚生内热,或正虚邪恋,阴津已亏,邪热未去,则可见阴虚肺热证。

本研究尚存在两点需要注意的问题:一是由于医院系统原因未提取出舌脉信息,使证型症状描述不够全面;二是隐结构分析中某个综合隐类中会出现个别与整体证型不符合的症状[20],增加了模型解释的难度。如综合聚类C2中,反酸烧心、腰痛症状并不符合肺脾气虚兼外感证的特点,考虑以下几个原因:首先,研究数据来源于呼吸科住院患者出院诊断中存在“支气管扩张症”这一诊断的病历,且老年人居多,患者多存在合并病,混杂因素较多;其次,该病病机本虚标实,临床常见虚实夹杂之兼证,显现的症状亦会出现虚实夹杂的现象。

猜你喜欢
证型肺气证候
不稳定型心绞痛患者中医证型与血脂和炎症指标水平的相关性分析
萧山地区帕金森病睡眠障碍患者中医证候要素、复合证候及其危险因素研究
广泛性焦虑障碍中医证候、体质及其关系的研究进展
慢性阻塞性肺疾病中医证候研究综述
补肝汤治疗肝肾阴虚型慢性乙型肝炎效果分析及对患者中医证候积分的影响
基于数据挖掘的小儿肺炎中医辨证分型研究
人到中年补肺气
6种食物能补肺气
调肺气先要通鼻窍
养肺要避开六怕