刘方方,许玉龙△,段 涛,焦晓敏,马锦地,吕雅丽
(1.河南中医药大学信息技术学院,郑州 450046;2.河南中医药大学基础医学院,郑州 450046)
肺痿是一组以肺间质为主要病变部位的疾病,开始以咳嗽、胸闷、活动后呼吸困难为主要临床表现,部分患者病情逐渐加重,最终导致呼吸衰竭[1,2]。肺痿多以肺肾虚损为主,初起病位在肺,随病情进展可渐及脾肾[3]。中医药在治疗慢性肺系疾病方面呈现出较大的优势和特色,以中医文献和名老中医经验为背景,结合现代技术研究证候分类与诊断规则,对提高中医临床诊治水平具有重要意义[4-14]。贝叶斯分类属于有监督学习,是机器学习领域常用的算法[15,16],它假定所有属性变量均相互条件独立。相比其他方法,贝叶斯分类的最大特点是不需搜索,其算法的效率高、结果较好。现有研究成果表明,贝叶斯分类在中医冠心病临床诊断模型中具有良好的分类性能,有助于提高临床辨证能力及发现新的辨证要素[17]。本研究利用改进贝叶斯统计方法,从名老中医诊疗肺痿病的数据出发,对症状和证候信息进行学习挖掘,得到证候与主要症状的对应量化关系,初步建立基于名老中医经验的肺痿辨证诊断规则,可为传承名老中医辨证思想和建立肺痿的证候诊断标准提供参考。
资料文献数据来源于已建立的《现代名老中医肺病数据库》(名医年代为1911~2011年)和《期刊中医肺病数据库》(名医年代为 1989~2012年)[18]。
纳入文献包括1911年至1990年从事临床一线工作30年以上、著有肺系疾病相关著作或论文、具有一定学术影响力的名老中医诊治肺痿的相关文献; 1990年至2012年第一批至第四批国家中医药管理局全国名老中医药专家诊治肺痿的相关文献。
基于《现代名老中医肺病数据库》和《期刊中医肺病数据库》,采用计算机检索方法,检索关键词为“肺痿”,采用IBM SPSS 22.0软件建立《现代名老中医诊治肺痿文献研究数据库》。数据库包括病名、西医诊断、证候、症状(包括舌质、舌苔、脉象)等内容,然后从数据库中提出待分析数据表,数据表中包含症状和证候信息,其值为1或0,分别表示有或无该症状(证候)(图1)。数据共有鼻翼煽动、不能平卧、潮热、喘促、喘息、大便秘结、盗汗等88个症状,涉及表虚证、肺脾气虚证、肺气阴两虚证、肺热炽盛证、肺肾气虚证等25个证候。
图1 肺痿病数据库的局部样式
对88个症状出现频次进行统计分析(见表1),其中频次最高的症状为咳嗽、咳痰,频次为150,频次最低的症状为脉代、胖大舌等,频次为2。对25个证候出现频次进行统计(见图2)。
表1 肺痿病症状频次统计比较
图2 肺痿病的证候频次统计图
贝叶斯理论中,如果事件的结果不确定, 那么量化其唯一的方法就是事件的概率[19]。若历史实验中事件的出现率已知,根据数学方法可计算出未来事件出现的概率,贝叶斯定理用数学公式表达,即贝叶斯公式(Bayes Formula)[20]。贝叶斯公式假设实验E的样本空间为S, A为E的事件,B1, B2…Bn为S的一个划分,且P(Ai)>0, P(Bi)>0(i=1, 2…n),则式(1)即为贝叶斯公式:
(1)
虽然贝叶斯公式能够学习挖掘出数据的潜在规律,但常规方法处理时都是以概率方式呈现结果,症状与证候之间的影响程度不能量化体现,难以在临床实践中推广应用。因此需要改进贝叶斯统计方法对数据进行分析挖掘,将证候与症状之间的影响程度进行量化展示。
改进的贝叶斯统计方法基本思路为所有证候,统计证候为1情况下,症状分别为1或0时的个数,即计算证候存在时症状出现或不出现的概率值;类似的统计证候为0情况下,症状分别为1或0时的个数,计算对应的2个概率值。根据上述4个概率值,利用对数比值比和贝叶斯概念,计算每个证候的阈值和对应的症状分值。基于贝叶斯统计的阈值和症状分值[5,12]计算方法见式(2)和式(3)。
症状分值的计算:
(2)
证候阈值的计算:
(3)
在式2和式3中,Z代表证候,~s含义是证候为0,Xi代表症状。上述公式中,症状分值的含义是:某症状在具有证候的人群中出现概率越高,同时该症状在不具有证候的人群中出现概率越低,那么该症状分值就会越大,即症状对证候的影响越大。由上可知,整个公式能够较好地量化反映症状对证候的影响程度。
基于上述改进的贝叶斯统计分析名老中医治疗肺痿的辨证规律,共统计出25个证候和88个症状。根据统计学常识,频次小于等于5时不具有统计学意义,所以在后续分析时对图2中频次小于5的证候不做考虑,分别为痰浊蕴肺、风寒袭肺、热毒闭肺、心肾阳虚、风热犯肺、脾肾阳虚、脾胃气虚、脾虚湿困、肺肾气虚共9个证候。对表1中频次小于等于5的症状也不做考虑,分别为鼻翼煽动、面色晦暗、手足冷、痰少、咽痛、绛舌、燥苔、脉微、脉大、恶风、面色红、痰白、小便数、遗尿、爪甲色紫、花剥苔、滑苔、灰黑苔、脉洪、裂纹舌、胖大舌、脉代、脉疾、脉结、脉芤共25个症状。
所以,后续研究分析的对象为63个症状和16个证候,其中证候包括虚证(表虚证、肺脾气虚证、肺肾阴虚证、肺胃阴虚证、肺阳虚证、肺阴虚证、阳虚证、阴阳两虚证、肺气虚证、肺气阴两虚证)、实证(肺热炽盛证、痰热壅肺证、痰瘀阻肺证、瘀阻肺络证)及虚实夹杂证(阳虚水泛证、阴虚肺燥证)。
对上述符合条件的16个证候进行改进贝叶斯统计挖掘,得到其辨证规则即名老中医治疗肺痿病证候辨证经验。规则包括证候阈值和症状分值,为便于描述,将得到的阈值归一化为10,症状分值按比例缩放,缩放后最大不超过10,分值的大小表示对证候辨识影响的强弱。将症状分值从大至小排序后,取每个证候对应分值高的前10个症状作为辨证规则(见表2至表11),这些症状及分值即是挖掘出名老中医肺痿辨证经验的量化体现。辨证规则的使用方法为若患者具有症状的累计总得分大于证候阈值10,则判定为该证候存在,否则判定该证候不存在。
表2示,表虚证规则以自汗分值最高为10,其余主要症状分值分别为神疲5.89,恶寒3.4,头痛4.77,乏力2.46,纳呆2.34,盗汗2.17。表虚卫表不固、腠理开合失司而见自汗,为表虚证最为常见的症状。表虚则卫外御邪功能减退易感受外邪,可见恶风、恶寒、头痛之症,兼见浮脉;表虚总属气虚,可表现为神疲、乏力、纳呆、淡白舌;表虚自汗、津液外泄耗伤阴液亦可伴见盗汗症状。
表2 表虚证辨证规则 表3 肺脾气虚证辨证规则
表3示,肺脾气虚证规则显示,下肢浮肿症状分值7.08,其余主要症状分值为畏寒5.8,喘促4.13,食少3.32,头晕3.16。肺、脾、肾三脏共同调控水液代谢,肺脾气虚则津液不布而见下肢浮肿;肺主呼吸,肺主气失司而见喘促,喉为肺之门户,肺气虚弱可见音哑;脾主运化为气血生化之源,脾气虚则运化无力而见食少、纳呆、头晕等症。此外,规则中有脉濡症状,提示肺脾气虚可兼阳虚或兼有实热。
表4 肺阴虚证辨证规则 表5 肺气虚证辨证规则
表6、7为阴虚类证候辨证规则,分别为肺肾阴虚证、肺胃阴虚证。以肺肾阴虚证为例,肺肾阴虚则阴液不足、濡润失常或阴虚而热,症见发热、呛咳、盗汗、大便秘结、口渴,肺肾阴虚累及脾胃亦可见纳呆之症。主要症状分值为呛咳3.98,盗汗3.58,发热2.88,大便秘结2.66等。
表6 肺肾阴虚证辨证规则 表7 肺胃阴虚证辨证规则
肺阳的内涵为防御、固摄、温煦功能,其外延为实卫固表、通调水道功能。《金匮要略·肺痿肺痈咳嗽上气病脉证治》中提到:“吐涎沫而不咳者,其人不渴,必遗尿,小便数,所以然者,以上虚不能制下故也。此为肺中冷,必眩,多涎唾。[21]”《中医藏象学》中指出,肺阳虚的基本症状有咳喘无力、咳吐涎沫、面色白、形寒肢冷、自汗易感、神疲少气、苔白滑润、脉迟缓。表8为肺阳虚证辨证规则,主要症状分值为咳吐涎沫7.43、畏寒4.8、口渴3.47、脉虚3.45、头晕3.11、痰多2.26、白苔1.6等,符合相关中医理论。
表8 肺阳虚证辨证规则 表9 阳虚证辨证规则
表10、11分别为肺热炽盛证、痰热壅肺证辨证规则,属里实证范畴。表10以肺热炽盛证为例,主要症状分值为口渴3.51,喘促3.12,无苔3.04,红舌2.19,咳痰1.49,纳呆0.96等。肺有实热而见喘促、咳痰,面色红、红舌均为热象,热耗津液而见口渴,肺热炽盛伤及脾胃亦可兼见纳呆。上述中医理论分析与所得规则的症状分值基本一致。
表10 肺热炽盛证辨证规则 表11 痰热壅肺证辨证规则
表11为痰热壅肺证辨证规则,其主要症状分值为脉滑4.8,食少4.76,黄苔4.41,大便秘结3.1,腻苔3,头痛2.92,咳痰2.85,痰多2.7。痰热壅肺则气滞不通,肺失宣肃则见咳痰、痰多,因痰热内盛故舌苔黄腻而饮水不多。黄苔、苔腻、大便秘结、口渴提示实热。此外,肺病及脾可兼见食少、脉濡,实热内盛亦可见头痛,得到的规则结果与中医理论相符。
表12、13为痰瘀阻肺证、瘀阻肺络证辨证规则,都属于实证。痰瘀阻肺一般为瘀血痰浊蕴阻于肺,以咳嗽气喘、咳痰或痰中带血、舌淡紫、苔腻、脉弦滑或弦涩等为常见症状。得到规则的症状分值中,脉涩4.32、舌生瘀斑3.94、紫暗舌3.3、苔腻2.1等均为痰瘀的表现。瘀阻肺络证多表现为瘀血阻滞、肺络不畅,以咳嗽不畅、胸闷气憋、胸痛有定处,如锥如刺或痰血暗红、口唇紫暗、舌暗或有瘀斑、苔薄、脉细弦或细涩等为常见症状。得到表13的辨证规则中,喘息3.5,胸闷2.29,紫暗舌1.58,胸痛1.54都为瘀阻经络不通则痛的症状表现,说明瘀阻较为严重。
表12 痰瘀阻肺证辨证规则 表13 瘀阻肺络证辨证规则
表14、15为虚实夹杂类辨证规则,分别是阳虚水泛证和阴虚肺燥证。以阳虚水泛证为例,可见脉沉、白苔、淡白舌、脉弱。阳虚津液不归正化则见下肢浮肿、头晕、滑苔、润苔,水凌心肺而见心悸、面色晦暗。得到的症状分值为脉沉3.68,白苔3.54,头晕3.34,润苔2.81,淡白舌2.86,心悸2.36,脉弱2.04,下肢浮肿1.78,与中医理论相符。
表14 阳虚水泛证辨证规则 表15 阴虚肺燥证辨证规则
表16、17分别为肺气阴两虚证、阴阳两虚证辨证规则。以阴阳两虚为例,该证可见于多种疾病的后期,并多以脏腑病变为基础,故阴阳两虚证常表现为某些脏腑的阴虚阳虚,常见症状有形体羸弱、精神萎顿、少气懒言、形寒肢冷、舌淡而少津,或光剥、脉微细而数。该证服温热药则阴虚症状明显,服苦寒药则阳虚症状加甚,症状复杂而易变。得到的辨证规则中,主要症状五心烦热4.69、烦躁3.58、汗出3.4、心悸2.48等均为阴虚表现,与中医理论基本一致。
表16 肺气阴两虚证辨证规则 表17 阴阳两虚证辨证规则
为验证挖掘得到规则的正确性,使用原始数据对得到的辨证规则进行测试。若患者具有症状的累计总得分大于阈值10,则判定该证候存在,否则判定该证候不存在。图3示,采用机器学习中常见的准确率指标进行评价,准确率最高的规则是肺热炽盛证,准确率为98.54%,最低的是肺阴虚证,准确率为87.38%,所有辨证规则的平均准确率为94.49%。
图3 挖掘得到规则的辨证准确率
本文基于改进贝叶斯统计方法,从名老中医治疗肺痿患者的症状和证候数据出发,挖掘症状与证候之间的潜在关系,利用对数比值和贝叶斯概率计算症状分值和证候阈值,揭示症状与证候的关系,量化症状对证候辨证的贡献程度,并以辨证规则的形式展现,从而挖掘出名老中医治疗肺痿病的辨证经验。
对前文挖掘到每个证候的辨证规则进行中医知识诠释,发现所有结果基本符合中医理论,如肺痿的辨证论治在教材与专著中常以虚实寒热为纲,包括虚热证、虚寒证等。在肺痿病慢性动态发展过程中,病位可由肺及脾、胃、肾、心,病机亦可因虚致实而见痰热壅肺证、痰瘀阻肺证等。从得到辨证规则中症状的分值来看,大都与中医理论一致。如表虚证,主要症状分值从高至低依次为自汗、神疲、恶寒、乏力、盗汗等;阴虚类以肺肾阴虚证为例,症状分值从高至低依次为呛咳、盗汗、发热、纳呆等。实证类痰瘀阻肺证得到的症状分值从高至低为脉涩、舌生瘀斑、紫暗舌、苔腻等均为痰瘀的表现。瘀阻肺络证多以咳嗽不畅,胸闷气憋,胸痛有定处,如锥如刺,或痰血暗红、口唇紫暗、舌暗或有瘀斑、苔薄、脉细弦或细涩等为常见症状,在得到的规则表中,喘息3.5,胸闷2.29,胸痛1.54,头痛3.5,都为瘀阻经络不通则痛的症状表现,说明患者瘀阻情况较为严重。
然而,在得到的辨证规则中也出现了与中医理论不相符的情况,原因是分析的数据量偏小,患者在真实世界中存在证候、症状兼夹的现象。如肺气阴两虚证,其常见症状有神疲乏力、气短、动则加重,平素畏风寒,或易感冒、自汗或盗汗,手足心热,口干甚至口渴,舌体胖大甚至边有齿痕,或舌体瘦小,或舌质淡或红,或舌苔薄少或花剥,或脉沉细或细数等。得到规则的主要症状为食少、无苔、潮热、脉缓、口苦口干、五心烦热。肺阴不足、阴不制阳则见潮热、口干、五心烦热,气阴不足舌苔无以化生而见无苔,气虚推动血行无力而见脉缓,与中医理论一致。但得到的规则中分值最高的症状为食少,可能提示肺气阴两虚证常兼脾胃虚弱,原因为肺脾两脏共同参与气的生成,在生理与病理上密切相关。此外,口苦常见于实热证,在此处可能提示肺气阴两虚证可兼有实热,如心火上炎、肝火上炎等。
使用原始数据对得到的辨证规则进行测试,发现所有辨证规则的平均准确率为94.49%,可知使用改进贝叶斯统计方法挖掘得到名老中医诊疗肺痿病的辨证规则,能够较好地反映数据的内在关系,将名老中医的辨证思想相对准确地进行量化展示。
本研究采用统计分析、改进贝叶斯统计得到的辨证规则绝大部分与中医理论吻合,能够反映出名老中医治疗肺痿病辨证分型的经验,可为名老中医经验的传承和肺痿中医证候诊断标准提供参考。研究的局限性在于数据库样本量小,如某些证候存在的条目在10例以下,统计学意义较低,使得到规则的精确率和召回率较低。另外患者在真实世界中存在证候、症状兼夹情况,也会影响规则的可靠度。中医证候诊断标准的建立需要大量的准确数据支撑,目前的样本大部分来自于名老中医文献数据库,后期将增加名老中医的实际病案诊疗数据,完善数据库和相关方法,为更好地传承名老中医经验和建立肺痿病中医证候诊断标准提供支持。