刘 超,陈恒文,刘兰椿,白 京,王 阶**
(1. 北京中医药大学研究生院 北京 100029;2. 中国中医科学院广安门医院 北京 100053;3. 陕西中医药大学第一临床医学院 咸阳 712046)
冠心病严重威胁人类健康,已经成为全球重大公共卫生问题。冠心病多发生于中老年人群,根据团队前期的研究发现[1-3],冠心病患者多在血瘀证的基础上兼有腰膝酸软、头晕耳鸣和健忘等症状,出现“阳微阴弦”肾虚血瘀的临床表现,通过补肾活血的治疗方法,可以明显改善患者症状,提高临床疗效。然而,目前关于不稳定型心绞痛(Unstable angina,UA)肾虚血瘀证患者中医证候特征的研究相对较少,缺乏对肾虚血瘀型UA 中医病机的全面认识,限制了中医药在临床中的应用。中医证候客观化研究一直是中医药领域研究的热点,近年来多种数据挖掘技术,如:人工神经网络、决策树、Logistic 回归、贝叶斯网络等多种算法广泛应用在中医证候客观化的研究当中[4]。但不同算法之间优势各异,适用的数据类型也有所差别,如何从众多统计方法中遴选出一种最优算法,并形成灵敏度高、特异性强的中医辨证依据,是实现中医证候诊断定量化和标准化的关键。因此,本研究拟通过对基于多种算法构建的UA 肾虚血瘀证诊断模型的研究,形成一个准确率高且符合临床实际的中医辨证诊断模型,并为进一步规范UA 肾虚血瘀证中医证候诊断标准提供客观依据。
研究病例来自2018年1月-2018年12月在首都医科大学附属北京安贞医院、中国中医科学院广安门医院、新乡医学院第一附属医院和云南省中医院经冠脉造影确诊的199 例UA 患者。西医诊断标准参照2014年美国心脏协会/美国心脏病学会制定的非ST段抬高型急性冠脉综合征指南[5];中医肾虚血瘀证诊断标准参照中华中医药学会心血管病分会2018年颁布的《冠心病心绞痛主要证型的诊断标准》[6]。本试验已取得中国中医科学院广安门医院伦理委员会批准(伦理编号:2017-058-KY-01)。
纳入标准:符合上述诊断标准;年龄大于18岁;自愿参加本研究并签署知情同意书。排除标准:近1 周内有急性感染、创伤、烧伤和手术史的患者;高血压控制不良、严重室性心律失常、Ⅲ度房室传导阻滞的患者;经检查证实为其它心脏疾病、重度神经官能症、颈椎病、甲亢、更年期症候群、胆心病、胃及食管反流等所致的胸痛者;慢性阻塞性肺疾病急性加重期和呼吸衰竭的患者;合并肝、肾、造血系统严重原发性疾病的患者;合并精神病或智力障碍的患者;妊娠或哺乳期妇女。
根据调查内容和研究目的,设计《冠心病不稳定型心绞痛肾虚血瘀证患者临床信息调查表》,主要内容包括:患者基本资料、既往史、生命体征、肾功能、血脂、心电图、冠脉造影结果、中医四诊信息、GRACE 评分和Gensini积分。对符合纳入标准的患者在入院24 h内进行信息采集,并于48 h 内行冠脉造影术,记录冠脉造影结果。中医证候由至少3名副主任医师及以上职称的临床医生进行判定。数据采用双人双机的录入方法,用EXCEL建立数据库。
试验开始前,对多中心调查者进行集中或网络在线培训,明确本试验的目的、方法、流程以及问卷调查填写标准;试验中,严格执行诊断及纳入、排除标准,采取统一规范的信息采集标准,尽量减少选择偏倚和信息偏倚;同时,运用内部检查和外部监查的方式,对多中心实施不定期现场或电话监查,及时发现和解决问题,以确保调查结果的真实、可靠。
表1 UA肾虚血瘀证与非肾虚血瘀证患者一般资料比较
采用SPSS 20.0软件对数据进行统计学分析,计量资料采用t检验或非参数检验,计数资料采用Χ2检验,以P<0.05为差异有统计学意义。将具有统计学意义的临床指标及中医四诊信息作为自变量,以“肾虚血瘀证”作为因变量,运用SPSS Modeler 18.0软件中的反向传播(Back-propagation,BP)神经网络、径向基函数(Radial basis function,RBF)神经网络、C5.0 决策树、分类回归树(Classification and Regression Tree,C&RT)决策树、卡方自动交互检测法(Chi-squared Automatic Interaction Detector,CHAID)决策树、随机森林、逐步Logistic 回归和贝叶斯网络8种算法构建UA 肾虚血瘀证诊断模型,随机抽取数据库中50%数据作为训练集以构建模型,另外50%数据作为测试集以验证模型的准确性,反复验证达到较稳定状态,进而输出最佳诊断模型。同时计算模型的受试者工作特征(Receiver operating characteristic,ROC)曲线下面积(Area under the curve,AUC)以评估模型优劣。
经临床辨证,199例UA 患者中肾虚血瘀证患者有145例(72.86%),非肾虚血瘀证患者有54例(27.14%)。两组患者在性别、年龄、身高、体重和吸烟时长方面差异有统计学意义(P<0.05或P<0.01)(表1)。
通过对患者中医四诊信息的收集发现,两组患者共有23个项目存在差异,UA肾虚血瘀证患者较UA非肾虚血瘀证患者多见胸痛、健忘、乏力、心烦易怒、自汗、失眠、口干口渴、腰膝酸软、口苦、耳鸣、口唇紫暗、畏寒、夜尿多、齿松、肢体麻木、耳聋、盗汗、腰冷、黯红舌、口黏腻和渴不欲饮,而少见淡红舌和胖大舌,且组间差异有统计学意义(P<0.05或P<0.01)(表2)。
表2 UA肾虚血瘀证与非肾虚血瘀证患者中医四诊信息差异
UA肾虚血瘀证患者在收缩压和GRACE评分上与UA非肾虚血瘀证患者存在差异,且差异有统计学意义(P<0.05 或P<0.01);在舒张压、心率、肌酐、尿素、总胆固醇、甘油三酯、高密度脂蛋白、低密度脂蛋白、ST段压低大于0.5 mv、冠脉狭窄程度、冠脉病变支数和Gensini积分方面不存在显著性差异(P>0.05)(表3)。
表3 UA肾虚血瘀证与非肾虚血瘀证患者客观指标差异
将上述30 个具有显著差异的中西医资料(P<0.05)作为自变量,构建基于8种算法的UA 肾虚血瘀证诊断模型。研究发现基于BP 神经网络构建的诊断模型较其它算法整体性能更优,其训练集的准确率、灵敏度和特异度分别为96.33%、96.39%和96.15%,ROC 曲线下面积为0.993;测试集的准确率、灵敏度和特异度分别为94.44%、98.39%和85.71%,ROC 曲线下面积为0.967。BP 神经网络对UA 肾虚血瘀证具有良好的辨识能力(表4)。
表4 基于多种算法构建的UA肾虚血瘀证诊断模型的比较
UA 肾虚血瘀证BP 神经网络诊断模型由3 层结构组成,包括了含30个自变量的输入层、3个隐节点的隐藏层,以及1个结局指标的输出层(图1)。在模型构建中贡献度前10 的指标为年龄(0.0894)>腰膝酸软(0.0737)>夜尿多(0.0717)>胖大舌(0.0693)>GRACE评分(0.0692)>收缩压(0.0663)>口唇紫暗(0.0482)>齿松(0.0453)>失眠(0.0450)>健忘(0.0399)(表5)。UA 肾虚血瘀证与年龄、GRACE 评分和收缩压密切相关,常见腰膝酸软、夜尿多、口唇紫暗、齿松、失眠和健忘等症状,而较少出现胖大舌。
图1 UA肾虚血瘀证3层BP神经网络模型
表5 BP神经网络诊断模型中贡献度前10的自变量
中医证候具有复杂性、非线性和非定量性的特点,如何实现中医证候的客观化和标准化一直是中医证候研究的热点,而方法学一直是限制其发展的最大瓶颈。随着大数据、人工智能时代的来临,多种数据挖掘算法如人工神经网络、决策树、Logistic 回归等广泛应用在中医证候的客观化研究当中,形成了中医智能辨证诊断模型,可有效对中医证候进行分类预测,并获得与之相关的预测因子,构建起现代病理生理与中医病因病机之间的联系,一定程度上为中医证候客观化研究提供了新的策略[7-9]。然而不同算法之间各有优势,适用的数据类型也有所差别,面对复杂的临床资料信息时,若仅采用单一的算法进行模型构建,往往会造成偏倚的产生,影响结果的可信度。只有通过对不同算法构建的模型进行比较,才能寻找到最佳诊断模型,这样不仅能够降低因单一统计方法而造成的系统误差,还能够排除混杂因素的干扰,使结果更加接近中医证候的本质。本研究通过对8种算法构建的UA 肾虚血瘀证诊断模型性能的比较发现,BP 神经网络构建的中医辨证诊断模型在准确率、灵敏度和特异度上均优于其它算法,可较好地识别UA 肾虚血瘀证,形成较为准确的中医辨证依据。
人工神经网络是一种模拟人脑神经网络结构和功能对数据进行分析和处理的数据挖掘方法,可从一组无秩序、无规则的数据中推演出一套分类规则,实现对研究对象的正确分类和精准预测[10]。本研究中构建模型性能较好的BP 神经网络算法是人工神经网络中的经典算法之一,它是建立在梯度下降算法基础上的多层神经网络,由输入层、隐藏层和输出层组成,层与层之间通过Sigmod 函数连接,通过从后向前逐层把误差反向传播到上一层,并不断对链接权重进行调整,建立起输入与输出间的非线性映射关系,进而达到对结局指标的精准预测[11]。BP 神经网络具有高度的并行性、良好的容错性以及强大地处理非线性问题的能力[12],不仅能够对中医证候中所蕴藏的大量信息进行充分识别,从中提取出证候特征的规律,建立起中医证候与外在客观指标间的非线性映射关系,而且还能够以其强大的自学习、自组织和自适应能力加强对边缘模糊病例的辨识,提高中医证候的诊断效率,使结果更加接近中医证候的真实面貌[13]。
既往研究也发现BP 神经网络较其它算法具有一定的优势。传统的Logistic回归仅限于线性可分问题,对于线性不可分问题,BP 神经网络明显优于Logistic回归[14]。另外,BP 神经网络应用比较灵活,对数据的要求也较传统方法低,分析过程中可利用大量的参数解释变量间复杂的非线性关系,从而构建准确率较高的诊断模型[15]。此外,有研究也发现BP 神经网络在对大肠癌虚实证型的分类处理上性能要优于决策树模型,且更适合于中医证候中非线性映射关系的处理[16]。同样,通过BP 神经网络建立的食管癌预测模型,较C5.0 决策树和Logistic 回归,有更好的预测效果,模型ROC 曲线下面积也最大,且各曲线下面积差异有统计学意义[17]。然而,并不是所有情况下BP 神经网络算法都是最优的,基于RBF 神经网络建立的高血压病阴阳两虚证诊断模型就优于BP 神经网络,并且其模型结构简单、收敛速度快[18]。因而,在面对不同类型的临床资料时,只有通过对不同算法构建的模型进行比较,才能寻找到符合该类研究的最佳诊断模型,得出的结果才更加可靠。
本研究通过BP 神经网络不仅发现了对诊断UA肾虚血瘀证重要的症状体征,如腰膝酸软、夜尿多、口唇紫暗、齿松、失眠和健忘等,还发现UA 肾虚血瘀证与患者年龄、收缩压以及GRACE 评分密切相关。年龄是BP 神经网络中贡献度最高的因子。冠心病多发生于40 岁以上的中老年人群,随着年龄的增长,肾气逐渐衰退,《素问·阴阳应象大论》云:“年四十,而阴气自半也”“年六十,阴痿,气大衰,九窍不利,下虚上实”,说明人到老年则肾之阴阳不足。肾阳虚则心阳不振而阴寒内生,寒凝则血瘀,血运不畅,不通则痛;肾阴精不足,则心之阴血内耗,阴血亏虚不能滋养心脉,心脉失养发生胸痛,不容则痛,故《素问·藏气法时论》道:“肾病者……虚则胸中痛”,《景岳全书》又说到:“凡房劳过度,肾虚羸弱之人,多有胸胁间隐隐作痛”。同时,血液运行又必须依靠肾阳的蒸动,心阳才能推动血液正常运行,若命门火衰则心失于温运,致心阳不足而“无力行舟”,留而为瘀,《医林改错》云:“元气既虚,必不能达于血管,血管无气,必停留而为瘀”。此外,研究还发现随着年龄的增长,老年患者会从生理和病理上表现出肾虚血瘀的基本改变[19]。可见,年龄因素可能是UA 患者出现肾虚血瘀证的重要原因。
此外,收缩压的高低也是诊断UA 肾虚血瘀证的重要因子。既往临床研究发现单纯性收缩期高血压是老年人常见病,多与肾虚血瘀、阴虚阳亢相关[20]。现代研究也证实,肾虚会导致患者大动脉弹性功能的下降,表现出早期的动脉硬化,而大动脉血管的老化会直接导致收缩期血压的升高[21],正如“髓海不足,则脑转耳鸣,胫酸眩冒”中的描述。同样,血瘀亦是高血压产生的关键因素。血瘀证在微观上会表现出血流变学改变、微循环障碍、血小板功能异常以及内皮功能的损害,使血液处于浓、粘、凝、聚的状态,这些异常改变会导致血压的升高[22-24],故《仁斋直指方论》道:“瘀滞不行,皆能眩晕”。因此,高血压可能是UA 肾虚血瘀证发生的危险因素之一。
再者,GRACE 评分对UA 肾虚血瘀证的诊断也较为重要。GRACE评分由心功能Killip分级、收缩压、心率、年龄、肌酐、院前心脏骤停、ST 段下移和心肌酶升高组成[25,26],可较好地预测患者住院期间以及6个月内不良心血管事件的发生率,GRACE 评分越高,死亡风险越大,中危、高危患者死亡率分别是低危患者的2倍和12倍[27]。既往研究证实,GRACE评分与肾虚证高度相关,肾虚型UA 患者往往具有较高的风险,更容易出现心血管不良事件[28]。同时,血瘀证在GRACE 评分的高危组中也最为常见(90.5%),当患者出现血瘀+阳虚+痰浊偏寒证时,其6个月内发生全因死亡事件的可能性相对较高[29]。因而,当UA 患者GRACE 评分较高时,其属于肾虚血瘀证的可能性也较大,临床预后也相对不良。
综上所述,本研究通过对多种算法构建的中医辨证模型的比较,初步形成了准确率较高且符合临床实际的UA 肾虚血瘀证BP 神经网络辨证诊断模型,为UA 肾虚血瘀证的中医证候诊断提供了客观依据。但由于本研究所涉及的样本量有限,检测的生物学指标相对较少,未能对UA 肾虚血瘀证的“微观辨证”提供更多的数据支持。同时,不同算法之间并没有优劣之分,只是适用的条件不同,虽然本研究中基于BP 神经网络构建的模型效果最优,但其能否很好地应用于其它中医证候类型的辨识中,还有待进一步验证。因此,在分析不同临床数据时,应采用多种算法进行比较,并根据其数据特点,选取最合适的算法,以构建准确性相对较高的诊断模型。