数据挖掘分析名老中医治疗冠心病心绞痛研究概述

2020-11-16 10:23王子焱王荣佘瑞宁代璐范金茹
中国中医药信息杂志 2020年10期
关键词:老中医医案数据挖掘

王子焱,王荣,佘瑞宁,代璐,范金茹

数据挖掘分析名老中医治疗冠心病心绞痛研究概述

王子焱,王荣,佘瑞宁,代璐,范金茹

湖南中医药大学第一附属医院,湖南 长沙 410007

通过数据挖掘技术挖掘名老中医诊疗冠心病心绞痛临证经验,发现其中隐性知识,对提升冠心病心绞痛诊疗水平具有重要意义。本文从数据挖掘技术运用现状、在传承名老中医诊疗经验中的运用、存在问题、措施及展望4个方面进行综述,并提出由专业人员规范数据,引入全新数据挖掘方式及借助人工智能技术等方式进行数据挖掘,为进一步传承名老中医学术思想传承发展提供一定参考。

冠心病心绞痛;名老中医;数据挖掘;综述

名老中医是中医学术造诣最深、临床水平最高的群体,是将中医理论、前人经验与当今临床实践相结合的典范。总结和传播名老中医临床经验、用药规律和学术思想是传承工作中的重要一环,亦是中医药创新发展的新思路。冠心病是临床的常见疾病,严重危害人民生命健康安全[1]。中医药治疗该病具有独特优势,临床疗效肯定[2],因此,加强对中医药诊疗冠心病研究具有重要意义。数据挖掘是建立在数据库基础上通过统计学、机器学习等方法探索隐含的、未知的、有潜在应用价值规律的过程,即数据库知识发现中的分析过程。数据挖掘在现代信息处理中运用广泛,采用数据挖掘技术对名老中医学术思想和临证经验进行研究,能解析其诊疗规律,提炼出临证经验中蕴藏的独到理论、方法,有助于实现名医经验的有效总结与传承[3]。

1 数据挖掘技术运用现状

辨证论治具有模糊性、主观性,导致中医医案中大多数要素也具有模糊性、主观性、高维度的特征[4],数据挖掘处理这一类信息具有优势。通过建立大样本数据库,使用数据挖掘技术进行统计分析,不仅能整理分析中医医案数据,更重要的是使中医医案数据中的隐性知识显性化。目前可查到最早将数据挖掘运用于中医药领域的为“神经元网络模型及其在中医诊断方面的应用”一文[5]。经不断发展,目前中医数据挖掘其以传统中医典籍、现代中医文献、典籍或名老中医验案为蓝本,进行标准化、结构化处理数据后,运用描述性分析、监督学习方法(多元线性回归分析、贝叶斯网络、判别分析、人工神经网络、Logistic回归分析、决策树等)、无监督学习方法(聚类分析、关联规则、主成分分析、因子分析等)等多种数据挖掘手段[6]。目前数据挖掘软件有中医传承辅助系统、中医临床科研信息共享系统、古今医案云平台、中医诊疗大数据智能分析系统,且这些软件运用前文所述的数据挖掘方式在现代中医数据挖掘中取得了丰硕的成果。

2 数据挖掘在传承名老中医诊疗经验中的运用

中医药对冠心病心绞痛的防治具有理想疗效,并在缓解临床症状、延缓疾病进展、改善预后方面具有独特优势。吴荣等[7]最早对名老专家冠心病诊疗规律进行总结,此后对于名老中医诊疗冠心病心绞痛的数据挖掘文献报道逐渐增多。在大数据时代下,收录名老中医临证诊疗数据,如医案、医论,构建以名老中医学术思想为基础的中医临床数据库,并采用数据挖掘方法进行分析,探析疾病症状、证候、方药之间的内在联系和规律,使其中的隐性知识得以显性表达,并让名老中医长期积累的临证经验从个体化、垄断化转变为群体性和全球性[8],深度探析名老中医预防治疗冠心病心绞痛遣方用药规律,丰富和发展现有中医药防治冠心病心绞痛的共识,使优秀的临床理论内涵和学术思想推广至国内外,对提升中医药从业者临床诊疗水平具有重要意义。

2.1 频数分析

频数统计是最为简单、基础的统计学方法,在最初的医案分析统计中起到非常重要的作用,可直观地看出频数分布、集中趋势、离散趋势等。

任毅等[9]以中国万方医学网、维普医药信息资源系统、中国知网和《当代名老中医典型医案集》中的386则医案为数据源,按照统一标准处理后录入数据库,采用频数分析等方法分析当代名老中医治疗冠心病用药规律。发现丹参、川芎、瓜蒌、半夏、当归、茯苓、黄芪、人参、薤白和麦冬是名老中医治疗冠心病使用频率最高的前10味药,频数分析结果显示名老中医治疗冠心病主要治法的用药思路是益气活血化痰。

李洁[10]利用中医传承辅助系统(V2.5)软件分析国医大师刘志明治疗冠心病处方用药规律,共纳入处方282首,用药频次分析显示刘老诊疗冠心病以补肾药(桑椹、制何首乌)、活血药(三七、丹参)、通阳药(瓜蒌、薤白)为主;药物四气五味频次分析显示甘味药居多,其次为苦、酸味,咸味最少;药物归经分析显示脾、肺、肝、心、肾经药物比较常见。

2.2 关联分析

关联分析是一种简单、实用的分析技术,在信息载体中查找存在于项目集合、对象集合之间的频繁模式、关联、相关性或因果结构,从大量数据中发现2个或多个变量之间的相关联系。

庄逸洋等[11]应用中医传承辅助平台(V2.5)软件,挖掘国医大师邓铁涛治疗冠心病用药规律,共纳入处方192首,使用药物使用频次、组方规律分析、新方分析,挖掘出16个核心组合和8个新方,发现邓铁涛教授治疗冠心病多用益气除痰化瘀之品,与其“心脾相关”“痰瘀相关”的学术思想及“调脾护心”的治疗方法相应。

范金茹等[12]运用Weka3.6软件,挖掘全国名中医王行宽肝心同治胸痹心痛用药规律,对医案中出现的药味进行描述性统计,采用Apriori算法对药味进行关联分析,表明王行宽教授论治胸痹心痛时,“通”予丹参、薤白、三七、柴胡、郁金、瓜蒌皮、法半夏等,“补”予白参、麦冬、白芍、茯神、炙远志、黄芪、茯苓等;可信度≥0.90药味关联多为丹参或柴胡与补气阴药、豁痰化瘀药之间的配伍;可信度≥0.65同类药味关联中,治心常用白参、五味子、白芍配麦冬,法半夏、黄连配瓜蒌皮等,治肝常予郁金配柴胡,天麻、蒺藜配钩藤、石决明等。研究表明,“肝心同治、通补兼施、用药平和”乃王老临床辨治胸痹心痛的用药规律。

2.3 聚类分析

聚类分析是依据研究对象的特征对其进行分类,减少研究对象数目的方法,可作为一个独立的工具获得数据的分布状况,也可作为其他算法的预处理步骤。

薄荣强等[13]运用SPSS20.0及Clementine12.0软件,使用频数统计、关联规则(Aprioi算法)、聚类分析(Ward法)对首批国医大师治疗冠心病用药规律进行挖掘,共纳入100则医案,确定高频中药42味、高频四诊信息20个,确定高频药物性味与归经,药物之间或药物与病机、四诊信息之间的关联规则系统聚类6个,总结出通补兼施、痰瘀并治、心脾并重的用药特点。李施新等[14]收集全国名老中医治疗冠心病医案,基于中医传承辅助系统软件,采用复杂系统熵聚类演化出3味药核心组合,运用无监督熵层次聚类算法得到7个新方,反映名老中医在治疗冠心病上重视活血化瘀、益气养阴的普遍规律。

2.4 回归分析

回归分析是指确定2个或2个以上变量间相互依赖的定量关系的一种统计方法,可表明自变量和因变量间的显著关系,还可表明多个自变量对1个因变量的影响强度,可实现预测事物发展趋势。主要回归分析方法包括线性回归、非线性回归、Logistic回归、回归树、人工神经网络等。

毕文霞[15]通过分析626则20世纪80年代后名老中医治疗冠心病的验案,利用Logistic回归分析方法对冠心病验案常见的血瘀证、气虚证等证型分别进行辨证用药分析,对冠心病验案常见的胸闷、胸痛等症状分别进行对症用药分析,分别得出Logistic回归方程,结合使用典型相关分析、聚类分析、改进的Apriori算法所得到用药分析结果,发现其结果符合临床实际意义。王雪冰[16]采用二分类多元Logistic回归分析总结丁书文教授治疗冠心病伴抑郁状态的临证经验,得出其常用配伍药物:黄芪-麦冬-五味子多常规用于治疗冠心病伴抑郁状态患者的基础治疗;冠心病症见胸痛时用三七粉-冰片-延胡索;抑郁状态症见多梦、舌淡红时多用炒枣仁-首乌藤,心慌、心烦时用茯神、泽泻;临证出现不欲交流、合并心律失常使用远志-牡蛎;临证出现心情低落、合并糖尿病、心律失常时使用黄连-生地黄;临证出现胃胀、舌黯、苔薄白、合并高脂血症时使用厚朴-木香;并总结出冠心病伴抑郁状态合并相关疾病时的用药特点。

2.5 因子分析

因子分析是从代表性的角度反映现象的本质问题,根据各主成分与各指标相关性大小,选择系数较大指标。采用因子分析可抽取变量间的共同因素,以较少的公因子代表原来较为复杂的数据结构[17]。

李瑞敏[18]运用因子分析、关联规则等统计方法进行分析、归纳、总结周仲瑛教授辨治冠心病临床经验及学术思想,对符合条件的211例(860诊次)冠心病病案进行数据挖掘分析,发现3个因子,分别为:由砂仁、檀香、薤白、瓜蒌、甘松、半夏、党参、莪术、娑罗子、炙甘草、桂枝、石菖蒲、丹参组成的因子1,为瓜蒌薤白半夏汤之意,是周老辨治冠心病痰瘀痹阻型最常用的药物;由麦冬、五味子、龙骨、酸枣仁、太子参、功劳叶、牡蛎、知母、生地黄组成的因子2,为周老辨治冠心病气阴两虚型最常用的药物;由娑罗子、川芎、薤白、瓜蒌组成的因子3,对冠心病表现为胸闷憋气的诊疗有重要意义。李彦彤[19]运用Excel2016建立数据库,运用SPSS19.0对其进行描述性统计分析、检验、秩和检验和因子分析方法探索张明雪教授运用中药汤剂治疗冠心病合并糖尿病临床疗效及用药规律,通过分析补益相关因子、理气化痰相关因子、平肝相关因子、清热相关因子可知,张明雪教授临床善用益气养阴、活血化痰法治疗冠心病合并糖尿病。

2.6 粗糙集理论和支持向量机

粗糙集理论是处理模糊、不精确、不一致等各种不完整信息的有效工具,能对医案进行高层次分析。支持向量机是监督学习模型,可根据有限的信息在模型的复杂性和学习能力之间寻求最佳折中,可用于分类和回归分析。

王阶等[20]以名老中医冠心病病历115份建立SQL2000数据库,运用Excel软件统计频数、频率,运用Weka3.4数据挖掘软件进行支持向量机分析,提取到名医诊治冠心病8个主要证候要素(血瘀、痰浊、气虚、阳虚、阴虚、内热、血虚、气滞),并确定了其定量诊断,并根据药物性能对名老中医针对证候要素的常用药物进行归纳,发现气虚常用黄芪、太子参等,血虚常用当归、白芍等,阴虚常用麦冬、白芍等,阳虚常用薤白、桂枝等,气滞常用延胡索、陈皮等,血瘀常用丹参、川芎等,痰浊常用瓜蒌、陈皮等,热蕴常用生地黄、黄连等。

3 存在问题

3.1 数据预处理困难

直接将名老中医临证经验建立数据库,其中的数据缺乏规律,不乏一些无价值的成分,很少能直接满足数据挖掘算法的要求,会严重影响数据挖掘算法的效率,其中噪声干扰还可造成挖掘结果的偏差。因此,对不理想的原始数据进行有效预处理,已成为数据挖掘过程中的关键问题[21]。数据预处理包括数据清洗、数据集成、数据转换和数据消减。目前对名老中医学术、临证经验挖掘多以分析医案为主。而中医医案描述方式具有一定的主观性、随意性,存在缺损数据多、噪声数据多、信息冗余、数据动态变化等缺点,尤其是古代医案缺乏规范与条理[22]。因此,将传统医案转化为数字医案的过程中,医案术语、计量单位、药物名称等内容受地区、个人影响极大,给数据的预处理带来极大困难。

3.2 数据挖掘技术受限

中医辨证论治思想往往具有模糊性、主观性,导致中医医案中的大多数要素也具有模糊性、主观性、高维度的特征[23]。因此,在现有技术条件下,中医医案数据挖掘具有一定难度。同时,适合应用于中医医案研究的数据挖掘技术较为单一,频数分析占据主要地位,定量和定性的综合分析难以进行,单一的统计分析方法不能满足处理中医医案这种高维度数据的要求[24],难以分析出医案中的隐性知识,名老中医的学术思想及临证经验的实质难以企及。且数据挖掘分析需要兼有计算机知识和中医知识储备的复合型人才,因此,非专业人员进行中医医案数据挖掘不可避免地存在局限,无法有效兼融二者的思考方式,更好地利用现代化信息技术。研究的重点以疾病的用药分析最多,基础理论研究相对较少,对研究所得的结果缺乏深度的解读分析。

3.3 前瞻性数据挖掘较少

当前,无论是传统师承、文献研究,还是临床试验研究,名老中医临床经验学术思想的系统研究大多为回顾性研究[25],缺少前瞻性研究。单纯回顾性研究的结果出现矛盾时难以保证研究结果的有效性、真实性,同时开展前瞻性研究,其偏倚较少,可调整监测方法和观察指标,且在因果关系推断上作用较大,对分析名老中医学术及临证思想具有临床指导意义。

3.4 个案分析困难

中医医案是在中医理论指导下,通过具体的医疗实例,记录医家辨病、辨证、立法、处方的实际诊疗全过程的叙议结合的传统临证文本,是中医学几千年来传承发展创新的重要载体之一[26]。其中临证个案占有重要部分,目前对个案的研究方法主要是领悟式分析方法[27],而数据挖掘技术多以群案分析为主。针对个案分析,可弥补群案数据挖掘热潮中对中医个性化诊疗的忽视;通过对个案的研究,也可发现名老中医辨证论治的普遍规律,个性与共性得到互相印证。因此,个案的数据挖掘具有必要性。

4 措施及展望

为解决上述问题,在医案数据挖掘过程中应由学科专业人士进行校正,合理分析、去伪存真,与临床实际对比,最好交由名老中医本人亲自校验,所得结果方能真正体现医家的诊疗策略。同时,引入新型数据挖掘方式为名老中医治疗冠心病心绞痛临床经验挖掘提供新思路。如江启煜等[28]运用条件随机域模型对禤国维名老中医临床医案进行挖掘分析,通过构建新的文本挖掘信息模型以高效整理和挖掘名老中医临床医案中的经验与学术思想。陈丽平等[29]使用隐结构模型对名老中医慢性支气管炎医案病机进行挖掘,并认为隐结构分析的结果较全面且能将相关指标量化,其结果的呈现方式更直观,通过对不同反映同一证型不同侧面的隐类进行综合聚类可简化中医证候辨证的复杂性。大数据时代背景下,人工智能技术克服了人脑接受、存储、处理信息的局限性,对于人脑的思维活动拓展具有重要意义,运用于中医药,对加速传统医学与现代技术的融合发展具有重要意义。针对中医数据的动态特征,运用最新的人工智能技术探索挖掘名老中医临证医案数据,如人工神经网络和基于案例的推理等技术,建立更加准确、实用、高效的医学数据库,无论是对群案还是个案,通过人工智能技术同样能够更好地实现定量和定性的分析[30],发现其中的客观规律,并以此建立中医临床病证诊疗决策支持,对中医现代化诊疗模式构建具有重要意义[31]。

综上所述,运用数据挖掘技术继承名老中医论治冠心病心绞痛学术经验取得了较多成果,在当前冠心病心绞痛疗效仍不尽如人意的情况下,中医药因其临床疗效显著、不良反应较少、药物依赖性不明显,患者更容易接受,借助数据挖掘技术可使名老中医的临证经验得以更好地传承,使其中的隐性知识与内容得以展现,对于进一步提升临床疗效,进而在循证医学时代更好地适应对中医药高质量临床证据的需求,乃至推广至全球各地以提升总体疗效,具有重要意义。目前对名老中医冠心病心绞痛数据挖掘水平尚有较大的提升空间,在专业学科工作者的带领下,结合现代人工智能技术,发现新的有效的模型和算法,可进一步提高数据挖掘的精确度,推动中医药理论体系的进一步发展。

[1] 胡盛寿,高润霖,刘力生,等.《中国心血管病报告2018》概要[J].中国循环杂志,2019,34(3):209-220.

[2] HAO P, JIANG F, CHENG J, et al. Traditional Chinese medicine for cardiovascular disease:evidence and potential mechanisms[J]. Journal of the American College of Cardiology,2017,69(24):2952- 2966.

[3] 刘凡,李新龙,李凌香,等.数据挖掘软件在名老中医经验传承中的应用进展[J].环球中医药,2019,12(10):1606-1610.

[4] 许鸣,陆嘉惠.基于真实世界研究的中医药临床数据挖掘方法浅探[J].中华中医药杂志,2017,32(4):1640-1643.

[5] 陈五零.神经元网络模型及其在中医诊断方面的应用[J].中华医学杂志,1991,71(2):111-113.

[6] 殷瑞刚,魏帅,李晗,等.深度学习中的无监督学习方法综述[J].计算机系统应用,2016,25(8):1-7.

[7] 吴荣,王阶,任廷革,等.基于数据挖掘的名老中医冠心病诊疗规律研究[J].中华中医药学刊,2008,26(12):2581-2583.

[8] 陶永鹏,刘朝霞,顼聪.大数据背景下有关中医药现代化思路的探讨[J].中华中医药杂志,2019,34(2):470-473.

[9] 任毅,陈志强,张敏州,等.当代名老中医治疗冠心病用药规律的聚类分析[J].中国中西医结合杂志,2016,36(4):411-414.

[10] 李洁.国医大师刘志明辨治冠心病规律及滋肾活血方经mTORC1调控H9C2能量代谢研究[D].北京:中国中医科学院,2019.

[11] 庄逸洋,郑升鹏,陈文嘉,等.国医大师邓铁涛治疗冠心病用药规律的数据挖掘研究[J].时珍国医国药,2016,27(12):3025-3027.

[12] 范金茹,李金洋,龚后武,等.基于关联规则挖掘名老中医王行宽肝心同治胸痹心痛用药规律[J].中华中医药学刊,2014,32(12):2854-2857.

[13] 薄荣强,宋庆桥,褚瑜光,等.基于数据挖掘的国医大师治疗冠心病的用药规律探析[J].中西医结合心脑血管病杂志,2018,16(3):271-275.

[14] 李施新,李远,刘孟敏.基于关联规则和复杂系统熵聚类的100位全国名老中医治疗冠心病证治规律研究[J].中华中医药杂志,2016,31(4):1258-1261.

[15] 毕文霞.名老中医治疗冠心病验案的数据挖掘及辨证模型构建[D].济南:山东中医药大学,2015.

[16] 王雪冰.丁书文教授治疗冠心病伴抑郁状态的经验总结[D].济南:山东中医药大学,2017.

[17] 赵艳青,李青松,项敏泓,等.中医药数据挖掘中常见问题的思考与策略——以中医药术语及用药规律总结为例[J].中华中医药杂志,2018, 33(4):1220-1225.

[18] 李瑞敏.周仲瑛教授辨治冠心病临床经验及学术思想研究[D].南京:南京中医药大学,2017.

[19] 李彦彤.张明雪教授治疗冠心病合并糖尿病的病例回顾性分析[D].沈阳:辽宁中医药大学,2017.

[20] 王阶,吴荣,周雪忠.基于支持向量机的名老中医治疗冠心病证候要素研究[J].北京中医药大学学报,2008,31(8):540-543,560.

[21] 陈淑华,朱秋爽,马纲,等.中医临床数据预处理与中医临床信息规范化[J].中医药管理杂志,2018,26(17):170-172.

[22] 何彦澄,肖永华,闫璞,等.中医医案分析方法评述[J].中医杂志, 2018,59(13):1106-1109.

[23] 许鸣,陆嘉惠.基于真实世界研究的中医药临床数据挖掘法浅探[J].中华中医药杂志,2017,32(4):1640-1643.

[24] 陈曦,李宜放.基于医案解构探讨名老中医经验数据挖掘现状[J].中华中医药杂志,2019,34(6):2608-2611.

[25] 王清贤,李凤娥,张颖.基于数据挖掘技术的刘玉洁治疗心悸临证经验研究[J].河北中医,2012,34(1):5-8.

[26] 高殿璞.基于数据挖掘的中医医案结构与要素发现研究[D].北京:中国中医科学院,2018.

[27] 申颖.基于医案的名老中医学术思想及临证经验传承方法探索[D].北京:北京中医药大学,2016.

[28] 江启煜,郑美思,李红毅,等.基于条件随机域的禤国维名老中医医案挖掘分析[J].中国实验方剂学杂志,2017,23(9):208-213.

[29] 陈丽平,蔡永敏,李建生.基于隐结构模型对名老中医慢性支气管炎医案病机的探讨[J].中华中医药杂志,2017,32(2):801-806.

[30] 仲芳,杨巍,赵翀,等.数据挖掘技术在中医医案的应用研究[J].中国中医药信息杂志,2020,27(2):141-144.

[31] 赵宇平,李楠,闫朋宣,等.中医药人工智能现状研究及发展思考[J].中国中西医结合杂志,2020,40(2):1-4.

Research Review of Treatment of National TCM Masters for Angina Pectoris of Coronary Heart Disease Based on Data Mining

WANG Ziyan, WANG Rong, SHE Ruining, DAI Lu, FAN Jinru

Data mining technology can be used to explore the clinical experience of national TCM masters in the diagnosis and treatment of angina pectoris of coronary heart disease, and discover the hidden knowledge, which is of great significance for improving the diagnosis and treatment of angina pectoris of coronary heart disease. This article reviewed from the current situation of the application of data mining technology, the application in inheriting the diagnosis and treatment experience of national TCM masters, existing problems, measures and prospects, and put forward that professionals should standardize the data, new data mining methods should be introduced and artificial intelligence technology should be used to carry out data mining, which can provide some references for the further inheritance and development of the academic thoughts of national TCM masters.

angina pectoris of coronary heart disease; national TCM masters; data mining; review

R2-05;R259.414.2

A

1005-5304(2020)10-0136-05

10.19879/j.cnki.1005-5304.202002016

湖南省中医药科研计划重点项目(201716);湖南中医药大学中医学国内一流建设学科(2018年)

范金茹,E-mail:fanjr218@sina.com

(2020-02-02)

(2020-02-17;编辑:华强)

猜你喜欢
老中医医案数据挖掘
探讨人工智能与数据挖掘发展趋势
老中医教你睡眠养生
老中医坐诊
医案聊斋续篇 吐泻案
医案聊斋续篇 晨泄案
基于并行计算的大数据挖掘在电网中的应用
老中医
一种基于Hadoop的大数据挖掘云服务及应用
新加香薷饮医案6则
周来兴老中医治疗疑难杂症的思路与经验