高婉卿,程宁,李力松,黄辛迪,丁长松
机器学习在方剂研究中的应用概述
高婉卿1,程宁1,李力松1,黄辛迪1,丁长松1,2
1.湖南中医药大学,湖南 长沙 410208;2.湖南省中医药大数据分析实验室(丁长松),湖南 长沙 410208
随着信息技术的发展及大数据、人工智能的普及,中医现代化研究得到极大发展。为探究辨证论治、组方配伍本质规律,方剂研究成为中医传承与发展的重要内容。为实现智能化中医诊疗,根据病症自动推荐准确有效的方剂成为研究关键。本文对近年来机器学习在方剂领域中的应用进行梳理,将聚类、支持向量机、关联规则等传统机器学习方法和深度学习技术的特点及其在方剂研究中的应用进行比较;分析机器学习在方剂研究中遇到的困境及其相应的解决办法;指出机器学习在方剂研究中的趋势,并对其前景进行展望。
机器学习;中医;方剂;客观化;智能化;综述
机器学习以计算机为工具模拟人类思维方式,通过学习知识和技能解决问题,在计算机视觉、自然语言处理、搜索技术、语音识别、推荐等诸多领域得到广泛应用。决策树、聚类、关联规则等传统机器学习算法通过提取样本的数据特征分析其内在规律,往往适用于小样本集。深度学习是机器学习领域中新的研究方向,将原始数据通过非线性模型映射为更高层次、更抽象的向量表示,通过足够多的映射来学习复杂关系以解决实际问题,具有良好的泛化能力[1-2]。近年来在辅助医疗、医学影像、药物挖掘等方面发挥了重要作用[3]。
历代医家留下的海量医案中蕴藏着医家思想,借助信息技术对中医临床案例、方剂数据进行分析,挖掘其内在组方配伍规律,是中医传承与发展的有效途径。传统机器学习方法因其小样本适应性、可解释性已在方剂领域取得很多成果,而深度学习技术目前应用虽少,但其结构、学习方式适用于拟合中医辨证论治、组方配伍思想,近年来在中医面诊[4]、中药鉴定[5-6]等方面展开应用研究。本文对机器学习在方剂研究领域的现状进行梳理,分析目前机器学习在该领域开展研究所面临的挑战,并结合中医药数据特点提出解决思路,为机器学习技术在方剂领域的进一步研究提供参考和依据,也为信息技术在中医传承与创新过程中的应用提供新思路。
聚类算法基于数据内部结构,通过聚类使同类型样本具有较高相似性,不同类样本具有明显差异。常用于方剂与药物研究的代表性聚类算法为K-Means[7]。
对治疗某病的大量方剂进行聚类,以得到的聚类特征推测方剂治疗准则、组方规律。如赵新等[8]收集全国17个省市中医药预防新型冠状病毒64首方,基于熵聚类得到8个常用药物组合,使用无监督熵层次聚类算法挖掘出7个潜在新方。裴卫等[9]运用K-Means方法对589首中医治疗肝硬化方中涉及的257味中药进行聚类分析,并利用复杂网络对比验证,显示聚类中心个数为5时,类别特征区分度较高。
为研究中医治疗疾病的药物功效、性味归经等特性规律,常对治疗该病的中药进行聚类,进而探究组方配伍规律。李国春等[10]采用K-Means算法对半夏泻心汤治疗慢性胃炎临床用药进行分析,发现半夏泻心汤7味中药药物组合呈规律性变化,有的药物组合以清热作用为主,有的以补益作用为主。贾海女等[11]对治疗恶性胸腔积液的127首方剂经聚类分析,得到28个常用药物组合及7个新方剂。为分析药物属性与配伍关系,金滋力等[12]采用层次分析与聚类方法将药物属性进行聚类,分析属性对规律配伍的作用,结果显示大部分禁忌配伍组合与常规药物组合的聚类结果具有明显差异。聚类分析主要从宏观角度对疾病、症状、药物等进行分类,偏向整体特性,结果呈现概括性评价,难以挖掘出具体的诊疗规律。聚类算法的性能在很大程度上依赖于输入特征构建的特征空间结构,聚类结果需结合专业知识进行判断,导致数据标签具有主观性,不利于研究问题的本质。
通过SVM对方剂的功能分类,分析同类方剂共有特征,以探寻中药配伍的本质规律。高全泉等[16]将10 000余首方剂作为实验对象,训练SVM分类器以预测新药物组合归属的中医治法类别。Xie等[17]对获取的中医治疗信息采用TF-IDF构建特征向量,根据不同SVM分类模型对未标注数据进行人工标注,为后期利用神经网络预测方剂与疾病之间的关系做准备工作。
通过SVM对方剂临床使用有效性进行划分,以预测新药物组合是否对疾病或证候发挥作用。Wang等[18]将575首知名方剂作为正样本、随机组合生成1961个非常规方剂为负样本构成训练集输入SVM分类器,该模型在测试集上得到十分理想的分类效果。金滋力等[12]采用SVM分析方剂配伍数据,对药物配伍可行性进行预测建模,结果表明在线性SVM模型下,方剂功效预测准确率均可达90%。Pan等[19]为检验方剂是否有效,利用SVM结构风险最小原则,对方剂进行初步诊断,有效降低了错诊概率。
SVM在分类性能、泛化性能上表现较好,然而由于SVM空间消耗主要为训练样本的存储、核矩阵的计算,借助二次规划求解支持向量,涉及m阶矩阵的计算,当样本数目很大时,矩阵的存储和计算将耗费大量机器内存和运算时间,因此在大规模训练样本上难以实施。然而中医方剂领域的功效分类不仅是多分类问题,更是多标签问题,对于该类问题的处理更为复杂。
关联规则从数据集中探寻当前数据与其他数据事物或特征之间相互依存和关联关系。关联规则挖掘信息主要包含两个阶段:第一阶段从数据集中找出所有高频项目组;第二阶段由高频项目组产生关联规则,以支持度衡量规则的普遍性,以置信度衡量规则的可靠度。常见的关联规则算法有Apriori、FP-树频集算法。关联规则算法简单,易被接受与解释,在探寻方剂高频药对、以病类方用药研究、以证类方关联规则挖掘中得到广泛应用。
高频药组对组方配伍、方剂功效具有重要作用。白明等[20]整理中医古籍中相似疾病组方,使用关联规则总结其中内涵,寻找潜在的中药配伍规律,得到甘草与桔梗、甘草与防风、甘草与羌活等关联度较高的12个药对。季涛等[21]采用关联规则方法探究治疗消渴症用药特点及规律,得到出现频次10次以上药对为人参-甘草、甘草-麦冬、人参-麦冬等187对3味中药药对包括人参-甘草-麦冬、天花粉-麦冬-黄连、天花粉-甘草-麦冬等117对,以及高频次的4味药对。
以病类方即针对具体疾病,探究其用药规律。杨艳平[22]采用关联规则Apriori算法分析133首治疗银屑病方剂,挖掘出20个核心药物组合、10首可用于治疗银屑病新方剂。宁江等[23]对459例寻常型银屑病医案涉及的358味中药进行频数统计和关联规则分析,发现银屑病遣方用药多考虑清热凉血、补血活血、祛风解毒之品。刘嘉辉等[24]研究治疗肝硬化用药规律,对63个医案中方剂药物的功效、性味归经进行描述性统计,对高频药物进行关联分析,得到5个置信度近100%的核心药物组。
以证类方即针对具体证型,找出治疗该类证的用药规律。李欣等[25]统计治疗寻常型银屑病进行期血热证的14类101味中药,运用经典统计和集对分析方法从中得到常用中药22味。郭宏等[26]以符合标准的56例鼻鼽患者为研究对象,分析方剂中药物的使用频次,运用Apriori算法探讨鼻鼽药物配伍规律,挖掘出功效较强药物,并得出鼻鼽“寒热错杂,虚实并见”证型中的特殊强关联药对。
关联分析挖掘出的知识有限,仅考虑了并发情况,一般局限于某个术语与其他术语共现频次较高的情况。然而方剂中有些中药出现频次较高,如“甘草”“大枣”等常以臣药或佐药的身份出现,但对方剂功效的影响远低于君药,因而无法挖掘出中药对方剂功效的真实贡献度。
通过以上分析,我们可以推断,留学生的语言能力与其语用语言能力有一定的关系,但与其社交语用能力之间关系不大。留学生的社交语用能力比其语用语言能力发展得要慢。这就要求我们在教学中加强对学生社交语用能力的培养。
以上论述了3种传统机器学习方法在方剂领域应用情况。K-Means等聚类算法具有可解释性强、计算复杂度低的优点,但严重依赖样本的特征工程处理。SVM适用于小样本,不易出现“维度灾难”,并且具有较强的鲁棒性,但SVM计算复杂度较高,依赖核函数的选择,同时也不适用于多分类任务。Apriori等关联规则算法挖掘结果易于理解,但仅考虑样本中事物的并发情况,强调结构化数据。聚类、分类、回归以及关联分析等传统机器学习方法除在方剂研究中得到广泛应用外,在中医其他领域也取得不错的研究成果,如中药分类[27]、中药识别[28]、面诊识别[29]、舌象质量评估[30]、药物选择[22-23,31]等。
浅层神经网络主要对结构化、半结构化数据做场景预测。在中医药领域利用神经网络的自学习、自适应及非线性映射能力建立药性特征与功效关系的关联模型,拟合中药属性与功效的复杂非线性关系,以实现中药药性客观化表示。浅层神经网络在方剂中的研究应用方向可归纳为方剂组成与功效对应关系、方剂与疾病对应关系、方剂配伍非线性规律。
李伟霞等[32]对养血补血、活血化瘀、调经止痛3种功效方剂进行效应指标的标准化整合,采用人工神经网络将所测得的主要效应成分含量与3种功效整合效应进行相关分析,以阐述归芎类组方中功效效应物质基础及成分对功效的贡献度。乔少杰等[33]将模糊神经元引入神经网络,构建基于模糊神经网络的方剂功效约简算法及神经网络模型EFNN,结果表明属性约简神经网络在方剂功效预测上具有较高的准确率。郭永坤等[34]将方剂信息“量子化”处理,以方剂基本特征属性作为输入,方剂功效作为输出,使用神经网络建立中药方剂功效预测系统。
Xie等[17]在利用SVM分类器将方剂划分正负样本的基础上,构建多个浅层神经网络,将疾病与中药分别作为网络的输入,经词嵌入层与全连接层将疾病与方剂中药网络输出进行串联,构建疾病-方剂向量表示,并经全连接将疾病-方剂向量表示映射到预测结果。该模型可用于探究疾病与方剂之间的关系,适宜验证方剂对该疾病的有效性。
宋小莉等[35]对21首方剂数据构建BP神经网络,以拟合不同配伍与蛋白酶之间的非线性映射关系。实现半夏泻心汤及其类方中8味中药配伍剂量的胃黏液分泌预测。Song等[36]利用动量法与学习速率自适应相结合网络模型建立药味药量与药效学指标的非线性映射模型,探究药物剂量对方剂配伍规律的影响。李味味等[37]在中药组方配伍原则基础上,构建补益类复方功效与药物性味、归经关系BP神经网络模型,结果表明模型在预测补益类方剂的补气、补血、补阴、补阳功效方面准确率可达92.5%。然而,传统的神经网络存在局部最优、过拟合及梯度扩散等问题,如在实验中确定的性味、归经属性并不能完全代表真实分类决策过程中的典型特征[36]。另外,中药具有多种属性,每种属性对决策结果都具有一定影响,而浅层神经网络的分析能力有限,无法很好地拟合输入与输出结果之间复杂的非线性映射关系。
针对浅层神经网络表示能力有限,难以准确把握中医辨证、药物配伍的多重非线性关系和协同关系,深度学习以有限的参数和多层网络结构模拟变量间的复杂关系,通过逐层特征变换,将原样本特征空间变换到新的特征空间。因其复杂的非线性映射能力,深度学习的灵敏度、特异度、精度及准确度都高于传统机器学习。因此,深度学习方法更适用于处理中医药领域的复杂问题。
Chen等[38]将中医古籍中收集的88味清热中药与45味活血中药采用Kennard-Stone算法分为100个校准样本和33个验证样本,以药性、药味、毒性及十二归经中药属性为网络输入,卷积操作进行特征选择,池化操作保留中药关键特征,输出中药所属类别,构建基于中药药性理论深度信念网络功效分类模型。Hu等[39]为探索舌诊对方剂的相关性,构建双通道卷积神经网络模型,对不同舌诊图片与处方进行训练,主通道用于中药处方生成,辅通道用于预测处方治疗主题,以2个全连接层输出最后的处方生成结果。Zhang等[40]基于高血压症状使用深度学习中的堆叠自动编码器将临床案例分为5个类别,分析各类高血压病主要方剂和常用中药的使用规律。
当前深度学习大部分研究主要集中于中医舌诊图片、脉诊信号处理,中医方剂领域研究成果较少。辨证论治、组方配伍规律是中医药的重要组成部分,是中医现代化的关键所在。深度学习技术可用来模拟方剂组成的“语义”信息,探究方剂组成与方剂功效之间的复杂关系,因此将深度学习引入方剂研究是中医药传承与发展的必然方向。
传统神经网络提升了基于数据特性进行具体问题建模的可行性,但对数据间隐藏特性的提取十分困难,深度学习适用于探究方剂功效间复杂关系及方剂配伍的内在规律。值得注意的是,无论浅层神经网络还是深度学习技术,模型构建难点在于不同问题、不同样本需设定不同的超参数,如神经元的个数、优化参数、样本批次、训练的轮数、学习速率等,需选择合适的损失函数、优化函数、激活函数。虽然深度学习以其优越的性能已解决了中医病例分类[41-42]、辨证分型[43],以及中医相关图片信息处理如舌诊、面部图片分析病因[4,44]、中草药识别[5-6]等诸多难题,但在方剂领域的应用研究仍处于起步阶段,需经过实践积累一定的研究经验。
3.1.1 药名不规范
中医历史悠久,不同地区、不同学派及不同时期均有其命名规则、用药习惯。中药存在大量“同物异名”“同名异物”现象。“同物异名”即同一个物种有多个不同的名字,如虎杖又称苦杖、斑杖、地榆、大虫杖、活血丹等;“同名异物”指同一个名字可能涵括多个不同的中药品种,如地黄可分为鲜地黄、干地黄和熟地黄,其性味归经有所不同,不能一概而论,然而方剂样本中存在大量未明确指明用药品种的数据,导致研究结果存在偏差。
3.1.2 用药剂量描述不规范
中药在方剂中的使用剂量是确保其安全和疗效的关键。方剂有汤剂、丸剂、散剂、丹剂等,不同类型方剂用药剂量安全范围有所差异,如金匮肾气丸(干地黄240 g,山药、山萸肉各120 g、泽泻、茯苓、牡丹皮各90 g,桂枝、炮附子各30 g)展示剂量为整个疗程用药剂量,而通窍活血汤[赤芍3 g,川芎3 g,桃仁(研泥)9 g,红枣7个,红花9 g,老葱3根,鲜姜9 g,麝香0.15 g]为汤药剂量;数据存在古方与现代方混杂现象,如戎盐散方(戎盐三分,甘草半两,蒲黄一两,白矾三分,龙骨一两,鹿角胶二两)剂量单位为分、两、钱等,而现代方主以“克”为单位;存在范围用量,如化痰通腑饮中全瓜蒌3~40 g、胆星6~10 g;“个”“根”“条”等单位的使用,如通窍活血汤中的红枣7个、老葱3根,增加大量人工处理工作。明确方剂药量-功效关系,是方药研究的关键问题之一,以上问题为剂量信息的有效使用、方剂量化表示带来严重阻碍。
3.1.3 功效术语不规范
方剂功效是研究中医辨证论治的关键。方剂功效不是组成药物功效进行简单叠加,而是相互作用的结果[45]。方剂数据中,方剂功效表述存在大量同义不同型术语,如“祛湿”与“去湿”,“补气养血”与“补气血”;语义重复术语,如“益气和中祛风”与“益气和中”或“益气”,导致方剂功效标签高维度。另外,功效术语具有稀疏性,部分术语的正样本个数极少,属于极端多标签,进一步提升了实验的难度。
将信息转变为计算机可识别的形式是数据分析的前提。然而中医理论涉及的理论知识较多且复杂。“君臣佐使”是方剂配伍的基本原则,等同于方剂的组方结构,这种结构的定义比较模糊,且无法确定结构的影响因素,方剂的名称、中药品数、中药效力及其药性都可能产生影响[46]。方剂用药药性组合规律十分复杂,如药性理论包括药气、药味、升降浮沉、归经及有毒无毒等内容,药与药之间存在“相须”“相使”“相畏”“相杀”“相恶”“相反”等关系。方剂数字化处理过程中必须考虑这些理论知识。在数据格式方面,方剂来源不同导致书写形式不同。
深度学习需大量样本,收集到的方剂样本质量并不能得到保证。首先,方剂收集来源较广,从古书、病案、网络爬虫、文献等均可获得,但有效性并未得到统一的公证;其次,不同经验、不同用药习惯的中医学者对同一方剂也存有主观意愿;一个方剂对同一疾病不同体质患者功效不完全相同,导致样本缺乏客观性。
①数据集角度:传统的机器学习方法在小数据集上可以取得很好的效果。大数据时代,随着中医数据不断整理积累,传统机器学习方法并不适合处理大样本数据。②特征选择角度:传统机器学习方法最大优势在于发现信息中的共性规律,但对一些出现频次不高的中药可从方剂中获得的信息较少。通常需要对研究问题的领域知识有充分的了解,以完成合适的特征抽取工作,最后才能对模型进行设计与训练。③模型构建角度:方剂数据、特征、规则的特殊性,以及当前研究成果较少的局限性,对于模型框架、模型中各种参数的选择需要进行不断尝试与改进,具有较大的工作量。④可解释性角度:深度学习模型大多数为黑盒模型,中间过程难以解释,不利于对组方配伍的内在规律进行探究。
首先,大数据为机器学习提供了海量的训练样本,给数据挖掘带来了革命性进步。随着中医药现代化研究的发展,中医文献、古籍整理,临床案例收集工作已全面展开,中医大数据呈线性增长。大数据与云计算技术的发展为具有模糊性、经验性特点的中医药提供了数据化的技术工具[47],充分利用大数据促进方剂科研的发展,将为中医药领域带来重要的革命性变化。如何让大数据成为研究发展的优势,则取决于对数据的收集与处理,因此,方剂的标准化、结构化是中医药大数据分析的关键所在。
其次,中药复方配伍涉及药效与物质基础之间的关系,并不是组成药物的简单堆砌,而是依据药物各有所长的功用在辨证、立法的基础上配伍并发挥整体增效减毒的调节作用,使各具特性的药物组合成一个新的有机整体[48]。在遵循中医“辨证论治”基本理论的基础上,通过分析复方属性及功效,构建以中药“四气-五味-归经-升降沉浮-毒性-功效”等属性为维度的多维空间量化模型。结合本体知识,针对不同问题的训练样本,借助或改进传统机器学习算法等挖掘复方信息,最大程度拟合其中的非线性规律,为诠释中医治疗机理、精准化医疗提供依据。
同时,方剂学研究中方证关系亦是业界关注的热点,“法随证立,方从法出,方以药成”,方药与病证关系是中医辨证论治核心内容。认识方证关系的学术内涵、总结方证规律及揭示其现代内涵对于论证中医药学的科学性和提高临床辨证的水平均有十分重要的意义。窦志芳等[49]认为,可运用计算机技术来整合归纳大量文献信息,用以揭示证候、方剂和方证相关的知识,建立具有中医学特色的文献挖掘信息提取技术。深度学习应用于方证关系的研究虽仍处于初级阶段,但其符合大数据分析、本质规律研究的需求,具有巨大的发展空间。
如今,借鉴网络药理学思维解析方剂多成分、多靶标整体调控作用原理已成为研究方剂的重要手段。网络药理学是基于“疾病-基因-靶点-药物”相互作用网络,观察药物对疾病网络的关键节点或网络模块的调控效应,从而揭示药物系统作用于人体的效应机制的药物研究新模式。近年来,“成分-靶点-通路”研究模式已广泛用于方剂物质基础和作用机制分析。方剂研究中,使用机器学习方法对结构化方剂数据进行靶点预测,同时以中药为连接点,将病证、方药映射到生物分子网络,结合网络药理学知识对预测结果进行评价与验证。该方向有助于提升机器学习方剂研究结果可信度,实现中医理论客观化。
方剂是中医临床治疗经验的有效载体,方剂用药规律研究是中医传承的关键。研究初期,中医领域中存在大量模糊数据,缺乏规范化、结构化,可用于模型学习的样本量较少,传统机器学习方法为当时中医的客观化、内在规律的探究提供了有效途径。聚类算法可用于探究用药规律、生成处方,探寻症状、证候之间的关系;分类和回归算法可用于疾病预测,证候症状、中药方剂分类;关联规则可通过对药物与药物、症状与症状、疾病与处方的关联分析,探寻其中的关系,为中医辨证论治、组方配伍研究做出贡献。随着方剂数据收集以及方剂研究的深入,传统方法已无法全面阐释方剂内在规律。深度学习方法以其强大的拟合能力、良好的泛化能力对方剂组方规律、处方与功效的多标签对应关系进行分析,将对中医药学术继承与创新带来重要意义,同时也是中医药现代化发展的必然趋势。
[1] HINTON G E, OSINDERO S, TEH Y W. A fast learning algorithm for deep belief nets[J]. Neural Computation,2006,18(7):1527-1554.
[2] HAO X, ZHANG G, MA S. Deep learning[J]. International Journal of Semantic Computing,2016,10(3):417-439.
[3] LI H, TIAN S, LI Y, et al. Modern deep learning in bioinformatics[J]. Journal of Molecular Cell Biology,2020,DOI:10.1093/jmcb/mjaa030.
[4] ER-YANG H, WEN G H, ZHANG S J, et al. Deep convolutional neural networks for classifying body constitution based on face image[J]. Computational & Mathematical Methods in Medicine,2017, 2017:1-9.
[5] WENG J C, HU M C, LAN K C. Recognition of easily-confused TCM herbs using deep learning[C]//Proceedings of the 8th ACM on Multimedia Systems Conference,2017.
[6] HUANG F, YU L, SHEN T, et al. Chinese herbal medicine leaves classification based on improved AlexNet convolutional neural network[C]//2019 IEEE 4th Advanced Information Technology, Electronic and Automation Control Conference (IAEAC). Chengdu,2019.
[7]MAC QUEEN J. Some methods for classification and analysis of multivariate observations[C]//Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability,1967.
[8] 赵新,张林旭,路雪婧.基于数据挖掘预防新型冠状病毒肺炎中医方药初探[J].中草药,2020,51(5):1147-1152.
[9] 裴卫,吴辉坤,李晓东,等.基于机器学习的中医治疗肝硬化组方规律研究[J].世界科学技术-中医药现代化,2017,19(6):950-956.
[10] 李国春,戴慎.动态聚类分析在中医方剂药量组合规律中的应用[J].中国卫生统计,2006,23(1):63-64,67.
[11] 贾海女,张沂,周梦玲,等.基于数据挖掘分析治疗恶性胸腔积液内服处方的组方规律[J].中国医药导报,2020,17(14):150-154.
[12] 金滋力,胡建星,金宏威,等.基于支持向量机与层次分析法的中药方剂配伍分析[J].中国中药杂志,2018,43(13):2817-2823.
[13] YANG X B, LIANG Z H, ZHANG G, et al. A classification algorithm for TCM syndromes based on P-SVM[C]//2005 International Conference on Machine Learning and Cybernetics. IEEE. Guangzhou, 2005.
[14] CORTES C, VAPNIK V N. Support-vector networks[J]. Machine Learning,1995,20(3):273-297.
[15] BORRAJO M, ROMERO R, IGLESIAS E. A linear-RBF multikernel SVM to classify big text corpora[J]. Journal Biomedicine and Biotechnology,2015,2015:1-14.
[16] 高全泉,张帆,刘晓峰,等.中医方剂属性特征的获取和知识挖掘实验[J].计算机工程与应用,2011,47(28):212-214.
[17] XIE D, PEI W, ZHU W, et al. Traditional Chinese medicine prescription mining based on abstract text[C]//2017 IEEE 19th International Conference on e-Health Networking, Applications and Services (Healthcom). IEEE. Dalian,2017.
[18] WANG J F, CAI C Z, KONG C Y, et al. A computer method for validating traditional Chinese medicine herbal prescriptions[J]. The American Journal of Chinese Medicine,2005,33(2):281-297.
[19] PAN L Z, SONG A G, XU G Z, et al. Prescription diagnosis of upper limb rehabilitation training robot based on SVM-GDFNN[J]. Journal of Mechanical Engineering,2013,49(13):17-23.
[20] 白明,李杨波,苗明三.基于古籍数据挖掘的中医防治疫病用药规律分析[J].中药药理与临床,2020,36(1):32-36.
[21] 季涛,宿树兰,尚尔鑫,等.基于关联规则的中医药治疗消渴症的用药规律与特点探析[J].中华中医药杂志,2016,31(12):4982-4986.
[22] 杨艳平.基于数据挖掘的治疗银屑病处方用药规律研究[J].世界中医药,2015,10(10):1611-1613,1617.
[23] 宁江,曾召,卢传坚.基于关联规则的1979-2010年寻常型银屑病期刊医案用药规律分析[J].中华中医药学刊,2013,31(10):2204-2206.
[24] 刘嘉辉,吕东勇,何洁茹,等.基于数据挖掘对国医大师治疗肝硬化用药规律研究[J].中华中医药杂志,2015,30(12):4328-4331.
[25] 李欣,李斌,李福伦,等.寻常型银屑病进行期血热证与方药的相关性研究[J].中医杂志,2012,53(10):843-847.
[26] 郭宏,黄嘉韵,邝艳萍.基于数据挖掘技术的郭宏治疗鼻鼽用药规律初步研究[J].中华中医药杂志,2017,32(3):1332-1335.
[27] RUAN C, WANG Y, ZHANG Y, et al. THCluster:herb supplements categorization for precision traditional Chinese medicine[C]// 2017 IEEE International Conference on Bioinformatics and Biomedicine (BIBM). IEEE. Beijing,2017.
[28] CHEN Y J, LIU Y Y, ZHAO G Z, et al. Chinese traditional medicine recognition by support vector machine (SVM) terahertz spectrum[J]. Spectroscopy & Spectral Analysis,2009,29(9):2346.
[29] ZHANG J, ZHANG P, ZHUO L. Fuzzy support vector machine based on color modeling for facial complexion recognition in traditional Chinese medicine[J]. Chinese Journal of Electronics, 2016,25(3):474-480.
[30] ZHANG X, ZHANG X F, WANG B C, et al. An assessment method of tongue image quality in traditional Chinese medicine[C]//2016 9th International Congress on Image and Signal Processing, Bio Medical Engineering and Informatics (CISP-BMEI). IEEE. Datong, 2016.
[31] 吴元胜,张冰,袁娟娜,等.基于关联规则的当代银屑病医案药-症数据挖掘分析[J].时珍国医国药,2012,23(11):2890-2892.
[32] 李伟霞,唐于平,尚尔鑫,等.基于人工神经网络的当归-川芎药对整体功效与化学物质关联性分析[J].中国中药杂志,2012,37(19):2935- 2942.
[33] 乔少杰,唐常杰,韩楠,等.基于模糊神经网络的方剂功效约简算法[J].四川大学学报(工程科学版),2008,40(2):107-111.
[34] 郭永坤,章新友,刘莉萍,等.基于神经网络的中药方剂功效预测系统研究[J].时珍国医国药,2019,30(2):493-495.
[35] 宋小莉,牛欣,司银楚.基于BP神经网络的半夏泻心汤及其类方配伍模型研究[J].中华中医药杂志,2005,20(6):383-384.
[36] SONG X L, NIU X, SI Y C, et al. Application of artificial neural network in compatibility modeling ofdecoction[J]. Chinese Clinical Pharmacology and Therapeutics,2005,10(1):104- 107.
[37] 李味味,章新友,仵倚,等.基于BP神经网络中药复方功效的预测研究[J].中医药导报,2016,22(6):38-41.
[38] CHEN Z, CAO Y, HE S, et al. Development of models for classification of action between heat-clearing herbs and blood-activating stasis-resolving herbs based on theory of traditional Chinese medicine[J]. Chinese Medicine,2018,13(1):12.
[39] HU Y, WEN G, LIAO H, et al. Automatic construction of Chinese herbal prescriptions from tongue images using CNNs and auxiliary latent therapy topics[J]. IEEE Transactions on Cybernetics,2019,4:1-14.
[40] ZHANG Q, BAI C, CHEN Z, et al. Smart Chinese medicine for hypertension treatment with a deep learning model[J]. Journal of Network and Computer Applications,2019,129:1-8.
[41] LIANG Y, YIN Z, WEI B, et al. Traditional Chinese medicine clinical records classification using knowledge-powered document embedding[C]//IEEE International Conference on Bioinformatics & Biomedicine. Shenzhen,2017.
[42] SONG Z, XIE Y, HUANG W, et al. Classification of traditional Chinese medicine cases based on character-level bert and deep learning[C]//2019 IEEE 8th Joint International Information Technology and Artificial Intelligence Conference (ITAIC). Chongqing,2019.
[43] HU Q, YU T, LI J, et al. End-to-End syndrome differentiation of Yin deficiency and Yang deficiency in traditional Chinese medicine[J]. Computer Methods and Programs in Biomedicine,2019, 174:9-15.
[44] HUO C M, ZHENG H, SU H Y, et al. Tongue shape classification integrating image preprocessing and Convolution Neural Network[C]//Intelligent Robot Systems. Wuhan,2017.
[45] 彭京,唐常杰,曾涛,等.基于神经网络和属性距离矩阵的中药方剂功效归约算法[J].四川大学学报(工程科学版),2006,38(1):92-97.
[46] 王烨燃.方剂组方法则研究[D].哈尔滨:黑龙江中医药大学,2010.
[47] 黄欣荣,张艳朋.大数据技术与中医现代化[J].中医杂志,2014, 55(19):1621-1625.
[48] 麦蓝尹,李怡萱,陈勇,等.基于数理统计方法学的中药复方配伍研究进展[J].中国中药杂志,2014,39(10):1749-1756.
[49] 窦志芳,郭蕾,张俊龙,等.将数据挖掘技术引入方证对应研究的思考[J].光明中医,2007,22(5):3-6.
Review of Application of Machine Learning in Study onTCMPrescriptions
GAO Wanqing1, CHENG Ning1, LI Lisong1, HUANG Xindi1, DING Changsong1,2
With the rapid development of information technology and popularization of big data and artificial intelligence, the research on objectification and modernization of TCM has made great progress. In order to explore the essential law of syndrome differentiation and treatment, essence law of prescription compatibility and prescription research have become an important research content of TCM inheritance and development. The key to realize intelligent diagnosis and treatment of TCM is recommend accurate and effective prescriptions according to the symptoms automatically. This article sorted out the application of machine learning in the field of prescriptions in recent years, and compared the characteristics of traditional machine learning methods and deep learning techniques such as clustering, support vector machines, association rules, and their applications in prescription research; analyzed the difficulties encountered by machine learning in the research of prescriptions and the corresponding solutions; pointed out the trend of machine learning in the research of prescriptions, and look forward to its prospects.
machine learning; TCM; prescription;objectification; intellectualization; review
R2-05
A
1005-5304(2021)06-0131-07
10.19879/j.cnki.1005-5304.202011013
国家重点研发计划(2017YFC1703306);湖南省中医药科研计划重点课题(2020002);湖南省自然科学基金(2018JJ2301);湖南省重点研发计划(2017SK2111)
2020-11-01)
2020-11-10;编辑:华强)