慢性阻塞性肺疾病的中医智能诊疗研究

2022-11-16 07:59:26李祯江国星冯毅范嘉豪杨宏志张威

中国中医药图书情报杂志 2022年6期

李祯江国星*冯毅范嘉豪杨宏志张威

慢性阻塞性肺疾病的中医智能诊疗研究

李祯1，江国星1*，冯毅2，范嘉豪1，杨宏志2，3，张威3

1.华中科技大学电子信息与通信学院，湖北武汉 430074；2.湖北省中医院，湖北武汉 430000；3.湖北中医药大学，湖北武汉 430000

探讨深度学习在慢性阻塞性肺疾病证型预测和药物推荐中的应用。从真实诊疗数据中提取症状、证型、药物信息并做预处理，使用Fisher特征选择算法筛选与证型相关性较强的症状作为4层深度前馈网络的输入进行中医证型预测。将药物推荐分为典型药物推荐和补充药物推荐，利用频数分析和粒子群优化（PSO）算法-反向传播（BP）算法构建各证型的典型药物推荐模型，通过挖掘关联规则完成补充药物推荐。最后通过相应指标分别对证型预测、药物推荐结果进行评价。对 2 232条COPD患者数据的9种中医证型分类准确率达到82.39%。对于外寒内饮证，基于233种药物的典型药物推荐结果的均方误差（MSE）为0.009 1，平均绝对误差（MAE）为0.087 9。设置最小支持度0.2、最小置信度0.9，挖掘到关联规则261条，用于补充药物推荐。实验和实际使用结果表明，本研究提出的基于深度前馈网络的证型分类算法、基于频数分析和PSO-BP网络的药物推荐算法较好地完成COPD患者的证型预测及药物推荐，具有较好的智能诊疗效果。

慢性阻塞性肺疾病；证型分类；中医药推荐；算法；PSO-BP网络

慢性阻塞性肺疾病（chronic obstructive pulmonary disease，COPD）是一种以持续性的气流受限为特征的阻塞性肺疾病，其较高的致残率、病死率，对患者家庭及社会造成了沉重的负担。中医治疗强调整体观，具有疗效明确、不良反应小的优势，规范的COPD中医药临床诊疗是延缓疾病发展、降低疾病负担的关键。

传统的COPD中医药诊疗依赖于医生的知识经验，目前我国COPD患者基数大，根据2015年人口普查数据估算，我国COPD患者约为9 990万例，医生数量相对不足，影响了COPD诊疗质量[1]。近年来，利用机器学习进行COPD智能诊疗的研究受到了关注。Ying等[2]提出一种基于深度学习的COPD加重频率自动分类器，采用2个隐藏层和1个可见层构成的3层深度置信网络建立分类模型，预测COPD患者病情恶化次数。Sugiarto等[3]应用深度学习方法，使用3D卷积神经网络模型根据COPD患者脑电图数据训练图像建立自切开型COPD诊断，将COPD患者根据其病情严重程度分为1～4级。

尽管COPD智能诊疗取得了一定进展，但是几乎没有涉及COPD中医证型预测或药物推荐的研究。事实上，其他一些疾病已经开始了相关研究。黄嘉韵等[4]通过对鼻鼽病例构建决策树模型，对鼻鼽证型分类的准确率达到91.5%。叶培[5]针对包含269种证型的2 597例病历建立证型症状表并进行特征提取，最后通过最大熵模型，对证型分类的准确率达到85.32%。徐琳等[6]运用二元Logistic回归分析方法对慢性乙型肝炎进行证候分类，最终湿热内阻证、肝郁脾虚证、肝肾阴虚证的刀切法预测准确率分别达到85.8%、86.1%和89.8%。但中医强调辨证论治，以上工作只针对证型或证候分类，缺乏对“论治”的研究。

张颖等[7]基于对医案中病症和对应药物的隐语义分析建立狄利克雷分布（LDA）模型，进一步建立根据症状推荐药物的辅助诊疗系统，虽考虑了症状和药物的关系，但没有充分结合中医辨证论治思想。李洪峥等[8]构建了基于中医思维的病证结合冠心病诊疗知识模型，实现智能化药物推荐。林犷[9]利用关联规则算法，从肾小球肾炎的中医数据集中挖掘出症状-证候规则、证候-药物规则，通过规则匹配导出核心药物组合，将其作为推荐药物输出。但是上述两项工作缺乏对症状信息的前期筛选，部分与最终药物相关性低的症状可能影响药物推荐结果。

本研究分别构建COPD中医证型分类和智能药物推荐模型。首先，对采集的真实诊疗数据做预处理，构建数据集，利用Fisher特征选择算法[10]剔除敏感性低的特征，通过深度前馈网络[11]预测COPD证型，利用频数分析和PSO-BP神经网络[12]构建各证型的典型药物推荐模型，完成典型药物推荐，最后通过挖掘症状-药物关联规则完成补充药物推荐。

1 资料与方法

1.1 数据来源和预处理

所有数据来源于2016年3月－2020年11月湖北省中医院肺病科（包括门诊及住院）的真实病案，涵盖COPD患者初诊、复诊的全部2232条记录。构建COPD中医诊疗数据集。一方面，主要面向患者的输入症状预测证型和处方，因此将初诊和复诊均看作独立的输入样本；另一方面，初诊和复诊患者不同的症状特征可以增加样本的丰富性。数据集的每条诊疗记录包含既往史、主症、次症、其他症状、中医四诊结果、西医辅助检查结果、证型和药方共8个部分，其中“症状”泛指所有用于COPD诊断的各类信息。首先抽取既往史、主症、次症、其他症状、中医四诊结果、西医辅助检查结果等共计106项；由于患者的临床表现通常由主证决定，兼证常由患者的某些体征提示，与主诉相关性不大，且病例样本来源单一，数量偏少，分析多证型并存的情况难度较大，故本文证型特指主证型1项；药方包含248种中药饮片的使用情况，因录入格式较为规范，所以数据预处理环节只针对采集的原始症状、证型两部分，药方部分不作处理。症状部分数据的预处理流程如图1所示。

图1 2232例COPD患者症状数据预处理流程

首先，剔除与诊断无关或无法量化的描述性字符串13项。由于某些症状在实际病案中记录极少，80%的数据集样本都不包含这些症状，为了避免影响模型训练，剔除相应数据中的这部分症状。对剩余的部分症状进行针对性计算与合并，处理后症状项数减少8项。其次，对这些症状依次进行分级、量化。例如，描述患者咳嗽频率的症状可根据咳嗽发作时间和是否影响工作生活而被划分为3个等级，并分别用整数1、2、3对其进行编码，以此量化表示患者的咳嗽频率症状。最后，对每个症状的量化表示值进行归一化，使其取值范围变换到[0，1]内，得到证型分类实验的83个初始特征。

1.2 Fisher特征选择

Fisher特征选择算法是一种用于找出最相关的分类特征的算法，目标是从原始特征集中挑选出最有效的原始数据特征，即从数据空间的所有特征中确定敏感子集，其基本思想是：越敏感的特征，在同类数据点之间的距离越小，在不同数据点之间的距离越大。

通过计算Fisher分数，从症状部分的83个初始特征中挑选出与证型相关性较强的特征用于证型分类，避免将无意义特征输入模型训练。对所有特征计算Fisher分数后，按照分数高低对特征的敏感性进行排序，图2展示了83个初始特征的Fisher分数归一化后的分布情况。其中，Fisher分数排名前3位的分别是“主症加重时间”“舌苔的厚薄”“脉象的沉浮”，排名后3位的分别是“是否有支气管哮喘”“是否有高血压”“是否有冠心病”。从图2可以观察到，Fisher分数在60位之后的特征敏感性较低。在尽量保留更多特征的前提下，取不同阈值进行实验，实验结果表明，取65个特征时实验效果最好。

图2 症状初始特征的Fisher分数示意图

1.3 证型预测模型构建

用于COPD中医证型分类的四层深度前馈网络包含1个输入层、2个隐藏层和1个输出层，各层节点数分别为65、50、30、9，隐藏层使用ReLU函数作为激活函数，输出层使用softmax作为激活函数。训练中使用反向传播（backpropagation，BP）算法反馈误差，更新网络参数。在每个隐藏层后添加Dropout单元[14]，抑制网络可能出现的过拟合现象。Dropout使模型不再依赖于特定的某些节点，降低了节点之间复杂的共适应性，减少了某些样本特征仅在其他特定特征下才有效的情况，对于抑制过拟合现象具有显著作用。该深度前馈网络在添加Dropout单元后的网络结构见图3。

图3 基于深度前馈网络的证型分类器结构

1.4 典型药物推荐模型构建

为使推荐的药物更加符合实际病情，将中药推荐分为典型药物推荐和补充药物推荐2个部分。典型药物是指特定证型的典型药物，即遵循证型对应的治则治法且在该证型治疗中使用频率较高的药物。补充药物指药方中针对患者个体特性而开具的药物，不具有证型典型性。图4展示了基于症状-证型-药方关系的模型构建图。

典型药物推荐模型的构建主要分两步：首先通过频数分析、查阅中医文献对各个证型的典型药物进行归纳，然后通过粒子群优化（particle swarm optimization，PSO）算法-BP神经网络在归纳药物范围内进行典型药物的推荐。

图4 基于症状-证型-药方关系的模型

频数分析法[15]通过统计目标在某样本范围内出现的频数，根据频数及其占比查看数据的基本分布形态。对9类样本依次独立进行频数分析，针对单个证型按以下流程进行典型药物归纳。首先，统计该证型样本的所有处方中出现过的药物的频数，以频数与处方数的比值作为该药物出现的频率；其次，根据频率由高到低将该证型下所有药物排序，将这些药物构成的集合称为集合；最后，通过查阅中医文献，获取该证型的治则治法和典型药物[16]，将查阅文献得到的证型典型药物构成的集合称为集合（由于证型与典型药物的关联是中医知识库中现有的结论，故本研究不做详述）。根据集合和集合归纳出该证型的典型药物，力求使其同时符合中医临床治疗理论和COPD数据集药物使用的实际情况，归纳步骤如下：

根据以上方案，对1 070篇报刊文本和500条微博文本进行分类和编码，将编码数据导入SPSS，进行描述性统计，得到传统媒体和新媒体的话语主题和话语倾向的基本情况和随时间的变化趋势。

a）从集合中选择出现频率＞的药物，构成集合；

b）从集合中选择出现频率在[，]内的药物，构成集合；

c）取集合与集合的交集，构成集合，即＝∩；

d）取集合和集合的并集，构成集合，即＝∪。集合中的药物即为所归纳的该证型典型药物。其中，和值根据各证型药物排序的实际情况确定。

传统BP神经网络利用BP算法进行参数更新，但是学习速度慢且可能陷入局部极小值，因此使用PSO-BP神经网络构建典型药物推荐模型。PSO-BP神经网络与BP神经网络的区别主要在于，训练网络时不是单一使用梯度下降的BP算法进行网络参数的更新，而是先使用PSO算法寻找全局最优解，通过多次迭代得到的位置参数作为神经网络的初始化参数，再使用BP算法训练网络，即由PSO和BP算法共同寻找最佳网络参数。

为充分利用患者的中医证型信息，典型药物推荐算法对9种COPD证型分别建立9个典型药物推荐模型，每个模型相互独立，推荐药物结果属于各自证型的典型药物范围，训练过程只使用各自证型内的样本数据。

单个典型药物推荐模型使用3层PSO-BP神经网络构成，ReLU作为激活函数，均方根误差作为神经网络的损失函数和PSO算法的适应度函数。网络的输入为从症状部分提取的特征，网络的输出为该证型各典型药物的推荐概率值，设置阈值，将推荐概率＞的药物作为推荐药物。网络输出用概率向量表示，假设该证型的典型药物数量为，则各典型药物推荐概率值用向量表示为[1,2, …,p]，其中p表示第种药物的推荐概率。对于训练集中的已知药方，若药方中存在某药物，则认为该药物的推荐概率为1，不存在则为0。

经过对9种证型分别建模和训练后，得到对应9个COPD证型的典型药物推荐模型。对于已经确定证型的患者，选择相应证型的典型药物推荐模型，以症状特征作为输入，即可得到各典型药物的推荐概率值，将所有推荐概率值＞对应的药物作为模型推荐的典型药物。

1.5 补充药物推荐

在COPD中医诊疗中，除了证型对应的典型药物，还有一些针对个体差异的药物，这些药物与患者的实际症状和疾病史息息相关。因此，在COPD诊疗数据集中挖掘症状、药物之间的关联性，据此向具有特定症状的患者推荐相应的药物，作为对典型药物构成的药方的进一步补充。

利用Apriori算法[17]在全部证型的数据集中挖掘症状-药物关联。先将样本的表示形式规范化，将每个样本的症状特征和药方包含的药物种类提取出来，每个特征或每种药物作为该样本的1个属性，每个样本用其包含的所有属性的集合表示，例如某样本被表示为：{“60岁以上”，“吸烟”，“油烟、粉尘、有害气体接触史”，“咳嗽”，“严重呼吸困难”，“胸闷”，“恶风/恶寒”，“小便：涩痛”，“乏力”，“面色淡白无华”，“唇甲紫绀”，“舌质：淡红”，“舌体：胖”，“舌苔：薄”，“苔色：黄”，“脉象：沉”，“双肺呼吸音：低”，“X片/胸部CT有双肺肺气肿表现”，“第一秒用力呼气容积（FEV1）/用力肺活量（FVC）＜70%”，“FEV1占预计值百分比：30%～50%”，“白芥子”，“地龙”，“茯苓”，“防风”，“瓜蒌皮”，“黄芪”，“黄柏”，“红景天”，“灵芝（树舌/平盖）”，“（炙）麻黄”，“（紫）苏子”，“淫羊藿”，“泽泻”}。

设置最小支持度和最小置信度，在全部样本集合中运用Apriori算法，获取支持度大于最小支持度的所有频繁项集，在该频繁项集中提取置信度大于最小置信度的规则作为强关联规则。挖掘出的关联规则有多条，其中规则的前项和后项各有3种可能的类型：⑴包含1个或多个症状的症状组合；⑵包含1个或多个药物的药物组合；⑶包含至少1个症状和至少1个药物的症状-药物组合。由于后项包含症状的关联规则表征的是症状出现的可能性，而非药物使用的可能性，因此，只取后项为药物组合的关联规则用于补充药物的推荐，如表1所示。

表1 用于补充药物推荐的关联规则种类

由于测试样本的症状、典型药物推荐结果都已知，在症状和推荐的典型药物中寻求与关联规则前项相匹配的组合，将该条规则的后项作为拟推荐的1个补充药物组合。剔除该药物组合中已存在于推荐的典型药物中的药物，将剩余药物作为1个推荐的补充药物组合，对应规则的置信度作为该补充药物组合的推荐度。进行多次关联匹配后，最终得到数个补充药物组合及各自的推荐度，将所有补充药物组合的并集作为最终推荐的补充药物集合，每个药物的推荐度由其所在的所有补充药物组合的推荐度的均值表示。

2 结果

2.1 证型分类实验

本实验使用的COPD数据集包含2 232条COPD诊疗记录，经过预处理和症状特征选择后，得到2 232个样本用于证型分类实验。将经过预处理后的症状特征作为本实验的输入特征，将9种证型的编码作为输出的类别标签。实验采用10折交叉验证，进行10次训练和测试，取测试结果的均值作为该方法的测试结果。

实验采用6种证型分类算法做对比实验，分别为K最近邻[18]、AdaBoost[19]、随机森林（random forest，RF）[20]、支持向量机（SVM）方法[21]、深度信念网络（DBN）方法[22]和本研究提出的基于深度前馈网络的证型分类算法（multi-layer perceptron，MLP）。6个分类模型都基于Python语言和Pytorch深度学习框架实现，各方法得到的证型分类准确率分别为67.56%、69.22%、62.30%、79.04%、74.23%、82.39%，MLP方法的证型分类准确率最高。实验结果表明，所提出的证型分类模型能较好地完成证型分类任务。

2.2 药物推荐实验

2.2.1 典型药物推荐本实验对9种COPD中医证型分别构建了典型药物推荐模型，下面以外寒内饮证为例展示典型药物推荐实验结果。

实验构建含1个隐藏层的3层PSO-BP神经网络，隐藏层节点数为50，使用从症状部分提取的74个特征作为PSO-BP神经网络的输入，对应16种外寒内饮证典型药物的16维推荐概率向量作为网络输出，设置推荐阈值＝0.5，学习率为0.001。设置PSO粒子数为75，惯性权重为0.5，学习常数1＝2＝1.6，粒子位置和速度的取值分别限定在区间[-5，5]和[-1，1]内。实验使用248例外寒内饮证样本集，每次实验按200∶48比例随机划分训练集和测试集，取10次实验测试结果的均值作为最终测试结果。

使用均方误差（MSE）和平均绝对误差（MAE）作为典型药物推荐模型的评价指标。MSE和MAE常用于衡量模型预测值与真实值之间的误差大小，取值越小表明预测结果与真实结果越接近，模型的拟合程度越高。为便于和所提出的基于PSO-BP神经网络的典型药物推荐算法进行比较，使用1种经典的推荐算法和2种神经网络方法分别构建典型药物推荐模型作为对照，分别为基于聚类的协同过滤（collaborative filtering，CF）算法[23]、BP神经网络方法和GA-BP神经网络方法[24]。其中，CF算法使用聚类算法计算用户相似度，结合协同过滤思想构建推荐项目集；GA-BP神经网络是利用遗传算法（genetic algorithm，GA）优化过的BP神经网络。4种方法的测试结果见表2。

表2 4种典型药物推荐模型测试结果比较

基于PSO-BP神经网络的典型药物推荐算法测试得到的MSE和MAE低于另外3种方法，PSO算法的优化使模型表现在原本BP神经网络的基础上有了显著提升。本研究的典型药物推荐算法在中医药推荐环节可以实现较为可靠的典型药物推荐。

2.2.2 症状-药物关联规则挖掘症状-药物关联规则挖掘实验在全部证型的COPD数据集中进行，样本量为2 232，共2 232个中医药方。设置最小支持度和最小置信度后，可得到由症状、药物组成的关联规则，剔除后项包含症状的规则，剩余规则可用于补充药物推荐。将最小支持度设置为0.20且保持不变，最小置信度在0.60～1.00之间取值，表3展示了最小置信度取值变化时，可用于补充药物推荐的关联规则数的变化。随着最小置信度从0.60增加到0.98，关联规则数从2 960下降到0。为了增强补充药物推荐的可靠性，取最小置信度为0.90得到的关联规则作为补充药物推荐的依据，此时满足条件的规则有261条。

表3 不同置信度下的关联规则数

衡量关联规则的指标有支持度、置信度和提升度。支持度为规则在样本集合中出现的频率，反映规则的普遍性；置信度为规则在满足前项匹配的样本集合中出现的频率，反映规则的可靠性；提升度（）则可以反映前后项之间的关联性，计算公式如式⑴：

式⑴中，表示事件出现的概率，表示事件出现的频数，表示样本总数。提升度＞1表示二者具有正相关性，且值越大表明相关性越强。和指关联规则的前项和后项。

表4展示了部分关联规则及其评价指标。关联规则支持度＞0.20，置信度＞0.90，证明前项与后项之间存在较强的相关性，表明算法挖掘得到的关联规则具有一定的可信度，本研究可以在完成典型药物推荐的基础上利用关联规则为患者推荐合适的补充药物。

表4 部分关联规则及其评价指标

3 小结

COPD严重危害人类健康，其防治是一个重大的公共卫生问题。我国COPD患者的基数庞大，存在漏诊、错诊的情况，在国务院发布的《健康中国行动（2019－2030年）》[25]要求推进COPD防治工作和中医防治慢性病[26]的政策背景下，开展中医COPD智能诊疗技术研究并推动临床应用具有重要的理论和现实意义。本研究提出的基于深度前馈网络的证型分类算法能根据患者症状判断中医证型，且在COPD诊疗数据集上取得了较好的分类性能。提出的COPD药物推荐方法，充分利用症状、证型、药物三者之间的关联，将药物推荐分为典型药物推荐和补充药物推荐，可对特定证型的患者进行具体药物种类的推荐。实验和实际使用结果表明，本研究的证型分类和药物推荐方法具有较好的智能诊疗效果，可为COPD的中医临床诊疗提供参考与借鉴。

[1] 李薇,杨汀,王辰.中国慢性阻塞性肺疾病防治现状及进展[J].中国研究型医院,2020,7(5):1-5.

[2] YING J, Dutta J, GUO N, et al. Classification of exacerbation frequency in the COPD gene cohort using deep learning with deep belief networks[J]. IEEE Journal of Biomedical and Health Informatics, 2016,24(6):1805-1813.

[3] Sugiarto T, Hsu C L, Sun C T, et al. An automatic COPD diagnosis with deep learning on topology-preserving multi spectral image of EEG data[J]. Basic & Clinical Pharmacology & Toxicology, 2019,124(S3):13-14.

[4] 黄嘉韵,郭宏,邝艳萍.基于决策树算法的鼻鼽辨证规律初步研究[J].中华中医药杂志,2016,31(11):4770-4773.

[5] 叶培.最大熵在中医智能辨证的研究及其应用[J].计算机时代, 2015(3):50-52,55.

[6] 徐琳,赵瑜,彭景华,等.慢性乙型肝炎常见证候特征的二元Logistic回归分析[J].中华中医药杂志,2015,30(5):1780-1783.

[7] 张颖,纪文迪,周毅萍,等.基于隐语义模型的中医在线辅助诊疗系统[J].计算机应用,2017,37(S1):303-307.

[8] 李洪峥,王阶,何浩强,等.基于中医思维的冠心病心绞痛病证结合诊疗知识模型构建[J].中医杂志,2019,60(15):1288-1293.

[9] 林犷.慢性肾小球肾炎的中医症状-证候-药物关联规则挖掘的研究[D].成都:电子科技大学,2016.

[10] GU Q Q, LI Z H, HAN J W. Generalized fisher score for feature selection[C]//The 27th Conference on Uncertainty in Artificial Intelligence, Barcelona, 2011:266-273.

[11] Goodfellow I, Bengio Y, Courville A, et al. Deep learning[M]. Cambridge: MIT press, 2016:163-220.

[12] DENG Y, XIAO H J, XU J X, et al. Prediction model of PSO-BP neural network on coliform amount in special food[J]. Saudi Journal of Biological Sciences, 2019,26(6):1154-1160.

[13] 樊长征,苗青,樊茂蓉,等.慢性阻塞性肺疾病稳定期中医临床实践指南(征求意见稿)[J].中国中药杂志,2020,45(22):5309-5322.

[14] WEI C, Kakade S M, MA T. The implicit and explicit regularization effects of dropout[C]//International Conference on Machine Learning. PMLR, 2020:10181-10192.

[15] 贾俊平,何晓群,金勇进.统计学:第7版[M].北京:中国人民大学出版社,2018:41-43.

[16] 李建生.国际中医临床实践指南慢性阻塞性肺疾病[J].世界中医药,2020,15(7):1084-1092.

[17] HAN J W, Kamber M, PEI J.数据挖掘概念与技术:原书第3版[M].范明,孟小峰,译.北京:机械工业出版社,2012:160-165.

[18] Peterson L E. K-nearest neighbor[J]. Scholarpedia, 2009, 4(2):1883.

[19] Freund Y, Schapire R E. A decision-theoretic generalization of on-line learning and an application to boosting[J]. Journal of Computer and System Sciences, 1997, 55(1):119-139.

[20] Breiman L. Random forests[J]. Machine Learning, 2001, 45(1):5-32.

[21] 李航.统计学习方法[M].北京:清华大学出版社,2012:95-130.

[22] HUA Y M, GUO J H, ZHAO H. Deep belief networks and deep learning[C]// Beijing Inst. of Tracking & Telecommun. Proceedings of 2015 International Conference on Intelligent Computing and Internet of Things. Harbin, 2015:1-4.

[23] LIU X J. An improved clustering-based collaborative filtering recommendation algorithm[J]. Cluster Computing, 2017,20(2):1281-1288.

[24] 刘春艳,凌建春,寇林元,等.GA-BP神经网络与BP神经网络性能比较[J].中国卫生统计,2013,30(2):173-176,181.

[25] 陈华东,廖晓阳,刘长明,等.《健康中国行动(2019－2030年)》之重大专项行动核心要点解读与启示:全科医生视角[J].中国卫生事业管理,2020,37(12):958-960.

[26] 新华社.中共中央国务院关于促进中医药传承创新发展的意见[N].人民日报,2019-10-27(001).

Study on TCM Intelligent Diagnosis and Treatment for Chronic Obstructive Pulmonary Disease

LI Zhen1, JIANG Guo-xing1*, FENG Yi2, FAN Jia-hao1, YANG Hong-zhi2, 3, ZHANG Wei3

(1. School of Electronic Information and Communications, Huazhong University of Science & Technology, Wuhan 430074, China; 2. Hubei Provincial Hospital of Traditional Chinese Medicine, Wuhan 430000, China; 3. Hubei University of Chinese Medicine, Wuhan 430000, China)

To explore the application of deep learning in syndrome prediction and medicine recommendation of chronic obstructive pulmonary disease (COPD).The information of symptoms, syndrome types and medicine was extracted from real diagnosis and treatment data and was under preprocessing. Fisher feature selection algorithm was used to screen the strong correlation symptoms with syndrome types as the input of four-layer deep feedforward network to predict TCM syndrome types. The medicine recommendation was divided into typical medicine recommendation and supplementary medicine recommendation. The typical medicine recommendation models of each syndrome type were constructed using frequency analysis and PSO (particle swarm optimization)-BP (backpropagation algorithm) network, and the supplementary medicine recommendation was completed by mining association rules. Finally, the results of syndrome type prediction and medicine recommendation were evaluated by corresponding indicators.The classification accuracy of nine TCM syndrome types on 2 232 COPD patient data was 82.39%. For syndrome of external cold and internal retained morbid fluid, the mean square error (MSE) of the recommended results of typical medicines based on 233 medicines was 0.009 1,and the mean absolute error (MAE) was 0.087 9. Totally 261 association rules for supplementary medicine recommendation have been mined when the minimum support and the minimum confidence were respectively set to 0.2 and 0.9.The experimental and practical results show that the syndrome type classification algorithm based on deep feedforward network and the medicine recommendation algorithm based on frequency analysis and PSO-BP network proposed in this study can better complete the syndrome type prediction and medicine recommendation of COPD patients, and have better intelligent diagnosis and treatment effect.

chronic obstructive pulmonary disease; classification of TCM syndromes; TCM recommendation; algorithms; PSO-BP network

R259.63

2095-5707(2022)06-0017-07

10.3969/j.issn.2095-5707.2022.06.003

李祯,江国星,冯毅,等.慢性阻塞性肺疾病的中医智能诊疗研究[J].中国中医药图书情报杂志,2022,46(6):17-23.

湖北省重点研发计划项目（2020BAB027）

李祯，E-mail: 614645906@qq.com

江国星，E-mail: gxjiang@mail.hust.edu.cn

（2022-02-28）

（修回日期：2022-03-21；编辑：魏民）