刘莉萍 章新友 郭永坤
摘 要:基于BP神经网络构建76味补虚药分类模型。采用数据挖掘方法挖掘补虚药药效,利用Python语言实现BP神经网络,并构建药效分类模型及其应用。对12味补虚药进行测试,其中有10味预测结果正确,正确率为83.33%。通过药性分布可知,补虚药的主要特征为温、甘,归经为脾、肾、心经。采用中药性味归经为特征对中药分类进行预测,实验结果表明,基于BP神经网络的药效分类模型具有一定的可靠性和准确性,亦为中药分类方法研究提供了借鉴。
关键词:中药药性;功效分类;BP神经网络
DOI:10. 11907/rjdk. 182484
中图分类号:TP301
文献标识码:A文章编号:1672-7800(2019)006-0006-04
Abstract: Based on the BP neural network, a classification model of 76 flavored drugs was established. Data mining method was used to mine the efficacy of tonic drugs, and BP neural network was used to construct the pharmacodynamic classification model and its application. 10 of the 12 flavours were tested correctly with a correct rate of 83.33%. Through the distribution of drug, we can see that the main characteristics of reinforcing deficiency medicine are warm and sweet, and the meridian is the spleen, kidney and heart meridian. In this study, the characteristics of flavor meridian of traditional Chinese medicine were used to predict the classification of traditional Chinese medicine. The experimental results show that the classification model based on BP neural network has certain reliability and accuracy, and provides a reference for the study of traditional Chinese medicine classification methods.
Key Words: properties of traditional Chinese medicine; efficacy classification; BP neural network
0 引言
中药药性理论是先辈们在长期行医实践中总结提炼出来的中药学理论,药效是根据中医药理论对药物治疗作用的高度概括,两者都是中药理论的重要组成部分[1]。历代医家均强调“药性互参”、“性效结合”的中医学整体观[2],“中药药性—功效”共同构成一个有机整体。随着计算机技术的发展,利用数据挖掘方法研究中药性效规律,阐述中医药疾病治疗机理,有助于揭示现代中医药的科学本质内涵,为中医药国际化提供有效的理论支持。
人工神经网络具有自学习、自适应功能特征,能够很好地处理非线性数据,恰好对应于中药数据的非线性、高维度等特征,近年来被广泛应用于中药领域[3]。相翠玉等[4]将近红外漫反射光谱分析技术与人工神经网络方法相结合,对不同产地的大黄进行识别,识别正确率可达95%;刘星等[5]以不同产地和品种的薏仁近红外光谱数据作为研究对象,采用学习向量化神经网络建立薏仁分类识别模型,预测准确率可达90%以上;王丽琼等[6]利用麻黄药材HPLC指纹图谱信息建立BP-ANN模型,对不同产地的麻黄进行分类,该模型对不同种类及产地麻黄药材的预测准确率达到94.4%;汤彦丰等[7]采用傅里叶红外光谱扫描 42种紫花地丁样品,利用径向基神经网络建立分类模型对野生紫花地丁与栽培紫花地丁进行鉴别,识别正确率达到95.24%。由此可见,人工神经网络在中药领域的研究已取得较好效果。因此,本文采用BP神经网络构建补虚药药效分类预测模型,以常用76味补虚药的性味归经为研究对象,并利用Python语言实现对中药药效的智能预测。
1 中药四气五味与归经
《神农本草经》序例云“药有酸咸甘苦辛五味,又有寒热溫凉四气[8]。”每味中药都有四气、五味的不同,因而可发挥不同治疗作用。历代本草在讨论药物功用时,首先标明其“气”和“味”,可见气与味是识别各种药物性能的重要标志之一。
四气,又称为四性,指寒热温凉4种不同药性,它反映药物对人体阴阳盛衰和寒热变化的作用倾向,是药性理论的重要组成部分[9]。四气之中寒凉与温热是相对立的两种药性,其中寒与凉、温与热之间仅有程度上的不同,即“凉次于寒”、“温次于热”。有些书籍甚至进一步用“大寒”、“大热”、“微酸”、“微苦”对中药四气进行描述,然而其从本质而言,只有寒热两性的区分[4]。四性之外还有一类平性药,如甘草、山药、党参等,这类药物药性寒热界限不太明显,且药性平和、作用缓和,因此对于平性是否入性,医家对此也有不同看法[10]。
五味,即酸、苦、甘、辛、咸5种不同药味,有些还具有淡味或涩味,所以实际上不止5种药味,但此5种是最基本的药味。五味最初是通过人品尝得到的,但在长期实践过程中发现,五味不仅是药物味道的反映,更是对药物作用的高度概括[11]。五味也具有阴阳五行的属性,即“辛甘发散为阳,酸苦涌泄为阴,咸味涌泄为阴,淡味渗泄为阳”。酸味属木、苦味属火、甘味属土、辛味属金、咸味属水。
归经表示药物作用部位,即某药对某些脏腑经络有特殊的亲和作用,因此该药对相关部位的病变起着主要治疗作用。药物归经不同,治疗作用也不同[12],掌握中药归经理论,可以有效提高用药准确性。中药归经理论是在中医基本理论指导下,以脏腑经络学说为基础、以药物治疗具体病证为依据,从长期临床实践中归纳总结出来的。由于经络能沟通人体内外表里,体表病变可通过经络影响到内在脏腑,反之,内在脏腑病变也可反映于体表上。
2 BP神经网络原理与训练过程
2.1 BP神经网络基本原理
BP(Back Propagation)神经网络是1986年由Rumelhart&McClelland等科学家提出的概念,是一种按照误差逆向传播算法训练的多层前馈神经网络,也是目前应用最广泛的神经网络[13]。BP神经网络主要分为输入层、隐含层和输出层,其结构如图1所示。输入層是指输入数据集构成的向量集合,其输出是输入层及权值点积与激活函数的计算结果;隐含层可以是一层,也可以是多层,一般不超过两层,其输入是上一层输出层与权重的点积标量,输出是该标量与激活函数计算结果;输出层只有一层,其输入是上一层输出层与权重的点积。输出层计算与隐含层相同,计算结果是最终预期的分类权值。
BP神经网络训练分为两步:一是根据当前参数值,计算前项传播过程中每一层的输出值;二是根据实际输出与期望输出之间的差,反向传播计算每一层的误差传播项,结合每一层输出关于该层参数的偏导数,实现每一层参数的更新。重复以上两步,直至该过程收敛。
2.2 BP神经网络训练过程
BP神经网络训练包括3个阶段:正向传播过程、期望与实际分类误差计算与反向传播过程计算。
3 BP神经网络模型构建及应用
3.1 中药药性指标量化处理
本文以全国高等中医药院校规划教材《中药学》(第四版)的76味补虚药为样本数据进行研究[11]。本文模型主要考虑中药的四气、五味和归经,总共22种属性与中药药效之间的关系,但由于采用数学方法对中药性味归经与药效关系进行研究,所以需要对中药药性特征进行数值化处理。本文采用二值量化方法对药性进行特征处理。例如,中药的四气属性“寒、热、温、凉”,每味中药具有哪项特征,则将其记为1,否则为0。同理,对中药的五味、归经和补益类4个功效即补气、补阳、补血、补阴也进行二值量化处理,得到部分量化结果如表1所示。
3.2 补虚药BP神经网络构建与应用
Python是最近十分流行的一款编程软件,由于其拥有丰富的扩展类库,并具有简单、易学、速度快等特点,在数据挖掘领域的应用越来越广泛。本文利用Python的numpy库构建BP神经网络模型[12]。首先,确定输入层、隐含层与输出层神经元数目。根据中药药性的四气、五味和归经情况,本文选取22个参数作为神经网络输入单元,将补益类中药的4种功效即补气、补阳、补血和补阴4个参数作为输出单元,输出范围取0~1。根据文献[14]-[18],经综合考虑,将本模型隐含层确定为1层,隐含层神经元数目跟据经验公式进行确定,最终确定隐含层神经元数目为44层;其次,建立补虚药药效的BP神经网络数学模型,并进行训练与测试。根据确定的输入层、隐含层和输出层神经元数目以及隐含层数目,本文建立一个输入节点为22、隐含节点为44、输出节点为4的三层BP神经网络。激活函数采用常用的S型函数Sigmoid,因为其能较好地反映人工神经网络的输入输出特性。本模型在纳入的76味中药中,随机抽取64味中药作为训练数据,剩余12组样本作为测试数据。
3.3 补虚药BP神经网络测试结果
经过1 000次迭代运算之后,权重误差达到最优,得到实际输出结果如表2所示,测试样本期望输出与实际输出的正确率比较如表3所示。根据表3结果可看出模型正确率高达83.33%,效果较好。
4 总结与展望
研究结果表明,在测试集12个中药功效预测对应的48个数据中,只有2个数据错误,预测准确率高达83.33%,表明本模型在中药功效分类预测应用中具有一定实用价值,并可将其推广到中药性效研究中。本模型研究中药四气五味与中药性效之间的关系,采用数据集为补虚类中药,其中大部分补虚类中药性温、甘,归肝、脾、肾、肺、心经,导致数据集具有很强的相似性,要求在模型参数设置上更加精确。而且中药性效与中药各成分关系之间是非线性的,作用机制十分复杂,采用传统研究方法难以做到全面分析。人工神经网络具有很强的自学习能力、自适应能力及针对非线性关系的处理能力,因此利用BP神经网络对中药性效进行系统研究是行之有效的。
由于中药成分与功效的复杂性,下一步研究将会考虑更多自变量因素,以提高模型分类准确性。例如:中药除四气五味归经外,还会受到毒性等因素影响,在四气五味中,“寒”还可细分为“大寒”和“小寒”,而本模型将其统一划分为寒。此外,本模型采用的数据量子化方法应实现自动量子化,将有利于对较大数据集的处理。因此,在今后研究中可采用更快捷的量子化处理方法,同时扩大训练数据集种类,以提高模型稳定性,并促进本模型在中医药研究领域得到更加广泛的应用。
参考文献:
[1] 李扬,冯旭,宋舸,等. 中药药性的研究方法进展[J]. 医学信息,2018,31(13):38-40.
[2] 毛德西. 中医整体观有三论[N]. 中国中医药报,2017-10-25(4).
[3] 周荣荣,闫润红,王丽萍,等. 数据挖掘技术在中医方剂科学问题研究中的应用[J]. 中华中医药杂志,2018,33(9):4016-4020.
[4] 相翠玉,宋晓勇. 中草药大黄的近红外光谱和人工神经网络鉴别分析[J]. 时珍国医国药,2012,12(3):3168-3169.
[5] 刘星,毛丹卓,王正武,等. 薏仁种类的近红外光谱技术快速鉴别[J]. 光谱学与光谱分析,2014,34 (5):1259-1263.
[6] 王丽琼,范琦,易珍奎,等. HPLC指纹图谱结合反向传播人工神经网络和判别分析鉴定不同的麻黄药材[J]. 西南师范大学学报:自然科学版,2012,37(5):73-77.
[7] 汤彦丰,候占忠,王志宝,等. 紫花地丁的红外光谱和径向基神经网络鉴别[J]. 湖北农业学,2014,53(1):132-134.
[8] 李味味,章新友,仵倚,等. 基于BP神经网络中药复方功效的预测研究[J]. 中医药导报,2016,22(16):38-41.
[9] 王建,曾南,夏厚林,等. 中药药性理论研究模式的新思路[J]. 中医杂志,2013,54(2):99-102.
[10] 金锐,张冰. 中药药性理论复杂性特征分析[J]. 中国中药杂志,2012,37(21):3340-3343.
[11] 陈素红,吕圭源. “性、味结合归经”层面研究中药药性[J]. 中药药理与临床,2008(4):58-62.
[12] 肖小河. 中药药性研究概论[J]. 中草药,2008(4):481-484.
[13] 王振国. 中药药性理论现代研究:问题、思路与方法[J]. 山东中医药大学学报,2011,35(3):195-198.
[14] 钟赣生. 中药学[M]. 北京:中国中医药出版社,2016.
[15] SHEN X, WANG L, HAN D. Application of BP neural network optimized by artificial bee colony in intrusion detection[J]. Computer Engineering, 2016(2):190-194.
[16] DAS H,JENA A K,NAYAK J, et al. A novel PSO based back propagation learning-MLP (PSO-BP-MLP) for classification[M]. India:Springer,2015:333-344.
[17] NIE P L, FEI D, WANG H J, et al. Short-term power load forecasting based on EMD-BP neural network[J]. Control & Instruments in Chemical Industry, 2016.
[18] ZHAO Z,XU Q,JIA M. Improved shuffled frog leaping algorithm-based BP neural network and its application in bearing early fault diagnosis[J]. Neural Computing & Applications, 2016, 27(2):375-385.
(責任编辑:黄 健)