徐 亮陈守强侯建辉毕文霞袁 锋
(1山东中医药大学,济南,250014;2山东中医药大学第二附属医院心脏中心,济南,250001;3山东管理学院信息工程学院,济南,250001)
基于BP神经网络的中医辨证模型构建方法探讨
徐 亮1陈守强2侯建辉1毕文霞1袁 锋3
(1山东中医药大学,济南,250014;2山东中医药大学第二附属医院心脏中心,济南,250001;3山东管理学院信息工程学院,济南,250001)
摘要目的:以气虚证辨证模型为例,探讨中医辨证模型构建方法。方法:将684例名老中医医案录入电子病历中,利用其统计功能,创建验案症状表;将验案症状表导入Matlab软件中;利用BP神经网络程序,随机将669例医案作为训练数据,剩余15份病例作为测试数据。结果:测试数据与模型数据之间的绝对误差中,有3例大于0. 6,其余12例小于0. 3;灵敏度为83. 3%,特异性为77. 8%,预测一致性为80%。结论:本文以气虚证为例,结合BP神经网络技术,创建了一种中医辨证模型,准确率较高,并为挖掘名老中医辨证经验提供了一条新的途径,值得推广。
关键词辨证模型;BP神经网络;气虚;中医
The Research on the Constructlon of the TCM Dlfferentlatlon Model Based on BP Neural Network
Xu Liang1,Chen Shouqiang2,Hou Jianhui1,Bi Wenxia1,Yuan Feng3
(1 Shandong University of Traditional Chinese Medicine in Jinan,Ji'nan 250014,China;2 Heart Center of the Second Hospital Affiliated to Shandong University of Traditional Chinese Medicine in Jinan,Ji'nan 250001,China;3 School of Information Engineering of Shandong Management University in Jinan,Ji'nan 250001,China)
Abstract Objectlve:To construct a Traditional Chinese Medicine(TCM)differentiation model by taking qi deficiency syndrome differentiation model as an example. Methods:To input the 684 cases and medication records of TCM distinguished veteran doctors into the electronic medical records management system and build a table of symptoms using its statistical function. Then using BP neutral network to input the symptoms table into Matlab software and take 669 medical records as training data randomly. The last 15 medical records are taken as test data. Results:The absolute error in test data and model data shows that there are 3 cases that are greater than 0. 6,and the other 12 cases were less than 0. 3. The accuracy is 83. 3%,specificity is 77. 8%,and predication consistency is 80%. Concluslon:This research has developed a TCM syndrome differentiation model with high accuracy based on BP neural network,and explored a new way to summarize experience of TCM distinguished veteran doctors. Therefore,it is worthy of popularizing.
Key Words TCM differentiation model;BP neural network;Qi deficiency syndrome;TCM
“医圣”张仲景奠定了辨证论治的基础,而辨证论治也是中医学的精髓之一。证,指疾病发展到某一阶段的病理本质的概括[1],包括病因、病机等。辨证是指通过对望、闻、问、切四诊信息进行综合分析,判断疾病病理本质的过程。正确的辨证,是遣方用药的基础,是疗效的保证。但辨证过程中,很多资料难以具体描述和精确量化,给辨证的系统化和客观化研究带来了很大困难[2]。
BP神经网络,人工生物网络的一种,通过模仿生物大脑神经元之间的联系,模拟人大脑学习功能,建立输入到输出非线性的映射[3-5],并且通过自身调节各数据的权重,是输出结果接近期望值,有着传统统计方法无法比拟的适应性、容错性及自组织性等优点[6-7]。在国内外,有学者已将BP神经网络成功地用于某些疾病的辅助诊断和预后分析方面[8],例如:急性心肌梗死诊断、缺血性心脑血管病、肿瘤等疾病的诊断及预测[9-13]。中医望、闻、问、切四诊信息多为非线性数据,四诊各信息共同决定一个辨证过程,通过大量中医医案数据对神经网络进行训练,调节各数据的权重,使输出结果更接近于真实。名老中医为中医发展的宝贵财富,名老中医医案则成为名老中医经验的结晶,通过搜集名老中医病历,建立名老中医医案数据库,医案数据中包含着名老中医辨证经验。本文以气虚证辨证模型为例,利用名老中医数据库的大量数据,应用神经网络技术,探讨中医辨证模型的构建方法,同时,能够挖掘名老中医辨证经验。
1. 1 一般资料 684份名老中医医案来自书籍、论文,将其录入医案分析系统中。
2. 1 BP算法基本原理 神经网络的基本单位为神经元,与生物学中的神经元类似,能够接受、处理、输出功能。一定数量的神经元连接在一起,构成一个神经网络,神经网络包括输入层、隐含层和输出层。神经元之间通过权连接,权值的大小代表上一层神经元对下一层神经元的影响程度,各神经元的作用函数为Sigmoid函数,而同一层的神经元之间无相互作用。BP(Back Propagation)[14-15],该算法解决了多层神经网络权值调整问题。该方法建立在梯度下降法的基础上的,通过向后传播学习算法,从而实现对权值的调整,故又称为反向传播算法。训练过程由正向传播和反向传播组成:1)正向传播过程中,即用一组训练样本对神经网络进行训练,每一个样本包含输入和输出信息,输入信息由输入层传向隐含层,并在隐含层进行处理,之后传入输出层;2)以输出值与期望值比较,如果输出值与期望值差别较大,则转入反向传播过程,计算每一层实际输入值与期望输入值的误差,并将误差信号按照原来的通道返回,修改每层神经元的权值,最终使得误差信号最小。经过充分训练后的神经网络,获得了各层连接之间的权值,该神经网络各层权值的分配即为神经网络所获取的知识,能够反映样本数据的特征,其中包含各变量之间潜在的关系。进过训练后的神经网络,具有合适的权值连接,当给予输入后,会输出与目标相近的数值,由此构成非线性映射模型。
2. 2 验案症状表的建立 684份名老中医医案来自书籍、论文,将其录入医案分析系统中。以气虚证的辨证为例,通过验案分析系统统计功能,分别定义“问诊”和“望闻切诊”为列变量,在条件框中输入“乏力”,若医案中包含此症状,则该医案中的“问诊”或“望闻切诊”标记为“1”,若无此症状则标记为“0”,建立数据表,复制该表中的“问诊”或“望闻切诊”列到新建表格中,命名为“验案症状表”。在条件框中录入其他症状,同样方式,复制该表中的“问诊”或“望闻切诊”列到验案症状表中。选择其他气虚常见症状,按上述方法,建立如下表1,“ID”为某条验案的ID。此外,某些症状存在表述方式不同的情况,如头晕与眩晕,在条件框中输入该症状的多种表述方式,选择“or”型分析。
表1 验案症状表(节选)
2. 3 数据导入与分析 将建立好的验案症状表导入到Matlab软件中,随机选择669份医案作为训练数据,剩余15份病例作为测试数据。
2. 4 设置BP神经网络参数 BP神经网络三个层参数设置如下:1)输入层设计:输入层神经元的个数与变量的个数相同[16]。参考《中医基础理论》,并结合临床经验,本研究中选取乏力、气短等11个症状变量,故输入层神经元为11个。2)隐含层的设计:一般来说,隐层单元数太少,神经网络缺乏充分的训练,无法识别未学习过的样本;若层单元数太多,能够对神经网络进行充分的训练,但当输入模式与训练集稍有变化,则不能判别,而且显著的增加训练时间,容易出现过度拟合[17-18]。参考Kolmogorov定理,确定隐含层单元数范围,之后参考灵敏度修剪算法[19],设定合适的隐层单元数为8。3)输出层的设计:输出层的神经元个数与期望得出的变量数一致,本研究为1个神经元(是气虚证,输出1;非气虚证,输出为0)。其模式示意图,如图1所示。
图1 基于BP神经网络气虚辨证模型模式示意图
导出数据,15例测试数据中,6例为气虚证型,9例为其他证型。测试样本实际值、模型值、误差数值如表2所示;测试样本、模型值如图2所示。
测试数据与模型数据之间的绝对误差中,有3例大于0. 6,其余12例小于0. 3,其模型误差曲线如图3所示。
当模型值大于0. 6判定为气虚证,小于0. 3判定为非气虚证。该组模型预测值准确率统计如表2所示。
表2 测试样本实际值、模型值、误差数值
图2 测试样本
图3 模型误差
表3 模型准确率
BP神经网络通过训练集对其进行训练,其中训练集数据包括录入值与输出值,每次录入一个数据,都会通过调整隐层结点权值,使输出值尽可能接近预期值。当经过大量的数据训练之后,神经网络中各权值不断调整,达到最佳权值,该权值通过数据形式获取样本知识,反映样本数据特点及关联。中医辨证是通过望闻问切,综合四诊信息,来判定证型。虽然各种常见症状与证型的判定有一定的关系,而复杂的四诊信息共同决定一个证型的判定[20],所以各四诊症状与证型是非线性关系。BP神经网络,在处理非线性数据时,有着常规统计方法无法比拟的优势,通过不断调节各数据权重,使输出值接近于期望值,此过程与中医辨证过程极为相似。
本文以气虚证型为例,运用BP神经网络技术建立辨证模型,灵敏度为83. 3%(气虚证准确率),特异度为77. 5%(非气虚准确率),预测的一致率达到80%。证实了BP神经网络技术在中医证候研究中的可行性。通过医案数量的积累、必要的规范化处理,以及对输入层参数的合理选择,会较大提高预测的准确性;同时,更加合理的参数设定及优化处理,将大大提高预测精度及运行效率。该方法的建立,为探索中医辨证论治提供一种全新思路,同时,为名老中医辨证经验的挖掘提供新的途径。
参考文献
[1]王卓雅,曾光,向茗,等.证素辨证与中医药标准化[J].中医药导报,2015,21(4):1-4.
[2]刘龙,许玲,孙大志,等.一种胃癌模糊辨证模型的建立[J].中西医结合医学杂志,2008,6(11):1117-1121.
[3]蒋亮. BP神经网络的优化研究及应用[D].南昌:南昌大学,2014.
[4]王俊杰,陈景武. BP神经网络在疾病预测中的应用[J].数理医药学杂志,2008,21(3):259-262.
[5]岑红蕾,鲁敏,聂晶.基于BP神经网络的非线性函数逼近仿真研究[J].农业网络信息,2015(1):52-55.
[6]张景阳,潘光友.多元线性回归与BP神经网络预测模型对比与运用研究[J].昆明理工大学学报:自然科学版,2013,38(6):61-67.
[7]司建波,杨芳,郭蔚莹,等.基于BP神经网络的两阶段疾病预测模型[J].吉林大学学报:工学版,2013(S1):481-484.
[8]William G. Baxt. Application of artificial neural networks to clinical medicine[J]. The Lancet,1995(346):1135-1138.
[9]白丽娜.基于BP神经网络的中医体质辨识研究[D].天津:天津理工大学,2014.
[10]陈金宏,吴海云,何耀,等.基于BP神经网络的老年男性保健人群缺血性心脑血管病预测模型研究[J].第三军医大学学报,2011,33(8):797-799.
[11]范炤,吕吉元,陈泽华,等.基于BP人工神经网络的急性前壁心肌梗塞冠脉内支架术一年预后模型研究[J].中国卫生统计,2010,27(1):71-73,82.
[12]张鸣.初步构建基于我国肝移植受体的生存评估模型及其与MELD的比较研究[D].成都:四川大学,2006.
[13]刘清云,吕艳辉.改进的BP神经网络在医疗中的应用研究[J].沈阳理工大学学报,2013,32(3):48-51.
[14]谭文学,王细萍,席金菊,等.基于BP神经网络模型的疾病确诊方法研究[J].计算机工程与设计,2011,32(3):1070-1073.
[15]陈艳霞,刘挥.基于BP神经网络的医学数据分析[J].中国实用医药,2010,5(18):275-276.
[16]曾晓青. BP神经网络在建模中的参数优化问题研究[J].气象,2013,39(3):333-339.
[17]张德慧,张德育,刘清云,等.基于粒子群算法的BP神经网络优化技术[J].计算机工程与设计,2015,36(5):1321-1326.
[18]杨守建,陈恳. BP神经网络性能与隐藏层结构的相关性探究[J].宁波大学学报:理工版,2013,26(1):48-52.
[19]沈花玉,王兆霞,高成耀,等. BP神经网络隐含层单元数的确定[J].天津理工大学学报,2008,24(5):13-15.
[20]向茗,黄惠勇.中医辨证现代化研究现状与思路[J].湖南中医杂志,2015,31(1):145-147.
(2015-03-18收稿 责任编辑:张文婷)
第十三届世界中医药大会“一带一路”中医药文化周(大洋洲·2016)
The 13thWord Congress of Chinese Medicine OBOR TCM CULTURE WEEK(Oceania·2016)
第一轮通知
2016年11月10日-17日·大洋洲
各位专家、各位同仁:
由世界中医药学会联合会主办的世界中医药大会是全球中医药领域规模大、参与广、层次高的学术盛会。至今已在中国、法国、加拿大、新加坡、中国澳门、澳大利亚、荷兰、英国、马来西亚、美国、俄罗斯、西班牙成功举办了十二届。第十二届世界中医药大会期间首次举办“一带一路”中医药文化周系列活动,为中医药在欧洲的发展搭建了广阔的平台。
“第十三届世界中医药大会暨‘一带一路’中医药文化周”,将于2016年11月10日-17日在新西兰奥克兰市、澳大利亚墨尔本市举行。活动期间,来自世界各地的中医药专家学者、政府官员、企业家将分享他们的理论研究和临床经验、科研成果和新发明新创造,大会附设中医药服务贸易展览会。活动期间将组织多种形式的学术考察调研活动。
现就有关事宜通知如下:
一、地点:新西兰·奥克兰市、澳大利亚·墨尔本市
二、主题:继往开来,新世纪中医药更美好!
三、会议主要议题及征文内容:(征文要求见附件)
1.中医药基础理论研究;
2.中医药临床实践:临床研究方法创新与进展、临床疗效评估体系研究、老中医临证经验总结、特色疗法体会及推广、中医养生保健治未病研究等;
3.针灸推拿研究实践:针药配合临床研究、特殊针法临床经验介绍、中医针灸治疗在区域性疾病治疗中的特色与优势等;
4.中药研究:中药方剂学、临床配伍研究、中药应用及研究等;
5.中西医结合研究:理论创新、最新进展、实践创新、经验总结;
6.中医手法流派的传承与发展;
7.中医药国际标准化、信息化研究;
8.中医药在世界各国的发展及立法情况,各国中医教育动态、教育制度现状及科研情況;
9.中医药文化与非物质文化遗产保护;
10.道地药材与濒危珍稀动植物保护。
11.中医药服务贸易理论研究与实践及经验交流。
四、参会人员:
相关国家政府官员,各国中医药、传统医药、中西医结合、现代医药及相关领域从事医疗、教育、科研、管理、生产、贸易的专家学者和企业家,世界中联各国会员。
五、会议安排:
1.学术会议:开、闭幕式,主题演讲,分会场专题报告,现场演示工作坊,欢迎晚宴。
2.中医药服务贸展览会:每个展位:3×3 m,1张桌子,2把座椅,1个插座,基本照明,免2人参会注册费。
3.大会特刊:为了珍藏这一重要活动,将制作《第十三届世界中医药大会特刊》,收录具备一定资质的机构和个人。本次大会特刊将赠与我会65个国家的246个会员团体、各国驻华使馆、我国驻外使馆及有关国际组织和相关机构收藏。欢迎报名申请,费用另行通知。
4.参会者可授予国家级继续教育二类学分证书6分,如有需要,请提前告知大会组委会。
5.“一带一路”中医药国际交流考察:具体安排请咨询世界中联国际联络部。
六、重要日期:
2016年7月1日大会注册费优惠截止。
2016年7月31日大会论文投稿截止。
七、会议咨询、报名处:世界中医药大会组委会已开始接受报名,联系方式如下:
世界中医药大会办公室(国际联络部):邱珺、杨柳、潘眩、税毅强
电子邮箱:wccm@vip. 163. com,电话:010-58650243/58650240/58650026/58650058
世界中医药大会组委会
2015年11月16日
中图分类号:R241. 4;R311
文献标识码:A dol:10. 3969/j. issn. 1673-7202. 2016. 02. 041
通信作者:陈守强(1972—),男,山东泰安人,副主任医师,硕士生导师,研究方向:中西医结合心血管,E-mail:csq23800@163. com
作者简介:徐亮(1989—),男,山东济南人,山东中医药大学2009级七年制硕士研究生,研究方向:中西医结合心血管,E-mail:1181193919@qq. com
基金项目:2014年山东省科技惠民计划项目(编号:2014kjhm0115)