基于人工神经网络的心系基础证诊断模型构建*

2013-10-10 12:17吴承玉
中国中医基础医学杂志 2013年9期
关键词:诊断模型病性病位

杨 涛,吴承玉

(南京中医药大学基础医学院,南京 210023)

吴承玉教授经过数十年的研究与实践,提出五脏系统辨证体系[1],研究由单一病位与单一病性构成的基础证,将其有机组合后可以执简驭繁地把握灵活多变、动态的证。由于病位、病性特征与基础证之间具有非线性、复杂性等特征,较难建立规范、准确的数学模型,给病证规范化及诊断信息化带来了障碍。

人工神经网络(Artificial Neural Network,ANN)是一种应用类似于大脑神经突触连接的结构进行信息处理的数学模型[2]。误差反向传播(Back-Propagation,BP)神经网络是ANN中应用最为广泛的1种模型,它是由非线性变换单元组成的前馈网络,通过对输入输出样本的自动学习,能够以任意精度逼近任意复杂的非线性映射。BP神经网络的这一特性使其可以作为多维非线性函数的通用数学模型。因此,本文从心系入手,利用BP神经网络建立心系基础证诊断模型,用以模拟心系病位、病性特征与基础证之间的非线性映射。

1 资料与方法

1.1 数据准备

项目团队在开展心系基础证[3]的研究中,通过文献调研、流行病学调查及专家咨询等方法,确定了心系基础证8类,心系病位、病性特征125个。搜集江苏省中医院病案室2000年至2010年存档的心系病证的病案1394份,古今医案及临床报道的典型病案347份,合计1741份。由于病案资料在各类心系基础证[4]上分布不均匀,因此本研究分层随机抽取属于心气虚证、心血虚证、心阴虚证、心阳虚证、心血瘀阻证、心火亢盛证、痰蒙心神证、瘀阻脑络证的病案资料各50份,合计400份,复合证(多个基础证组合构成)病案资料100份,共计500份。

1.2 数据格式化及编码

心系病位、病性特征涉及125个症状,将每个症状用1个二进制位标识,有该症状则对应的二进制位为1,没有则为0。将500份病案资料整理成如表1所示的形式。

表1 病位特征编码

表2显示,将每个基础证作为一个属性,用1个二进制位标识,有该基础证则标为1,没有则为0。

1.3 建立神经网络模型

利用MATLAB 7.11构建BP神经网络模型(见图1),输入层125个节点,对应125个心系病位、病性特征;隐含层18个节点(通过比较不同节点下的网络误差,发现当隐含层节点数为18时,网络误差最小);输出层8个节点,对应8个基础证。传递函数选择对数函数“logsig”,训练函数选择共轭梯度算法“trainscg”,最大训练次数 3000次,最小梯度0.02。从500份病案中随机抽取400例作为训练样本,100例病案作为测试样本。

图2显示,在BP神经网络的训练过程中输出的平均方差逐渐减小,经过2224次迭代计算,达到设定的误差限度。此时,心系基础证诊断模型初步建立,再利用100例病案数据进行测试。

表2 基础证编码

图1 “心系病位、病性特征”→“基础证”的神经网络模型

图2 网络的性能曲线(训练函数trainscg)

2 结果

模型预测值与实际值之间存在多种形式(见图3),不能将“正确率”作为单一的模型评价标准,还应该有漏判率和误判率。利用训练后的网络模型对100例样本进行分析(预测结果见表3)。

图3 基础证判断

表3 神经网络模型各项指标

模型对每个基础证的诊断正确率都在84.00%以上,平均诊断正确率达90.63%,误判率4.50%,漏判率4.88%。对于最终“证”的判定需要综合每个基础证的判定结果,如病人既有“心气虚”也有“心阴虚”的表现,则模型诊断结果应为10100000(“心气虚证”兼“心阴虚证”,即心气阴两虚证)才能判为正确。本实验模型对100例病案资料的“证”的诊断正确率为73.00%。

3 分析及讨论

临床症状与证之间没有明确的函数关系,只有通过对大量文献及临床流行病学调查的病案资料进行数据挖掘,客观寻找它们之间的内在关系。本文利用MATLAB神经网络工具箱,建立心系基础证BP神经网络诊断模型,通过样本测试验证了心系基础证诊断模型的有效性。从检验结果可以看出,一是模型对基础证的诊断正确率较高,而对最终“证”的诊断正确率不高。临床上基础证相对少见,而复合证多见,复合证的诊断建立在正确诊断基础证的前提上。因此,要进一步提高基础证的诊断正确率,进而提高复合证的诊断正确率;二是125个心系病位、病性特征作为输入变量,部分变量相互耦合关联,造成神经网络的过拟合,耗费时间处理冗余数据,影响模型精度。因此,要进一步开展心系病位、病性特征与基础证的相关性研究,找出最能反映与基础证特点的病位、病性特征参与建模。

本文利用MATLAB神经网络工具箱,初步构建了心系基础证BP神经网络诊断模型,经过样本测试证明,利用BP神经网络可以较好地模拟心系病位、病性特征与基础证的多元非线性的复杂映射关系,模型对基础证的诊断正确率较高,但对最终“证”的诊断正确率有待进一步提高。在后续的研究中,要进一步提炼心系病位及病性特征,同时要积极探寻ANN的优化算法,从而提高模型的诊断正确率及工作效率。本文的研究思路可以进一步应用于五脏系统诊断模型的研究中,为病证规范化、诊断信息化提供方法学参考。

[1]吴承玉,徐征,骆文斌,等.五脏系统病位特征与基础证的研究[J].南京中医药大学学报,2011,27(3):201-203.

[2]傅荟璇,赵红.MATLAB神经网络应用设计[M].北京:机械工业出版社,2010:28-29.

[3]丁以艳.心系病位特征及基础证的研究[D].南京:南京中医药大学,2012:18-23.

[4]吴承玉,丁以艳,吴承艳,等.心系病位特征与基础证的研究[J].南京中医药大学学报,2012,28(1):1-2.

猜你喜欢
诊断模型病性病位
脾系藏象病位与病性特征研究
基于“风痰瘀虚”的高血压脑小血管病病性证素的临床表现与影像学特征研究
八珍汤加味序贯中药包热熨治疗气血两虚型子宫腺肌病性痛经的临床观察
糖尿病肾病中医证素特征与临床理化指标相关性研究
术后早期炎症性肠梗阻的中西医结合治疗案例举偶
中医对痛风的认识
消渴病合并抑郁症之病位探析
基于模糊优选反问题的电机电气故障诊断模型
对于电站锅炉燃烧经济性诊断模型的研究