基于机器学习的失眠症中医证素辨证模型的构建思路

2020-11-26 20:19辜伟科王艳劳祥婷刘洁清廉永红
电子技术与软件工程 2020年21期
关键词:证素失眠症机器

辜伟科 王艳 劳祥婷 刘洁清 廉永红*

(1.广西中医药大学赛恩斯新医药学院 广西壮族自治区南宁市 536000)

(2.广西中医药大学第一附属医院 广西壮族自治区南宁市 530023)

失眠症是指因无法入睡或无法保持睡眠状态,临床特征表现为经常不能获得正常睡眠的一种常见病证[1]。失眠症属于祖国医学“不寐”的范畴,由于失眠症的发病原因十分复杂,中医诊断存在着病机分析繁杂、辨证分型混乱等的弊端,直接影响到临床施治的效果,因而亟需建立一种能够准确辨识失眠症不同证候的方法及标准。中医证素辨证是在中医四诊辨识的基础上确定疾病的病位和病性,以此构成证名的基本要素即证素,并依据不同证素的分值水平和组合规律来确定各种证候分型,从而获得疾病治则治法和处方遣药的依据[2]。证素辨证能够将中医定性的病症特点与定量的客观指标结合起来,推动中医辨证向客观化、标准化的方向发展。由此,基于证素辨证的理论和方法来构建失眠症的中医规范化辨证模型是目前较为可行的实现路径。

1 中医证候与证素辨证

辨证论治是具有中医特色的一种临床诊疗模式,即通过望、闻、问、切等手段获取患者的疾病资料来进行综合分析,确定其在某一阶段的证候特征,并在此基础上制定治疗干预的方法和手段。中医证候是疾病在发生和发展过程中某一阶段症状和体征的概括,包括病位病性、病因病机及发展趋势等。中医证候可以说是对机体的一个或多个脏腑功能失调的综合反映,因此,如果能从疾病的病位和病性的角度来对中医证候进行精细的描述,可能更有利于建立较为统一规范的中医证候诊断标准。

所谓证素即证候的基本要素,由湖南中医药大学朱文峰教授首次提出,主要指辨证所确定的病位和病性因素[3]。证素是组成证候的最小有效单位,不同的证素可组成各种证候分型,疾病在不同阶段的证候组合可以综合反映疾病进行动态演变的整个发展过程。中医四诊所采集的信息是对机体自身感受与外在表现的概括,多为主观感受的模糊信息,因而经验不足的中医师很容易发生误诊误治。证素辨证能够通过建立症状与证素之间的量化关系,确定某一症状在不同证素中的贡献度,从而根据患者症状贡献度的加权总值,确定症状-证素权值之和是否超过某一设定的诊断阈值,进而形成最终的中医证素辨证证型。

2 证素辨证与机器学习

证素辨证的基本原则是以症为据,从症辨证。由于中医四诊信息具有多维性,失眠症的症状与证素、证素与证候之间的关系交错,某一证素可能对应多个症状,而某一个症状又可能对应多个证素,症状与证素之间的复杂对应关系体现了中医证素辨证的非线性特征。而证素辨证时不仅要建立证候与证素之间、证素与证名(型)之间的多维网络联系,还应充分认识每个症状对不同证素或证候具有不同的诊断价值,因而需要对这些关系的强度进行定量描述,明确每一症状对有关证素、证型的诊断贡献度。一般的分类统计方法很难比较准确地模拟中医证候分类的非线性演变过程,由此,机器学习方法被引入中医证素辩证的研究之中。

作为人工智能的重要分支,机器学习(Machine Learning,ML)方法越来越多地应用于中医的诊治决策的分析过程之中。机器学习具有能够高效处理非线性数据的优势,可以通过一定的映射方法将高维空间的数据映射到低维度空间,从而实现多维数据的“降维”[4]。此外,机器学习有类“黑箱系统”,即不必完全清楚系统内部的结构和相互关系,而是通过对系统的输入输出的数据反馈特点进行学习,从中获取经验进而改善系统的分类、回归或预测等性能。机器学习算法涉及贝叶斯网络、K-means 聚类、支持向量机、决策树、随机森林、人工神经网络等,而尤以支持向量机、人工神经网络方法最为普遍。

3 机器学习系统的基本结构

机器学习能模拟人的学习行为,自动地通过学习来获取知识和技能,不断改善性能,实现自我完善[5]。一个典型的机器学习系统的基本结构应当包括环境、学习、知识库和执行四个部分。机器学习系统的环境是指系统外界信息的来源,一般认为,环境提供给系统的信息水平与质量对于机器学习系统有很大影响。学习是机器学习系统的核心部分,即通过比较、归纳、分析和推理等方式将环境所提供的信息进行加工处理后存入知识库。学习是一个有特定目的的知识获取过程,主要任务就是降低环境提供的信息水平与执行环节的信息水平之间的差距。知识库代表目系统前所拥有的知识,可用来存储学习部分得到的结果,也包括指导执行部分运行的方法。执行部分用于处理系统面临的现实问题,以及对所做出的结论进行评价,并将获得的评价信息反馈给学习部分,从而进一步强化学习系统的能力。从中医证素辨证的角度看,环境就是通过中医四诊所采集的与患者相关的症状和体征信息,知识库用于存储针对患者的症状和体征等进行初步处理后的数据,学习部分负责指导对知识库的数据进行补充和修改,执行部分在经过运算后得出中医证素分型的判断,并对判定结论的准确性作出评价。当评价较差时就会将结果反馈到学习部分,从而激活新一轮的机器学习过程。

4 基于机器学习构建失眠症中医证素辨证模型

4.1 数据采集

制定失眠症的中医临床症状规范化采集量表,根据中医四诊的方法收集失眠症患者的症状和体征资料,并对各种症状的不同程度进行定义和分级,构建失眠症中医临床调查数据库。

4.2 数据预处理

按照以症测证的方法列出每个症状所有可能对应的病位和病性属性,构建失眠症患者的证素数据量表。对失眠症患者的症状和证素等数据进行预处理,包括缺失值处理、重复值处理、以及统一数据的度量、零均值化、属性的分解与合并等数据转换的处理。

4.3 特征选择

查找失眠症患者的症状数据及其对应的证素数据,并进行同一个症状对应的所有证素数据的加权计算,构建失眠症患者的症状数据与证素数据“加权求和、浮动阈值”的映射函数。比如失眠症患者“入睡困难”的症状对应的证素权值积分为心-5,肺-9,肝-6,阴虚-7,痰-8,热-6,寒-3 等,就可以根据阈值确定证素,如阈值设置为6,则确定的证素为集合为{肺,肝,阴虚,痰,热}。特征选择就是从原始特征数据集中选择出子集,依据上述方法可以确立症状数据与证素数据的对应关系,剔除掉无关特征和冗余特征,从中筛选出与失眠症患者的症状数据关联程度较高的证素数据最优特征子集。

4.4 降维

当对失眠症中医临床数据的特征选择完成后,可能由于特征矩阵过大导致在建模过程中出现计算量大以及训练时间长等问题,因此降低特征矩阵维度是必不可少的。机器学习常用的降维方法有主成分分析(PCA),独立成分分析(ICA),线性判别分析(LDA)等。

4.5 构建模型

将失眠症的中医临床数据划分为训练数据集和测试数据集,选取训练数据和测试数据的特征和标签,并根据学习目标和数据要求选择合适的机器学习算法。利用训练集建立失眠症中医证素辨证预测模型,配置和调整超参数以获得最佳性能,然后将这种训练好的模型应用于测试集上进行预测。根据模型在测试集上的表现来选择最佳模型。机器学习的模型构建其实是一个参数学习与调优的过程,对模型进行训练是模型参数的学习更新过程。

4.6 评估模型

构建失眠症的中医证素数据与证名的映射函数,根据不同的的失眠症证素数据组合成相应的失眠症中医证候或证型。使用验证数据集验证和评估失眠症的中医证素辨证模型,进一步调整超参数以获得最佳性能。并将中医证素辨证与成熟的中医专家系统辨证模型进行比较,以确定所构建的机器学习模型是否具有更高的预测精度。

5 总结

中医证候学的研究一直是中医临床医学研究的热门领域。中医临床疗效的关键在于辨证论治的准确与否,而中医证候分析则是辨证论治的核心[6]。传统的中医证候分析不仅需要专业的知识背景,还要依赖于医生的经验积累。中医证素辨证方法使中医证候学的研究更加科学、细致,在中医辨证论治的临床运用中重复性好,同时又能把握住疾病和体质的个体化特征,为中医临床研究的客观化、标准化、规范化发展奠定了坚实的基础。失眠症的中医证候分型较为混乱,缺乏统一的标准,从而造成中医药对失眠症的辨证论治过程难以实现客观化、规范化。失眠症是一类多元多因素影响的复杂性疾病,运用证素辨证有助于认识和把握失眠症的本质,有助于把握失眠症的病机演变规律,也有助于失眠症证候的规范化研究,可以为失眠症的中医临床诊疗提供坚实的理论支持。

中医证候分析往往具有一定的主观性和随意性,所涉及的资料大多通过中医四诊合参等方式获取,具有数据维数大、冗余度高、精确性低、价值密度低的特点,这些都影响到中医证候分析的准确性以及临床治疗的效果。机器学习是一门多领域交叉学科,专门研究计算机怎样模拟或实现人类的学习行为,可以通过学习从已知的样本中构建模型对未知样本进行预测,并能够在学习过程中进行自我校正、不断改善自身的性能,其应用遍及人工智能的各个领域[7]。本研究将中医证素辨证与机器学习方法相结合,构建智能化的失眠症中医证素辨证模型,能够对失眠症的中医症状与证素之间复杂的对应关系进行精确地分析,从中筛选出具有典型特征的病位证素与病性证素,实现在失眠症的诊疗过程中症状-证素-证名的智能化辨识,从而使失眠症的中医证素辨证分型更加便捷、高效和准确,对于提高失眠症的中医疗效具有重要的现实意义。

猜你喜欢
证素失眠症机器
机器狗
糖尿病前期中医证型及证素特点分析
机器狗
2型糖尿病合并肥胖患者的相关危险因素和中医证素分析
基于因子分析及聚类分析的241例感染后咳嗽中医证素证型研究
新九针治疗失眠症验案1则
未来机器城
浅谈蒙医诊治失眠症
蒙医药治疗失眠症30例临床观察
宁神定志汤治疗失眠症临床观察