基于机器学习的单相抑郁与双相抑郁鉴别的脉图参数分类模型

2022-06-28 10:18:18刘鑫子李自艳郑思思尹冬青贾竑晓
首都医科大学学报 2022年3期
关键词:脉象单相双相

刘鑫子 李自艳 郑思思 朱 虹 尹冬青 贾竑晓*

(1.首都医科大学附属北京安定医院 国家精神心理疾病临床医学研究中心 精神疾病诊断与治疗北京市重点实验室,北京 100088;2.人脑保护高精尖创新中心 首都医科大学,北京 100069)

抑郁发作临床表现为情绪低落、兴趣或愉悦感减少、自责自罪、注意力不集中、体质量减轻、失眠等症状,抑郁发作可见于抑郁障碍与双相情感障碍。双相情感障碍是一类既有躁狂或轻躁狂发作又有抑郁发作的心境障碍。50%的双相I型患者和75%的双相Ⅱ型患者常以抑郁发作为首次发病的表现[1],且在整个病程中抑郁发作时长达躁狂发作时长的3倍[2]。当双相情感障碍患者首次发病且以抑郁发作时,常因难以与单相抑郁进行鉴别区分出现诊断转换延迟,平均延迟长达(8.74±9.40)年[3]。双相抑郁治疗难度较大,若治疗不当造成患者转相,出现躁狂发作或混合特征,进而影响预后。因此区分抑郁发作患者是单相抑郁或双相抑郁是临床医生的难点之一。目前因为双相情感障碍与抑郁障碍的发病机制尚不明确,所以临床常由临床医生问诊结合病史、病程配合使用轻躁狂检测清单、心境障碍问卷等进行诊断,因为用于诊断的信息多由临床问诊与自评量表所得,他评量表临床应用较少[4],缺少相对客观化的诊断指标。

脉诊是中医独特且有效的诊断方法,《内经》曰:“夫脉者血之府也”,“诸血者,皆属于心”,“心者,生之本,其充在血脉”。现代中医常把双相抑郁和单相抑郁都纳入中医“郁证”的范畴,但由于双相情感障碍与抑郁症的病机不同[5],在证候分类上也有所不同[6],影响气血津液的运行输布不同从而导致脉象的不同。中医的脉诊信息也因此会表现出特异性,可能是鉴别诊断单相抑郁与双相抑郁的有效手段。

脉诊客观化是指通过客观化手段采集脉象,对个体的脉图进行参数分析,继而反映机体整体的病理生理指标改变,是中西医结合现代化的成果[7]。脉图参数具有客观化的优点,t检验与非参数检验可以提供单相抑郁与双相抑郁脉图参数比较,但是统计分析时具有数据量多,各类数据关联较少的缺点,机器学习则可以弥补t检验与非参数检验的不足,得到更加精确地鉴别结果。向量机算法(support vector machines,SVM)是一种基于统计学习理论中的VC维理论和结构风险最小化原理的机器学习方法[8],在小样本、非线性和高维模式识别问题中都具有其特定的优势;随机森林算法(random forest,RF)是一种以决策树为基分类器的常见机器学习算法,具有适用范围广且不易过拟合等优点。在处理大量多类数据时,SVM模型与RF模型都能建立较好的数据模型,并可以相互印证后得出较为准确的特征变量。

本研究通过对双相抑郁患者与单相抑郁患者脉象信息进行采集,对数据进行t检验与非参数检验获取比较结果后,使用机器学习SVM算法和RF算法分别建立双相抑郁与单相抑郁的SVM与RF分类模型,并对鉴别模型中的重要特征进行分析,得出单双相抑郁脉诊特征特点,并有可能将得到的两个带有特征参数的模型应用于临床,以期可以根据患者脉象得到患者单双相预测概率值,对临床单双相抑郁的鉴别提供帮助。

1 对象与方法

1.1 研究对象

研究对象均为首都医科大学附属北京安定医院2020年6月至2021年11月门诊就诊患者。共收集88例,其中单相抑郁发作患者31名,双相情感障碍抑郁发作患者57名。本研究经首都医科大学附属北京安定医院伦理委员会审批,伦理审批号:202025FS-2。

1.2 筛选标准

1.2.1 入组标准

①单相抑郁发作患者符合《精神障碍诊断与统计手册》(Diagnostic and Statistical Manual of Mental Disorders,DSM-5)重性抑郁障碍诊断标准[9];双相情感障碍抑郁发作患者符合DSM-5 双相情感障碍Ⅰ,目前或最近为抑郁发作与双相情感障碍Ⅱ,目前或最近为抑郁发作诊断标准[9];②汉密尔顿抑郁量表(Hamilton Depression Scale,HAMD)评分>7分;③杨氏躁狂量表(Young Manic Rating Scale, YMRS)评分<6分;④可配合完成各项量表调查,小学以上文化者;⑤生命体征平稳;⑥患者本人或法定监护人签署知情同意书。

1.2.2 排除标准

①并发精神分裂症等其他精神类疾病者;②并发重大躯体疾病者; ③孕妇、哺乳期妇女;④无人监护或未能签署知情同意书者。

1.3 脉图参数采集和数据预处理

研究者对患者进行基本信息收集后使用道生四诊仪DS01-A舌面脉信息采集体质辨识系统(沪械注准20202200060)采集患者脉图信息。采集方法:待患者在安静的环境中静坐5 min后,在自然呼吸的条件下将脉象传感器固定在患者左手及右手桡动脉搏动最强处进行脉象采集获得最佳脉图及其参数值。将相关数据导出后用Excel工作表整理储存。

使用Epidata 3.1软件录入并整理患者人口学资料与相关量表数据,使用RStudio通过R语言mice程序包对缺失数据进行多重插补[10],获得最终的数据集。数据集包括患者序号、性别、年龄、诊断分组、抑郁症状严重程度(HAMD>20为中重度抑郁,7

1.4 单相抑郁与双相抑郁脉图参数鉴别模型算法

通过R 4.0.5 “mlr3”程序包[11]将数据样本按7∶3比例随机分为训练组和测试组,利用数据集特征在训练组中构建SVM全模型与RF全模型,用测试组数据进行验证。

1.5 单相抑郁与双相抑郁脉图参数鉴别模型优化

1.5.1 通过特征选择对鉴别模型进行优化

数据集包含大量特征(变量),提取相关特征子集的技术称为特征选择。对特征进行筛选可用于提高模型性能,清除与模型无关的变量,从而提高模型的适用性[12]。本研究使用R 4.0.5 mlr3fselect程序包[13]中的包装器法(wrapper methods)方法,通过计算重新采样的预测性能来评估该特征集合,得到新的特征子集。以分类误差(classification error,classif.ce)作为衡量标准来预测特征筛选性能,classif.ce值越小,特征子集的预测效果越好。

1.5.2 通过超参数调优对鉴别模型进行优化

超参数是控制模型如何适应数据的学习器的参数。本研究通过R 4.0.5 mlr3 tuning程序包[14]中的自动调谐(automatic tuning)方法,对特征选择后重新构建的SVM模型行超参数调优。

1.6 统计分析与脉图参数鉴别模型结果评价

采用 R 4.0.5 进行统计学分析。为了更加准确和全面地评估模型,采用模型鉴别准确率及曲线下面积( area under curve,AUC )作为预测结果的评价指标。为了提高模型解释性,对模型中各特征重要性进行评价,取重要性前五的特征进行个体条件期望(individual conditional expectation,ICE)分析,形成居中个体条件期望图(centered ICE plot)。个体条件期望是将每个实例数据显示为一条线,当特征发生变化时预测实例如何变化。居中个体条件期望图是将曲线在特征中的某个点居中,并仅显示与该点的预测差异[15]。本文拟采用居中个体条件期望图显示该特征的预测差异。研究流程图详见图1。

图1 研究流程图Fig.1 Research flow chart

1.7 统计学方法

2 结果

2.1 一般资料

本研究纳入单相抑郁患者31例,其中男性14例,女性17例,平均年龄(18.16±9.24)岁,HAMD分数(18.16±9.24)分,YMRS(0.23±0.71)分;双相抑郁患者57例,其中男性25例,女性32例,平均年龄(23.91±9.68)岁,HAMD分数(17.21±7.76)分,YMRS(1.75±1.72)分。两组间年龄、性别、HAMD评分差异无统计学意义(P>0.05),YMRS与病程差异有统计学意义(P<0.05)。单相抑郁患者服用抗抑郁药物与苯二氮卓类药物,双相抑郁患者除服用抗抑郁药物与苯二氮卓类药物外,服用心境稳定剂与抗精神病性药物。详见表1。

表1 人口学资料Tab.1 Demographic data

2.2 单相抑郁与双相抑郁脉图参数比较

对单相抑郁与双相抑郁进行双手脉图参数比较,其中脉力、脉率、AD、T1/T4、H1、H3/H1、(H3-H1)/H1,组间差异有统计学意义(P<0.05);脉位、脉律、脉形、脉势、H2、H3、H4、H5、T1、T2、T3、T4、T5、W1、W2、ASS、T、H4/H1、H5/H1、T1/T、T1/T4、(T4-T1)/T、T5/T4、W1/T、W2/T,组间差异无统计学意义(P>0.05)。详见表2。

表2 单相抑郁与双相抑郁脉图参数比较Tab.2 Comparison on scores of pulse graph parameters in different groups

2.3 单相抑郁与双相抑郁脉图参数鉴别的特征选择

在使用特征选择清除与模型无关的变量后,SVM算法优化后的特征子集(classif.ce=0.17)为:患者序号、诊断分组、年龄、抑郁症状严重程度、脉律、脉率、脉形、H1、H2、H4、T1、T4、W1、AD、T1/T、(T4-T1)/T、T5/T4、H3/H1,共18个特征;RF算法优化后的特征子集(classif.ce=0.15)为:患者序号、诊断分组、年龄、抑郁症状严重程度、左右手分组、脉律、脉率、脉势、脉形、H1、H2、H3、H4、T1、T3、T4、W1、W2、AD、T1/T、(T4-T1)/T、T5/T4、H3/H1、(H3-H1)/H1、W1/T、W2/T,共26个特征(表3)。

表3 单相抑郁与双相抑郁脉图参数鉴别的特征选择结果Tab.3 Feature selection results of pulse graph parameters in different groups

2.4 预测结果及单相抑郁与双相抑郁脉图参数鉴别模型性能

在SVM模型中将抑郁症状严重程度、年龄与16个脉图参数作为特征,基于算法进行建模,预测结果与训练集中真实数据进行比较,最终得出评判结果,分类鉴别的准确率为80.56%,AUC值为83.04%(图2)。在RF模型中将抑郁症状严重程度、年龄、左右手分组与16个脉图参数作为特征,分类鉴别的准确率为80.56%,AUC值为84.62%(图2)。SVM模型特征重要性前十位为H4、H2、AD、AGE、(T4-T1)/T、H1、T4、脉率、T5/T4、T1(图3);RF模型特征重要性前十位为H3、H4、AD、AGE、H2、H1、(T4-T1)/T、脉势、T5/T4、H3/H1(图3)。SVM和RF模型重要性前5位指标居中个体条件期望图详见图4。

图2 SVM模型与RF模型ROC曲线Fig.2 ROC curve of SVM model and RF model

图3 特征重要性排序(前10位)Fig.3 Importance ranking of features (top 10)

图4 Centered ICE plot图(前5位)Fig.4 Centered ICE plot (top 5 )ICE:individual conditional expectation;SVM:support vector machines;RF:random forest.

3 讨论

本研究通过分析单相抑郁患者、双相抑郁患者的脉图参数,使用常规统计学方法与较为先进的机器学习算法来评估中医脉象识别单相抑郁与双相抑郁鉴别诊断的可行性。两组患者在性别、年龄、抑郁程度上差异无统计学意义,YMRS分数均小于6分,患者处于抑郁发作状态。常规统计学方法在对患者的双手脉图参数的分析中得到脉力、脉率、AD、T1/T4、H1、H3/H1、(H3-H1)/H1共7个变量的差异有统计学意义,表明脉图参数在区分单双相抑郁中具有一定的可行性;SVM模型与RF模型分别进行特征选择,清除与模型无关的变量,得到优化后的特征子集,并对其进行建模,鉴别准确率均为80.56%,AUC值处于0.80~0.85,具有较好的准确率和稳定性[16],其中AD、H2、H3、H4、(T4-T1)/T、AGE是最相关的特征变量。

脉图是血管波动的直观体现,脉图参数是反映人体心脏、血管、血液等功能的有效信息。在对脉图参数进行常规统计学时发现,脉力、脉率、AD、T1/T4、H1、H3/H1、(H3-H1)/H1共7个变量差异有统计学意义,脉图参数可以对单相抑郁与双相抑郁进行鉴别,进而进行了机器学习模型的构建,得到特性重要性的排序。其中特征H1为主波幅度,即主波峰顶到脉搏波图基线的高度,主要反映左心室的射血功能和大动脉的顺应性。H2为主波峡高度、H3为潮波高度,即潮波峰顶到脉象图基线的幅度。H2与H3生理意义较一致,主要反映动脉血管张力和外周阻力状态。H4为降中峡高度,为降中峡谷底到脉搏波图基线的高度。降中峡高度也同样可以反映动脉血管外周阻力的大小,常常与被试者舒张压相应。H1与脉力有关,H1越大,脉力越强。H2、H3与H4值越大,表明血压升高时所遇到的外周阻力越大,血管张力越高,弹性越差[17]。AD为舒张期对应的脉图面积,AD值增大,左室射血分数增大[18]。T1/T4为T1左心室的快速射血期与T4左心室的收缩期的比值,(T4-T1)/T为T4与T1的差值与全脉搏周期的比值,T1/T4值越大,(T4-T1)/T值越小,反映心脏急性射血期速度越慢,左心收缩功能减弱[19]。

在centered ICE plot图中可以看到在SVM与RF两个模型中年龄对于分类鉴别具有一定的贡献,机器学习认为鉴别时双相抑郁患者预测年龄与单相抑郁患者相比较小,这与流行病学研究双相抑郁障碍的发病年龄要早于单相抑郁症一致[20]。脉图参数是反映血管功能的有效指标,抑郁症与双相情感障碍等患者可能因情绪变化而影响血管内皮功能最终加速动脉粥样硬化和早期心血管病的形成[21]。本研究中单双相抑郁患者均H1值较大,H3/H1>0.7,均体现患者动脉血管处于高张力、高阻力状态,具有血管弹性差、外周阻力增加的特点[22]。这都提示患者可能已出现血管内皮功能受损,具有早期心血管疾病的可能,目前单相抑郁与双相抑郁血管功能的比较研究还需要进一步的研究。

从中医理论理解,在脉图中H1、H2、H3、H3/H1、H4提示单相抑郁与双相抑郁均为弦脉脉象,H1、AD、T1/T4与(T4-T1)/T则体现患者整体的虚实。弦脉血管弹性较大,压力传导速度加快,使得重搏前波抬高(H2、H3);血管血流排空速度减慢,使得降中峡高估也有所增加(H4)[23]、H3/H1、(H3-H1)/H1增大;AD与(T4-T1)/T主要体现左心室射血分数与左心收缩功能的强弱,值较大时被试者通常为健康人或者实证患者,值较小时被试者多为虚证患者[24]。单相抑郁患者较双相情感障碍患者H3/H1、(H3-H1)/H1值较大提示单相抑郁患者脉象较弦。而大部分双相抑郁患者H1、AD与(T4-T1)/T值比单相抑郁患者较大,这暗示双相情感障碍患者在躁狂、抑郁相与稳定期三者之间反复,双相抑郁患者的脉象较弦且有力,呈实象;单相抑郁患者脉较弦且无力,呈虚象,既往中医文献研究[25]显示从阴阳角度理解双相情感障碍抑郁发作的病机可能与为阴阳不平衡,阳气功能活动的失常,阴虚失守而至的阳郁有关,而单相患者可能与阳弱失用有关,在脉象上与本研究结果相契合。双相抑郁患者虽然症状表现与单相抑郁相似,均呈现情绪低落、兴趣减退、快感缺失等虚相,但是本质可能为实证偏多,这也许是双相抑郁患者易转躁的原因。遗憾的是在SVM与RF两个模型中H2与H3在鉴别时没有呈现一致的趋势,还需要进一步探索。

临床上,单双相患者多因情志刺激而出现气机紊乱而在脉象上共同具有弦脉的特点[26],但其本质是不同的。单相抑郁虚多实少,虽易出现气郁化火,但随病程发展常兼夹气虚、阴虚、血虚、肾虚等虚证,脉象多为弦缓、弦细脉。双相抑郁则不然,常表现为实多虚少,易出现内生火热,邪热扰神,抑郁症状伴随烦躁易怒、面部痤疮、舌边尖红较多,脉象多弦而有力,可随病程转化为躁狂与混合状态。

综上所述,本研究使用统计学分析脉图参数与建立相关机器学习模型两种方式进行单双相抑郁鉴别,得出脉图差异变量与分类模型,且模型具有较好的鉴别准确率和稳定性。脉图参数作为客观化评价指标,对于临床早期鉴别单双相抑郁患者提供了有力的依据,后续本课题组将对特征变量联系临床表现进行进一步的探索。

猜你喜欢
脉象单相双相
热轧双相钢HR450/780DP的开发与生产
山东冶金(2022年2期)2022-08-08 01:50:42
基于时间序列和时序卷积网络的脉象信号识别研究
瞬时波强技术对人迎、寸口脉象研究的意义探讨
S32760超级双相不锈钢棒材的生产实践
上海金属(2016年1期)2016-11-23 05:17:28
基于PI+重复控制的单相逆变器研究
DP600冷轧双相钢的激光焊接性
焊接(2016年8期)2016-02-27 13:05:13
105例弦脉的“计算机脉象仪”脉图参数分析
LDX2404双相不锈钢FCAW焊接及存在问题
焊接(2015年9期)2015-07-18 11:03:52
一种新型斩波AC/DC/AC变换的单相DVR
采用干扰观测器PI控制的单相SPWM逆变电源