基于主成分分析和LS/ Lasso 回归的气虚质人群脉诊信息特征研究

2022-07-22 11:50樊西倩安二匣宋诗博王星雅汪南玥
中国医药导报 2022年16期
关键词:特征参数气虚体质

樊西倩 安二匣 宋诗博 王星雅 刘 跞 刘 佳 汪南玥

1.陕西中医药大学基础医学院,陕西咸阳 712046;2.中国中医科学院医学实验中心,北京 100700

中医体质学在治未病、慢病防控、公共卫生服务等方面应用广泛,在应对大健康问题上具有独特优势[1-2]。体质[3-4]是指人体生命过程中在先天禀赋和后天获得的基础上,所形成的形态结构、生理功能和心理状态方面的固有特质,其个体差异性和群体趋同性构成了体质可分类的基础。气虚质[5-7]以气息低弱、机体、脏腑功能状态低下为主要特征,是人群中常见的偏颇体质类型之一。平和质[8]是一种相对健康的体质状态,可作为偏颇体质的对照样本。调查研究显示[9],中国健康人群9 种中医体质分布中平和质占32.14%,8 种偏颇体质占67.86%,且偏颇质中气虚质占比最多,为13.42%。在最新调查研究中[10],气虚质人群的占比也相对较高,为13.18%。因此,本研究以气虚质人群为研究对象,将平和质人群作为对照,研究气虚质人群的脉诊信息特征。

1 资料与方法

1.1 一般资料

本研究中的受试者包括陕西中医药大学第二附属医院的体检者与陕西中医药大学的在校学生,采集时间为2019 年3 月至2020 年4 月。共采集研究对象165 例,包括气虚质组82 例,其中男24 例,女58 例;年龄19~74 岁,中位年龄25(22,35)岁。平和质组83 例,男27 例,女56 例,年龄19~73 岁,中位年龄25(22,31)岁。两组一般资料比较,差异无统计学意义(P >0.05),具有可比性。本研究经医院伦理委员会批准。

1.2 纳入标准

①年龄16~75 周岁;②体格检查(体温、血压、呼吸、心率等)及实验室检查无异常改变;③受试者本人同意参加调查研究,并签署知情同意书。

1.3 排除标准

①出现反关脉、斜飞脉等异常脉位;②有器质性疾病,或患有精神疾病,有严重智力或认知功能障碍;③不能按要求坚持配合完成信息采集。

1.4 中医体质判定与分组标准

参照中华中医药学会2009 年发布的《中医体质分类与判定》[11]中的判定标准进行中医体质判定,将判定为气虚质者纳入气虚质组,将平和质者纳入平和质组作为对照。

1.5 研究方法

1.5.1 脉诊信息采集 待受试者调匀呼吸后,嘱其保持安静并配合采集。采用天津帕斯泰克医疗器械有限公司生产的三探头中医脉诊仪(专利名称:适用于中医脉搏检测的三探头机械装置,专利号:ZL20141006951 7.6,型号:MS3-Ⅳ)分别采集其左、右手寸口部的寸、关、尺6 部脉的信息,采集时长40 s,以保证双手所采集的脉诊信息均≥50 个周期。

1.5.2 脉诊信息预处理 脉诊数据较为敏感,信号频率一般在0.5~48.0 Hz,呼吸、咳嗽等因素对脉诊信号具有一定的影响,可通过滤波的方法减少其对脉诊数据的影响[12]。本研究使用离散余弦变换(discrete cosine transform,DCT)的方法进行数据预处理,滤除脉诊信息数据中频率<0.5 Hz 和>48.0 Hz 的波。

1.5.3 脉诊信息特征参数提取 脉诊信息特征参数提取分为周期划分、12 谐波拟合建模、时频特征参数提取等3 个部分[13]。人体不同生理、病理状态下,脉搏波形图的周期长度与图形有一定差异,可通过脉诊信号的强度与变化速度划分脉图周期。使用最小二乘回归对所有脉图周期信号进行拟合,建立12 谐波模型。对所采集的左右手寸、关、尺共6 组数据进行建模,提取出时域(8×6 个部位+1=49)、频域(24×6 个部位=144)分析方面的193 个特征参数。其中,时域参数包括脉位、急性射血期时值t1、主波幅值h1、主波1/3 处的宽度w、单个脉搏波周期的总面积s、主波峰值前脉图面积s1、主波峰值后脉图面积s2、面积比值s1/s2 及6 部脉共用的一个脉数参数;频域参数包括12 谐波的振幅值(C1~C12)与相位值(F1~F12)共24 个特征值。

1.5.4 脉诊信息分类判决 分类判决是将按数据差异性的大小对数据进行区分的方法,本研究随机选取80%的数据作为训练集进行建模,将20%的数据作为验证集,通过验证得出各模型的判决准确率。为提高数据分析结果的可信度,本研究采用机器学习中主成分分析(principal component analysis,PCA)、最小二乘(least square,LS)回归和套索(least absoluste shrikage and selection operator,Lasso)回归交叉验证的方法对脉诊信息数据进行分类判决。其中,主成分分析法未事先利用分类信息,不会产生过拟合的现象,因此被归为无监督学习。主要反映两组数据之间变化方向的大小,如:第1 主成分反映数据最大的变化方向,即数据最显著的差异,依次类推,第2、3 主成分则反映数据第二、第三大变化方向。LS 回归、Lasso 回归需要使用已知分类信息,所以被归为有监督学习,本研究中,为避免过拟合的出现,结合样本量与数据质量,有监督学习中均选取7 个参数进行建模。

1.5.5 脉诊信息特征挖掘 在分类判决的基础上,本研究使用拓展的双向逐步LS 回归法(extended forward backward least square regression,EFBLS)寻找特征性参数,并对关键特征参数判断其差异显著性,从而得到具有统计学意义的关键特征参数。

1.6 统计学方法

采用SPSS 26.0 软件对所得数据进行统计分析。符合偏态分布的计量资料以中位数或四分位数[M(P25,P75)]表示,采用Mann-Whitney U 检验。计数资料以例数或百分比表示,采用χ2检验。采用“脉诊数据库管理、建模、统计分析平台”[14]进行主成分分析、LS回归、Lasso 回归、特征参数t 检验等处理。以P <0.05为差异有统计学意义。

2 结果

根据采集脉诊信息的信号质量及资料完整性筛选后,共选取119 例研究对象进行建模,包括61 例气虚质人群与58 例平和质人群。分析对象为人体双侧桡动脉寸、关、尺3 部脉搏波,共提取193 个参数。

2.1 主成分分析识别

两组脉诊信息前10 个主成分中,两组数据在第1、4、6、7、9 主成分中不能准确分类的概率为均24%,即判别准确率为76%。见图1。

图1 主成分分析结果图

2.2 LS 回归识别

LS 回归分析中,两组脉诊信息未被准确分类的概率为0.28(28%),即模型判别准确率为72%。判别公式:Y=2707.56 相位9 左尺-15.81h1 左尺+767.86相位11 左关+0.34s 右尺-933.32 相位11 左尺+0.36s2右寸-1214.50 相位6 左关-92.87。见图2。

图2 两组LS 分类结果图

2.3 Lasso 回归识别

在Lasso 回归分析中,两组脉诊信息未被准确分类的概率为0.35(35%),即模型判别准确率为65%。判别公式:Y=0.11 脉数-0.08 能量6 左关+0.25 相位11 左关+0.26 相位7 左尺+0.05s2 右寸+0.20 相位12 右寸+0.21 s 右尺。见图3。

图3 Lasso 回归结果

2.4 全部特征分析

通过对陕西省气虚质与平和质人群脉诊信息全部特征参数进行比较,193 个特征参数中,气虚质组脉数、右寸s、右尺s、右寸s2、右尺s2 高于平和质组,左关能量低于平和质组,差异有统计学意义(P <0.05)。见图4。

图4 多个特征比较

3 讨论

气虚质人群心血管功能特点:通过研究结果发现,气虚质组脉数、s、s2 等时域参数较平和质组差异显著。脉数即脉搏跳动的次数,脉数增大,反映心肌收缩频率较快,提示气虚质人群与平和质人群比较,有心肺功能下降的可能[15]。s、s2 均为脉图面积参数,与射血时间及心室射血时心腔压力具有相关性。s 代表脉管内总体血液的充盈度,s2 为心脏舒张期脉管内血液的充盈度,s、s2 的值增大间接反映心脏泵血后血管弹性与压力不同造成的心脏后负荷较大,提示与平和质人群比较,气虚质人群有心输出量不足的可能[16]。通过上述3 个特征参数的特征性变化,提示气虚质人群与平和质人群比较,心血管功能有所下降,从一定程度上验证了心血管功能降低与气虚质有较密切的联系[17-18]。

气虚质人群脏腑功能差异:通过研究结果发现,气虚质组在左关部位的频域参数上较平和质组存在明显差异,具体表现为左关脉能量较低。在中医寸口脉诊部位分候理论[19]中,左关候肝。肝“主疏泄”“主藏血”,左关部能量较低反映气虚质者肝的功能状态较弱。通过上述脉诊部位参数的特征性变化,提示气虚质人群与平和质人群比较,在情志疏泄功能及气血运行状态方面存在差异,为气虚质人群的健康促进与易感疾病防治提供参考[20]。

本研究主要对陕西省人群脉诊信息进行分析,与其他地区气虚质人群与平和质人群脉诊信息差异表现在:贺研[21]、陈清光等[22]和陈彦坤等[23]分别研究了上海和华中地区气虚质人群脉诊信息的特征变化,发现气虚质者脉率大于平和质人群,与本研究所得结果相符。在时域参数方面,上海地区气虚质组在h4、h3/h1,h4/h1 等参数上指标明显增高;华中地区研究显示h1、h4及h4/h1 减少,而h5 及h5/h4 增加。总之,气虚质与平和质人群在脉诊信息上存在客观差异,脉数较平和质人群均有所增加,时域参数在不同地区反应的差异有所不同。上述变化与气虚质者脉象以沉、细、数、无力等特征为多见[24-25]的文献报道具有一定的趋同性。

综上所述,气虚质与平和质人群的生理差异可以在寸口部桡动脉脉诊信息的时域与频域参数中得到体现,构成气虚质与平和质人群脉诊信息差异的主要共同参数集中在脉数、时域参数s、s2 及左关的频域参数,通过脉诊信息数据模型可以较准确地将两类人群进行分类与辨识。本研究为中医“独取寸口”的诊脉方法提供了一定的科学依据,并在一定程度上为中医体质辨识提供了科学、基础、客观的指标与方案。

猜你喜欢
特征参数气虚体质
中医“体质”问答
中医“体质”问答
中医“体质”回答
故障诊断中信号特征参数择取方法
基于特征参数化的木工CAD/CAM系统
28天吃出易瘦体质
气虚便秘用白术莱菔汤
气虚了,病多了
基于PSO-VMD的齿轮特征参数提取方法研究
统计特征参数及多分类SVM的局部放电类型识别