胡晓娟 ,崔骥 ,屠立平 ,姚兴华 ,许家佗
1.上海中医药大学上海中医健康服务协同创新中心,上海 201203; 2.上海中医药大学基础医学院,上海 201203
中医脉诊通过脉象“位、数、形、势”四要素的重要属性信息反映人体健康与疾病状态[1]。脉搏搏动图(以下简称“脉图”)是脉象的客观化表现和客观诊断依据,也是脉诊现代化研究的代表性成果。中医脉诊现代化研究根据研究路线主要分为中医脉诊理论梳理、中医脉诊信号感知、中医脉象智能分析、中医智能脉诊临床应用及各个环节所涉及的中医脉诊标准化研究。中医脉诊现代化研究已经开展近半个世纪,取得一定进展。基于脉图的中医脉象智能分析是指针对脉象传感器获取的信号进行智能分析的过程,具体包括脉象信号预处理、特征识别、模式分类。目前中医脉诊信号感知涉及的脉象传感器和采集设备主要集中于单点、单部采集,正在向阵列式的多点、多部脉图方向发展。基于中医脉诊信号感知现状,本文针对中医脉象智能分析的研究进展与发展趋势,从单点、单部及多点、多部两类脉图进行综述。
一个典型的脉图及其常用参数见图1[1],主要由主波、重搏前波、重搏波组成。单点、单部脉图智能分析主要包括数据预处理、特征识别和模式分类。
图1 脉搏周期图及常用参数特征
通过脉象传感器和采集设备获得的脉图原始信号中存在的噪声、漂移和异常值会影响特征提取效果。因此,几种经典滤波器如高通、平均平滑、小波滤波器及几种滤波器级联的滤波方法用于噪声消除[2-4]。小波、经验模态分析等方法用来处理由呼吸或抖动产生的基线漂移,小波变换技术因其计算量少而效果佳的特点可更有效消除漂移。针对噪声消除和漂移消除技术无法检测和处理失真信号引起的异常值问题,研究者引入了基于动态时间扭曲的方法,通过计算单个脉图段与所有其他脉图段的扭曲路径距离来识别异常脉图波形[4]。Garg等[5]通过曼哈顿距离和堪培拉距离获得更好的异常值检测,并提出实时脉图信号质量评估框架以估计波形异常。Jiang等[6]研究基于多传感器融合的脉图质量评估框架。异常波处理是数据预处理的重要内容,目前就如何区分身体功能异常和失真信号导致的波形异常的方法尚无有效解决方案,还需进一步深入研究。
单点、单部脉图分析方法从时域、频域到时频分析,从线性分析到非线性分析,诸如小波变换、傅里叶变换、样本熵等各种谱分析变换后的谱能量、谐波等[7-8]。时域分析通常基于单一周期脉图或几个分段周期进行平均,以获得“平均脉图周期”。研究者对脉图提取的参数有差异,主要脉图参数见表1[1,9-10]。
表1 主要脉图参数
几种主流时域特征提取方法及其优缺点见表2。目前主波提取准确性较高,但因波形复杂,重搏前波、重搏波在实际应用中的检测效果较差,提取上有一定难度,因此重搏前波、重搏波提取方法还需深入研究,以进一步阐释脉象的机制。
表2 脉图时域特征提取方法分析
虽然当前很多脉象智能分析避开了时域特征提取这一环节,但笔者认为时域特征依旧是脉图智能分析的基础,尤其是主波的提取,不仅是脉型和疾病诊断的重要特征,也是脉搏波周期分段的依据,同时重搏前波和重搏波也代表重要的生理意义。
20世纪80年代研究者开始研究脉图频域、时频和非线性特征识别方法。频域特征反映脉图整体特征,典型分析方法包括功率谱分析和倒谱分析。时频分析是把一维信号或系统表示成一个时间和频率的二维函数,时频平面能描述出各个时刻的谱成分,时频分析可从时间、频域角度反映脉图的特征。常用的方法有短时傅里叶变换和小波分析。非线性特征多用于临床特定病证的脉图分析[11]。典型的频域、时频分析及非线性分析研究见表3。
表3 不同脉图特征分析方法比较
已有研究显示,时域、视频、非线性脉图特征在临床中有其各自的表征意义[12-13],因此具体特征提取方法研究应与临床应用结合,挖掘不同维度特征提取方法是后续研究的基础。
脉图模式分类从早期的人工读图识别开始,发展至20世纪80年代后开始计算机识别脉图。目前对于常见脉象的(平、弦、滑、迟、数、虚、实、浮、沉脉等)及高血压等常见疾病的单点、单部脉图分析已取得一定成果。
从句法分析指导的模糊识别和相似度度量方法[14-15],到以支持向量机(SVM)为代表的传统机器学习方法[16-19],再到目前人工智能领域应用较多的深度学习为方法。基于统计的模式分类方法虽然依赖于输入的特征,但其白盒子的特点便于理解和应用,如张嘉琪[20]利用马尔可夫决策与蒙特卡罗搜索算法设计脉象分类方案,可缩减训练时间和资源,并可保留完整的经验轨迹,在提高脉象识别准确率的同时,还可解决处理过程中的“黑箱”问题。深度学习在其处理和挖掘潜在特征方面有其优势,但制约深度学习方法实际应用的一个因素在于小脉图数据集。脉图数据集通常不够大,使其难以训练用于脉图分析的鲁棒模型。
人工智能技术的发展为中医脉象智能分析提供机遇,医生指下属于无数传感器的多源多部位信号,单点、单部信号单一、信息有限。因此,研究者们也在思考解决途径,获取多点、多部脉图对其进行智能分析或可部分解决此问题。多个脉诊研究团队研发可采集寸、关、尺三部脉图的装置[21-23]。广州、辽宁、北京等多地研究机构从“三部九候”理论到现代化应用等多个层面对多点、多部脉图进行了研究。
研究者首先验证多点、多部脉图的研究必要性;在此基础上,多点、多部脉图数据预处理多沿用单点、单部脉图处理方法。
单点、单部脉图分析从原始信号滤波、去基线、特征提取分析及模式分类均进行了系统的研究,但目前与临床应用尚有一定距离。研究者就单部脉图与多部脉图的信息学差别进行研究,结果显示多部脉图获取的信息量较大;Li等[10]采用时频、频域、时频分析等方法,研究了寸、关、尺位腕部脉象特征的相关性和差异性,利用每个位置的66个特征指标,详细计算了寸、关、尺位置及双手之间的Spearman相关系数,从定量和定性两方面研究了脉象采集位置之间的关系,结果表明,不同部位之间的特征有差异,为脉象的客观诊断和脉象信息的全面揭示奠定了基础。
多点、多部脉图特征识别以单点、单部脉图为基础,主要有2种分析思路。一种是先将多点、多部脉图看作多通道单点脉图,首先处理单点、单部脉图特征,然后对多通道的特征进行综合分析。如Wang等[19]使用主成分分析和最小二乘法等方法结合时域特征分析寸、关、尺三部脉图,并在脂肪肝和肝硬化数据上获得了较好的效果。另一种思路则将多点多部看作整体,分析其整体特征。Chu 等[24]根据寸、关、尺三部时空特征,并比较浮、中、沉的不同,区分了健康弦脉和高血压弦脉,Chung等[25]基于3×4的12 点阵脉象传感器,利用离散模型和曲面拟合模型定义阵列式脉图特征,比较三部一起按和关部单按脉图的关系。基于曲面拟合定义5个阵列式脉图参数(见图2):曲面峰值最大值(Vppmax)、脉长(Length)、脉宽(Width)、收缩期(AS)和舒张期(DS)面积。其中Vppmax定义为曲面拟合的最大值;Length、Width、AS、DS根据拟合后图形曲面的坐标轴定义。
图2 离散模型与曲面拟合模型示意图
上海中医药大学许家佗团队提出不同时刻的脉图容积(APV)系列特征[26-28],并通过健康与高血压脉图阵列脉搏波分析表明,APV能可靠地反映中医脉搏特征。APV是指单位时间(1个周期)内脉搏波波动的平均体积。按照传感器的位置组织成3*4列二维数组,数据F为12个点幅值高度,利用线性插值对3*4=12个点的F进行插值到N*N,实验中取N=1 000,即3*4列二维数组变为的1 000*1 000矩阵M,M可看成多个点幅值,目的是组成一个面(见图3),不同时刻的体积,即X轴(脉宽)、Y轴(脉长)、Z轴(幅度)围成的图形体积[25]。
多点、多部的脉图模式分类主要以融合分析为主。从特征融合角度,Lu等[29]提出一种多尺度特征提取模型,该模型包含三部分:卷积神经网络用于提取单周期脉图的空间特征和多周期脉图的节奏特征;递归神经网络用于保留脉图的长期依赖性特征;最后,使用推理层通过提取的特征进行分类。该模型在连续无创血压数据集上进行心血管疾病分类精度达到96%。Lin等[30]将脉图数据转换为二维图像,将获得的特定特征值转换为多维数组,并在SVM分类器中进行训练,分析正常人和慢性病患者脉图二维图像的差异,分类精度高于基本时间特征,实验结果表明,使用特定特征挖掘算法进行疾病检测是可行的。Zhang等[18]基于三部脉图提出基于图的多通道特征融合方法,通过应用堆叠稀疏自动编码器和小波散射生成2种不同的特征,将一个腕部脉图样本的每个特征视为与其相应特征向量相关联的节点,并用于构建一个候选图,通过开发图卷积网络,取得较好效果。Jiang等[31]提出决策级脉图融合框架,使用Karhunen-Loeve多重广义判别典型相关分析将脉图多种特征融合到一个特征向量中,对每种类型的融合特征训练支持向量机分类器,框架采用决策级融合方法将这些分类器结合进行脉搏信号分类,以解决异构特征融合问题。
多点、多部脉图的预处理多沿用单点、单部分析方法;整体性特征分析较少,多点、多部脉图智能化分析方法集中在融合方法本身,缺少理论指导下的融合分析方法。中医生诊脉时根据“三部九候”“位、数、形、势”信息,获得与疾病或状态相关的主要信息,找到问题的主要矛盾,从寸关尺部位、浮中沉空间等多个方面综合分析,得出最终的脉象分析结论。由于脉象分类具有“多维”“综合”的特点,此过程的多维有效信息融合问题,尚未得到有效解决。符合临床意义的脉象包含“位、数、形、势”多维信息,目前基于脉图的脉象分类研究主要集中在单点、单部脉图,并且已取得进展;但是,基于“三部九候”理论的脉象分类研究尚不成熟。目前“三部九候”脉图分析方法大多因为信息局限而简单堆砌,未能很好地处理各部脉图间关系,无法满足临床脉诊的全面需要[32]。
脉象全域特征(时间、节律、频率及寸关尺部位、浮中沉空间、定性和定量的波形特征等)分析需要对各部脉图进行有效的融合处理以给出综合决策,综合决策不仅是信息的简单堆积,其本质是基于多维信息融合的属性判别问题。融合分析方法可为解决脉象全域特征分析提供借鉴。在信息研究领域,融合是一种形式框架,其过程是用数学方法和技术工具综合不同信息,目的是得到有用信息或进行综合的决策融合技术,可分为数据层、特征层和决策层融合。就多部脉图而言,数据层融合是指将原始的时间序列数据直接作为融合方法输入;特征层融合为提取各部脉图特征作为输入;决策层融合是将各部脉图的分类结果作为融合方法的输入,最后给出综合结果。贝叶斯网络、神经网络、SVM等机器学习方法[33],根据其各自的优势都被应用到数据层和特征层的融合分析中,用来挖掘多源信息的内在联系。而决策层的典型方法是适用于处理多源不确定性信息的D-S证据融合模型,其优点是可将证据(输入数据)之间细微的差别累加起来,当这些差别累积到一定程度就能进行区分,达到提高综合决策准确率的效果,但它需要知道每个输入的先验概率,而大多数情况是不容易获得的。
随着人工智能和深度学习技术的发展[34-37],深度神经网络也被应用于信息融合领域。如Ren等[38]通过多通道深层神经网络进行多源图像数据的融合,取得了一定的效果,其结果也在标准数据集中进行验证,同时表明深层神经网络在多信息融合分析方面的优势。金林鹏等[39]在卷积神经网络结构基础上,通过构建的导联卷积神经网络模型实现多导联心电图融合分析,通过大数据验证该模型有明显优势。从信号角度,脉图与心电图都具有周期性的特征,且多部之间都具有相似的结构。
基于此,本文提出以中医脉诊理论、信息融合理论为指导,关注显性整体特征,利用深度学习挖掘隐性特征,构建脉图融合分析模型分析“位、数、形、势”全域特征;构建脉图全域特征表达模型,从而找出表征脉象或身体状态的主特征结合,并通过临床验证的中医脉象智能分析研究新思路(见图4),以期提供多点、多部脉图智能分析研究的可行途径。
图4 中医脉象智能分析研究新思路
中医脉象智能化分析方法主要集中在单点、单部脉图分析中,基于多点、多部脉图的研究主要集中在多点、多部脉图必要性分析、整体特征分析及融合分析方面,正在发展阶段。现阶段脉诊的现代化研究成果在实验室范围均取得较好效果,但是在实际临床中应用较少。面向临床应用是脉象智能分析研究的重要内容。本文以中医“三部九候”脉诊理论为指导,基于多点、多部脉图数据,从“位、数、形、势”角度利用深度学习与信息融合方法相结合进行脉图全域特征融合分析的新思路,为中医脉图智能化分析提供可行途径,有望解决脉诊现代化研究中关键技术问题,为实现“三部九候”中医脉诊的数据化、规范化、标准化提供方法学突破。