王浩伦,朱业安,徐唯祎,徐苒,黄月姑,卢巍
1.华东交通大学交通运输与物流学院,江西南昌330013;2.江西省人民医院康复医学科,江西南昌330006
步态分析旨在通过生物力学和运动学手段来获取定量的步态检查信息,从而为揭示异常步态原因、矫正异常步态、制定治疗计划以及评估干预效果提供依据[1]。步态识别在神经病学、矫形病学和康复医学等临床医学中有着广泛应用,大多数临床医生使用观察和量表技术进行评估,但主观的观察评估在临床治疗中是不够可靠的[2],量表评估虽然可以提供关于患者日常运动能力的信息,但也常被认为不客观以及对患者病情的改变评价不够敏感[3]。测力台和三维运动捕捉系统是实验室中用于步态识别的常用设备,这些测量工具能为评估患者的功能表现提供准确可靠的信息,但昂贵的设备和较高的技术要求限制了其在临床诊断中的大规模使用[4]。与传统的三维运动分析系统相比,微软公司的Kinect传感器系统是一种更切实可行的选择[5-7]。Kinect传感器系统成本低且性能受环境的影响小,并能通过较低的设置条件来获取患者的运动轨迹数据,操作简单。最近几年,有研究者已经证实Kinect传感器作为临床步态识别工具的准确性和有效性[8-11]。因此,本研究利用Kinect传感捕获受试者骨骼关键点的运动轨迹数据,并根据步态分析的内容实现相关识别特征的提取。
考虑到步态运动学分析参数的多样性和复杂性,大量参数可能存在信息冗余及属性重复等问题,因此对采集的数据信息进行特征参数提取后,需要利用属性选择方法对特征进行分析,获得识别特征的重要性排序,从而有效地提高步态模式的识别精度,这样既能为临床医生的识别诊断提供参考,也能为今后步态障碍的自动识别研究提供新的思路。属性选择方法在数据预处理和建模过程中也得到了广泛的应用,其主要目标就是去除一些不相关和冗余的特征属性,进而得到满足特定要求的、最优的特征属性集。属性选择的优点是不仅能够通过筛除不相关和冗余的属性使得数据挖掘算法效果更好,还能够使最后构建的模型具有较高的泛化能力。因此,本研究在提取3组步态模式的特征后,采用以信息增益为依据的模糊二元对比决策方法对步态模式影响因子的重要度进行排序。首先,通过计算所有特征的信息增益来实现两两特征之间的二元对比,从而建立二元比较级;然后,利用模糊相对比较函数,建立模糊相及矩阵;最后,通过确定λ-截矩阵来对所有的特征进行排序。
本研究共招募了60名受试者。其中,试验组为20名偏瘫患者,男性12名、女性8名,年龄(54.3±12.2)岁,身高(164.75±6.13)cm,体质量(61.5±10.1)kg;对照Ⅰ组为20名健康老年受试者,男女各10名,年龄(71.83±10.55)岁,身高(159.83±10.49)cm,体质量(58.16±7.52)kg;对照Ⅱ组为20名健康青年受试者,男性13名、女性7名,年龄(24.43±3.83)岁,身高(169.00±6.87)cm,体质量(59.93±13.58)kg。两组对照组均无运动障碍相关疾病。临床试验在江西省人民医院康复医学科进行,由当地伦理委员会审批通过,受试者均签署知情同意书。
试验时,每名受试者均需完成规定的范式动作:单次直线行走5 m,一次试验走3次,重复3次试验。因Kinect传感器测量精度的限制,本研究确定的有效试验范围为1.5~4.5 m,现场试验如图1a所示。由Kinect传感器捕获到的骨骼关键点如图1b所示。在试验过程中,受试者骨骼节点的三维坐标位置会被实时捕获和存储。
图1 试验示意图Fig 1 Schematic diagram of test
1.2.1 时空特征提取本研究从Kinect传感器捕获的运动轨迹数据中提取出步幅、步长、步宽、步速、步频、足偏角和支撑相时间比作为步态的时空特征。提取算法可归纳为以下几个步骤:(1)对Kinect传感器捕获的标记点坐标数据进行预处理,去除标记点坐标的粗误差;(2)计算标记点15和16的中心位置坐标,获得左足底坐标;计算标记点19和20的中心位置坐标,获得右足底坐标;(3)利用单侧足底坐标间的欧氏距离来计算平均步幅,利用左右足底间的水平距离来计算平均步宽,利用一足着地至对侧足着地的距离来计算平均步长,如图2所示;(4)测量所有受试者的腿长,即计算节段13~15和节段17~19之间的欧氏距离,并利用它们的均值来对步幅、步长、步宽进行标准化[12]。在获得步幅后,由步速=步幅/步行周期,计算出步速特征。以标记点15(19)和16(20)的向量方向为足中心线方向,计算足中心线与同侧步行直线之间的夹角来度量足偏角。另外,通过统计单位时间内行走的步数计算出步频特征;以足底与地面接触的时间计算支撑相时间,从而推算完整步态周期下支撑相的时间比重。
图2 步态时空特征示意图Fig 2 Schematic diagram of gait spatiotemporal features
1.2.2 质心特征提取人体质心的移动范围是进行步态运动学分析的一个重要指标。Winter[13]提出的身体节段法是质心测量的“金标准”,该方法首先将人体分为头、躯干、上臂、前臂、手、骨盆、大腿、小腿、足等15个独立的身体节段,本研究利用Kinect传感器采集该方法所定义的所有身体节段的近端坐标和远端坐标。然后,利用采集到的标记点位置计算出每个节段的质心位置,定义一个身体节段质心位置的计算公式如式(1)所示:
其中,xcm、ycm、zcm为节段质心坐标;xp、yd、zp是节段近端的坐标;xd、yd、zd是节段远端的坐标;lp是从近端到末端的节段长度的百分比;ld是从远端到末端的节段长度的百分比[14]。
最后,利用各节段质心位置来计算人体质心位置,其计算公式如式(2)所示:
其中,xtcm、ytcm、ztcm为人体质心的坐标;xk、yk是第k段的坐标;mk是第k段的质量;M是15个身体节段的总质量。本研究获得的质心移动范围(上下和左右方向)如图3所示,在此基础上,可计算出受试者质心左右移动范围(L/R Distance of the Center of Mass,L/R COM)和上下移动范围(U/D Distance of the Center of Mass,U/D COM)的平均值。
图3 步行过程中人体质心移动示意图Fig 3 Schematic diagram of the movement of the center of mass during walking
1.2.3 下肢关节活动度提取关节活动范围是肢体运动功能检查的最基本内容之一。下肢关节活动度测量科目众多,本研究根据步态分析的要求提取了膝关节最大屈曲角度、膝关节最大伸展角度、髋关节最大屈曲角度和髋关节最大伸展角度作为评定特征,本节将以膝关节的屈曲角度测量为例阐述特征提取过程,其余特征可按运动向量法计算[15]。首先,设髋关节、膝关节和踝关节的坐标分别为(Xhip,Yhip,Zhip)、(Xknee,Yknee,Zknee)、(Xankle,Yankle,Zankle),利用Kinect传感器获取骨骼节点数据,得到各关节的空间坐标点;然后,采用空间中两点间的距离公式计算髋到膝、膝到踝、髋到踝的距离,分别以L1、L2、L3表示,L1的计算如式(3),其余距离的计算方法类似;最后,利用运动空间三角形法计算膝关节屈曲角度α,如式(4)所示。
模糊决策的目的是要把论域中的对象按优劣进行排序。实践表明,人们认识事物往往是从两个事物的对比开始的。一般先对两个对象进行比较,然后再换两个进行比较,如此重复多次,每做一次比较就得到一个认识,而这种认识是模糊的,需要将这种模糊认识数量化,最后用模糊数学方法给出总体排序,这就是模糊二元对比决策。模糊相对比较决策就是一种二元对比决策,该方法首先在二元对比中建立二元比较级,然后利用模糊相对比较函数,建立模糊相及矩阵,最后通过确定λ-截矩阵来对所有的备选方案进行排序。模糊相对比较决策的具体步骤如下。
设论域U={x1,x2,…,xn}是对象集,A是U上的一个模糊集。首先,在二元对比中建立二元比较级。对于给定的一对元素(xi,xj),若存在数对(fj(xi),fi(xj))满足0≤fj(xi)≤1、0≤fi(xj)≤1,使得在xi与xj的比较中,如果xi具有A的程度为fj(xi),那么xj具有A的程度为fi(xj),这时称(fj(xi),fi(xj))为xi与xj对A的二元相对比较级,简称二元比较级。当i=j时,令fi(xi)=1。然后,利用模糊相对比较函数,建立模糊相及矩阵。若论域U={x1,x2,…,xn},xi与xj的二元比较级为(fj(xi),fi(xj)),称:
为模糊相对比较函数。记rij=f(xi|xj),则称以rij为元素的矩阵R=(rij)n×n为模糊相及矩阵,于是有:
最后,通过确定λ-截矩阵来对所有对象进行排序。取定阈值λ∈[0,1]得λ-截矩阵,其中:
当λ由1逐渐下降时,若首次出现的Rλ,它的第i1行元素全等于1,则认定xi1是第一优越对象;再在R中划去所在的行与列,得到一个新的n-1阶模糊矩阵,用同样的方法获取最优对象作为第二优越对象。如此递推下去,可将全体对象排出一定的优劣次序。
建立二元比较级矩阵是模糊相对比较决策的关键,通过计算特征的信息增益可实现两个特征之间的二元对比,从而建立二元比较级矩阵。信息增益表示得知特征X的信息使得类Y的信息的不确定性减少的程度,信息增益大的特征具有更强的分类能力,在本研究中能更好地体现最重要特征的属性,因此本研究将所有特征与步态类别之间的信息增益作为评价函数对特征的相对重要性进行评价。信息增益的概念是在信息熵的基础上建立的,信息熵是一种常见的用于统计离散变量不确定性的度量。
设X是一个取有限个值的离散随机变量,其概率分布为P(X=xi)=pi,i=1,2,…,n,则随机变量X的熵的定义为:
因为熵只依赖于X的分布,而与X的取值无关,所以也可以将X的熵记作H(p),即:
随机变量X给定条件下随机变量Y的条件熵H(X|Y),定义为X给定条件下Y的条件概率分布的熵对X的数学期望:
加入条件X前、后Y信息熵的差异即为X与Y之间的信息增益。特征A对数据集D的信息增益g(D,A),定义为集合D的经验熵H(D)与特征A给定条件下D的经验条件熵H(D|A)之差,即:
设数据集为D,|D|表示其样本容量,即样本个数。设有K个类Ck,k=1,2,…,K,|Ck|为属于类Ck的样本个数,设特征A有n个不同的取值{a1,a2,…,an},根据特征A的取值将D划分为n个子集D1,D2,…,Dn,|Di|为Di的样本个数。记子集Di中属于类Ck的样本的集合为Dik,|Dik|为Dik的样本个数。信息增益的算法如下。
首先,计算数据即D的经验熵H(D):
然后,计算特征A对数据D的经验条件熵H(D|A):
最后,计算信息增益:
采用SPSS 24.0软件对特征提取结果进行统计学分析。计量数据用均数±标准差表示,组间均数比较采用单因素方差分析。P<0.05表示差异有统计学意义。
利用单因素方差分析对3种步态模式的评定特征的平均值之间是否存在差异进行检验。由表1可以看出3种步态模式下所有评定特征的平均值之间均有显著差异,也就是说这些评定特征对于步态模式的识别有着重要影响。
表1 实验组与对照组特征参数比较Tab 1 Comparison of feature parameters between experimental group and control groups
设论域U={步幅,步长,步宽,步速,步频,足偏角,支撑相,质心上下移动,质心左右移动,膝关节最大屈曲角度,膝关节最大伸展角度,髋关节最大屈曲角度,髋关节最大伸展角度},A=“最重要的分类特征”是U上的模糊集。将计算得到的特征xi和xj对数据集D的信息增益g(D,xi)和g(D,xj)代入:
得到两两特征之间的二元比较级,其中xi、xj∈U。从而构建二元比较级矩阵(图4)。
利用λ-截矩阵方法对所有对象进行排序,得到优先排序结果:步频、膝关节最大屈曲角度、足偏角、髋关节最大屈曲角度、步幅、支撑相、步速、髋关节最大伸展角度、质心左右移动、膝关节最大伸展角度、质心上下移动、步长、步宽。
图4 二元比较级矩阵Fig 4 Binary comparative matrix
图5 计算得到的矩阵Fig 5 Calculated matrix
本研究获取了偏瘫患者、健康老年、健康青年的骨骼关键点的运动轨迹数据,从中提取了步幅、步长、步宽、步速、步频、足偏角、支撑相、质心左右移动、质心上下移动、膝关节最大屈曲角度、膝关节最大伸展角度、髋关节最大屈曲角度、髋关节最大伸展角度作为步态模式的识别特征。通过单因素方差分析发现3种步态模式下所有特征的平均值之间均有显著差异。利用以信息增益为依据的模糊二元对比决策方法对步态识别特征的重要度进行排序可为步态障碍的及时检查和识别提供参考。本研究的不足之处在于只提取了步态的时空特征和运动学特征,并没有提取动力学特征,因此在后续的工作中,本课题组将会利用基于逆向动力学的骨肌仿真模型来获取患者步行时的动力学参数,以提高研究结果的精确性。这类方法利用运动捕捉系统捕获的患者运动轨迹作为输入,然后基于逆向动力学模型来预测患者在整个步态周期内的动力学参数[16-18]。此外,本研究的样本量不大,以后的研究还可以根据更多的样本和试验来提高结果的准确性。
基于骨骼关键点检测技术的步态检查方法具有成本低、操作简单的特点,其采集数据的准确性和有效性也得到了验证[19-20]。对于我国康复医疗发展来说,这一新技术可以有效降低治疗成本,提高行业的服务能力。另外,人工智能正在深刻地改变人们的生活,在提升医生工作效率、提高医生服务能力等方面展现出巨大优势,“人工智能+医疗”无论是从政策上的支持还是经济上的表现,都承载着“改善医疗现状”的使命。属性选择一直是构建智能诊断算法的关键所在,通过去除一些不相关和冗余的特征属性,得到满足特定要求的、最优的特征属性集不仅能够使得诊断算法效果更好,还能够使最后构建的模型具有较高的泛化能力。因此对步态识别特征进行分析,得到识别特征的重要性排序,可为今后步态障碍的自动识别和智能诊断研究提供借鉴。