吴玉琳
(枣庄职业学院 山东 枣庄 277800)
随着我国经济水平的高速发展,脊髓损伤发病率呈逐年升高趋势[1]。脊髓损伤不仅会给患者本人带来身体和心理的严重伤害,还会对整个社会造成巨大的经济负担。在脊髓损伤之后,因肢体感觉和运动功能障碍缺乏自主运动能力导致长时间单一姿势卧床是发生褥疮的主要原因。因此,快速、准确分析脊髓损伤者卧床姿态并及时提醒,对预防褥疮等并发症和现代化医疗有重大意义。
本文利用脊髓损伤者卧位时足底图像作为特征图像,提出一种基于卷积神经网络的卧姿状态识别算法。首先,获取特征图像并进行预处理。其次,利用卷积神经网络对特征图像进行分类进而获知卧姿状态。
为降低成本,使用视频传感器拍摄的卧位图像作为特征图像。人体卧位时,两脚处于自然摆位状态且足底的形状为长方形,有良好的方向区分性。因脊髓损伤者肢体运动功能障碍,在某一卧位姿态时足部无自主运动,采集到的足底图像就比较稳定。此外,在患者翻身时,因肢体是被动摆位,能保证足部姿态与卧位姿态强相关性。因此,本文提出利用足底图像作为特征图像,根据足底图像方向变化得知脊髓损伤者当前卧位姿态。
原始图像由视频传感器直接获取,其中包含噪声和部分人为干扰,预处理可以使图像标准化,减少之后分类的难度。
2.1.1 图像去噪
通过视频传感器获取的数字图像,常常因设备和外部环境因素而含有噪音。因此,在对图像处理之前需要对原始图像进行数字去噪,降低对后续图像处理的不良影响。
中值滤波器是一种非线性数字滤波器,主要原理是设置一个大小为N的观察窗口并对窗口内的N个数进行排序,若N为奇数,输出取中间值,否则输出取中间两个值的平均。每次丢掉最前面的一个数,取一个新采样重复计算来滤除图像中的斑点噪音和椒盐噪音。
2.1.2 图像光平衡
利用图像传感器获取数字图像时,往往会受到外界光照因素的影响,采集的足底彩色图像常常会有偏色现象或者不同程度的高光和阴影。本文将Gray World[2]色彩均衡方法融入图像预处理过程中,消除待处理图像的偏色问题,为提高姿态识别提供了保障。
本文所用GrayWorld色彩均衡具体方法如下:
(1)在RGB色彩空间中计算有颜色偏差图像的R,G,B分量和,分别记为:sR,sG,sB
(2)计算颜色均衡调整参数:
(3)利用色彩均衡调整色彩分量:
本文定义了四种基本卧位姿态:仰卧、俯卧、左侧卧和右侧卧。采用的人体睡姿识别方法就是利用计算机视觉来识别静态图像中的睡姿,识别的结果是四种基本睡姿中的一种。
卷积神经网络(ConvolutionalNeuralNetwork,CNN)是神经网络的一种,但其微观结构与其他神经网络有很大不同,它的每一层数据由若干矩阵数据节点构成,而不是由若干向量节点构成。在计算过程中采用卷积模式,因此被称为卷积神经网络。
卷积神经网络对图像的旋转、平移或缩放具有高度不变性。卷积神经网络的一个很大的亮点是其使用的下采样算法,减少了运算复杂度,并且能够随着模型网络层数的增加,提取出更为抽象的信息。图1A和图1B分别显示了一个典型的用于识别的卷积神经网络——LeNet-5[2]和一个用于人脸识别的卷积神经网络[3]。
图1 卷积神经网络
本文采用了与LeNet-5类似但又更为复杂映射关系的卷积神经网络,此网络规模大提升了脊髓损伤者卧位姿态的识别率。
经多次迭代学习后,可计算一个平均矩阵。
本文使用的卷积神经网络设定5个隐含层,第一隐含层设定1000个神经元,第二隐含层和第三隐含层均设定500个神经元,第四隐含层和第五隐含层均设定200个神经元。当训练样本较大时,需要相应减少神经元个数。
卷积神经网络的输出的卧位姿态如下表所定义:
表1 卷积神经网络输出定义
本实验采用已标注的300张正常光照情况下脊髓损伤者各种卧位姿态下足底正面拍摄图像作为数据集,随机选择此数据集的70%(210张)用于训练卷积神经网络,剩余20%(90张)用于验证结果。
实验结果如下表2所示:
表2 实验结果
本实验将210张脊髓损伤者各种卧位姿态下足底正面拍摄图像直接作为卷积神经网络的输入进行训练,得益于卷积神经网络具有提取目标深层信息的能力,并不需要提取特征。训练后的卷积神经网络用于识别卧位姿态,识别效果非常好(准确率为98.9%)。
本文综合分析了脊髓损伤者卧位时的多种图像,确定使用足底图像作为特征图像,随后引入卷积神经网络将足底图像进行分类,进而识别卧位姿态。通过实验表明,选择脊髓损伤者卧位时足底图像作为特征图像有较好的区分度,使用卷积神经网络识别足底图像进而确定卧位姿态有较高的准确率。下一步,需要获取更大的数据集,测试算法的稳定性并继续优化算法,保证准确率的前提下减少隐含层数量。