文/徐天宇
(重庆邮电大学软件工程学院 重庆市 400065)
随着人工智能技术的不断发展以及各种智能设备的普及,人工智能技术正影响着整个世界,人工智能的概念最早问世于1956年的达特茅斯会议上,数学、计算机科学等科学家们提出了人工智能(Artificial Intelligence,AI)的概念,标志着计算机科学这一门交叉学科的又一次重要突破。人工智能这一交叉学科涵盖统计学、脑神经科学、社会科学等多门学科,涉及并应用于诸如工业、教育、医疗等领域。在医疗以及科研时经常用到试管这一重要工具,但是人们往往要涉及到试管的数量确认,而试管数目检测就可以减少不必要的人工涉入,自动化的完成预期目标。
本文提出的基于卷积神经网络的试管数目识别算法从图片形式,特征考虑,主要过程可以大致分为三个步骤,如图1所示:
(1)采用Canny算子对试管图像进行边缘检测。
(2)利用霍夫变换识别图像中的试管,并进行标注。
(3)利用卷积神经网络判断所识别图像是否为试管。
边缘检测是传统图像处理中提取图像边缘信息的基本操作之一,能够大幅度减少图像中包含的信息量,提取关键的边缘信息。目前在图像处理领域有多种边缘检测方法,包括一阶导数的微分算子,如Sobel算子、Robert算子、普通一阶差分、Prewitt算子、Canny算子等;此外,以及通过计算二阶导数的拉普拉斯算子、LoG算子等。考虑到Canny采用高斯滤波,对灰度渐变低噪声的数据有着较好的检测效果,因此本算法采用Canny算子进行图像的边缘检测。
Canny算子进行试管图像的边缘检测主要进行以下步骤:
利用一维高斯滤波器平滑图像,去除噪声,如公式(1)所示:
用边缘差分算子计算一阶偏导的有限差分,用差分来计算梯度的幅值和方向,如公式(2)和公式(3)所示:
其中Gx表示水平方向上的差分,Gy表示垂直方向上的差分,θ表示梯度的方向,G表示计算所得梯度的模。
图1:方法研究示意图
图2:CNN网络结构
对梯度幅值进行非极大值抑制,寻找像素点局部的最大值,此时所得到的试管数据集图片的边缘宽度将大大减小。接下来利用双阈值算法检测,设置一个高阈值和一个低阈值,抑制梯度大小小于低阈值的噪点,并定义梯度大小大于高阈值的像素为强边缘点,大于低阈值又小于高阈值的像素点为弱边缘点。
最后进行连接边缘,也叫做滞后边界跟踪,检查若边缘点的领八连通域像素,如果发现存在强连通点则保留该弱连通点,否则抑制。
图3:试管原始数据集
图4:利用canny算子进行边缘检测
霍夫变换是图像处理中检测几何图像的常用方法之一,主要用来检测直线、圆等几何特征,被广泛的应用于图像处理,计算机视觉等技术中。在试管数量识别模型中,对于坐标内的任意一个点(x1,y1),能够做出无数个圆,并且存在公式(4)成立,而对于另一个点(x2,y2),同样能够使得公式(4)成立,要检测出圆就必须使得参数相等,当方程存在解时,即检测到圆。模型中依次计算中个像素点,当公式(4)存在解时,累加器增加,表示该图像中是试管数目加一,并输入给卷积神经网络进行判断。
利用霍夫变换检测到的圆形可以得到圆形样本,但是由于霍夫变换并不稳定,以及图像中其他圆形的干扰,可能产生不是试管图案的圆形训练集。利用标签技术,区分是否为试管图案,并作为卷积神经网络的训练集。将每一张训练集转换成64*64大小的图片,输入给卷积层,进行特征提取,然后将结果输出给最大池化层,降低高维信息并减小过拟合的风险,并减少特征数量,参数数量。
卷积神经网络是一种基于卷积和池化操作的神经网络,最早演技与上世纪80,90年代,随着后来计算机技术,计算机硬件的发展,越来越多人开始研究卷积神经网络,其中LetNet-5是出现最早的卷积神经网络,能够提取数据集中的深层次特征。被广泛地应用于计算机视觉,自然语言处理中。
本模型采用CNN结构中,共有5层,两个卷积层,1个池化层以及两个全连接层,其中卷积层的激活函数使用ReLU,用于解决高维空间,梯度消失的问题,损失函数使用SoftMax以及交叉熵,被用来衡量在给定的真实分布下,两个概率分布之间的信息差。使用Adam最优化参数,Adam结合了Adagrad和Momentum两者的优点,利用梯度的一阶和二阶矩阵来动态的调节所要优化损失函数的学习率(learning rate)。具体网络结构如图2所示。
实验所采用的数据集来自实验室真实数据,如图3所示,定图片是以俯视的角度拍摄试管架。本数据集一共有15张试管照片,并保留3张作为测试集,经过霍夫变换识别试管之后,一共获得378个卷积神经网络的训练集。在训练模型时,每批包含50张图片,一共为100此迭代训练。实验硬件环境采用Windows10操作系统,第七代i5处理器2.5GHz,8GB内存,GeForce1050独立显卡,软件环境为PyCharm开发环境,python3.7,tensorflow1.8。
分析可以发现在图像处理阶段,输入图像被转换成二值图,Canny算子的边缘检测效果十分明显,如图4所示,并且所有试管都被霍夫变换所识别,变换效果不是十分理想,试管架上面的圆形与试管无法完全区分。把许多并不是试管的圆识别出来,需要卷积神经网络发挥作用。综上所述,基于本文设计的试管数量识别模型有着较高的准确率,测试集的收敛速度也十分迅速,泛化效果不错。
本文设计一种基于卷积神经网络的试管数目识别模型,利用了canny边缘检测以及霍夫变换检测图像圆形等图像处理方法,采用卷积神经网络识别圆形是否为正确试管,其中利用最大池化有效的减少参数量,并且降低过拟合的风险。模型实现了自动化试管数目的检测,解决在实验过程中人工涉入的问题,可以有效地实现使馆数目识别,完成人工智能技术在医疗实验方面的应用。