基于神经网络的钢筋计数方法研究

2010-12-07 06:04陈至坤潘晓娣王福斌周亚罗

传感器与微系统 2010年8期

陈至坤，潘晓娣，王福斌，，周亚罗，刘杰

(1.河北理工大学计算机与自动控制学院，河北唐山063009;2.东北大学机械工程与自动化学院，辽宁沈阳110004)

0 引言

钢筋是我国消费量最大的钢材品种之一，在钢筋定支打捆和计数时，各生产商纷纷采用先进技术来提高计数准确率和计数效率。20世纪80年代，国外开始对钢筋进行自动计数系统进行研究，其研究的重点是准确的测量和控制。国内现有的自动计数方法主要是图像识别法，将采集的图像输入计算机，通过图像处理算法进行特征提取，实现自动计数。

目前，研究人员主要采用基于面积法的钢筋计数系统和基于模板法的钢筋计数系统。这2种计数方法都有一定的可行性，但也存在一定的缺点。面积法［1］计数结果并不易于在计数的结果图像中直观地显示出来，不易对计数结果的优劣进行判断，一旦有误差出现，不易找出错误的原因;模板匹配法［2］对模板和目标物的形状有较大的依赖，自适应能力较低。

由于神经网络具有自学习、自组织、分类能力强、自适应强等特点，对于数字图像来说，采用神经网络是一种有效的手段。

1 基本原理

钢筋识别和计数的基本原理图如图1所示。

图1 神经网络识别钢筋并计数基本原理图Fig 1 Basic principle diagram of reinforcement recognization and counting based on neural network

从现场采集到的钢筋图像包含大量的背景信息和噪声，不仅对识别带来困难，而且，在这种情况下识别没有意义。所以，在钢筋识别之前，必须对原始的钢筋图像进行数字图像处理。数字图像处理包括图像灰度化、滤波去噪、边缘检测、图像分割、形态学处理。经过一系列处理之后的图像，图像特征明显了，这样的图像作为神经网络的输入待识别图像，用来识别和计数的神经网络是已经训练好的网络，这个网络可以将待识别的钢筋图像根据神经网络的输出，做出判断得到识别的结果。

2 数字图像处理

数字图像处理是模式识别的基础和关键，处理结果的好坏直接影响识别的性能，图2给出数字图像处理的流程图。

图2 数字图像处理的流程图Fig 2 Flow chart of digital image processing

钢筋原始图像是数码相机拍摄的彩色图像，彩色图像的储存占据大量的空间，所以，在对图像处理和识别时经常采用灰度图像，以加快后续的处理速度。

从摄像头获取的图像在转化过程中受电磁特性和外界条件(光照、天气等)的影响，使得图像有噪声、模糊、退化、变质等干扰，图像质量下降，不宜于图像的进一步处理。为了抑制噪声，改善图像质量，需要对图像进行去噪。中值滤波能够有效地抑制图像中的噪声，并且能保护图像的轮廓边界，不使其边界模糊。因此，本系统采用中值滤波去噪。

图像分割［3］的目的是将图像中有意义的特征或者需要应用的特征提取出来，有意义的特征和需要提取的特征与要解决的问题图像有关，问题不同，同一图像的分割方法和结果也不同，本系统采用阈值分割。

二值化后的图像，有时存在空洞、缝隙、孤立子域等问题，因此，需要数学形态学的膨胀运算子填补物体中狭小的空洞和缝隙，使物体的形状增大;腐蚀运算子简化物体的结构可以使较复杂的物体分解成几个简单部分。另外，膨胀运算子和腐蚀运算子结合运用，开运算(先腐蚀再膨胀)可以切断搭结，去掉孤立子域、毛刺等部分，闭运算(先膨胀再腐蚀)可以填充细小空洞，搭结短的间隔。本系统采用闭运算。经过数字图像处理后钢筋图像如图3。

3 特征提取

对计算机图像识别系统而言，物体的形状是一个赖以识别的重要特征。一个图像形状和结构特征有2种形式，一种是数字特征主要包括几何属性(如，长短、面积、距离等)、统计属性和拓扑属性;另一种是由字符串和图等所表示的句法语言。

由于感兴趣的是图像的形状和结构特征，所以，其灰度信息可以忽略，常用的方法是用二值化算法把目标和背景区分开来，即将感兴趣的部分标以最大灰度值，把背景或不感兴趣的部分标以最小灰度值。

在本文钢筋识别和计数中，感兴趣的是钢筋的形状，因此，选择图像的特征必须可以表达或者描述钢筋的形状。图4为提取的钢筋轮廓图像。

图3 经过数字图像处理后的钢筋图像Fig 3 Reinforcement image after digital image processing

图4 钢筋轮廓图像Fig 4 Steel bar profile image

3.1 钢筋的面积［4］

求单根钢筋的面积和打捆钢筋的总面积，方法原理是一样的，即图像中区域的面积就是图像中相同标记的像素数目。

因为图像采集是连续的图像，而经过图像处理后的图像是离散的数字图像，在像素点描述时，产生了误差，因此，在计算面积过程中对每一个不同像素模式上加上不同的权值，以减少误差。面积计算公式如下

3.2 钢筋的高度和宽度［5］

对于离散的数字图像，区域的边界轮廓可理解为相邻边界像素点之间的单元连线逐段相连而成，考虑数字图像像素点(x，y)的一个8邻域，显然，在该处的边界只能有以下几种情况:正东、东北、正北、西北、正西、西南、正南和东南，对于每一种方向赋以一种码表示，就是 0，1，2，3，4，5，6，7这8个码表示下一点与前一点之间的位置关系，这些码称为方向码。例如:0表示下一点在该点的正东方向，即下一点可表示为(x+1，y)，又如7表示下一点在该点的东南方向，即下一点可表示为(x－1，y－1)，如图5所示。

图5 方向码的定义Fig 5 Define of the directional code

设方向链码为{a1，a2……an}，定义ai在X轴上的分量为aix，在Y轴上的分量为aiy，则有以下式子成立

ai=0 时，aix=1，aiy=0;ai=1 时，aix=1，aiy=1;

ai=2 时，aix=0，aiy=1;ai=3 时，aix=－1，aiy=1;

ai=4时，aix=－1，aiy=0;ai=5时，aix=aiy=－1;

ai=6时，aix=0，aiy=1;ai=7时，aix=aiy=－1 .

设x0和y0是起始点的坐标，则边界轮廓所表示的区域的高度和宽度为

4 BP神经网络识别钢筋并计数

图6为BP神经网络识别钢筋并计数的流程图。

图6 BP网络应用流程图Fig 6 Flow chart of BP network application

4.1 BP 神经网络

BP神经网络结构算法描述:1)初始化网络参数，学习参数，如，设置网络初始权矩阵、学习因子等;2)提供训练模式，训练网络，直到满足学习要求;3)前向传播过程:对给定训练模式输入，计算网络的输出模式，并与期望模式比较，若有误差，则执行(4)，否则，返回(2);4)后向传播过程:.计算同一层单元的误差，修正权值和阈值，返(2)。

4.2 设计网络结构

网络结构的设计是根据输入节点和输出节点的个数与网络性能来决定的。本文特征量为单根钢筋的宽度、高度和面积、打捆钢筋的总面积4个特征量，因此，输入节点选4 个;要识别96，97，98，99，100，101，102，103 这 8 种情况下的钢筋数量，所以，将目标输出值设定为一个八维的列向量，其中以钢筋个数对应的那个位为1，其他位为0;隐含层数目没有规定，一般根据经验和实际情况而定，本文选6个隐含层。因此，本文的BP网络的结构为4—6—8，如图7所示。