基于BP神经网络结构的图像压缩技术研究

2021-05-28 20:11刘光宇曹禹黄懿曾志勇赵恩铭邢传玺
关键词:BP神经网络重构

刘光宇 曹禹 黄懿 曾志勇 赵恩铭 邢传玺

摘 要:采用BP (back propagation)神经网络方法进行图像数据压缩处理.通过输入信号的正向传递和误差信号的反向传播算法,直接为图像提供数据压缩的能力.仿真实验表明,通过合理调整BP神经网络模型隐含层神经元的个数,可使图像压缩效果最佳.

关键词:BP神经网络;数据压缩;归一化;重构;隐含层神经元

[中图分类号]TP391   [文献标志码]A

Research on Image Compression TechnologyBased on BP Neural Network structure

LIU Guangyu1,CAO Yu1*,HUANG Yi1,ZENG Zhiyong1,ZHAO Enming2,XING Chuanxi3

(1.School of Engineering,Dali University,Dali 671003,China;2.College of Physics and Optoelectronic

Engineering,Harbin Engineering University,Harbin 150001,China;3.School of Electrical and

Information Technology,Yunnan Minzu University,Kunming 650504,China)

Abstract:BP (Back Propagation) neural network is used to compress image data.Through the forward transmission of the input signal and the back propagation algorithm of the error signal,the ability of data compression is directly provided for the image.The simulation results show that the optimal compression effect can be achieved by reasonably adjusting the number of hidden layer neurons in BP neural network model.

Key words:BP neural network;data compression;the normalized;reconsitution;hidden layer neurons

海量图像信息的无失真传输和快速存储的问题,使得多媒体技术面临巨大的压力,大容量信息存储更是对高效压缩技术提出了迫切的要求.[1]为了减轻数字图像在信息存储和传输方面的压力,人们开始把人工神经网络的强大功能应用于图像压缩处理领域,并取得了良好的效果.BP (back propagation)神经网络模型鲁棒性高,容错性强,可以通过不断调整网络中的参数来实现数据压缩,达到理想的效果.[2]神经网络具有分布式处理、大规模并行、自学习、自组织等优点,是人工智能的主要技术手段.[3]在种类繁多的神经网络中,应用最为广泛的就是BP神经网络.[4]BP神经网络是典型的前馈型网络,它可以实现多维输入和多维输出的非线性映射.[5]BP神经网络有很强的自学习和自适应能力、泛化能力和容错能力[6],其本质是以误差平方函数为目标函数,采用梯度下降法求目标函数的最小值.[7]另外,BP神经网络比传统的方法更为有效和方便,在非线性领域具有广阔的应用前景.[8]本文采用该方法进行图像数据压缩处理,通过仿真实验验证该方法的可行性和有效性.

1 研究原理和方法

1.1 BP神经网络的图像压缩原理

BP神经网络对图像压缩的基本思想:让原始数据到达隐含层的网络瓶颈,使其在网络瓶颈处获得较为紧凑的数据表示,从而达到压缩的目的.即当隐含层的神经元个数较少时,意味着隐含层能用更少的数来表现输入模式,而这实际上就是压缩.网络模型和压缩原理流程见图1.BP网络结构由输入层、隐含层和输出层三部分组成.[9]原始图像在输入端经过神经网络的处理后,通过隐含层得到输出数据,并由输出层来输出矢量数据,既为解压后重建的图像数据.一般对图像进行压缩处理时,选择三层的BP神经网络模型应用较多,原因是BP神经网络的整体收敛偏慢,当隐含层变多时,运行速度会变得更慢,其耗时也会随之增加.

1.2 神经网络算法

信号在BP神经网络传播的过程中,包括一个正向学习过程和一个误差反向学习过程,这个过程是一个反复进行的网络训练学习过程.正向传播是由输入层到隐层的过程,反向传播是输出层到隐层的误差反传过程,这就是BP神经网络算法的基本原理.[10]正向传播时,每层神经元的状态只影响下一层神经元, 且神经网络各层的阈值和权值在信号前向传播过程中是固定不会变的.[11]若在输出层得不到期望的输出,则转向误差信号的反向传播流程,随着输出端的误差逐渐减少,一直达到可接受的程度或设定的学习次数才会停止.[12]

·正向传播算法:

设BP网络的输入层有n个节点,隐层有q个节点,输出层有m个节点,输入层与隐层之间的权值为vki,隐层与输出层之间的权值为wjk,如图2所示.

BP網络实质上是对任意非线性映射关系的一种逼近,由于采用的是全局逼近的方法,因而BP网络具有较好的泛化能力.

1.3 BP神经网络设计

BP神经网络使用feedforwardent函数创建,用LM训练法.因为LM算法的BP神经网络是基于误差不断减小这一原则,采用逐层向前移动的方法,使输出值与期望值之间的误差平方在阈值范围内.[13]

网络训练参数的设置:训练目标最小误差为0.001,最大训练步数为1 000,学习率设置为0.05.确定目标误差和最大训练步数以及学习率后,需要新建一个初始化的网络,网络的初始化包括输入层和映射层之间权值的初始化.[14]启动一个计时器记录训练所用的时间,调用train函数进行训练,最后利用sim函数实现神经网络对数据非线性映射后的编码仿真结果.

2 仿真实验和结果分析

2.1 样本原图的处理

实验原图选用云南省大理市崇圣寺三塔照片,见图3(a).该照片为png格式的灰度图像,尺寸为1080×1440,宽度1080像素,高度1440像素,位深度为8.对该样本原图做以下处理:首先将原图修改为312×312的像素尺寸,然后将此图像分割成若干不重复的4×4像素块,利用函数reshape将像素块重构成16×1的列向量,即将样本原图转化成了16×6084的像素矩阵,对此像素矩阵除以255来进行归一化处理,保证矩阵中的每一个值在[0,1]之间,提高其在BP训练网络中的收敛性.

2.2 图像重构和反归一化

将BP神经网络对图像压缩后的输出数据进行重建.由于BP神经网络输入与输出采用的是同一个矩阵,即将之前构建的16×6084像素矩阵作为目标输出矩阵,再将每个列向量恢复成图像块,把所有子图像块合成一幅完整图像,完成图像的重构工作.最后将矩阵元素乘255并取整,进行反归一化操作,目的是将各像素值从[0,1]恢复到[0,255]区间内重建图像.

2.3 仿真结果分析

由于隐层神经元数量对BP网络的性能影响很大,若神经元数量过小,则计算精度较低;若神经元数量过大,则会出现过拟合现象.[15]因此,对BP神经网络的隐含层神经元个数分别设置为2,4,6,8,16,然后分别进行实验.

为了更直观的对实验压缩重构后的图像质量进行评价,将原始图像与不同神经元个数的重构图像做对比,如图3所示.对比发现:隐含层的不同神经元个数对重构后的图像质量会有很大的影响.当隐含层神经元个数越多时,图像会在某种程度上出现块效应现象,这是由于对图像处理时简单进行分成像素块造成的,但是观察图像压缩重构后的效果可以发现,图像的清晰度有明显的提升,故可以通过增加隐含层的神经元个数提高图像的质量.

采用压缩所用的时间、重构后的图像信噪比、峰值信噪比和压缩率等性能指标对实验效果进行评价,实验性能指标结果见表1.

结果显示,改变BP神经网络的隐含层神经元个数会对实验的性能指标产生较大的影响.当对BP神经网络的隐含层神经元个数选取为4时,其性能指标要好于对其他神经元个数的选取,且隐含层神经元个数为4时,压缩所用时间仅在1秒左右,拥有的压缩率也显示出可以大幅减少占用存储空间.

通过用户界面可以综合分析各参数运行的状况.当隐含层神经元个数为2时的图像数据压缩率最好,但图像质量较差;隐含层神经元个数为16时的图像数据压缩率较差,但图像质量最好.因此,可以综合分析隐含层神经元个数为2和16时的用户界面各参数运行的状况,如图4所示.

实验选用的隐含层神经元个数可使训练目标的最小误差在0.001内,隐含层神经元个数越多,训练的步数会变得更少,回归效果也会拟合的更好,但相应的数据压缩率会变差以及所花费的时间会更多.

3 总结

本文采用BP (back propagation)神经网络方法进行图像数据压缩处理.通过输入信号的正向传递和误差信号的反向传播算法,直接为图像提供数据压缩的能力.仿真实验证明,合理调整BP神经网络的隐含层神经元的个数,可以实现最大化节约图像传输所用的时间,减少数据压缩后的大小,满足人们对重构后的图像质量的要求.

参考文献

[1]李崇.基于神经网络的实时性图像压缩算法研究[D].北京:北京邮电大学.2019.

[2]诸葛木子,李文,张兴会.基于BP神经网络的数字图像压缩方法的研究[A].中国高科技产业化研究会智能信息处理产业化分会.第十届全国信号和智能信息处理与应用学术会议专刊[C].中国高科技产业化研究会智能信息处理产业化分会:中国高科技产业化研究会,2016:5.

[3]俞立平,阮先鹏,陈一涛,等.基于因子-BP人工神經网络的期刊评价方法选择研究[J].现代情报,2020,40(11):128-135+153.

[4]张尧,胡骏,宋美荣,等.神经网络在彩色图像压缩中的应用[J].计算机技术与发展,2012,22(11):9-12+17.

[5]李敬德,康维新.基于信息熵和BP神经网络的信号奇异点智能检测[J].牡丹江师范学院学报:自然科学版,2017(4):1-5+43.

[6]王虹,徐佑宇,谭冲,等.基于改进粒子群的BP神经网络WSN数据融合算法[J].中国科学院大学学报,2020,37(5):673-680.

[7]潘程艳.带动置的BP神经网络在线梯度学习算法的收敛性[D].上海:华东理工大学.2019.

[8]Yan-Wen Li,Ke Cao.Establishment and application of intelligent city building information model based on BP neural network model[J].Computer Communications.2020,153:382-389.

[9]兰欣.基于BP神经网络的乙型病毒性肝炎辅助诊断的应用研究[J].中国数字医学,2016,11(12):19-21.

[10]张文胜,郝孜奇,朱冀军,等.基于改进灰狼算法优化BP神经网络的短时交通流预测模型[J].交通运输系统工程与信息,2020,20(2):196-203.

[11]常志萍.基于BP神经网络的投标报价博弈研究[D].西安:西安理工大学.2020.

[12]赵晨.神经网络预测模型在A股市场预测中的应用[J].时代经济贸,2012,(18):185-185.

[13]Hongzhi Xue,Hongwei Cui.Research on image restoration algorithms based on BP neural network[J].J.Vis.Commun.Image R.2019,59:204-209.

[14]别威,田丽.基于SOM神经网络的电能质量综合评估[J].牡丹江师范学院学报:自然科学版,2019(4):34-37.

[15]陈乐瑞,曹建福,胡河宇,等.一种基于Volterra频域核的非线性频谱智能表征方法[J].中南大学学报:自然科学版,2020,51(10):2867-2875.

编辑:琳莉

收稿日期:2020-12-14

基金项目:国家自然科学基金项目(61761048);云南省地方本科高校基础研究联合专项资金项目(202001BA070001-060);黑龙江省自然科学基金项目(LC2018026)

作者简介:刘光宇(1982-),男,黑龙江哈尔滨人.助理研究员,博士,硕士生导师,主要从事信号处理研究;曹禹(1994-),男,黑龙江牡丹江人.在读研究生,主要从事图像处理研究;黄懿(1998-),女,河北省邢台人.在读研究生,主要从事图像处理研究.

通信作者:曹 禹

猜你喜欢
BP神经网络重构
长城叙事的重构
重构
农产品供应链重构赋时层次有色Petri网建模与仿真研究
学科哲学导向的高中历史教学重构
重读《重构》,呼唤匠艺
就bp神经网络银行选址模型的相关研究
基于DEA—GA—BP的建设工程评标方法研究
复杂背景下的手势识别方法
BP神经网络在软件质量评价中的应用研究 
BP神经网络算法在数值预报产品释用中的应用