陈顺成 梁志军 申启访
摘 要:图像素描化在激光雕刻领域中发挥着极其重要的作用,传统的图像素描处理方法是不同的图像采用同一种算法进行处理,存在适用率不高和部分参数不通用问题。文章提出一种基于机器学习的素描图像处理技术,通过搭建素描图像处理神经网络系统,使用构建的素描图片数据库对模型进行多次迭代训练,最后达到预期素描处理效果,提高了图片素描化处理的普适性。
关键词:图像素描化;图像处理;机器学习;神经网络
中图分类号:TP391 文献标志码:A 文章编号:2095-2945(2019)22-0152-02
Abstract: Image sketching plays an extremely important role in the field of laser engraving. The traditional image sketch processing method is that different images are processed by the same algorithm, which has the problems of low application rate and incompatibility ofsome parameters. In this paper, an image sketch processing technology based on machine learning is proposed. By building a sketch image processing neural network system, the sketch image database is used to give the model the iterativetraining for many times, and finally the expected sketch processing effect is achieved. The universality of image sketch processing is improved.
Keywords: image sketching; image processing; machine learning; neural network
1 概述
近年來,随着相关激光技术理论研究的深化以及激光器件的不断发展,使其应用领域也不断得到拓宽[1],工艺品制作领域就是其中之一,如应用激光内雕技术生产的水晶产品,使用激光打标机来进行名片的个性化制作[2]。激光加工技术与数控技术相结合,从而能加工更复杂的形状,使很多用常规方法不能解决的加工难题得以解决[3]。图像激光雕刻应用越来越广泛,对图像素描化的要求越来越高。
经过几十年的发展,机器学习衍生出很多理论模型,应用于自然语言处理、图像识别处理以及语音识别分析等各类问题。机器视觉作为人工智能的一个主要构成部分,前人在图片处理方面做了很多机器学习相关的研究。
本文采用机器学习进行素描图像处理,通过建立模型训练数据库、搭建模型、训练模型和模型测试与分析,验证了通过机器学习来处理素描图片方法的可行性。
2 方法
因图片具有多样性,所以不能使用单一线性模型来训练,而CNN(卷积神经网络)由于使用的卷积核具有参数共享以及稀疏连接等优点,能较高效的对图片进行有效处理,并且在各卷积隐藏层能捕捉图片的一些细节。
2.1 数据准备
本文使用Labeled Faces in the Wild(LFW)dataset[4],LFW图片数据库包含了13233张含有背景的尺寸为3×250×250的人像照,而这些包含多种姿势表情、图片光线质量以及各种复杂背景的图片是由Erik Learned-Miller等人在网上寻找并通过神经网络系统处理出来的。
2.2 模型搭建
训练数据库中图片是单通道的尺寸大小为1×250×250的灰度图片,根据需要模型输出的图片尺寸也为1×250×250。参照Deepak Pathak在其论文中DNN搭建思路(如图1),也将图片处理神经网络模型分成“编码器”网络与“解码器”网络。
在“解码器”网络中,通过借鉴DCGAN模型的搭建思路,使用反卷积的方法将“编码器”网络输出的4000×1×1隐藏层经过六个类似的卷积层还原成1×250×250原图尺寸进行输出。
3 实验
在训练过程中,由于图片数据库较大,模型参数较多,运算量大,所以我们使用配备GTX1080Ti显卡的主机来训练模型。
3.1 模型训练
本模型训练流程:前期是图片数据库的建立和加载,为了使导入图片与目标图片相对应,我们要编写相应数据加载函数,使其在每次迭代时返回对应的一组图片;模型加载以及相应参数的设定;接着将批量的图片导进神经网络模型进行多次迭代训练,算法过程如表1。
3.2 模型数据测试与分析
在测试时,我们选取了6个不同阶段的模型参数来进行测试,分别是epoch=1、50、150、300、600、1000时对应的模型。图2第一行分别是原图和人工处理的目标素描图。
当epoch=1时,模型输出的素描图片只有一个模糊的轮廓;epoch=50时,图像细节增多,相片黑框边界较清晰;epoch=300时,处理图可显示出大概的人像。当epoch=1000时,图片素描效果已经十分接近人工处理的目标素描图。因此在一定范围内,随着迭代次数越来越大,素描图片效果越明显。
4 结束语
本文采用机器学习进行素描图像处理,通过建立模型训练数据库、搭建模型、训练模型和模型测试与分析,最后解决自动化图片处理时调参问题以及图片处理时局部优化问题,达到预期素描处理效果,提高了图片素描化处理的普适性。
参考文献:
[1]郑锦生,陈松青.激光雕刻技术的发展[J].机床与液压,2005,(8):228-231.
[2]曹雪璐,郑志军,杨林丰.激光打标的几种PS图像处理方法[J].实验室研究与探索,2015,34(5):228-231.
[3]赵静.木质材料激光雕刻加工技术的研究[D].北京:北京林业大学,2007.
[4]E. Learned-Miller, G. B. Huang, A. RoyChowdhury, H. Li, and G. Hua, “Labeled faces in the wild: A survey,” in Advances in Face Detection and Facial Image Analysis, pp. 189-248, Springer Science + Business Media, 2016.
[5]Deepak Pathak,Phillip Krhenbühl,Jeff Donahue,Trevor Darrell,Alexei A. Efros. Context Encoders: Feature Learning by Inpainting. arXiv:1604.07379v2 [cs.CV].2016.