安国进
摘要:为解决全彩3D打印中彩色信息在计算机与打印设备间的复制与传递问题,提出了基于BP神经网络色彩空间转换模型,并通过学习打印设备的输入/输出样本对构建打印设备內部的转换关系,改变网络隐层神经元数量,最终得到一个训练结果较好、速度较快的RGB到L*a*b*转换的网络结构。再按照心理明度值L*将样本数据通过等间隔及聚类两种分组方式进行建模,使用径向基函数作为神经元传递函数再次进行网络训练。该模型在网络结构最优值寻求的简便性、训练精度和速度上都具有相当的优势。
关键词:全彩3D打印;校色算法;色彩管理技术;神经网络
自从有了彩色打印技术,色彩管哩技术一直是印刷出版领域关注的重要内容,其首要任务就是解决色彩信息在各个没备间的转换问题,保证图像的色彩在传递过程中失真最小。全彩色3D打印作为3DP一个独特的亮点,包含了色彩管理技术、喷墨打印技术、材料科学与化学等关键领域。表现优异的色彩管理系统饀快速、精确的将色彩信息在输入与输出设备间进行匹配,使用户能提前预见色彩信息在不同设备、介质上的表现效果。色彩管理作为保证彩色印刷质量的前提,是全彩色3D打印中必不可少的一项技术。
一、国内外研究现状
分色技术是色彩管理系统中的关键技术。在颜色理论上,从RGB色空间向CMYK色空间转换的实质就是分色的过程。分色算法的优劣直接影响印刷输出的质量,目前主流的分色算法包括ICC Profile、多项式回归、修正的纽介堡方程、神经网络、多光谱和查找表等方法。20世纪末,国际色彩联盟ICC制定了ICC这一规范。该规范系统描述了中间色彩空间与设备相关的色彩空间之间的转换关系,通常采用CIE LAB作为中间色空间。CIE LAB作为一个均匀颜色空间,能够直观表色和评色,较方便的表示出设备之间的色差并与视觉上达到一致。但该色彩空间不能预測不同视觉条件下的复杂空间图像的颜色差别,以及不适跨媒体和跨平台的颜色比较。
由于色彩空间的转换是一个拟合非线性的过程且相对复杂,文献表明,BP神经网络能够不同程度的拟合出任意非线性复杂映射关系,适合于在外部求解内部复杂的问题。但是BP网络在网络调节时存在局部最优和收敛速度慢等劣势,因此本文进一步提出基于径向基函数的神经网络来提高拟合能力和收敛速度。通过神经网络学习输入空间RGB数值与输出空间CMYK数值之间的非线性关系得到两个空间之间的转换模型,进而计算足量输入/输出数值对生成三维查找表,彩色打印时,通过查找三维表来进行色彩匹配。
二、神经网络分色模型的建立
近年来,神经网络已经被尝试应用于色空间的转换和彩色油墨的调配问题中。其高度非线性表达能力作为最大亮点,非常适合彩色空间之间的非线性转换。同时它具有的强大非线性映射能力,使我们不需要了解系统内部结构就能得到其输入和输出之间的映射关系。
1、RGB到CMYK颜色空间的BP神经网络模型建立
通过建立一个BP神经网络,并使其作为RGB颜色空间到CMYK颜色空间的转换模型,该方法具体原理如图l所示。
在该转换方法中,将打印设备当作一个不知其内部结构的“黑盒子”,该黑盒子接受一个(R,G,B)格式的三维向量输入,经过打印后有一个(L*,a,b*)的颜色输出,该颜色输出值由SpyderPRlN/分光光度计进行測量。
实验时,由打印机打印出大量已知(R,G,B)值的色块样本,并由SpyderPRINT进行测量得到每个色块的(L*,a*,b*)值,将两组数据一一对应组合成(R,G,B)-(L*,a*,b*)样本数据对。进行网络训练时,以(L*,a*,b*)值作为网络输出,
(R,G,B)作为网络标准输出,训练结束后即可得到一个神经网络控制器。打印时,将所需要打印颜色的(L*,a*,b*)值输入控制器,即可得到打印机应有的(R,G,B)值,这样打印出来的效果即是用户所期望的颜色。
(1)数据准备与处理。
网络训练样本采用SpyderPRINT分光光度計自带的Expert Target Plus Grays试样,共967组数据,其中部分建模数据对如表l所列。
网络测试数据的RGB值分别取为10、50、100、150、200和255六种之一进行组合,共216组数据。
由于(L*,a*,b*)三个分量的取值范围的不统一不利于网络的训练,因此在输入网络进行训练前需要对数据进行归一化处理,经处理后的数据取值范围都为(0,1),经过归一化后的数据能够保证输入向量各维度具有相同的权重,使网络更快收敛,并能统一评价标准。
(2)建立网络模型。
根据训练样本三维输入输出的特点,选取含有两个隐含层的BP神经网络,使用MATLAB进行编程实现,训练最大步长为1000,总误差MSE阈值为0.001,采用trainlm(LM算法)作为训练函数,purelin作为输出层传递函数,tansig作为隐含层传递函数。
①大步长实验。
首先第一轮测试使各隐层神经元个数分别为5、10、15、20、25和30进行大步长实验,实验数据如图2所示。分析可知,当两层神经元数都在(15,20)之间时,色差值较小且波动稳定。
②小步长实验。
在上述实验基础上进行第二轮小步长实验用以确定最终的网络结构,分析发现,使用组合为(15,16)或(16,15)的BP神经网络结构进行建模得到的測试结果误差最小,且较为稳定。
(3)模型精度分析。
BP神经网络控制器的目的就是为了拟合打印机的输出特性,从而找到正确的(R,G,B)数值对来抵消打印机及墨水等硬件特性带来的色差。上述实验通过对216组样本进行測试,将打印样本的(L*,a*,b*)值输入控制器得到转换后的(R,G,B)数值并与原始(R,G,B)数值进行比较计算误差,其中部分数据由表2所列。
由于打印机输出采用CMYK的减色模式,相比于RGB的光增色模式,亮度会降低,致使打印图像变得暗沉,由此在表2中转換后的RGB数值基本都比源数值偏高以提高图像亮度,这一定程度上证明了转換的可靠性。
由上述各组试验综合分析,BP神经网络模型的训练误差最低为6.65△Eab,但是其样本数据计算量大,训练时间较长,如果没有硬件神经网络的支持,训练速度很难达到应用要求。此外,训练BP神经网络需要考虑不同样本的特点,进而确定训练函数、传递函数、网络层数和各层神经元数,调节过程耗时耗力。
2、RGB到CMYK颜色空间的RBF(径向基)神经网络模型建立
相比于BP神经网络繁杂的调整结构和参数过程,径向基神经网络能够根据输入数据自适应调整结构,使训练更加便捷,因此,下面将上述实验中的BP神经网络改为径向基神经网络进行研究。径向基函数是一种中心对称且沿中心往外逐渐衰减的非负非线性函数,最为常见的径向基函数是形如式(1)的高斯函数。
(1)数据预处理。
网络训练与測试数据采用与上节相同的数据来源,但为了提高训练速度和预測精度,将967组训练对按照明度L*大小划分为10组分别进行网络训练,分组采用两种不同方式。第一种按照归一化后的明度L*大小进行等间隔划分,每10个单位作为一组。第二种分类方法将归一化后的明度L*按大小排序后进行聚类分析,使用K-means聚类算法得到聚集更加紧密的10组数据。
(2)建立网络模型。
由于径向基网络的结构与连接权值由学习样本数据自行确定,因此网络的训练过程只需要确定基函数的扩展系数SPREAD。SPREAD表示径向基函数的光滑因子,其值越大则输出结果越光滑,但太大会导致计算的困难而太小又会导致不能对所有输入向量产生响应,因此必须有一个合适的值来赋给网络。对第一种分类方式进行实验分析,将10个网络(NI~N10)分別进行训练,并采用取样间隔为l的SPREAD值进行结果评估,找到误差最小的SPREAD值,结果如表3所列。采取同样方法对第二组分类结果进行训练,结果如表4所列。
(3)模型精度分析。
由于采样数据在RGB颜色空间为均匀分布,当其进行非线性映射转换到到L*a*b*颜色空间后,数据不再具有均匀分布的特性,因此采用等间隔划分数据不再是最优的分组方式。因此提出采用聚类算法进行分组,使更加接近样本分为同一组来降低每组的偶然误差从而提高训练精度。
由上节实验结果进行计算可得等间隔分组十个网络色差均值为5.19△Eab,而采用聚类方法分组的十个网络色差均值为4.86△Eab。结果证明采用聚类算法进行分组比人为等间隔分组有更好的效果,同时采用聚类算法分组可以考虑减少分组数从而简化训练过程,在此不进行详细实验分析。
三、分色模型实验
1、设计训练与测试标签数据对
本训练样本采用SpyderPRINT分光光度计自带的ExpertTargetPlusGrays试样,共967组数据,其中(R,G,B)数值对中每个分量取值范围为0~255。測试样本采用自主设计的test.bmp位图,其中共216组不同(R,G,B)数值对目与训练样本不重复,所有样本RGB三通道分量取值为{O,50,100,150,200,250}中任意一个。
2、测量训练与测试样本数据对
设计完标签数据对之后,使用Easy3DP-Ⅱ3D打印机进行石膏粉末的彩色打印,打印后进行表面细化等后处理工序,待打印制品完全粘结,表面颜色不再发生变化后使用SpyderPRINT分光光度计进行样本LAB数据对的采集。
3、模型精度验证
将测试样本的RGB值依次输入第4章中确定的网络模型进行预測输出,得到校色后RGB数值对,使用新的RGB值对原有样本进行覆盖生成校色后的打印制品。采用SpyderPRINT分光光度计对校色后制品进行測量,并与理论输出LAB数值进行对比,进行色差分析。
四、结论分析
采用聚类方法分组的十个径向基网络色差均值为4.86△Eab。结果证明使用径向基神经网络并采用聚类算法进行分组具有最佳的的分色效果。通过对实验数据综合分析可以发现,色差较大的样本主要集聚在亮度较暗的区域。分析原因可得到以下两点原因:
分光光度计測量采用反射原理,理论上的黑色色块会吸收所有色光不进行反射,而实际測试中这不可能发生,由于暗调色块的反射率大于理论值,是的整体測量结果偏亮,也就使得暗凋部分数据不够准确与充足。根据实验測量结果表明,色块最低亮度L为10.16,低于10的样本不存在,因此导致暗调色差偏高。
暗调部分打印设备四色墨水进行大量叠加,呈现出复杂的颜色效果,同时受黑色墨水影响,其余三色效果被覆盖,导致a与b的预测结果偏差较大。