唐偲
摘要:文章提出了一种新的样本筛选机制,该机制利用样本特征匹配的方式根据每个测试样本的特性选择最佳地自适应子集,然后在自适应子集中计算重建出物体的光谱反射率。考虑到计算复杂度和重建精度,根据测试样本的特性预先在光谱颜色空间进行预筛选,然后在预筛选的样本子集中计算与测试样本的相似度。正如结果显示的那样,文章提出的样本筛选机制是一种利用样本之间相似度而不是样本之间的距离的筛选方式,显著地提高了光谱重建精度。
关键词:光谱重建;伪逆法;三刺激值;颜色特征匹配
颜色的定量描述一直以来都是色彩学的研究热点,它通常在三维空间中由三刺激值来表示。在三维空间中,被广泛认可的表达方式为基于色度的三刺激值法,而物体表面的光谱反射率被人们称为物体颜色最本质的属性,它能准确地表示在任一观察环境下物体的颜色信息。因此,获取物体表面的光谱颜色信息可从根本上解决同色异谱问题,已成为最近的研究热点。然而,多光谱成像设备存在重构过程复杂、时间复杂度高、价格昂贵等因素限制了其在印刷、艺术品复制和网上购物等领域的应用;同时这些领域的颜色获取设备仅有三通道颜色值,例如常规相机、扫描仪及色度仪等。
因此,利用数学算法从颜色色度值到光谱反射率的光谱重建技术得到了广泛地研究。尽管该数学算法的求解是欠定矩阵的求解,但其重建的光谱反射率仍然具有较高地重建精度。目前,光谱反射率重建算法按照其原理基本上可分为两种类型:一种是基于机器学习的重建算法(神经网络、支持向量积、压缩感知、遗传算法等);另一种是基于线性模型的重建算法(线性插值、非负矩阵分解、主成分分析法、伪逆法等)。很显然,基于机器学习的重建算法要求算法的时间复杂度高,这样基于线性模型的重建算法得到了广泛地研究。由于伪逆法是一种能够直接地反映颜色三刺激值与光谱反射率之间的对应关系的线性模型,所以样本筛选机制的精度评价都采用该方法进行。
为了提高光谱的重建精度,研究人员对标准的基于线性模型的重建算法进行了修正,其主要是为了根据每个测试样本的特性来创建最佳训练样本子集。这些训练样本的筛选机制可分为两种类型:第一种是固定分区法,它主要涉及到将光谱颜色空间按照颜色特性进行划分,且标准模型应用到每个子分区中;Garcia-Beltran等人通过聚类分析按照颜色的色相对光谱颜色空间进行固定分区划分,然后线性模型应用在每个分区中;Lee等人基于Macbeth ColorChecker颜色特性划分Munsell样本颜色空间,然后线性模型应用到每个分区中;Ayala等人和张显斗等人根据Munsell样本色相自身的特性对光谱颜色空间进行划分,在每个分区中进行光谱重建。另一种是以色差值作为样本的筛选机制,使用测试样本与训练样本之间的色差值大小进行样本预筛选,然后使用预筛选的样本进行光谱重建;Babaei等人利用色差值的大小来形成加权函数,从而通过加权函数来影响光谱的重建精度。然而,色差值的局限只能选择临近的样本对光谱重建精度产生较大影响,这样人为地导致把相似的光谱排除在外。
本文提出了一种基于样本筛选机制的自适应光谱重建算法,该方法基于颜色特征匹配来实现由CIE XYZ三刺激值来重建物体光谱反射率。我们根据颜色特征来筛选相似样本曲线,进而提高光谱重建的精度。为了体现提出样本筛选机制的优势,该方法的性能在色度精度和光谱精度上与传统的方法进行了比较分析。
一、基本理论
式中AT和 r 是表示为两个矩阵,分别涉及到样本的三刺激值和光谱反射率向量。AT是系数矩阵,是标准光源和颜色匹配函数的内积,而 r代表的是矩阵转换。由式(3)可知,光谱形状越相似,其对应的三刺激值向量也具有越高的相似度。
对于一个给定地三刺激值,物体的光谱反射率可直接通过系数矩阵的违逆而得到,而这种直接从三刺激值空间到光谱空间的重建方法叫做直接重构法。由于系数矩阵是欠定矩阵,光谱反射率的重构需使用违逆矩阵来进行计算,这样必然导致较大的重构误差。使用伪逆法来重建光谱反射率的公式如下:
公式(4)建立了三刺激值(CIE XYZ或RGB相机响应值)空间与相对应的光谱反射率之间的映射关系。一旦确定了转换矩阵,这时乘以三刺激值向量就可计算出相对应的光谱反射率。使用标准的伪逆法得到的转换矩阵是所有样本的最优解而非是每一个单独的样本,这也是造成标准线性模型重建光谱精度低的原因。如果转换矩阵的形成是根据每一个样本的特性进行确定来可以提高光谱的重建精度,所以样本筛选机制可根据样本三刺激值向量特征进行样本选择。然而,三刺激值不能代表着样本的光谱向量特征,这主要是由于同色异谱现象。正常情况下,样本之间的同色异谱现象并不严重,主要是由于同色异谱对具有相同的光谱形状趋势。因此,基于颜色特征匹配原理来从本质上探讨三刺激值空间到光谱反射率空间之间的映射关系。该样本筛选机制首先依据颜色特征匹配选择机制动态选择训练样本集,通过测试样本与训练样本集之间的匹配/不匹配关系而得到自适应样本子集,基于自适应样本子集计算得到重建光谱。理论上来讲,增加不同环境下的物体三刺激值的数量可有效地避免同色异谱问题,但常规色度获取设备常常仅能获得固定环境下的三刺激值。
二、实验过程
本文的测试样本选择三个不同的样本集:Munsell样本集、ColorChecker SG和Vrhel样本集进行测试验证。Munsell样本集包含1269个样本光谱反射率值,其来自于Munsell 半光泽度色卡;ColorChecker SG光谱颜色信息是通过GretagMacbeth Eye-one Pro 分光光度仪测量得到;Vrhel数据集包含354个不同材料的光谱反射率。
为了获得最佳转换矩阵,具有样本筛选流程如下:首先,所有样本在CIE D65光源和CIE 1964标准观察者的环境下计算样本的CIE XYZ三刺激值;然后,利用颜色特征匹配从训练样本中筛选得到自适应子集;这种样本筛选机制是利用样本之间的相似度,样本之间的相似度通过公式(5)计算得到:
式中,t 和 r 代表着测试样本的向量和训练样本集的向量;这种方法把样本的三刺激值看作一个向量,计算结果仅显示了向量的方向性而非是向量的大小,从而计算得到相对应的相似度。为了便于训练样本的选择,选择公式(6)对数值进行归一化处理。式(6)中,α和α′分别代表着原始和归一化的角度值;αmax代表着原始角度值的最大值。换句话说,为了得到与测试样本具有良好的光谱相似度的训练样本曲线,需要确定一个较佳地相似度系数,以此来建立自适应子集。例如,如果定义相似度系数为t来作为 最小选择系数,自适应子集的相似度归一化范围为r;最后,通过公式(4)计算得到具有测试样本特性的转换矩阵。
为了证明提出的算法的有效性和准确性,同时常规伪逆法和加权伪逆法来重建光谱反射率。为了定量分析的伪逆法、加权伪逆法和提出的算法的结果,选择均方根误差(RMSE)和CIE LAB色差值(使用CIE1964标准观察者和光源A,D50,E,F2)来计算测试光谱和重构光谱反射率之间的差值。
三、结果和讨论
为了在细节上评价提出算法的精度,相似系数的数值是一个非常重要的决定因素。换句话说,相似系数决定着相对应的最佳自适应子集。正如Babaei等人所讨论的那样,最佳条件的实现就是测试样本是训练样本集中的一个样本。因此,Munsell样本集作为训练样本集,而三个样本集作为测试样本集。图1展示了在不同的相似系数下,RMSE的平均值和在光源A和CIE 10°标准观察者的色差平均值。
从图1可看出,随着相似系数的不同而样本差值的分布也相对应的的发生变化,当相似系数为=0.95时重构误差在最佳值。因此,在本文中相似度系数选择为=0.95。
为了验证本文所提出的算法机理,光谱反射率的重建过程展示了图2中,光谱曲线是从Munsell样本集,ColorChecker SG样本集和Vrhel数据集中随机选择的样本。
正如图2所展示,测试样本从训练样本集Munsell中选择具有较高曲线形状相似度而不是选择的临近的样本来作为自适应子集。为了进一步分析所选择样本的特征,计算了每一个所选择样本和测试样本的CIE L*C*H*,且把样本展示在色相环上。通过图2可看出,测试样本的色相角分布以测试样本色相角为中心的固定角度范围内。为了节省计算时间,预先确定固定的角度范围来预筛选样本。例如,如果测试样本的色相角是和预先确定的角度是,则动态分区的角度范围是。在实验中,计算时间随着预先确定的角度的变小而显著减少,但颜色的重建精度基本上保持不变。因此,考虑到计算复杂度和重建精度,本文选择在光谱颜色空间进行预筛选,然后计算与测试样本相似度。
为了验证提出算法的准确性,比较了伪逆法、加权伪逆法和提出方法的光谱重建精度。数学统计结果展示在表格1中。首先,加权伪逆法和提出的算法计算精度明显高于标准伪逆法,并且提出算法的优势要明显好于加权伪逆法。这样可以说明提高重构光谱精度不仅能够使临近的样本,还可以是通过光谱相似度;为了客观地评价这三种不同的算法,测试样本集和重构样本集之间的平均光谱误差展示在图3~5。
通过分析图3~5,可以看出本文提出的算法在光谱重建精度方面要明显优于其他两种算法,这也是本文的光谱重建精度高于其他两种方法的原因。
第二,表1展示所有方法在重建Munsell样本集时重建精度要高于其他两个样本集。其主要原因是不同样本集具有自身的特性,使其应用场景不同。
第三,在三种算法和测试样本下,CIELAB色差在CIE光源A和F2要明显大于其他光源D50和E。这种现象跟Ayala等人和Zhang等人的所得到的结论相一致,主要是由于三刺激值的获得受到光源光谱曲线的影响。
四、结论
本文提出了一种新的基于颜色特征匹配样本选择机制的自适应光谱重建算法,通过创建根据样本自身特性的自适应转换矩阵,实现通过三刺激值来重建光谱反射率。为了减少计算时间,根据测试样的色相角进行预筛选以此来实现算法计算复杂度的降低。测试样本重构精度的提高依据筛选样本之间相似度而不是样本之间的距离。
本文选择三种测试样本:Munsell样本集、ColorChecher SG样本集和Vrhel样本集进行测试,并与标准伪逆法、加权违逆法进行比较。正如结果展示的那样,本文提出的样本筛选机制是一种有效地提高光谱重建精度的筛选方式。
参考文献:
[1]Dupont D. Study of the reconstruction of reflectance curves based on tristimulus values: Comparison of methods of optimization[J]. Color Research & Application, 2002(27).
[2]Zhang W-F, D
ai D-Q. Spectral reflectance estimation from camera responses by support vector regression and a composite model[J]. JOSA A, 2008(25).
[3]Zhang L, Liang D, Pan Z, et al. Study on the key technology of reconstruction spectral reflectance based on the algorithm of compressive sensing[J]. Optical and Quantum Electronics, 2015(47).
[4]Abed F M, Amirshahi S H, Abed M R M. Reconstruction of reflectance data using an interpolation technique[J]. JOSA A, 2009(26).
[5]Amiri M M, Amirshahi S H. A hybrid of weighted regression and linear models for extraction of reflectance spectra from CIEXYZ tristimulus values[J]. Optical Review, 2014(21).
[6]张显斗.数字图像颜色复现理论与方法研究[D].浙江大学, 2010.
[7]Babaei V, Amirshahi S H, Agahian F. Using weighted pseudo‐inverse method for reconstruction of reflectance spectra and analyzing the dataset in terms of normality[J]. Color Research & Application,2011(36).
[8]García-Beltrán A, Nieves J L, Hernández-Andrés J, et al. Linear bases for spectral reflectance functions of acrylic paints[J]. Color Research & Application, 1998(23).
[9]Lee C-H, Park K-H, Ha Y-H, et al. Surface reflectance estimation using the principal components of similar colors[J]. Journal of Imaging Science and Technology,2007(51).
[10]Ayala F, Echávarri J F, Renet P, et al. Use of three tristimulus values from surface reflectance spectra to calculate the principal components for reconstructing these spectra by using only three eigenvectors[J]. Journal of the Optical Society of America A,2006(23).
[11]Zhang X, Xu H. Reconstructing spectral reflectance by dividing spectral space and extending the principal components in principal component analysis[J]. Journal of the Optical Society of America A,2008(25).
(作者单位:上海理工大学光电信息与计算机工程学院)