陈 磊 李晓华 夏振平 王 坚
(1 东南大学电子科学与工程学院,南京210096)
(2 扬州大学物理科学与技术学院,扬州225002)
(3 苏州科技学院电子与信息工程学院,苏州215009)
对比灵敏度是人类视觉系统的一个重要特性,反映了人眼对图像亮度信息随时间和空间位置变化的敏感程度,通常用对比灵敏度方程(contrast sensitivity function,CSF)来描述.目前有多种描述平面图像对比灵敏度的数学模型,并被应用在二维图像的图像评价[1-2]和视觉显著性检验[3]、立体分辨率感知[4]等方面.
双目视差立体显示技术中,将2 幅具有视差的左右眼二维图像呈现给观看者,观看者通过大脑融合形成立体视觉.这种产生立体视觉的方法,与观看自然景观和二维图像时双眼会聚点和单眼聚焦点一致的机理不同.图像中亮度信息的时空调制内容通过多个不同类型的视觉通道输入到大脑处理视差的神经单元,因而立体图像中亮度信息的时空调制直接影响了立体深度感知.在光学平台或平面图像中适用的CSF 模型,能否运用在平板立体电视显示的图像中,立体图像对人眼的对比度感知有哪些影响,仍需要深入的研究.为了避免单目视觉线索的影响,Banks 等[5-6]利用随机点图构建测试图像来研究影响人眼立体分辨率的因素,但这种方法不能直接用于研究立体电视中显示的3D 图像,这是由于左右两眼在观看有视差的不同图像时,单眼视觉线索一直存在.因而,在立体显示设备的研究中不能通过这种方法来研究单眼视觉对人脑立体感知的作用.Hoffman 等[7-8]利用制作的分层显示设备,研究人眼在观看不同景深图像时的融合特性,这种分层显示立体图像的原理与平板3D 电视的原理类似,适合用于研究立体图像对人眼感受到的立体视觉效果的影响,但这种方法不能研究立体显示设备本身对立体视觉效果的直接影响.
本文通过在平板立体电视上呈现左右眼测试图像,进行视觉感知实验,研究平板立体电视中景深和空间频率这2 个因素对人眼对比灵敏度感知阈值的影响,以及不同眼镜式平板立体电视本身对人眼对比度感知阈值的影响.
目前常用的对比灵敏度方程有2 种:Kelly&Daly 模型[9-10]和Barten 模型[11].Barten 模型主要适用于静止或闪烁图像的空间CSF,Kelly& Daly模型适用于运动图像的时间-空间CSF.这2 种基本模型都是基于光学组件平台或二维显示图像的实验研究得出的,对于平板3D 显示设备呈现的立体图像是否适用,研究仍然较少.
目前市场上平板立体电视主要有2 种:①快门式3D 显示,或称为开关眼镜式(shutter glasses,SG);②偏振光式3D 显示,即偏振光眼镜式(film patterned-retarder,PR).
SG 型立体显示技术是在一帧时间内分别先后呈现具有视差的左眼图像或右眼图像,液晶眼镜的左右镜片与屏幕显示的左右眼图像同步开关,通过时间分离使左右眼看到不同图像.PR 型立体显示技术是将显示器表面相邻行镀上偏振方向相互垂直的偏振膜,而左眼镜片和右眼镜片也分别镀上相互垂直的偏振膜.显示时左右眼图像在显示器上隔行显示,这样透过两眼镜片,左右眼分别只能看到隔行显示的不同图像,从而通过空间分离的方法使左右眼看到不同图像.
这2 种显示方式都是通过眼镜和显示屏的配合显示出正确的左右眼图像.观看者的左右眼看到不同视差的图像后,通过人脑融合形成具有立体感的图像.
这种立体成像的方法和观看自然景物时的成像不同,只有景深为零的立体图像,左右眼图像无视差,单眼聚焦点和双眼会聚点都在显示屏平面;而景深不为零的立体图像,观看时单眼聚焦点和双眼会聚点不一致.如图1所示,具有正视差(见图1(a))和负视差(见图1(b))的图像单眼聚焦点和双眼会聚点不一致,图中左眼图像和右眼图像为两眼聚焦点,感知的立体图像为双眼会聚点.图1中,Δθ 为视差角,Δd 为立体图像的景深,b 为瞳距,d为视距,约为屏高的3.2 倍.
图1 不同视差的显示原理
为了研究视差、空间频率和显示器类型对CSF的影响,通过在SG 型和PR 型立体电视上进行视觉感知实验,研究这些因素对人眼对比灵敏度感知阈值的影响.
实验中,图像的对比度采用Michelson[12]的定义:
式中,C 为图像的对比度;Lmax和Lmin分别为测试图像的最高亮度和最低亮度.
实验图像为一幅垂直条纹的Gabor 图像,图像直径的视角为2°,实验时Gabor 图像随机显示在上半屏或下半屏.为了在实验中帮助受试者在立体显示模式下尽快将左右眼图像正确会聚,上下半屏的中心始终显示一个4 像素点的白色方块,如图2所示.
图2 实验图像
实验中采用强迫二选一法[13]和超阈值法[14]确定对比度阈值.测试开始后,Gabor 图像随机出现在上下白色方块的位置,受试者观看后,通过按下键盘的上下键记录其看到图像的所在位置.图像的初始对比度为V0(V0为低于人眼能辨别的对比度值).然后,Gabor 图像对比度按下式变化:
式中,Sn为对比度的相对变化量.初始状态时n=0,S0为一个较小的值,本文设为0.01.
当受试者在实验中连续2 次正确判断Gabor图像的位置,对比度停止增加,记录此时Gabor 图像的对比度Vm,记为C0;并将对比度以S1递减,即
在递减过程中,如果判断错误,记录此时对比度值Vm,记为C1,并将图像对比度变化的幅度减为原来变化幅度的一半,即S1/2.
然后,利用式(2)增加Gabor 图像的对比度,此时Sn=S1/2.如果又连续2 次判断正确,则记录此时对比度阈值Vm,记为C2.如此反复,直到记录下临界值C4,本组实验结束.实验中对比度的变化过程如图3所示.
图3 实验中对比度的变化过程
这种方法正确判断的概率为79.4%[15].最终的对比度阈值按下式选取:
实验测试程序在Matlab 环境下利用心理学测试工具箱[16]编写完成.每组测试包含10 幅不同空间频率的Gabor 图像,如表1所示,各空间频率值的图像随机顺序出现.
表1 测试Gabor 图像的空间频率 cpd
在3D 显示模式下,分别测试了左右眼图像视差角Δθ 为+0.34°(屏后成像)、-0.34°(屏前成像)和0°(显示屏位置成像)3 种情况下的竖直条纹Gabor 图像的对比灵敏度阈值.
实验在暗室中进行,平面立体电视的背景亮度设置为显示屏最高亮度的中间值,如表2所示.
表2 2 台平面立体电视的背景亮度
测试条件如下:温度为25°,湿度为51%.视距为屏高的3.2 倍[17].
实验装置包括一台47 寸(119.38 cm)PR 型商用平板立体电视和一台46 寸(116.84 cm)SG 型商用平板立体电视.实验人员共16 人,10 男6 女.平均年龄25 岁,视力(或矫正视力)均大于1.0,且立体视觉检查测试正常.3D 电视的Gamma 曲线和图像的平均亮度使用美能达CS200 亮度计测得.
图4显示了SG 型和PR 型平板立体电视在2D 显示模式和3D 显示模式下实测的Gamma 曲线.由于3D 显示模式下需透过眼镜观看,显示亮度较2D 显示要低得多,PR 型约为2D 状态下的1/3,SG 型约为2D 状态下的1/6.SG 型立体电视是利用时间分离的方法显示左右眼图像,单眼的眼镜只有一半时间开启,因而总体的感知亮度比观看PR 型立体电视时感知的亮度低.
图4 2 种平板立体电视的Gamma 曲线
本文实验中采用静止图像作为观看对象,因此将实验结果与描述静止图像的Barten 模型进行了比较.
图5显示了PR 型和SG 型3D 电视在2D 显示模式下10 个受试者的平均对比灵敏度阈值曲线.图中2 条曲线分别为Barten 模型在各空间频率点的对比灵敏度阈值和所有受试者对比灵敏度阈值的均值.可以看出,在2D 显示模式下,2 种立体电视实际测试得到的对比灵敏度阈值均低于Barten 模型的CSF 曲线.
2D 显示模式下,2 种平板立体电视的显示亮度相近,测得的CSF 曲线在各空间频率点的值也都接近.而各点均值处的方差线显示,除个别空间频率点,各受试者测试结果的偏差度较低,说明不同的测试者在实验中的测试结果一致性较好.2 种平板立体电视上测得的CSF 曲线均表现为低通特性,与Barten 模型的带通特性略有不同.通过分析Barten 模型中各参数的作用得出,观察LCD 电视图像时的平均视觉敏锐度要低于Barten 模型中给出的建议值.此外,SG 型电视中测试得到的CSF曲线与Barten 模型更为接近,特别是低空间频率点(0.41 cpd)和高空间频率点(15 cpd).
图5 2D 显示模式下实测CSF 与Barten 模型的比较
3D 显示模式下,分别测试了不同视差和不同显示方式下的对比灵敏度阈值水平.
图6显示了PR 型电视和SG 型电视分别在2D 模式和3D 模式视差为零时的测试结果.可看出,在3D 显示模式下,虽然左右眼的测试图像的视差为零,但仍对人眼的对比灵敏度有影响.通过SPSS 对实验结果进行方差分析(ANOVA)可知,PR 型和SG 型立体电视2D 显示模式和3D 无视差的图像,对CSF 产生显著影响(p <0.01).
图6 立体视差为零时实测CSF 与Barten 模型的比较
从图6可看出,3D 显示模式下的亮度低于2D显示模式.而CSF 与观看图像的亮度密切相关,因而对阈值影响较大.从Barten 模型计算结果也可看出,3D 显示模式下的CSF 低于2D 显示模式下的CSF.
此外,由图6可知,不同类型的平面立体电视对人眼对比灵敏度也会产生较大的影响.PR 型立体电视是利用空间分离的方法得到左右眼图像,在中等空间频率处与2D 显示模式相比,对人眼对比灵敏度的影响较大;SG 型立体电视是利用时间分离的方法得到左右眼图像,在高、低空间频率段对人眼对比灵敏度的影响较大.
由表2可知,3D 显示模式下,同灰阶的PR 型3D 电视的亮度约为SG 型的4 倍,但2 种立体电视测得的人眼对比灵敏度阈值的差异并不明显(见图6).这一现象符合韦伯定律:感觉的差别阈值与原刺激量相对变化有关.在观看同样的图像时,即使PR 型3D 电视的绝对亮度要比SG 型高得多,但相对亮度差别不大,因而受试者并未明显感觉到SG 型3D 电视中的立体图像亮度低.
为了了解时间分离和空间分离的立体图像显示方式对人眼对比灵敏度阈值的影响,对2 种立体电视中不同视差图像进行了CSF 测试.
图7显示了PR 型和SG 型电视3D 显示模式下不同视差图像的测试结果.从图7得出,不同视差未对CSF 产生明显影响,而中等空间频率范围内3 种视差的立体图像测试结果基本一致,且方差很小.说明各受试者的测试结果一致性很好.
通过对测试数据的方差分析同样可以看出,2种立体电视中不同视差的立体图像对CSF 影响不明显(p >0.05).在观看2 种类型的立体电视时,不同空间频率对人眼的影响也不一样.立体图像的视差在中等空间频率范围对人眼的CSF 影响最小,而在较高空间频率(7.5 cpd 以上)和低空间频率(0.6 cpd 以下)影响相对较大.此外,在Barten模型中,人眼在中等空间频率处的CSF 阈值最高,说明在这个频率范围内人眼能辨别出更低对比度的图像.而在3D 显示图像中,无论是PR 型电视还是SG 型电视,这一范围内的不同视差对人眼对比灵敏度的影响最小.
图7 立体模式下不同视差立体图像实验结果
人眼观看不同2D 显示模式的立体平板液晶电视时,CSF 阈值的一致性较好.但在液晶中测试的CSF 与Barten 模型存在差异,特别是中等空间频率处差异较大,说明液晶电视中显示的图像与传统成像方法显示的图像对人眼CSF 阈值存在不同影响.在3D 显示模式下,PR 型3D 电视的高亮度未明显提高人眼的CSF 阈值.PR 型和SG 型立体电视在3D 显示模式下,不同视差的立体图像对人眼CSF 阈值没有明显影响,尤其是在中等空间频率范围.
立体显示模式中,如何修正现有CSF 理论模型,使之适用于立体液晶电视中的立体图像,有待进一步深入研究.
References)
[1] Westland S,Owens H,Cheung V,et al.Model of luminance contrast-sensitivity function for application to image assessment[J].Color Research and Application,2006,31(4):315-319.
[2] Murray N,Vanrell M,Otazu X,et al.Low-level spatiochromatic grouping for saliency estimation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2013,35(11):2810-2816.
[3] Meur O L,Callet P L,Barba D.A spatio-temporal model to predict visual fixation:description and assessment[J].Vision Research,2007,47(19):2483-2498.
[4] Yun J D,Kwak Y,Yang S.Evaluation of perceptual resolution and crosstalk in stereoscopic displays[J].Journal of Display Technology,2013,9(2):106-111.
[5] Banks M S,Gepshtein S,Landy M S.Why is spatial stereoresolution so low?[J].The Journal of Neuroscience,2004,24(9):2077-2089.
[6] Vlaskamp B N S,Yoon G,Banks M S.Human stereopsis is not limited by the optics of the well-focused eye[J].The Journal of Neuroscience,2011,31(27):9814-9818.
[7] Hoffman D M,Banks M S.Focus information is used to interpret binocular images[J].Journal of Vision,2010,10(5):1-17.
[8] Banks M S,Akeley K,Hoffman D M,et al.Consequences of incorrect focus cues in stereo displays[J].Journal of the Society for Information Display,2008,24(7):10-14.
[9] Kelly D H.Motion and vision.Ⅱ.Stabilized spatiotemporal threshold surface[J].Optical Society of America,1979,69(10):1340-1349.
[10] Daly S J.Engineering observations from spatiovelocity and spatiotemporal visual models[C]//Human Vision and Electronic Imaging Ⅲ.San Jose,CA,USA,1998,3299:180-191.
[11] Barten P G J.Contrast sensitivity of the human eye and its effects on image quality[M].SPIE Press,1999:65-90.
[12] Michelson A A.Studies in optics[M].New York:Dover Publications Inc,2003:20-50.
[13] Levitt H.Transformed up-down methods in psychoacoustics [J].Journal of the Acoustical Society of America,1971,49(2B):467-477.
[14] Tourancheau S,Le Callet P,Barba D.Influence of motion on contrast perception:supra-threshold spatiovelocity measurements[C]//Human Vision and Electronic Imaging Ⅻ.San Jose,CA,USA,2007:64921M.
[15] Kaernbach C.Simple adaptive testing with the weighted up-down method[J].Attention,Perception and Psychophysics,1991,49(3):227-229.
[16] Brainard D H.The psychophysics toolbox[J].Spatial Vision,1997,10:433-436.
[17] Edward F K.Resolving resolution[J].Society for Information Display,2011,11(9):18-21.