立体图像视差线性调整算法

2016-05-17 07:23:52侯春萍浦亮洲阎维青王来花王志远

哈尔滨工业大学学报 2016年5期

侯春萍, 浦亮洲, 阎维青, 王来花, 王志远

(天津大学电子信息工程学院, 300072 天津)

立体图像视差线性调整算法

侯春萍, 浦亮洲, 阎维青, 王来花, 王志远

(天津大学电子信息工程学院, 300072 天津)

摘要:为使立体图像能在特定显示设备上舒适显示，本文提出一种调整立体图像的方法. 首先利用立体图像融像区知识，计算不同显示设备舒适显示的水平视差范围；利用匹配的SIFT(scale-invariant features)特征点来估计立体图像的视差范围，建立起立体图像原有视差到舒适显示视差的线性映射；最后利用奇异值分解估计该映射的变换矩阵，通过变换矩阵计算出调整后的图像，消除立体图像垂直视差，并将立体图像的水平视差调整到舒适观看的范围. 实验结果表明，本文提出的方法可以解决不同显示设备上立体图像视差调整的问题，得到更好的显示效果.

关键词:立体图像；视差调整；线性变换；SIFT算法

近年来，随着3D电影的风靡和3D电视的推出，3D产品已成为一种大众消费品. 但是，由于不同屏幕的光学特性不同，立体图像在不同的显示屏幕上的显示效果也不相同. 在小屏幕显示时观看者感觉舒适的图像，在大屏幕显示时，观看者会出现不舒适的感觉甚至出现复视现象. 因此针对不同显示设备的立体内容调整研究是目前立体显示领域的一个研究热点.

解决这种立体视觉差异的最佳方法是调节立体内容的深度以适应不同屏幕的光学特性，而调节深度可通过调整立体图像的视差范围实现. 文献[1-2]研究用手动方式为特定显示器调整立体图像视差的方法. 但这些方法的调整方案仅靠感官判断，没有公式化的调整原则. 文献[3-5]研究基于图像的视图差补方法，如摄像机标定和深度图校正，这些方法需要大量复杂的计算. 文献[6]提出一种调整左右眼图像在原立体图像中相对位置的方法，该方法实现了视差调节且操作简单，但是该方法假设原立体图像不存在垂直视差，因此对存在垂直视差的立体图像无法实现垂直视差的调整.

本文提出一种使获取的立体图像在显示设备上舒适显示的线性调整方法，可给观看者提供舒适的观看体验. 首先利用立体图像融像区的知识[7]，得到不同显示器舒适显示的视差范围；然后利用匹配的SIFT(scale-invariant features)[8]特征点来估计获取的立体图像的视差范围，建立起立体图像视差到舒适显示视差的线性映射，满足特定立体显示设备舒适显示的需要；最后利用奇异值分解的方法估计投影变换矩阵，实现对立体图像垂直和水平视差的调整.

1立体视觉及图像变换

1.1立体图像融像区

观看者观看立体图像时，双眼聚焦于立体屏幕上，使大脑认为观看距离为S,而立体图像视差信息暗示观看物体的距离为S′. 当水平视差太大时，S与S′间的差值超过阈值，观看者将无法在大脑中融合左右眼图像，感受不到立体视觉效果. 这一现象由文献[9]首先发现，并将在注视点周围可以形成单像的区域称为立体图像融像区. 融像区内的物体均能在大脑中融合，融像区外的物体会形成双眼复视并造成视觉疲劳. 如果立体图像还存在垂直视差，那么融合图像的边缘将出现畸变，加剧观看者的疲劳程度. 因此需要将左右眼图像的水平视差控制在一定范围内，同时消除垂直视差.

文献[6]给出可使观看者舒适观看立体图像的水平像素差应满足的条件:

(1)

式中:Δn为左右视点图像的水平像素差;S为观看距离;Pw为显示屏像素宽度;D为瞳孔直径，通常为4 mm;η≈2.907×10-4rad为人眼视锐度;Ee为观看者瞳距,通常为6.5 cm.

1.2图像变换与特征点提取

通过确定调整前后图像中特征点的坐标，计算线性变换模型中的变换矩阵M

(2)

为实现左右视点图像的调整，必须得到图像的水平视差与垂直视差以确定式(2)中变换后的坐标. 首先需要完成立体图像的匹配[10-11]，寻找合适的特征点计算上述两种视差.

本文采用SIFT特征点检测算法提取图像特征点，该算法运算速度较快且稳定性好，在图像处理领域具有深入广泛的应用[12-13]. 计算左右眼图像中SIFT特征点的特征向量欧式距离即可实现特征点匹配.

2立体图像视差调整算法

2.1垂直视差调整

(3)

垂直视差调整就是要将左右眼图像中的垂直像素差调整为0，即Δyi=0，令左眼图像IL为参考图像，右眼图像IR为待调整图像，则

(4)

即令IL中特征点纵坐标在变换后保持不变，而IR中特征点纵坐标在变换后则与左视点相同，从而达到消除垂直视差的目的.

将式(4)代入式(3)得

(5)

2.2水平视差调整

1)计算匹配特征点之间的水平像素差di，即

2)对di进行直方图统计，组距为1个水平像素，计算统计直方图中所有统计点个数，记为Ptotal；计算统计直方图中视差值最大的5组数据中统计点的个数，记为Pmax.

3)计算Pmax/Ptotal并将它与给定的阈值T%进行比较，若小于给定的阈值，则认为当前统计直方图中的dmax数据是由不具有典型性的匹配特征点提供的，因此从匹配特征点中删除这些点并重复步骤3；若大于给定阈值，则认为当前统计直方图中的dmax即为该立体图像的最大水平像素差.

实验中阈值T%通常取5%～10%即可滤除明显的误匹配点.

使用类似的方法可以获得最小水平像素差dmin. 最终确定的立体图像的水平像素差范围为[dmin,dmax].

另一方面，立体图像的水平视差在不超过式(1)所定义的水平视差Δn时，观看者可得到舒适的立体图像. 令dm=(ηSEe)/(DPw)，则舒适观看的水平像素差区间Δn为[-dm,dm].

图1　水平视差调整的映射关系

当立体图像的水平像素差过大时，应该减小水平像素差，使其处于区间Δn的范围内，另一方面，当水平像素差过小时，会存在立体效果不明显的问题，因此可以适当增大水平像素差. 进行如图1所示的映射，使调整后水平像素差满足

(6)

式中:d为调整前水平像素差，d′为调整后水平像素差. 该式中调整前后0视差平面保持不变，并把调整后的水平像素差约束在区间Δn的范围内.

可得到水平视差调整后左右视点图像的匹配特征点坐标与原特征点坐标关系如下:

(7)

(9)

展开式(8)、(9)可得到方程组：

(10)

式中：i取1～4，因此共存在16个等式. 展开后化作矩阵形式，可利用奇异值分解并结合RANSAC算法[14-15]求出左右视点图像的变换矩阵ML，MR. 当匹配特征点数量众多时，RANSAC算法可寻找出使可能多的特征匹配点满足变换的最佳变换矩阵. 利用式(2)及变换矩阵即可获得视差调整后的左右视点立体图像.

3实验

为检验本文提出的视差调整算法，分别选择两幅视差过大和两幅视差过小的立体图像进行视差调整，且这4幅图像中均存在一定的垂直视差. 播放立体图像的屏幕为分辨率1 920×1 080的24英寸显示屏，观看距离为1.5m. 根据显示屏尺寸与分辨率显示屏像素宽度为

(11)

图2　视差调整过程

图3　水平视差过大的立体图像的调整

图4　水平视差过小的立体图像的调整

图3中调整前的立体图像(a)“铜狮”、(b)“校门”水平视差均过大，都具有明显垂直视差. 经过视差调整后得到的(c)“铜狮”、(d)“校门”消除了垂直视差，且水平视差减小到舒适观看的范围. 图4中调整前的(a)“雕像”水平视差太小，观看时立体效果不明显，且具有明显的垂直视差，调整前的(b)“故宫”垂直视差很大，直接观看时图内景物边缘处发生畸变. 经过视差调整后的(c)“雕像”、(d)“故宫”都成功消除了垂直视差，且在舒适观看的范围内尽量增大了水平视差，使调整后图像有了更好的立体效果.

将本文算法与文献[9]所述算法进行比较，进一步验证本文算法的视差调整效果. 以前面实验中的“铜狮”“故宫”为例，对比结果见图5. “铜狮”立体图像视差过大，2种算法都成功将图像调整至立体图像融像区的范围，但是文献[9]的算法将原来一部分视差明显的图像区域的视差调整至0，调整后该部分区域立体效果减弱. “故宫”的视差在立体图像融像区范围内，但是立体效果不够明显. 文献[9]的算法认为该图像不需要调整，因此未对该图像的视差进行调整，本文算法在融像区允许的范围内对立体图像视差进行了增大操作，使调整后的立体图像仍能舒适显示并且立体效果更为明显. 另外，由于文献[9]的算法为考虑立体图像中存在垂直视差的问题，因此2幅图像调整后仍能观察到垂直视差.

图5　算法比较

表1　垂直像素差统计　%

4结语

双视点设备获取的立体图像很难直接应用于显示设备. 当立体图像具有垂直视差或者相对于指定的屏幕水平视差过大或者过小时,都会给观看者带来视觉体验上的问题. 因此立体设备获取的双目立体图像必须经过图像调整的处理方法来实现立体图像在指定屏幕上的舒适显示.

本文提出一种基于特征点匹配的立体视差矫正算法，该算法建立起从立体图像原有视差到舒适显示视差的线性映射，并利用奇异值分解的方法计算出该映射的投影变换矩阵，从而实现对立体图像垂直视差和水平视差的调整. 实验结果表明，该算法具有很好的显示效果，并保证了双目立体图像的一致性.

参考文献

[1] FELDMANN I, SCHREER O, KAUFF P. Navigation dependent nonlinear depth scaling [C]// Picture Coding Symposium. Saint Malo, France : INRIA, 2003: 387-390.

[2] WANG C, SAWCHUK A A. Disparity manipulation for stereo images and video[C]// Stereoscopic Displays and Applications XIX. San Jose, CA: SPIE, 2008: 68031E-68031E-12.

[3] KIM M, LEE S, CHOI C, et al. Depth scaling of multiview images for automultiscopic 3D monitors[C]// 2008 3DTV-Conference: The True Vision-Capture, Transmission and Display of 3D Video. Istanbul. Turkey: IEEE, 2008: 181-184.

[4] SMOLIC A, MULLER K, DIX K, et al. Intermediate view interpolation based on multiview video plus depth for advanced 3D video systems[C]// ICIP 2008. San Diego, CA: IEEE, 2008: 2448-2451.

[5] BLEYER M, GELAUTZ M, ROTHER C, et al. A stereo approach that handles the matting problem via image warping[C]// IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Miami, FL: IEEE, 2009: 501-508.

[6] 张丞, 侯春萍, 王晓燕. 立体图像视差自适应调整算法[J]. 光电子激光, 2014, 25(3):581-587.

[7] MAXWELL M G. Three-dimensional color television[J]. SMPTE journal, 1985, 94(8): 821-825.

[8] LOWE D G. Object recognition from local scale-invariant features[C]// Proceedings of the Seventh IEEE International Conference on Computer Vision. Los Alamitos, CA: IEEE, 1999, 2: 1150-1157.

[9] PANUM P L. Physiologische Untersuchungen über das Sehen mit zwei Augen[M]. Charleston, SC: Nabu Press, 2010.

[10]王华, 丛建亭, 侯相深, 等. 畸变图像的有效配准算法[J]. 哈尔滨工业大学学报, 2010,42(4): 597-601.

[11]王磊, 张钧萍, 张晔. 基于特征的 SAR 图像与光学图像自动配准[J]. 哈尔滨工业大学学报, 2005, 37(1): 22-25.

[12] LI J, LU Z. B-SIFT: a highly efficient binary SIFT descriptor for invariant feature correspondence[C]// 2nd Sino-Foreign-Interchange Workshop on Intelligent Science and Intelligent Data Engineering, IScIDE 2011. Xi′an: Springer Berlin Heidelberg, 2012: 426-433.

[13] SOYEL H, DEMIREL H. Improved SIFT matching for pose robust facial expression recognition[C]// 2011 IEEE International Conference on Automatic Face & Gesture Recognition (FG 2011). Santa Barbara, CA: IEEE, 2011: 585-590.

[14] HARTLEY R, ZISSERMAN A. Multiple view geometry in computer vision[M]. Cambridge: Cambridge university press, 2003.

[15] SATTLER T, LEIBE B, KOBBELT L. SCRAMSAC: Improving RANSAC′s efficiency with a spatial consistency filter[C]// 2009 IEEE 12th International Conference on Computer Vision. Kyoto: IEEE, 2009: 2090-2097.

(编辑王小唯苗秀芝)

A disparity adjustment algorithm for stereo image based on linear transformation

HOU Chunping, PU Liangzhou, YAN Weiqing, WANG Laihua, WANG Zhiyuan

(School of Electronic and Information Engineering, Tianjin University, 300072 Tianjin, China)

Abstract:A 3D image calibration method is proposed to provide a better performance on particular display device. Firstly, the knowledge of stereo image fusion area is adopted to calculate the comfortable horizontal disparity range for different display device. Secondly, the Scale-Invariant Features (SIFT) algorithm is applied to estimate the disparity range in a 3D image, and then a linear mapping between the original disparity and the comfortable disparity for the 3D image are obtained. Finally, the transformational matrix for the linear mapping and disparity correction for the 3D image are got. The experimental results indicate that the proposed algorithm has a good performance, which is adaptive for various disparity problems.

Keywords:stereoscopic image; disparity adjustment; linear transformation; SIFT algorithm

中图分类号:TP391

文献标志码:A

文章编号:0367-6234(2016)05-0090-05

通信作者:王志远, wzhiyuan@tju.edu.cn.

作者简介:侯春萍(1957—)，女，教授，博士生导师.

基金项目:国家高技术研究发展计划(863 计划)重大项目(2012AA03A301)；国家基金重大研究计划重点项目(91320201)；国家基金面上项目(61471262)；教育部博士点基金(20110032110029)(20130032110010).

收稿日期:2014-08-28.

doi：10.11918/j.issn.0367-6234.2016.05.014

哈尔滨工业大学学报2016年5期

哈尔滨工业大学学报的其它文章: 超塑性自由胀形温度对Ti2AlNb板材壁厚分布的影响; 应用复杂网络的航空维修安全信息辐射模型; 一种适于无源LANDMARC算法的定位性能评价方法; 多元符号的安全算术编码; 可拓聚类适应度共享小生境遗传算法研究; 改进卷积玻尔兹曼机的图像特征深度提取