白柯萌,王建中,王洪枫,张晟
(北京理工大学 机电学院,北京 100081)
眼动跟踪技术在各个领域中的应用越来越广泛,尤其在无人武器的操控中,可实现看哪打哪[1-6]. 标定是眼动跟踪技术的重要环节,一般通过人眼注视标定界面上的标定点建立对应的视线估计映射函数来完成[7-8]. 标定界面作为一种人机交互的界面,界面中的不同特征因素对人眼有着不同的刺激,因此研究人眼对标定界面的注视效果也是眼动跟踪技术的一大关键.
Wooding[9]于 2002 年建立的眼动仪数据库网站,根据网站统计结果,目前世界上共有约 44 家眼动仪研发与生产单位,对于眼动跟踪的标定都采用了不同的标定界面. 包括对屏幕的4个顶点进行标定[10],注视屏幕上显示的3×3分布的9点标定点完成标定[11-13],注视屏幕中间固定的一点进行标定[14],利用共面4彩色标定点分布在屏幕中作为标定界面进行眼动跟踪的标定[15],注视屏幕上3×5分布的15个标定点进行标定[16],注视5×5分布的25个标定点进行标定[17-19]. 其中,文献[14-15,18-19]使用“+”型标定点,标定界面的背景颜色有黑色、白色、灰色等,标定点颜色有白色、黑色、蓝色等,文献[16-17]使用标定界面背景颜色为白色,“•”型黑色标定点.
上述研究的眼动跟踪标定界面的背景颜色有黑色、白色、灰色等,标定点颜色有四彩色、白色、黑色等,标定点形状有“+”、“•”等,未对标定界面的特征统一规定. 人机交互界面中的颜色、形状、大小等特征对人的视觉生理有着不同的刺激和影响[20-22],标定界面的颜色、形状、大小等特征对人眼都有着不同影响. 因此,本文研究人眼对不同标定界面的注视效果,设计不同的标定界面,包括背景及标定点颜色、标定点形状、标定点大小. 利用混合加权特征对人眼检测[23]和最小二乘回归的方法建立视线估计映射模型进行标定[24]和注视测试,以注视准确度和精密度表示注视结果,计算不同标定界面的注视准确度和精密度[25],并进行对比分析选出最佳标定界面.
不同的颜色对人的视觉生理器官的刺激不同,产生色彩心理反应. 颜色是标定界面中最基本的要素之一[26]. 颜色的作用,一方面凸显界面中的重点信息,引导被试者迅速锁定目标,另一方面不同颜色对被试者有着不同的心理感受,也会影响标定结果. 在颜色的选择上,以双色搭配进行凸显[27],使得标定界面的视场简洁明了,有助于被试者快速定位注视标定点. 形状和大小也是视觉识别的表征信息,标定点形状及大小特征影响被试者的认知,进而影注视效果.
① 界面颜色的确定.
应用心理学认为,黑色严肃、沉静,白色洁净、光明,有利于眼动跟踪标定时被试者保持沉静,快速定位注视标定点. 以双色搭配进行凸显,设定标定界面的背景分别为黑色、白色、灰色,参考表1所示不同颜色组合的易见度顺序[26],选择各背景色对应的标定点颜色分别为白色、黑色、黄色,如图1所示.
表1 不同颜色组合的易见度顺序Tab.1 Visibility order of different color combination
② 标定点形状的确定.
形状构成元素包括线段、圆弧、圆、样条曲线等,即形状轮廓表征形状. 轮廓中的角点、倾角等作为形状中的局部特征具有凸显性[21,28],在视野中容易引起注视. 高分辨性和简单的标定点形状在标定界面中易凸显,标定过程中易搜索定位. 按照条状、面状、环状等整体差异性[21]设计标定点的形状和大小,设定的3类简单标定点形状如图2所示.
③ 标定点大小的确定.
标定点的大小同样会影响被试者的注视效果,针对23.8寸显示屏按照30×30,60×60,90×90 pixels设定小、中、大3种尺寸的标定点,如图3所示.
综合以上分析,3种背景和标定点双色搭配,3种标定点形状,3种标定点大小相互组合成27组标定界面,如表2所示(例:1号黑环中界面表示黑色背景、白色环状中等大小标定点),3×3均匀分布9点标定界面的样式如图4所示.
表2 标定界面Tab.2 Calibration interface
标定及测试系统,如图5所示,包括NVIDIA Jetson TX2开发板,用于对眼睛摄像机和武器瞄准摄像机两路视频进行处理,同时对眼动跟踪注视数据处理;显示器(23.8寸,宽×高约为526.89 mm×296.37 mm,分辨率1 920×1 080 pixels),用于显示实验过程中的图形图像信息,实验中屏幕亮度调整为300 cd/m2;头部固定架,用于保持被试者头部的正确位姿. 被试者眼睛与显示器屏幕的垂直距离为60 cm,屏幕中央与被试者眼高基本水平.
① 标定.
不考虑实验过程中不同标定界面的标定结果会因人而异. 被试者按照图4所示标定点编号顺序,逐一注视显示屏中的标定点. 每注视一个标定点,眼睛摄像机采集对应的眼图,并通过眼动检测获得对应的瞳孔中心坐标. 完成9个标定点的注视,即可建立瞳孔中心坐标与标定点坐标之间的映射关系,即视线估计映射函数[24].
② 测试.
打开武器瞄准摄像机,其采集的场景图像在显示屏中显示,在此图像上按照从左至右,从上至下顺序依次出现5×5均匀分布的25个位置已知的红色“+”目标点,每个目标点保持5 s后消失,如图6所示. 被试者按照屏幕中目标点出现的顺序和位置,完成对5×5目标点的注视.
针对27组标定界面标定后注视测试,每组测试3次,标定和测试过程如图7所示.
图8所示为5×5均匀分布25点测试的注视点与目标点分布效果.
考虑测试系统的响应和被试者对相邻两个目标点的注视反应,每一个目标点取5 s中后3 s的注视点数据作为有效注视点数据,每秒输出5个注视点数据. 计算每组测试的注视准确度和精密度,并对每组测试3次的结果取平均,分析不同标定界面对注视结果的影响. 以准确度为主,兼顾精密度选取最佳标定界面.
注视准确度是指注视点与目标点之间的偏差角度θi,每一组实验的注视准确度θ,计算如式(3). 如图9所示,d为眼屏垂直距离,A(x0,y0)为像素坐标系中屏幕中心坐标,B(xt,yt)为像素坐标系中目标点坐标,C(xs,ys)为像素坐标系中注视点坐标. 将像素坐标转换为物理坐标,屏幕中心点A转换为(x′0,y′0),目标点B转换为(x′t,y′t),注视点Cj转换
为(x′s,y′s),坐标转换关系如式(1).
(1)
由图9可知眼睛与目标点及注视点之间关系,如式(2).
(2)
因此,注视准确度θ计算如式(3)
其中,j为每个目标点对应的注视点个数,m=15(每个目标点采集后3 s 15个注视点数据).i为目标点序列,n=25.
注视准确度θ的误差用均方根误差(RMSE)计算表示为σ,如式(4).
(4)
注视精密度以各目标点对应的各个注视点每相邻两个注视点之间角度偏差θj的均方根(RMS)表示为θiRMS,则每组实验的注视精密度为θRMS,计算如式(5). 如图10所示,d为眼屏垂直距离,A(x0,y0)
为像素坐标系中屏幕中心坐标,Cj(xj,yj)为像素坐标系中第j个注视点坐标,Cj+1(xj+1,yj+1)为像素坐标系中第j+1个注视点坐标. 将像素坐标转换为物理坐标,屏幕中心A转换为(x′0,y′0),注视点Cj转换为(x′j,y′j),注视点Cj+1转换为(x′j+1,y′j+1),坐标转换关系同注视准确度.
由图10可知眼睛与目标点之间关系,如式(5)
(5)
因此,注视精密度θRMS计算如式(6)
(6)
式中:j为每个目标点对应的注视点个数,m=15(每个目标点采集后3 s 15个注视点数据);i为目标点序列,n=25.
注视精密度θRMS误差用均方根误差(RMSE)计算表示为
(7)
图11为27组标定界面 25点测试的注视准确度及其误差,表3为27组标定界面25点测试得注视准确度误差σ. 图中准确度越小,注视点与目标点的偏差越小. 误差值越小,注视的准确度值波动越小. 其中,1号黑环中标定界面的注视准确度最好(0.69°±0.43°).
27组标定界面25点测试,不同颜色的标定界面注视准确度对比如图12所示,黑/白、白/黑、灰/黄3种标定界面颜色的注视准确度之间有明显地差异. 黑/白色标定界面的注视准确度整体比较好,并且其中一个界面的注视准确度是27组标定界面中最好的;白/黑色标定界面的注视准确整体变化幅度相对小;灰/黄色标定界面相对整体准确度值偏高,且变化幅度较大.
不同形状标定点注视准确度对比如图13所示,环状、条状、面状3种形状标定点的注视准确度之间有差异,但整体间的变化幅度不大. 其中条状标定点的一组标定界面的注视准确度为27组标定界面中的最大值,环状标定点的一组标定界面的注视准确度为27组标定界面的最小值.
不同大小标定点注视准确度对比如图14所示,中、小、大3种大小标定点的注视准确度之间有差异,但整体间的变化幅度不大. 其中大标定点的一组标定界面的注视准确度为27组标定界面中的最大值,中标定点的一组标定界面的注视准确度为27组标定界面中的最小值.
表3 27组标定界面25点测试得注视准确度误差σTab.3 27 groups of calibration interface 25 points test fixation accuracy error
以上对比表明,标定界面背景及标定点颜色、标定点形状、标定点大小对注视准确度有不同的影响. 黑色背景与白色标定点的搭配,使得被试者在实验中保持沉着冷静,能够集中注意力;环状中等大小的标定点,形状简单,标定范围突出明确,使得被试者的注视点更好地落于标定点处.
图15为27组标定界面 25点测试的注视精密度及其误差,表4为27组标定界面25点测试得注视精密度误差σ′. 图中精密度越小,注视点数据分布越集中. 误差值越小,精密度值波动越小. 其中,24号灰条大标定界面的注视精密度最好(0.27°±0.083°). 整体之间的注视精密度变化不大,每组实验中的注视精密度的分散程度差异也不大.
综上所述,人眼对不同标定界面的注视结果有不同的影响,背景及标定点颜色,标定点大小对注视结果也有不同的影响. 对比不同标定界面注视准确度和精密度结果,以注视准确度为主,兼顾精密度 1号标定界面为最佳标定界面.
表4 27组标定界面25点测试得注视精密度误差σ′Tab.4 27 groups of calibration interface 25 points test fixation precision error
本文设计了不同的标定界面,包括背景及标定点颜色、标定点形状、标定点大小;确定了实验的流程和数据处理方法;对标定后的不同界面进行5×5的25点注视测试. 实验结果表明,不同的标定界面对人眼的注视结果有影响,且标定界面中不同的特征对注视的结果也有不同的影响. 对比注视实验结果,以注视准确度为主,兼顾精密度,选取准确度最好的1号标定界面为最佳标定界面.
人眼注视效果是眼动跟踪技术中的一个关键问题. 未来将进一步研究标定界面中标定点的分布方式和呈现方式对注视结果的影响. 同时结合人眼的注视效果,选取有效的注视数据,使得最终输出的注视点数据最佳.