穆向昕
(原北京市广播技术研究所,北京 100034)
视觉是人体感觉器官中最重要的系统,人们靠眼睛获得外界87%的信息,并且75%~90%的人体正常活动是由视觉引起的。视频系统设计是在应用环境约束条件下,利用技术手段,解决受看个体或群体在符合人体工程学的基础上,多数受看者能够对视频信息看得清楚,或是具有看得舒服的主观感受。
视频系统服务对象是人类视觉系统(HVS,human vision system),所以有必要认识与之关的视觉感知系统。视觉是一个复杂的过程:物体图像以光的形式刺激人的视觉神经,通过生理器官——眼睛(瞳孔和晶状体、视网膜、视神经细胞)、大脑皮层枕叶传递光信号,视神经细胞在受到光刺激后,将光信号转变成生物电信号,物质的动与静是物体本身的信息,亮暗是光作用于物体的信息;到此视觉形成并未结束,因为最重要的人脑还要参与,需要靠其人脑内存的印象信息、知识以及周围的环境来诠释这个影像。整个过程形成视觉。经大脑处理生成结果,从而形成物体的形状、颜色等概念。视觉包含了物理学、心理学、生物物理学、生物化学、解剖学、神经学等专业。它的复杂程度远远大于听觉。人类视觉的小部分是属于物理层面,更多的则属于精神层面。主观感受是第一位的。这点很重要,是探讨视频系统设计目的的基础。它与经听神经传递冲动到大脑听觉中枢形成的听觉不同。声音纵波将外界空气分子的振动实实在在地传入耳器官,虽然有主观感受,但是客观物理层面可量化的东西真实存在。这使得在两者的研究、仿真、计量、评价上存在非常多的差异。
下面探讨视频设计相关的人类主要视觉特性要素。这些要素在前面视频定义中都有体现。暂时抛开视频环境及视频信息的内容,还是关注人类视觉评价看得清楚和看得舒服的问题。对于看得清楚,立刻会想到视力表。荷兰眼科医师弗朗索瓦·唐德斯 (Francisus Donders )在18世纪提出:“视力(visual acuity)”一词,并将其定义为视敏度(sharpness of vision),即受检者主观视力与标准视力的比值 。视力是指视网膜分辨影像的能力。视力的好坏由视网膜分辨影像能力的大小来判定,普通所谓视力是指中心视力而言(生理视觉标准还包含周围视力和立体视力),它反映的是视网膜最敏感的部位——黄斑区的功能。对视敏度测量办法有多种:最小可见度、两点分辨力、游标视力(vernier acuity)和对比敏感度(contrast sensitivity,简称CS)等。但是最常用的还是用视力表测定的视力表视力。视力表又有:标准对数视力表、5分弧度视标的斯内伦(Snellen)视力表(见图1)、每行5个不同字母的几何数的增率(Bailey-Lovie)视力表、兰氏环形(Landolt)视力表(见图2)等。国内流行的是中国眼科专家缪天荣先生发明的标准对数视力表,所用的增率为。
标准对数视力表GB11533—2011[3]中规定:一般视力测定,测出被检眼所能辨认的最小行视标(辨认正确的视标数应超过该行视标总数的一半),该行视标的视力记录值即为该眼的视力。表达视力水平的记录方式有对数、小数、分数等视力记录值。
视力表上的5分记录是一种对数记录,以5分减去视角的对数值表达视力。统计数学及科学经验认定:人眼的空间分辨能力为1′,灰度分辨能力大约64级。所以视力表视标字高为5′,字母的笔划为1′,如图3所示。正常为5.0 。
视力另一种定量的科学描述小数记录:眼睛能够分辨两物点间最小距离的能力,通常用视角的倒数来表达视力,V=1/α。能分辨的视角越小,视力越好;正常为1.0。
视力的生理学描述和计算:
视力表是检测人眼在模仿日间视觉条件下(环境照度应达200 lx~700 lx ;用灯箱,则视力表白底的亮度应达80 cd/m2~320 cd/m2),用静态黑白视标检验方法,去验证分辨两物点间最小距离的中心视力能力。在此限定条件下,分辨的视角合格的值为1′,记为5.0(1.0)。那么,动态、彩色、非条形光栅的两点、中文字标、双眼分辨率、辨认正确总数的一半的真实性等问题,都对人眼真实分辨率1′视角权威性产生质疑。21世纪初,现代科学家又论证双眼视力相对单眼视力有所提高(视角相对变窄)。同时,研究领域对人眼分辨视角标准从0.7′~ 1.7′的论证,始终都有探究。而对动态的、有彩色辨识的视觉实际应用都会采用6′ 以上。这些研究并不影响人们对视力的医学判定。笔者不去过多探讨科学研究领域的视觉因素,只去归纳影响这些因素的成因。
表1 人眼视觉特性
众所周知,人的视力分为两种能力:形觉和色觉,即对物体形状轮廓辨别和颜色辨别的功能。人眼的视觉特性见表1。人眼分辨力的影响因素:光的照度、相对对比度、物体运动速度、色彩。
探讨人类视觉特性要素和视觉环境要素的目的是为了获得观看显示的科学的视觉数据支持,反映到具体应用就是较佳观察距离(PVD,preferred viewing distance)。
上述规范和经验数据实际上是静态视敏角概念在不同环境下、不同视觉对象(静态、动态)人类视觉应用的经验总结,见表2,对视频系统设计有着指导性的意义。它展示了人类观察物体时的三种状态:远眺观看总览物体全貌,近看观察个别物体,细察是对物体的纹理、材质、肌理等;并进行仔细分析,对于群体视场应用以区域和最远视距为参考数据;而个体及少数人视场应用PVD数据更有积极意义。如图5所示,是在同样动态图像、不同分辨率质量要求的最佳推荐视距,其更侧重对像素质感的主观体验,将视角放在了次要位置。这也是基于ITU(国际电信联盟)关于高清影视显示图像追求实际现实图像感受的要求。
上述部分属于形觉范畴,也是人类最基本的视觉要素。在色觉应用上,英国医学家兼物理学家T.Young提出经典的三色理论。他认为,人的眼睛中有三类感光组织,分别对蓝光、红光、绿光灵敏。在白光照明下三类感光体都受到激励。亮度响应曲线表明人眼对波长为550 nm左右的黄绿色最为敏感,如图6所示。这种正态分布形曲线就是人眼视觉系统的相对视敏函数(Relative Luminous Efficiency Function of the Vision System)。
表2 视觉系统设计中常见的视角与视距
人类眼睛对蓝光的灵敏度远远低于对红光和绿光的灵敏度。所以不同图像颜色亮度感受是不同的。换句话说,同样显示设备,有的彩色图像感觉很亮,有的彩色图像就会感觉不亮,这是很正常的事情。
色彩数字化标准的建立,确定了人们在生活中对色彩应用规定格式(体系)间互通,舞美、灯光、照片、摄像、打印等都有了统一的色彩概念。但是,由于用于显示应用RGB色域和应用于印刷CMYK(Cyan青、Mageata品红、Yellow黄、Black黑)色域及其他应用色域的不同,就会出现色域的转换(数字变换);再者,设备时效的变化,光源的衰耗、显示设备因输入的电压信号与亮度不成正比,所产生失真的伽玛值(Gamma)的校正等因素,会造成类似计算机模拟效果显示与舞美效果图以及印刷海报色彩有着明显差异的问题。为此,由行业主流企业牵头的ICC(International Color Consortium,国际色彩联盟),推出了建立描述设备颜色的特征文件(Profile)标准,以反映设备表现色彩的范围和特征,用色彩管理减少相同数值下在不同设备上产生不同颜色的互通间的色差问题。由于色彩涉及不同人种、民族的心理感受,是物理量和心理感量的综合,因此至今还没有绝对统一的国际色彩实用标准。国内制定了中国颜色体系 GB/T 15608—2006标准。
实际颜色由三个可以感知和度量的参数决定:色调、饱和度和亮度。其作用见表3。
色彩中,通常由配色方程配出的彩色光F的亮度用光通量表示:
Y(白光亮度)=0.30R(红)+0.59G(绿)+0.11B(蓝)
这也验证了格拉斯曼定律(H. Grassman)——复合光的亮度等于各光分量的亮度之和的定律。虽然公式给出了度量的精确计算,但是人类感知与度量值不是简单的线性关系,而是近似于对数关系。这就是著名的韦伯-费赫涅尔定律(Weber-Fechner)——亮度感觉与亮度的对数成线性关系。同样,人耳听力感知的声压级也是成对数关系。由此,科学家韦伯和费赫涅尔师徒两人于1860年提出著名心理物理学定律:人的一切感觉,包括视觉、听觉、肤觉(含痛、痒、触、温度)、味觉、嗅觉、电击觉等等,都遵从“感觉不与对应物理量的强度成正比,而是与对应物理量的强度的常用对数成正比”的法则。虽然后人又有很多修正,但是宗旨未发生撼动。法则是一个经验定律,和所有的定律一样都有其适用的范围。
在常用的背景亮度变化范围内,人眼的对比灵敏度因素变化很小,平均亮度不等于周围的环境亮度时,对比灵敏度不仅与背景亮度有关,而且与环境亮度有关。电影院银幕中心设计亮度约为60 nit(cd/m2)。而通常会议室投影显示屏中心设计亮度约为240 nit(cd/m2)。由于会议室显示屏周围亮度环境不同,所计算的显示屏亮度也会有变化。这些用韦伯-费赫涅尔定律就很容易解释。
表3 颜色感知维度
在初步了解人类视觉感知基础后,如何建立适合于人类视觉的标准呢?和听觉系统相同,图像质量评价从方法上可分为主观评价方法和客观评价方法。目前世界上并没有科学权威的统一标准。目前主观评估方法缺乏稳定性,实现起来步骤复杂,代价昂贵,实时性不好,不利于实时视频通信中的视频质量评估。中国对于对象质量的主观感知评价,实验人员是参照ITU-BT-510进行的。
客观质量评估法又可以分为三种类型:全参考(Full.Reference,FR),部分参考(Reduced.Reference,RR)和无参考(No.Reference,NR)。对于一个视频客观质量评估方法来说,关键的是找出一个或几个最合适的视频质量度量(Video Quality Metric,VQM)来衡量视频质量的好坏。ITU规定了视频质量度量的精确度和交叉校验的方法(ITU-T J.149—2004)。中国也在探索电视视频质量的评价标准。
视觉设计中,演出的人或物比较具象,而视觉图像信号的应用会带来更多的思考。视觉设计中视觉图像信号主要为视频信号和计算机图像信号。表4中分辨率是数字成像技术和计算机技术融合的表述方式,是将显示器固有物理格式及图像内容格式有机结合特征符号。在实际视频显示应用中,会遇到图像内容分辨率(见图7)与显示器固有物理分辨率不同的问题,即图像格式不同的应用,技术上解决办法是格式变换,见表5。此时显示图像的同心度、重显率、过扫描和欠扫描对图像是否完整、显示屏利用是否充分即图像重显率等因素影响着实际分辨率质量。当显示器件固有分辨率像素数低于图像内容格式下变换显时,水平和垂直清晰度会出现伪像。显示器件固有分辨率像素数高于图像内容格式上变换显示状态也会出现疏密不同干扰花纹状伪像。为了追求原像素真实表现,系统工作于最佳分辨率状态的固有分辨率显示系统,在此状态清晰度值是最佳的。同时要考虑像素逐点对应与像素排列的关系,如图8所示。
表4 常用信号格式的垂直分辨率(标准名称)
表5 常用显示分辨率及其应用、接口、支持的最大分辨率
视频系统设计基于人类主要视觉特性要素,根据视觉图像信号元素内容,确定在具体的视觉环境因素条件下;并通过对视点、视觉最佳视距PVD、人类经验总结的标准,进行视觉分析,从而选取适当的技术手段,以实现具有科学性的应用。
[1]杨公侠. 视觉与视觉环境[M]. 上海:同济大学出版社,2002.
[2]The Free Encyclopedia//Display resolution [ DB/OL]. http://www.wikipedia.org/, 2014-01/2014-07.
[3]GB11533—2011, 标准对数视力表[S].北京:中国标准出版社,2011.
[4]蒋刚毅,黄大江,王 旭,郁 梅. 图像质量评价方法研究进展[J]. 电子与信息学报,2010,32(1): 219-226.
[5]International Telecommunication Union. RECOMMENDATION ITU-R BT.500-11. HTTP://WWW.ITU.INT[S/OL],2011/2014-07.
[6]沈模为,朱祖祥. VDT字符点阵尺寸对汉字显示清晰度的影响[J]. 应用心理学,1989(3):21-26.
[7]The International Commission on Illumination. CIE DS 017.2/E:2009 ILV:International Lighting Vocabulary [S/OL].HTTP://WWW.CIE.CO.AT, 2009/2014.
[8]The Limits of Human Vision[P]. Michael F.Deering. Sun Microsystems.