管彩霞,胡 杨,钱宜刚,沈海平
(复旦大学工程与应用技术研究院超越照明研究所,上海 200438)
在照明领域,国际照明委员会(CIE)于20世纪20年代基于对多名观察者心理物理学实验结果所建立起来的光度学体系一直沿用至今,心理物理学实验也是至今照明研究最常用的方法。但是,经常出现的一个问题是,其研究结果往往只适用于其开展实验的特定照明应用场景,通用性不强,比如室内眩光模型UGR不适用于户外眩光评价,阈值增量TI也不合适对室内眩光进行评估。
生理学和神经科学的发展使得人类对自身的认识越来越深入,随着人眼视觉神经通路及视觉形成机制的深入研究,视觉计算模型逐渐成为研究热点,并在图像处理、机器视觉等领域得到应用。视网膜层是人类视觉信息获取和处理的第一步也是最重要的一步,视觉系统的许多功能都在视网膜层上实现,例如视锥细胞和视杆细胞对亮度的适应[1-3],降噪、颜色识别[4, 5]、视觉信息压缩[6]和对比度增强等,因此视觉计算模型研究一般多集中在视网膜层面,本文研究也是针对视网膜视觉功能形成机制的建模。
视网膜模型可以很好地描述人眼的整个视觉感知过程,不仅有助于人们从机理层认识和理解人眼视觉的形成机制,而且对各种光环境都适用,因此对照明研究提供了一种全新的研究方法和思路,具有极高的研究价值。已经有部分科学家开始采用视网膜模型来进行光度学研究[7, 8],但其模型仍存在与心理物理学实验结果偏差较大的问题。
本文拟建立一套更高精度的用于光度学计算的视网膜模型,可对视网膜上的视觉形成过程进行理论模拟。该过程涉及视锥细胞和视杆细胞响应的自适应、时空处理、双极细胞的增益控制等。即使在具有不同特点的照明应用场景,模型也能很好地描述人眼的视觉感知反应。对该模型的研究不仅有利于更好地了解人类视觉感知的形成机理,填补照明应用研究中的理论空白,而且对今后的照明应用和测试研究同样具有重要价值。
在对视网膜进行建模之前我们必须首先了解视网膜的细胞结构,尤其是视觉信号的传输通路,如图1所示。视网膜是一种分层的神经结构[9],它将光线输入首先转换成电信号,然后将电信号逐层进行处理并最终通过神经传送到大脑皮层。
图1 视网膜的层状结构Fig.1 Bedded structure of the retina
实现光电转换的细胞是视锥细胞和视杆细胞。视锥细胞分为三种类型:L锥对可见光谱的红色部分敏感(长波长),M锥对绿色部分敏感(中等波长),S锥对蓝色部分敏感(短波长)。视杆细胞只有一种类型。视杆细胞的信号可以通过神经突触耦合入视锥细胞的信号通路。视杆细胞和视锥细胞在视野中的位置也不同。在中央凹,只有L和M锥体存在。它们的密度很高,并且随着偏心量的增加而迅速减小。S锥细胞的数量要少得多,它们的密度在整个视网膜上几乎是恒定的。中央凹没有视杆细胞。它们的密度在距视觉中心约20°左右达到最大值。眼睛的光谱灵敏度不仅取决于光的强度(明视觉、暗视觉、中间视觉),还取决于观察点在视场上的位置,即对应像点在视网膜上的位置。
水平细胞通过树突或轴突与视杆细胞与视锥细胞相连,使光感细胞间形成横向联系,可以对光感细胞输出的视觉信号进行亮度调节,实现视觉的亮度适应。
双极细胞和神经节细胞构成了后续视觉信号的直接通路,各自分为两类:小型双极细胞和弥散型双极细胞,小型(P型)神经节细胞和弥散型(M型)神经节细胞。小型双极细胞主要和P型神经节细胞相连,形成小细胞通路(PC通路)。弥散型双极细胞主要和M型神经节细胞相连,形成大细胞通路(MC通路)。
基于前人在视神经模型方面的研究成果,我们建立了如图2所示的视网膜模型,来模拟不同光环境条件下PC和MC通路中视锥和视杆细胞信号的处理。
模型的第一阶段是在外丛状层(OPL)进行的信号处理。从生理上讲,OPL是视网膜中突触的第一层。它是光感细胞、水平细胞和视网膜与突触相互作用的地方。该阶段被建模为一个简单的时空线性滤波器。我们使用一个简单的线性滤波器对OPL中的处理过程进行建模,将在第2.1节详细介绍此部分。这种滤波器产生众所周知的视网膜处理的中心环绕结构。此外,我们的模型在OPL水平上引入了另一种视网膜功能:亮度适应,包括细胞对持续刺激的缓慢化学适应和快速神经适应模型,将在第2.2节详细介绍。
图2 视网膜模型示意图Fig.2 Schematic diagram of the retinal model
模型的第二阶段将模拟内网状层(IPL)的突触相互作用,它主要涉及小型双极细胞和弥漫型双极细胞的处理。从水平细胞传输到双极细胞的信号是中心-环绕结构,第一阶段视锥细胞的权重耦合信号作为中心信号,水平细胞信号经过时空滤波器处理作为环绕信号,然后传输到双极细胞进行增益控制等进一步的信号处理。
视网膜的层次结构意味着它是一个连续的时空模型,它将光输入转换成电信号,并在将它们发送到大脑之前进行处理。我们将视网膜上的入射光描述为亮度时空分布图L(x,y,t)的形式。类似的,细胞的每一层或细胞之间的突触相互作用被认为是由特定微分方程驱动的时空连续体。
当视网膜细胞整合来自突触前层细胞的信号时,它将在时间和空间上对其突触前的输入信号作平均运算。就时间而言,平均是由于突触延迟造成的,每个神经节细胞起着低通电容的作用。在空间上,平均发生的第一个原因是细胞可能经历树突扩散,这意味着每个细胞都整合了来自其周围突触前细胞的信号传导。第二个原因是,每个细胞通过神经缝隙与同一层中的相邻细胞相耦合,导致相邻细胞电位的局部均匀化。
低通信号每次传输到新的细胞层在视网膜的功能中起着非常重要的作用,在OPL中,它形成了视网膜的中心-环绕结构。我们使用如下时空滤波器来描述信号的低通过滤:
Kσ,τ(x,y,t)=Gσ(x,y)exp(-t/τ)/τ
(1)
其中τ是时间常数。Kσ,τ(x,y,t)是一个在时间和空间上可分离的低通滤波器,其中空间滤波器Gσ(x,y)是标准差为σ的二维归一化高斯分布函数,如图3所示。
图3 视网膜模型中的空间过滤器Fig.3 Spatial filters in the retina model
人眼具有很高的光环境亮度调适动态范围,从很弱的星光到很强的太阳光它都能适应,适应状态受瞳孔大小、视网膜色素漂白和再生、神经适应的控制。模型第一个阶段还要同时模拟这一视觉适应机制。前人研究中已经有较多关于视网膜适应模型的成果,这些成果主要都是来源于对视网膜的神经学和心理物理学的测量[10, 11],其中Pattanaik[12]的模型同时考虑了神经适应和化学适应(色素漂白)。
人在观看自然场景时,视觉系统不断适应不同的亮度级别。视觉适应状态是许多视网膜模型的关键参数。瞳孔大小可以忽略不计,因为它的影响很小。每种机制都有其时间行为。光感色素漂白(化学适应)机制较慢,神经适应较快。无论哪种机制,视杆细胞的速度都比视锥细胞的速度慢,这也是为什么人从亮环境换到暗环境中的适应时间要比反过来的慢的原因。
我们将σb定义为色素漂白引起的化学适应,σc定义为慢速神经适应,σn定义为快速神经适应。那么视网膜模型的适应值σ的由下式给出:
σ=σb*σc*σn
(2)
化学适应和神经适应的时间变化曲线如图4所示。人眼在亮度从L0变为La后,化学适应即色素的漂白和再生的过程遵循以下规律:
(3)
p(L)=I0/(L+I0)
(4)
I0=104cd/m2
(5)
σb=1/p(L)
(6)
图4 神经适应(红线)和化学适应(蓝线)Fig.4 Neural adaptation (red line) and chemical adaptation (blue line)
在黑暗中p(La)=1,在明亮的环境中p(La)<1,色素漂白比色素再生发生得更快。p(La)是完全适应La的未漂白色素的分数。时间常数t0对于视锥细胞一般设110 s,对于视杆细胞是400 s。在稳态时,p(L)的值遵循方程。
对于神经适应,我们使用指数衰减函数来描述其时间演化过程:
(7)
与化学适应不同,神经适应是对称的。我们将视锥细胞的神经适应时间常数t0设为0.08 s,将视杆细胞时间设为0.15 s。至此,对于视锥细胞,其神经适应值σn和σc分别为:
(8)
(9)
对于视杆细胞,其神经适应值σn和σc分别为:
(10)
(11)
在给定的适应值水平下,光感细胞对亮度的响应遵循S型曲线,可以用Naka-Rushton方程来描述[13]。细胞的响应信号可以表示为:
(12)
其中I是亮度刺激,对于视锥细胞使用V(λ)计算,对于视杆细胞使用V′(λ)计算,B是光漂白曲线的幅度,σ即视网膜模型的适应值,它定义了曲线的水平位置,n是灵敏度控制。视锥和视杆细胞的亮度响应图分别如图5和图6所示。
图5 亮度刺激变化时的视锥细胞响应图Fig.5 Cone cell response vs luminance stimulus change
图6 亮度刺激变化时的视杆细胞响应图Fig.6 Rod cell response vs luminance stimulus change
我们将视杆细胞的最大响应设置为0.8,将视锥细胞的最大响应设置为1。对于在中间视觉条件下开始饱和而在明视觉条件下完全饱和的杆细胞,响应范围的减小尤为明显。这种由B因子表示的压缩也适用于视锥模型,但只在高亮度环境下才有影响。
视杆细胞的信号通过神经缝隙与视锥细胞信号耦合,连接到视锥细胞的视杆细胞数取决于其在视网膜上的密度,而密度与其偏心角即光感细胞离中央凹中心的角距离有关。图7显示了视锥细胞的密度分布图。在中央凹中心这块极小的区域,视锥细胞密度很高,平均值达到了19.9万个/mm2。离开中央凹后,在偏心角3.33°的位置视锥细胞密度急剧下降,这种密度降低的现象随着偏心角的变大而减缓。图8是视杆细胞的密度分布图,中央凹内有一块很小的椭圆形的无视杆细胞区,离中央凹中心100~200 μm处才开始出现视杆细胞,此后视杆细胞密度向周边急剧增加,在偏心角约27°左右的环区达到最大。
图7 视锥细胞密度分布图Fig.7 Cone cell density distribution
图8 视杆细胞密度分布图Fig.8 Rod cell density distribution
我们将式(12)得到的视锥细胞和视杆细胞的响应值R分别与其所对应的归一化密度值进行加权求和,然后发送至水平细胞和双极细胞进行第二阶段处理。
双极细胞的感受野是中心-环绕结构,中心输入由视锥细胞提供,周围拮抗由水平细胞提供。我们参考了Fleet和Richter提出的时空中心环绕算子(CS)来对该结构的信号处理过程进行建模。CS算子本质上是一种时空高斯差分算子,它描述了神经节细胞的一些感受野特征,但忽略了视网膜处理早期的非线性传导和适应。CS运算核K(x,y,t)表达如下,包括高斯运算符G(x,y,σ)和指数时间低通滤波器E(t,τ):
(13)
(14)
K(x,y,t)=αc·G[(x,y,σc(x,y)]·E[t,τc]-
αs·G[(x,y,σs(x,y)]·E[t,τs]
(15)
其中σc和σs分别表示感受野中心和周围的高斯宽度,τc和τs分别表示中心和周围的时间常数,用αc和αs分别表示中心和周围的相对权重。
MC通路的特点是细胞对视觉信号中的瞬时信号有强烈的反应,而PC通路对高的空间频率信号更敏感,但对于高的时间频率不敏感。为简化起见,我们在模型中假设水平细胞信号延迟仅在弥散型双极细胞中显著,而在小型双极细胞中为零。
双极细胞层还有一套增益控制和饱和非线性处理机制,我们用arctangent函数来对此进行建模,其中小型双极细胞的输出信号如下:
BPmidget[r,t]=BPsat(cone[r,t]-
horz[r,t])K(t;τmidget)
(16)
(17)
其中K(t;τmidget)代表与式(14)相同的时间低通滤波器,cone[r,t]和horz[r,t]是视锥细胞和水平细胞的信号,BPsat(x)为饱和运算子,kBPmidget为增益放大系数,在我们的模型中kBPmidget取值为0.027。
对于弥散型双极细胞,输出信号如下:
BPdiffuse[r,t]=BPsat(center[r,t]-
surround[r,t])K(t;τdiffuse)
(18)
(19)
τdelay]*G(r;3σhorz[r,t])
(20)
与小型双极细胞不同的是,弥散型双极细胞的饱和运算子中的输入是center[r,t] 和surround[r,t] 之差,其中center[r,t] 是由9个临近视锥细胞输出的平均值,surround[r,t] 是延迟的水平细胞信号,延迟时间τdelay设置为3 ms,σhorz[r,t]是水平细胞的控制大小,增益放大系数kBPdiffuse取值0.015,τdiffuse设置为5 ms。
图9给出了模型计算结果的一个示例,我们用一张简单的方形高动态灰阶图像作为输入,分别计算了锥状细胞(权重耦合)、水平细胞、小型双极细胞和弥散型双极细胞随时间变化的输出信号。图像中所设参数为:视场角度为2°,刺激亮度为1 cd/m2,背景亮度为0.01 cd/m2,两者都是中间视觉亮度级别。当t<0 s时,视网膜模型适应背景亮度,当t>0 s时,模型开始显示图像。
图9 简单图像的计算结果Fig.9 Calculation results of a simplified image
从图9可以看到,水平细胞的输出比视锥细胞的输出更模糊,这主要是水平细胞层中的高斯扩散产生的。同时PC通路只接受中央凹内一个视锥的输入,小型双极细胞的输出主要由视锥细胞与水平细胞的输出之间的差值决定。MC通路接收来自几个锥体的输入,因此从视觉上看,弥散型双极细胞的输出更加模糊,空间分辨率较小型双极细胞的低。
本文基于前人在视觉神经模型领域的研究成果,建立了一套视网膜计算理论模型。该模型以高动态图像为输入,仿真模拟了视觉信号从视锥视杆细胞到水平细胞、双极细胞和神经节细胞这个传递和转化的过程,初步展现了视网膜对简单场景的时空响应。有了这个视网膜模型,我们便可对各种实际的复杂场景进行光度计算,从响应图中获得比现场测试丰富得多也更精确的信息,从而为进一步深入的视觉分析研究工作奠定基础。
本文所搭建的模型尚比较初步,一些过程作了简化处理,大部分参数都是从参考文献中获得,模型的精确度即其计算结果与人眼真实感受的匹配度还有待验证。在下一步的研究工作中,我们将以中间视觉模型为对象,将标准心理物理学模型与本文模型进行比对,以此检验本文模型的精确度。