光学成像通信研究现状与展望

2020-07-27 08:33韩思齐侯春宁贾俊连
照明工程学报 2020年3期
关键词:接收端解码像素

韩思齐,侯春宁,贾俊连,迟 楠

(1.复旦大学通信科学与工程系,电磁波信息科学教育部重点实验室,上海 200433;2.上海精密计量测试研究所,上海 201100)

引言

VLC使用发光二极管(LED)作为光源。LED 光源具有使用寿命长、节能和安全可靠等优势。特别是白光 LED,具有更高的调制带宽,现在已经被大量应用于信号发射、照明、显示等领域。VLC 是将 LED 照明和无线通信技术结合起来的通信方式,可以作为现有的无线通信的有效补充,应用于射频敏感、智能家居、智能交通以及水下通信等领域[1-4]。迟楠等[5]提出的一些技术可以支持 VLC 在自由空间中实现超过 10Gbit/s 的传输。文献[6]中提出了基于单封装 RGBYC LED、采用硬件预均衡的10.72 Gbit/s VLC 系统。然而,随着智能手机和数码相机的发展,图像传感器的应用越来越普及,相比较传统的 VLC,直接用相机作为接收端更加简单,系统的灵活性也得到提高,这一通信方式被称为光学成像通信(OCC)。OCC 是一种与射频技术等其他技术不同的新型廉价技术,它可以利用光学域中位于微波和 X 射线波长之间高达10 000 nm 的光谱资源。OCC 技术通过使用图像传感器作为接收器,继承使用 VLC 的相关技术,可以在不修改硬件的前提下实现 OWC。互补金属氧化物半导体(CMOS)技术的发展使得相机的像素分辨率和快门速度逐年显著提高,这为OCC 的发展创造了重要机遇。

1 OCC概述

OCC系统和VLC类似,包括独立的发射器模块和接收器模块。OCC 是使用特殊接收器的VLC,也是VLC更加实用的版本。与基于光电二极管的VLC系统不同,OCC系统使用镜头组和彩色图像传感器阵列来捕获一系列图像帧中的入射光信号。同时,它需要更多的定向传输,这可以使用智能设备相机来实现[7]。由于具有这些独特的特性,OCC能够通过波长分离和空间投影等方法将多路并行的光信号分开,各种功能都可以轻松地在智能设备中实现。

OCC和VLC的发射端基本相同,都是对二进制数据进行编码调制后通过 LED 发送,经过自由空间中的光信道传输后到达接收端。但与VLC不同的是,OCC的接收端用相机作为接收器,相机中的图像传感器接收像素点后, 然后经过像素扫模数转换器(ADC)和像素解复用后再解调解码得到最终的数据。如表1所示,在干扰、频带宽度和数据速率等方面对 OCC 和 VLC 两种通信方式进行了对比。

表1 VLC和OCC的优缺点对比

OCC系统的具体设计中也涉及到一些与VLC系统不同的地方,包括接收端图像传感器的选择,调制、解调方式选择以及同步技术等的选择。由于采样的随机性,在信号发送的任何符号期间摄像机都有可能进行采样,任何时候都有可能丢失符号。此外,帧采样的间隔是变化的,它取决于图像传感器和光学通道的性能。因此,在OCC中, 发射端和接受端的同步是一项具有挑战性的工作。由于OCC使用相机作为接收器,因此图像传感器的特性会影响通信过程的好坏。在像素曝光的基础上,相机可以分为两类,即全局快门类和滚动快门类。全局快门类通常采用电荷耦合器件(CCD)图像传感器,滚动快门类的照相机通常采用互补金属氧化物半导体(CMOS)图像传感器。图2分别画出了 OCC 通信过程接收端全局快门模式相机和滚动快门模式相机下图像传感器的工作过程。

图2 全局快门(a)和滚动快门(b)模式下图像传感器的工作过程Fig.2 The working process of global shutter(a) and rolling shutter(b)

在全局快门模式下,光电二极管同时收集所有的光,传感器阵列中所有的像素同时开始和结束曝光。因此,图像的所有像素同时从传感器获得信息,并且具有相同的持续时间。这种模式在移动物体捕获的曝光和获得高质量的多媒体文件方面具有优势,但在 OCC 系统中,从全局快门图像传感器的每次曝光中仅能捕获一个光源状态,也就意味着通信过程仅编码一个信息比特,这限制了全局快门模式的数据传输速率。

在滚动快门(又叫卷帘快门)模式下,光电二极管不同时收集所有的光,而是由 CMOS 图像传感器顺序扫描像素,通过逐行或逐列扫描以及一次曝光一行或一列像素来生成图像,传感器阵列中每一行或每一列像素开始和结束曝光的时间都不同。在该模式下,从卷帘快门图像传感器中获得的不同的像素线具有不同的光信号强度,也就意味着有多个比特的信息。虽然在目标足够大且光源变化的足够快的情况下,会使捕获的图像中发生运动模糊,但曝光时间的延迟使得我们可以根据时间来记录目标的相对结构,这样在光学成像通信中,就可以将光源的多个切换状态捕获在图像中,从而编码多个信息比特。因此,相比较全局快门模式,卷帘快门具有较高的数据传输速率。

但是在多输入多输出(MIMO)的拓扑结构中,全局快门模式的相机在实现和部署方面具有一定的优势。在捕获的一张图像中,可以包含多个独立的源,我们可以对从这些独立的源中分离的数据分别进行调制。此外,全局快门中 CCD 传感器在信号还是电子时就进行累加,这种累加是不会引入噪声的,而卷帘快门中的 CMOS 传感器是在像素变成电压信号后累加,会引入热噪声,因此 CCD 的噪声性能要优于 CMOS。在使用中,可以根据具体需求来选择适合的图像传感器。

2 OCC 调制方式

与传统的基于光电二极管(PD)的 VLC 系统相比,在 OCC 中采用相机作为接收器。相机中的图像传感器是采用的是光电二极管阵列,它收集光的形式与光电二极管类似,因此,VLC 的一些调制技术也适用于 OCC。但相机以图片或者视频帧的形式捕获光信号,因此在传统的调制方案上我们需要做一些调整会更加适合 OCC 系统。常见的调制方式有通断键控调制(OOK)、频移 OOK 调制和离散多音频调制(DMT)等,在此基础上,有闪烁可变脉冲位置调制(VPPM)、空间 2 相移键控(S2-PSK)和脉冲宽度调制(PWM)等先进的调制方式被提出。以下分析了 OCC 中使用的一些调制方式,并将其分为键控调制和颜色调制来讨论。

1995 年开始,全国交通行业开始注重服务品质。已经到南航湖南分公司的程凤萍告诉记者,当时湖南分公司打造的芙蓉乘务示范组被评为“全国青年文明号”。

2.1 键控调制

数字调制中,主要有三种方式:相移键控调制(PSK)、幅移键控调制(ASK)和频移键控调制(FSK),在本文中我们将其统称为键控调制。以下将主要讨论OOK调制[8-14]、频移 OOK 调制,欠采样频移 OOK 调制(UFSOOK) 和欠采样相移 OOK 调制(UPSOOK)。

1)OOK 调制。通断键控调制(OOK)是最基础的调制方式,也是一种特殊的幅度键控调制,它通过单极性不归零码序列来将一个幅度取为 0,另一个幅度取为非 0 来控制正弦波的启闭。为了保证人眼察觉不到数据传输过程,LED 打开和关闭的速率应当大于人眼闪烁的最大频率,通常为100 Hz[7]。因此,在基于 OOK 调制的 OCC 系统中,基带信号的频率通常应当高于 100 Hz,同时,为了满足奈奎斯特采样定理,不管是在全局快门模式下还是在卷帘快门模式下,相机帧采样速率都应当高于200帧/s。

如图3所示,为基于 OOK 调制的 OCC 系统框图,也是 OCC 系统常见的框图。在发射端,与 VLC 类似,原始的二进制比特流经过编码和调制后,驱动 LED,对 LED 进行强度调制,将电信号转化为光信号。而在接收端, OCC 系统使用图像传感器或者相机作为接收器,相机由成像镜头,图像传感器和读出电路组成。成像镜头将光信号投射到包含多个光电探测器(PD)的图像传感器上,来检测和处理入射光子。通过该处理的信号可以被视为图像传感器上的单个像素,每个激活的像素产生与撞击在其上的光子数量成比例的电压[8]。同时,每个像素连接到外部电路。最后,外部电路将像素电压转换为二进制数据,完成一次光学成像通信过程。

图3 基于 OOK 调制的 OCC 系统框图Fig.3 The OCC system based on OOK modulation

2)频移 OOK 调制、UFSOOK 调制和 UPSOOK 调制。在 OOK 的基础上,频移 OOK 调制的概念被提出[15],我们用“0”位和“1”位分别来表示频率f1和频率f2, 如图4(a)所示。然而,OOK 调制和频移 OOK 调制的缺点之一是闪烁问题。在 OOK 调制中,相机帧采样速率应当大于 200 帧/s,但对于大多数相机来说,帧速率只有 30 帧/s,这就要求在 OOK 调制的 OCC 系统中,基带信号的速率必须低于 15 bits/s,这是低于人眼闪烁速率的,也就意味着可以被人眼察觉到。为了避免闪烁,在相机帧速率较低的情况下,应当将基带信号调制到较高的频率,图4(b)和(c)所示为在 OOK 基础上两种改进的方案。

图4 (a)频移 OOK 调制;(b)UFSOOK 调制;(c)UPSOOK 调制Fig.4 (a) Frequency shift OOK modulation;(b) UFSOOK modulation;(c) UPSOOK modulation

在文献[16]中提出了欠采样频移 OOK 调制(UFSOOK),图4(b)所示是由帧头(FH)、9 个周期的比特 1 和 8 个周期的比特 0 组成的 UFSOOK 调制的示例。其中,FH 为了支持异步通信所设计的独特的帧结构[16]。在接收端,相机对可见光信号进行采样,灯可能处于稳定状态也就是“开”或“关”,也可能处在“开—关”或“关—开”的闪烁状态。为了避免闪烁,空间(逻辑 1)和标记(逻辑 0)的频率均需高于 100 Hz,这里取相机帧速率为 30 帧/s, 空间频率为 105 Hz,标记频率为 120 Hz。相机在采样的位置捕获连续帧,每个 UFSOOK 符号以 30 Hz 的频率采样两次。如图4(b)所示,对于逻辑 1,两次采样值是不同的,对于逻辑 0,两次采样值是相同的。但在 UFSOOK 调制中, 需要通过比较两个连续的视频帧是否相同来确定一个比特,并不能有效地利用采样值。为了提高帧采样的速率,文献[18]中给出了一种基于欠采样键控技术的欠采样相移开关键控(UPSOOK)的调制方案,如图4(c)所示, 一个视频帧样本代表一个比特,逻辑 1 和逻辑 0 信号以相同的频率和幅度传输,但具有相反的相位载波。当捕获到灯处于“开”、“关”或者“帧头”的状态时,视频帧中的指示灯分别对应“完全点亮”、“完全熄灭”和“部分点亮”的状态。然而由于相机采样的随机性,发射端和接收端可能会出现相位误差,如图4(c)中的两幅图所示,同一个接收信号会有两个不同的采样值,不确定接收到的“开”或“关”是代表“1”还是“0”。为了预防这种不确定性,文献[18]中给出了一种对帧的处理方法,将每个帧设计成由一个起始定界符和由q个 UPSOOK 符号组成的有效载荷构成,这里不赘述。

3)S2-PSK 调制。另一种常见的用于 OCC 的键控调制技术是欠采样和无闪烁空间二进制相移键控(S2-PSK)[22],由于从屏幕发出的光不会像单个 LED 灯那样影响人眼,因此光学时钟的速率可以低于相机速率(通常为 30 帧/s),此外,空间欠采样还可以解决时间欠采样中广泛存在的噪声偏差问题。图5(a)所示为基于 S2-PSK 调制的 OCC 系统框图,在发射端二进制信号经过游程长度压缩限制编码(RLL)后,进行信道编码,再通过 S2-PSK 调制后驱动两个 LED 光源, 经过可见光传输后,接收端的相机接收发射端传来的光信号,然后对可见光信号进行 S2-PSK 解调,信道解码和 RLL 解码后得到最终的数据。图4(b)所示为两个 LED 的波形图,比特为“0”时两个波形相位相同,为“1”时两个波形相位相反。对应地,接收端对接收图像序列中的 LED 进行检测,如图4(c)所示,如果两个 LED 相位相同,则解码输出“0”,反之则输出“1”。

图5 (a)基于 S2-PSK 调制的 OCC 系统框图;(b)LED1 和 LED2 波形;(c)接收端检测解调过程Fig.5 (a) The OCC system based on S2-PSK modulation;(b) waveform of LED1 and LED2;(c) the detection and demodulation at the receiving end

S2-PSK 解调过程如图6所示,相机采样过程中,如果两个 LED 的状态相同(都处于“开”或“关”),解调为“0”,状态相反则解调为“1”,输出的比特值由异或运算得到。可以看到,输出不受采样时间随机性和单一 LED 状态的影响,这种解调方法很好地解决了发射端和接收端之间帧速率不匹配的问题。

由于相机之间是相互分离的,S2-PSK可以完全解调出随机采样的图像,从而可以应用在可变帧率相机上。同时,在车载 OCC中,可以用无闪烁的2-PSK调制技术,能够有效提升系统的传输速率[12]。

2.2 颜色调制

因为摄像机的最终输出是图像而不是电压,所以OCC 在调制方式上需要进行一些调整。一些最近开发的图像传感器[20]能够像光电二极管一样解码数据位,但是在大多数情况下,需要图像处理技术,其中数据位通过像素亮度或色相值进行解码,这就用到了与颜色有关的调制方法,本文中称其为颜色调制。以下主要对颜色调制中常用的颜色强度调制(CIM)[23-26]和色移键控调制(CSK)[27,28]两种方法进行分析。

1)CIM-MIMO 调制。白光LED大多由红光、绿光和蓝光(RGB)LED组成,同时智能设备内置相机的图像传感器上也都具有 RGB 颜色滤波器阵列。因此,在 OCC 系统中使用 RGB LED 阵列和彩色相机提高系统的传输速率。此外,相机中的像素本质上可以看作是高度定向的接收元素阵列,因此可以采用更多的 LED 来最大程度地利用相机的像素阵列,从而可以利用MIMO复用技术在成像时实现更高的吞吐量,继而提高长距离传输空间利用效率。结合以上两种技术,在 OCC 中提出了 CIM-MIMO 调制方法[23]。图7(a)所示为基于 CIM-MIMO 调制的 OCC 系统框图,数据经过串并转换后分别插入同步序列和训练序列,然后将这两种序列通过 CIM 调制到 LED 阵列上,被分集的 LED 阵列复用后传到接收端,内置相机采用现场可编程门阵列(FPGA)来控制图像传感器以连续方式捕获图像,像素映射后进行串并转换和帧同步,最后再经过 CIM 解调出传递的数据。

图7 (a)基于 CIM-MIMO 调制的 OCC 系统框图;(b)拜耳滤波器原理图;(c)单色调制和彩色调制对比Fig.7 (a) The OCC system based on CIM-MIMO modulation; (b) the schematic diagram of Bayer filter; (c) comparison of mono-color modulation and color modulation

彩色相机的图像传感器中带有颜色滤波器阵列,最常见的滤波器阵列为拜耳滤波器[29],如图7(b)所示,分别有 25%的红色区域、50%的绿色区域和 25%的蓝色区域,分别允许红色、绿色和蓝色的光通过。其中绿色区域是红色或蓝色区域的两倍,这是因为相比于红光和蓝光,人眼对绿光更加敏感,绿色通道的噪声更小,因此绿色像素多的图像噪声更小。相比较单色调制,彩色调制利用了图像的像素亮度和色调值等与图像处理技术相关的参数。如图7(c)所示,其中数据位可以从接受发射信号的像素(x,y)的亮度或色调值中解码。由于帧速率是连续脉冲速率的两倍,两个帧将表示相同的数据位。但由于 LED 开启和关闭的转换,一帧可能表示 LED 的状态不明(不完全开启或完全关闭),因此数据位可以由其他帧的像素亮度决定,这也提高了 OCC 系统的传输速率和准确率。

2)CSK-CDMA调制。除了颜色强度调制(CIM)外,色移键控调制(CSK)也是一种常见的利用于红绿蓝(RGB)发光二极管(LED)的调制方法。一个RGB LED实际上包含三个相互独立的发不同颜色光的LED,这三种颜色分别被看作一种单色,在信息传递过程中,一种单色对其他单色的解码解调造成的干扰称为单色干扰。CSK 可以更改每个 LED 的发光强度来进行调制,从而可以通过提高每个符号的比特率来抵抗单色干扰,同时也提高了系统的吞吐量[30]。而码分多址(CDMA) 是一种使多个用户同时访问网络的技术[31],结合这两种技术,也是一种改进的 OCC 系统调制方式。如图8所示,对 QAM 映射后的数据进行 CDMA 编码,产生两路编码后的信号,结合这两路信号进行 CSK 调制,接着驱动 RGB-LED 阵列传输,接收端有两个相机接收CSK 信号,对接收的信号进行像素解复用、CSK 解调以及 CDMA 解码后得到系统传输的数据。

图8 基于 CSK-CDMA 调制的 OCC 系统框图Fig.8 The OCC system based on CSK-CDMA modulation

由于在接收端对 RGB 的处理是独立的,此处以红色为例进行说明,蓝色和绿色也是一样的过程。每种颜色的颜色深度由 8 位二进制数来表示,因此颜色幅值的范围为0~255。在发射端,图9(a)所示为 CSK-CDMA 的调制编码过程。用户 1 的颜色[R,G,B]为[40,40,0],用户 2 的颜色[R,G,B]为[80,0,40]。用户 1 的红色幅度值为 40,通过扩展码[1,-1,1,-1]扩展后变为[40,-40,40,-40],同时用户 2 的红色幅度值被扩展为[80,80,-80,-80],可以看到,扩展后的两个码彼此正交,将其叠加后增加 130 的偏移量,从而使得颜色幅值在 0~255 的范围之内。在接收端,图9(b)所示为 CSK-CDMA 的解调解码过程,接收到的信号包含两个用户的幅值信息,因此两个用户的相机都接收相同的信号,首先对接收的信号减去 130 的偏移量,然后将其乘以各自的扩展码后除以扩展码的长度,两个用户分别得到各自的红色幅度值,由此完成调制编码和解调解码的过程。

图9 CSK-CDMA 调制解调过程Fig.9 The modulation and demodulation of CSK-CDMA

除了调制方式外,OCC系统性能的好坏还与发射器和接收器的类型有着密不可分的关系,由于OCC系统的接收器为相机的特殊性,可以实现很大范围的信息传输速率。表2中,以调制方式为主,对部分文献中的实验数据速率、传输距离、图像传感器、系统设计以及它们各自的优缺点进行了对比。

表2 OCC 中的调制方式Table 2 The modulation of OCC

3 OCC的发展及局限性

光学成像通信(OCC)采用相机作为接收端的一部分,采用图像传感器巧妙地从多个光源接收调制数据,从而实现视线(LOS)链路和空间分离,使其可以应用于多种通信场合。OCC具有比VLC更加高的频带宽度,并且可以采用相机的变焦功能对其传输范围进行扩展,在一定程度上优于VLC。

然而,OCC系统也存在一定的局限性。OCC的主要挑战之一是其对接收器(相机)结构的依赖性,由于市售的相机帧速率都较低,大约为30帧/s,这限制了OCC的数据传输速率。因此,接收信号的质量和解码速率都受相机的帧速和曝光时间的影响,这是OCC与其他技术竞争的主要障碍。此外,环境光的干扰是OCC噪声的主要来源之一,即为闪烁噪声,它会修改接收像素的亮度,使其在解码过程中产生错误并因此导致信息丢失,而现有的无闪烁调制技术又受到短距离照相机的限制。当相机的视角不断变化时,会出现透视失真,这是影响OCC性能的另一个问题。

由于相机性能、照明条件、系统因素以及帧速率的多样性和可变性,基于屏幕-相机链接的智能手机的可视通信很难达到完美的帧同步,特别是在单向OCC中,发射端和相机接收端的帧速率之比是不匹配的,除了改进调制方法外,还需要在同步、编码等技术上不断研究。随着智能设备相机帧速率的不断提高,未来可以将OCC中的图像传感技术与VLC结合使用,仍然具有光明的发展前景。

4 总结

光学成像通信(OCC)技术是可见光通信(VLC)的扩展,与基于光电二极管的VLC系统不同,OCC接收器是内相机。本文对OCC进行了概述,首先介绍了OCC的工作原理及其应用场景,然后对其接收端特有的图像传感器进行了分析,就分键控调制和颜色调制两个方面介绍了一些应用于OCC中的调制方式,其中键控调制包括OOK、频移OOK、UFSOOK和UPSOOK,颜色调制包括CIM和CSK;还对OCC中的调制方案的速率以及传输距离等性能进行了对比。最后,对OCC的发展和局限性进行了展望。虽然OCC的数据传输速率还有待提高,但相比较VLC,OCC可以实现更高的定向信道,成本也更低,通过技术进步和持续研究,OCC系统具有巨大的发展潜力。

猜你喜欢
接收端解码像素
《解码万吨站》
像素前线之“幻影”2000
基于扰动观察法的光通信接收端优化策略
基于多接收线圈的无线电能传输系统优化研究
解码eUCP2.0
手机无线充电收发设计
“像素”仙人掌
NAD C368解码/放大器一体机
Quad(国都)Vena解码/放大器一体机
高像素不是全部