卢小刚,崔炜,熊志航,3,张华峰,廖然
(1.长江大学 物理与光电工程学院,湖北 荆州 434023;2.清华大学深圳国际研究生院,广东 深圳 518055;3.佛山科学技术学院 物理与光电工程学院,广东 佛山 528231)
水环境安全日益受到人们重视.由微塑料造成的环境污染成为人们关注的新热点.微塑料通常是指粒径小于5 mm 的塑料制品或塑料碎屑[1];它在环境中的残留浓度高且容易被生物摄入,对生物体的健康构成潜在威胁[2].我国水体中微塑料污染问题比较严重,部分水体中检测到的微塑料浓度较高[3].微藻是水生态系统的主要初级生产者,在水生食物网的物质转移和能量流动中发挥着重要作用[4].微藻在食品生产、医药研究、生物能源等领域具有很大的商业价值[5].有害微藻过度增殖会引发水华,导致水中鱼类中毒甚至死亡,严重污染水环境[6].
探测微塑料、微藻是水资源开发和水环境污染监测的重要组成部分.光学探测方法具有无损伤、非接触、信息量大等优势[7],多种光学仪器被用于原位监测水体悬浮颗粒物的变化.激光粒度仪LISST-200X 基于激光前向散射原理,用于测量水体前向散射小角度分布,可获取颗粒物的粒径分布和浓度[8].吸收系数和衰减系数是水体固有光学量,水体吸收-衰减测量仪AC-S 能同时测量这2 个系数,为水体颗粒物分析和水色遥感提供基础参数[9].浊度计通过测量悬浮颗粒物的散射光测量水体浊度,水体浊度常用于评估悬浮颗粒物浓度[10].以上光学仪器进行的是水中大量颗粒物的统计测量,难以对颗粒物细致分类.光学显微镜通过观察颗粒物大小、颜色、形态等特征对颗粒物进行分类,是微藻、微塑料观察和鉴定的常用仪器[11].普通光学显微镜在识别某些形态特征相似的微藻或微塑料时,不仅准确度较低[12],而且分析过程耗时,鉴定种类需要专业分类学家在观察大量相关图集的基础上,通过观察颗粒物的形态特征进行分类鉴定[13].流式细胞仪通过流体动力学液流系统,让颗粒物依次通过探测区域,测量单个颗粒物的散射光强和荧光强度,据此对颗粒物进行分类[14].由于自然水体中颗粒物的种类复杂、形态差异大且粒径分布广,导致液流系统容易堵塞,影响了流式细胞仪的广泛使用[15].偏振是光的基本属性[16].用偏振光照射颗粒物后,出射光的偏振态对颗粒物的微观结构尤为敏感.偏振光技术能够兼容传统的非偏振光学仪器,在传统的光学显微镜上添加偏振器件可以构成缪勒矩阵显微镜,测量样品的缪勒矩阵[17].缪勒矩阵表征样品偏振光学属性,如退偏、双折射和细微结构取向等[18].Li 等[12]使用缪勒显微镜进行海藻成像和分类,证明了利用缪勒矩阵图像的分类准确度优于光强图像.Liu 等[19]使用缪勒矩阵显微镜进行形态相似的微藻的有效分类,实现了海洋微藻的高通量分类.此处的通量是指同一视野中同时测量的微藻数量,与流式细胞仪中定义的通量(单位时间内经过检测区的颗粒物数量)不同[14,19].缪勒矩阵显微镜作为非标记、定量化、无损伤的检测工具,在水体颗粒物分类领域显示出了技术优势和应用潜力.
本研究使用缪勒矩阵显微镜进行水中微藻和微塑料的测量,讨论影响分类结果的因素,包括不同颗粒物所在像素的处理方法,颗粒物运动伪影,缪勒矩阵显微镜在不同成像深度的对焦等.1)以2 种常见微塑料和2 种微藻为样品,利用缪勒矩阵显微镜高通量地测量大视野范围内所有颗粒物的缪勒矩阵;2)由缪勒矩阵计算得到的多个偏振参数来表征颗粒物的物理性质;3)借助前馈神经网络的深度学习方法对颗粒物进行分类.
光的偏振态可以采用斯托克斯向量S描述,S=[S0,S1,S2,S3]T,其中S0为 总光强,S1为水平 和垂直线偏振分量的强度差,S2为±45°方向线偏振分量的强度差,S3为右旋与左旋圆偏振分量的强度差[20].当照明光穿过样品时,
式中:Sout为透射光的斯托克斯向量;Sin为照明光的斯托克斯向量;M为缪勒矩阵 ,它包含了样品的所有偏振信息,16 个阵元可以表征多种偏振效应;其中M11为样品的光强信息,M22、M33为样品的退偏特征,M12、M13为样品的二向色性特征,M24、M34、M42和M43为样品的双折射特征.通过改变入射光和出射光的偏振态,求解线性方程组可以得到样品的缪勒矩阵.根据定义,至少需要4 次测量才能得到完整的缪勒矩阵.
缪勒矩阵携带颗粒物丰富的微观结构特征信息,可以完备描述颗粒物偏振光学性质,对散射颗粒物的光学性质(包括折射率、吸收、双折射、二向色性等)、形态(粒径、形状、取向、排列、有序度等)和微观结构(表面形貌、内部亚结构)都十分敏感,特别是对亚波长尺度以下的超光学分辨结构特征敏感[21].通过缪勒矩阵分解[22],可以将缪勒矩阵分解为一组代表明确物理过程的子矩阵,进而获得一组具有明确物理意义的偏振参数,即散射退偏、相位延迟、线性相位延迟、二向色性.缪勒矩阵变换[23-24]从特定样本偏振行为分析出发,获得一组具有物理意义的偏振参数,这些偏振参数可以提供样品微观结构信息.本研究使用的偏振参数包含有D、t以及b等在内的34 个偏振参数,它们都是旋转不变量.其中D表示二向色性,t表示各向异性,b为线性相位延迟,其他偏振参数的含义可参考文献[21]~[24].
在商用透射式显微镜上添加起偏器(polarization state generator, PSG)模块和检偏器(polarization state analyzer, PSA)模块构成缪勒矩阵显微镜[17,25],其结构如图1 所示.PSG 由固定角度的线偏振片P1 和可旋转的四分之一波片R1 构成.R1安装在电动旋转平台上,旋转R1 的角度可以得到不同偏振态的照明光.PSA 由2 个基于焦平面划分的线偏振相机(DoFP CCD)、1 个50∶50 非偏振分光棱镜和1 个固定角度的四分之一波片R2 构成.穿过样品的透射光被非偏振分光棱镜分成2 份,一份先经过R2 再照射到线偏振相机DoFP CCD1上,另一份直接照射到线偏振相机DoFP CCD2 上.2 个线偏振相机搭配四分之一波片组成的结构在经过校准后可以测量待测光的偏振态[17].
图1 缪勒矩阵显微镜结构图Fig.1 Schematic of Mueller matrix microscope
PSG 调制发光二极管(光源波长λ=514 nm)发出的照明光偏振态,PSA 检测穿过样品的透射光得出透射光斯托克斯向量.根据文献[26]的研究结论,令R1旋转到4 个特定的角度(±45°和±19.6°)进行起偏,每转动到其中的一个角度时2 个线偏振相机进行数据采集,共进行4 次采集.PSG 先后产生4 组不同偏振态的照明光,其斯托克斯向量组成4×4 矩阵SPSG;PSA 相对应地得到4 组透射光斯托克斯向量,组成4×4 矩阵SPSA.样品的缪勒矩阵计算式为
实验用微塑料分别是聚氯乙烯(PVC)和尼龙6(PA6),购买自东莞市樟木头华创塑胶原料商行,均为白色粉末状.单个颗粒物粒径约为1 000目(13 µm),在水中会呈聚集状态,粒径不一.PVC的折射率为1.53,PA6 的折射率为1.54.这2 种微塑料广泛分布于河流、湖泊、海洋[27].实验用微藻分别是多芒藻(Golenkinia)和衣藻(Chlamydomonas),购买自中国科学院淡水藻种库.多芒藻细胞半径平均约为10 µm,细胞为球形,周围有纤细的刺毛;衣藻细胞半径平均约为5 µm,细胞为卵形,前端有2 条等长的鞭毛.微藻的折射率为1.36~1.45.多芒藻多生活于湖泊、河流、水坑,可以快速积累油脂实现生物能源生产,可以用于污水处理[28].衣藻多生活于有机质丰富的小水体或潮湿的土表上,池塘、湖泊或河流中也常发现,是能够特异地对线粒体、叶绿体与核分别建立转化系统的生物,具有高研究价值[29].
各样品在缪勒矩阵显微镜4 倍物镜(数值孔径为0.1,视场为2 mm,分辨率为每微米1.028 个像素点)下测得的缪勒矩阵阵元M11图像如图2 所示,图像大小均为1 992×2 350.图中,LREF为各图像的参考长度.
图2 微塑料和微藻的光强图像Fig.2 Images of light intensity of microplastics and microalgae
图2 中颗粒物透射光比周围背景的光更暗,利用M11将颗粒物从背景中分离;先将图像中的像素值用该图像的最大值归一化,然后将其中大于0.5 的所有像素点都归为背景,其余像素点为颗粒物像素点,将同一个连通域内的颗粒物像素点算作1 个颗粒物.本研究采用2 种数据处理方法:1)像素点法(pixel point method, PPM),2)平均值法(mean value method, MVM).PPM 取颗粒物图像上所有的像素点,计算每个像素点的PBPA,所有像素点都归入数据集;MVM 是将该颗粒物看成整体,先计算图像上每个像素的PBPA,再取平均值,1 个颗粒物只有1 个PBPA 归入数据集.不同PBPA 计算方法对应的颗粒物类别的判别方法也不同.采用像素点法的判别方法先利用分类模型输出所有像素点对应的颗粒物类别,如果被归于某类的像素点数最多,则将整块颗粒物归入该类;采用平均值法所对应的判别方法则是直接使用分类模型的输出结果作为整块颗粒物的类别.
前馈神经网络是典型的深度学习方法[30],也是成熟的监督工具,可以在大量变量中提取特征并实现高预测准确性.本研究建立针对二分类的前馈神经网络模型并将其作为分类模型.缪勒矩阵蕴含丰富的颗粒物信息,颗粒物的物理特征复杂、种间差异多样,为此采用前馈神经网络从缪勒矩阵数据中提取不同种颗粒物的差异特征,以实现颗粒物分类.如图3 所示,前馈神经网络分类模型包含输入层、一层隐藏层以及输出层.输入层有34 个单元I1~I34,分别对应PBPA 的34 个数组元素;隐藏层有8 个神经元H1~H8;输出层有2 个单元O1、O2,代表2 种颗粒物的预测概率.Wij为Ii和Hj之 间 的 权 值,Vjk为Hj和Ok之 间 的 权 值.隐藏层净输入的和为
图3 前馈神经网络模型示意图Fig.3 Schematic diagram of feedforward neural network model
输出层的输入的和为
输入与输出的关系用权值联系在一起.划分数据集的70%为训练集,15%为验证集,15%为测试集.
实验采集14 个PVC 的测量视野、8 个PA6 的测量视野,11 个多芒藻的测量视野、4 个衣藻的测量视野,每种颗粒物各获得1 100 个.对于采用像素点法计算PBPA 的微塑料来说,其数据集的样本数均约为2.0×105个,对于采用图像平均值法计算PBPA 的微塑料和微藻,其数据集样本数各约为1 100 个.
从PVC、PA6、多芒藻和衣藻这4 个类别的颗粒物样品的缪勒矩阵图像中获取单个颗粒物的图像信息,分析缪勒矩阵阵元的差异.各类别颗粒物的单个颗粒物的缪勒矩阵图像组成如图4 所示.考虑到各种颗粒物大小不一,为了完整显示它们的结构特征,设定PVC 的缪勒矩阵阵元图像大小为80×80,PA6 的缪勒矩阵阵元图像大小为50×50,多芒藻的缪勒矩阵阵元图像大小为40×40,衣藻的缪勒矩阵阵元图像大小为30×30.图中,VNOR为缪勒矩阵阵元的归一化值.为了显示方便,对各类别颗粒物图像进行缩放,让它们合成的缪勒矩阵图像一样大,缪勒矩阵的对角阵元的值已减1.可以看出,PVC 和PA6 均在M22、M33有明显的差异,表明这2 种微塑料对光的退偏程度不同[31].实验 微 塑 料 的M24、M34、M42和M43同 样 有 明 显 差 异,反映了不同微塑料内部结构引起的双折射不同[31].PVC 的M22和M33差异大,表明该样品具有明显的各向异性[31].图中可以明显观察到单个微塑料颗粒内部阵元值分布差异较大,这是由于该颗粒由许多细小微塑料堆叠而成,在不同位置处,厚度的不同会导致其阵元值不同.多芒藻对应的M22和M33在细胞的不同结构上表现出较大差异,表明多芒藻细胞内部不同部位的退偏特征较其他特征更 加 明 显[31].由M24、M34、M42和M43阵 元 可 以 看出,多芒藻内部结构具有明显的双折射[31];由M12、M13、M21和M31阵元的取值可以看出,多芒藻内部结构的排列导致了二向色性分布的变化[19].上述4 个类别样品对应的缪勒矩阵阵元有显著差异,反映出样品不同微观结构具有不同的偏振特征,因此可以根据这些特征来区分不同种类的颗粒物样品.
图4 微塑料和微藻的缪勒矩阵图像Fig.4 Mueller matrix images of microplastics and microalgae
微塑料的形状大小不一,当采用像素点法计算PBPA 时,数据集对应的微塑料样本数为200 000个.测试集样本数占总样本数的15%,将测试集数据作为分类模型的输入,得到微塑料分类对应的混淆矩阵,如图5(a)所示.混淆矩阵的行表示实际类别,矩阵的列表示预测类别,对角线阵元的值表示预测准确的比例,越接近100%,分类效果越好.混淆矩阵由大量测试集样本得到,保证了分类准确度[32].2 种微塑料在纯样品实验中的分类效果图,如图5(b)、(c)所示,图中深色代表PVC,浅色代表PA6.可以看到,在纯PVC 样品的实验中,视野内共有35 个微塑料颗粒,其中34 个被准确识别;在纯PA6 样品的实验中,视野内共有114 个微塑料颗粒,其中107 个被准确识别.2 类微塑料在水中混合时的分类效果图如图5(d)所示.在混合实验中,颗粒物被分为2 类,其比例与图5(b)、(c)的比例接近;可以看出,2 种微塑料的形态、大小变化范围很大,并且微塑料的聚集程度不同,仅凭图像难以得知微塑料种类.由大量测试集样本得到的混淆矩阵,保证了缪勒矩阵数据可以准确地进行微塑料种类的区分,因此图5(d)混合样品中的2 种微塑料被准确地识别出来是可信的.
图5 聚氯乙烯和尼龙6 的混淆矩阵和分类效果图Fig.5 Confusion matrix and classification result of PVC and PA6
微藻形状单一,且细胞内部结构丰富,当采用平均值法计算PBPA 时,数据集对应的微藻样本数为1 100 个.微藻分类对应的混淆矩阵如图6(a)所示,多芒藻和衣藻的预测准确率分别为87.3%和90.2%.如图6(b)所示为2 种微藻在水中混合时的分类效果图,包含31 个多芒藻,171 个衣藻.图中,红色代表多芒藻,黑色代表衣藻.27 个多芒藻细胞被准确识别,156 个衣藻被准确识别,准确度分别是87.1%和91.2%,与混淆矩阵接近.衣藻普遍小于多芒藻[28-29],对比图2(c)和图2(d)可以得出类似结论,因此在图6(b)的混合样品中,可以通过观察图像中颗粒物大小来区分二者,但是这种判别方式可能存在误差.
图6 多芒藻和衣藻的混淆矩阵和分类效果图Fig.6 Confusion matrix and classification result of Golenkinia and Chlamydomona
在考察微塑料和微藻的分类情况时,为了便于与真值进行比较,实验选择图像特征比较明显的微塑料PVC 和圆形的多芒藻作为样品.此时,微塑料和微藻均采用平均值法计算各自的PBPA,其数据集样本数各1 100 个,其混淆矩阵如图7(a)所示.可以看出,2 类颗粒物的分类准确度大于85%,分类准确度较高,其中微塑料的分类准确度大于微藻的分类准确度.为了模拟自然水体中的情形,实验时将2 种颗粒物在水中混合后测量其缪勒矩阵图像,分类效果图如图7(b)所示.利用图像特征认定颗粒物类别作为真值,其中认定圆形颗粒物为多芒藻,形状不规则的颗粒物则为PVC.图中包含26 个PVC,63 个多芒藻,分类效果图中蓝色代表PVC,红色代表多芒藻.其中,21 个PVC 被准确识别,58 个多芒藻细胞被准确识别,微塑料和微藻的分类准确度分别为8 0.8%、92.1%,与混淆矩阵接近.虽然图7 中采用图像特征区别显著的2 种颗粒物作为例子,方便评估分类结果的准确性,但是自然水体中颗粒物种类繁多、形态复杂,区分不同颗粒物难度很大.如图5(d)中2 种不同微塑料混合时,仅凭图像特征难以区分二者,还需要颗粒物的偏振特征(缪勒矩阵).
图7 聚氯乙烯和多芒藻的混淆矩阵以及分类效果图Fig.7 Confusion matrix and classification result of PVC and Golenkinia
如图8 所示为对PVC、PA6、多芒藻、衣藻4 种颗粒物进行四分类的混淆矩阵.各类颗粒物的分类准确度差异很大,比如对2 种微塑料的分类准确度大于90%,衣藻的分类准确度大于80%,但是多芒藻的分类准确度小于80%.可以看出,多芒藻与PVC 之间的误判较高,这与图7(a)中混淆矩阵的结果类似;图6(a)多芒藻与衣藻之间也有一定程度的误判.综合来看,多芒藻的分类准确度较低,但是4 类颗粒物的平均分类准确度大于86%,说明缪勒矩阵显微方法可以较准确地识别不同的颗粒物.
图8 4 种颗粒物四分类的混淆矩阵Fig.8 Confusion matrix corresponding to four classifications of four particles
综合图5~8 的结果可以看出,缪勒矩阵图像可以准确地对水中微塑料和微藻进行分类.分类准确度受制于PBPA 的计算方法、颗粒物种类的真值影响;缪勒矩阵图像的准确测量也可能关乎分类效果.
结合实验结果可知,由缪勒显微镜采集到的数据算出的缪勒矩阵及其演化的偏振参数对颗粒物的物理性质具有较强表征能力,它是比传统显微成像更强有力的分析工具.然而,影响颗粒物分类效果的因素有很多,依旧有许多值得探讨的地方.
图6 是采用平均值法计算PBPA 对2 种微藻进行分类得到的结果,获得了较好的分类效果.当采用像素点法计算PBPA 时,对应的混淆矩阵如图9 所示.可以看到,相较图6(a),像素点法对应的准确度下降了9.2 个百分点.
图9 2 种微藻采用像素点法时分类后得到的混淆矩阵Fig.9 Confusion matrix obtained after classification of two microalgae using pixel point method
分别采用像素点法和平均值法分析数据集中的1 100 个多芒藻样本的PBPA,其偏振参数D、t的值分布情况如图10 所示.NNOR为偏振参数分布数量的归一化值.采用像素点法时,D的标准差为0.031 2,t的标准差为0.018 4.采用平均值法时,D的标准差为0.019 2,t的标准差为0.006 3.可以看到,采用平均值法可以将偏振参数的值分布范围缩小.微藻内部结构复杂,内部结构的偏振特征差异较大,对整个细胞偏振参数取平均值,可以将这些差异压制,有利于突出不同微藻之间的差异,因此分类效果更好.
图10 采用不同数据处理方法时2 种偏振参数值的分布图Fig.10 Distribution diagram of two polarimetry basis parameters with different data processing methods
在水环境中的颗粒物,尤其是微藻容易发生旋转和翻滚.部分偏振参数对颗粒物的运动较为敏感,缪勒矩阵显微镜在采集图像数据时须配合电机的转动,用时18 s,过程中要求视野下的颗粒物保持静止不动,以便采集到最为准确的数据.如图11所示为有运动伪影和无运动伪影时PVC 的M11图像.有运动伪影和无运动伪影的实验条件不变,区别仅在于水流动的剧烈程度,严格来讲,图11(b)中的颗粒物图像依然存在运动伪影,但成像效果明显好于图11(a)的颗粒物图像.
图11 有运动伪影和无运动伪影时聚氯乙烯的光强图像Fig.11 Images of light intensity of PVC with or without motion artifacts
如表1 所示为同一块PVC 在有运动伪影和无运动伪影时对应的偏振参数D、t、b的均值和标准差.表中,DM为偏振参数D的均值,DSD为偏振参数D的标准差,tM为偏振参数t的均值,tSD为偏振参 数t的 标 准 差,bM为 偏 振 参 数b的 均 值,bSD为 偏振参数b的标准差.可以看到,存在运动伪影时,各偏振参数的平均值都发生较大变化.从偏振参数的标准差变化情况来看,运动伪影会导致数据变得离散,使分类效果变差.在实验过程中,通过抑制细胞或颗粒物的运动、更快的成像和更复杂的图像配准技术,可以减少由运动伪影引起的误差.可以通过添加固定剂(如福尔马林溶液)来抑制微藻的自身运动,或者在盖玻片边缘用蜡封抑制液体挥发来限制颗粒运动,也可以通过减少整个显微镜台面的振动或晃动来减少颗粒物的运动.
表1 有运动伪影和无运动伪影时聚氯乙烯偏振参数的均值和标准差表Tab.1 Mean and standard deviation of polarimetry basis parameters of PVC with or without motion artifacts
由于颗粒物在水中位置分布不同、自身厚度不同等因素,实验时无法做到对视野中所有颗粒物精确对焦,尝试采集PVC 和PA6 的多个焦平面的数据,再对多组数据的每个像素点的偏振参数进行取均值处理.以单个PVC 颗粒为例,采集3 种不同对焦情况下的图像(F1、F2、F3),并取3 张图像每个像素点的均值合成新的图像(F4).3 种不同对焦情况下偏振参数D、t的值分布情况如图12 所示.在对焦情况F1 下,D的标准差为0.025 9,t的标准差为0.020 1;在对焦情况F2 下,D的标准差为0.074 8,t的标准差为0.033 1;在对焦情况F3 下,D的标准差为0.027 8,t的标准差为0.020 7;对3 种对焦情况下的数据取平均后,D的标准差为0.030 8,t的标准差为0.016 3.可以看到,对3 种聚焦下的数据取均值后,可以减小单次随机对焦带来的不利影响,有利于分类.
图12 在不同对焦情况下2 种偏振参数值的分布图Fig.12 Distribution diagram of two polarimetry basis parameters in different focusing situations
本研究基于缪勒矩阵显微镜对2 种微塑料和2 种微藻进行分类探测.使用缪勒矩阵显微镜采集样品缪勒矩阵图像数据,得到颗粒物的偏振参数.利用深度学习工具实现对微塑料、微藻以及微塑料和微藻的分类识别,结果显示,分类准确率均超过80%,表明源于缪勒矩阵图像的偏振参数能够有效、高通量地实现对水中微塑料和微藻的分类和识别.本研究讨论了不同数据处理方法、样品运动、物镜的对焦对缪勒显微镜所采集数据的准确性的影响,但只在进行了微塑料与微藻的简单分类实验后展示了方法的有效性.在后续工作中,1)将探索更多的偏振参数,从中选择合适、有效的偏振参数进行多分类实验;2)将对自然水体中颗粒物开展实验研究,摸索可以直接用于现场水样检测的方法.