王 彪 王 筠 屈军乐
(1.深圳大学生命与海洋科学学院,深圳,518060;2.深圳大学光电工程学院,光电子器件与系统重点实验室,深圳,518060)
雉鸡(Phasianuscolchicus),颈部下方有一圈显著白色环纹,为我国雉科(Phasianidae)中分布最广的鸟类。目前已确定多达31个亚种,一些亚种从表型与遗传上已适应于不同的地理区域(例如:寒带、热带、干旱区、高原等),从而形成了各具特色的独特群体[1]。群体间的差异可能是自然选择、配偶选择、群体历史迁移等共同的影响[2-4]。近年来,动物学家通过形态分类和分子生物学手段对雉鸡亚种的种群类型进行了较为深入的研究[5-6]。例如:Qu等[7]以线粒体DNA(mtDNA)控制区基因1 079 bp碱基序列为遗传标记,研究了中国雉鸡28个群体的分子生态(将我国雉鸡群体分成3个进化支(clade),与依形态上划分的“白翅组、准噶尔组、灰腰组”对应[8])。Liu等扩大了取样的范围,对全国13个亚种58个采样点的483个雉鸡样本进行了线粒体DNA控制区和细胞色素b共1 625 bp的序列进行了分析,将全国的雉鸡分为7个主要进化支,发现随着适宜的栖息地的扩大,雉鸡群体适应性产生的差异也在各亚种之间的形态上有所体现[9-11]。Kayvanfar等的研究确认了elegans亚种的分布范围在中国云南西北部,在所研究的17个亚种中处于基础地位,并且验证了雉鸡可能起源于中国东南部森林的假设[12-13]。
雉鸡的亚种种群具有分布范围广、群体数量大、扩散能力弱等特点,在漫长的进化历史中,形成了形色各异的亚种羽色图案形态。通过对雉鸡亚种羽色形态进行研究,能够更精准地对其进行亚种分类,基于宏观形态的类别又可以与微观分子的进化进行比较分析,即可揭示种群遗传格局和历史动态,并能从另一角度理解自然选择、种群历史等对于雉鸡遗传格局及演化的不同影响[14-16]。同时,基于形态学的详细分析可为基因与形态的关联研究(genome-wide association study)提供更多的有用信息[3,17-19]。
雉鸡亚种羽色形态观察大多通过动物学家人眼进行,但有经验的动物识别专家往往需要多年的经验积累。对于雉鸡这样分布广、数量大、亚种形态复杂易混的物种来说,识别准确难以实现。随着数码相机等观察设备的更新换代,可以运用图像数字化的技术对光线、角度、环境干扰等多种复杂因素的进行修正,明显提高了野外采集雉鸡羽色形态的图像质量。通过实验室计算机图形的后期数字化分析,可以帮助更好地识别雉鸡亚种,对物种鉴定进行辅佐纠偏。
实现数字图形识别的前提是通过特征提取,将雉鸡图像区域与背景区分出来。因此,需要建立雉鸡羽色数据库,应用已有的信息进行辅助提取。另一方面,羽毛的样式和颜色受遗传与环境交互影响,是一些具有独特纹理的图案和一些不可描述的特征组合。图像数字化处理:(1)基于像素的分割:利用像素外观作为像素分配标签;(2)基于区域的分割:主要通过寻找图像之间的边界来将图像分割成区域;(3)基于图像标记的分割:被定义于全局能量函数,但精准度取决于外观和图像梯度的识别[20-21]。特征提取后,需要用数字分类方法对图像进行解析,这是一种基于模板匹配的动物图像监测模型,并可通过基于颜色特征的支持向量机(support vector machine,SVM)对雉鸡的分类特征进行聚类与描述。其中,K近邻分类算法(K-nearest neighbor)、概率神经网路(probabilistic neural network)和符号分类器(symbolic classifier)是最有效的3种算法[22-26]。本研究通过以上3种算法,对大英博物馆提供的25个雉鸡亚种的标准图片进行识别,探索数字识别在雉鸡亚种鉴定中的可能性。
本研究的雉鸡亚种外观性状图像取自大英博物馆馆藏标本,共25个亚种,每个亚种2张不同角度的全身数码图片(图1)。对图片的处理包含图像切割、特征提取、特征分析与聚类3个步骤。
首先通过TernausNet对图形微切分割出色彩微格,并将其灰白化[27](图2)。对于原始分割进行赋值、合并、再切割。在分割中,图像的中心区域被称为目标标记区域,图像的边界称为背景标记区域。对数值矩阵进行标记:标记对象区域、标记背景区域和非标记区域[28]。提取对象轮廓及非标记区域被分配给对象区域或背景区域。
利用Gabor函数的滤波器微格对数字图像模式进行分析,将有效表征的重复结构进行归纳,在空间域和频率域的联合不确定性之间进行折中[29]。基于频率分析的数学特性通过Gabor函数来进行描述,将空间和频率联合的不确定性最小化。微格分析通过应用同一组尺度和方向选择性的Gabor来完成的[30]。对图像的过滤所应用的二维Gabor函数G(x;y)及其傅立叶变换G(u;v)可以写成:
式中:波长(λ):以像素为单位指定,大于等于2,不大于输入图像尺寸的五分之一;方向(θ):Gabor函数并行条纹的方向,取值为0到360°;相位偏移(φ):取值范围-180°到180°,分别对应中心对称的center-on函数和center-off函数;长宽比(γ):空间纵横比,Gabor函数形状的椭圆率。操作程序可在github.com/mhaghighat/gabor获取。
通过检测重要特征来减少数据的维度,每个雉鸡图像所使用的特征选择算法分为两类:(1)过滤法:通过矩阵评估和选择特征子集的数据特征,需要滤波器用作图像预处理步骤;(2)包含法:使用机器学习算法的性能来评估每个算法候选特征子集,寻找最优化学习的特征算法。
聚类方式包括:
K近邻分类算法是基于“最近距离(nearest neighbor)”的算法,通过R语言中的yalmpute程序包实现[31-33]。K近邻分类算法采用向量形式测试样本特征,找到每个训练示例的向量的欧氏距离,作为最近距离。随后,将标签分配在测试样本上,利用“平滑”假设,归类聚合相同的微格模块。
概率神经网路是3层结构的前馈网络,来自贝叶斯决策网络(Bayesian network),通过R语言中的PNN程序实现(https://github.com/chasset/pnn)。它基于训练样本的概率密度函数,使用相似的概率密度函数,针对每个测试向量单独进行计算[34])。在输入到网络之前对向量进行同一化。隐含层每个分类含一个节点,输出层具有用于每个模式分类的节点。
符号分类器使用提取的Gabor特征作为雉鸡样本的符号表示[35-36],通过R语言中的symbolicDA程序实现(http://keii.ue.wroc.pl/symbolicDA)。由于雉鸡羽毛的特征在每个亚组中具有的类内差异较小,区分这些变化较困难。因此使用非常规数据处理,能够更有效地区分并保存数据之间的差异。基于象征特征的算法适应于捕捉变化区间值的特征向量。
雉鸡亚种图像识别结果显示了分割与特征提取的性能和效率,此步骤结果可直接影响到后面的聚类分析。在提取时,不同的种群呈现出不平衡的数据集。检测的雉鸡5大亚种类群,包括:黑颈雉鸡(Phasianuscolchicuscolchicus)、橄榄腰雉鸡(Phasianuscolchicustarimensis)、灰腰雉鸡(Phasianuscolchicushagenbecki)、准格尔雉鸡(Phasianuscolchicusmongolicus)和白翅雉鸡(Phasianuscolchicuschrysomelas)(图3)。总的来说,所有模型取得的识别效果并不好,主要在于雉鸡的羽色过于接近。其中灰腰雉鸡的利用概率神经网路(PNN)的识别精度最高,为62.3%。而橄榄腰雉鸡和白翅雉鸡则分别利用K近邻分类算法(KNN)和概率神经网路(PNN)所获得的识别度最低,仅有20.5%。
对完整雉鸡图像数据集的识别包含5大亚种集群一共25个亚种,但来自各大集群的亚种数目并不平衡,本研究依然采纳所有亚种图像进行分析验证。结果表明雉鸡在大的亚种类群中识别度较高。依然是概率神经网路取得了最好的效果,识别性能从19.2%到60.4%。最简单的模型K近邻分类算法性能较低。模型符号分类器也显示了较好的结果。
本研究对图像切割后的灰度微格的识别效率,继而运用序列前向选择法、序列后向选择法、序列浮动前向选择法和序列浮动后向选择法等算法,对差异纹理特征进行提取和聚类,并进行了多重组合验证[37]。这种验证技术仅适用于K近邻分类算法、概率神经网路和符号分类器的基础构架设计。其模型具有预先训练的权值,本研究的实验结果显示了完整的验证结果。在数据模拟进行到40%时,数值就已趋于稳定,平均值稳定为(70.8±4.5),验证了识别结果的可靠性。
在对雉鸡亚种图像识别的进一步验证中,本研究将所有亚种图片共50张对应的主要亚种类群进行比对,5个亚种类别为:黑颈雉鸡、橄榄腰雉鸡、灰腰雉鸡、准格尔雉鸡和白翅雉鸡。在只考虑不平衡数据集的验证中,每一类的所有图像样本被拆分为2组:预测亚种类群与目标亚种类群(表2)。同时,类群的判别应用了3种聚类模型。如果有2个以上判定为同一种,可认定为这一种。结果证明,本研究并没有3个模型判定为3个不同类群的情况,因此50个实验图像都被归集到相应的群组之中。其中,3个模型判定完全一致的占52.5%。通过这个3模型联合验证法,雉鸡亚群的平均识别率已经达到了70%,最低的(即对于橄榄腰雉鸡的识别)也在60%。
表1 图像识别聚类的交叉验证率
表2 3种模型综合使用的图片识别验证
本研究测试了通过羽毛图案对雉鸡亚种类群进行识别的计算方法,主要依托K近邻分类(KNN)、概率神经网路(PNN)和符号分类器3大函数。利用最大区域合并分割雉鸡图像,从分割图像中提取Gabor特征,判别Gabor特征,然后使用3大算法进行特征选择。对于所提出的方法的有效性,我们也进行了不同维度的验证,包括对能采集到图像资料的所有亚种(共25种)进行了分析,并在交叉验证中混入来自图册或野外工作采集的图片。同时,考虑了不同大小的亚种数据库的差异,研究了非平衡状况下效果分类的精度。实验结果表明,概率神经网路(PNN)优于其他个体特征。
通过数字模型对雉鸡亚种种群进行图像识别证实了目前数字分类的难度。同时,通过比较可以清楚地发现概率神经网路(PNN)模型可以被较好地应用到图片识别数据集之中。此外,K近邻分类算法(KNN)的算法架构最为简单,分类结果对于某些类群也显示了良好的效果。而用符号分类器实现高性能,对图像数字矩阵模型的平衡性有较高要求。对于雉鸡羽色的识别,图3显示平衡数据集的性能结果并没有其他2种算法表现好。本研究结果还显示,对于25种亚群群体的图像识别与人脸识别相比都有不同程度的性能退化,这可能是雉鸡初始样品集图像大数据欠缺的原因。而分析过程中,初始样本的分类结果也确认了本研究分析流程的可靠性,因而表明为未来研究需求还应采集更大量和高精度的样本图像。
在特定雉鸡类群的识别方面,对于准格尔雉鸡,3种算法K近邻分类、概率神经网路和符号分类器显示出非常接近的性能,这可能是由于准格尔雉鸡在羽毛外观形态上和其他几类亚种类型的重叠度最高。在其他几个亚种类群中,灰腰雉鸡拥有反差最大的羽色特征,这也是造成在概率神经网路算法下,获得最高识别度的原因。白翅雉鸡在3种算法下的效率都不好,主要因为白色区域的识别度较差。而在实际野外采样中,采集到的自然界的样本可能更难形成被模型高效识别的数据集。
通过图像识别聚类的交叉验证,可以推断出序列浮动后向选择法的模型精度较低,而与训练相比新数据集的序列前向选择法可取得更好的验证结果。因为K近邻分类算法呈现了从61.7%到79.2%的变化范围,表明结果可能出现了过度拟合。最重要的微格数值矩阵带来了计算成本的极大不确定性,也是在实际应用中需要考虑到的。
本研究通过计算机图像识别对羽色图案各异的雉鸡亚种类群实现自动化分类。虽然现在的识别效率还不够精准,优化后的模型也只能对5个亚种大类进行识别,且成功率只有大约70%,但这对于野外物种的标准化采集与识别是一次重要的尝试。系统性的数字识别会降低野外观测的偏差,同时数字化提取出的信息也可以作为系统进化分析的重要原始数据。目前识别效率较低主要原因有:第一,目前用于优化模型的雉鸡羽色形态的初始数据量仍不足。随着对于雉鸡的深入研究,以及有意识的采集高质量的图片,一定会有更多的原始图像数据积累。第二,数码摄影的硬件局限,虽然现代的照相设备已经能达到很高的像素质量,但光线处理问题仍还存在瓶颈,有待于摄影硬件的技术突破。第三,本研究采用灰度微格进行分析,制约了颜色数字矩阵的转换,一定程度上丢失了一些重要的形态信息,需要进一步的技术改良。第四,本研究采用的数据模型并非严格意义上的人工智能算法。相信现代计算科学的快速发展,会带来更加高效率的数值算法,使得更好的图像识别成为可能。再伴有越来越多的大数据收集与储存,计算机视觉的深度学习技术能力肯定能在不久的将来,使得此探索性研究的功能与成果得到显著性提高。