基于卷积神经网络的图像识别技术在育种工作中的应用

2023-07-12 03:16韩学坤
现代农业装备 2023年3期
关键词:稻粒图像识别种业

刘 洋,张 钊,夏 旭,韩学坤

(怀化市农业科学研究院旱作研究所,湖南 怀化 418000)

0 引言

我国是农业大国,也是世界第二大种子需求国,目前良种在农业增产中的贡献率已经超过了45%,但是与美国等发达国家60%以上的贡献率相比,我国仍有较大的差距[1],一方面是国外育种工作有先发优势,另一方面是作物育种工作本身的特点和难点:周期长、难度大、失败率高且劳动强度较高,这些因素导致选育优良品种较为艰难。基于卷积神经网络的图像识别技术的迅猛发展,为减轻育种劳动强度,提高育种效率提供了良好的解决方案。

1 图像识别技术在育种中的应用

育种工作是一项繁琐且劳动重复率较高的工作。如水稻育种工作中,对分蘖、株高、穗长等性状要在水稻的整个生长期间不间断的测量记录,成熟收割后还要对水稻的穗粒进行分类统计。而识别统计恰好是图像识别技术的强项,把图像识别技术引入到水稻育种工作中将会大量减少重复劳动,极大提高工作效率。

图像识别技术基本原理是计算机把图片看作一个三维张量[2],三维分别代表图片的宽、高以及通道,通道的意思是对于一张图片,在计算机看来是由很多个像素点拼接组成,把图片在计算机上放大很多倍就能看到一个个像素点,而每一个像素点的颜色都是由R、G、B 这3 种颜色组成(光的三原色红、绿、蓝,3 种颜色的占比不同就能组成所有颜色),通道代表着R、G、B 这3 种颜色,程序将颜色转换为数学形式进行计算,这是图像识别技术的基础。

传统的图像识别技术需要经历图像处理、特征提取、分类器设计等步骤[3],需由专家提取图像特征、对图像识别分类,这类技术受参数需求量大、设备要求高等局限一直难以得到应用,如水稻数粒仪,如图1 所示,其使用的是传统图像识别技术,因便携性低且操作复杂,一直难以得到普及。随着基于卷积神经网络(Convolutional Neural Networks,CNN)图像识别技术的快速发展,图像识别技术正以更便捷、更准确的方式应用到育种工作中。

图1 水稻数粒仪

未来,随着卷积神经网络模型的不断优化,图像识别技术的不断发展,识别领域将不断拓宽,识别场景也会更加多元化,如自动识别植物性状、区分不同品种之间的遗传变异,从而可以更有效地筛选出优良品种,为育种工作提供新的思路和方法。图像识别技术还可以借助高清摄像头以及无人机技术应用于大田生产,可以帮助农业生产者更有效地鉴别出植物的病害及其特征,从而有效地控制病害,有助于植物的生长和发育;也可以帮助农业生产者有效地识别出植物的叶片及其他生长特征,从而可以更有效地控制肥料的施用量,减少肥料的浪费,节省成本。

2 卷积神经网络基本原理

卷积神经网络是一种基于卷积操作提取图像特征的深度神经网络,广泛应用在图像分类、图像检索、目标检测、图像分割、图像特征迁移等计算机视觉研究中,和传统的神经网络相比,具有成本低和分类准确率高的优点。1959 年,HUBEL 等发现在猫的大脑皮层中用于局部敏感和方向选择的神经元独特的网络结构可以有效地降低反馈神经网络的复杂性[4-5],由此受到启发,日本科学家 FUKUSHIMA等于1981 年前后提出一种层级化的多层人工神经网络——神经认知机(neocognitron)[6-7]。神经认知机模型由多种类型的细胞单元组成,其中最重要的2 种细胞单元称为“简单细胞(Simple Cells)”和“复杂细胞(Complex Cells)”。这2 种细胞功能上的共同点是每个细胞对特定方向上的条形图样的刺激有反应,而其区别在于简单细胞用于提取局部特征(如边缘或角等);复杂细胞对简单细胞的输入进行一些处理,如图像较小的位移或轻微变形等。1990 年,LECUN 等[8]基于FUKUSHIMA 的神经认知机,提出了现代卷积神经网络框架的原始版本,之后又对这个原始版本进行了改进,于1998 年提出了基于梯度学习的卷积神经网络模型——LeNet-5[9],并将其成功应用于手写数字字符识别中,这为卷积神经网络的发展奠定了坚实的基础。

随着卷积神经网络技术的不断发展,现在主流的卷积神经网络模型层级已基本成型,主要包括输入层(Input Layer)、卷积层(Convolution Layer)、池化层(Pooling Layer,也称取样层)、全连接层及输出层[10],如图2 所示。

图2 卷积神经网络结构

在不同的卷积神经网络模型中,卷积层和池化层一般都会有多层,采用的是卷积层和池化层交替连接,即一个卷积层与一个池化层连接后,池化层再与另一个卷积层连接。输入层主要是将图片中的R、G、B 的颜色信息数字化传递给卷基层,卷基层主要是提取图像特征,而池化层则对卷基层提取的图像特征进一步进行抽样。通常,卷积操作与池化操作要进行多次,经历卷积和池化操作后下一步进入到输出层,输出层包括全连接层和激活函数,全连接层将池化层提取到的特征全部集合,然后给出图片是某种可能分类的概率。全连接层也会有一层或者多层,全连接层会将当前层的每一个神经元与上一层中的所有神经元连接,表示任意一个神经元都与前后层的所有神经元相连接,这样就能够保证输出值是基于图片整体信息的,最后一个全连接层的输出值传递给一个输出层,经计算最终得到图片是某种可能分类的概率[11]。

3 卷积神经网络在水稻种子识别统计中的应用

卷积神经网络具有占用资源少、速度快且识别率高的特点,在手机性能逐步提升的基础上,能够在手机中部署基于卷积神经网络的应用,手机应用读取到拍摄好的图像后,经过卷积计算就能识别出种子类型和数量。这种实现方式为图像识别技术进入日常育种工作提供了可能性,现分别就机器和人工计量水稻稻粒在计数准确度、速度方面做对比试验。

试验模拟水稻考种[12],拍摄背景为黑色,采用的稻粒为烘干状态,且已筛选出空壳和其他混杂物,如图3 所示。为确保数据的真实有效,更加贴合试验条件,特在实粒中混杂了少量的半粒、稻梗等混杂物。

图3 图像识别拍摄图像

用某品牌手机安装基于卷积神经网络的图像识别应用后,对某品种水稻稻粒进行识别计数,分别用人工和机器识别图3 中稻粒,每种数量的稻粒由人工和机器分别识别3 次,统计识别的准确率与识别时间,如表1 所示。

表1 图像识别与人工识别统计水稻稻粒试验

由表1 可知,在100 颗数量级中,人工和机器的平均识别准确率都能达到100% 以上,而到了1 000 粒级别以后,人工仍然能够达到99.50%,而机器识别准确率却下降到96.50%。机器识别准确率虽然有所下降,但是在识别速度上急速增加,在100、500、1 000 数量级上,随着数量的上升,机器识别相对人工识别的速度也在快速上升,在1 000 数量级时,机器识别速度达到了人工识别的5 倍。

人工识别准确率随着稻粒数量的增长并没有显著变化,而机器识别的准确率却明显下降,原因有三点:一是图片噪声较大,拍摄环境较差,背景有反光;二是卷积神经网络模型不匹配,每一个卷积神经网络模型都有其擅长识别的领域,该模型并没有对识别稻粒进行调优,导致准确率难以达到理论值;三是训练模型不充分,模型用图片训练时选用的稻粒图片太具代表性,如稻粒颜色、形状等比较典型,稻粒间粘连情况较少,没有考虑实际工作中稻粒颜色、性状、大小有细微的不同,及普遍存在的粘连情况,应该考虑到实际工作中稻粒不同情况。

总之,目前基于卷积神经网络的图像识别技术在种粒识别方面其效率明显高于人工,通过网络模型的训练,卷积神经网络也能应用到玉米、高粱、大豆等种子的识别统计中。目前,卷积神经网络在农业领域的应用还不够深入,网络模型还不成熟,在实际工作中要注意图片的拍摄环境,尽量排除干扰,一次不能识别太多,以免种子粘连。

4 存在问题及建议

1)应用图像识别技术进行图像分类需要对卷积神经网络模型进行图像训练,需要大量的图像数据,个人或机构难以获取和采集庞大的数据集,国内相关研究起步较晚,图片数据集也不完善,导致大部分图像识别网络模型只能在国外大型公共数据集上进行统计和评估,如ImageNet、Labelme 等,针对特定分类任务的研究数据集样本较少,尤其是种业领域。

2)种业应用场景下的图像分类具有巨大的挑战性,种业图像往往采集于野外,因野外环境复杂,导致图像含有较大噪声,网络难以在日光、地面、作物等其他干扰中准确分辨出目标物体的类别,使得分类准确率低于实验室。

3)部分种业科研人员对图像识别技术缺乏了解,对新技术在科研上的应用持怀疑态度,目前多为计算机相关专业人才在研究图像识别技术在农业领域的应用。

要扩大图像识别技术在种业科研领域的应用,一要加大对国内自有图像公共数据集的支持力度,国际上较为大型的公共数据集通常由高校建立,我国也要支持高校建立和壮大图像公共数据集;二要研发农业领域卷积神经网络,农业图像识别场景较为复杂,一般的卷积神经网络模型难以适配,把其他领域较为成熟的网络模型进行修改应用到种业领域其效果通常不尽人意,因此要开发种业领域的网络模型;三要做好人才培养,卷积神经网络开发的核心是计算机专业人才,但是种业应用场景及用途的复杂性又需要一定的专业背景,要做好人才资源的整合工作,加强种业人才与计算机人才的交流合作,培养既有农业知识又懂计算机的跨专业人才。

猜你喜欢
稻粒图像识别种业
水稻不育系稻粒黑粉病抗性QTL的定位
水稻与稻粒黑粉病菌互作分子机制研究进展
基于Resnet-50的猫狗图像识别
芷江杂交水稻制种稻粒黑粉病发生规律及防治对策探讨
高速公路图像识别技术应用探讨
图像识别在物联网上的应用
图像识别在水质检测中的应用
稻田里的争吵
种业名企展示
种业名企展示