基于深度学习的实验室设备管理

2021-04-10 17:03徐咏黄文海黄波王扬栋黄丽林杨程钧
新型工业化 2021年7期
关键词:图像识别神经网络实验室

徐咏,黄文海,黄波,王扬栋,黄丽林,杨程钧

(河池学院 人工智能与制造学院,广西 河池 546300)

0 引言

传统的实验设备识别和管理只能对特定的标签进行识别,即在每样实验设备上标记条形码或二维码,通过扫码器对设备的条形码或者二维码进行出库入库操作[1-2],而且没有一个较为精确的物品定位功能,也没有容错机制,若是设备找不到,只能通过实验室管理员到现场查找。在科技不断发展的今天,基于深度学习的图像识别技术为解决实验室设备管理问题提供了方向,但目前国内将这项技术应用于实验室设备识别和管理方面的研究和应用还较少。为了解决实验室设备管理及其图像识别问题,本文回顾和分析深度学习在图片识别方面突出的成果及其发展趋势,并对其在实验室设备管理方向的未来应用进行展望。

1 实验室设备管理的深度学习图像识别难点

从1924年心理学家McCulloch和Pitts提出MP神经元模型到Rosenblatt将单层感知器网络模型应用于实践,再到2006年深度学习之父Hinton教授提出的深度学习这一概念之后[3],深度学习经过十几年的快速发展,当今最受欢迎的深度学习模型有卷积神经网络CNN、深度自动编码器网络DAN、生成式对抗网络GAN、循环神经网络RNN和深度信念网络DBN等[4-5]。目前,深度学习在图像进行识别领域已经有了较为广泛的应用,如人脸识别、车牌识别和手势识别等。这些领域的实际应用给实验室设备的管理者提供了许多可以借鉴的经验,但是将图像识别技术应用于实验室设备管理还存在以下难点:

首先,目前深度学习技术大部分采用有监督训练方式,但是实验室设备种类多,更新快,导致将所有收集到的图片都进行标注的工作变得非常繁琐,这样使得有监督的训练模型难以实现。

其次,深度学习的设备图像识别技术,需要有庞大的训练集进行训练,才能精确的分辨外形相似的设备以及定位设备位置,但由于实验室设备有种类繁多,更新速度快等特点,这使得很难在实验设备入库之初就采集到足够的样本训练集,存在训练样本数量不足的问题。

2 无监督训练问题

无监督学习是指计算机在没有样本标签和标号监督的情况下进行学习的过程,在广义上分为自由组织学习与强化学习。在实际任务中,标记数据集耗费很高的人力和时间,无监督学习利用大量未标记的数据集来满足机器学习的训练量要求,故无监督学习的主要研究方向是如何利用好未标记的数据。其中自由组织学习是利用竞争性学习规则[11],网络化表达质量的任务度量,对那些正确的行为作出激励,对那些错误的行为进行抑制,让机器在这个过程中不断根据这个度量来优化自己的网络。强化学习的目的是将代价函数最小化,通过一些随机信息进行学习,做出最佳的行动,以获得最多的奖励,但存在机器所做出的反应不仅会对目前的奖励产生影响,还会对随后的动作和一系列的奖励产生影响。

在图像领域,通过引入了对偶学习,利用任务之间的反馈信息,就能克服模型对数据的依赖问题。例如Van Tulder等人的无监督深度学习模型玻尔兹曼机和Chen等人的对偶TriNet网络[6-7],但是目前只能应用于样本较为简单的模型。可见,结合对偶学习等技术采用无监督学习的图像识别技术可解决实验室设备图像识别标注繁琐的问题。

3 训练样本不足问题

目前,在深度学习中针对训练样本数量不足问题,常采用迁移学习和元学习方法解决。常见的卷积神经网络样本学习模式,致力于解决样本不足而导致模型过拟合等问题,简单的数据增强与正则化方式可以缓解,但是并无法缺少样本导致识别率低的问题。通过特征提取技术可以有效提高小样本下的图像识别率,利用注意力机制与记忆力机制[7],设计特征提取网路和分类器之间的映射关系,建立适应数据分布的特征提取模型。

3.1 迁移学习方法分析

迁移学习使卷积神经网络适应小样本数据,降低了参数和特征提取的消耗,直接迁移已经寻找到的具有相同特征的基类模型数据到新类模型,目前常用的迁移学习方法包括基于特征的、基于样本的、基于模型的和基于关系的。

基于特征的迁移学习由Chen等人在2019年提出[8],首先进行数据增强,提取和分类基类数据的特征,通过共同特征训练实现一个可用在基类数据与新类数据的分类器,最终实现将源域和目标域的特征变换到同一个空间。基于样本的迁移学习,其样本迁移对象包括源域和目标域,对象中样本相似度高的权重值给予高,相似度低的权重值给予低。基于模型的迁移学习,也叫基于参数共享的迁移学习,由于神经网络的结构可以直接迁移,因此其应用广泛,例如最经典的finetune、Oquab等人的微调策略和Qiao等人的激活功能层预测分类参数算法等[9-10]。基于关系的迁移学习比较关注目标域和源域之间的关系,其方法思路与其他方法截然不同,Hinton的知识蒸馏概念是用小网络模拟大网络[11],之后Kimura等人提出不同的提炼方法丰富和发展知识蒸馏[12]。

3.2 元学习方法分析

元学习是一种模仿人类学习模式的机器学习方法,早在1985年John Biggs将元学习定义为“了解并控制自身学习”。一般的元学习就是获取知识多功能性的能力,利用元学习,可以让机器通过学习获得学习经验,再利用这些经验来评估最终的目标任务。不同的元学习模型采用不同的技术,目前的常见的元学习类型有:基于度量的元学习、基于循环模型的元学习、基于优化器的元学习和基于小样本的元学习。

基于度量的元学习是为了实现一个高效学习度量空间,2015年Koch等人提出了一种用于字符识别的深卷积孪生网络[13],将度量元学习应用于分类问题。2018年,Bartunov等人设计了一种比余弦距离计算复杂度更高的生成性匹配网络GMN[14],实现了快速从小数据集学习新概念,不仅可以提高图像特征的表示能力,而且可以提高图像的多样性,同时也探讨了范畴之间的关系。基于循环模型的元学习适用于RNNs,算法将训练RNN模型依次处理先前的数据,然后再处理后面的数据,2019年Ren等人提出的将增量学习与元学习相结合的注意吸引网络AAN就是这种方法的一个例子[15]。基于优化器的元学习是一个神经网络将不同的优化应用于另一个神经网络,从而优化实现目标,例如Finn等人提出的模型不可知算法MAML[16]。基于小样本的元学习启发了记忆增强神经网络或单样本生成模型等技术的产生,核心是创建深层神经网络从简易数据中学习。

4 结语

综上,采用无监督学习的图像识别技术可解决设备图像识别标注繁琐问题;小样本学习在较为复杂的场景如人脸识别和车辆识别时,其应用效果并不理想,但在模式与背景较为简单的分类数据集上有较好的表现。针对采用有监督的训练模型存在标注图片繁琐和训练样本数量不足的问题,本文分析了无监督学习与小样本学习的图像识别技术在其他领域的应用及特点,在目前高校实验室设备种类多、环境单一和同类型设备较多情况下,采用无监督学习与小样本学习的图像识别技术可应用于实验室设备图像识别,是实现智能化实验室设备管理的突破点。

猜你喜欢
图像识别神经网络实验室
神经网络抑制无线通信干扰探究
基于Resnet-50的猫狗图像识别
高速公路图像识别技术应用探讨
电竞实验室
电竞实验室
电竞实验室
电竞实验室
图像识别在物联网上的应用
图像识别在水质检测中的应用
基于神经网络的拉矫机控制模型建立