基于主动学习的图像分类协同训练模型研究

2021-12-17 02:02柳永春李娟
赤峰学院学报·自然科学版 2021年11期
关键词:样本实验组协同

柳永春 李娟

摘 要:在当前数量庞大的网络存储图像中,如何在过滤不相关信息的同时挖掘出具有价值的信息参量,已成为图像处理技术的主要研究内容之一。对此,提出一种基于主动学习的图像分类协同训练模型。定义图像样本的不确定性水平,通过计算边缘抽样系数指标的方式,建立主动型分类核函数定义项,实现基于主动学习的图像分类处理。在此基础上,提供稳定的参数服务器配置环境,按照协同加速比的数值需求,确定收敛训练指标的具体计算数值,完成基于主動学习的图像分类协同训练模型研究。在面对等量存储图像数据时,协同训练模型比传统向量机模型的信息过滤速度更快,所挖掘出信息参量的价值潜力更大,可较好解决基于图像处理技术的实用性问题。

关键词:主动学习;图像分类;协同训练;样本不确定性;抽样系数;核函数;参数服务器;加速比

中图分类号:O212;TP391  文献标识码:A  文章编号:1673-260X(2021)11-0003-04

0 引言

主动学习是机器学习算法的特殊表现方式,能够在解决类别归属问题的同时,给予大量的数据样本,并借助不同的处理模型,对这些样本信息进行分类处理,从而生成多个不同的门限判别条件。互联网空间中,每一个数据样本都有其直属的信息类别,且通常情况下,每个信息类别中可包含多个数据样本,但一个数据样本却只能属于一种信息类别[1,2]。若将主动学习算法看作是从“数据”到“类别”的函数映射关系,则可根据机器学习理论中的数据定义思想,对信息参量进行分类处理,从而使得无类别数据的学习准确率水平得以大幅提升。

由于互联网空间的多样性存储能力,在实施图像信息存储指令时,极容易因不合理的信息过滤关系,从而导致有价值信息的挖掘准确性下降。传统向量机模型以簇间通信协议为基础,在跨越第三方网络主体的同时,降低图像信息训练所需的簇间通信量水平,从而使得有价值信息得以暴露。然而,此方法在信息过滤方面的处理速度较慢,并不具备较强的信息挖掘潜力。基于此,引入主动学习算法,通过定义图像样本不确定性条件的方式,建立新型的图像分类协同训练模型,并在主动分类核函数的作用下,完成对参数服务器的准确配置。

1 基于主动学习的图像分类处理

图像分类处理作为协同训练模型搭建的基础处理环节,由样本不确定性分析、边缘抽样系数计算、主动分类核函数定义三个步骤组成,在主动学习算法支持下,具体操作流程如下。

1.1 图像样本不确定性

图像样本是对网络图像存储能力的描述,在主动学习算法的支持下,图像样本空间就越大,与之匹配的网络图像存储能力也就越强。图像样本不确定性是一种泛化应用能力,在图像样本的空间中,相邻的两个图像数据虽然具备无限接近的能力,但却始终不会完全地解除,因而越大图像样本空间,其中的样本不确定性能力也就越弱[3,4]。基于主动学习算法的图像样本选择能够较好避免不确定性条件对于互联网存储能力的影响,且整个存储过程中的所有指令行为都保持主动性的能力。因此,无论图像样本空间的增大或减小,主动学习算法都能较好稳定有价值信息参量的传输与应用能力。规定?字代表图像样本空间中的信息度量值,P?字代表度量值为?字时的图像样本存储量,联立上述物理量,可将基于主动学习算法的图像样本不确定性条件定义为:

1.2 边缘抽样系数

边缘抽样是主动学习算法中的惯用处理手段,由于图像样本不确定性条件的存在,该项处理行为能够直接决定图像分类的最终执行结果。当所处图像信息空间较大时,边缘抽样系数的实值结果也会随之增大;而当图像信息空间较小时,边缘抽样系数的实值结果也会随之减小[5,6]。换句话说,边缘抽样系数是一个灵活性较大的指标参量,能够干预图像分类的实际处理行为,且随着图像样本不确定性能力的减弱,受到主动学习算法影响的图像有价值信息量也会逐渐增大,这也是边缘抽样系数能够在一定程度上决定图像分类处理行为方向的主要原因[7]。设?琢代表有价值图像信息的抽样参量值,?着代表主动学习算法的抽样参量值,联立公式(1),可将图像分类的边缘抽样系数表示为:

1.3 主动分类核函数

主动分类核函数决定了主动学习算法的实际应用能力,在允许图像样本不确定性条件存在的情况下,网络主机往往需要同时存储大量的图像样本数据,而随着边缘抽样系数的增大,核函数所属的范围区间也会不断提升,直至主动学习算法能够完全负担图像样本数据的实际存储需求。若已知边缘抽样系数的准确计算数值,则可按照主动学习算法的具体要求,对已存储图像样本数据所处空间进行安排,一方面为后续图像分类与协同处理提供信息参量支持,另一方面也可避免已存储图像数据出现明显的堆积行为[8,9]。设i1代表第一个图像信息分类条件,in代表第n个图像信息分类条件,联立公式(2),可将基于主动学习算法的分类核函数定义为:

2 图像分类协同训练模型的应用

遵循主动学习算法的具体应用需求,按照参数服务器配置、协同加速比确定、收敛训练指标计算的处理流程,完成图像分类协同训练模型的设计与搭建。

2.1 参数服务器配置

参数服务器是网络环境中的重要应用元件,可负担与图像信息相关的分类协调处理任务,并且可在执行任务指令的同时,记录各级训练节点所处的实时位置。参数服务器位于网络结构体的顶层应用组织中,可在主动学习算法的作用下,向下级服务器传达与图像信息相关的数据处理指令。由于服务器内部包含多条数据传输通道,因此这些信息处理指令的最终传输位置并不局限于单一的协同训练节点[10,11]。一般情况下,一个训练节点中必须完整包含一个协同训练模型与多类型的图像数据信息,前者负责执行参数服务器的核心处理指令,后者则可借助其他空余信道进入相应的模型空间进行长期存储。

2.2 协同加速比

随着网络存储图像信息量数值的提升,主动学习算法的作用能力也在逐渐增强,一般的参数服务器可能没办法完全满足图像的分类与协同训练处理需求。因此,网络主机可将这种期望放置于图像信息集群之上[12,13]。设m0代表加速前的图像信息单位处理量,m1代表加速后的图像信息单位处理量,联立公式(3),可将图像分类的协同加速比定义为:

 2.3 收敛训练指标

收敛性是图像信息在网络存储环境中所具备的关键训练能力,在已知协同加速比数值的情况下,可认为收敛性能力越强,参数服务器所具备的图像信息分类能力也就越强。收敛训练指标是一类边缘化应用变量,其定义过程受到多个干扰条件的影响,但由于主动学习算法的存在,该项物理量的数值水平也基本不具备无线扩张的变化能力[15,16]。限定一个定值空间作为图像信息的存储环境,往往随着协同样本数量的增大,计算所得的收敛训练指标数值才会不断减小,直至能够与协同加速比数值保持相对匹配的参数影响关系。设v0代表图像信息的最小存储系数,?茁代表协同数据信息的固定提取条件,联立公式(4),可将收敛训练指标计算结果表示为:

3 实验结果分析

为了验证提出的基于主动学习的图像分类协同训练模型的应用性能,将提出的基于主动学习的图像分类协同训练模型设置为实验组,将传统向量机模型设置为对照组,进行单位时间内的图像信息过滤速度的对比测试,和QRP指标变化规律的对比测试。配置实验检测环境,分别将实验组主机、对照组主机与核心网络控制器相连,实验参数如表1所示。

在互联网环境中提取两组等量的图像数据信息作为实验对象,分别将其输入实验组与对照组控制主机中,确保其他外界干扰条件始终保持不变,记录相关实验指标在既定时间节点处的真实数值水平。

3.1 单位时间内的图像信息过滤速度测试

单位时间内的图像信息过滤速度可用来表示为网络主机对于图像数据的存储能力,当信息过滤速度较快时,网络主机往往具备较强的图像数据存储能力;而当信息过滤速度较慢时,网络主机则具备较弱的图像数据存储能力。实验时间为50min,以每10min作为一个检测时间段,共分为5组实验组别,检测实验组与对照组在不同时间内的图像信息过滤速度,并记录了实验组、对照组图像信息过滤速度的具体数值表现情况,如表2所示。

由表2可知,在以10min作为一个检测时长的5组实验组中,实验组图像信息过滤速度值在每一个单位时长中,均保持相对稳定数值存在的状态,只有第二、第三与第四、第五个单位时长之间,出现了较为明显的数值下降变化趋势,最小速度值6.2Mb/s,最大速度值7.3Mb/s;对照组图像信息过滤速度在每一个单位时长内的数值变化趋势均不相同,在第二、第三与第三、第四个单位时长之间,产生了明显下降的变化状态,最小速度值3.1Mb/s,最大速度值4.0Mb/s。对比实验组的检测结果,对照组的整体均值水平远远低于实验组数值,说明基于主动学习图像分类协同训练模型的应用,加快了图像信息的过滤速度,单位时间内的图像信息过滤速度较快,促进了网络主机对于图像数据的实际存储能力。

3.2 QRP指标测试

QRP指标可以描述网络主机挖掘出图像信息参量所具有的价值潜力。一般情况下,QRP指标所表现出的数值水平越高,网络主机挖掘出图像信息参量所具有的价值潜力也就越大,二者之间始终保持一种正相关性影响变化关系。因此,对实验组与对照组进行QRP指标的测试,分为两个实验阶段,分别为0-25min时间段和0-25min时间段,并记录实验组与对照组QRP指标数值的实际变化情况,如图2所示。

结合图2所示的实验结果可知,在本次实验的两个时间段测试中,在0-25min的实验阶段内,实验组QRP指标曲线大部分位于对照组曲线上端,也有小部分位于对照组曲线下端,实验组QRP指标的最高值为87.1%,高于对照组最高值80.3%;而在30-55min的实验阶段内,实验组QRP指标曲线完全位于对照组曲线上端,实验组QRP指标的最高值为89.7%,高于对照组最高值52.4%。根据两个测试时间段的QRP指标测试结果,实验组QRP的最高指标为87.1%,远高于对照组的QRP最高指标为80.3%,提高了9.4%。由此可以说明,应用分类协同训练模型后,QRP指标的最大表现数值出现了明显上升的变化趋势,能够适应挖掘具有巨大价值潜力图像信息参量的应用现状。

4 结束语

随着主动学习算法的应用,图像分类协同训练模型在网络存储空间中,可有效过滤不相关信息,从而挖掘出更具价值的信息参量,由于图像样本是在具备较强的不确定性,因此只有在已知边缘抽样系数的条件下,才能建立稳定的主动分类核函数定义式。从全局化角度来看,这种新型协同训练模型更能适应网络空间对于图像数据信息的实际存储需求,与传统向量机模型相比,实用性能力更强。

参考文献:

〔1〕杨承文,李吉明,杨东勇.基于深度贝叶斯主动学习的高光谱图像分类[J].计算机工程与应用,2019, 55(18):166-172.

〔2〕王立国,刘佳俊.结合边缘采样与差分进化的高光谱图像半监督协同分类框架[J].黑龙江大学自然科学学报,2020,37(01):96-102.

〔3〕张银芳,于洪,王国胤,等.一种用于数据流自适应分类的主动学习方法[J].南京大学学报(自然科学),2020,56(01):72-78.

〔4〕奚东升,郭建勋,薛飞.基于激光雷达扫描的输电空间三维数据协同方法[J].电子设计工程,2020, 28(24):57-60+65.

〔5〕汪敏,武禹伯,闵帆.基于多种聚类算法和多元线性回归的多分类主动学习算法[J].计算机应用,2020,40(12):31-38.

〔6〕吴建,许镜,丁韬.基于集成迁移学习的细粒度图像分类算法[J].重庆邮电大学学报(自然科学版),2020,32(03):128-134.

〔7〕余传明,王峰,安璐.基于深度学习的领域知识对齐模型研究:知识图谱视角[J].情报学报,2019,38(06):89-102.

〔8〕王占云,闫志华.一种基于深度学习的产品分类统计方法的研究[J].机械设计与制造,2020,349(03):170-173.

〔9〕解冰.一种基于选择性卷积特征和最大后验高斯混合模型的细粒度图像分类算法[J].华东理工大学学报(自然科学版),2019,45(05):789-794.

〔10〕韓嫚莉,侯卫民,孙靖国,等.基于PCA与协同表示的高光谱图像分类研究[J].电子科技大学学报,2019,48(01):117-121.

〔11〕李明俊,张正豪,宋晓琳,等.基于一种多分类半监督学习算法的驾驶风格分类模型[J].湖南大学学报(自然科学版),2020,47(04):10-15.

〔12〕王鑫,李可,宁晨,等.基于深度卷积神经网络和多核学习的遥感图像分类方法[J].电子与信息学报,2019,41(05):1098-1105.

〔13〕高子翔,张宝华,吕晓琪,等.基于自适应池化的双路卷积神经网络图像分类算法[J].计算机工程与设计,2019,40(05):1334-1338.

〔14〕高原,陈爱斌,周国雄,等.基于OctConv的DCNN在遥感图像场景分类中的应用[J].电子测量与仪器学报,2020,34(01):66-72.

〔15〕林聪.标准化病人教学模式在普外科临床教学中的应用效果观察[J].饮食保健,2020,7(05):276-277.

〔16〕杨楠,叶迪,林杰,等.基于数据驱动具有自我学习能力的机组组合智能决策方法研究[J].中国电机工程学报,2019,39(10):2934-2945.

猜你喜欢
样本实验组协同
家校社协同育人 共赢美好未来
融合创新 协同发展
论下肢力量训练对拉丁舞的重要性
SHR主动脉结构重构的microRNA—195和BCL2、Bax作用机制
京津冀协同发展
直击高考中的用样本估计总体
趣味 “课课练”对城镇小学四年级肥胖男生的体重和BMI的影响
随机微分方程的样本Lyapunov二次型估计
也议对照实验中的“对照组”和“实验组”
基于支持向量机的测厚仪CS值电压漂移故障判定及处理