王 晶,莫绪军,朱常玉
(品茗科技股份有限公司,浙江 杭州)
设计基于识别模型泛化能力提高的目标识别算法要充分分析当前跨域识别问题和需求,将统计学习作为基础,设定概率分布适配方法,着力解决传统目标识别方法中只能借助目标域数据的聚类结构分布适配的问题。运用结构化联合分布适配方法,建立条件联合分布模型,修正分布差异,以此保证算法具备高泛化能力。因此,下文将重点就目标识别算法模型构建与验证展开深入分析。
学习目标可分成降低源域损失ls(Xs,Ys)以及缩小目标域与源域数据分布距离d(Xs,Xt)两部分,所设计的学习框架为:
其中,函数框架的关键在于如何缩小d(Xs,Xt)数值[1]。根据条件分布距离和边缘分布距离,设定源域与目标域分别为Ds与Dt,所对应的概率分布分别为ps和同时分别为ps和pt采集样本,其中M 为样本维度[2]。设定特征变换函数,设计目标域数据与定义源域数据间的边缘分布距离公式为:
式中:φ 和i 分别代表目标域和源域样本数量。计算是将参数改变,能够得到最小值,此值即为边缘分布适配[3]。同理可得当存在目标域与源域样本标签是同时对应的目标域与定义源域条件分布距离公式为:
式中:λ为权重系数,且djoin(Xs,Xt)=dmar(Xs,Xt)+dcnd(Xs,Xt)。
基于目标识别泛化能力提高设计目标识别算法要引入SJDA 模型,经过优化,所得到的总体目标函数为:
第一、二项分别为源域识别损失函数和联合分布差异djoin=dmar+dcnd,θφ, θW,θcls为参数,λ 为权重系数。分别从训练预识别模型、预测结构化伪标签和优化整体目标函数方向对原有模型予以完善,最终得到的第二项形式为:
式中:μ 为惩罚因子,ht,hs代表从目标域和源域所提取的样本特征,来源于特征提取模块,且按照Lipschitz约束要求,Pgrad符合梯度惩罚项设置需要,满足为满足目标域与源域联合分布适配需求,应当保证联合分布差异取最小值,运用梯度下降法,调整参数,并循环迭代步骤:(1)执行迭代;(2)利用源域样本集合(Xs,Y)s优化式的第一项,初步学习fφ和fcls;(3)用伪标签预测算法为目标域样本Xt预测伪标签,达到收敛整个过程的效果[5]。
运用统计学习理论,估计并分析所设计目标识别算法的误差边界。假定识别模型f=F,使得,将其作为假设函数,其中为F 函数空间。设置识别模型的VC维为d,期望风险分别位于目标域和源域上,用符号εs(f)和εt(f)分别代表。并且设定目标域与源域的分布散度为dHΔH。由此,根据公式:
可以准确分析识别算法模型目标域与源域期望风险,其中,式中Ω、e、n 分别代表理想联合假设的期望风险、自然对数基底和训练样本数量[6]。
通过估计目标域与源域标签样本可得到期望风险,引入伪标签计算最终数值,以此近似等于真实情况下的联合假设期望风险。令作为目标域数据集合,nt表示样本与伪标签共同组成,代表无标签目标域样本数量。根据假设函数,其所对应的期望风险符合≤ρ关系,预测错误率用ρ 表示。最终形成的误差边界计算公式为:
本研究所设计的目标识别模型可从以下两方面达到优化效果:
(2)此种算法符合结构化伪标签预测算法,整体能够实现错误预测率降低的目标,可对不等式最后一项予以缩小。
总的来看,基于识别泛化能力所设计的目标识别算法具备可行性和正确性,能够展示出良好理论误差边界特性,满足跨域识别基本要求。
上文阐释了于识别泛化能力所设计的目标识别算法基本模型,为切实从严谨角度衡量此算法是否可行,需采取性能验证办法,在选定性能验证手段后,设置实验参数。经过计算,生成与其他方法对比的结果,从数据角度判定目标识别算法是否实用。性能评价与结果分析的具体过程如下:
运用通用跨域识别算法评估协议基本方法优化性能评价任务,设计12 组任务,分别为:C→I、I→C、C→P、P→C、C→B、B→C、I→P、P→I、I→B、B→I、P→B、B→P 和A→W、D→W、W→D、A→D、D→A、W→A、A→C、W→C、D→C、C→A、C→W、C→D。并使用平均准确率评价算法识别性能,对应的公式是:
式中:N、I 分别表示样本总数和指标函数。通过计算平均准确率均值判定算法性能,对应公式为:
式中:ntask表示跨域识别任务总数。
本研究设置10 次实验,将基于CNN、JDA、LCS 设计的算法性能验证结果与本研究所提出基于提高识别泛化能力的算法性能验证对比,结果于表1 和2 出示。
通过读表能够发现,基于识别目标泛化能力提高所设计的算法模型性能优越,相较于CNN 方法,此种算法可达到mAAc8.6%的提升,且准确率高于其他算法,具备泛化能力高的特点。另外,相对于CNN 方法,基于识别目标泛化能力提高所设计的算法在实际运用中,平均识别准确率降低了1.3%左右,该方式在具体运用中性能影响程度较低,在使用时整体性能超出了CNN 方法,在本次研究中通过网络学习特征关系,提升识别性能。除此之外,基于识别目标泛化能力提高所设计的算法在运用中超出了LSC 方式,主要是由于基于识别目标泛化能力提高所设计的算法在运用中具备域不变性的特征,模型的跨域识别性能得到了有效提高,可满足识别泛化能力需求。根据表2 实验结果分析,基于识别目标泛化能力提高所设计的算法中,SJAD、LSC、JDA 以及CNN 等目标识别算法的使用,对于识别性能所产生的影响存在差异性,可以在不同条件下合理运用以上方式,也表明了SJAD、LSC、JDA 以及CNN 技术的应用具有合理性与重要性。
表2 借助物体分类实验Office-Caltech 数据集各算法的实验对比结果(%)
根据以上实验表明,在对基于泛化能力的目标识别算法中,对各项技术提升泛化能力的贡献进行研究时,通过属性特征以及不同特征之间的关系,直观地表明了基于识别目标泛化能力提高所设计算法具备缩小数据域之间的分布差异,通过参数敏感性分析,对目标泛化能力研究中,全面验证了该方式在不同条件下具备适用性与稳定性,可在不同条件下加以运用。
综上所述,基于识别泛化能力提高要求,为达到跨域识别目标,引入SIDA 方法设计目标识别算法,最终得出公式为:的结论。经过误差边界估计与分析,确定此算法可行。同时,与CNN、JDA、LCS 设计的算法进行比较,得出此种算法具备泛化能力高特点的结论,证明此种算法可直接应用于跨域目标识别计算中,在目标识别算法设计领域具有研究前景。