关键词:相关向量机;机器学习;学习算法;算法研究;算法应用
中图法分类号:TP309 文献标识码:A
1前言
近年来,社会经济和科学技术都快速发展,机器学习也运用于诸多领域,并取得了良好的效果和作用。但与此同时,无论是时代发展还是现代社会大众,对机器学习的要求都在不断提升。因此,本文提出了一种基于相关向量机的机器学习算法。与传统的支持向量机相比,相关向量机能够体现数据中最核心的特征,以此为基础可以有效减少核函数的计算量。并且,相关向量机还能克服所选核函数必须满足Mercer的缺点,提升了机器学习的效果。
2关于相关向量机算法的描述
传统的SVM拥有诸多缺点:无法计算样本输出的后验概率分布;不太适用于多分类问题;超参数需要通过交叉验证得到,非常耗费时间;核函数必须正定。而相关向量机算法的出现和运用则有效克服了以上SVM的诸多缺点。另外,相关向量机算法的核函数可以进行任意指定,这也使其最终得到的解比传统的SVM更加稀疏。
RVM与SVM具有同样的模型:
假设模型的残差符合高斯分布,以此能够得到数据的极大似然估计:
而且,相关向量机算法是一种贝叶斯方法———需要给予其函数先验分布,并且是零均值不同方差高斯先验分布。在这种情况下,每一个参数都可以得到相对应的样本。在实际的研究过程中可以发现,随着参数的不断迭代、更新,其中一部分相对应值会逐渐趋于无穷大,对应的权值向量w则会无限趋于零,这意味着部分相对应的基函数会逐渐被“剔除”。因此,与传统的SVM相比,相关向量机算法的解具有稀疏性,这是其独特的优势之一。
3相关向量机算法的改进优化模型
3.1经典的相关向量机算法
首先,经典的相关向量机算法可以针对线性可分的情况进行分析。而对于线性不可分的情况,经典的相关向量机算法通过使用非线性映射算法,将低维输入空间线性不可分的样本转化为高维特征空间,使其线性可分,从而使高维特征空间采用线性算法对样本的非线性特征进行线性分析成为可能。
其次,基于结构风险最小化理论,在特征空间建构最优分割超平面,可以全局最优化学习器,并在整个样本空间的期望风险以某种概率满足一定上界。因此,目前支持向量机只适合处理小批量样本的任务。
3.2改进优化模型
一方面,相关向量机算法具有减少核函数计算量、稀疏性明显和学习效率比较高等特点,可以提升机器学习的水平;另一方面,相关向量机算法包含异常值相对敏感、噪声数据的影响比较大等缺点,会影响基于相关向量机的机器学习算法的现实应用。因此,我们需要注重对相关向量机算法的改进和优化。
有学者和专家推出了一种用于分类和回归的广义相关向量机模型,其继承了GLM统一模型结构的优势,并且提升了相关向量机算法的适用性,可以应对更加广泛的学习任务。经实际应用后也可以发现,分类和回归的广义相关向量机模型具备相对良好的综合性能。
另外,还有学者和专家推出一种具有噪音方差系数的相关向量机模型,其能够解决传统相关向量机算法存在的魯棒性比较差的问题。这一优化方式的核心思想是:在每一个训练样本中引入独立的噪声方差系数。由于在具体的训练过程中,异常值的噪声方差系数会逐渐减小,从而可以实现对异常值的自动监测和剔除,相关向量机算法也就有了较好的鲁棒性。
此外,还有学者和专家为了克服相关向量机算法的异常值敏感的缺点,提出了一种基于加权方案的相关向量机模型,其可以在训练的过程中进行自动计算。经过综合分析和计算之后可以发现,这一优化方式的性能表现始终优于传统相关向量机算法。因此,在后续的发展过程中,可以高度重视基于加权方案的相关向量机模型的应用、优化、完善,从而解决传统相关向量机算法存在的异常值敏感的问题。
4基于相关向量机的机器学习算法的具体应用阐述
基于相关向量机的机器学习算法解决以上两种问题的框架图如图1所示。
4.1故障检测中的具体应用
所谓故障检测,顾名思义就是运用不同的检查和测试方法,检查和发现系统、设备中是否存在故障情况。
其中,一种量子粒子群的启发式相关向量机算法在实际的应用过程中,可以针对相关向量机的参数实现优化处理。目前,在滚动轴承的故障检测过程中运用了这一机器学习算法——将预处理之后的轴承震动信号作为这一模型的输入向量,可以找到全局最优解参数。根据实际的故障检测结果来看,运用这一机器学习算法可以使分类的准确率达到90%左右。但是,其在故障检测中的运用也存在一定的不足——在学习、训练阶段需要花费的时间代缴比较高。而经过专家和学者再一次针对这一机器学习算法进行优化,相关向量机算法的分类能力进一步增强,且在更加精细化的工业领域得以运用。其中,包含乙烯裂解炉工艺和乙烯加热工艺过程等,具有较高的准确率和较低的阳性率,对工业生产工艺水平的提升效果非常显著。
4.2模式识别领域中的具体应用
模式识别指的是:通过计算机数学技术形成研究模式的自动处理和判读过程。目前,一种基于相关向量机的含噪声人脸图像识别算法运用了模式识别技术,它极大地拓宽了相关向量机的应用领域。相关向量机在模式识别领域中的运用,可以将ORL人脸库作为具体的训练样本和测试样本,通过二维小波交换和K?L变化提取对应的样本特征,这能够提高识别准确率和克服对图像噪声不敏感的缺点。在此基础上,为了进一步降低特征数量,通过对ORL、AR、YaleB和户外人脸库四种数据集的实验发现,人脸识别准确率进一步提升、人脸识别时间进一步减少。
4.3网络安全领域中的具体应用
基于相关向量机的机器学习算法在网络安全领域的应用具有较强的代表性,形成了高水平的入侵检测刺痛,这是一种基于软件的监控系统,可以对网络中是否存在恶意活动进行检测。但是,在实际的研究和分析过程中能够发现,基于相关向量机的机器学习算法在网络安全领域的运用还存在一定的不足。其中包含惩罚参数的设置受到人为因素的影响相对明显等问题,在这种情况下,可以采取一种基于粒子群优化的方式,使其形成对应的网络入侵检测模型。实验表明,上述模型的检测精确度能够达到95%左右,与传统的SVM、BPNN项目相比,这一模型具有较大优势,比较适合在网络安全领域进行运用。
5结语
基于相关向量机的机器学习算法与传统算法相比具有多种优势,但是同样存在一定的不足。在后续的发展过程中,需要不断对基于相关向量机的机器学习算法进行优化和完善,这样才能满足时代的发展和大众的需求。
作者简介:
罗远军(1971—),硕士研究生,讲师,研究方向:移动互联网、大数据、网络体系结构。