崔鹏
摘 要:半监督学习研究主要关注当训练数据的部分信息缺失的情况下,如何获得具有良好性能和推广能力的学习机器。本文我们提出了一种基于核优化的半监督学习框架,将数据嵌入到高维特征空间,从而与线性分类器等价。在核的设计上,采用了基于谱分解的无监督核设计,提出了学习边界,通过最小化边界来获得最优核表示。通过实验,对不同的核方法进行了比较,证明了我们结论的正确性。
关 键 词:谱特征分解;核;半监督学习;监督学习;降维
中图分类号:TP301.6 文献标识码:A
1 引言
谱图法已成功用于聚类和半监督学习。半监督学习是一种利用标记与无标记训练样本的分类器,能很好地解决具体问题,但在[1,3]中并没有明确图半监督学习与标准监督核学习的关系。在[4,5]中的谱图设计中,也没给出图学习的公式。本文提出了一种与监督核学习等价的关于图的核学习公式,可将这些基于图的半监督学习法视为利用无标记数据的核设计法,设计的核可在标准监督学习情况下使用。
2 标准监督核学习
3 图半监督学习
4 谱与核优化
4.1 谱特征分解与泛化
4.2 谱核优化设计
为获得最佳性能,可使用一种带有更快衰减特征值的核。当输入特征受到少量随机噪声影响时,K的特征值会变得单一,而合理目标函数的谱系数受到较少的影响。如果输入数据受到噪声破坏,则目标函数的谱系数可能比原始核的谱系数衰减地更快,因而使用一个衰减更快的谱是很有帮助的。可使用交叉校验来优化核。另一种方法是优化一个可导致半正定的学习边界。我们关注能获得降维效果的核,将核标准化,并使K/m=∑jμjujujT,其中0≤uj≤1。在不同的图拉普拉斯方程采用的函数,用标准化的高斯核作为初始的核K,分析表明降维效果是重要的,而不是与图拉普拉斯有关联。其它的核也可获得类似的降维效果(但与图拉普拉斯无关),也能提高性能。
5 结论
通过研究图的监督学习法,构建核学习公式,使得图半监督学习法与监督核学习法等价,获得了图学习的泛化范围;分析解释了修改原始核特征值有助于达到降维效果;对得到优化特征值衰减的范围,将是一个有意义的研究方向。
参考文献
[1] 张建波,朱敏琛.基于监督学习的核拉普拉斯特征映射分类方法[J].福州大学学报(自然科学版),2011,39(1):49-53.
[2] 李明,杨艳屏,占惠融.基于局部聚类与图方法的半监督学习算法[J].自动化学报,2010,36(12):1655-1660.
[3] 张亮,等.基于局部尺度转换的拉普拉斯核方法[J].计算机工程,2011,37(8):202-206.
[4] 赵凤,等.半监督谱聚类特征向量选择算法[J].模式识别与人工智能,2011,24(1):48-56.
[5] 贾建华,焦李成.空间一致性约束谱聚类算法用于图像分割[J].红外与毫米波学报,2010,29(1):69-74.