训练样本
- 基于互邻信息的树型近邻分类方法
类算法输入:训练样本集(X1,X2,…,Xn),训练样本的类别标签(C1,C2,…,Cn),测试样本Y,测试样本的k值。输出:测试样本的预测标签L。①计算测试样本Y与训练样本集(X1,X2,…,Xn)之间的距离(D1,D2,…,Dn);②根据距离(D1,D2,…,Dn)的递增关系完成排序;③选取距离最小的k个样本(X1,X2,…,Xk)以及对应的类别标签(C1,C2,…,Ck);④计算k个样本所属类别的出现频率;⑤返回k个样本出现频率最高的类别作为测试样本
南京理工大学学报 2023年2期2023-05-24
- 叶分量分析(LCA)在静态图像识别中的应用①
始化过程中将训练样本的类标号赋给该叶分量,通过训练样本的叶分量和测试样本的叶分量进行对比,将训练样本的叶分量类标号赋予与其最为接近的测试样本的叶分量,从而判定测试样本对应的具有标号的类,从而可以达到模式识别的目的。模式识别过程如图2所示。图2 本文模式识别过程2 人脸图片样本识别结果2.1 样本来源与分类此以ORL人脸数据(http://download.csdn.net/detail/kyszp123/1583590)作为研究对象,包括400幅不同脸部姿
佳木斯大学学报(自然科学版) 2022年4期2022-08-23
- 基于对抗推演的训练样本生成框架
发展的核心是训练样本数据,缺乏高质量强对抗的训练样本数据支撑。为了有效解决上述问题,本文提出了基于对抗推演的训练样本数据生成框架,建立了训练样本分类体系,提出了军事目标图像、目标航迹等典型训练样本表征模型;建立了基于对抗推演的的训练样本生成框架,提出了基于规则与微分方程求解相结合的智能空战训练样本生成方法,依据红蓝双方的行为决策模型,开展对抗式仿真推演,积累训练样本数据。生成的训练样本数据一方面,用于军事智能目标识别、情报处理、智能态势认知、智能指挥决策等
火力与指挥控制 2022年4期2022-07-25
- 基于隶属度的模糊加权k 近质心近邻算法
过已知类别的训练样本寻找待测样本的k个近邻,将k个近邻中出现频率最高的类别作为待测样本的类别。由于KNN 算法具有理论简单、易于操作等优点,被认为是数据挖掘中最简单的方法之一[13]。但是,KNN 算法也存在不足:第1 个问题是它没有考虑样本的分布,当样本分布不均匀或样本中存在噪声样本时,分类精度会明显下降;第2 个问题是所有训练样本具有同等重要性,判断待分类样本的类别时没有考虑k个近邻的区别;第3 个问题是使用单一的多数投票原则进行分类决策。以上3 个问
计算机工程 2022年7期2022-07-14
- 基于条件变分自编码器的射线样本生成算法*
络的射线数据训练样本数为5 900(该样本是从所有,即59 000 个样本中,挑选出并能代表整体样本特征的样本集),预测样本数为1 000。将预测误差>10%的用户称为高误差用户,预测误差≤10%的用户称为普通用户。将输入预测样本到训练好的BP 神经网络中得出的信道幅值与系统级仿真得出的信道幅值相比,会发现存在较多的偏差。通过观察BP 神经网络的预测结果可以发现,预测误差较大的高误差用户普遍与训练集中训练样本的相似度较低。故根据预测用户与训练集之间的余弦距
通信技术 2022年4期2022-05-10
- 基于输出信杂噪比的机载雷达训练样本选择算法
[3-4],训练样本的杂波特性可能与CUT 不一致,导致利用训练样本对CUT 的CCM 的估计精度降低,从而使STAP性能恶化。为解决非均匀训练样本对STAP 性能的影响,研究者提出了一系列非均匀检测器,用于剔除非均匀样本。基于广义内积(generalized inner product,GIP)的训练样本选择算法可用于非均匀训练样本的筛选[5],然而GIP 算法采用样本协方差矩阵表征CUT 杂波特性,并不能直接表征CUT 本身的杂波特性,因此所选择的样本
电子科技大学学报 2021年5期2021-10-13
- 回波功率筛选与数字地表分类数据辅助的低空风切变风速估计方法
距离单元作为训练样本对待测距离单元的杂波协方差矩阵进行估计,进而得到一个最大似然准则下的最优滤波器[9],但在雷达的实际工作环境中,由于地表起伏等原因,不同的训练样本之间很难满足独立同分布的条件,同时不同距离单元的杂波回波功率存在严重的非均匀性,导致估计得到的杂波协方差矩阵失配,无法充分抑制强杂波,严重影响风速估计结果的准确性。围绕非均匀杂波环境下的STAP问题,研究者开展了大量的研究,提出了很多具有重要意义和实际应用价值的杂波抑制算法,主要包括功率选择训
电子与信息学报 2021年8期2021-08-26
- 广义近邻选取的KGNN 改进算法研究
足够近的那些训练样本,即只使用了输入样本的近邻信息,可以看作是一种单向选择过程。在实际应用中,训练样本的近邻信息对于分类判决同样具有重要作用,它们的近邻也可以被用来判断它们与输入样本之间的邻近性[1]。因此,为了同等地考虑输入样本和训练样本的作用,提出一种双向近邻选择方法,即K 广义近邻(KGNN,k-general nearest neighbor)算法[2]。算法的基本思想是:寻找输入样本的K 近邻训练样本,采用K 近邻包含输入样本的训练样本作为广义近
河北软件职业技术学院学报 2020年4期2020-12-21
- 一种半监督人脸数据可分性特征提取方法∗
接对人脸数据训练样本进行特征提取,存在以下问题:1)训练样本过少,造成类内散布矩阵奇异,无法求解;2)无法利用无类标样本,即不能提取出无类标样本中的可分性信息;3)原始数据维数过高,使得特征提取速度慢;4)单一的可分性特征提取方法,导致效果不理想,数据在LDA 特征子空间识别率较低。为提高人脸数据的识别率和识别速度,本文提出一种结合SCC 和LDA 的人脸数据半监督可分性特征提取方法——SCC-LDA。SCC-LDA 先采用SCC 获取保留人脸数据固有空间
计算机与数字工程 2020年7期2020-10-09
- 极坐标变换下的基于表示的分类方法
测试样本能被训练样本(近似)线性表示,并通过求最小表示误差来对测试样本进行分类. 早在2007 年,文献[1]提出一种基于回归分析的分类方法,该方法的基本思想与Naseem 等[2]在2010 年提出的著名的线性回归分类器(Linear Regression Classification,LRC)相似. 2009 年,Wright 等[3]提出了稀疏表示分类器(Sparse Representation Classification,SRC).文献[4]提
五邑大学学报(自然科学版) 2020年3期2020-09-14
- 基于多样本扩充的卷积神经网络人脸识别算法*
样本作为新的训练样本集,输入CNN网络得到更新权值,然后通过目的训练样本集训练CNN提取更多隐藏的人脸图像特征,最后使用支持向量机SVM(Support VectorMachine)[13]特征提取后进行分类。SVM在解决小样本、非线性和高维模式识别问题具有良好的性能。该算法与其他算法不同之处在于:1)在镜像图的基础上,利用平滑中值样本构造新的虚拟样本作为新的训练样本集;2)新的训练样本集输入CNN网络得到更新的权值,训练CNN网络更好地进行特征提取;3)
计算机与数字工程 2020年4期2020-06-18
- 基于英语翻译应用视角下的计算机智能校对系统开发研究
智能校对; 训练样本中图分类号: TP311 文献标志码: AResearch on the Development of Computer Intelligent Proofreading SystemBased on the Perspective of English Translation ApplicationSUN Rui(Xian Innovation College, Yanan University, Xian 710100)A
微型电脑应用 2020年2期2020-05-11
- 人工智能
林;决策树;训练样本中图分类号:TP18 文献标志码:A 文章编号:2095-2945(2020)06-0151-02Abstract: This paper gives an in-depth and brief introduction of the random forest system, which is a commonly used artificial intelligence algorithm, intro
科技创新与应用 2020年6期2020-02-29
- 应用于小样本的差异字典人脸识别
]。一是由于训练样本存储空间的有限性所致,二是因为在较短的时间内难以取得大量的训练样本。测试人脸具有难以预测的光照、面部表情和姿势变换,使得人脸识别的准确度仍需提高。因此,为了应对这些挑战,许多研究人员将注意力集中在小样本问题上,并且设计了许多相应的方法。其中大多数研究者使用生成虚拟样本的方法以解决样本不足的问题。如Hao Zhang等使用正脸和非正脸的角度变化来生成虚拟训练样本[2],Yong Xu等提出的生成镜像脸以扩充训练样本的算法[3],和Ning
计算机工程与设计 2020年1期2020-02-08
- 基于稀疏恢复的MIMO-STAP离散干扰抑制方法
需独立同分布训练样本数至少为2倍系统自由度。然而,雷达的工作环境复杂、多变,在不同距离单元可能存在着除探测目标以外的其他运动目标,这些运动目标会对训练样本形成离散干扰。离散干扰的存在会导致实际环境中杂波分布的非均匀性更加严重,使得用于估计杂波协方差矩阵的训练样本很难满足要求。针对训练样本存在的离散干扰问题,一般有两种解决思路:一为研究训练样本挑选方法,将存在离散干扰的训练样本直接剔除;二为直接数据域法,只使用待检测距离单元的数据,完全避免训练样本中离散干扰
探测与控制学报 2019年6期2020-01-08
- 结构化加权稀疏低秩恢复算法在人脸识别中的应用
的字典,消除训练样本中的遮挡带来的影响,但是并没有考虑到测试样本中存在遮挡的情况。如果测试样本中也存在遮挡且没有通过算法被有效地移除,也将导致测试样本无法正确分类,会对实验结果产生很大的影响。针对样本中存在污染的问题,本文提出一种结构化加权稀疏低秩恢复算法。该算法在原始低秩表示的基础上对低秩系数进行了加权和结构化稀疏约束,可以得到一个结构化的判别低秩系数,而且同类样本的表示系数会有更强的相关性。跟上述方法不同的是,受到Chen等[19]提出的DLRR(di
智能系统学报 2019年3期2019-05-22
- 局部稀疏表示的鲁棒PCA人脸识别
鲁棒。而且对训练样本有一定的依赖性。近年来一种对遮挡鲁棒的RPCA[5,6]算法被提出,实验表明RPCA在图像恢复、聚类等方面也效果显著。在文献[6]中Luan等提出通过RPCA将测试样本分解成低秩和误差人脸,最后分析误差人脸,构建平滑因子和稀疏因子用于人脸的识别。然而当字典较大时,低秩分解会变得更复杂。针对此问题我们提出一种局部稀疏表示的鲁棒PCA人脸识别算法。受稀疏表示的影响,本文提出用稀疏系数来选取临近样本组成新的字典,即选取前K个稀疏系数绝对值和最
微型电脑应用 2019年4期2019-04-26
- 基于镜像脸的FLDA单训练样本人脸识别方法∗
的,充分利用训练样本的类别信息,寻找到最有助于分类的投影方向子空间。FLDA不仅可以实现将高维数据降低到低维,而且可以尽可能地分离不同类的样本特征,并尽可能压缩相同的类样本特征。通过将其应用于脸部识别,Belhumeur[11]提出了的 Fisherface算法,即首先采用PCA将高维数据降维,然后运用FLDA提取面部判别特征,相关研究表明基于FLDA算法在实现分类与识别时效果将大大超过PCA算法[13]。使用FLDA进行特征提取很大程度上取决于由训练样本
计算机与数字工程 2019年1期2019-03-01
- 适用于海量负荷数据分类的高性能反向传播神经网络算法
效果,其根据训练样本不断迭代更新网络参数,具有良好的学习和容错能力,且不受负荷成分和特性限制,具有描述复杂动态行为方面的优势。其中,反向传播神经网络(back propagation neural network,BPNN)算法作为神经网络训练采用最多、也是最成熟的分类算法之一,具有极强的函数逼近与模式分类能力,在负荷模型辨识中应用广泛。文献[5]提出了一种基于模糊聚类与改进的反向传播(BP)算法的负荷特性曲线分类方法,在C-均值聚类得到典型负荷曲线后,结
电力系统自动化 2018年21期2018-11-26
- 最大似然分类的训练样本敏感度研究
根据是否需要训练样本,遥感影像分类方法分为非监督分类和监督分类。非监督分类是在没有先验类别知识的情况下,根据图像自身的统计特征以及自然点群的分布情况来划分地物类别的分类技术[2]。监督分类是以建立的统计识别函数为理论基础,依据典型的样本训练方法进行分类的技术,例如最小距离法、最大似然法和神经元网络分类法等[3]。相比非监督分类,监督分类不仅能确定分类类别,而且具更高的精度。在监督分类中,样本的选取对分类结果的精度十分重要。许多学者从样本数量和质量等方面,分
中国农业信息 2018年2期2018-07-28
- 基于稀疏样本选优的机载雷达动目标检测算法
协方差矩阵的训练样本充足、满足独立同分布(independent and identically distributed,IID)时才不会影响动目标的检测性能。然而,机载雷达实际工作在非均匀环境中,上述条件很难满足。当训练样本中存在干扰目标时会引起信号相消,造成漏警,降低对动目标的检测性能。针对此问题,学者们提出利用非均匀检测器(nonhomogeneous detector,NHD)[5]来检测训练样本中是否含有干扰目标,对含有干扰目标的训练样本加以剔除
系统工程与电子技术 2018年5期2018-04-26
- 基于先验信息稀疏恢复的非均匀样本检测方法
(IID)的训练样本来估计杂波协方差矩阵。然而,杂波环境并不是理想的,而是非均匀的、非平稳的,尤其是当训练样本被干扰目标(运动目标或者强散射点)污染时,将会引起杂波协方差矩阵估计不准,进而导致目标信号自相抵消[3]。为了解决样本非均匀导致STAP目标检测性能下降的问题,必须要剔除被干扰目标污染的训练样本。广义内积(GIP)方法[4-5]作为一种典型的非均匀检测器(NHD),可以用来剔除非均匀环境中被污染的训练样本,但是当训练样本中包含的被污染样本数比较多时
兵工学报 2018年2期2018-03-20
- 基于常数矩阵改进的SRC算法
该样本在所有训练样本构成的字典上的稀疏系数,之后利用稀疏系数与训练样本重构测试样本,最后将测试样本分配给重构误差最小的类别。SRC算法可以直接利用原始像素进行人脸识别,从而避免了预处理的过程。除此之外,SRC算法对表情变化、图像遮挡具有一定程度的鲁棒性。但是,在将稀疏表示人脸识别算法应用于实际中,常常需要在两个方面进行改进。首先,是要突破人脸图像对齐的假设,因为在实际环境中人脸的图像是不对齐。但是更重要的是,在实际环境中,常常会发现可用的训练样本非常稀少。
现代计算机 2018年3期2018-03-15
- 支持向量机研究综述
两类分类对于训练样本是线性可分的情况,即只要一个超平面H就能正确划分所有训练样本的类别。给定一个训练样本(G1,a1),(G2,a2),…,(G1,a1),其中,G1∈Rn,i=1,2,…,l,a1 ∈{-1,+1}是Gi对应的类别,则线性可分两类分类支持向量机求解下列问题:3.有向无环图分类有向无环图分类是在一对一分类方法的基础上提出的。对于类别数量为M的训练样本,与一对一分类方法类似地,有向无环图方法构造M(M-1)/2个两类分类支持向量机,每个两类分
知识窗·教师版 2018年12期2018-02-22
- 基于结构化低秩表示和低秩投影的人脸识别算法*
思想是将所有训练样本作为字典,得到测试样本在字典矩阵上的编码系数,然后通过最小残差法分类。SRC处理遮挡或随机像素破坏时在原始字典上添加了单位矩阵作为遮挡字典,这样可以很好地处理测试样本中存在的遮挡和像素破坏。然而,当样本维数比较高时,SRC的时间复杂度随之升高。为了解决这个问题,Yang等人[6]提取图像的Gabor特征,然后对遮挡部分进行字典学习,这样遮挡字典的规模会降低,加快了稀疏编码的速度。Ou等人[7]提出了遮挡字典学习方法,使得测试样本在原始训
计算机工程与科学 2018年1期2018-01-26
- 基于自步学习的加权稀疏表示人脸识别方法
本相差较大的训练样本,并且没有考虑到表示系数的局部信息,从而导致分类结果不稳定。提出一种基于自步学习的加权稀疏表示算法SPL-WSRC,在字典中有效剔除与待测样本相差较大的训练样本,并利用加权手段考虑样本间的局部信息,以提高分类精度和稳定性。通过3个典型的人脸数据集中的实验,实验结果表明,所提算法优于原稀疏表示算法SRC,特别是当训练样本足够多时,效果更明显。基于稀疏表示的分类方法;分类;自步学习; 加权系数;人脸识别0 引言人脸识别作为模式识别中最为典型
计算机应用 2017年11期2018-01-08
- 基于分水岭的图像分割训练样本的自动选择和标注
岭的图像分割训练样本的自动选择和标注张荣1,张烁2(1.山西医科大学,山西 太原 030001;2.山西青年职业学院,山西 太原 030032)图像分割是图像理解、模式识别、计算机视觉等研究方向的一个重要研究内容。图像分割的方法有很多,将支持向量机(Support Vector Machine,SVM)应用于图像分割已是一种较为广泛的分割方法,但该方法大多采用人工方式来选取训练样本,降低了图像分割的自适应性,且有可能影响图像分割的质量,因此基于支持向量机的
山西大学学报(自然科学版) 2017年4期2018-01-02
- 训练样本不足时的子空间信号检测方法*
10046)训练样本不足时的子空间信号检测方法*杨 星1,王利才2,杨 洋3,王鹤磊2,刘维建**2(1.解放军94402部队,济南 250022;2.空军预警学院 黄陂士官学校,武汉 430019;3.解放军驻720厂军事代表室,南京 210046)为了解决训练样本不足时的子空间信号检测问题,提出了两种有效的降秩检测器。基于主分量分析(PCA)的思想,先把常规自适应子空间检测器中采样协方差矩阵(SCM)的求逆运算用噪声特征子空间矩阵与其共轭转置的乘积代替
电讯技术 2017年9期2017-09-18
- 概率神经网络的平滑参数分析及在地震属性分析中的应用
对平滑参数和训练样本的选取方法进行研究。在分析了平滑参数对网络分类符合率的影响后,利用取值试验得到样本归一化情况下平滑参数的最优取值区间。在此基础上进行训练样本选取的随机性、均匀性及数量试验,发现均匀选取各类训练样本时,小样本量能使网络获得较高的分类符合率,而大样本量则能得到更高的分类符合率。X工区的实际应用结果表明,概率神经网络在少井情况下具备一定的应用潜力,可作为勘探初期利用地震属性进行模式识别的一种选择。概率神经网络;训练样本;平滑参数;地震属性分析
石油物探 2017年4期2017-08-30
- 基于两段稀疏表示方法的3D掌纹识别方法
c个类和n个训练样本:x1,x2,……,xn。如果训练样本来自第l类(l=1,2,……,n),则将l作为类标签。用全局方法假设的测试样本可以近似地看成所有训练样本的线性组合表示。不同地,TIPS仅使用训练样本的一部分作为测试样本。1.1 TPTSR的第一阶段TPTSR的第一阶段使用所有训练样本来表示每个测试样本,并利用表示结果来从训练样本集合中识别测试样本的M个最近邻。如果首先假定以下等式近似满足:式(1)中,y是测试样本,ai是系数。可以将式(1)重写为
河南科技 2017年3期2017-04-15
- 基于小波神经网络的网络流量预测研究
为小波网络的训练样本,成功实现了该网络的流量预测。试验仿真结果表明,构建的小波神经网络模型可以很好地实现对网络流量的高精度预测。关键词: 小波神经网络; 网络流量; 预测研究; 训练样本中图分类号: TN711?34 文献标识码: A 文章编号: 1004?373X(2016)23?0098?02Research on network traffic prediction based on wavelet neural networkLI Xin, SUN
现代电子技术 2016年23期2017-01-12
- 基于稀疏学习的kNN分类
定的,另外,训练样本中可能存在的噪声能影响分类结果。针对以上存在的两个问题,本文提出一种新的基于稀疏学习的kNN分类方法。本文用训练样本重构测试样本,其中,l1-范数导致的稀疏性用来对每个测试样本用不同数目的训练样本进行分类,这解决了kNN算法固定k值问题;l21-范数产生的整行稀疏用来去除噪声样本。在UCI数据集上进行实验,本文使用的新算法比原来的kNN分类算法能取得更好的分类效果。稀疏学习;重构;l1-范数;l21-范数;噪声样本0 引言模式分类是人工
广西师范大学学报(自然科学版) 2016年3期2017-01-05
- 宽带光谱成像系统最优训练样本选择方法研究
成像系统最优训练样本选择方法研究万晓霞, 梁金星, 刘强(武汉大学 印刷与包装系, 湖北,武汉 430079)为解决现有标准色卡或颜色样本集因数量大、存在严重颜色冗余而导致的光谱成像工作繁重的问题,提出一种基于宽带光谱成像系统光谱重建误差最小化的最优训练样本选择方法. 通过现有颜色样本集中最有效样本的选择,实现宽带光谱成像系统训练样本的优化. 研究通过伪逆方法进行光谱重建,以光谱均方根误差作为评价依据,从颜色样本集中逐步挑选训练样本,实现每次迭代所确定训练
北京理工大学学报 2016年6期2016-11-22
- 基于样本差异的多标签分类器评价标准预估
的方法是观察训练样本集中的评价标准值,训练样本集中的评价标准值与测试样本集中的评价标准值无明确关系,但是通过对训练样本集中的评价标准值的观察,估计测试样本集中的评价标准值有一定意义。对于Hamming loss、One-error、Coverage和Ranking loss,这些评价标准关于测试样本集的值往往高于或等于这些评价标准在训练样本集中的估计值,那么关于训练样本集的这些评价标准值过高,其在测试样本集中的评价标准估计值也不会低。对于Average p
计算机应用与软件 2016年9期2016-11-09
- 基于稀疏表示的人脸识别系统设计与实现
结果表明,在训练样本充分的情况下,系统对正面无表情人脸识别率在99%以上,满足正常人脸识别的使用需求;在训练样本不充分的情况下,识别率仍可以达到70%以上,可用于安防预警。计算机图像处理;人脸识别;稀疏表示;主成分分析人脸识别技术(Face Recognition,FR)[1]涵盖了生物技术和计算机技术,涉及到计算机图像处理、机器学习、模式识别、人体生理学和认知科学等多个技术领域[2]。人脸识别算法已经经历了长时间的研究,在图像背景简单、样本充分的情形下,
电子设计工程 2016年17期2016-10-22
- 融合原始样本和虚拟样本的人脸识别算法
能获得少量的训练样本,但是,在小训练样本情况下大多数人脸识别算法都会遇到困难。因此,为了提高人脸识别的分类正确率,提出了一种融合原始样本和虚拟样本的人脸识别方法。该方法先利用人脸的对称性来构造虚拟训练样本;然后,利用协同表示方法分别对原始训练样本和虚拟训练样本进行分析,并且分别得到每一类训练样本的重建误差;最后,将原始训练样本和虚拟训练样本的同一类重建误差进行加权融合并得到最终的分类结果。大量的实验结果比较分析表明,该方法可以获得更好的识别效果。人脸识别;
电视技术 2016年9期2016-10-17
- 论训练样本集结构和稀疏表示分类算法的关系
006)论训练样本集结构和稀疏表示分类算法的关系向顺灵 (广西民族大学信息科学与工程学院,广西南宁,530006)摘要:近年来,基于表示法的人脸识别技术主要都集中在约束条件和字典学习。很少有研究用样本数据特征来确定基于表示分类算法的性能。本文定义了结构离散度,表示样本集的结构特征。实验结果表明,具有较高的结构离散度的集合能让一个分类算法获得更高的识别率。关键词:模式识别;人脸识别0 引言1 SRC和训练样本集的结构关系在基于标准的分类算法中,训练样本集的
电子测试 2016年6期2016-05-23
- 基于训练样本集扩展的隐式篇章关系分类
006)基于训练样本集扩展的隐式篇章关系分类朱珊珊,洪 宇,丁思远,严为绒,姚建民,朱巧明(苏州大学 江苏省计算机信息处理技术重点实验室,江苏 苏州 215006)隐式篇章关系分类主要任务是在显式关联线索缺失的情况下,自动检测特定论元之间的语义关系类别。前人研究显示,语言学特征能够有效辅助隐式篇章关系的分类。目前,主流检测方法由于缺少足够的已标注隐式训练样本,导致分类器无法准确学习各种分类特征,分类精确率仅约为40%。针对这一问题,该文提出一种基于训练样本
中文信息学报 2016年5期2016-05-04
- 基于混合模重构的kNN回归
值固定问题和训练样本中的噪声问题,提出一种新的基于重构的稀疏编码方法。该方法用训练样本重构每一个测试样本,重构过程中,l1-范数被用来确保每个测试样本被不同数目的训练样本来预测,以此解决kNN算法固定k值问题;l2,1-范数导致的整行稀疏被用来去除噪声样本,以避免数据集上的噪声对重构产生不利影响。实验在UCI数据集上显示:新的改进算法比原来的kNN算法在线性回归中具有更好的预测效果。关键词线性回归稀疏编码重构l1-范数l2,1-范数噪声样本KNN REGR
计算机应用与软件 2016年2期2016-03-17
- 基于图像边缘位移的有监督的稀疏表示分类方法
法的准确度与训练样本个数有很大的关联.通常训练样本越充分,则该算法分类准确率越高,然而遇到小样本问题时,该算法分类准确率会明显降低.针对小样本问题,提出使用基于图像边缘位移的方法,得到和原始训练图像样本高度相关的新样本,达到扩充训练样本容量的目的,进而提高算法的分类准确率.同时,对于带仿射约束的稀疏表示分类算法,也可以经过图像边缘位移方法来提高分类准确率.实验结果证明,所用方法能够取得较好的图像识别效果.图像分类;稀疏表示;训练样本;仿射约束0 引 言在近
成都大学学报(自然科学版) 2016年4期2016-03-07
- 基于加权稀疏近邻表示的人脸识别
没有考虑不同训练样本对测试样本的重构权重,同时为了提高基于稀疏近邻表示人脸识别的识别率,文中提出一种加权稀疏近邻表示的人脸识别算法。首先在每一类训练样本中寻找与测试样本最近的k个样本,构成这一类新的训练样本;然后在每一类中都进行同样的操作,从而构造一个新的训练字典,在求解l1范数最小化的稀疏系数时,为每一个新的训练样本对应的稀疏系数赋上一个权值;最后在新的字典下,根据重构误差最小化来完成识别任务。在YaleB数据库和ORL数据库上的大量实验结果表明,文中所
计算机技术与发展 2016年2期2016-02-23
- 支持向量机在预测配煤灰熔点中的应用
熔点时,针对训练样本代表性不足的问题,提出了一种选取训练样本的方法。在国内具有代表性的煤灰成分和灰熔点数据库的基础上,分别添加现场实际中不同数量的灰熔点实验数据,将二者的集合作为训练样本集对灰熔点进行预测,并对预测结果进行分析。结果表明:训练样本的选取对支持向量机的预测结果有较大的影响,而向数据库中添加灰熔点实验数据可以有效改善训练样本代表性不足的问题,配煤灰熔点预测值的均方误差MSE=5.76,最大相对误差为6.91%。关键词:配煤;灰熔点;支持向量机;
电力科学与工程 2015年8期2016-01-26
- 基于半监督学习方法的软件故障定位研究
同训练算法;训练样本软件故障定位是软件调试过程中最为耗时和合耗资源的活动之一。为了减轻程序员手工排查程序语句的工作量,提高代码调试效率和可靠性,研究人员提出了一系列自动化的故障定位方法。机器学习方法被广泛采用。基于监督学习方法应用较广,且可靠性高。但是存在一个重要问题,就是大量标记样本的获取,因为在实际项目中大量标记样本的获取极其困难且代价高昂[1]。针对标记样本获取困难这一问题,本文提出基于半监督学习的软件故障定位方法,应用Zhou等人给出的一种命名为C
西北工业大学学报 2015年2期2016-01-19
- 训练样本对遥感影像分类精度影响研究
0500)训练样本对遥感影像分类精度影响研究高文杰,王金亮*,刘广杰(云南师范大学 旅游与地理科学学院,云南 昆明 650500)以大理SPOT-5 HRG影像和Landsat TM影像作为数据源,在构建标准训练样本数据集的基础上,探索训练样本对遥感影像分类的影响。选取不同训练样本数量组合,分别对监督分类中的平行六面体、最小距离、马氏距离、最大似然法、神经网络和支持向量机6种分类方法进行多次实验,并采用Kappa系数和总体分类精度对实验分类结果的精度进行
云南地理环境研究 2015年2期2015-12-26
- 训练样本数量选择和总体分类精度的关系研究
方法上,而对训练样本数量选择和分类精度的关系研究较少。2004年Foody针对SVM分类提出:以地物边界上较少数量的混合像元作为训练样本,可以达到选取大量纯净样本作为训练样本得到的分类精度[1]。2005年Van Niel T G等指出,训练样本数量选取规则是每个地物类别需要的样本数量为遥感数据波段数的10~30倍,并在此基础上越多越好[2]。2006年Foody又结合统计学理论,给出了训练样本数量的计算公式[3]。而国内的学者薄树奎、丁琳等于2010年选
河南城建学院学报 2015年3期2015-12-04
- 带虚警抑制的基于归一化残差的野值检测方法
法。首先利用训练样本计算待考查模式的NR值,其次比较NR值与野值检测门限的相对大小,从而判断待考查模式是否为野值。该文理论上推导了野值门限与虚警概率之间的关系表达式,以此为依据设置检测门限,可实现在少量训练样本情况下仍能抑制虚警率的目的。计算机仿真和实测数据测试验证了所提方法在野值检测和虚警抑制方面的优越性能。模式识别;监督;野值检测;虚警概率;归一化残差1 引言野值定义为这样的样本,它偏离其他模式太远以至于可认为它是由不同机制产生的[1]。野值检测被广泛
电子与信息学报 2015年12期2015-08-17
- 基于道路信息的知识辅助空时自适应处理
STAP)的训练样本,导致空时自适应处理时的目标自相消,引起漏警。针对这一问题,该文提出一种基于道路信息的知识辅助(KA)空时自适应处理方法。该方法首先根据主波束中道路相对于雷达的位置估计道路上车辆相对于雷达的径向速度,然后得到可能含有主波束车辆回波信号的距离-多普勒单元,接着根据训练样本与杂波导向矢量和主波束导向矢量的匹配程度判断这些训练样本是否包含主波束车辆回波信号,最后在进行空时自适应处理估计杂波协方差矩阵时剔除被主波束车辆回波信号污染的训练样本。理
电子与信息学报 2015年3期2015-07-05
- 基于BP神经网络的GPS高程模型研究与应用
S高程模型;训练样本1 引言BP神经网络算法是一种反向传播学习算法,把学习的结果反馈到中间层次的隐单元,改变它们的权系矩阵,从而达到预期的学习目的,它是一种自适应的映射方法,没做假设,能减少模型误差,它是迄今为止应用最广泛的神经网络。(本文原刊于《煤矿开采》2014年5月)2 BP神经网络算法BP神经网络算法包括两个方面:信号的前向传播和误差的反向传播。即计算实际输出时按从输入到输出的方向进行,而权值和阈值的修正从输出到输入的方向进行,其网络模型如图2-1
卷宗 2015年3期2015-05-13
- 基于ELM的作战方案样本验证及评估方法*
制定作战方案训练样本时容易受主观性影响的问题,提出了基于ELM的样本验证及评估方法。首先根据ELM建立作战方案样本的预测模型,然后更正错误标记的样本。仿真实验表明,利用ELM模型训练更正后的样本集能有效降低均方根误差值和提高预测的准确率。与RBF神经网络相比,训练ELM模型的时间缩短了98.8%,而且无需调节激活函数的参数就可以得到足够好的泛化性能。超限学习机; 径向基函数;作战方案;评估;泛化性能0 引言现代化作战需要在战前经过严格论证,建立多个可行的作
现代防御技术 2015年4期2015-05-05
- 适用于智能传感器系统的SVM集成研究
M本质是根据训练样本集构造出最优分类超平面,使得样本集可以被该超平面尽可能正确地分开,并使离超平面最近的向量与超平面之间的距离最大,因此,SVM是无法进行增量学习的,这种特性显然是不满足智能传感器系统实时性要求。其次,SVM是性能稳定的分类器,有“灾难性遗忘”现象。对于上述问题,国内外学者提出了各种方法用于SVM的增量学习[7~9]。与此同时,不少文献提出利用分类器集成来实现对SVM分类性能和精度的进一步改进,如Boosting算法和Bagging算法[1
传感器与微系统 2014年8期2014-07-01
- 一种基于类间类内双权重图像分块PCA的人脸识别技术
法是根据所有训练样本分块图像的平均图像来建立总体散布矩阵,因此在特征提取时没有考虑到不同位置分块图像的特征差异.为进一步提高人脸识别的正确率,本文提出一种新的方法.该法首先对训练样本图像建立同类图像空间,根据同类训练样本的平均图像与所有训练样本平均图像的距离,定义类间图像加权函数,以增强不同类图像在特征提取中的类间区分度,同时计算类内训练样本图像与该类平均图像的距离,定义类内图像加权函数,将此和类间加权函数相乘,这样每个图像均可获得一个权重.如果权重越小,
杭州师范大学学报(自然科学版) 2014年1期2014-03-23
- 自适应通用学习框架改进FLDA的人脸识别
算法在处理单训练样本人脸识别时由于类内散布矩阵为零而不能进行特征提取的问题,提出了一种基于自适应通用学习框架改进FLDA的人脸识别算法。首先选取一个合适的通用训练样本集,计算其类内散布矩阵和样本平均向量;然后,利用双线性表示算法预测单训练样本的类内、类间散布矩阵,巧妙地解决了单训练样本类内散布矩阵为零的问题;最后,利用Fisher线性判别分析进行特征提取,同时借助于最近邻分类器完成人脸的识别。在Yale及FERET两大通用人脸数据库上的实验验证了所提算法的
电视技术 2014年7期2014-01-27
- 基于FBG传感器网络的结构应力定位*
长漂移值进行训练样本的采集,最终通过对测试数据与样本数据的差异度进行对比计算完成应力定位。1 应力定位算法本文提出的基于参考数据的应力定位算法主要基于:施加相同强度应力时,应力位置距离传感器越近,传感器的中心波长漂移越大。该方法属于基于静力学理论的损伤检测方法,在应力定位过程中不需要对结构的材料特性进行分析研究。假设结构体表面分布有m只FBG传感器,在对结构体某个位置施加应力时,该位置会产生应变,同时,应变会以一个极快的速度传递到结构体其他位置,此时FBG
传感器与微系统 2013年7期2013-10-22
- 改进SRC算法在人脸识别中的应用
决测试样本与训练样本存在偏移误差的问题,本文提出了基于SRC的改进算法。该算法将每一类的训练样本单独作为训练字典,利用迭代校正和基于金字塔分层机构的运动偏移估计方法得到最终的偏移量,最后对校正后的测试样本使用SRC算法实现分类。实验结果表明该方法对于有偏移误差的人脸图像具有较好的鲁棒性及识别率。SRC;人脸识别;迭代校正;运动偏移估计基于图像的人脸识别技术是近年来计算机视觉领域研究热点之一,人脸识别技术利用从人脸图像中提取出有效特征信息,与数据库中的已知人
电子设计工程 2013年4期2013-07-13
- 基于表示的简单快速人脸识别方法
而是首先使用训练样本子集的线性组合来表示测试样本,然后基于表达式的结果,对测试样本进行分类。这种方法已经获得了非常不错的性能,并且被一致认为是人脸识别研究的一个突破[2]。然而,稀疏表示法有非常高的计算开销,主要是因为它依赖迭代算法来实现解决方案。稀疏表示法也可用于乳腺癌的识别分类、信号处理及图像分解等[3]。以前的人脸识别方法通常由特征提取、分类器的选择及分类这三个阶段组成。通常,特征提取阶段由变换方法实现,如基于独立成分分析方法[4]、主成分分析方法[
电视技术 2013年17期2013-02-13
- 基于遗传算法的形声输入法训练样本生成研究与实现
的形声输入法训练样本生成研究与实现李锟华,段利华,桑志强(大理学院数学与计算机学院,云南大理 671003)在用户利用输入法练习软件学习时,输入法练习软件使用的训练样本设计是否合理,是影响学习好坏的重要因素。讨论以形声编码输入法练习软件训练样本生成作为研究对象,根据用户设定的训练目标,通过遗传算法生成符合训练要求的最优训练样本,来满足用户训练要求。输入法;训练样本;遗传算法随着科学技术的不断发展,计算机被广泛应用于人们的生产生活。在我国,计算机应用主要围绕
大理大学学报 2012年4期2012-11-03
- 基于压缩感知的SAR图像目标识别
别应用时需由训练样本构造稀疏基,测试样本表示为稀疏基的线性组合。当假设任意亮度和表情变化的人脸图像取决于一个低维的人脸子空间时,利用压缩感知的重构算法,可以从稀疏表示的结果中精确恢复出人脸图像的表示,根据各类训练样本的重构图像与测试样本之间的距离度量实现对目标的有效识别。基于这种基本思路,压缩感知理论又被进一步引入到人脸表情识别[5]和三维人脸识别[6]等领域。本文主要研究将压缩感知理论应用于SAR图像目标识别,以获得对SAR目标更优的识别性能。但是值得注
火控雷达技术 2012年4期2012-09-30
- 用于七段码识别的BP网络中虚拟样本的生成
须搜集大量的训练样本,这通常要消耗大量人力物力,且在工业环境下难以实现,因此,如何在少量训练样本下,提高BP网络的泛化能力,就值得深入研究。1992年,Poggio T和Vetter T[5]提出了虚拟样本的思想,目前虚拟样本构造方法有:添加噪声[6]、基于模板[7]、基于高斯变换[8]等方法。本文根据工业用七段码数显仪表的特征,采用特定的构造方法在原有样本的基础上,模拟七段码码段重叠,构造一定量的虚拟样本,并增加到训练样本集中,使训练样本集的样本在样本空
传感器与微系统 2012年3期2012-07-25