主成分分析法在数字图像压缩中的的应用

2017-03-30 15:14鲁书山沈小林樊凯强
科技与创新 2016年23期
关键词:主成分分析法特征提取

鲁书山++沈小林++樊凯强

摘 要:阐述里主成分分析法的定义,及应用于实际的意义,通过matlab编程实现主成分分析法在图像压缩方面的应用,在编程过程中设置不同主成分个数来显示不同的处理结果。在对处理结果进行分析,同时也对主成分分析法的性质有了更直观的认识,方便日后在其他领域的应用。

关键词:主成分分析法;图像压缩;特征提取;matlab编程

中图分类号:TP309.7 文献标识码:A DOI:10.15913/j.cnki.kjycx.2016.23.098

主成分分析法是用降维的思想,用几个互不相关的主成分反映原始变量的大部分信息的统计方法。能有效降低数据维度,减少计算量,在涉及到数理统计的各个领域均有广泛的应用。本文先介绍主成分分析的原理,再通过matlab用主成分分析法对图像进行压缩,实现主成分在图像处理中的应用。

1 主成分分析法概念及性质

1.1 概念

假定有n个样本,每个样本由p个变量构成,则可以组成一个n×p阶的数据矩阵:

设x1,x2,…,xP为原变量,z1,z2,…,zm(m≤p)为新变量,则:

系数lij为新变量对原变量的反应情况。

1.2 性质

zi与zk(i≠k;i,k=1,2,…,m;j=1,2,…,p)相互无关;z1是x1,x2,…,xP的一切线性组合中方差最大者,z2是与z1不相关的x1,x2,…,xP的所有线性组合中方差最大者;zm是与z1,z2,……,zm-1都不相关的x1,x2,…xP的所有线性组合中方差最大者。则新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,xP的第1,第2,…,第m主成分。

通过以上表述可知,主成分分析的实质是计算主成分zi(i=1,2,…,m)所反映的原变量xj(j=1,2,…,p)上的荷载 lij(i=1,2,…,m;j=1,2,…,p)。它们分别是相关矩阵(也就是x1,x2,…,xP 的相关系数矩阵)m个较大的特征值所对应的特征向量。

2 计算步骤

2.1 计算相关系数矩阵

相关系数矩阵为:

rij(i,j=1,2,…,p)为原变量xi与xj标准化后的相关系数,rij=rji,其计算公式为:

2.2 计算特征值与特征向量

解特征方程|λI-R|=0,求出特征值,并使其按大小顺序排列λ1≥λ2≥…≥λp≥0;分别求出对应于特征值λi的特征向量ei

(i=1,2,…,p),要求‖ei‖=1,即 =1,其中,eij表示向

量ei的第j个分量,也就是说ei为单位向量。

2.3 计算主成分贡献率及累计贡献率

主成分贡献率为:

主成分累计贡献率为:

一般取累计贡献率达85%~95%的特征值λ1,λ2,…,λm所对应的第1、第2、…、第m(m≤p)个主成分。

2.4 计算主成分载荷

,主成分载荷就是zi与xj之间的相关系数(主成分不相关)。

2.5 各主成分的得分

各主成分的得分为:

3 图像处理及结论

众所周知,图像信息所含的数据量巨大。为了便于图像的存储,提高存储效率,研究图像压缩具有重要的意义。

主成分分析法在数字图像压缩中的的应用

鲁书山,沈小林,樊凯强

(中北大学,山西 太原 030051)

摘 要:阐述里主成分分析法的定义,及应用于实际的意义,通过matlab编程实现主成分分析法在图像压缩方面的应用,在编程过程中设置不同主成分个数来显示不同的处理结果。在对处理结果进行分析,同时也对主成分分析法的性质有了更直观的认识,方便日后在其他领域的应用。

关键词:主成分分析法;图像压缩;特征提取;matlab编程

中图分类号:TP309.7 文献标识码:A DOI:10.15913/j.cnki.kjycx.2016.23.098

主成分分析法是用降维的思想,用幾个互不相关的主成分反映原始变量的大部分信息的统计方法。能有效降低数据维度,减少计算量,在涉及到数理统计的各个领域均有广泛的应用。本文先介绍主成分分析的原理,再通过matlab用主成分分析法对图像进行压缩,实现主成分在图像处理中的应用。

1 主成分分析法概念及性质

1.1 概念

假定有n个样本,每个样本由p个变量构成,则可以组成一个n×p阶的数据矩阵:

. (1)

设x1,x2,…,xP为原变量,z1,z2,…,zm(m≤p)为新变量,则:

. (2)

系数lij为新变量对原变量的反应情况。

1.2 性质

zi与zk(i≠k;i,k=1,2,…,m;j=1,2,…,p)相互无关;z1是x1,x2,…,xP的一切线性组合中方差最大者,z2是与z1不相关的x1,x2,…,xP的所有线性组合中方差最大者;zm是与z1,z2,……,zm-1都不相关的x1,x2,…xP的所有线性组合中方差最大者。则新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,xP的第1,第2,…,第m主成分。

通过以上表述可知,主成分分析的实质是计算主成分zi(i=1,2,…,m)所反映的原变量xj(j=1,2,…,p)上的荷载 lij(i=1,2,…,m;j=1,2,…,p)。它们分别是相关矩阵(也就是x1,x2,…,xP 的相关系数矩阵)m个较大的特征值所对应的特征向量。

2 计算步骤

2.1 计算相关系数矩阵

相关系数矩阵为:

. (3)

rij(i,j=1,2,…,p)为原变量xi与xj标准化后的相关系数,rij=rji,其计算公式为:

. (4)

2.2 计算特征值与特征向量

解特征方程|λI-R|=0,求出特征值,并使其按大小顺序排列λ1≥λ2≥…≥λp≥0;分别求出对应于特征值λi的特征向量ei

(i=1,2,…,p),要求‖ei‖=1,即 =1,其中,eij表示向

量ei的第j个分量,也就是说ei为单位向量。

2.3 计算主成分贡献率及累计贡献率

主成分贡献率为:

. (5)

主成分累计贡献率为:

. (6)

一般取累计贡献率达85%~95%的特征值λ1,λ2,…,λm所对应的第1、第2、…、第m(m≤p)个主成分。

2.4 计算主成分载荷

,主成分载荷就是zi与xj之间的相关系数(主成分不相关)。

2.5 各主成分的得分

各主成分的得分为:

. (7)

. (8)

3 图像处理及结论

众所周知,图像信息所含的数据量巨大。为了便于图像的存储,提高存储效率,研究图像压缩具有重要的意义。

猜你喜欢
主成分分析法特征提取
基于MED—MOMEDA的风电齿轮箱复合故障特征提取研究
基于曲率局部二值模式的深度图像手势特征提取
一种针对特定无线电信号的识别方法
基于模糊K近邻的语音情感识别
山东省旅游产业竞争力评价研究
中国装备制造业阶段竞争力研究
陕西省各地区人力资本水平综合评价与分析
基于主成分分析的煤层气赋存影响因素分析
基于主成分分析法的高校财务风险评价指标体系构建