基于扩散算子的带限图信号加权重建策略

2017-12-16 06:48杨立山游康勇郭文彬
电子与信息学报 2017年12期
关键词:截止频率偏置残差

杨立山 游康勇 郭文彬



基于扩散算子的带限图信号加权重建策略

杨立山 游康勇 郭文彬*

(北京邮电大学信息与通信工程学院 北京 100876)

图信号处理技术将经典信号处理的概念和算法延展到图结构信号的处理领域。对于带限图信号,可以通过分析信号之间的关联性,重建出未采样的信号。该文分析了未采样信号的构成架构,提出一个基于扩散算子的未采样信号迭代重建算法。在每次迭代过程中,将已采样信号的重建残差扩散至所有未采样的信号节点,并进一步通过初步估计结果与重建残差的加权处理,提升算法的收敛速度。采用合成数据和真实数据进行仿真验证,实验结果显示所提出的算法具有低重建误差和快速收敛的特点。

带限图信号处理;图信号扩散算子;下采样与重建

1 引言

近些年来,随着传感器技术的发展与工业信息化革命,在气象预测、智能交通等监控网络内部署了大量传感器设备。由于传感器设备空间分布的不规则性,其所采集的大规模数据也呈现空间分布的不规则性,从而限制了PCA, SVD等经典规则域算法的应用。因此,面对不规则域下的数据处理问题,需要新的算法、思维和处理模式,促进图信号处理技术的快速发展[1,2]。

图信号处理技术中大规模数据之间的关系被映射为2维平面的图结构,图中的节点代表单个数据元素,节点之间的连接边表示数据元素之间的关联关系,所有节点的信号总称为图信号。图信号可以理解为一个具有空间关联关系的矢量信号,由于信号间的关系复杂并且量级庞大,利用小规模信号集表征原始信号是非常必要的。图信号采样与重建的实质从图信号节点集合中选取合适的部分节点,利用部分节点的数据,根据图拓扑结构以及图信号的特点,实现对原始数据的表征与恢复。目前关于图信号采样与重建问题的研究有以下几个方面。文献[3]分析和利用图结构的邻接矩阵,建立了基于优化理论的采样与非迭代重建理论,给出了能够实现无失真重建的条件。文献[4]采用数据汇聚的思想,将图结构中的节点通过图邻接矩阵汇聚至单个节点,从而实现对图结构的采样。与上述两个方面不同,本文重点研究基于图结构的拉普拉斯矩阵以及凸集映射的采样信号迭代重建策略。Persenson[5]建立了基于Paley-Wiener函数的图信号采样理论基础,提出了采样信号唯一集的概念,给出了信号无失真重建的充分条件。关于采样图信号的重建问题,现有重建算法的核心思想是将经典信号处理中的Papoulis-Gerchberg算法[6,7]引入到不规则域,采用凸集映射的思想迭代重建信号。文献[8,9]提出了一个最小均方迭代重建算法(Iterative Least Square Reconstruction, ILSR),将已采样的图信号交替投影至顶点域下采样子空间和图谱域低通滤波子空间,寻找能够同时满足两个空间限制条件的信号。Wang等人[10,11]提出了局部集的概念及其划分方法,利用局部集的划分选取合适节点构成下采样集,并在此概念的基础上提出了两个迭代重建算法(Iterative Propagating Reconstruction, IPR和Iterative Weighting Reconstruction, IWR)。这两个算法设定的前提是将图拓扑结构划分成若干个互不相连的子集,单个子集称之为局部集。与ILSR相比,IPR最主要的特点是建立了采样信号重建残差的传播机制。在每次迭代重建过程中,重建残差从已采样的节点传播到位于同一局部集中的未采样节点,然后将组合后的图信号投影至图谱域低通滤波子空间。得益于采样信号重建残差的传播,IPR能够得到比ILSR更快的重建收敛速度。但是,IPR将采样节点的重建残差直接赋予同一局部集合内的非采样节点,不仅忽略了局部集合外的节点对局部集合内节点影响,而且无法反映真实图信号重建残差之间的差异性,从而影响重建收敛速度。另外,现阶段的研究缺少未采样信号构成要素的分析。

本文针对从采样信号中重建原始带限图信号的问题,充分利用带限图信号的平滑特性,构建了恢复未采样信号的分析框架,从均值与偏置的角度建立了采样信号重建残差的扩散模型,定义了局部均值和全局偏置扩散算子的概念,并在此基础上提出了基于扩散算子的迭代重建算法。建立了采样信号与未采样信号之间的关联关系,利用局部均值与全局偏置的协同处理机制消除了未采样信号的重建残差在局部区域内的过度一致化,并进一步通过初步估计结果与重建误差的加权处理,加速信号重建的收敛速度。仿真结果显示,所提算法具有较低的迭代重建误差和快速的重建收敛速度。

2 图信号处理相关工作

图1 明尼苏达州路网图

2.1 带限图信号的下采样方法

2.2 带限图信号的重建方法

ILSR的迭代重建过程可表示为

文献[10]提出了局部传播算子的概念以及局部集的划分方法,其给出的局部传播重建算法(IPR)也是基于迭代凸集投影来重建图信号。与ILSR的重建残差处理机制不同,在每次迭代重建过程中,IPR将局部集内采样节点的重建残差传播至局部集内的未采样节点,然后再将合成的信号映射到图谱域低通滤波子空间,其迭代重建过程可表示为

3 基于扩散算子的重建策略

本节建立了未采样信号的分析架构,定义了局部均值扩散算子和全局偏置算子的概念,构建了采样信号的重建残差局部扩散与全局扩散策略,提出了基于扩散算子的加权重建算法。

3.1 重建残差的扩散机制框架

采样信号重建问题的实质是依据图拓扑结构建立已知的采样图信号与待定的未采样图信号之间的关联关系。鉴于原始信号与重建信号都具有图谱域带限的特性,可知重建残差同样呈现带限的特点,也即,与重建残差相关联的节点之间的差异性较小。那么,可以利用这个关键特性,依据已知的采样节点的重建残差去估计未采样节点的重建残差,这也是本文研究的最主要动机。首先,依据未采样节点图信号各分量构成方式的不同,将其分解为

3.2 局部均值扩散算子

引入局部均值扩散算子的目的是实现采样节点重建残差的局部扩散,将采样节点的重建残差视为局部区域内的均值,其实质是依托带限图信号的平滑性,充分利用节点之间差异化较小的特性,为未采样节点重建残差的估计提供有效的基础。

3.3 全局偏置扩散算子

可以从两个角度理解全局偏置扩散过程,从采样节点的角度来看,单个采样节点的重建残差分量以某种方式扩散至所有未采样节点;从未采样节点的角度来看,单个未采样节点的全局偏置部分则是所有采样节点的重建残差分量扩散到该节点上的重建残差分量之和。

3.4 扩散算子以及加权重建算法

上述定义中,扩散算子由局部均值扩散算子和全局偏置扩散算子构成,扩散算子将采样信号的重建残差在图拓扑结构内扩散,其中局部均值扩散算子将采样信号的重建残差扩散至与该节点局部区域内的未采样节点,全局偏置扩散算子则将采样信号的重建残差扩散至所有未采样节点。基于上述扩散过程分析,根据凸集映射的思想,本文提出基于扩散算子的图信号迭代重建算法(Iterative Graph diffusion operator based Weighted Signal Reconstruction, IGSR-W)。首先将初始的采样信号投影至图谱域低通滤波子空间,获取已知采样节点的重建残差,完成重建算法的初始过程。在每次迭代过程中,利用扩散算子将采样节点的重建残差扩散至所有未采样节点,然后将扩散后的信号投影至图谱域低通滤波子空间,赋予重建信号图谱域带限特性,使其与原始信号的特性相匹配,完成重建信号的第1步估计;而后进一步利用局部均值与全局偏置扩散部分,并与第1步估计的重建信号进行加权处理,最后将加权后的信号投影至图谱域低通滤波子空间,从而完成迭代过程中重建信号的估计。上述重建过程可归纳为

4 仿真结果

本次仿真采用美国明尼苏达州路网图[11]作为图结构,其节点表示道路交叉口,边表示交叉口之间的道路,如图1所示,其节点数目为2642。该路网图主要用于验证本文提出的IGSR-W算法与现有算法的重建性能,对比分析所有算法在不同图谱域截止频率上的重建误差性能,并采用3种典型的图结构对比分析所有算法的重建效果,验证所提出算法的鲁棒性和适用性。另外,为了对比验证加权处理的性能,在以下仿真实验中,采用IGSR(Iterative Graph diffusion operator based Signal Reconstruction)表示未进行加权处理的重建方式,即仅利用式(16)中的过程。由于IPR需要以局部分割作为基础,本次仿真采用基于节点度的分割方式构成下采样集合,依次选取度最大的节点以及其邻居节点构成局部集合,每个局部集合中选取一个节点作为采样节点。下采样集合中含有873个节点。首先需要模拟生成仿真实验中与明尼苏达路网图相适应的带限信号,本文主要利用图傅里叶变换、图谱域截取与图傅里叶反变换进行生成,其具体过程如下所示:

主检查员会以PPT的方式介绍哥伦比亚概况、INVIMA背景、GMP认证依据、缺陷的分类、如何进行整改以及认证通过的标准。期间,还会穿插介绍一下哥伦比亚的风光,并推荐一些景点。受检方也可以准备一个PPT,介绍一下公司的背景以及GMP的执行情况。

(1)首先产生一个2642行1列的随机信号,其每一行元素对应明尼苏达州路网图上每个节点;

(2)通过图傅里叶变换将图信号变换至图谱域,设定图谱域截止频率,将高于图截止频率的分量设置为零;

(3)通过图傅里叶反变换将图谱域信号变换至顶点域。

上述步骤中,第1步产生仿真所需的初始信号,并使其单个元素对应于明尼苏达州路网图上的单个节点;第2步与第3步则利用图傅里叶变换,使得初始信号中元素之间的关联关系与明尼苏达州路网图上对应节点之间的边相符合,并且使该信号满足图谱域带限的特性。需要说明的是,基于目前的研究工作可知,所研究的图信号仅需要其满足图谱域带限特性,并无其他限制条件。此外,采用山东电网作为图结构,并将山东电力消耗数据作为真实世界的数据对比分析了所有算法的实际应用性能。

4.1 重建性能

本节仿真实验的目的是验证IGSR-W算法中加权因子对算法性能的影响,并且对比分析所提算法与现有算法的性能表现。采用0.45作为本次仿真的图谱域截止频率(归一化图谱域频率的变化范围为0至2)。首先,鉴于加权因子的变化范围为0至1,设置加权因子的参数值为0, 0.2, 0.4, 0.6, 0.8和1.0,分析加权因子对IGSR-W算法的鲁棒性。如图2(a)所示,纵坐标为相对误差,横坐标为迭代次数,IGSR-W算法在不同的加权因子下都具有稳定的表现,且其加权因子为0.6时获得最快收敛速度。因此,将设置加权因子的参数值为0.6,以此分析所提算法与现有算法之间的重建性能表现。重建性能的对比如图2(b)所示,纵坐标为相对误差,横坐标为迭代次数。从图中可以看出,IGSR-W和IGSR比ILSR和IPR拥有较快的信号重建收敛速度,与前文阐述的理论分析相同;得益于加权处理,IGSR-W在IGSR的基础上进一步提升了算法的收敛速度。

4.2 图谱域截止频率

由于现有算法都是基于迭代收敛,交替投影至下采样子空间和低通滤波子空间。因此,图谱域截止频率也是一个非常关键的影响因素。本节是为了验证重建算法对于图谱域截止频率的鲁棒性,观察其在不同的图谱域截止频率下是否能够保持稳定性。设置图谱域的截止频率的变化范围为0.40至0.50。基于上一节仿真实验的结果,设置加权因子为0.60。如图3所示,横坐标为图谱域截止频率,纵坐标为相对误差,图中曲线为ILSR, IPR, IGSR和IGSR-W在不同的图谱域截止频率设定下第10次迭代重建的重建误差。从图中可以看出,随着图谱域截止频率的变化,所有重建算法具有相类似的增长变化,其相对误差都随着图谱域截止频率的增大而增大。由于采用了重建残差的局部均值和全局偏置扩散,IGSR和IGSR-W比ILSR和IPR在第10次迭代重建的误差拥有较低的重建误差。由于采用了加权处理,IGSR-W在IGSR的基础上提升了算法性能,并且在各个图谱域截止频率上都保持稳定。

图2 参数分析与重建收敛曲线对比图

图3 图频域截止频率变化对比图

4.3 典型图结构

现实世界中的大部分网络都可以划归为3种典型的图结构:Erdos-Renyi随机图(Erdos-Renyi Graph)、小世界图(Small-world Graph)和无标度图(Scale-free Graph)。Erdos-Renyi随机图是一种典型的随机图结构,节点之间的连接关系由某个概率确定。本次仿真生成了40个节点Erdos-Renyi随机图,节点之间的连接概率为0.10。小世界图是介于随机图与规则图之间的典型图结构,图中大部分的节点彼此不邻接,但是大部分节点可以从任一其他节点经过有限步数跳转到达。采用Watts-Strogatz模 型[15]产生100个节点的小世界图结构。第3个典型的图结构是无标度图,其最主要的特点是其节点的度分布服从幂律分布。采用Barabasi-Albert模型[16]产生200个节点的无标度图结构。3种典型结构中的图谱域截止频率值均为0.50。为了有效验证所有算法重建性能,消除随机因素的影响,每种图结构的实验结果为100次随机图结构的平均值。首先,设置加权因子的参数值为0, 0.2, 0.4, 0.6, 0.8和1.0,分析IGSR-W算法的不同加权因子在3种典型图结构下的表现。如图4(a)所示(鉴于线条过多,仅选取部分结果展示),纵坐标为相对误差,横坐标为迭代次数,IGSR-W的不同加权因子在3种典型图结构下具有稳定的性能,且在Erdos-Renyi随机图、小世界图和无标度图上具有最快收敛速度的加权因子分别为0.2, 0.2和0.8。因此,依次将相关的加权因子设置为0.2, 0.2和0.8,分析所提算法与现有算法之间的性能。如图4(b)所示,对比3种图结构,算法在小世界图结构的重建性能为最佳。对比其他重建算法,IGSR-W在3种典型图结构上具有较低的迭代重建误差。由此可见,IGSR-W重建算法不拘泥于某种特定的拓扑结构,具有普适性的特点,其局部均值扩散算子与全局偏置扩散算子相辅相成,实现对采样图信号的快速与稳定的重建。

图4 基于典型图结构的性能对比图

4.4 真实世界数据

采用山东电网2015年的电力消耗数据[17]作为真实世界的数据,验证所提出的重建算法与现有的重建算法。图结构如图5(a)所示,图结构的节点为山东省17个地级市,节点之间的边为地级市之间的电力连接线。采用局部集合分割方式构成采样集合,其含有7个节点。关于真实系统中的图谱域截止频率和加权因子的选定,可以将存储的历史数据或者抓取的快照数据(snapshot data)投影至图谱域进行观测,从而获取合适的参数值。因此,本次仿真设定的图谱域截止频率为0.55,设置加权因子为0.2。重建性能如图5(b)所示,横坐标为迭代次数,纵坐标为相对误差。从仿真结果中可以看出,与ILSR和IPR相比,IGSR和IGSR-W具有更快的迭代收敛速度;由于引入加权处理方式,IGSR-W比IGSR具有更快的收敛速度。

5 讨论与分析

当IGSR-W算法不进行加权处理,IGSR-W算法退化为IGSR算法;当IGSR-W算法中不进行加权处理、局部均值扩散控制因子和全局偏置扩散控制因子为零时,也就是在重建过程中不进行采样节点重建残差的扩散,IGSR-W算法退化为ILSR算法;当IGSR-W算法中不进行加权处理且全局偏置扩散控制因子为零时,也就是在重建过程中采样节点的重建残差值仅扩散至与其有连接关系的邻居节点,IGSR-W算法退化为IPR算法。因此,IGSR-W具有统一性与模块化的优越特点。

此外,由于引入局部均值扩散过程和全局偏置扩散过程,IGSR-W要比ILSR和IPR消耗更多的计算资源。但是,采用集中式的数据采样方式,原始信号的重建过程通常是在一个被认为计算资源与能量资源无限的数据处理中心完成,从而弥补了IGSR-W所引起的不足。

6 结束语

本文针对采样的带限图信号重建问题,提出了未采样信号的构成框架,定义了局部均值扩散算子和全局偏置扩散算子的概念,提出了基于扩散算子的加权重建算法。最后采用实验方法,验证了所提出算法的有效性。之后的研究者,可以根据实际系统的需要,依托未采样信号的3层关联体系,设计不同的局部均值扩散算子和全局偏置扩散算子,灵活实现图信号的采样与重建过程。此外,本文采用从历史数据或抓取的数据中获取加权因子,其最优的获取方式将在后续研究中继续展开。

图5 真实世界数据的性能对比图

[1] SHUMAN D I, NARANG S K, and FROSSARD P. The emerging field of signal processing on graphs: Extending high-dimensional data analysis to networks and other irregular domains[J]., 2013, 30(3): 83-98. doi: 10.1109/MSP.2012.2235192.

[2] SANDRYHAILA A and MOURA J M F. Big data analysis with signal processing on graphs: Representation and processing of massive data sets with irregular structure[J]., 2014, 31(5): 80-90. doi: 10.1109/MSP.2014.2329213.

[3] CHEN Siheng, VARMA R, SANDRYHAILA A,. Discrete signal processing on graphs: Sampling theory[J]., 2015, 63(24): 6510-6523. doi: 10.1109/ TSP.2015.2469645.

[4] MARQUES A G, SEGARRA S, LEUS G,. Sampling of graph signals with successive local aggregations[J]., 2016, 64(7): 1832-1843. doi: 10.1109/TSP.2015.2507546.

[5] PESENSON I. Sampling in Paley-Wiener spaces on combinatorial graphs[J]., 2008, 360(10): 5603-5627. doi: 10.1090 /S0002-9947-08-04511-X.

[6] PAPOULIS A. A new algorithm in spectral analysis and band-limited extrapolation[J]., 1975, 22(9): 735-742. doi: 10.1109/TCS.1975. 1084118.

[7] GERCHBERG R W. Super-resolution through error energy reduction[J]., 1974, 21(9): 709-720. doi: 10.1080/713818946.

[8] NARANG S K, GADDE A, and SANOU E. Localized iterative methods for interpolation in graph structured data[C]. IEEE Global Conference on Signal and Information Processing, Texas, USA, 2013: 491-494. doi: 10.1109/ GlobalSIP.2013.6736922.

[9] ANIS A, GADDE A, and ORTEGA A. Towards a sampling theorem for signals on arbitrary graphs[C]. IEEE International Conference on Acoustics, Speech and Signal Processing, Florence, Italy, 2014: 3864-3868. doi: 10.1109/ ICASSP.2014.6854325.

[10] WANG X, LIU P, and GU Y. Local-set-based graph signal reconstruction[J]., 2015, 63(9): 2432-2444. doi: 10.1109/TSP.2015.2411217.

[11] WANG X, CHEN J, and GU Y. Generalized graph signal sampling and reconstruction[C]. IEEE Global Conference on Signal and Information Processing, Orlando, USA, 2015: 567-571. doi: 10.1109 /GlobalSIP.2015.7418259.

[12] GLEICH D. The MatlabBGL Matlab Library[OL]. http://www.cs.purdue.edu/homes/dgleich/packages/matlab -bgl/index.html.2016.9.

[13] SANDRYHAILA A and MOURA J. Discrete signal processing on graphs: Frequency analysis[J]., 2014, 62(12): 3042-3054. doi: 10.1109/TSP.2014.2321121.

[14] SANDRYHAILA A and MOURA J. Discrete signal processing on graphs: graph Fourier transform[C]. IEEE International Conference on Acoustics, Speech and Signal Processing, Vancouver, Canada, 2013: 6167-6170. doi: 10.1109/ICASSP.2013.6638850.

[15] WATTS D J and STROGATZ S H. Collective dynamics of ‘small-world’ networks[J]., 1998, 393(6684): 440-442. doi: 10.1038/30918.

[16] BARABASI A L and ALBERT R. Emergence of scaling in random networks[J]., 1999, 286(5439): 509-512. doi: 10.1126/science.286.5439.509.

[17] SHANDONG BUREAU OF STATSTICS. Shandong Statistical Yearbook (2015)[OL]. http://www.stats-sd.gov. cn.2016.8.

杨立山: 男,1986年生,博士生,研究方向为图信号处理与压缩感知、大数据处理.

游康勇: 男,1993年生,博士生,研究方向为压缩感知技术.

郭文彬: 男,1971年生,副教授,研究方向为信号处理、认知无线电及其关键技术.

Graph Diffusion Operator Based Weighted ReconstructionStrategy for Band-limited Graph Signals

YANG Lishan YOU Kangyong GUO Wenbin

(,,100876,)

Signal processing on graphs extends signal processing concepts and methodologies from the classical signal processing theory to data indexed by general graphs. For a band-limited graph signal, the unsampled data can be reconstructed from the sampled data by exploiting the relationship of the graph signals. This paper proposes a concept of graph diffusion operator for signal processing on graphs, and uses the operator to reconstruct band-limited graph signals from the sampled data. In each iteration, the residuals of the sampled vertices are propagated to all the unsampled vertices, and the known information and initial estimated results are further exploited via weighted process, aiming at accelerating the convergence. An analysis framework is proposed for the unsampled graph signals. The simulation results of synthetic data and real-world data demonstrate the wonderful effectiveness of the proposed reconstruction strategy.

Band-limited graph signals processing; Graph diffusion operator; Downsampling and reconstruction

TN911.7

A

1009-5896(2017)12-2937-08

10.11999/JEIT170106

2017-02-08;

2017-09-11;

2017-10-27

通信作者:郭文彬 gwb@bupt.edu.cn

国家自然科学基金(61271181)

The National Natural Science Foundation of China (61271181)

猜你喜欢
截止频率偏置残差
基于40%正面偏置碰撞的某车型仿真及结构优化
基于超声Lamb波截止频率的双层薄板各层厚度表征
基于双向线性插值的车道辅助系统障碍避让研究
基于双向GRU与残差拟合的车辆跟驰建模
基于残差学习的自适应无人机目标跟踪算法
基于递归残差网络的图像超分辨率重建
低频射频识别系统中的RC放大器电路性能分析与研究
梯度饱和多孔材料中弹性波的截止频率
一级旋流偏置对双旋流杯下游流场的影响
平稳自相关过程的残差累积和控制图