郑文炜, 王宇华, 程 湘
(佛山科学技术学院 机械与电气工程学院, 广东 佛山 528000)
基于系统聚类法的空调钣金振动信号的分类方法
郑文炜, 王宇华, 程 湘
(佛山科学技术学院 机械与电气工程学院, 广东 佛山 528000)
为解决静音家电振动检测存在的问题对稳定运行于一个特定工作状态的空调外机外壳的钣金结构进行多点的振动信号采集, 提取采集所得的时域波形的均方值及峭度特征, 并选取两个包含不同频率成分且具有典型分类特征的振动信号进行傅里叶变换, 将所得的两个频域数据分别与其他点的振动信号的频域数据进行相关系数计算. 再将所得的相关系数与均方值和峭度作为分析的指标, 利用系统聚类法对振动信号进行分类. 实验结果表明: 该聚类方法对振动信号的分类有着明显的效果, 能较好地解决传统的家电振动检测方法所存在的问题.
钣金振动; 信号处理; 系统聚类法; 傅里叶变换
在家电行业中振动、 噪声是质量评价的重要内容. 随着消费者生态环保意识的提高, 对具有静音效果的各类家用电器的需求日益增长, 这些静音产品都对工作时的振动噪音提出了很高的要求. 然而, 在对家电的外壳钣金结构进行振动检测时, 由于钣金结构的振动特性较为复杂, 所以技术人员只能根据经验对某种工作状态下的家电进行多个点的振动检测, 这种依靠人为经验的检测方法存在较大的主观性, 容易产生“漏检”或者“多检”的现象.
为解决以上问题, 本文对稳定运行于一个特定工作状态下的空调外机外壳的钣金结构进行多点的振动信号采集, 提取采集所得的时域波形的均方值及峭度特征, 并选取两个包含不同频率成分且具有典型分类特征的振动信号进行傅里叶变换, 将所得的两个频域数据分别与其他点的振动信号的频域数据进行相关系数计算, 再将所得的相关系数与均方值和峭度作为分析的指标, 利用系统聚类法对振动信号进行分类.
1.1 样品间的相似性度量
聚类分析的基本思想是: 从一批样品的多个指标变量中, 定义能度量样品间或者变量间相似程度(或疏远关系)的统计变量, 其中对样品进行分类的方法称为Q型聚类法, 所用的统计量用“距离”这一术语进行描述[1].
假设每个样品xi有p个指标, 它们的观测值可表示为
这时, 每个样品xi可以看成是p维空间中的一个点,n个样品就组成p组空间中的n个点, 各个点之间的距离被用来衡量各个样品之间的靠近程度.
设d(xi,xj)为样品xi和xj之间的距离, 它们常用的距离有以下几个:
1) 明氏距离
当q=1时, 式(2)为绝对距离; 当q=2时, 式(2)为欧氏距离; 当q=3时, 式(2)为切比雪夫距离. 明氏距离, 特别是欧氏距离是人们较为熟悉的也是使用最多的距离. 但明氏距离存在两个方面的不足: 第一, 它与各个指标的量纲有关; 第二, 它没有考虑指标之间的相关性. 另外, 当各个变量的测量值相差悬殊时, 采用明氏距离并不合理, 应先将数据标准化, 再进行距离计算.
2) 马氏距离
设Σ表示指标的协差阵, 如果Σ-1存在, 则两个样品之间的马氏距离为
d(xi,xj)2=(xi-xj)′Σ(xi-xj).
(3)
马氏距离既排除了各个指标之间的相关性干扰, 而且还不受各指标量纲的影响. 除此之外, 将原数据做一线性变换后, 马氏距离仍不改变[4].
3) 兰氏距离
兰氏距离能够很好地克服各个指标之间的量纲影响, 但是此距离仅可以用于一切xij>0的情况[3].
1.2 类间距离
类间聚类是用来度量一个类与另一个类之间的距离的统计量. 类间距离的定义方法有很多, 它们都是以距离系数为依据的. 设类A中有a个样本, 类B中有b个样本,D(i,j)为类A和类B中一对样本之间的距离,i=1,2,…,a;j=1,2,…,b.
1) 最短距离法
D(A,B)=min{D(i,j)}.
(5)
定义类间距离等于两类中距离最小的一对样本之间的距离.
2) 最长聚类法
D(A,B)=max{D(i,j)}.
(6)
定义类间距离等于两类中距离最大的一对样本之间的距离.
3) 平均距离法
D(A,B)={sumD(i,j)}/(ab).
(7)
定义类间距离等于两类中所有样本对之间距离的平均值.
4)重心距离法
D(A,B)=d(Xa,Xb).
(8)
定义类间距离等于两类的重心之间的距离.
2.1 均方值
均方值又称为有效值, 在信号分析中表示信号的能量, 多用于评价振动的烈度或者振动的等级[4]. 本文根据某型号空调外机外壳钣金结构的特点, 对稳定运行于一个特定工作状态的空调外机外壳的钣金结构进行多点的振动信号采集, 将采集所得的振动信号进行均方值指标提取, 得到的均方值指标如表 1 所示.
表 1 均方值指标
2.2 峭 度
图 1 峭度系数Fig.1 Kurtosis coefficient
峭度系数的意义如图 1 所示. 当K=3时定义为分布曲线具有正常峰度(即零峭度); 当K>3时, 分布曲线具有正峭度. 由式(10)可知, 当标准差σt小于正常状态下的标准差, 即观测值的分散程度较小时,K增大, 此时正态分布曲线峰顶的高度高于正常正态分布曲线, 故称为正峭度. 当K<3时, 分布曲线具有负峭度[5], 由式(10)可以看出, 当标准差σt大于正常状态下的标准差, 即观测值的分散程度较大时,K减小, 此时正态分布曲线峰顶的高度低于正常正态分布曲线, 故称为负峭度. 将本文采集所得的振动信号进行峭度指标提取, 得到的峭度指标如表 2 所示.
表 2 峭度指标
2.3 相关系数
相关系数是测定变量之间关系密切程度的量. 对两个变量之间的线性相关程度的度量称为单相关系数; 相关系数的值介于-1与+1之间, 即-1≤r≤+1并且r具有对称性,x与y之间的相关系数rxy和y与x之间的相关系数rxy相等;r数值大小与x和y的数据原点及计量尺度无关, 改变x和y的数据原点和计量尺度, 并不改变r数值的大小[6]. 在采集得到的振动信号中选取两个包含不同频率成分且具有典型分类特征的振动信号作为标准信号(检测点a0,a7)进行傅里叶变换, 再将所得的两个频域数据分别与其他点的振动信号的频域数据进行相关系数计算.
图 2 检测点a0时域波形图Fig.2 Time domain waveform of detection point a0
图 3 检测点a7时域波形图Fig.3 Time domain waveform of detection point a7
图 4 检测点a0频域图Fig.4 Frequency domain of detection point a0
图 5 检测点a7频域图Fig.5 Frequency domain of detection point a7
表 3 标准信号a1频谱数据与其他振动信号频谱数据的相关系数指标
表 4 标准信号a7频谱数据与其他振动信号频谱数据的相关系数指标
2.4 指标归一化
由于不同评价指标往往具有不同的量纲和量纲单位, 这样的情况会影响到数据分析的结果, 为了消除指标之间的量纲影响, 需要进行数据标准化处理, 以解决数据指标之间的可比性. 原始数据经过数据标准化处理后, 各指标处于同一数量级, 适合进行综合对比评价[7]. 本文使用z-score归一化法对以上3个指标进行归一化处理, 以消除指标之间的量纲差异.
z-score归一法
式中:μ和σ分别为样本均值和样本标准差.
2.5 聚类效果的评价
采用计算Cophenetic相关系数的方法来评价不同距离计算方法和不同的系统聚类法的聚类效果. 设d=(d1,d2,…,dn(n-1)/2), 其中d1为第2个样品和第1个样品初次并为一类时的并类距离,d2为第3个样品和第2个样品初次并为一类时的并类距离,dn(n-1)/2为第n个样品和第(n-1)个样品初次并为一类时的并类距离, 将这些距离称为Cophenetic距离. 所谓的Cophenetic相关系数是指样品间距离y与d之间的线性相关系数, Cophenetic相关系数越接近于1, 说明聚类的效果越好[8-10]. Cophenetic相关系数计算方法如式(13)所示.
本文分别使用绝对距离、 欧氏距离、 切比雪夫距离及马氏距离的分类方法, 并计算以上4种分类方法的最短距离、 最长距离、 重心距离及平均距离4种类间距离, 使用Cophenetic相关系数的方法计算其聚类效果, 计算结果如表 5 所示.
表 5 4种不同分类方法分别使用4种不同的类间距离进行分类的Cophenetic相关系数
2.6 聚类结果
由表 5 可知使用马氏距离分类方法结合平均距离法对样本进行聚类得到的聚类效果最好. 其冰柱图如图6所示, 样本的分类如表6所示. 由图6和表6可知样本被分为13类, 利用检测所得的各点振动信号的时域波形和频域数据对所得的聚类结果进行检验, 发现聚类所得的各个簇的样本的时域波形和频域数据基本一致, 聚类效果较好.
表 6 样本分类表
图 6 冰柱图Fig.6 Icicle figure
本文通过使用峭度、 均方值和两个标准信号的频域数据与其他检测点的频域数据的相关系数作为聚类指标, 以Cophenetic相关系数为判断依据, 使用马氏距离分类方法结合平均距离法对样本进行聚类. 结果样本被分为13类, 利用检测所得的各点振动信号的时域波形和频域数据对所得的聚类结果进行检验, 发现聚类所得的各个簇样本的时域波形和频域数据基本一致, 聚类效果较好.
[1] 张志红. 基于神经网络模糊聚类的研究[D]. 安徽: 安徽大学, 2004.
[2] 韩涵, 王厚军, 龙兵, 等. 基于改进马氏距离的模拟电路故障诊断方法[J]. 控制与决策, 2013, 15(11): 1713-1717. Han Han, Wang Houjun, Long Bing, et al. Method for analog circuit fault diagnosis based on improved Mahalanobisdistance[J]. Control and Decision, 2013, 15(11): 1713-1717. (in Chinese)
[3] 李深洛. 基于特征的时间序列聚类[D]. 桂林: 广西师范大学, 2014.
[4] 陈孝桢. 加速度均方值与平均振动能量密度的关系[J]. 噪声与振动控制, 1990(6): 7-10. Chen Xiaozhen. The relationship between mean square value of acceleration and average vibration energy density[J]. Noise and Vibration Control, 1990(6): 7-10.(in Chinese)
[5] 刘鹏辉, 黄纯, 江亚群, 等. 基于峭度系数的变压器励磁涌流识别方法[J]. 电网技术, 2015, 39(7): 2023-2028. Liu Penghui, Huang Chun, Jiang Yaqun, et al. An approach to identify inrush current of transformers based on the kurtosis coefficient[J]. Power System Technology, 2015, 39(7): 2023-2028.(in Chinese)
[6] 赵志宏, 杨绍普, 申永军. 基于独立分量分析与相关系数的机械故障特征提取[J]. 振动与冲击, 2013, 32(6): 67-72. Zhao Zhihong, Yang Shaopu, Shen Yongjun. Machinery fault feature extraction based on independent component analysis and correlation coefficient[J]. Journal of Vibration and Shock, 2013, 32(6): 67-72.(in Chinese)
[7] 肖汉光, 蔡从中. 特征向量的归一化比较性研究[J]. 计算机工程与应用, 2009, 45(22): 117-119. Xiao Hanguang, Cai Congzhong. Comparison study of normalization of feature vector[J]. Computer Engineering and Applications, 2009, 45(22): 117-119.(in Chinese)
[8] 车远宏, 贾雍, 汤卓, 等. 皮尔逊相关系数在风电功率组合预测中的应用[J]. 广西电力, 2016, 39(3): 50-53. Che Yuanhong, Jia Yong, Tang Zhuo, et al. Application of pearson correlation coefficient in wind power combination prediction[J]. Guangxi Electric Power, 2016, 39(3): 50-53.(in Chinese)
[9] 彭涛. 基于特征和实例的海量数据约简方法研究[D]. 武汉: 华中科技大学, 2011.
[10] 范金城, 梅长林. 数据分析[M]. 第二版. 北京: 科学出版社, 2010.
The Classification Method of Vibration Signal From Air Conditioning Sheet Metal Based on Hierarchical Clustering Method
ZHENG Wenwei, WANG Yuhua, CHENG Xiang
(College of Mechanical and Electrical Engineering, Foshan University, Foshan 528000, China)
To solve the problem of vibration testing of Mute appliances, this paper describes the vibration signals acquisition on the stable working air-conditioning, The characteristics include RMS (Root Mean Square) and Kurtosis feature are extracted, selected signals which contain different two frequency components and typical characteristics of the classification of the signals conduct a Fast Fourier transform to calculate their correlation coefficient with others in frequency domain.Finally selecting the RMS and Kurtosis feature and the correlation coefficient as the index of Hierarchical Clustering Method to classify the signals. The experimental results show that the clustering method has a significant effect on the classification of vibration signals, and it can solve the problems of the traditional vibration testing in home appliances.
sheet metal vibration; signal processing; hierarchical clustering method; Fourier transformation
1671-7449(2017)01-0040-07
2016-11-02
广东省公益研究与能力建设专项资金资助项目(2015A010103017,2015B010101014); 佛山科学技术学院研究生自由探索基金资助项目
郑文炜(1991-), 男, 硕士生, 主要从事非接触式检测的研究.
TN911.7
A
10.3969/j.issn.1671-7449.2017.01.007