王尉旭
摘 要:正则化弹性网络是一种强大的深度学习模型,结合线性回归和逻辑回归的特点,可以同时进行特征选择和参数控制,避免了传统正则化的部分局限性。离散傅里叶变换特征提取是一种常用的信号处理方法,可以提取信号中的特定频率的特征,在众多领域都有着广泛的应用。通过弹性网络正则化和加窗离散傅里叶变换的信号分析技术结合,进行了相应的研究和应用。以凯斯西储大学故障轴承振动数据为例,进行信号分析处理,再经过神经网络模型的学习和预测,从而得到了一个准确率较高的弹性网络模型。其方法对于众多复杂的问题都有着重要的研究价值。
关键词:深度神经网模型 正则化弹性网络 数据分析工具 信号处理
中图分类号:TP183
Research and Application Based on the Combination of Data Analysis and the Deep Neural Network
WANG Weixu
Chongqing Jiaotong University, Chongqing, 400074 China
Abstract: A regularized elastic net is a powerful deep learning model, which can combine the characteristics of linear regression and logistic regression to perform both feature selection and parameter control, avoiding some of the limitations of traditional regularization. Discrete Fourier transform feature extraction is a commonly-used signal processing method that can extract specific frequency features from signals, and it has a wide range of applications in many fields. This article combines the signal analysis technology of elastic net regularization and windowed discrete Fourier transform to conduct corresponding research and applications. This article takes the vibration data of faulty bearings from Case Western Reserve University as an example, performs signal analysis and processing, and then obtains an elastic net model with high accuracy through the learning and predicting of the neural network model. This method is of great research value for many complex problems. Key Words: Deep neural network model ; Regularized elastic net; Data analysis tool ; Signal processing
随着科技的飞速发展,人工智能技术逐渐渗透到各个领域,为人类社会带来了前所未有的变革。而神经网络的研究和应用备受关注。正则化弹性网络是一种重要的神经网络深度学习模型,有着线性回归和逻辑回归的优点,广泛应用于图像识别、自然语言处理等领域,其能够更好地处理非线性化问题。傅里叶变换峰值特征提取是利用傅里叶变换来识别和提取信号中的重要特征方法,这种强大的数据分析工具,可以帮助我们更好地去了解信号和数据的内在结构和特征。
本文旨在探讨傅里叶变换数据分析工具与正则化弹性网络结合的技术原理和应用,通过深入剖析其中的正则化弹性网络和傅里叶变换峰值提取结合的基本原理和算法,揭示其内在的规律和特点,为进一步的研究和应用奠定基础。
在应用方面,本文将详细介绍正则化弹性网络和傅里叶变换特征提取的应用。通过滚动轴承故障诊断为例,本文将证明正则化弹性网络和傅里叶变换特征提取的数据分析方法在信号数据处理的应用效果和优势,为相关领域的研究和实践提供有力支持。
最后,本文将对正则化弹性网络和傅里叶变换特征提取的应用前景进行展望。希望通过本文的研究,能够进一步推动神经网络人工智能领域的发展,为人类社会的进步和发展做出更大的贡献。
1 正则化弹性网络
1.1 正则化弹性网络概述
正则化弹性网络是强大的深度学习模型,结合了线性回归和逻辑回归的优点,将神经网络的参数进行稀疏化约束,对于稀疏化特征筛选,引入L1正则项,在模型中完成特征筛选[1],通过L1范数和L2范数作为正则项来优化模型的损失函数。通过不断地调整参数,控制权重限制的程度,进一步优化模型的复杂度和泛化能力之间的平衡,使得模型的预测误差最小化,能够处理高维数据和复杂的非线性问题。
正则化弹性网络的优点这就是能够同时实现特征选择和模型复杂度控制。所以,弹性网络在高纬数据集和特征相关性较高的情况下表现出色。更是可以在复杂的问题中,实现有效解,不会产生交叉的路径。在特征选择、回归分析、图像处理、自然语言处理、推荐系统和生物信息学等领域有着广泛的应用。
1.2 正则化弹性网络原理
正则化弹性网络的原理主要基于线性模型的优化,通过添加L1范数和L2范数的惩罚项,对线性模型进行正则化,对这两个正则化项的权重调节来控制模型的特征选择和模型复杂度。
弹性网络中的L1范数的惩罚项促使部分特征权重变为0来实现特征选择,而L2范数的惩罚项来控制模型的复杂度,所以通过调整这两个正则化项的权重,来找到一个较为良好的平衡点,提高模型泛化能力。
2 傅里叶变换特征提取
频域特征的基础是傅里叶变换[2],傅里叶特征抽取是一种常见的信号处理技术,它通过傅里叶变换来提取信号的特征。这种方法将信号从时间域转换为频率领域,然后通过对信号进行频域分析,将信分解成为一系列不同频率和振幅的正弦波的叠加。通过频谱分析,我们能够了解信号在各个频率上的能量分布,从而提取出信号的特征信息。
傅里叶特征提取应用于众多领域,例如音频处理、图像处理、信号处理等。在音频处理中,可以利用傅里叶特征提取来提取音频信号的频谱特征,用于音频分类、声音识别等任务。在图像处理中,可以将图像转换为频率域表示后,提取图像的频谱特征用于图像分类、图像识别等任务。
3 正则化弹性网络和离散傅里叶变换特征提取结合在轴承故障诊断中的应用
3.1 凯斯西储振动数据分析处理
本文选取了凯斯西储大学的轴承振动数据作为数据集进行数据分析和神经网络训练[3],常见的故障特征提取方法包括时域特征、频域特征和时频域特征[4],所以研究人员选用傅里叶特征提取来解决轴承故障类型故障诊断的多分类问题。
将振动数据进行归一化处理后进行Blackman窗口函数加窗处理。Blackman窗口函数是一种常用的窗函数,具有较窄的主瓣宽度和较低的旁瓣高度,能够提供较好的频率分辨率和较小的频谱泄漏。在故障诊断领域,Blackman窗口函数可以对振动信号进行增强处理,突出信号中的特定频率成分,提取特征,以用于模式识别算法,如向量机和本文使用的人工神经网络。
傅里叶变换可以将信号从时域转换到频域,其基本思路是将信号转换为一组正弦波的线性组合,将信号分解成不同频率的分量,用于信号的频率分析。
离散傅里叶变换是傅里叶变换的一种离散形式,在离散傅里叶变换中,信号只在特定的时间点上有值,用于处理离散信号,如数字信号、离散传感器信号。离散傅里叶变换将离散信号转换为复数序列,每个复数对应一个频率分量,从而将离散信号转换到频率,对于一个有限长度的离散信号,x其离散傅里叶变换可以用以下公式表示:
X[k] = ∑_{n=0}^{N-1} x[n] * e^{-i2πk*n/N}
这个公式表示,离散傅立叶变换将每个样本x乘以e^{-i2πk*n/N},然后将所有的乘积进行求和,其中表示第k个频率分量的振幅。
加窗离散傅里叶变换后的频率信号,有利于分析信号的频率成分,在故障诊断领域中可以反映出不同故障的特有频率,对于本文的轴承故障诊断数据应提取其高幅峰值频率。本文对归一化后幅值大小前20的频率数据进行记录并排序,用于神经网络输入。
3.2 正则化弹性网络的Matlab构建
fitnet函数用于创建一个具有一层隐藏层的神经网络函数,通过使用基于误差的反向传播算法进行网络训练。该函数在网络输入时会自动将数据进行适当的预处理,如归一化、标准化。在使用fitnet训练神经网络时,Matlab会自动使用trainlm函数进行正则化,包括L1和L2正则化。
Trainlm函数使用Levenberg-Marquardt算法来训练多层感知器LMP,该算法是一种迭代优化算法,用于解决最小二乘优化问题。该函数与fitnet函数结合时,Trainlm函数会自动计算L1和L2正则化项的权重,并最小化带正则化的损失函数,有助于在训练过程中自动调整正则化强度,从而得到一个具有良好泛化能力的弹性网神经网络模型。
L1正则化式:
将其加入损失函数(表示为loss),变成:
是超参数。除了能够约束参数量级之外,L1正则化还能起到稀疏化参数的作用。
L2正则化式:
L2代表求权重的欧几里得范数,也叫作L2范数:
假设待正则的网络层参数为,L2正则式为:
将其加入损失函数(表示为loss),变成:
上述式中,是一个模型中的超参数,一般被称作为正则化参数。
在Matlab中fitnet 函数中,L1实现的公式:
,其中,W是模型矩阵,取其绝对值然后求和。
L2则是用Matlab中的vecnorm函数可以实现。通过计算矩阵的范数来实现。公式如下:
L2=norm(A,2)A 是模型矩阵,对于矩阵中每一个元素平方后求和,然后取平方根。
弹性网络正则化则是结合L1和L2正则化,正则化式:
3.2.3 配置网络参数
(1)传递函数。
本文选取Tansig函数作为隐藏层激活函数。
Tansig函数是神经网络模型中的一种常用的激活函数,其非线性映射能力强,可以将输入值非线性映射到输出值,从而有效地解决线性不可分的问题。Tansig函数还有计算效率高的优点,其采用简单的数学公式和计算方法,速度快。
(2)隐藏层节点个数。
根据样本数据和问题的复杂程度,本文设置了一层隐藏层以避免网络复杂化、网络训练时间过长和出现过拟合的倾向。
隐藏层节点数应小于训练样本数减一,否则网络模型的系统误差与训练样本的特性无关而趋于零,即建立的网络模型没有泛化能力,也没有任何使用价值[5]。
训练样本数必须多于网络模型的连接权数,一般为其的2~10倍,否则样本必须分成几部分且必须采用“轮流训练”的方法才能得到可靠的神经网络[5]。
本次网络训练样本量为2 717,输入特征序列长度为20,输出层节点数即分类类别为32,得到隐藏层节点数范围应在6~25之间,因此研究人员选取中间数15作为隐藏层节点个数。
(3)性能指标。
本文选取了MSE作为弹性网神经网络训练的训练指标,MSE易于计算和理解,值越小,模型的性能越好。并且,MSE适用于各种不同类型的模型和数据集,对于分类问题,MSE能够作为评估性能的有效指标。
(4)设置目标误差1。
3.3 模型训练及验证
将样本集随机打乱后划分为训练集和测试集,测试集用于评估验证该模型的分类正确率。通过Matlab神经网络工具箱对该网络进行代码实现,在训练集样进行训练后,得到弹性网神经网络模型,各参数如图 1所示。
图 1展示了模型预测输出和目标输出之间的误差分布情况,将训练数据集的每个样本的误差进行统计,并进行分组,可以直观地看出模型在不同误差范围内的表现,以及是否存在异常点。
图 2是训练过程变化图,图二中第一个曲线表示了训练过程,显示了训练过程中每一次误差迭代的变化,用于了解网络的改进过程;第二个是训练误差的曲线,用于评估模型在未见过的数据上的性能;第三个曲线表示了权重和偏置的变化,显示了权重和偏置参数随迭代次数的变化;
用测试集对模型验证评估。
准确率验证:对于分类问题,准确率能直观地体现神经网络的性能,表明模型的泛化能力,能够在新数据上进行有效的推断。
准确率计算过程:将测试集预测输出矩阵进行二值化处理,即每列(一份样本输出)中最大概率化为1,其余概率化为0,与测试集的预期输出矩阵进行比较,得到该测试集经过本神经网络预测的准确率。
本模型经过多次初始化并训练,求得模型的准确率范围在0.965~0.980,准确率高,说明模型对于轴承故障类型诊断问题的解决能力强。
4 结论
本文以凯斯西储大学的正常及各故障类型的振动数据为例,对信号分析和神经网络结合方法进行研究应用。将振动信号进行归一化处理后进行Blackman窗口函数进行加窗处理。从而对振动信号进行增强并提取特征。然后经过离散傅里叶变换将信号从时域转换为频域,根据不同轴承故障类型具有独有的高幅度高频特征频率,对幅频谱进行峰值提取,以最高的20个幅值对应的频率归一化处理后作为正则化弹性网络的训练样本,选择神经网络的训练函数并调整各参数,经验证后,得到准确率较高的神经网络模型。本文方法得到的神经网络模型高效准确,足以证明该结合方法有效且具有良好的前景。
正则化弹性网络在回归和分类问题上表现出色。在医疗、金融等众多领域都取得了显著的成果。随着计算能力的提升和算法的优化,正则化弹性网络的性能也将会不断优化。
而离散傅里叶变换提供了对信号频率特性的深入理解,在许多应用中具有重要的价值。随着计算能力的提升,未来可以利用更高效的方法实现离散傅里叶变换特征提取,可以将其探索于其他更广泛的领域。
总之,随着技术的不断进步和应用需求的不断提升,信号分析技术与神经网络技术的结合方法将会是一种高效准确的信号处理技术,将会为各种实际应用提供更好的支持。
参考文献