一维对流扩散方程的勒让德神经网络解法研究

2019-06-11 03:13:50杨云磊侯木舟罗建书

中北大学学报(自然科学版) 2019年4期

杨云磊，侯木舟，罗建书

(1. 中南大学数学与统计学院，湖南长沙 410083； 2. 湖南交通工程学院高科技研究院，湖南长沙 421001)

科学和工程领域中的很多问题涉及到偏微分方程(PDE)的数值解，大量的物理现象，从流体流动到电磁场领域，热扩散和海洋声波的传播等等广泛的科学问题，建立的很多数学模型都是对流扩散方程，关于模型的准确解或近似解的求解，对研究数学模型的意义非常重要，然而很多情况下，求得模型的准确解或者良好的数值解是非常困难的或不可行的，因此研究对流扩散方程的数值解很有必要.

PDE数值解法的传统研究包括差分格式的建立，网格剖分，线性方程组的求解及差分格式的相容性、收敛性和稳定性的证明[1]，围绕这些研究产生了很多PDE数值方法，如比较熟悉的差分方法、有限元方法、有限体积法等等[2]. 一维常系数对流扩散方程是一类特殊的PDE，这些数值方法也适用于计算对流扩散方程.

神经网络的应用涉及很多领域，如模式识别[3]、图像处理[4]、风险评估[5]、系统控制[6]、预测[7-8]、分类[9]等方面. 随着神经网络研究的发展，关于神经网络逼近能力的研究促进了神经网络在微分方程数值解中的应用. 如：侯木舟等提出构造小波神经网络逼近实函数[10]，构造小波RBF神经网络[11]，L2(R)上的RBF神经网络[12]及衰减的RBF神经网络[13]逼近任意多元函数，Guangbin Huang提出极限学习机的概念[14]，并在其很多研究[15-18]中给出极限学习机逼近能力的证明.

根据神经网络的逼近能力，可以构造微分方程问题的近似解，从而建立微分方程数值解的神经网络模型. 如微分方程两点边值问题的神经网络解法[19]，传输线方程的神经网络模型算法[20]等，均采用余弦基函数作为神经网络隐层激活函数. 本文根据勒让德多项式的微分性质及矩阵张量积的性质，构造一维对流扩散方程的勒让德神经网络模型，采用改进的极限学习机(IELM)算法求解网络权值，并进行数值实验来分析网络拓扑结构对计算结果的影响.

1 理论知识

1.1 勒让德多项式微分性质

勒让德多项式P0(x),P1(x),…,Pn(x)满足三项递推公式

(1)

(2)

(3)

(4)

(5)

由方程 (4)～(5) 可得

(6)

其次, 求(n+1)Pn+1(x)=(2n+1)xPn(x)-nPn-1(x)关于x的导数

(7)

由方程 (6) 和 (7) 可得

(8)

由方程 (8), 经过递推易得P′(x)=P(x)M和矩阵M.

1.2 矩阵张量积

定义1[21]设A=(aij)∈Cm×n,B=(bij)∈Cp×q, 则如下分块矩阵

为A与B的张量积, 简记为A⊗B=(aijB).

矩阵张量积性质:

如果A∈Ck×m,B∈Cp×s,C∈Cm×n,D∈Cs×q, 则(A⊗B)(C⊗D)=(AC)⊗(BD).

2 勒让德神经网络方法

一维对流扩散方程第一边值问题一般形式为

(9)

式中：系数u,v是常数；x∈[0,a]；m是已知常数. 问题(9)就称为常系数一维对流扩散方程的数值解问题.

定理2对任意两元连续二阶可导函数ρ(x,t)∶D→R,D=[a,b]×[c,d]存在自然数n, 常数βij(i=0,1,…,n；j=0,1,…,n), 勒让德多项式P0(x),P1(x),…,Pn(x),P0(t),P1(t),…,Pn(t), 使得当n→∞时，有

(10)

‖ρ(x,t)-ρ*(x,t)‖2=

∬D[ρ(x,t)-ρ*(x,t)]2dxdt=

(11)

式中：ρ*(x,t)为ρ(x,t)的最佳逼近, 即‖ρ-ρ*‖ 能够取得最小值.

证明假设

β00P0(x)P0(t)+β01P0(x)P1(t)+…+

β0nP0(x)Pn(t)+β10P1(x)P0(t)+….

(12)

令

E=‖ρ(x,t)-ρ*(x,t)‖2=

∬D[ρ(x,t)-ρ*(x,t)]2dxdt.

(13)

为了找到能够使得E取得最小值的βij的值, 令E关于所有βij的偏导数等于零，可得如下方程组

(14)

令

P(x)=[P0(x),P1(x),…,Pn(x)],

(15)

P(t)=[P0(t),P1(t),…,Pn(t)],

(16)

P(x,t)=P(x)⊗P(t)=

[P0(x)P0(t),P0(x)P1(t),…,P0(x)Pn(t),

P1(x)P0(t),…,P1(x)Pn(t),…,Pn(x)Pn(t)],

(17)

β=[β00,β01,…,β0n,β10,…,β1n,…,βn0,…,βnn],

(18)

(19)

方程 (14) 可以改写成

(20)

由矩阵分析理论可知，方程 (20) 有唯一解, 所以能够求出βij的值及近似解ρ*(x,t), 使得E取得最小值.

定理3假定ρ(x,t)是问题(9)的准确解，由定理2可知，存在ρ*(x,t)是ρ(x,t)的近似解.

证明由定理1，矩阵张量积性质及定理2，很容易构造ρ(x,t)的近似解ρ*(x,t).

假定ρ*(x,t)是ρ(x,t)的近似解，且存在自然数n, 常数βij(i=0,1,…,n;j=0,1,…,n), 勒让德多项式P0(x),P1(x),…,Pn(x),P0(t),P1(t),…,Pn(t)使得当n→∞时，有

(21)

且

P(x,t)(I⊗M)β,

(22)

P(x,t)(M⊗I)β,

(23)

P(x,t)(M2⊗I)β,

(24)

ρ*(x,t)满足初边值条件

(25)

(26)

(27)

假定ρ*(x,t)是ρ(x,t)的近似解，则

(28)

将式(21)～(27)代入式(28)，可得

(29)

此时，方程(29)是权值β的方程组，通过优化算法求出方程组的解，即β的值，可得ρ(x,t)的近似解ρ*(x,t)，即是问题(9)的近似解.

(30)

可得问题(9)的离散形式

Hβ=T.

(31)

此时，问题(9)就转化为求解方程组(31).

定理4方程(31)是可解的, 且满足如下三种情况:

1) 若矩阵H为方阵且是可逆的，则β=H-1T;

证明定理的证明可参考矩阵论[21]中矩阵广义逆理论及Guang-Bin Huang的文章[14-18]. 算法步骤：

1) 选择两个勒让德多项式的乘积P(x)P(t)作为激活函数，建立问题(9)的神经网络模型，构造近似解ρ*(x,t)；

2) 将ρ*(x,t)代入问题(9)得到方程(29)；

3) 将方程(29)表示成矩阵形式(31)；

3 数值实验

这里以数值实验来验证勒让德神经网络方法的有效性.

例1当u=0.01,v=1,a=1时，求对流扩散方程

例2当u=0.1,v=0.1,a=2时，求对流扩散方程

表 1 实验结果

由表 1 中数据可知，随着隐层神经元的增加，计算精度提高，但绝不是越多越好. 当n=20时，例 1 的计算精度为6.445 4×10-9，此时计算时间仅需要0.210 7 s. 当n=10时，例 2 的计算精度为6.376 1×10-5，此时计算时间仅需要0.037 9 s. 采用所提出的新方法，能够由简单的网络拓扑结构，用较快的速度达到一定的计算精度.

图1 和图2 表示随着n值不同，例 1和例 2 的计算时间. 图3 表示误差与神经元之间的关系. 图4 表示计算时间与神经元之间的关系.

图1 例 1 所用时间Fig.1 Calculation time of example 1

图2 例 2 所用时间Fig.2 Calculation time of example 2

图3 n取不同值的计算误差Fig.3 Error with different values of n

图4 n取不同值时的平均计算时间Fig.4 Average calculation time with different values of n

4 结论

本文主要介绍求解一维对流扩散方程问题的勒让德神经网络方法，建立该问题的神经网络模型，当近似解满足偏微分方程及初边值条件时，根据矩阵分析理论，可以采用基于广义逆矩阵的IELM算法求解近似解中的权值，为一类常系数一维对流扩散方程问题的数值解提供一种新的方法. 数值实验结果表明，采用IELM算法求解神经网络模型中的权值参数，当样本量给定时，计算精度及速度只与网络拓扑结构中隐层神经元数量有关，且只需少量的隐层神经元，通过改变神经元数量即可得到相应的计算精度. 本文的实验结果可以为该方法在应用时隐层神经元的选择提供参考，未来可以研究该算法的推广能力，如隐层神经元的最优取值区间等.