刘 寅,覃 红
(华中师范大学数学与统计学学院,武汉替换为 430079)
基于均匀设计Goldstein-Price函数模拟研究
刘 寅,覃 红*
(华中师范大学数学与统计学学院,武汉替换为 430079)
Goldstein-Price函数是A.A.Goldstein和J.F.Price 1971年首次提出的.Goldstein-Price函数是一个比较经典的二元多项式函数模型.有许多作者从优化和算法的角度对它进行详细的研究.最近,在计算机试验设计中,一些作者对 Goldstein-Price函数进行模拟研究.本文利用均匀设计和中心化四次回归的方法对 Goldstein-Price函数进行模拟,并重点考虑不同的均匀设计对拟合好坏的影响以及生成数据集时是否选取边界点对拟合好坏的影响.
Goldstein-Price函数;中心化四次回归方法;均匀设计
Goldstein-Price函数是一个二元八次多项式,它是A.A.Goldstein和J.F.Price[1]1971年中首次提出来的,其目的利用局部最小化算法去研究该二元多项式的局部最小值.最近,许多作者对Goldstein-Price函数从优化、算法、模拟等角度进行了研究.J.Andre等人[2]用改进的标准遗传算法对 Goldstein-Price函数进行研究,P.Ranjan[3]从随机超拉丁方设计出发利用序贯的方法对Goldstein-Price函数的等高区域进行了模拟.Chen[4]分别用带有高斯相关函数的 Kriging模型、二次响应曲面多项式等六种方法以及均匀设计、正交设计等五种不同的设计方法对 Goldstein-Price函数进行拟合,并比较了不同设计拟合的效果.S.C.Chung和 Y.C.Hung[5]利用序贯权重均匀设计的方法对 Goldstein-Price函数的目标区域进行估计.
上述文献都是利用计算机试验来对Goldstein-Price函数这一经典的二元多项式函数模型进行研究.本文将利用均匀设计和中心化四次回归的方法对 Goldstein-Price函数进行模拟,并分别考虑不同的均匀设计对拟合好坏的影响以及构造数据集时是否选取边界点对拟合好坏的影响.
1.1 均匀设计
均匀设计是由我国学者方开泰教授和王元教授于70年代末应复杂系统建立数学模型并研究其诸多影响因素的需要而提出的一种试验设计方法[6-7],该设计要求试验点均匀散布在试验区域χ内.
由于均匀设计可以有效减少试验次数和降低试验成本,因此它被广泛应用于许多领域来解决实际问题.现在越来越多的人对均匀设计的理论和应用感兴趣,并取得了大量的理论和应用成果,详细的情况可参见文献[8-9].
一个n次试验,s个因子,每个因子有q个水平的均匀设计通常记为Un(qs).表1给了一个均匀设计U11(114)..这个设计有11次试验,4个因子且每个因子有11个水平.这个设计参见文献[10].下一节将利用 U11(114)去研究 Goldstein-Price函数.
表1 设计表Tab.1 Design table
1.2 Goldstein-Price函数
在 Goldstein-Price函数模型中,响应变量 y由下式决定
图1 Goldstein-Price函数图Fig.1 The picture of Goldstein-Price function
在 Goldstein-Price函数中,有2个输出变量x1和 x2,因此用表1中给出的均匀设计U11(114)中的因子A和因子B本别来研究变量x1和x2.对每一个输入变量,其11个水平1,2,…,11分别由原始模型的定义域[-2,2]中的11个等距的值来替换,这里不包括两个边界值.由此获得的U11(112)设计和由公式(1)式得到的相应的输出变量y值一并列入表2中.
现在考虑用多项式回归模型的子模型来近似真正的模型(1),为评价不同的输入变量对 y的影响,分别作出 y对2个输入变量之间按的关系图,见图2,其中图(a)是固定 x2在其中间值即 x2=0得到,图(b)是固定 x1在其中间值即 x1=0得到.这些图表明传统的中心化二次回归模型已经不能很好的近似模拟真实模型,因此考虑用更高阶的回归模型来逼近真实模型.本文用 x的中心化四次回归模型来近似逼近真实模型.
表2 设计表和相应的输出变量 yTab.2 The design and related outputy
图2 输出变量对输入变量的点图Fig.2 Plots of y against input variables
现在基于表2来建立中心化四次回归模型.由于在这个模型中有16个变量,用回归分析中的模型选择技术来去掉那些对模型没有帮助的项,由于n<16,只有前进法和逐步回归方法可以用.在这个问题中,借助于逐步回归得到结果.对于逐步回归方法,采用0.05作为显著性水平去在模型中添加或删除一个变量,表3给出了回归模型(2)的方差分析(ANOVA)表,其中表3(a)给出了模型(2)的总体方差分析的结果,表3(b)给出了模型(2)各分项的分析结果,可以看出 y对两个变量的中心化四次模型的逐步回归结果,除常数项外,有9项进入回归方程.
因此,得到如下的回归模型
与其它模拟方法相比,本文采用的中心化四次回归的方法具有较小的均方误差,因此模拟的效果更好.结果可见表4.
表3 模型(2)的ANOVA表Tab.3 ANOVA table for model(2)
表4 不同模拟方法比较[4]Tab.4 The comparison among different simulative methods
图3 模型(2)在1 000个随机点的预测误差Fig.3 Prediction errors at
传统的设计理论认为因子的水平数越高,由此拟合出来的回归方程与真实模型应该越接近.下面,研究一下低水平与高水平的均匀设计对Goldstein-Price函数进行拟合的影响.这里以 R2作为衡量模型拟合好坏的标准.R2越接近于1,则拟合越好;反之,则拟合越差.
这里,分别考虑低水平 q=5,6,7和高水平 q=11,13,15时的均匀设计对 Goldstein-Price函数拟合的影响.选取均匀设计表来自于文献[10],具体使用的设计见表5.
表5 不同水平的设计表Tab.5 Design tables with different levels
表6 高、低水平拟合函数的比较Tab.6 The comparison among simulative functions of high levels and low levels
根据表5来建立相应的数据集,并通过中心化四次回归的方法对 Goldstein-Price函数进行拟合,得到表6.
这里以 R2low表示低水平时拟合函数的 R2,以R2high表示低水平时拟合函数的R2.从表中,可以很清楚的看到,在q=11,13,15时,均有 R2high>0.99,特别的 q=11时,有 R2high=1.0000;q=7时,R2low=0.9715<0.99,这说明因子的水平数越高,用中心化四次回归的方法拟合的函数与真实模型越接近,也即用中心化四次回归的方法拟合的方程和 Goldstein-Price函数非常接近.因此,可以认为在对Goldstein-Price函数进行中心化四次回归建模时,通过高水平产生的数据集建立的拟合模型比低水平产生的数据集建立的拟合模型要好,这与传统理论的结论是一致的.
在利用均匀设计表构造数据集时,通常有两种方法,一种不取边界值,另一种是取边界值.下面来研究是否取边界值对于中心化四次回归建模的影响.
4.1 不取边界的情形
首先通过变换使得取值落在区间(-2,2)中,其中 k是因子的水平,q是因子的水平数.
以q=11为例来说明具体的方法.当不取边界时,本文所用的均匀设计表为U11(112).将通过变换(3)获得的数据和由(1)式得到的相应的输出变量 y值一并列入表7中.
基于表7中的数据,可以建立如下的回归函数:
表7 q=11时设计表和相应的输出变量 y(不取边界)Tab 7 The design table and related outputyat levelq=11(without boundary)
其中,R2=1.0000.
4.2 取边界的情形
通过变换
k=1,2,…,q使得取值落在[-2,2]之间来构造数据集.
以q=11为例来说明具体的方法.当取边界时,本文所用的均匀设计表为U11(112).将通过变换(4)获得的数据和由(1)式得到的相应的输出变量 y值一并列入表8中.
表8 q=11时设计表和相应的输出变量y(取边界)Tab.8 The design table and related outputyat levelq=11(with boundary)
基于表8中的数据,可以建立如下的回归函数:
其中,R2=0.9995.
4.3 比较
是否通过不取边界值建立的数据集进行拟合的函数要比通过取边界值建立的数据集进行拟合的函数要好呢?下面按照5.1和5.2中介绍的方法对q=13和q=15的情形进行模拟研究,具体结果列举在表9中.
表9 取边界与不取边界拟合函数的比较Tab.9 The comparison among smulative functions of choosing points with boundary and without boundary
以 R2wo表示不取边界值时拟合函数的 R2,以R2w表示取边界值时拟合函数的R2.从表9中,可以看到当 q分别取11、13、15时,均有 R2wo>R2w成立,也就是说通过不取边界值进行拟合得到的函数比通过取边界值进行拟合得到的函数要好,也即通过不取边界值进行拟合得到的函数与真实模型更接近.
这一点,也可以借助于 Goldstein-Price函数的函数图像加以解释.从图1中看到 Goldstein-Price函数的局部极值点主要集中在函数图像的边界位置处,因此,当数据集不取到边界点时,得到的拟合函数更接近于真实模型.
本文作者利用中心化四次回归的方法对Goldstein-Price函数进行模拟,分别考虑不同的均匀设计对拟合好坏的影响以及构造数据集时是否选取边界点对拟合好坏的影响.首先,本文中的数据是基于一类重要的空间填充设计——均匀设计——生成的,而均匀设计具有较好的稳健性,它能够将试验点均匀的散布在试验区域内,从而有助于建模,使得近似模型能和真实模型在全试验区域内都很接近[6].其次,本文重点考虑了取边界值与不取边界值对拟合好坏的影响,这一点在过去的文献中是没有的.同时,这个例子也说明对于 Goldstein-Price函数,用高水平对函数进行拟合比低水平要好,不取边界值时拟合的函数要优于取边界值时拟合的函数.
[1]Goldstein A A,Price J F.On descent from local minima[J].Mathematics of Computation,1971,25:569-574.
[2]Andre J,Siarry P,Dognon T.An improvement of the standard genetic algorithm fighting premature convergence[J].Advances in Engineering Software,2001,32(1):49-60.
[3]Ranjan P,Binggham D,Michalidis G.Sequential experiment design for contour estimation from complex computer codes[J].Technometrics,2008,50(4):527-541.
[4]Victoria C,Chen P.A review on design,modeling and applications of computer experiments[J].IIE Transactions,2006,38:273-291.
[5]Chung S C,Hung Y C.Uniform design over general input domains with applications to target region estimation in computer experiments[J].Computational Statistics&Data A-nalysis,2010,54:219-232.
[6]方开泰.均匀设计[J].应用数学学报,1980,3:363-372.
[7]王 元,方开泰.关于均匀设计与试验设计(数论方法)[J].科学通报.1981,26:65-70.
[8]Fang K T,Wang Y.Number-Theoretic Methods in Statistics[M].London:Chapman and Hall,1994.
[9]Fang K T,Li R,Sudjianto A.Design and modeling for computer experiments[M].London:Chapman and Hall,2005.
[10]方开泰.均匀设计与均匀设计表[M].北京:科学出版社,1994.
Abstract:Goldstein-Price function was first proposed by A.A.Goldstein and J.F.Price in 1971,which is a classical polynomial model with two variables.Considerable study has been done on this function in computer experiments.In this article,the quadratics regression method is used to simulate the Goldstein-Price function,and we consider the influence on the simulative the Goldstein-Price function,and we consider the influence on the simulative functions resulted from choosing different uniform designs as well as whether choosing boundary points to construct data or not.
Key words:Goldstein-Price function;quartics regression method;uniform design
Goldstein-Price function in the application of uniform designs
LIU Yin,QIN Hong
(School of Mathematics and Statistics,Huazhong Normal University,Wuhan 430079)
O212.6
A
1000-1190(2010)04-0535-06
2010-04-23.
国家自然科学基金项目(10671080);教育部新世纪优秀人才支持计划项目(06-672).
*通讯联系人.E-mail:qinhong@mail.ccnu.edu.cn.