韩波,郭梅修
(北海市环境监测中心站,广西北海536000)
遗传投影寻踪回归在城市环境质量评价中的应用
韩波,郭梅修
(北海市环境监测中心站,广西北海536000)
引入投影降维的思想,将遗传投影寻踪与回归分析技术运用到城市环境质量评价中。将此技术与神经网络方法进行实例比较,投影寻踪回归方法不但可以合理地作出环境质量的综合评价,而且消除了神经网络方法中类别判断不够精确的影响。
投影寻踪;遗传算法;城市环境质量;评价;回归分析
城市环境质量评价,就是根据城市各组成要素及其特征污染指标进行全环境的综合质量评价。城市环境的复杂性使得人们难以用数学的方法为其建立精确的模型。近年来城市环境质量评价方法的研究进展迅速,尤其是运用层次分析、模糊数学和神经网络的方法进行城市环境质量评价已成为一种时尚,并取得了很多成果[1~3]。然而,这些方法也存在一些缺陷,如层次分析和模糊数学很难摆脱评价过程中的随机性和参评人员主观上的不确定性及其认知水平上的模糊性,不同的人采用同一案例,常常会得出不一致的评价结果。如何科学、客观地将一个复杂高维空间数据的分布综合成简单指数的形式,已成为城市环境质量评价研究的焦点。该研究尝试应用遗传投影寻踪回归方法对城市环境质量进行评价,以期为城市环境质量评价开辟新的途径。
投影寻踪是一种处理多因素复杂问题的统计方法,即利用计算机技术,首先根据经验给定一个初始模型,把数据投影到低维空间上,找出数据与现有模型相差最大的投影,然后把投影中所包含的结构并在现有模型上,得到改进的新模型,再从这个新模型出发,重复以上步骤,直到数据与模型在任何投影空间都没有明显的差别为止。若将投影寻踪与回归分析结合,则形成城市环境质量评价投影寻踪回归模型[4]。具体步骤如下:
步聚1:构造投影指标函数。设依据城市环境各指标评价标准表产生评价等级及其环境指标分别为y(i)及{x*(j,i)|j=1-p},i=1-n。其中,n,p分别为样本个数和指标个数。污染越重,评价等级就越高,最低等级设为1,最高等级设为N。建立评价模型就是建立{x*(j,i)|j=1-p}与y(i)之间的数学关系。投影寻踪方法就是p维数据{x*(j,i)|j=1-p}综合成以a=(a(1),a(2),…,a(p))为投影方向一维投值Z(i):
然后根据Z(i)-y(i)的散点图建立数学关系。为了消除各污染指标值的量纲和统一各指标值的变化范围,式(1)中a为单位长度向量,a(j)为指标投影方向单位向量,{x(j,i)=|j=1p,为(x*(j,i)=|j=1-p)的标准化值,即:
式(2)中,xmax(j)为根据评价标准表确定的第j个指标的最大值。
在综合投影值时,要求投影值构造一个投影指标函数Z(i),Z(i)应尽可能大地提取{x(j,i)}中的变异信息,即z(i)的标准差Sz达到尽可能大;同时要求z(i)与y(i)的相关系数的绝对值|Rzy|达到尽可能大:
式中,Sz为投影值z(i)的标准差:
Rzy为z(i)与y(i)的相关系数:
步骤2:优化投影指标函数。当给定评价等级及评价指标的样本数据{y(i)=|i=1-n}和{x*(j,i)=|j=1-p,i=1-n}时,投影指标函数Q(a)只随着投影方向a的变化而变化。可通过求解投影指标函数最大化问题来估计最佳投影方向,即:
这是一个以为优化变量的非线性优化问题,用常规方法很难处理,而用遗传算法来求解就显得十分简便和有效。
步骤3:建立投影寻踪回归质量评价模型。把由步聚2求得的最佳投影方向的估计值a代入(1)式后即得第i个评价等级投影值的计算值z(i),根据z(i)-y(i)的绘制散点图进行回归分析,寻找较好评价等级值y(i)与投影值z(i)的非线性方程。研究表明z(i)-y(i)关系为非线性对数函数类型:
遗传算法是Holland教授于1969年提出,后经DeJong等人归纳总结所形成的一类模拟进化算法。遗传算法与传统搜索算法不同,它以适应度函数为依据,通过对种群中的所有个体实施遗传操作,实现群体内个体结构重组的迭代过程随机搜索算法。选择、杂交、变异构成遗传算法的三个主要遗传操作因子,其主要计算步骤如下:[5]
(1)选择一定数目的个体构成初始种群,并求出种群内各个个体的函数值。
(2)设置迭代代数,开始循环。
(3)计算选择函数的值,选择即通过概率的形式从种群中选择若干个体的方式。
(4)通过染色体个体基因的复制、交叉、变异等创造新个体,构成新的种群。
(5)进行循环,若终止条件不满足,则转到步骤(3)继续进化。
刘晓莉等人[6]采用神经网络方法对1997-2002年广州市城市环境质量进行了评价,评价选取指标体系为:大气环境为二氧化硫(SO2)、二氧化氮(NO2)、氮氧化物(NOx)、总悬浮颗粒物(TSP);水环境为总磷(TP)、生化需氧量(BOD5)、石油类(OIL);声环境为交通噪声(Leq交)和区域噪声(Leq区)3个要素9个评价指标。城市环境质量评价标准见表1。在应用投影寻踪回归法之前,需要把表1处理成足够的、有效的样本数据,才有利于模拟环境系统的复杂性和精度。这里采用线性等隔内插法在表1各级评价等级取值范围内均匀生成10个指标值,与对应的评价级别线性等隔内插值(等级值)一起组成样本数据,如表2所示。
表1 城市环境质量评价标准
表2 城市环境质量标准内插值和寻踪投影回归的计算值的对比结果
续表2
从表2所构建的评价标准样本数据出发,首先根据式(2),把表2中各数据进行标准化,然后通过编制目标函数和约束函数两个文件后调用gatool,在Matlab7.8版图形用户界面(GUI)完成相关参数设置,进行计算,种群数为20,变异采用自适应方法,其他采用工具箱默认设置,程序运行后,得到最佳投影方向a=(0.0360.1580.2240.6160.0760.5380.0890.4910.015)。把a代入(1)式后可求得城市环境质量评价等级的投影值z(i),见表2。将y(i)与z(i)经非线性曲线拟合后,得到评价等级y(i)与z(i)的关系式(图1)和等级计算值结果(表2)。
图1 投影值与评价等级的关系
将文献[6]1997-2002年广州市环境指标监测值(实际数据)和按上述建立的城市环境质量评价模型计算各个评价指标的投影值、等级计算值结果列于表3,文献[6]神经网络法计算的特征值和评价结果列于表4。
表3 1997-2002年广州市环境指标监测值与投影寻踪回归评价结果
表4 1997-2002年广州市环境质量神经网络法计算的特征值和评价结果
由表3、表4两种评价结果可知:2000-2002年神经网络法与寻踪投影回归法不尽相同,从原始数据分析:2000年TSP、NOx、TP、BOD5、交通噪声,2001年SO2、NOx、TP、BOD5、交通噪声,2002年SO2、TSP、TP、BOD5、交通噪声,都超过了较好等级,按经验判别神经网络法评价是有误的,其原因一方面是神经网络训练样本数太少(仅用了5个训练样本),另一方面是神经网络结构不合理,在设置网络结构时应该将希望输出为一维输出,这样不仅网络收敛快,输出误差小,而且还可以消除输出结果离散化的影响。对比投影寻踪回归法,输出结果分别是人们便于识别的一维投影值和等级计算值。将等级计算值对照表1,证明评价结果合理,并且对照原始数据,不会产生不可信的误判。
采用遗传算法对寻踪投影模型的投影方向进行优化,将评价等级对应的投影值与回归分析技术相结合,构建了投影寻踪法用于环境质量等级类别的判定,精确量化了评价结果。通过实例分析比较,验证了投影寻踪回归法应用于城市环境质量评价较之神经网络更具可行性与合理性,避免了在权重给定中的人为任意性。遗传投影寻踪指标的权重,是通过寻找最佳投影向量获取,采用计算机技术完成,并具有严谨而科学的数学方法。最佳投影向量获得的投影值为评价污染程度提供了依据,能直观地比较出各样本间污染的轻重程度。另外,投影寻踪与回归技术结合,将量化城市环境质量评价污染等级的分类,它为涉及城市环境多因素的综合评价提供了一条新思路。
[1]徐福留,周家贵,李本纲,等.城市环境质量多级模糊综合评价[J].城市环境与生态环境,2001,14(2):13-15.
[2]刘殿伟,周云轩,付哲.吉林西部环境质量空间模糊综合评价[J].干旱区研究,2006,23(1):155-159.
[3]韩波.L-M神经网络在北海市城市环境质量评价中的应用[J].三峡环境与生态,2011,33(6):42-45.
[4]金菊良,魏一鸣,丁晶.水质综合评价的投影寻踪模型[J].环境科学学报,2001,21(4):431-434.
[5]陈广洲,解华明,鲁祥友.Matlab遗传算法工具箱在非线性优化中的应用[J].计算机技术与发展,2008,18(3):246-248,252.
[6]刘晓莉,李梦婷.基于Matlab的神经网络在城市环境质量评价中的应用[J].佛山科学技术学院学报:自然科学版,2005,23(1):41-44.
Application of Genetic Projection Pursuit Regression in the Evaluation of Urban Environmental Quality
Han Bo,Guo Meixiu
(Beihai Environmental Monitoring Center,Beihai Guangxi 536000,China)
The paper introduced the projection dimension reduction ideas and applied the genetic projection pursuit regression technique to the evaluation of urban environmental quality and compared this technique with the neural network method.It is found that projection pursuit regression method is not only reasonable to make a comprehensive evaluation of the environmental quality,but also eliminate the effect of category judgment’s inaccuracy in the neural network method.
projection pursuit;genetic algorithm;urban environmental quality;evaluation;regression analysis
X820.2
A
1008-813X(2012)04-0011-05
10.3969/j.issn.1008-813X.2012.04.004
2012-04-28
韩波(1956-),男,河北省巨鹿县人,毕业于湖北理工学院环境监测专业,高级工程师,主要从事环境监测与科研工作。