杨鸿忠
(吉林建筑大学基础科学部,长春 130118)
众所周知,水是万物赖以生存的基础.尤其对人类,饮用水的卫生和安全直接关系到人们的身体健康状况,随着工农业生产的迅猛发展,对天然水质造成的污染日趋严重.因此水中污染物净化问题越来越受到人们的重视.而水中污染物的处理办法无非是过滤和反应.对于一些体积大的颗粒污染物,一般采用过滤的方法,这些微粒的直径一般大于100μm.而在水中直径小于0.08μm的颗粒,我们就可以说这是可溶性污染物,对于这类污染物,我们一般采用一些化学方法让其反应生成无害物或反应生成大直径颗粒来过滤掉.
为了有针对性的处理天然水体和饮用水中低浓度、高毒性、难降解污染物(如多溴联苯醚、全氟辛酸(磺酸)、消毒副产物、内分泌干扰物、PPCPs(抗生素)等),我们建立了以下模型进行分析研究和模拟(主要针对消毒副产物进行建模).从而对天然水体和应用水体中的物质进行检验,能够考察一些突发性环境污染事故的影响,有效预测几种污染物在各个环境介质中的动态变化和受污染环境的恢复情况.为相关决策提供科学依据.
试建立支持向量机的回归算法数学模型说明如何对颗粒的污染物进行处理,达到净化污水的目的.
支持向量机(Supportveetormachines,SVM)是V即nik等人提出的一种基于VC维(v叩nik一ehervone放15dimension)理论和结构风险最小化原则的机器学习方法[1].
支持向量机是针对有限样本,在已有信息下得到最优解来作为其优化目标.因为使用了非常规算法,使支持向量机可以很好地解决传统机器学习中的线性不可分、维数灾难及局部极小值等问题.
支持向量回归算法:
向量机的回归算法,对于一组数据 {(xi,yi),…,(xm,ym)},x ∈ Rn,y ∈ Rn,用非线性映射到 φ(·)把样本数据映射到n维向量空间V.在n维向量空间用线性函数进行线性回归f(x)=wφ(x)+b,其中w为权值,b为偏置项[2].(SVR)引入δ不敏感损失函数:
SVR在n维向量空间V用δ不敏感损失函数进行线性回归[3],我们取最小值‖w‖2,使模型的难易程度降低.在允许误差的范围内,我们引入松弛变量δi≥0,δi*≥0,
使目标变为最小化:
式中第一项是回归函数更平坦,泛化能力更好,第二项则为减少误差.K位为正则常数,用以平衡回归函数的平坦程度和偏差大于δ的样本点的个数,即为调整模型的复杂性和经验风险的折中.引入拉格朗日乘子ai,ai*,λi,μi作出拉格朗日函数[4]:
要使上式取得最小值,对于参数 w,b,ξi,ηi的偏导数都应等于零,即
由此得到对偶优化问题.
由此,支持向量机的函数回归问题就可以归纳为二次规划问题.
式中,G(x,xi)=φ(xi)·φ(x),称为核函数.选择不同的核函数就形成不同的支持向量机.常见的核函数有线性函数、多项式函数、Sigmoid及径向基函数等,其中,径向基函数G(x,xi)=exp(-γ‖xi-xj‖2,r为核参数)由于能够较好地实现输入样本到n维向量空间V的非线性映射,且需要的参数较少,因此成为支持向量机应用中的首选核参数[4].例如,某环境监测部门利用动态光反射仪器测量出水中某污染物粒径随时间变化的值见表1.
表1 水中某污染物粒径随时间变化的值
将其构造成数据组(xi,yi)代入上述模型,利用MATLAB数学软件计算,得粒径y与时间x的线性函数关系为
支持向量机的回归算法数学模型就是使非线性问题转化为线性问题来研究分析预测,故与实际情况进行分析比较时存在较大误差,可再结合其它数学模型进行分析比较,比如shepard插值法水质评价数学模型;基于河网水动力数学模型和传输扩散数学模型,使误差会更小,从而为污水处理过程的正常运行和管理提供参考给出有力的科学依据.
[1]金春久,王 超,范晓娜,刘 伟.松花江干流水质模型在流域水资源保护管理中的应用.水利学报,2010(1):86-92.
[2]金菊良,杨晓华,金保明.水环境质量综合评价的新模型[J].中国环境监测,2000,16(4):42-47.
[3]党连文.松花江干流水质模型的系统原理[J].中国水利,2009(5):39-40.
[4]张 晶.污水处理过程模拟及系统软件开发[D].大连:大连理工大学,2011.