基于最优化方法与合作博弈理论的排污成本分配模型

2015-05-30 10:48刘丽华黄晓宇

环境 2015年13期

刘丽华　黄晓宇

摘要：数学最优化方法是解决环境管理问题的一种常用手段。而对于普遍存在冲突与妥协等问题的环境管理领域，博弈论也是一种重要的应用手段。目前，污水处理厂作为我国常见的排污个体，因其管理受各种限制，未能实现环境-成本的最优化。本文从该角度，将最优化理论与合作博弈理论结合，通过研究排污量-成本的分配模型，以同一流域范围内的不同排污口为基础，为改变常用平均分摊法导致成本较高的弊端，建立了排污口处理率分配优化模型，并通过数学方法，求得了该二次规划问题的解析解。同时，使用Shapley值法对联盟获得的收益（即减少的成本）进行再分配，使各参与成员的成本对比参与联盟前有所降低。本文以粤西漠阳江流域范围内的春湾、合水、春城三家污水处理厂为实例，进行了模型应用验证。

关键词：最优化方法合作博弈分配模型

在社会发展过程中，水资源已成为影响区域发展的重要资源，流域范围内水资源利用的冲突，归根就是各利益主体的水资源开发利用和水环境保护合作问题。解决流域环境问题冲突时，排污权分配是一个重要问题，一般以多目标优化模型为技术手段，以达到流域全局最优策略；但各个主体的既得利益也不能忽视，如何通过谈判达到多赢效果也是一个重要问题。因此，博弈论也被广泛应用于流域内的排放、分配问题的研究。污水处理厂作为我国常见的排污个体，由于种种原因仍处粗放式管理，同一流域的污水处理厂，可能存在地域性的不公平，未能达到整体的最优化。本研究从这个角度切入，通过建立最优化-合作博弈模型，研究了同一流域内不同污水处理厂的排污量分配及利益分配方案，实现区域整体最优化，并通过利润再分配减少了各参与主体的成本。

1 文献综述

目前我国在控制改善环境质量方面，污染物总量控制制度发挥着重要作用。基于总量控制下的河流排污权分配，我国学者利用优化模型进行研究，如陈阳[1]等研究了一种基于相互补偿的协商分配模型。刘首文[2]等、黄国如[3]等以基本遗传算法求解多个排放口的最优化处理问题。王艳[4]运用最优控制原理与博弈论，研究了流域水环境管理的区域间自愿合作协商促进机制。刘红刚[5]等采用合作博弈论方法，建立了在给定污染物总削减比例条件下各区域环境合作的博弈模型。在国外方面，Deininger[6]使用线性规划方法研究了在保证预设水质要求的条件下污染负荷的最优分布。Liebman和Lynn[7]、Shih[8]使用动态规划识别了污染负荷沿着一条河流的最优分布。Loucks等[9]建议对于同一类问题推广线性规划方法。Ecker[10]提出了一个几何规划模型，并用于在维持现状溶解氧水平的基础上优化河流污染负荷分配，以达到处理费用最小化。CardweIJ和Ellis[11]提出了一种最优化模型，用于在考虑参数不确定性和模型不确定性的清况下，进行多个点源的污染负荷分配。总体来说，国外对环境冲突问题的研究日渐深入，博弈论在国外环境科学领域的研究成果非常丰富，提出过包括流域污染微分博弈的旁支付方法、流域污染多阶段超级博弈模型等方法，几乎博弈论的每一个最新成果，在环境问题中都能找到应用实例。

2 区域污染物排放量最优化分配模型

2.1 问题提出

假设某一流域存在n个排污口，如n个污水处理厂。将每个排污口作为整个博弈系统的一个参与者，则所有的参与者形成一个集合I 。在给定集合I排放总量情况下，如何分配集合内部各参与者（排污口）之间污染物排放量，并尽可能使其节约成本。其中，不同的参与者用i（i =1， 2， ...， n）表示，其排放量用s表示，各排污口的处理率为η。

由于η为各排污口的处理率，因此可将ηi称为各个参与者（排污口）i的处理策略，将I=（n1，n2，...，nn）称为参与者的策略集。

通常，各污水处理厂的污水处理费用，也就是参与者i的成本可以用下式来表达：

区域内总排污成本为：

其中，M表示处理成本，η表示污水厂的处理率，q表示流量，a、b、c分别为参数，具体由于各地区不同工艺设备、成本控制、排污流量等因素而产生差异，需通过具体调查确定。对于同一污水处理厂，若当地管理者要求污染物削减量越大时，则要更大幅度地提高污染物的处理率，以达到更高的治理要求，则处理成本Mi越高。

一般来说，在形成合作联盟之前，各个参与者间无好的信息交流或合作协议，较为公正的排污分配方案是统一采用平均分摊法，例如，每个排污口都采取相同处理率。此时则有：

其中，上标N代表为非合作状态。式2-4即为采用平均分摊方案情况下的总成本。

平均分摊对于每个参加者来说或许是公平的，但这其实是因各参与者间缺乏信息共享、没有形成统一联盟，而形成一个整体高成本的Nash均衡的博弈结果，即所谓的“囚徒困境”。根据合作博弈理论，其结果必定符合Pareto最优，通过形成协议联盟进行合作，降低总体成本，获得额外利益，并进一步将收益公平合理分配，从而使各个参与者合作后的成本都低于合作前的成本，这种做法是完全可以实现的。

当采取合作时，则总体成本存在最优化模型：

其中，约束条件（2-6）表示进行区域合作后的排污量必须到达规定排污量削减指标。约束条件（2-7）表示处理率的范围在0-1之间。

此外，根据合作博弈的定义，该联盟合作后的成本必须小于合作前各成员单干的成本，否则该联盟的形成就没有意义。因此还有下式成立：

2.2 优化模型解析解

3 合作博弈分配模型

3.1 优化模型存在问题

经过优化模型分配后的排放量，虽然在整体经济效益上最优的，但对于参与的各个成员来说，则未必最优。最优化的结果通常为大部分参与成员成本下降，某些参与成员反而成本上涨。因此对这些成员来说，他们没有真正参与合作的动机，联盟也就不能成立。因此，要保证联盟成立，统一优化过程可行，还需进一步对联盟得到的利润进行科学合理的分配，使每个参与成员的成本在参与联盟后都比参与前有所降低，确保联盟合作的可行性。

在这个联盟中，Z（I）是所有参与者都参与的大联盟，同时，任意参与者都可能会形成一个子联盟，该子联盟是大联盟集合I的真子集。因此，若存在n个参与者，则共可以形成2n个子联盟。设某个参与者的子集合K形成的博弈联盟为Z（K）。

定义V为联盟所获得的收益，则V（I）为大联盟所获得的收益，V（K）为子联盟所获得的收益。用pi表示参与成员i从联盟最大收益值中V（I）应获得的利润，集合P=（p1，p2，…pi）称为该合作博弈的分配策略。根据合作博弈的定义，pi应同时满足以下两个条件：

（1）整体合理性：

即每个参与者所分配到的额外收益，等于整个合作联盟比合作前增加的额外收益的总和。

（2）个体合理性：

即每个参与者参与联盟后得到的收益，应当高于他未参加合作时（即单干时）所获得的收益，否则该成员没有参与联盟的动机。

3.2 博弈模型的求解

因此，要对合作联盟得到的利润进行合理分配，就是要求解满足上述条件的pi的过程。合作博弈模型的求解方法比较多，本文主要选择Shapley值法与核心法，分别进行求解。

对于一个联盟来说满足式（3-1）及式（3-2）的分配方案有很多种，在一般情况下，或在强有力的约束协议下，只要满足上述两式条件的分配方案都可以被参与成员接受。但是如果联盟协议的约束力并不强，并假设所有参与者都追逐最大利益的情况下，则还要考虑子联盟的情况。若有数个参与者发现当他们组成一个小联盟后，获得的收益比参与大联盟时要更高，这样他们就不会参与大联盟，而形成收益更高的小联盟了，而大联盟也就随之不能成立。因此，在这种情况下，大联盟的分配必须保证每个成员的的收益都高于他任何可能参与的小联盟的收益，才能保证大联盟的稳定性。

由于核心是满足以上所有条件的解集，因此理论上来说核心内的解才是最符合联盟收益最大化的。从满足整体合理性及个人合理性的角度来说，以核心作为分配策略才最为合理。但遗憾的是，由于要求过高，核心的解集往往是空集，从而大大限制了核心法的运用，因此只能寻求其他的妥协方法进行求解，从而求得到相对公平的分配策略。

Shapley值法是一个重要的求解方法之一，其可确保得到合作博弈的唯一解。其结果可能在核心集合内，也可能在核心集合外，但能保证存在唯一解。事实上，Shapley值法是对于该博弈联盟的每个参与者，考察其对所有可能存在的子联盟的贡献率及其概率大小，按照该贡献率给出参与者在联盟博弈中的一个分配方式。Shapley值由特征函数V确定，特征函数V即该联盟合作后获得的额外利润。由于当联盟中仅存在一人时，即相当于该参与者单干，因此他采取的策略仍为平均分摊法时的策略，即η。由此可知，当联盟K为单参与者i时，V（i）= 0。

综上所述，根据最优化结果得到的分配方案建立的博弈模型，是以求解分配方案P=（p1，p2，…pi）为目标。首先必须求得联盟的特征函数V，包括大联盟I的特征函数，以及所有子联盟K的特征函数。随后根据式（3-3）（3-4）（3-5），寻找该博弈模型的核心，看是否为空集。

一般情况下都采用Shapley值法进行求解博弈模型，因其是根据成员贡献来进行收益分配，且一定有解，解可能在核心集合内。Shapley值法可根据以下公式进行求解：

上式中，Pi即为Shapley值。|K|为博弈联盟K所含的元素个数，V（K）表示包含参与者i的联盟K的博弈特征函数，V（K＼i）表示在联盟K中，若将参与者i除去后，剩余参与者组成的博弈联盟的特征函数。

4 研究案例

4.1 案例现状及参数选取

本研究选用粤西阳春市漠阳江流域。参考《粤西水质保护规划》，根据不同规划年限城镇生活污水处理率的要求，综合考虑水污染源预测结果、污水处理厂建设规划现状、削减量，提出的漠阳江流域城镇污水处理工程建设方案中的重点规划项目，漠阳江上游的春湾污水处理厂于2010年新建，处理规模1.0万t/d，2020年将扩建至2.5万t/d；合水污水处理厂于2010年新建，处理规模1.0万t/d，2020年将扩建至1.5万t/d；春城污水处理厂与2010年扩建至规模4万t/d，2020年将扩建至8.0万t/d。本研究将采用以上污水处理厂2020年数据。

根据上级单位分配给阳春市的“十一五”COD排放总量，规划提出近年内COD目标总量控制方案，见下表。

表4-1 漠阳江阳春市流域COD总量控制目标

本研究采用2020年COD允许排放量数据进行计算。

此外，由2.1节可知，污水处理厂的处理率参数a、b、c，具体由于各地区不同工艺设备、成本控制、排污流量等因素而产生差异。根据文献调查，式（2-5）中的污水处理参数a=200，b=1000，c=0.8，污水处理厂进水COD浓度为650mg/L。

4.2 最优化方法求解排污量分配

根据上节，至2020年时三个污水处理厂运行规模，可以算出每个污水处理厂的平均排污流量（春湾污水处理厂为1，合水污水处理厂为2，春城污水处理厂为3，下同）及COD产生量。又根据表3-2，由于2020年该流域内COD允许排放量为6686t，因此总的COD处理率应至少达到0.77。在形成合作之前，为公平起见，每个污水处理厂都采取相同的处理效率，即都采取77%的削减率，这能达到管理者的要求。在这种情况下，根据式（2-1），各厂的成本分别为：

即，1号参与者采用0.56的处理率，2号参与者采用0.52的处理率，3号参与者采用0.88的处理率时，可以使总成本达到最小。相比起采用平均分摊法的策略，总体成本共节省了45.45万元。

但是如果直接采用这种方法的话，会使1号、2号参与者的成本有较大的降低，而使3号参与者的成本有较大的提升，这样3号参与者必定不会同意这种联盟的实现。因此，为了使得合作顺利实现，必须对合作带来的收益（即经集体规划后节省下来的资金）用合作博弈模型重新进行分配，使各个参与者在参加联盟后都有所收益，才能保证联盟的顺利进行，保证最优化分配的可行性。

4.3 合作博弈模型求解分配方案

5 结语

本论文对在同一流域的不同排污口之间的排污量最优化分配模型及成本分配的合作博弈模型上进行了研究。以同一流域内的不同排污口为基础，为改变平均分摊法导致成本较高的弊端，在达到管理者要求的处理率的前提下，以总体成本最小为目标，建立了排污口处理率分配优化模型，并通过数学方法，求得了该二次规划问题的解析解。由于最优化的结果通常为大部分参与成员成本下降，而某些参与成员反而出现成本上涨，因此这些成员没有真正参与合作的动机，联盟也就不能成立。为保证联盟成立使得统一优化过程可行，通过建立合作博弈的模型，并使用核心解法及Shapley值法，进一步对联盟得到的额外收益进行科学合理的分配，使得每个参与联盟成员的成本都比参与前降低。根据粤西漠阳江流域阳春市范围内的春湾、合水、春城三家污水处理厂，以当地管理者提出的COD排放总量控制要求，用合作实例用模型进行了验证分析。在满足COD最大允许排放量的情况下，通过组成统一联盟，进行处理率最优化，以及采用合作博弈进行收益分配后，春湾、合水、春城三家污水处理厂分别采用56%、52%及88%的处理率，取代之前的平均分摊法，使得处理成本分别比合作前降低了11.79、10.69及22.97万，分别占总成本比例的4.01%、5.56%和3.86%。可见，通过合作降低成本的做法是有效的。

【参考文献】

[1] 陈阳，赵勇，肖江文.激励机制下污染物允许排放总量的分配模型[J].华中科技大学学报，2006，34（6）

[2] 刘首文，冯尚友.遗传算法及其在水污染控制系统规划中的应用，武汉水利电力大学学报，1996.29 （4）：95-99.

[3] 黄国如，胡和平等基于遗传算法的水污染控制系统规划清华大学学报，2002，42（4）551—554

[4] 王艳.流域水环境管理合作促进机制博弈分析[J].系统工程，2007，25（8）：54-57

[5] 刘红刚，陈新庚，彭晓春.基于合作博弈论的感潮河网区污染物排放总量削减分配模型研究[J].生态环境学报，2011，20（3）：456-462

[6] Deininger，R.A.. Water quality management： the planning of economically optimal pollution control systems[D].Northwestern University， Evanston，Illinois. 1965

[7] Liebman，J.C.and Lynn，W.R. The optimal allocation of stream dissolved oxygen[J].Water Resources Research.1966.2521

[8] Shih，C.S.. System optimization for river basin management[Jl. Journal of the Water Pollution Control Federation.1970.42： 1792

[9] Loucks，D.P.，Revelle，C.S. and Lynn，W.R.. Linear programming models for waterpollution controI[J].Management Science，1967，14（B）：166

[10] Ecker，J.. A geometric programming model for optimal allocation of stream dissolvedoxygen[J]. Management Science.1975.21：658

[11] Cardwell，H. and H.Ellis （1993）， Stochastic dynamic programming models for water quality management， Water Resour.Res.， 29（4），803-813