曾 鸣, 许彦斌, 马嘉欣, 董厚琦, 王雨晴
(1.华北电力大学 经济与管理学院,北京 102206;2.华北电力大学 经济与管理学院,河北 保定 071003)
作为大型能源生产国与消费国,我国能源电力工业碳排放占全国总排放量近40%[1],推动能源电力清洁化转型是实现“双碳”目标的重要抓手[2]。截止2021年底,我国风光发电机组装机达6.4亿kW,考虑到在未来很长一段时间内,风光发电平准化成本仍将高于常规机组[3,4],“绿证交易+RPS考核”模式将成为缓解可再生能源投资经营压力、促进可再生能源发展及缓解财政补贴压力的重要解决方案之一[5]。
国内外学者针对“绿证交易+RPS考核”机制的影响开展了一系列研究。从能源系统层面看,RPS下的绿证交易可加速能源结构绿色转型进程[6-8]。如,文献[9]构建了RPS下绿证中长期交易模型,并以省份为对象测算分析了非水可再生能源在全国能源系统中的流向。文献[10]和[11]分别构建了基于多元回归和线性规划的综合规划模型以及系统动力学模型,并指出RPS加绿证的模式可以促进可再生能源机组装机容量增长和可再生能源资源的大范围优化配置;从市场主体层面看,“绿证交易+RPS考核”会对市场主体的投资、经营、交易等行为产生明显影响[12,13]。如,文献[14]基于寡头竞争均衡理论构建了可再生能源发电商参与绿证市场和电力批发市场的两阶段联合均衡模型,分析了不同配额下发电商的出力策略变化。文献[15]构建了RPS下发电厂商行为演化博弈模型,指出绿证交易成本与发电边际成本的差额、单位罚金对发电侧主体的经营策略有明显影响。文献[16]构建了包含经济性与环保性的多目标调度优化模型,并通过算例表明RPS与绿证的组合政策可在保证电力系统安全的基础上有效降低弃风率。
综上,现有研究侧重从长时间尺度和宏观视角分析“绿证交易+RPS考核”对能源系统及供给侧主体经营策略的影响,加之由于我国绿证停留在自愿认购阶段,多数研究将绿证价格视为外部给定的静态参数,忽略了市场供需与绿证价格间的关系,而针对“绿证交易+RPS考核”下消费侧责任主体在为期一年的考核期内交易策略的研究仍较为有限。本文首先在分析“绿证交易+RPS考核”下电力市场与绿证市场耦合关系的基础上,从反身性视角揭示了责任主体参与市场交易的序贯决策过程并构建了绿证市场价格模型;其次,基于反身性与马尔科夫决策过程构建了交易策略优化模型,通过算例分析了责任主体在考核期内的绿证与可再生能源电力交易策略;最后,进一步分析了责任权重及近期利益偏好对责任主体交易策略的影响。以上研究对责任主体履行RPS责任、调整优化电力与绿证交易策略,以及政府完善RPS和绿证相关政策等有参考与辅助决策支持作用。
为减轻国家财政补贴压力和引导社会绿色用能,2017年,国家发展改革委、财政部和国家能源局联合发了《关于试行可再生能源绿色电力证书核发及自愿认购交易制度的通知》,明确每兆瓦时非水可再生能源上网电量可获发绿证,企事业单位等主体可通过协商或竞价的形式自愿认购绿证,成交的绿证不得再次转让,且对应电量不再享受国家财政补贴[17]。然而,由于强制约束缺失、权责主体不明确、价格机制不清晰等问题,绿证交易规模十分有限。
经三次征求意见,2019年底国家发展改革委和国家能源局联合印发《关于建立健全可再生能源电力消纳保障机制的通知》,在我国拉开了推行RPS的序幕。政策确认电网企业、电力批发市场直购电用户等主体为RPS责任主体,要求责任主体根据全年电力消费量及政府核定的责任权重履行可再生能源电力消纳责任,并且政策明确认购绿证可将对应的可再生能源电力等量登记为消纳量。此外,能源主管部门负责对消纳情况开展年度考核[18]。RPS的实施弥补了绿证认购政策中的监管考核机制缺失、权责主体不清等不足,形成了“绿证交易+RPS考核”的可再生能源发展政策组合,绿证市场与电力市场间耦合互动将日益深化,如图1所示。
图1 RPS下绿证交易市场与电力市场耦合关系示意图Fig.1 Coupling relationship between TGC market and electricity market under RPS
反身性最早起源于金融领域,多用于分析市场参与者与市场表现之间的关系[19]。反身性认为有思想的参与者与环境之间是相互影响,并且在时间维度上存在反馈关系:
(1) 环境影响参与者行为。有思想的参与者的行为并非盲目的,是基于对当下所处环境认知做出的有限理性决策。
(2) 参与者行为影响未来环境。基于对当下环境的认知,参与者会将自身偏好及对未来的期望投射到行为决策上,而参与者作为环境的重要组成部分,其行为决策会影响未来环境的发展和形成。
以上两部分在时间维度上交替发生,将过去、现在和未来的参与者和市场有机连接,形成了缠结状态。
基于本文第1部分,“绿证交易+RPS考核”下责任主体参与市场交易时有以下特征:
(1) 责任主体交易策略制定存在弹性。与电力市场不同,绿证交易不需要满足类似电力实时平衡的约束,责任主体可根据自身偏好和对未来期望灵活调整绿证的购买时间与购买量,这为交易策略的灵活优化提供了重要前提。
(2) 市场影响责任主体交易策略。可再生能源可用出力、核发的绿证数,RPS考核完成进度、绿证效用等决定了当下市场的供需关系和绿证价格,在RPS考核机制约束下,责任主体将根据可再生电力交易成本、绿证交易成本和RPS考核成本等调整可再生能源电力和绿证的购买策略。
(3) 责任主体交易策略影响市场。责任主体的可再生能源电力和绿证购买量将间接和直接决定未来市场中绿证的核发量与供给能力、RPS考核完成进度及可再生能源电力需求,进而改变未来市场中的供需关系,并影响未来市场中的绿证价格。
综上,责任主体与市场之间同样存在2.1中描述的交替反馈现象,故将反身性应用于分析“绿证交易+RPS考核”下责任主体的交易策略是可行的。
结合前文可知,反身性视角下责任主体的交易策略制定是典型的序贯决策优化问题,如图2所示。同时,本文建立相关假设如下:
图2 责任主体交易决策序贯过程Fig.2 Sequential decision process of responsibility entities
(1) 责任主体作为绿证和电力市场中的买方,是以考核期内总成本最小化为目标的有限理性主体;
(2) 电力市场与绿证市场为中长期月度市场且相互独立,绿证与可再生能源电力不存在绑定交易。绿证成交价格由市场供需关系决定,但绿证交易存在最高指导价限制;
(3) 由于可再生能源出力不确定性导致的电力交易偏差可通过平衡市场交易补充,平衡市场主要靠火电机组供给;
(4) 为保障RPS落实和绿证市场运转,未完成的年度可再生能源电力消纳责任量将受罚款惩罚,单位罚金与绿证最高限价相等[20,21]。
基于研究假设,绿证市场交易价格为
(1)
反身性视角下,t时买方可接受绿证价格表征了责任主体的期望为
(2)
式中:rbuy为买方折现率;T为考核周期,T=12;UTGC,0为绿证初始效用,表征购买绿证满足买方需求的能力,设初始效用与罚金值相等;δt为t时绿证效用系数,且δt∈[0,1]。
基于基数效用理论,随着未完成RPS的减少,购买绿证的效用也将衰减,即绿证效用是可再生能源电力与绿证累积购买量的递减函数,且当可再生能源电力与绿证累积购买量大于RPS总量时,绿证效用为0。综上,t时绿证效用系数可按下式计算:
(3)
卖方可接受价格表征了市场中绿证的供给能力,结合2.2和2.3,可再生能源出力能力、核发且未成交的绿证等会影响绿证供给能力,故卖方可接受价格可按下式计算[22]:
(4)
3.2.1 马尔科夫决策过程兼容性分析
基于前文,反身性视角下责任主体交易序贯决策优化问题具备无后效性,即当给定t时市场状态(包括电价、绿证价格、可用出力等),责任主体将据此制定交易策略,且此后市场和责任主体交易策略的演化仅与t时有关,而与之前经历的状态和策略无关。马尔科夫决策过程作为强化学习领域的经典方法,对于求解无后效性的序贯决策问题有着良好适应性,故本文将马尔科夫决策过程用于模拟和求解“绿证交易+RPS考核”下责任主体交易策略。
3.2.2 基于马尔科夫决策过程的模型构建
马尔科夫决策过程通常可用元组表示,其中包含:
能源平衡约束
(5)
可再生能源机组出力约束
(6)
考虑到可再生能源出力预测的不确定性,其出力可写作下式:
(7)
(8)
综上,式(6)可改写为下式:
(9)
火电机组出力约束
由于可再生能源出力不确定性导致的电力交易偏差需要由平衡市场中火电机组进行补充,故需要满足以下约束:
(10)
市场绿证交易约束
(11)
针对两项改善重点分别设定目标值。设定圈能力为90%。由现况把握可知,现况值=(833/1800)×100%=46.28%,改善重点为73.47%。目标值的计算公式:目标值=现况值—改善值=现况值—(现况值×改善重点×圈员能力)=46.28%-(46.28%×73.47%×90%)=15.68%。经计算,急诊不合理处方发生率的目标值为15.68%。
(3)转移函数T,通常写作T(St+1|St,At),表征t时采取动作At后,状态由St向t+1时St+1转移。反身性视角下,可交易绿证数量、绿证价格、绿证效用系数、待履行的RPS等是受责任主体交易策略影响而转移的状态量,其转换关系可写作下式:
(12)
(13)
(14)
(15)
(16)
马尔科夫决策过程问题求解的核心是搜寻最佳策略π*:S→A使得整个序贯决策过程中奖励累计之和取得极值。结合式(13),本文中的奖励是责任主体各时刻的交易成本,故交易策略序贯决策问题的目标函数如下:
(17)
(18)
式中:sp_penalty为罚金值的状态。
(5)衰减系数γ∈(0,1],可用于表征责任主体在序贯决策过程中对于近期利益的偏好程度,γ越小,表明责任主体在序贯决策过程中对于近期利益的偏好越显著。
根据贝尔曼最优方程,值函数可表征在策略π下当前状态、动作以及未来奖励累计之间的映射关系如下:
(19)
根据式(19),式(17)目标函数可写为下式:
(20)
进一步,最优策略π*可依据式(21)从最优值函数中提取
(21)
在贝尔曼最优方程思想基础上,考虑到目标函数的非线性特征,本文利用动态规划将责任主体交易策略优化模型求解归纳为逆向迭代过程,并用遗传算法提取各t时最佳动作At以得到考核期内的最佳交易策略,如图3所示。
图3 模型求解流程Fig.3 Schematic diagram of model solving process
本文选取华南某地作为数据来源,该区域火电机组及集中式光伏电站月度出力能力如图4,月度电力市场交易价格及月度电力消费需求如图5。同时,参考能源局发布的通知设定责任权重为10%,光伏中长期预测不确定性的置信度取95%。
图4 火电与光伏月度可交易电量Fig.4 Monthly tradable volume of thermal power and PV
图5 月度电力需求及电力市场交易价格Fig.5 Monthly electricity consumption demand and electricity market transaction price
为分析“绿证交易+RPS考核”机制与反身性视角下责任主体交易策略及影响,本文设定两个场景如下:
场景一:固定绿证价格场景,根据中国绿证认购平台2021年至今的光伏绿证平均成交价格和最高成交价,设定单位绿证价格为50元,RPS罚金为600元;
场景二:绿证市场化交易场景,价格由市场供需决定,且最高限价与罚金均为600元。
图6展示了两个场景中责任主体在考核期内各月度可再生能源电力的购买策略。
图6 场景一和场景二中责任主体可再生能源电力交易策略Fig.6 Responsible subjects' renewable power trading strategy in Scenario 1 and 2
当可再生能源电力价格明显高于火电时(1月~3月,8月~9月),场景一中,责任主体的光伏购买量大多要低于场景二,这是因为场景一中固定绿证价格显著低于可再生能源电力价格,所以责任主体会尽量减少可再生能源电力的购买量;场景二中,责任主体在1月~3月采取了比8~9月更激进的购买策略,即尽可能多购买可再生能源电力。原因在于,从反身性视角看,在绿证市场化交易机制下,当绿证最高指导价明显高于可再生能源电力时,责任主体会倾向在年初增加可再生能源电力购买量,增加未来市场中绿证的供给、扩大市场供需差,进而有效压缩未来的绿证交易成本。
当可再生能源电力价格接近或者低于火电时(4月~7月,10月~12月),在4月~7月和11月,可再生能源电力价格明显低于火电,场景一、二中的责任主体都愿意承担可再生能源出力不确定性带来的风险(平衡市场购电成本),即尽可能多地购买可再生能源电力。此外,尽管10月和12月可再生能源电力和火电价格均十分接近,但责任主体在12月的购买策略比10月更保守,这是因为在考核期末RPS目标接近完成,绿证市场供需差较大、绿证价格较低,同时,叠加考虑到可再生能源电力不确定性风险及平衡市场价格较高,责任主体将考虑购买绿证以完成RPS,故在一定程度减少可再生能源电力购买量。
图7展示了两个场景中责任主体在考核期内的绿证的购买策略及交易价格趋势。
在场景一中,除了1月和12月外,责任主体均会在各月度购入一定量绿证,但购买策略并不具备明显的规律。原因在于:一是,根据绿证核发机制只有成交上网的可再生能源电力能在月末核发相应绿证,故1月市场中并无可交易的绿证;二是,12月时RPS目标已经完成,所以责任主体选择不再购买绿证。
在场景二中,责任主体主要选择集中在2月、6月、11月和12月购买绿证。值得注意的是,尽管2月的绿证价格居高,但责任主体仍将市场中可交易的绿证全部购入。原因在于,基于反身性和马尔科夫决策过程视角,在RPS考核机制下,责任主体为压缩未来的交易成本和惩罚成本,选择在考核初期尽可能多购买绿证以加快RPS完成进度,扩大未来市场中的供需差,进而向具备低价绿证、低交易成本等特征的市场状态转移。此外,从全年看,随着RPS完成进度推进,绿证单价将持续下滑,直至12月跌至43元,故责任主体将选择在年末大量购买绿证以完成RPS考核。
表1展示了两个场景中的年度交易情况,相较场景一,场景二中责任主体年度累计交易成本增加了1.18%,可再生能源电力累计交易量提升了46.67%,此外,绿证累计交易量尽管下跌了约770(图7),但市场交易额提升了76.21%。以上说明,当责任权重设定合理时,相较固定价格机制,绿证的市场化交易可在不明显增加责任主体成本的前提下,有效刺激市场消纳可再生能源电力的需求,并显著提升绿证市场交易额,这对拓宽可再生能源企业盈利空间、缓解经营压力及减轻国家财政补贴负担有着积极意义
表1 场景一和场景二交易情况对比
基于前文,责任权重和责任主体的近期利益偏好程度会显著影响市场中绿证和可再生能源电力的供需。鉴此,本节针责任权重和近期利益偏好的影响开展进一步分析。
4.3.1 责任权重
由图8可见,提升责任权重能会对责任主体的月度可再生能源电力交易策略产生影响,但这种影响并不一定为正相关,还需要考虑到不同电力商品价差、可再生能源不确定性、RPS完成进度等因素的影响,举例如下:
在1月~3月,可再生能源电力价格明显高于火电,当权重由7%提升至8.5%及以上时,责任主体愿意承担不确定性的风险并尽可能多地购买可再生能源电力,其原因与4.2所指出的相似,即旨在推动未来市场向绿证供需差扩大、绿证价格降低及年度总成本降低的状态转移;
在8月~9月,尽管可再生能源电力价格均高于火电,但在9月,只有将权重提升至10%及以上责任主体才会选择更激进的可再生能源电力购买策略,而在8月,权重则需要被进一步提升到11.5%以上才能刺激责任主体购买更多的可再生能源电力。原因在于,相比8月,9月可再生能源电力与火电的价差与平衡市场与火电的价差更小,这意味着当权重一定时,在9月增加可再生能源电力购买量带来的风险成本小于8月,故从提升权重对刺激可再生能源电力需求的效果看,9月比8月更迅速和明显;
在12月,尽管可再生能源电力略低于火电,权重从8.5%提升至13%并未对责任主体的可再生能源电力购买策略产生进一步影响,购买量均在出力波动置信区间下界附近,这是因为12月平衡市场价格较高,叠加年末时RPS接近完成、绿证价格水平较低等因素,责任主体倾向规避可再生能源不确定性带来的风险成本,故权重提升对可再生能源电力需求的刺激作用十分有限。
图9展示了不同权重下责任主体购买绿证的策略。一方面,三维图左下向右上呈逐渐升高趋势,说明从交易量看,提升责任权重可刺激责任主体购买绿证的积极性;另一方面,三维图投影等高线从左下至右上逐渐由疏变密,说明从交易时间节点看,随着权重提升,责任主体倾向推迟大量购买绿证的时间以压缩交易成本,且这种影响的边际贡献会逐渐增强。
图9 不同权重下责任主体绿证交易策略Fig.9 TGC trading strategies under different weights
表2和图10展示了不同权重下的年度交易情况。
表2 不同权重下年度交易情况
图10 不同权重下年度交易变化趋势Fig.10 Growth in market performance under different weights
首先,就可再能源电力交易看,随着权重提升,累计交易量从2 064.07 MW·h上升至2 770.23 MW·h,但环比增长率从17.45%持续下降至1.52%。说明提升权重能促进可再生能源电力年度消纳量增长,但边际效用是递减的,这和可再生能源机组装机总量和出力有限、可再生能源不确定性风险成本等因素有关。
其次,就绿证交易看,随着权重提升,累计交易量从86持续上升至1 225,增长率从116.27%先增长至169.35%,又持续下降至52.36%。以上说明,提升责任权重可以刺激年度绿证消费需求,但边际效用呈先增后减趋势,这和RPS持续提升造成的绿证供需差缩小、绿证价格优势减小有关。
最后,就责任主体年度累计成本看,年度累计成本环比增长率一直稳定在0.8%附近,说明在合理范围内提升责任权重并不会过度增加责任主体履行RPS的成本。
另外,值得注意的是,随着责任权重提升,尽管绿证累计交易量的环比增长率远高于可再生能源电力,但从数量上看,当权重从7%提升至8.5%时,可再生能源电力交易量增加了360.33 MW·h,而绿证成交量仅增加了100,这意味着在较低范围内提升RPS权重,可能导致市场内积累更多未能成交的绿证。
4.3.2 近期利益偏好
图11展示了不同近期利益偏好水平(衰减系数)下责任主体的绿证购买策略。尽管三维图大部分均为贴近xy面的紫色,但右上部分呈缓慢上升趋势,且右下部分呈陡然增长的态势,此外,结合投影等高线可知右下部分为左高右低。以上说明,从交易时间节点看,对近期利益的偏好将导致责任主体选择在年末集中大量购买绿证;从交易数量看,对近期利益的偏好可刺激责任主体购买绿证的积极性。
表3和图12展示了不同近期利益偏好水平下年度交易情况。
表3 不同衰减系数下年度交易情况
图12 不同衰减系数下年度交易变化趋势Fig.12 Growth in market performance under different discount factors
首先,就可再能源电力交易看,随着责任主体对近期利益偏好的增加,累计交易量从2 612.21 MW·h持续减少至1 594.49 MW·h,环比增长率从-13.11%跌落至-19.14%,说明对近期利益的偏好将导致责任主体减少对可再生能源电力的购买,且其边际贡献是逐渐增强的,这是由可再生能源不确定性、平衡市场价格较高、绿证最高限价较高等因素叠加导致的。
其次,就绿证交易看,随着近期利益偏好水平增加,累计交易量从501增长到了1 476,但环比增长率从60.02%下降至32.92%,说明对近期利益的偏好促使责任主体增加了绿证的购买量,但其边际效果是逐渐减弱的,这是因为对近期利益的偏好导致可再生能源电力成交量下跌限制了绿证市场中的供给能力,导致绿证市场供需差缩小、价格居高不下,进而致使责任主体会尽可能推迟购买绿证的时间节点如图11所示。
本文基于反身性视角与马尔科夫决策过程构建了“绿证交易+RPS考核”下责任主体交易策略优化模型,模拟了固定绿证价格与绿证市场化交易两种场景下责任主体的交易策略,并分析了责任权重与近期利益偏好的影响。结果表明:
(1) 在“绿证交易+RPS考核”下,相较固定价格,绿证的市场化交易可在不明显增加责任主体年度总成本的前提下刺激对可再生能源电力的购买需求,有效促进可再生能源的消纳。同时,尽管市场化交易模式在一定程度上导致绿证交易规模减少,但能有效提升绿证市场总成交额,这对助力可再生能源企业回收成本及缓解国家财政补贴有着积极意义。
(2) 就责任权重的影响,从月度交易看,并不一定存在权重越高,可再生能源电力和绿证交易量就越高的情况,需要进一步考虑可再生能源不确定性、不同电力商品价差及反身性等的影响;从年度交易看,提升权重能有效促进可再生能源电力与绿证的消纳与交易。但需要注意的是,一方面,由于区域内装机容量的限制,这种促进效果的边际贡献是递减的;另一方面,由于权重提升对可再生能源电力和绿证交易刺激程度的差异,可能导致区域内积累更多未成交的绿证。鉴此,为助力可再生能源企业成本回收、提升可再生能源资源大范围优化配置能力,适时推动绿证交易融入全国统一市场进程是必要的。
(3) 在可再生能源不确定性、不同电力商品价差的影响下,对近期利益的偏好可能导致责任主体优先选择购买绿证以完成RPS,进而在一定程度上减少了可再生能源电力消纳量,这对可再生能源的可持续发展有着负面影响。因此,未来在完善RPS与绿证交易相关政策时,也需要考虑到消费侧主体对于近远期利益的不同偏好。
此外,本文仍存在相应不足之处,一方面,本文将区域内消费侧责任主体视为统一整体,在一定程度上忽略了责任主体间的差异和竞合行为,在未来可以针对责任主体间的博弈行为开展研究;另一方面,本文中绿证交易价格、限价及罚金主要是依据中国绿证认购平台统计数据设定,未来可针对相关参数变化的影响开展研究。