褚荣浩,李 萌,沙修竹,倪 锋,谢鹏飞,蒋跃林,申双和
(1.安徽省公共气象服务中心,安徽省气象局,合肥230031;2.安徽农业大学资源与环境学院,合肥230036;3.河南省人工影响天气中心,郑州450003;4.南京信息工程大学应用气象学院,南京210044)
目前,在气候与水文研究中,学者们已经构建出许多基于气候变量的参考作物蒸散量(ETref) 估算模型来估算ETref[1,2]。其中,联合国粮农组织(FAO) 推荐的Penman−Monteith FAO−56(PMF−56)模型被认为是过去几十年估算ETref的最为精确的模型[3]。与其他模型相比,PMF−56 模型有两个优点,一是基于生物物理基本理论所得,可在全球范围内使用且无需校准;二是在现有研究中,已经通过多种方法对其精度进行了系统评估与验证[1,2,4]。然而,PMF−56 模型的主要缺点是其对大数据集的要求,包括平均温度、最高温度和最低温度、相对湿度、风速和太阳辐射等,且上述气象参数往往在数据质量上存在争议或在某一特定地点无法获取,特别在一些发展中国家[5]。此外,气象观测站点仪器的安装流程比较复杂、维护费用也十分昂贵[6],使得一些研究人员或机构无法在某些研究领域获得完整的气象数据集。此时,PMF−56模型并不认为是估算ETref的最佳选择。考虑到PMF−56模型的上述缺点,在实际应用过程中,亟需选取计算误差较小且运算过程相对简单的ETref估算模型。尤其在气象数据集有限或缺失的情况下,更需寻找一个准确、合适、简单的替代模型来估算ETref[7]。
近几十年来,需要较少气象输入参数且计算过程相对简单的ETref经验估算模型已被相继开发,其中主要包括温度法、质量传输法、辐射法和组合法四种类型。尽管前人已经在不同气候区对上述经验模型进行了一些研究[4,8−12],但在中国东部湿润/半湿润区仍少有研究[13,14]。不同环境条件下,各经验模型的模拟性能也不尽相同,因此有必要对上述模型进行局部评价与校准[2,15]。FENG 等[12]在四川盆地采用贝叶斯模型校准了Hargreaves 模型。LIU 等[11]通过路径分析法确定了估算ETref的关键气象变量并建立了具体经验模型。以上研究主要采用基于温度和辐射的方法来估算ETref,然而基于质量传输法和组合法的模型在中国鲜有使用,其适用性也有待检验。因此,有必要对4种经验模型的模拟性能进行综合评估,以确定最佳或相对合适的模型来估算湿润/半湿润地区的ETref。此外,在对经验模型参数进行校准时,BOURLETSIKAS 等[16]认为在季节或月时间尺度上对经验模型参数进行校准可以获得更为准确的日尺度ETref估算结果。因此,有必要在年、月和日时间尺度上对上述经验模型的模拟性能进行综合评估。
尽管前人已在中国不同子区域对10 种常用经验模型的模拟性能进行了对比与评估[17],但如何针对安徽省三大自然区选择一个估算ETref的最佳替代经验模型仍有待进一步探讨。为弥补这一研究空白,本研究根据模型输入的气象参数及模型在区域范围内的适用性,最终选择了13 种应用广泛的经验模型作为本文的研究对象。针对上述存在的问题,本文的主要研究内容包括:①以PMF−56 模型为基准,评估13 种经验模型在日和月时间尺度上模拟ETref的适用性;②采用2001−2014年逐日气象观测数据集和线性回归模型,在月尺度上对13 种经验模型参数进行校准;③采用2015−2019年逐日气象观测数据集和3种统计分析方法,在月尺度上对校准后的经验模型进行效果验证。研究结果旨在为安徽省及其他气候类似地区的农业生产、水资源规划和管理等提供有效的科学指导。
安徽省(东经114°54'~119°37'和北纬29°41'~34°38')地处南暖温带与北亚热带过渡区,以亚热带季风气候为主,气候温和湿润,四季分明,全省年平均气温14~17 ℃,年平均日照时数1 800~2 500 h,无霜期200~250 d,年平均降水量800~1 800 mm,适于以农耕为主的农、林、牧、渔、副各业全面发展。省内地貌类型多样,山地、丘陵、平原岗地兼备,总体呈南高北低的分布特征。境内河流众多,河网密布,淮河干流和长江干流自西向东横穿全省,将全省划分为淮北平原、江淮丘陵和皖南山区三大自然区(图1)。此外,安徽省也是我国重要的农业生产基地,主要农作物有水稻、小麦、玉米等;然而,安徽省地处南北气候过渡带,气温波动大,旱涝灾害交替发生,农业产量极不稳定。
1.2.1 气象数据
本研究采用安徽省2001−2019年65 个气象站点常规气象观测数据,数据来源于国家气象科学数据中心(http://data.cma.cn/),主要包括:日平均气温(Ta,°C)、日最高气温(Tmax,°C)、日最低气温(Tmin,°C)、相对湿度(RH,%)、10 m风速(u10,m/s)、日照时数(SD,h)。
1.2.2 高程数据
本研究采用的数字高程模型(DEM)数据集(图1)的空间分辨率为90 m,数据来源于http://srtm.csi.cgiar.org/。
图1 安徽省高程信息和土地利用类型Fig.1 Elevation information and land use type of Anhui Province
1.3.1 Penman−Monteith FAO-56模型
FAO 推荐的PMF−56模型具有完整的理论基础和较高的估算精度,是国际上公认的估算ETref的最佳模型。由于缺乏蒸渗计的观测数据,本研究以PMF−56 模型计算的ETref为基准[3,13,18−20],评估经验模型的模拟效果。具体表达式如下:
式中:ETref为日参考作物蒸散量,mm/d;∆为饱和水汽压在空气温度为Ta时的曲线斜率,kPa/℃;Rn为净辐射,MJ/(m2·d);G为土壤热通量密度,MJ/(m2·d);γ为干湿表常数,kPa/℃;Ta为2 m 高度处日平均气温,℃;u2为2 m 高度处风速,m/s;es为饱和水汽压,kPa;ea为实际水汽压,kPa。
其中,u2可以由u10通过公式转换计算得到,Rn可以通过日照时数计算得到,具体计算公式可以参考相关文献[3]。
1.3.2 经验模型
基于模型对气象输入参数的要求以及在世界范围内的使用程度,本研究拟采用13 种经验模型[包括1 种基于温度的模型(Hargreaves−Samani)、3 种质量传输模型(Penman、WMO和Trabert)、6 种基于辐射的模型(Makkink、Priestly−Taylor、Jensen−Haise、Abtew、Irmak 和Tabari) 以及3 种组合模型(Valiantzas1、Valiantzas2 和Valiantzas3)]估算安徽省逐日ETref,并与PMF−56 模型的模拟结果进行对比分析与评估。其中,组合模型相对较新,主要针对PMF−56方程进行简化[21,22],其在华东地区的适用性尚未得到验证。上述经验模型的主要输入参数、具体计算公式及参考文献如表1所示。
表1 13种经验模型的原始表达式Tab.1 Original formulas of 13 empirical models
1.3.3 模型性能评估方法
本研究采用相对均方根误差(Relative Root Mean Square Error,RRMSE)、平均绝对误差(Mean Absolute Error,MAE)和(Nash−Sutcliffe,NS)系数3 种统计方法对13 种经验模型的模拟性能进行效果评价[32,33],具体计算表达式如下:
式中:和分别为PMF−56 模型和13 种经验模型估算得到的日ETref,mm/d;n表示样本大小;ETref,mean表示ETref的平均值;RRMSE为无量纲数,介于0 到∞之间;MAE单位为mm/d,其中RRMSE或MAE值越接近于0,模型模拟性能越好;NS为无量纲数,介于1 到−∞之间;NS值越接近于1,模型模拟性能越好。
1.3.4 模型的校准与验证
本研究以PMF−56 模型模拟的ETref为基准,采用线性回归模型对上述经验模型进行校准与验证,具体表达式如下:
式中:ETref和ETemp分别表示由PMF−56 模型和13 种经验模型估算得到的日ETref,mm/d;a和b均为校准的经验系数。
本研究首先针对安徽省淮北、江淮和皖南三大自然区,分别绘制PMF−56模型(ETref)与13种经验模型(ETemp)估算的日ETref之间的散点拟合图。如图2所示,三大自然区之间的散点拟合图整体差异较小,该现象表明上述经验模型的模拟效果可能不受安徽省自然区域的影响。基于气候的模型[如基于温度的模型(HS)、基于辐射的模型(MAK、PT、JH、ABT、IRM 和TAB)和组合模型(VA1、VA2和VA3)]均比质量传输模型(PEN、WMO 和TRA)模拟效果要好,其拟合出的散点均匀分布在1∶1 线附近且决定系数(R2)值基本均大于0.9。在基于气候的模型中,HS、PT、JH、ABT、VA1、VA2 和VA3 模型的线性拟合斜率均大于1,呈现高估现象;MAK、IRM 和TAB 模型的线性拟合斜率均小于1,呈现低估现象。然而,质量传输模型的模拟性能总体较差,R2值均远低于0.9,因其拟合的散点更加的分散,总体存在明显的低估现象。
与此同时,本研究进一步将13 种经验模型估算得到的ETref在月时间尺度上进行了对比分析。如图3所示,13种经验模型在江淮和皖南地区估算的月ETref变化趋势基本保持一致。除PT 和JH 模型外,其余模型估算的ETref均呈现双峰型变化特征,峰值和次峰值分别出现在7月和5月。然而,在淮北地区,13 种经验模型估算的ETref均呈现单峰型变化特征,峰值大多出现在6月,其中质量传输模型(PEN、WMO 和TRA)估算值与其他模型相比存在不同的变化趋势,该现象在图2中也有所体现。
为更好地评价各经验模型的模拟性能,本研究采用RRMSE、MAE和NS三种统计值对各经验模型的模拟结果进行对比分析。如图4所示,在基于温度的模型中,HS 模型的模拟性能表现一般,淮北、江淮和皖南3 个区域对应的RRMSE、MAE和NS值分别为0.252/0.226/0.291、0.523/0.474/0.608 和0.813/0.843/0.745。在质量传输模型中,各模型的模拟性能遵循TRA>WMO>PEN 的变化规律。考虑到上述3 种模型在图2和图3中表现出的较大模拟误差,均不建议作为PMF−56 模型的合适替代方案,尤其是PEN 模型。在基于辐射的模型中,除JH 模型外(在淮北、江淮和皖南3 个区域RRMSE、MAE和NS值分别为0.417/0.425/0.445、0.834/0.839/0.830 和0.489/0.443/0.403),其他模型的模拟性能均表现良好,总体性能大致遵循IRM>TAB>PT>ABT>MAK>JH 的变化规律。在组合模型中,各模型的模拟性能均较好,尤其是VA3 模型,其在淮北、江淮和皖南三大区域的RRMSE、MAE和NS值分别为0.129/0.122/0.120、0.285/0.270/0.260 和0.950/0.954/0.957,VA2 和VA1 模型次之。基于上述讨论,在日和月尺度上,相对PMF−56 模型而言,VA3 模型均被认为是估算安徽省各区域ETref的最佳替代模型。
图3 2001-2014年13种经验模型估算的月尺度ETref与PMF-56模型估算值之间的对比分析Fig.3 Comparison analysis between the monthly ETref estimated by 13 empirical models and PMF-56 model during 2001-2014
图4 2001-2014年13种经验模型估算的日和月尺度ETref与PMF-56模型估算值之间的误差统计Fig.4 Error statistical analysis between ETref estimated by 13 empirical models and PMF-56 model in daily and monthly time scales during 2001-2014
由于经验模型在月时间尺度上的估算结果差异较大,且在三大自然区之间的模拟结果和性能差异较小,因此本研究决定不区分区域在月时间尺度对上述经验模型参数进行逐一校准。基于2001−2014年逐月ETref与ETemp数据,建立二者之间的线性回归模型,具体校准系数的月尺度变化特征见图5。如图5(a)所示,质量传输模型的系数a总体均呈“增−减−增−减”的变化趋势,除PT模型的系数a呈“先减后增”的变化趋势外,其余均呈“先增后减”的变化趋势。图5(b)中,质量传输模型的系数b呈“先增后减”的变化趋势,而HS、PT、TAB和IRM 模型的系数b呈“先减后增”的变化特征,其余模型的系数b整体变化不大。如图5(c)所示,本研究发现基于温度、辐射和组合模型的R2值在1−12月间均呈现出先增后减的变化趋势。R2值的高值区主要位于4−10月,尤以7−9月最为明显。此时,上述模型可以被推荐为估算ETref的合适备选方案。然而在其他月份,尤其是1月和12月,上述模型的模拟性能较差,尤以PT 模型最为明显(12月R2值仅为0.15)。然而,此时质量传输模型的R2值较高,模拟性能较好,尤以WMO 和TRA 模型更为明显,可作为估算ETref的合理替代方案。此外,VA3 模型的R2值总体介于0.887(12月)至0.997(7月)之间,这也进一步证明了VA3 模型相对于其他模型而言是估算安徽省ETref的理想方案。
图5 2001-2014年13种经验模型估算的月尺度ETref与PMF-56模型估算值之间校准系数变化特征Fig.5 Variation characteristics of calibrated coefficients between monthly ETref estimated by 13 empirical models and PMF-56 model during 2001-2014
本研究采用2015−2019年气象数据集对校准后的经验模型进行验证。如图6所示,各经验模型在经过逐月校准后,性能均比校准前有了明显改善,对应的RRMSE和MAE值更接近于0,NS值更接近于1,且趋于稳定。在1月、2月和12月,模型校准前,各经验模型的RRMSE均较大,尤其是ABT和JH模型以及2月份的PEN 和WMO 模型;模型校准后,除WMO、TRA 和VA3 模型外,其余模型的RRMSE值与其他月份相比改善仍不明显。WMO、TRA 和VA3 这3 种模型的模拟性能均较好,尤其是WMO 和TRA 模型在1月和12月的模拟性能。然而在其他月份,尽管PEN、WMO和JH模型在校准前存在较大的RRMSE值,但经过校准后这些模型的模拟性能均得到了较大的提升。类似的结果也可从图中MAE和NS值得到验证。
图6 2015-2019年13种经验模型估算的ETref与PMF-56模型估算值之间的RRMSE、MAE和NS值在校准前与校准后的对比分析Fig.6 Comparative analysis of RRMSE,MAE and NS values between ETref estimated by 13 empirical models and PMF-56 model before and after calibration during 2015-2019
为进一步探讨校准后经验模型的模拟性能,本研究采用2015−2019年数据在月时间尺度上对比分析了各模型校准前后的性能差异。如图7所示,模型校准后,13种经验模型在月尺度上的ETref与PMF−56 模型的估算值均非常接近。尽管TRA、MAK 和WMO 模型校准后的性能有所改善,但在4−8月均存在低估现象[图7(b)]。该现象也表明线性回归模型不能很好地校准上述3种模型。
图7 2015-2019年13种经验模型估算的ETref在校准前与校准后的对比分析Fig.7 Comparison analysis of ETref estimated by 13 empirical models before and after calibration during 2015-2019
综上所述,VA3 模型与其他12 种经验模型相比,在估算安徽省ETref方面表现最佳。在能够获得完整的气象数据集时,VA3 模型因其具有较高的准确性和相对简单的算法,被认为是PMF−56模型的最佳替代方案。然而,考虑到数据的可获取性,如果安徽省和其他类似地区可以获取表1中对应的气象输入参数,则建议在4−10月使用基于温度和基于辐射的模型以及VA1和VA2模型,而在其他月份推荐使用质量传输模型。
本研究发现,在模型校准前,尽管HS 模型的模拟性能一般,然而该模型在安徽省的模拟精度要高于其在四川盆地[12](该地区云量相对较大且太阳辐射减少,最终影响了ETref的估算结果)以及中国大陆各子区域的模拟结果[17]。质量传输模型的低估现象与TABARI 等[5]在伊朗的研究结果相一致,虽然两地区具有类似的湿润条件,但两地区ETref的月变化趋势仍存在一定差异。除质量传输模型外,虽然其他模型与PMF−56模型的月尺度变化趋势类似,但在3个自然区均存在明显的高估(JH、HS 和PT)和低估(TAB 和MAK)现象。以JH 模型为例,其估算的ETref在4−10月存在明显的高估现象,而在其他月份存在低估现象。JH 模型较差的模拟性能与AHOOGHALANDARI 等[34]在澳大利亚的研究结果基本一致。此外,JENSEN 等[35]、TABARI 等[5]和TEGOS 等[36]的研究也表明JH模型在湿润气候条件下存在明显高估的倾向。
在前人研究中,MEHDIZADEH 等[37]研究表明,质量传输模型的模拟性能最差,而组合模型表现最佳。TABARI 等[5]在伊朗湿润环境下评估了10 种质量传输模型的模拟性能,发现其中一些模型的模拟性能表现不佳且存在低估现象,这也与本文的研究结果相一致。组合模型的较高模拟精度可能是由于其综合考虑了ETref估算过程中最合适且最重要的气象参数(例如,基于温度的模型中的Ta、质量传输模型中的u2和RH以及基于辐射的模型中的Rs)。在本研究中,VA3 模型组合了Ta、RH、u2和Rs参数,且这些参数在ETref估算中起着至关重要的作用,因此表现出最佳的估算准确率。东非的坦桑尼亚和肯尼亚西南部[38]、印度[39]和澳大利亚西部[40]等地区也有类似的研究结果。此外,基于辐射的模型的较好模拟性能主要是由于Rs参数在湿润气候条件下估算ETref时起了重要的作用[41]。
在模型校准过程中,基于温度、辐射和组合模型的R2值的高值区主要位于4−10月,尤以7−9月最为明显。这与LI等[14]的研究结果相一致,其研究发现Rs参数是影响生长季(4−10月)和夏季(6−8月)ETref趋势的最强主导因子,这可能是该时段内基于辐射的模型表现良好的主要原因。尽管与PMF−56 模型相比,VA3 模型的计算公式相对简单,但由于需要输入大量的气象参数(如Ta、Rs、RH和u2),其适用性仍有待进一步探讨。与此相反,质量传输模型的R2值表现出与其他模型相反的变化趋势,其在1−12月间总体呈现出先减后增的变化趋势,最低值出现在9月。尽管质量传输模型在日和月尺度ETref模拟中表现最差(图4),但该模型在1−3月和11−12月间的R2值均大于0.8,表明其在上述时段的模拟性能较好。尤其在12月,WMO 和TRA 模型的R2值均为0.972,大于VA3 模型的R2值(0.887)。该现象表明,上述两种质量传输模型在相应时间段内可以作为估算ETref的最佳替代方案。WMO 和TRA 模型均以u2作为输入气象参数,有研究表明,u2是对应时段ETref趋势变化的主导气候因子[42],这可能是两种模型在该时段呈现较好模拟性能的主要原因。此外,TEGOS 等[43]提出,由于经验模型中缺少相对湿度和风速变量,致使模型的模拟值与PMF−56 模型的估算值在某些地区存在一定的偏差,这与本文的研究结果相一致。
模型校准后,尽管HS 模型拥有最简单的数学表达式,且只需输入3 个气象变量(即Ta、Tmax和Tmin),但其模拟性能与其他模型相比并不理想。FENG 等[12]研究也表明,尽管贝叶斯理论提高了HS 模型的模拟性能,但该模型仍存在高估现象,这可能是由于该模型没有考虑ETref变化中存在的物理作用机制。在质量传输模型中,3 种模型的模拟性能在1−7月遵循TRA>WMO>PEN 的规律;在9月,模型模拟性能呈现PEN>TRA>WMO 的规律;而在其他月份遵循WMO>TRA>PEN 的规律。在基于辐射的模型中,所有模型的模拟性能均较好,且在4−10月其组间差异较小,而在其他月份可以发现明显的差异,其中IRM 和TAB 模型表现最好,PT 和JH 模型表现最差。JH模型较差的模拟性能与塞尔维亚[44]以及美国佛罗里达州[31]等湿润气候区的研究结果相一致。此外,在组合模型中,VA3模型的模拟性能最优,其次是VA1 和VA2 模型;除9月和10月外,上述3 种模型的模拟性能遵循VA3>VA1>VA2 的变化规律。
尽管当前研究中以PMF−56模型为基准来评估经验模型的模拟性能,但本研究中获得的结果在某种程度上仍需进一步探讨,如果条件允许的话,在今后的研究中应采用实验观测数据(如涡度相关法、蒸渗仪等)对上述经验模型的模拟性能进行进一步验证。此外,有必要进一步结合数学和物理理论来提高经验模型的模拟性能以及评估上述经验模型在其他气候条件或类似气候条件下的适用性。
本研究基于安徽省65 个气象站点2001−2019年常规气象观测数据集(其中2001−2014年数据用于建模,2015−2019年数据用于验证),以PMF−56 模型为基准,对比分析了13 种典型经验模型在模拟安徽省ETref上的适用性。主要结论如下:
(1)13 种经验模型在模拟安徽省不同自然区ETref时的模拟性能相当,差异较小。
(2)模型校准前,在日和月时间尺度上,VA3 模型被认为是估算安徽省ETref的最佳替代模型;然而,鉴于PEN、WMO、TRA 和JH 模型估算过程中存在的较大误差,不推荐作为PMF−56模型的合理替代模型。
(3)模型校准过程中,基于温度、辐射和组合的模型与PMF−56 模型之间的R2值在1−12月间呈现出先增后减的变化趋势,较高值介于4−10月;然而,质量传输模型的R2值在1−12月间呈现出相反的变化趋势。尽管质量传输模型在日和月尺度ETref模拟中整体表现较差,但其在1−3月和11−12月ETref模拟中性能较好,尤其在12月,WMO 和TRA 模型的R2值均高达0.972,优于VA3模型。
(4)模型校准后,13 种经验模型在月尺度上的模拟效果均较好,仅TRA、MAK和WMO模型在4−8月存在低估现象。
(5)如果能够获得完整的气象数据集,VA3 模型因其计算过程简单且误差更小,被认为是PMF−56模型的最佳替代方案。考虑到数据的可获取性,如果能够获得较为全面的气象输入参数,则在4−10月推荐使用基于温度和辐射的模型以及VA1和VA2模型,而在其他月份推荐使用质量传输模型。