张雷明,罗艺伟,刘敏,陈智,苏文,何洪林,朱治林,孙晓敏,王艳芬,周国逸,赵新全,韩士杰,欧阳竹,张宪洲,张一平,刘琪璟,郝彦宾,闫俊华,张德强,李英年,王安志,吴家兵,李发东,赵风华,石培礼,张扬建,何永涛,林露湘,宋清海,王辉民,刘允芬,于贵瑞*
1. 中国科学院地理科学与资源研究所生态系统网络观测与模拟重点实验室,北京100101
2. 中国科学院大学资源与环境学院,北京 100190
3. 华东师范大学,上海 200062
4. 中国科学院华南植物园,广州 510650
5. 中国科学院西北高原生物研究所,西宁 810008
6. 中国科学院沈阳应用生态研究所,沈阳 110016
7. 中国科学院西双版纳热带植物园,云南勐仑 666303
8. 北京林业大学林学院,北京100083
数据库(集)基本信息简介
陆地生态系统CO2和水热通量的长期观测研究一直是国际上关注的热点问题。基于微气象学理论的涡度相关法是测定大气与群落碳水交换通量最直接的方法,实现了对生态系统尺度的生产力、能量平衡和温室气体交换等功能和过程的直接测定[1-3],成为目前国际通量观测网络(FLUXNET)的主要技术手段[4]。涡度相关通量观测数据已经被广泛用于各种模型及遥感观测的检验和验证之中,并且多过程、多要素的长期协同观测将为陆地生态系统碳氮水循环过程的机理研究以及碳源/汇的时空分布评价提供重要的观测数据[5-6],特别是全球尺度通量观测网络的联合观测是实现从生态现象观察和生态要素观测跨越到全球尺度生态系统功能状态变化观测的重大突破[7]。
在中国科学院知识创新工程重大项目“中国陆地和近海生态系统碳收支研究”的资助下,依托中国生态系统研究网络(CERN),2001年中国陆地生态系统通量观测研究网络(ChinaFLUX)开始科学论证和启动建设,2003年正式实现8个观测站点(长白山、千烟洲、鼎湖山、西双版纳、内蒙古、海北、当雄和禹城)碳水通量的联合观测研究[8],填补了亚洲季风区通量观测研究的空白,开始积累中国典型生态系统碳水交换通量的科学观测数据。2014年,通过联合国内行业部门及高等院校观测站点,共同组建了中国通量观测研究联盟(ChinaFLUX)。
本数据集为2003-2005年ChinaFLUX首批8个观测站点的碳水通量和常规气象要素观测数据集,也是我国获取的首套多站点的联网协同通量观测数据,包含生态系统CO2通量、潜热通量、显热通量、摩擦风速、空气温度、土壤温度、土壤湿度、降水、总辐射、净辐射和光合有效辐射等观测指标,形成了半小时和日尺度两类数据产品。虽然本数据集已于2013年10月发布共享,并且受到了国内外相关研究机构和人员的广泛关注,但尚缺乏对本数据集的系统性描述。同时,作为推动数据共享和规范数据使用的重要途径,ChinaFLUX将在充分保障数据产权的基础上,加强与观测台站的沟通和协调,以数据论文形式进一步推动后续更长时间和更多台站观测数据的开放共享。
基于顶层设计和科学论证,结合我国陆地样带的空间分布,依托CERN的台站网络,经过观测系统设计、观测台站和通量观测塔选址、观测仪器选型等技术方案的反复论证,以及野外工程实施和观测系统安装与调试,ChinaFLUX于2002年底之前完成了长白山、千烟洲、鼎湖山、西双版纳、海北和禹城6个通量观测研究站点的建设,于2003年5月之前完成了内蒙古和当雄2个通量观测研究站点的建设,形成了ChinaFLUX的首批观测台站网络(表1、图1和表2)。
表1 生态站名称及经纬度信息
代码 站名 台站全称 经度 纬度 植被类型N M G 内蒙古站 内蒙古温带典型草原通量观测研究站 1 1 6°1 8'E 4 4°0 8'N 草地H B G C T 海北站 海北高寒草地通量观测研究站 1 0 1°2 0'E 3 7°4 0'N 草地D X 当雄站 当雄高寒草甸通量观测研究站 9 1°0 3'E 3 0°2 9'N 草地Y C 禹城站 禹城温带农田通量观测研究站 1 1 6°3 8'E 3 6°5 8'N 农田
图1 观测研究台站的空间分布(审图号:GS(2018)4935号)
表2 生态站植被和土壤的基本特征
注:1)草地和农田植被的冠层高度是指生长季内的最大高度;2)叶面积指数为生长季内的最大叶面积指数。
各台站采用了相同的观测设备开展通量和气象数据的采集,数据的测定和采集均为自动化完成。
观测设备组成与型号:各测定要素所采用主要仪器设备的传感器和分析仪及制造商分列于表3。
表3 各测定要素所用关键设备的传感器和分析仪及其制造商
观测系统 测定要素 传感器和分析仪 制造商数据采集与通讯 常规气象要素 CR10X/CR23X CAMPBELL碳水通量要素 CR5000 CAMPBELL
观测设备的安装和配置:根据各观测站点下垫面情况和植被冠层高度,在观测塔上安装不同要素的测定传感器(表4),开展植被-大气界面CO2、H2O和能量通量以及气象要素在线、连续观测。
表4 各测定要素所用关键传感器的安装高度(m)
观测数据采集与传输:本数据集中植被-大气界面CO2、H2O和能量通量系统的原始测定频率为10Hz,利用数据采集器获取和存储高频测定数据。常规气象要素的测定记录频度为30分钟,由相应的数据采集器获取和存储数据。根据站点条件的不同,通量和气象测定数据采用有线网络方式下载(长白山站、千烟洲站、鼎湖山站、西双版纳站和禹城站)和直接读取数据采集器内的存储卡(内蒙古站、海北站和当雄站)两种方式获取,然后开展后续的质量控制、标准化处理和产品加工。
基于获取的生态系统碳水通量原始观测数据,利用ChinaFLUX技术体系完成标准化的质量控制和数据处理(图2)。
数据质量控制:采用国际上普遍认可的涡度通量数据质量控制方法,主要包括原始数据分析[2]、超声虚温校正[9]、坐标轴旋转[10]、WPL校正[11]、频率损失校正[12]、冠层储存项校正[13]、稳态测试与湍流积分特性[14]、夜间摩擦风速阈值筛选[15]和异常值剔除[16],以及能量闭合评价[17]。其中需要说明的是,农田和草地台站采用二次坐标旋转,森林台站采用平面拟合;冠层存储项采用CO2浓度的单点估算方式,并且仅考虑植株高大的森林台站。
缺失数据插补:对于短时间(小于2小时)内缺失的通量和气象观测数据,采用内插的方式完成插补;对于长时间缺失的气象数据,利用各观测站气象站观测资料(土壤湿度和降水数据除外)开展插补;如未能完成插补,则利用平均日变化法完成数据插补。
对于长时间缺失的CO2通量数据,采用非线性回归的方式[18-19]。其中夜间缺失数据利用Arrhenius方程插补[20],并且对于易受水分胁迫的台站,如千烟洲、内蒙古和当雄,方程中的 Q10表达为土壤温度和土壤水分的线性方程[21]。白天缺失数据利用直角双曲线方程插补,最小插补时间窗口为7天。
对于长时间缺失的能量通量数据,采用边际分布采样法[15]完成缺失数据插补。
CO2通量数据拆分:采用边际分布采样法[15]完成数据拆分。首先,基于夜间观测数据,采用和缺失数据插补时相同的回归方程,确定生态系统呼吸方程中的系数,然后估算夜间和白天的生态系统呼吸;其次,利用插补完成的白天CO2通量数据和估算的同时刻生态系统呼吸,求和得到总生态系统生产力。
图2 ChinaFLUX通量数据质量控制与处理技术体系(改自文献[8])
本数据集包括8个台站产生的观测数据,因此分为8个数据子集,共计66个EXCEL数据文件,总数据量为78.94 MB(表5)。在半小时尺度上,根据数据要素不同,数据文件(数据子集)的名称格式为“年份+台站+类型+时间尺度.xls”,如“2003年长白山通量30分钟数据”和“2003年长白山气象 30分钟数据.xls”。数据代码为“AAATL30MIN_GFYY.xls”和“AAAQX30MIN_GFYY.xls”。其中,AAA表示站点缩略名(见表1);TL表示通量,QX表示气象;30MIN表示数据的时间分辨率为30分钟;GF表示插补(Gap-filling);YY表示数据产生年份的后两位,如2003表示为03。
表5 数据集各子集名称与数据量
台站 年份 3 0分钟尺度 数据量(M B) 日尺度 数据量(K B)D H S Q X 3 0 M I N_G F 0 4 1.7 4 0 2 0 0 5 D H S T L 3 0 M I N_G F 0 5 1.7 0 1 D H S T L D A I L Y_G F 0 5 6 7 D H S Q X 3 0 M I N_G F 0 5 1.7 6 7西双版纳站 2 0 0 3 X S B N T L 3 0 M I N_G F 0 3 1.6 2 2 X S B N T L D A I L Y_G F 0 3 6 7 X S B N Q X 3 0 M I N_G F 0 3 1.7 1 0 2 0 0 4 X S B N T L 3 0 M I N_G F 0 4 1.6 2 0 X S B N T L D A I L Y_G F 0 4 6 7 X S B N Q X 3 0 M I N_G F 0 4 1.7 2 7 2 0 0 5 X S B N T L 3 0 M I N_G F 0 5 1.5 9 8 X S B N T L D A I L Y_G F 0 5 6 7 X S B N Q X 3 0 M I N_G F 0 5 1.7 2 3合计 文件数量 6 6个 数据量(M B) 7 8.9 4
在日尺度上,数据文件(数据子集)的名称为格式为“年份+台站+类型+日统计数据.xls”,数据代码为“AAATLDAILY_GFYY.xls”。其中,AAA表示站点缩略名(见表1);TL表示通量;DAILY表示数据的时间分辨率为日;GF表示插补;YY表示数据产生年份的后两位,如2003表示为03。
以长白山站 2003年数据文件为例,表 6-7分别为 CBSTL30MIN_GF03.xls、CBSQX30MIN_GF03.xls和CBSTLDAILY_GF03的数据表头。
表6 半小时通量观测数据
数据表头说明:(1)“CO2通量”表示经过质控和异常值剔除后的CO2通量(mg m-2s-1);(2)“潜热通量”表示经过质控和异常值剔除后的潜热通量(W m-2);(3)“显热通量”表示经过质控和异常值剔除后的显热通量(W m-2)。
表7 半小时气象观测数据
数据项 数据类型 计量单位 数据项说明 示例日 数字 日期 1时 数字 小时 9分 数字 分钟 3 0四层空气温度 数字 ℃ 植被冠层下方的空气温度 -1 8.5 3五层空气温度 数字 ℃ 植被冠层上方的空气温度 -1 8.8 1天空短波辐射 数字 W m-2 总辐射平均值 2 7 7.2光合有效辐射 数字 μ m o l m-2 s-1 光合有效辐射平均值 4 8 3.2降水量 数字 m m 降水量累计值 0.2
数据表头说明:(1)四层平均气温表示植被冠层上方的空气温度(℃);(2)五层平均气温表示植被冠层上方的空气温度;(3)平均天空总辐射表示冠层上方接受的太阳总辐射(W m-2);(4)有效辐射平均值表示冠层上方的光合有效辐射(μmol m-2s-1);(5)总降水量表示降水量的累计值(mm)。其中剔除后的数据以“-99999”表示。需要说明的是,对于农田和草地台站而言,空气温度表示为一层空气温度和二层空气温度,前者的观测高度低于后者。具体安装高度参见表4。
表8 日尺度通量观测数据
数据表头说明:(1)NEE表示日尺度的CO2通量累计值(g C m-2d-1);(2)Re表示日尺度的生态系统呼吸累计值(g C m-2d-1);(3)GEE表示日尺度的总生态系统生产力累计值(g C m-2d-1);(4)LE表示日尺度的潜热量累计值(Kg H2O m-2d-1);(5)H表示日尺度的显热量累计值(Kg H2O m-2d-1)。其中无法统计日值的数据以-99999表示。
ChinaFLUX有严格的数据质量保证和质量控制规范,以支撑长期、连续的联网观测的开展和运行。本数据集从观测、采集、质控、处理和存储方面均遵循了ChinaFLUX的技术体系(图2)。该技术体系是基于全球通量观测研究领域普遍采用和认可的技术流程建立起来的[8],包括数据质控、缺失数据插补和通量拆分等方面。同时,亚洲通量观测网(AsiaFlux)组织日本通量网(JapanFLux)、韩国通量网(KoFlux)和ChinaFLUX基于同一站点数据开展数据处理与质量控制的综合比较,结果表明,不同网络的计算结果表现出很好的一致性[22]。
基于全球通量观测研究领域普遍使用的质量评价方法,对数据集的数据质量开展系统评价。谱分析结果表明,三维风速、CO2、H2O和温度的功率谱在惯性子区内基本符合-2/3定律,而CO2、H2O和温度与垂直风速的协谱在惯性子区内也基本符合-4/3定律[23]。能力闭合分析表明,8个台站的能量平衡比率为0.57-0.95,平均为0.73[24],处于全球通量观测台站能量平衡比率变化范围之内[17]。数据质控的不确定性分析表明,摩擦风速阈值是影响CO2通量年总量的主要因素,数据处理方法不确定性引起的总生态系统碳交换量和生态系统呼吸年总量估算相对偏差分别为3.88%-11.41%和6.45%-24.91%[25]。
在半小时尺度上,不同台站和年份之间CO2通量、潜热通量和显热通量的有效观数据比例分别为42.6%±4.6%、54.1%±8.8%和54.7%±9.0%,在仅考虑白天数据的情况下,CO2通量有效观测数据的比例可以达到60%-70%以上(表9)。数据缺失的原因可以分为两类,一类是个性原因,主要为供电故障、仪器故障和干扰(如设备维护、雷击等),特别是2004年鼎湖山站由于观测系统返厂维修导致数据缺失明显;另一类是共性原因,主要是数据质量控制中出现的数据缺失,包括异常数据剔除、夜间通量数据筛选等,特别是夜间数据的质控和筛选是引起有效观测数据降低的主要因素。
表9 半小时尺度上不同站点通量数据质控后的有效数据比例(%)
站点名称 年份 C O 2通量 潜热通量 显热通量2 0 0 5 4 1.4 5 6.1 5 6.6长白山 2 0 0 3 5 0.2 6 2.9 6 3.6 2 0 0 4 4 4.9 5 8.8 6 0.4 2 0 0 5 4 6.7 6 2.4 6 4.2
本数据集由CERN综合研究中心和ChinaFLUX综合研究中心提供数据共享资源,用户可登录数据资源服务网站(http://www.cnern.org.cn),在首页打开碳氮水通量数据集进入相应的数据浏览、在线申请页面。也可登录Science Data Bank(http://www.sciencedb.cn/dataSet/handle/600)访问数据集信息。
通量观测数据的质量控制与处理是国际通量观测研究的基础性内容,同时也是目前尚未得到很好解决的重要议题。因此,本数据集在使用中需要注意以下5个方面:
(1)由于受到观测台站下垫面、植被特征和气候条件等因素的影响,涡度相关通量观测数据的处理技术与方法目前还没有全球普遍公认的一套技术体系。
(2)为了避免不同方法处理结果之间的差异,并便于不同站点之间开展比较分析,本数据是基于目前ChinaFLUX技术体系开展数据的质控和处理,因此计算结果可能与部分单台站自行计算结果之间存在一定的差异。
(3)随着数据综合处理技术的发展,ChinaFLUX也会更新和完善现有的技术体系,其结果也可能与现有方法之间存在一定差异。
(4)受观测系统运行状态(如供电、仪器故障和外界干扰)和数据质量控制(如异常数据剔除和夜间通量数据筛选)的影响,导致数据出现不同程度的缺失。考虑到数据插补可能引起的不确定性,如果是基于日尺度数据开展模型验证和改进,建议查看半小时尺度数据有效性,优先选择数据缺失较少的日尺度累积数据开展相应的研究。如果是基于半小时数据开展碳水交换过程研究,则优先选择未插补数据,以减少不确定性。
(5)本数据集的质量控制和处理方法的详细信息可参考于贵瑞等[3]、Yu等[8]和Wen等[23]发表的文献。