闵屾,钱荣树,朱广伟,黄建明,秦伯强*,杨宏伟,李宽意,张运林,沈睿杰
1.中国科学院南京地理与湖泊研究所,南京 210008
2.中国科学院太湖湖泊生态系统研究站,江苏无锡 214026
太湖(119°52′-120°36′E,30°55′-31°32′N)是我国五大淡水湖泊之一,地处长江三角洲,流域面积约3.69万km2。太湖流域是我国人口最密集、经济最发达的地区之一。太湖作为典型的浅水性湖泊,平均水深1.9 m,水面面积2338 km2,是整个太湖流域水调节和水生态系统的中心,承担着农业灌溉、工业用水及居民生活用水等重要功能,对长江下游地区的经济发展起着举足轻重的作用[1]。随着经济发展加快,人类活动增加使得大量的营养物质进入湖泊,导致太湖富营养化水平增高,随之而来的蓝藻水华日益严重,对湖泊生态功能及周边人民供水安全造成了严重危害。
以往研究表明,氮、磷、有机碳及水温等理化因子的综合作用对太湖蓝藻的生长和水华的暴发有着重要的影响[2-3]。因此,水体理化因子的长期监测数据有助于了解太湖水生态系统的变化情况,可为太湖水质目标管理、及时有效制定应对措施等提供数据基础。
中国科学院太湖湖泊生态系统研究站(以下简称太湖站)隶属于中国科学院南京地理与湖泊研究所,成立于1988年,并于1989年进入中国生态系统研究网络(CERN)。“太湖站”无锡本部位于太湖梅梁湾东岸(31°24′N,120°13′E,图1),作为太湖生态环境长期监测平台于1991年开始对太湖进行连续采样监测,积累了丰富的历史监测数据。本数据集汇集了太湖站8个长期观测站点2007-2015年的月尺度数据,包括透明度(m)、水深(m)、水温(℃)、电导率(μs/cm)、悬浮质(mg/L)、溶解氧(mg/L)、pH、硅酸盐(mg/L)、磷酸盐(mg/L)、亚硝酸盐氮(μg/L)、硝酸盐氮(mg/L)、氨态氮(mg/L)、化学需氧量(mg/L)、总磷(mg/L)、总氮(mg/L)和溶解性总有机碳(mg/L)。
图1 太湖站位置以及站点分布图
本数据集中涉及的太湖站8个常规观测站点分别为 THL00、THL01、THL03、THL04、THL05、THL06、THL07和THL08,样地编码沿用CERN长期生态联网监测中的编码,具体见表1。此8个观测站点长期定位监测太湖生态环境各项指标,采样频率均为1次/月,于每月中旬采样。
表1 太湖站观测点序号、编码及经纬度
本数据集包含的各项指标中,有些指标为采样现场测定,如水深、水温、透明度。其中,使用测深仪测量水深,水温计测量水温,测量仪器定期校准;透明度使用塞氏圆盘,每个采样点测定3次取均值。现场测定的指标通常是采样人员在现场测量之后,将数据记录在采样表中,并填写其他辅助信息,如采样点、采样时间以及天气等。
其余指标在对采集的水样进行妥善保存之后带回实验室按照湖泊生态调查观测与分析标准方法[4]进行测定。其中,pH使用PHS-3TC仪测定,使用前使用标准缓冲液校准;电导率使用DDS-11C电导率仪进行测定;悬浮物使用烘箱和十万分之一的电子天平进行测定;溶解氧、化学需氧量使用10 ml微量滴定管进行测定,使用前进行浓度标定;磷酸盐、亚硝酸盐氮、硝酸盐氮、氨态氮、总磷、总氮使用紫外分光光度计进行测定,分析时带标样控制分析结果;硅酸盐使用SKALAR分析仪,溶解性总有机碳使用TOC-VCPC仪进行测定,分析时均带标样控制分析结果(表2)。
表2 太湖站水质监测使用仪器及质量控制表[5]
项目 分析方法 使用仪器 质量控制硅酸盐 硅钼蓝自动比色法 SKALAR流动分析仪 分析时带标样控制分析结果磷酸盐 钼锑抗分光光度法 UV-2450PC紫外分光光度计 分析时带标样控制分析结果亚硝酸盐氮 N-(1-萘基)-乙二胺光度法 UV-2450PC紫外分光光度计 分析时带标样控制分析结果硝酸盐氮 酚二磺酸光度法 UV-2450PC紫外分光光度计 分析时带标样控制分析结果氨态氮 纳氏试剂光度法 UV-2450PC紫外分光光度计 分析时带标样控制分析结果化学需氧量 酸性法 10 ml微量滴定管 每次标定高锰酸钾使用液浓度总磷 钼锑抗分光光度法 UV-2450PC紫外分光光度计 分析时带标样控制分析结果总氮 紫外分光光度法 UV-2450PC紫外分光光度计 分析时带标样控制分析结果溶解性总有机碳 燃烧法 TOC-VCPN 分析时带标样控制分析结果电导率 电导率仪法 DDS-11C电导率仪 定期标定悬浮物 烘干法 烘箱,十万分之一电子天平烘3小时后在干燥器中冷却称重,再烘半小时后在干燥器中冷却称重;误差小于万分之一
太湖水体理化监测数据集为表格型数据,包含太湖站8个常规观测站点2007-2015年16个理化指标,观测频率为1次/月。其具体字段名称、类型等参见表3。数据集中缺测数据用“/”表示,使用箱线法对数据进行质量评估得到的离群数据用绿色字体标注,异常数据用红色字体标注。各指标分析精度见示例。
表3 太湖水体理化监测数据表内容
字段名称 数据类型亚硝酸盐氮 数字型硝酸盐氮 数字型氨态氮 数字型化学需氧量 数字型总磷 数字型总氮 数字型溶解性总有机碳 数字型备注 字符型量纲/说明 示例μg/L 14.6 mg/L 0.35 mg/L 0.61 mg/L 140.25 mg/L 6.478 mg/L 86.27 mg/L 14.996必要的说明文字 水华很多,100%覆盖
为了保证数据质量进而实现有效共享,CERN形成了严谨的质量控制体系,通过计划、执行、评估三个步骤,采取前端控制和后端质控的管理模式,对数据进行审核、检验和评估[6]。质量控制管理具体可分为三级:
第一级为台站层级的质量控制。太湖站作为CERN站,在样品采集、分析化验和数据处理过程中,严格按照CERN统一制定的水环境观测规范[7]、湖泊生态调查观测与分析标准方法[4]以及水环境观测质量控制规范[6]来开展相关工作。太湖站仪器分析数据使用的各种仪器设备由专人负责管理使用,并要求厂商定期上门维护。所有监测分析项目,由专人长期严格按照规范操作进行,在分析测试过程中,需要带标样控制分析结果,并要求做到数据真实、记录规范、书写清晰、数据及辅助信息完整等。分析测试工作完成之后,由数据管理员进行了各种源数据的集成、整理、转换、格式统一;通过一系列质量控制方法,去除随机及系统误差,并与历史数据信息进行比较,评价数据的完整性、准确性、可比性和连续性。
第二级为专业分中心的质量控制。太湖站分属CERN水体分中心,每年太湖站按时保质保量向水体分中心提交监测数据,水体分中心通过阈值范围、完整性、一致性等方面的检查进行数据审核,汇总形成数据质量评估报告,并将数据整理上报至CERN综合中心。
第三级为CERN综合中心的质量控制。综合中心除了用软件检查数据质量外,重点检查数据格式的规范性,尽可能减少数据入库的错误率。
本数据集内共有数据864条,每条数据包含16个指标共计13 810个数值,其中缺失数值14个(表4)。为检验数据质量,我们使用箱线图法计算数据集中各指标的四分位间隔范围(IQR=Q3-Q1,其中Q3和Q1分别为上、下四分位数)来检验数据集中各指标的离群值(Outlier)和异常值(Extreme)[8]。我们将高于上四分位数或低于下四分位数1.5倍IQR的数据标记为离群值;高于上四分位数或低于下四分位数3倍IQR的数据标记为异常值,除去离群值和异常值之外的数据称为有效数据。本数据集16个指标中有10个指标的有效数据占比达到95%以上,仅有1个指标的有效数据占比在90%以下(表4)。本数据集中没有剔除筛选出来的离群值和异常值,只是对可能存在问题的数据进行标记,供使用该数据集的研究人员参考。
表4 数据质量评估表
富营养化是全球湖泊普遍面临的生态灾害问题之一。太湖是我国蓝藻水华问题出现最早、治理时间最长的大型湖泊之一。2007年5月无锡发生饮用水危机事件,根本原因就是富营养化导致的蓝藻水华在水源地积聚[9]。自此之后,太湖治理攻坚战已开展10余年,整体水质有所改善[10-11],但蓝藻水华灾害问题依然存在[12]。
水体理化因子是衡量气候变化及人类活动对湖泊生态系统影响的重要指标。本数据集包含了太湖站8个长期监测站点2007-2015年的理化数据,对深入了解太湖水体生态系统的结构、功能和演替规律具有重要意义,可为揭示水体内能量流转及物质循环过程、探索大型富营养化浅水湖泊蓝藻水华爆发机制提供数据基础,为蓝藻水华预测预警、富营养化防控治理及饮用水安全保障等提供科学支撑。
本数据集可通过Science Data Band在线服务网址(http://www.sciencedb.cn/dataSet/handle/833)获取数据;也可登录江苏太湖湖泊生态系统国家野外科学观测研究站数据资源服务平台(http://thl.cern.ac.cn/meta/detail/LC02),通过申请获取数据服务。