深度学习法在水文中应用的现状

2020-01-15 16:51□龚
河南水利与南水北调 2020年4期
关键词:水文水库调度

□龚 亮

(河南省岩石矿物测试中心)

1 深度学习简介

深度学习的计算模型由多个处理层组成,通过训练可学习多个抽象层次上的数据特征,它代表了当前人工智能研究的主流趋势,在计算机视觉和机器学习等领域带来技术层面上的革新。

与传统的机器学习相比,深度学习具有以下优势:模型结构立体纵深,多层的隐层节点使模型内部的训练过程更加复杂精密;数据特征抽象提取,经过多层神经网络的特征变换,将数据的特征表示逐渐抽象到另一个新的特征空间,通过此方法模拟人脑的学习过程。在深度学习的实现过程中,建立多层神经网络结构,确定合适的计算节点,通过逐层迭代训练,即可建立输入层到输出层的函数关系。在调整好模型结构及相关参数后,可实现模型对现实数据的有效模拟,从而大大减小工作量与时间成本,对复杂事务实现自动化管理。

基于此,文章综合国内外相关研究,介绍了深度学习的基本概念与原理,从水文预报、水库调度以及遥感图像分类三个方面阐述深度学习在水文中的应用现状。最后,指出深度学习在水文中的应用中存在数据稀缺性、原理可解释性以及参数选择等方面的不足之处,对未来研究趋势进行分析,以指导深度学习在水文应用中的进一步发展。

2 深度学习在水文中的应用

2.1 水文预报

水文预报中采用的模型方法主要有三类:物理模型、概念模型以及黑箱模型,前两者的建立要求掌握水文过程的原理,但由于水文现象的规律十分复杂,且许多参数难以获取,所以很难有较好的模拟效果。此时,基于数据驱动的黑箱模型便显露其优势,只要建立合适的模型,输入足够多的数据,即可得出准确度很高的模拟结果。

作为黑箱模型的一种,深度学习方法近年来才开始运用到水文预报中。目前相关研究不多,主要可总结为降水预测、水库来水预测以及降雨径流模拟三个方面。前两者是对一个水文因素的数据序列进行分析,而后者需要学习两个水文因素之间的相关关系,输入长序列的数据后,通过模型内部逐层学习,即可较好地延展水文序列,以实现水文工作的需要。研究表明,多种基于深度学习方法的计算模型均可适用于水文预报领域,如:长短期记忆神经网络(LSTM)以及深层回声状态网络(DeepESN)、卷积长短期记忆神经网络(ConvLSTM)等。同时,也有研究将深度学习方法进行改进,创造出更适合水文预报的独特方法。2016 年Yun Bai 等提出了一种基于混合模型的多尺度深层特征学习(MDFL)方法来处理水库日入库量预测问题。首先提取数据的多尺度(趋势、周期和随机)特征,然后分别用三个深信度网络(DBNs)表示每个DBN的权值,将其应用于初始化神经网络(D-NN)。最后,对三个尺度的D-NNs的输出进行重构,采用混合模型对三峡水库2000—2012 年的历史日入库序列进行了研究,证明该模型的效优于传统模型。该方法将深度学习的框架与多尺度、混合观测相结合,有利于探索水库入库预报的复杂性质,为水库调度提供数据支持。但深度学习方法对水文预报的数据量及连续性有一定的要求,数据量不足或水文条件改变都会影响水文预报的效果。

2.2 水库调度

水库调度是受到多个变量、多重约束所影响的复杂问题,涉及时间尺度、降雨、农业灌溉等自然条件以及洪水调峰等人类需求等多个具有不确定性的因素。因此,基于运行规则的物理模型难以准确模拟水库运行过程以及预测水库出流。随着大数据挖掘技术的发展,数据驱动的人工智能模型已成功推广到水库调度领域。人工智能模型能够从大量的水文数据和实时的水库运行数据中自动学习水库运行规律,但传统模型仍存在着特征提取能力弱、耗时较长等缺点。

近年来,深度学习作为计算机科技前沿,在解决调度问题方面积累了一些成功的经验。目前,深度学习方法在水库调度中的应用研究较少,主要有贝叶斯深度学习模型、LSTM模型、卷积LSTM 模型等。关于水库调度的研究主要集中于深度学习方法与传统人工智能模型的对比,深入分析深度学习方法的优势所在。例如:Zhang D等将3个人工智能模型进行对比,即反向传播(BP)神经网络,支持向量回归(SVR)技术,长短期记忆(LSTM)模型,基于约30 a 的历史水库运行记录模拟水库操作,以探讨LSTM 模型在水库运行模拟中的适用性。结果表明,LSTM模型能够有效地降低其他人工智能模型所需的时间消耗和内存存储量,并具有良好的模拟低流量工况和高峰运行期流量曲线的能力。深度学习方法在水库调度方面的优势已经显现,但入库水量的不确定性对模型精度的影响亟待验证。对此,Liu Y Q 等提出了一种同时考虑模型参数不确定性和来水不确定性的贝叶斯深度学习方法。在该模型中,采用蒙特卡罗积分将入流概率的复积分转化为求和形式,利用变分推理得到模型参数的后验分布。该方法在长江三峡工程中得到了实际应用,结果表明,此种贝叶斯深度学习方法在水电发电量和均方根误差方面均优于其他比较方法,在考虑入流不确定性时,该方法具有更强的优势。与传统方法相比,深度学习方法在水库调度应用中可以很好地解决不确定性以及条件多变等问题,优势显著。但目前在水库调度中的应用并不广泛,仍需进行更多相关研究,将深度学习方法与水库调度特点更好地融合。

2.3 遥感图像分类

提取水体信息以及流域下垫面信息是水文流域调查必不可少的一个环节,可为流域水文模拟、生态环境评估等提供基础资料。为了保证效果最优,遥感影像的分类需要尽量精确。传统的遥感影像分类方法有基于贝叶斯的最大似然法、最小距离法等,但这些传统方法分类精度不高,可能会出现错分、漏分的现象。随着技术的发展,人工智能方法开始得到广泛应用,如:人工神经网络分类方法,此类方法的效果虽然较传统方法有所提升,但仍有较大的改进空间。

近年来,随着深度学习方法的普及,其在遥感影像分类方法的应用研究也逐渐增多。在水体识别提取方面,深度学习以其在特征提取方面的优势开辟了新的思路,不再受到传统方法如单波段阈值法及水体指数法等需要通过多次实验确定阈值的局限。杜敬将深度卷积神经网络模型运用到无人机遥感影像水体识别中,得到的结果表明识别准确度高达95.36%,优于传统的向量机法、面向对象法。许多基于深度学习的新方法被提出,如:基于堆叠自动编码器的水体提取模型,基于卷积神经网络和logistic 回归分类器的多光谱数据水体提取方法,这些新方法准确性的优势均得到了验证。在长序列土地利用分类方面,深度学习方法的应用也带来了突破。Wang HY等将双向长短期记忆网络(Bi LSTM)模型与长时间序列的土地利用分类数据相结合,得到了总体精度为84.20%的分类结果,为建立高分辨率长时间序列土地覆盖分类产品提供了新思路。但基于遥感图像制作标签数据的过程较为复杂,而目前的监督训练方法有需要大量的标签数据,导致工作量较大。此外,影像分类的结果也会受到遥感数据的预处理和标准化处理的方式的影响,更稳定高效的分类方法有待研究。

3 未来展望

3.1 不足之处

3.1.1 数据稀缺性问题

深度学习属于数据驱动技术,需要大量数据进行训练,且足够的数据量才能保证模型的精度。但基础的水文资料在很多地区难以获得,传统的人工搜集标签数据的方法产生较高的人力物力成本。因此,数据的自动采集传输是亟待突破的难关,基于部分标签的无监督的深度学习方法有待进一步研究。

3.1.2 原理可解释性问题

深度学习方法建立基于数据的黑箱模型,缺乏具体的物理原理及过程机理作为支撑。而自然界中的水文过程十分复杂,使用黑箱模型可能会导致模拟精度不够以及难以使人信服等问题。因此,深度学习方法需要与水文原理进行有机结合,创造出更具有水文色彩的更有效的模型。

3.1.3 参数选择问题

选择模型训练参数也是深度学习方法面临的一个关键问题,比如:隐层层数、卷积核大小、优化函数的设定等。由于现阶段对于深度学习方法的工作原理认识不够,只能依靠研究人员的经验与反复试验确定训练参数。因此,探究训练参数与训练结果之间的规律是十分必要的,由此可以针对具体的水文情景创建专属的参数设置体系。

3.2 结论与展望

近年来,深度学习在水文中的应用广泛,给水文预报、水库调度以及遥感图像分类等诸多领域带来了深刻变革。多年研究逐渐发展出将LSTM模型、卷积LSTM模型、深度卷积神经网络模型等深度学习方法运用到水文领域的成功经验。实践证明深度学习方法在特征提取和模拟优化方面的优势是物理方法及传统机器学习方法无可比拟的,值得进一步研究与发展。

基于目前深度学习技术存在的数据稀缺、原理难以解释以及参数选择困难等问题,已经逐渐发展出元学习、小样本深度学习、神经网络构架搜索、深度迁移学习等深度学习技术的分支。有理由相信,越来越多的研究将会带领深度学习方法与水文领域更好的融合互通,创造出更有效的数据分析以及模型建立技术,为水文领域注入新的发展活力。

猜你喜欢
水文水库调度
漳河有一水库群
继往开来 守正创新——河北省水文工程地质勘查院
中型水库的工程建设与管理探讨
继往开来 守正创新——河北省水文工程地质勘查院
出山店水库
水文
水文水资源管理
《调度集中系统(CTC)/列车调度指挥系统(TDCS)维护手册》正式出版
电力调度自动化中UPS电源的应用探讨
基于强化学习的时间触发通信调度方法