Page 121 - 2024年第55卷第9期
P. 121
本研究将研究区域按 500m × 500m网格单元进行划分,流域共分为 11362个网格,根据流域土地
利用和土壤类型总共分为 7类,模型参数优化采用蒙特卡洛抽样法(MonteCarloMethod)进行网格参数
的分类率定。格点气象要素利用反距离加权插值法( InverseDistanceWeighting,IDW)计算,其中温度
数据集存在部分数据缺失,网格化计算时根据站点数据完整度分时间段分别计算权重并进行插值,最
后将各时段整理合并得到完整的温度输入数据。
3.2 CNN - LSTM 时空后处理模型
3.2.1 模型基本原理 卷积神经网络(CNN)的结构可分为 3层:卷积层(ConvolutionalLayer)、池化层
( MaxPoolingLayer)、全连接层(FullyConnectedLayer)。卷积层的主要作用是使用滤波器对输入的数
据样本进行扫描,通过卷积运算提取特征信息。池化层的功能是对卷积层的输出进行下采样( down
sampling),卷积处理后的特征信息数据过大,不便直接使用,池化层对其进行分割和最显著特征的筛
选,剔除其中的无用信息,以减少运算。池化过程不会对数据丢失产生影响,不改变最终结果。全连
接层将经过卷积层提取和池化筛选的特征信息进行分类,从而得到数据空间特征的识别结果 [27 - 28] 。
长短期记忆网络(LSTM)是一种特殊的循环神经网络(RNN)。传统 RNN网络存在梯度消失和梯度
爆炸的问题,因而在处理长序列时难以达到很好的性能。LSTM 引入了 4种门结构用以提升处理长序
列时的表现:输入门、输出门、更新门和遗忘门。其中输入门、输出门控制数据在记忆细胞间的输入
和输出,更新门用于对储存的过去信息进行更新,而遗忘门将选择性地遗忘过去信息中不影响或影响
较小的因素,避免这些信息继续往下传递,从而使模型的累计系统误差降低,有效解决梯度问题,得
到更优的结果 [29] 。
CNN - LSTM耦合模型旨在充分利用上述二者各自的优势,使耦合模型能够完成对数据样本空间特
征的提取和时间相关性的分析,实现对流域水文过程这一具备空间分布和时间序列双重特性的研究对
象进行更全面的信息提取和处理 [30] 。
3.2.2 模型结构 本研究以 Grid - HBV水文模型输出的分布式产流要素作为 CNN - LSTM 模型和 LSTM
模型的输入数据样本,以柏枝岙水文站实测径流作为输出数据样本,进行后处理模型的训练。
本研究共使用 3种模型开展径流后处理以进行比较分析,详细信息可见表 1:
(1)以单一分布式产流要素(格点总径流即 Qf + Qs)一维向量为输入数据的 s - LSTM模型;
( 2)以单一分布式产流要素(格点总径流即 Qf + Qs)二维栅格为输入数据的 s - CNN - LSTM模型;
(3)以 2种分布式产流要素(格点快速径流 Qf和格点基流 Qs)组成的三维矩阵为输入数据的 bi -
CNN - LSTM模型。
表 1 各后处理模型信息一览表
模型名称 模型输入 模型结构
s - LSTM 11362 × 1 × T LSTM层 1(32) +LSTM层 2(16)
s - CNN - LSTM 175 × 127 × 1 × T 卷积层 1(32,3) + 卷积层 2(64,3) +LSTM层 1(32) +LSTM层 2(16)
bi - CNN - LSTM 175 × 127 × 2 × T 卷积层 1(32,3) + 卷积层 2(64,3) +LSTM层 1(32) +LSTM层 2(16)
上述 3种模型的结构示意图如图 3所示。其中 2个 CNN - LSTM 模型的输入数据为 175 × 127 × N × T
的四维数据集。其中前两个维度代表网格化研究区域的格点列数和行数;N代表产流要素数,s - CNN -
LSTM模型中为 1,bi - CNN - LSTM模型为 2;T代表数据集时间长度(d)。输入数据首先进入 CNN模
块,通过前后 2个二维卷积层和池化层进行图像扫描和特征信息提取,卷积核数分别为 32和 64;再
由全连接层完成分类得到图像识别结果,传递至 LSTM 模块中作为输入数据。LSTM 模块由节点数分
别为 32和 16的两层神经元组成,将 CNN模块传递而来的输入数据与实测数据进行训练后输出,经由
全连接层整合为最终的径流模拟值。模型采用的优化器为 Adam,训练迭代次数为 150次,初始学习
率为 0.0001,迭代 100次时学习率调整为原学习率的 10%,每组训练数据量为 64,损失函数为均方误
差(MSE)。数据集划分比例训练集:验证集:测试集为 5∶2∶3。
— 1 1 6 —
2