Page 30 - 2022年第53卷第4期

P. 30

型应用于大坝监测领域已成为研究热点［15-16］。与传统的机器学习方法相比，深度学习模型可对渗流
监测数据进行深度挖掘，能得到更加准确的预测结果。在时序预测研究中，循环神经网络（Recur⁃
rent Neural Networks，RNN）是一种常用的深度学习模型。然而，RNN 存在梯度消失和爆炸的问题，
导致对长时间序列数据的预测精度不足［17］。LSTM 的提出解决了传统循环神经网络（RNN）的缺陷，
它在 RNN 的隐含层中引入“门”的概念来增强模型的长期记忆能力，可以有效避免时间序列中长期
依赖的问题［18］。与其他神经网络模型一样，LSTM 具有众多超参数且难以通过人为选择确定最优超
参数。此外，不同的超参数对模型的拟合优度、收敛速度等都存在较大的差异性。蚁狮优化算法
（Ant Lion Optimizer，ALO）因其具有调节参数少、收敛速度快、鲁棒性高等特点，在工程领域应用
广泛［19-20］。因此，本文采用 ALO 算法对 LSTM 的参数进行自动寻优。
在大坝服役期间，坝体渗流压力受到上下游水位、温度、降雨以及坝体材料的时变特性等多种
［2］
变量的耦合影响。由于 LSTM 为黑箱模型，故其对坝体渗流压力与影响因子之间的可解释性不高［21-22］。
注意力机制是从人类视觉研究中衍生出来的智能算法，通过在关键信息上分配注意力权重来突出
重要的特征信息［23］。本文在渗压预测模型中引入一种特征注意力机制以增强模型对各个影响因子
的可解释性。值得注意的是，当影响因子维数较多时，会存在多重共线性，不仅会造成信息的冗
余［5，24］，还会影响注意力机制进行特征学习时的准确性。因此，在渗压预测研究中需要对影响因子
进行降维处理以消除其多重共线性。常用的降维方法有皮尔逊相关分析法、主成分分析（Principal
Component Analysis，PCA）、逐步回归、关联度分析方法等［25-26］。其中，PCA 方法是一种通过线性
空间变换将多个输入向量进行降维的统计分析方法，其降维效果显著，故本文选择 PCA 方法来对
各影响因子数据进行降维处理。
综上所述，为深入探究渗压效应量变化的内在影响机制，本文提出了一种耦合 ALO-LSTM 和特
征注意力机制的土石坝渗压预测模型。首先，为了消除影响因子之间的多重共线性，采用 PCA 方
法对影响因子进行降维；其次，由于渗压监测数据为时间序列数据，为挖掘其在时间维度上的关
联性，构建基于 LSTM 的土石坝渗压预测模型，并采用 ALO 算法对 LSTM 模型的超参数进行自动寻
优；最后，采用特征注意力机制量化各个影响因子对渗流压力的影响程度以增强模型的可解释性。

2 耦合 ALO-LSTM 和特征注意力机制的土石坝渗压预测模型

2.1 ALO-LSTM 模型与传统的神经网络不同，传统循环神经网络（RNN）借助其循环模块可以帮
助模型记忆历史信息，这样网络可以更好地挖掘渗压输入变量和其影响因子中的时间信息。LSTM 模
型是对传统循环神经网络的一种改进，它通过将门控制函数引入状态动力学，解决了传统循环神经
网络中常见的梯度消失和爆炸问题［27］。LSTM 模型先通过遗忘门从记忆单元细胞中筛选渗压输入变
量；其中重要信息的存储由输入门来确定；最后通过输出门来输出渗压变量。LSTM 神经网络的结构
示意图如图 1 所示。

tanh
c͂ i

tanh

图 1 LSTM 神经网络结构示意图
— 404 —

25 26 27 28 29 30 31 32 33 34 35