Page 79 - 水利学报2021年第52卷第1期
P. 79
(2)超参数调试对深层网络的预测效果影响较大。以 LSTM 为例,通过试算和随机搜索算法,对
2
隐层数 n 、各隐层节点数 n 、学习率 l 和优化迭代次数 n 等超参数进行迭代优化,选取最优超参数组
h
n
r
i
(
合 n opt ,n n opt ,l r opt ,n i opt ) 。相较于 LSTM ,LSTM 需将时序问题转化为监督学习问题,故增加时间窗口长
h
2
1
度 w 这一超参数。
t
(3)多数效应量监测序列存在长期相关性(即记忆性),通常越接近待预测值的数据对外延精度的
影响越大,且过多的历史冗余数据会增加模型的复杂度 [37] 。在预设范围内,通过限定步长 l 改变 T 跨
r
m
度,循环训练得到不同的网络 LSTM ,m = 1,2, ,根据 V 多次评估选取精度较高的网络结构
1,2 a
best
LSTM ,其对应的有效记忆区间 T + V (区间长度设为 d )即可满足预测 T 的要求。
1,2 r a e
(4)为避免 LSTM 因 T 数据量较少而出现过拟合等问题,一方面,控制网络深度和训练周期,
1,2 r
根据训练损失和 V 性能评估确定何时提早停止;另一方面,采用 L 正则化、Dropout、批标准化等方
a
2
法对模型参数进行约束,提高模型的泛化能力 [38] 。此外,添加正则项也有助于解决共线性问题。
best
(5)针对不同应用场景,将多步预测精度和逐步误差累积作为竞选指标,自动择优选用 LSTM
1
best
或 LSTM 进行外延预测,并利用全连接层进行维度变换(一维输出),以此实现最优化数学建模。
2
3.3 外延预测方法 直接多步预测(Direct Multi-step Prediction,DMP)能够一次返回多个时刻的预测
j
值 ŷ ( ) t ,是目前安全监控模型中最常用的外延方法。DMP 的学习、估计过程分别见下式:
j 1( 1,j 2,j I,j
)
y (t + 1 = f x (t + 1 ),x (t + 1 ),⋯,x (t + ) ) 1 + ε (9)
1(
1,j
j
2,j
I,j
)
ŷ (t + h = f x (t + h ),x (t + h ),⋯,x (t + ) ) h h = 1,2,⋯,H (10)
式中: f (×) 为预测模型,文中指代 LSTM ; ε 为学习误差; H 为外延步数。
1 2
j
与 DMP 不同,滚动单步预测(Rolling One-step Prediction,ROP)是将上一时刻预测值 ŷ ( ) t 作为
j
)
下一时刻预测值 ŷ (t + 1 的输入,利用动态更新间接实现多步预测,直至达到待预测步数 H 为止。
ROP 的学习、估计过程分别见下式:
j 2( j j j
)
y (t + 1 = f y ( ) t ,y (t - 1 ),,y (t - d + ) ) 1 + ε (11)
ì 2( j j ),,y (t - d +
j
ï f y ( ) t ,y (t - 1 ) ) 1 h = 1
2(
j ï j j j j
)
ŷ (t + h = í f ŷ (t + h - 1 ),,ŷ (t + 1 ),y ( ) t ,,y (t - d + ) ) h h = 2,3,,d (12)
ï
2(
j
j
j
ï f ŷ (t + h - 1 ),ŷ (t + h - 2 ),,ŷ (t + h - d ) ) h = d + 1,d + 2,,H
î
式中: f (×) 为预测模型,文中指代 LSTM ; d 为有效记忆区间长度。
2 1
对于一个稳定的预测模型,无需高频次学习更新,通过设定更新时间 t 即可完成周期性的模型迭
u
代。
综合上述三个方面的改进,以 LSTM 算法为基础的水工建筑物安全监控优化深度模型得以构建,
称为优化 LSTM 模型(Optimized LSTM,OLSTM)。
4 工程实例验证
基于上述模型方法,选取多组不同效应量实测数据作为典型应用场景,对 OLSTM 进行有效性和
准确性验证,旨在通过此实例说明 OLSTM 在多类型水工建筑物安全监控方面的优势。为此,以某混
凝土坝 IP4_01_X 方向变形监测数据(数据示于图 2,竖线以右为预测期)与某调水工程关键部位钢筋
计、测缝计、应变计和渗压计读数记录(数据示于图 3,竖线以右为预测期)为例,设定 3 种实际应用
场景,引入逐步回归统计模型(SRSM)和 SVM、反向传播神经网络(BPNN)等浅层模型与 OLSTM 深度
模型进行性能对比。仿真实验中需要注意以下几点:(1)确保各模型输入数据前端处理步骤(详见 3.1
— 75 —