Page 79 - 水利学报2021年第52卷第1期
P. 79

(2)超参数调试对深层网络的预测效果影响较大。以 LSTM 为例,通过试算和随机搜索算法,对
                                                                        2
               隐层数 n 、各隐层节点数 n 、学习率 l 和优化迭代次数 n 等超参数进行迭代优化,选取最优超参数组
                      h
                                       n
                                                 r
                                                                  i
                 (
               合 n opt  ,n n opt  ,l r opt  ,n i opt )  。相较于 LSTM ,LSTM 需将时序问题转化为监督学习问题,故增加时间窗口长
                   h
                                               2
                                                       1
               度 w 这一超参数。
                  t
                  (3)多数效应量监测序列存在长期相关性(即记忆性),通常越接近待预测值的数据对外延精度的
               影响越大,且过多的历史冗余数据会增加模型的复杂度                          [37] 。在预设范围内,通过限定步长 l 改变 T 跨
                                                                                                        r
                                                 m
               度,循环训练得到不同的网络 LSTM ,m = 1,2, ,根据 V 多次评估选取精度较高的网络结构
                                                 1,2                     a
                    best
               LSTM    ,其对应的有效记忆区间 T + V (区间长度设为 d )即可满足预测 T 的要求。
                    1,2                        r   a                                e
                  (4)为避免 LSTM       因 T 数据量较少而出现过拟合等问题,一方面,控制网络深度和训练周期,
                                  1,2   r
               根据训练损失和 V 性能评估确定何时提早停止;另一方面,采用 L 正则化、Dropout、批标准化等方
                               a
                                                                            2
               法对模型参数进行约束,提高模型的泛化能力                     [38] 。此外,添加正则项也有助于解决共线性问题。
                                                                                                        best
                  (5)针对不同应用场景,将多步预测精度和逐步误差累积作为竞选指标,自动择优选用 LSTM
                                                                                                        1
                       best
               或 LSTM    进行外延预测,并利用全连接层进行维度变换(一维输出),以此实现最优化数学建模。
                      2
               3.3  外延预测方法        直接多步预测(Direct Multi-step Prediction,DMP)能够一次返回多个时刻的预测
                   j
               值 ŷ ( ) t ,是目前安全监控模型中最常用的外延方法。DMP 的学习、估计过程分别见下式:
                                         j       1(  1,j      2,j           I,j
                                              )
                                       y (t + 1 = f x (t + 1 ),x (t + 1 ),⋯,x (t +  ) ) 1 + ε          (9)
                                          1(
                                            1,j
                                 j
                                                      2,j
                                                                     I,j
                                       )
                                ŷ (t + h = f x (t + h ),x (t + h ),⋯,x (t +  ) ) h  h = 1,2,⋯,H      (10)
               式中: f (×) 为预测模型,文中指代 LSTM ; ε 为学习误差; H 为外延步数。
                       1                            2
                                                                                                   j
                   与 DMP 不同,滚动单步预测(Rolling One-step Prediction,ROP)是将上一时刻预测值 ŷ ( ) t 作为
                                j
                                     )
               下一时刻预测值 ŷ (t + 1 的输入,利用动态更新间接实现多步预测,直至达到待预测步数 H 为止。
               ROP 的学习、估计过程分别见下式:
                                          j       2(  j     j            j
                                              )
                                        y (t + 1 = f y ( ) t ,y (t - 1 ),,y (t - d +  ) ) 1 + ε      (11)
                               ì  2(  j    j    ),,y (t - d +
                                                         j
                               ï  f y ( ) t ,y (t - 1            ) ) 1  h = 1
                                 2(
                       j       ï     j               j        j          j
                            )
                      ŷ (t + h = í f ŷ (t + h - 1 ),,ŷ (t + 1 ),y ( ) t ,,y (t - d +  ) ) h  h = 2,3,,d  (12)
                               ï
                                 2(
                                                 j
                                                                 j
                                     j
                               ï f ŷ (t + h - 1 ),ŷ (t + h - 2 ),,ŷ (t + h - d  ) )  h = d + 1,d + 2,,H
                               î
               式中: f (×) 为预测模型,文中指代 LSTM ; d 为有效记忆区间长度。
                       2                            1
                   对于一个稳定的预测模型,无需高频次学习更新,通过设定更新时间 t 即可完成周期性的模型迭
                                                                                   u
               代。
                   综合上述三个方面的改进,以 LSTM 算法为基础的水工建筑物安全监控优化深度模型得以构建,
               称为优化 LSTM 模型(Optimized LSTM,OLSTM)。
               4  工程实例验证
                   基于上述模型方法,选取多组不同效应量实测数据作为典型应用场景,对 OLSTM 进行有效性和
               准确性验证,旨在通过此实例说明 OLSTM 在多类型水工建筑物安全监控方面的优势。为此,以某混
               凝土坝 IP4_01_X 方向变形监测数据(数据示于图 2,竖线以右为预测期)与某调水工程关键部位钢筋
               计、测缝计、应变计和渗压计读数记录(数据示于图 3,竖线以右为预测期)为例,设定 3 种实际应用
               场景,引入逐步回归统计模型(SRSM)和 SVM、反向传播神经网络(BPNN)等浅层模型与 OLSTM 深度
               模型进行性能对比。仿真实验中需要注意以下几点:(1)确保各模型输入数据前端处理步骤(详见 3.1
                                                                                                — 75   —
   74   75   76   77   78   79   80   81   82   83   84