Page 78 - 水利学报2021年第52卷第1期
P. 78

3  水工建筑物安全监控深度分析模型优化构建方法


                   针对上述不足,以 LSTM 深度学习算法为基础,从数据前端处理、网络拓扑结构和外延预测方法
               三个方面着手改进,提出一种适用于不同类型水工建筑物的安全监控深度分析模型。
               3.1  数据前端处理        为了提高安全监控模型的外延能力,需提前对原型观测资料进行清洗、降噪和
                                                                               j
               变换等必要的处理。现给定包含 T 个数据的任一效应量监测序列 y ( ) t ,t = 1,2,,T;j = 1,2,
                                                  j       j
              ,J ,其中缺失值和异常值分别用 y ( ) t 、 y ( ) t 表示,那么前端处理具体操作步骤如下:
                                                 nu
                                                         an
                                                                                                       j
                  (1)步骤 1。数据清洗。利用笔者先前所提“插值填补”和“异常检测”算法分别对监测数据 y ( ) t
                              j             j                                               j
               中局部缺失值 y ( ) t 、异常值 y ( ) t 进行实时处理(详见文献[10]),得到修正序列 y ( ) t 。不同于传
                             nu
                                            an
                                                                                            1
               统 数 据 清 洗 方 法  [34] ,“ 插 值 填 补 ”算 法 能 通 过 分 布 式 建 模 充 分 利 用 缺 失 区 域 双 侧 已 知 监 测 数 据
                                                           }
              { ,y (t - 2 ),y (t - 1 ),y (t + 1 ),y (t + 2 ), 估计未知空值 y ( ) t ,而“异常检测”算法则能通过
                                                                           j
                     j
                                        j
                                                 j
                               j
                                                 nu
                              nu
                                       nu
                    nu
                                                                           nu
                                  j
               鲁棒分解对异常值 y ( ) t 起到明显放大作用,使其便于识别。
                                 an
                  (2)步骤 2。降噪平滑。一般认为,实际监测数据往往含有不同程度的噪声。在处理含噪数据
                                                                             j
               时,为了最大限度还原真实信号,同时避免相移,先将输入序列 y ( ) t 按顺序滤波,再将滤波结果
                                                                            1
                                                                                    j               [35]
               逆转并反向通过滤波器,最后将所得结果逆转后输出,即为降噪平滑序列 y ( ) t 。其数学描述                                        为:
                                                                                   2
                                                               j
                                                                     j
                                                        j
                                                      ì z ( ) t = y ( ) t × h ( ) t
                                                      ï ï  1  1
                                                               j
                                                        j
                                                      ï ïz ( ) t = z (T - 1 - t )
                                                      í  2 j  1 j   j                                  (7)
                                                      ï ï z ( ) t = z ( ) t × h ( ) t
                                                       3
                                                              2
                                                      ï ï y ( ) t = z (T - 1 - t )
                                                        j
                                                               j
                                                      î 2     3
                                                            j
                       j
                                                                                                     j
                                                                    j
               式中: h ( ) t 为所用数字滤波器冲激响应序列; z ( ) t 、 z ( ) t 分别为第一、二次滤波结果; z ( ) t 、
                                                           1       3                                2
                 j
               y ( ) t 分别为第一、二次滤波结果的逆转序列。
                2
                                                      j
                  (3)步骤 3。数据变换。对平滑序列 y ( ) t 进行归一化处理,既能加快寻求最优解的速率,又能
                                                     2
               避免给梯度更新带来数值问题。
                                                                    (
                                                                       j
                                                            j
                                                          y ( ) t - min y ( ) t  )
                                                  j
                                                y ( ) t =  2          2                                (8)
                                                           (
                                                                       (
                                                 3            j          j
                                                       max y ( ) t  )  - min y ( ) t  )
                                                             2
                                                                         2
                         (
                                      (
                                                              j
                                        j
                           j
               式中: min y ( ) t  ) 、 max y ( ) t  )  分别为平滑序列 y ( ) t 中的最小值和最大值。
                                                             2
                           2
                                        2
                                                                          j
                   需 要 说 明 的 是 , 上 述 步 骤 均 是 针 对 效 应 量 y ( ) t                而 言 , 若 是 对 影 响 因 子
                                                                        j
                                                                                   i
                i
               x ( ) t ,t = 1,2,,T;i = 1,2,,I 进行前端处理,将 y ( ) t 替换为 x ( ) t 即可。此外,倘若优
                                        j
               化深度模型选择对效应量 y ( ) t 进行一元时序预测,就在上述步骤的基础上,补充运用分段三次 Her⁃
                                                                                               j
               mite 插值函数   [36] 完成数据均匀化。为表述方便起见,下文将经过前端处理的效应量 y ( ) t (或因子
                                                                                               3
                             j
                                      i
                i
               x ( ) t )仍称为 y ( ) t (或 x ( ) t )。
                3
                                                                           i,j
                                                         j
               3.2  网络拓扑结构        全部数据(包括效应量 y ( ) t 及其影响因子 x ( ) t )经过预处理后,按照一定比
               例划分为训练集 T 、验证集 V 和测试集 T ,随后采取以下措施对深层网络拓扑结构进行优化改进。
                               r
                                         a
                                                    e
                  (1)并联搭建深层网络 LSTM 1和 LSTM(统称 LSTM                ),其中 LSTM 1用于一元时序预测,直接根据
                                                    2          1,2
                                      j
               历史监测数据对效应量 y ( ) t 未来变化趋势进行外延分析;LSTM 则用于多元回归预测,即通过效应
                                                                          2
                   j                 i,j
               量 y ( ) t 及其影响因子 x ( ) t 间的因果关系构建数学模型,进而求解待估计参数。
                — 74   —
   73   74   75   76   77   78   79   80   81   82   83