Page 77 - 水利学报2021年第52卷第1期
P. 77

l
                                l
                                             l
              ( f )、输入门( i )和输出门( o )构成,用于决定数据更新或丢弃。具体来说,遗忘门控制上一时
                 t
                               t
                                             t
                                                                               l
                                                                              ͂
               刻内部状态(C      l  )需遗忘的信息量,输入门控制当前时刻候选状态(C )需保存的信息量,而输出门
                            t - 1                                             t
                                                               l
                                         l
               则控制当前时刻内部状态(C )需输出给外部状态( h )的信息量。其对应计算过程如下:
                                                               t
                                        t
                                                                                           ͂
                                                                                      l
                                                                                            l
                  (1)利用上一时刻外部状态( h            l  )和当前时刻输入( h       l - 1 ),计算出 f  l  、 i 和 C :
                                              t - 1                t - 1        t     t    t
                                                               l
                                                   f t  l  = σ ( w ×[ h  t - 1 ,h t - 1 ] + b f  )     (1)
                                                                    l - 1
                                                           f
                                                              l
                                                    l
                                                   i = σ ( w ×[ h t - 1 ,h  l - 1 ] + b i )            (2)
                                                          i
                                                    t
                                                                   t - 1
                                                  ͂
                                                                l
                                                   l
                                                 C = tanh( w ×[ h t - 1 ,h t - 1 ] + b C )             (3)
                                                                     l - 1
                                                  t
                                                           C
                                  l
                                                       l
                  (2)结合 f   t  l  和 i 更新记忆单元状态(C ):
                                                      t
                                 t
                                                               l
                                                                   l
                                                       l
                                                           l
                                                      C = f C t - 1  + i C ͂  t l                    (4)
                                                                   t
                                                       t
                                                          t
                                 l
                                               l
                            l
                  (3)通过 o 将 C 信息传递给 h :
                                               t
                                 t
                            t
                                                    l
                                                   o = σ ( w ×[ h l t - 1 ,h  t - 1 ] + b o )          (5)
                                                                    l - 1
                                                    t
                                                          o
                                                       h = o tanh( )                                  (6)
                                                            l
                                                        l
                                                                     l
                                                                   C
                                                                    t
                                                        t
                                                            t
               式中: σ (×) 、 tanh(×) 分别为 Sigmoid 函数和双曲正切函数; w 、 b 分别为权重矩阵和偏置向量;  表
               示两向量的标量积。
                                              σ      σ           σ
                                                   图 1  LSTM 单元内部结构 [25]
               2.3  深度学习算法适用性分析             对于水工建筑物安全监控大数据,深度学习(如 LSTM)与浅层学习相
               比,主要“深”在能够更为全面地获取数据潜在规律,从而为提升模型预测性能奠定信息基础。因
               此,LSTM 算法在水工建筑物安全监控通用模型构建框架中,不仅能承担模型层的预测功能,而且能
               减少特征层中手工提取有效信息的工作量。再者,LSTM 模型结构便于调整,可依据数据形式的复杂
               程度而定    [33] 。不过,根据监测数据特性,直接应用 LSTM 算法构建安全监控模型仍有以下几点不足:
              (1)监测数据中存在含噪失真、非等间距以及局部空值野值等现象,需加强数据前端处理;(2)监测
               数据处理讲究及时有效,模型难以实现全数据处理,需限定记忆区间以减少模型训练时长;(3)模型
               表现易受监测数据多重共线性等的影响;(4)模型超参数较多,而单一项目监测数据量并不大,容易
               发生过拟合;加之,监测项目众多,数据形式多样,对模型泛化能力提出了更高要求;(5)监测数据
               外延对模型多步预测精度和特殊场景应对能力亦较为重视。因此,有必要优化深度模型架构以适应
               安全监控大数据分析的需求。

                                                                                                — 73   —
   72   73   74   75   76   77   78   79   80   81   82