Page 76 - 水利学报2021年第52卷第1期
P. 76

点 [8-11] 。Wang 等 [12] 、Wei 等 [13] 和李明超等 [14-15] 进一步发展并创新提出了组合模型、时空模型等一系列
                                                          [5]
               先进方法,并取得了丰富成果。据此,吴中如等 归纳总结出安全监控模型的总体发展趋势如下:三
               大常规模型逐渐向组合化、时空化和智能化发展,以此提高模型的准确性、鲁棒性和外延性。
                   随着安全监控理论和计算机技术的不断进步,智能化是水工建筑物安全监控发展的必然趋势,
               其主要体现在监测手段、数据管理和数值方法三个方面。目前,水利信息化建设偏重于监测仪器
               和信息集成系统的升级改造,而对数据分析方法的研究和创新关注较少                                    [2,16-19] 。这就引发数学监控
               模型的信息挖掘能力与数量日益庞大、形式日渐复杂的原型观测资料不相适应的问题,直接影响
               到模型的预测表现。尽管 ANN、SVM 等浅层学习算法相较于统计模型在非线性信息提取方面有较
               大提升   [20] ,但在某些场景下仍旧难以满足监控需求。深层非线性网络模型                             [21] 为解决上述问题提供了
               可行性。深度学习        [22] 是 ANN 发展的突破,亦是机器学习领域的拓展,其利用复杂结构或多重非线性
                                                                                                   [23]
               变换处理层对数据进行高度抽象,因而在隐含信息挖掘方面优势明显。以长短期记忆网络 (Long
               Short-Term Memory, LSTM)为例,其能够充分挖掘时序数据中的时间依赖性以增加信息维度,从而
               实现对滑坡位移        [24] 、地下水埋深    [25] 等监测量的高精度预测。而在水工建筑物安全监控领域,有关
               LSTM 等深度学习算法的应用探索还鲜有报道,仅有少量研究                           [26-29] 将其用于大坝变形预报,目前尚未
               扩展到其他水工建筑物,亦未针对监测数据自身特性进行优化处理。
                   为此,本文在 LSTM 算法的基础上构建水工建筑物安全监控深度分析模型,并对算法进行优化,
               以提高所建模型的预测可靠性和工程适用性,其主要包括以下三个方面的内容:(1)界定水工建筑物
               安全监控大数据的概念,并阐明直接应用深度学习算法构建安全监控模型的局限性;(2)有针对性地
               提出适用于不同类型水工建筑物的安全监控深度模型构建及优化方法;(3)通过多类型水工建筑物的
               多效应量实测数据验证所提模型方法的有效性。


               2  深度学习及其应用分析


               2.1  安全监控大数据特性            水工建筑物安全监控大数据并不完全符合信息技术行业大数据的“5V”特
                [30]
               征 (即 Volume、Variety、Velocity、Value 和 Veracity),具有其独特性,主要体现在以下五个方面。
                  (1)在容量方面,单一项目监测数据量不大,仍属于小规模数据集;繁多项目长期监测记录构成
               的数据库体量巨大,但远达不到 PB 级。
                  (2)在种类方面,数据多源自各种监测仪器,如三峡大坝安全监测系统布置的仪器种类有六十多
               种,数量达到一万余支;数据格式呈现“大部分结构化,小部分半/非结构化”的特点,且结构化数据
               演变形式复杂多样,总体上以周期性演变为主,但也不乏突变、噪声等情况。
                  (3)在获取速度方面,各种监测仪器本身采集频率较高,但受限于系统设置,一般以天为单位进
               行统一采样;且运行初期采样速度较快,后期逐步放缓,以至于数据存储时间间隔不固定。
                  (4)在价值方面,多数项目监测数据价值密度较高,即有价值的数据所占比例较大。
                  (5)在真实性方面,除非监测仪器发生故障或失效,否则数据质量往往较高,但也伴随着局部离
               群值等。
               2.2  LSTM 原理概述       水工建筑物在施工和运行过程中所产生的监测数据大多为结构化时序数据。

               传统 ANN 每相邻两层节点全互连,同层节点却相互独立,故难以学习时序数据的内在延续性。循环
                       [31]
               神经网络 (Recurrent Neural Networks,RNN)将时序概念引入网络结构中,表现为隐层间节点相连,
               且隐层输入同时包含输入层输出与上一时刻隐层输出,使其在时序数据分析方面适应性较佳。但
               RNN 经过多次迭代容易出现梯度爆炸或梯度消失的问题,导致网络不稳定甚至无法收敛                                         [32] 。为此,
                   [23]
               LSTM   应运而生,其不仅克服了梯度问题,还提高了预测间隔或延迟较长的时序数据的能力,遂成
               为当前处理时序数据最流行的深度学习算法之一。
                   LSTM 在 RNN 的基础上增加了特殊单元(即记忆模块),其学习当前信息的同时,还会提取长时间
               跨度数据之间的关联性,以此减缓信息丢失速度,实现持久记忆。如图 1 所示,记忆模块由遗忘门

                — 72   —
   71   72   73   74   75   76   77   78   79   80   81