Page 78 - 水利学报2021年第52卷第1期
P. 78
3 水工建筑物安全监控深度分析模型优化构建方法
针对上述不足,以 LSTM 深度学习算法为基础,从数据前端处理、网络拓扑结构和外延预测方法
三个方面着手改进,提出一种适用于不同类型水工建筑物的安全监控深度分析模型。
3.1 数据前端处理 为了提高安全监控模型的外延能力,需提前对原型观测资料进行清洗、降噪和
j
变换等必要的处理。现给定包含 T 个数据的任一效应量监测序列 y ( ) t ,t = 1,2,,T;j = 1,2,
j j
,J ,其中缺失值和异常值分别用 y ( ) t 、 y ( ) t 表示,那么前端处理具体操作步骤如下:
nu
an
j
(1)步骤 1。数据清洗。利用笔者先前所提“插值填补”和“异常检测”算法分别对监测数据 y ( ) t
j j j
中局部缺失值 y ( ) t 、异常值 y ( ) t 进行实时处理(详见文献[10]),得到修正序列 y ( ) t 。不同于传
nu
an
1
统 数 据 清 洗 方 法 [34] ,“ 插 值 填 补 ”算 法 能 通 过 分 布 式 建 模 充 分 利 用 缺 失 区 域 双 侧 已 知 监 测 数 据
}
{ ,y (t - 2 ),y (t - 1 ),y (t + 1 ),y (t + 2 ), 估计未知空值 y ( ) t ,而“异常检测”算法则能通过
j
j
j
j
j
nu
nu
nu
nu
nu
j
鲁棒分解对异常值 y ( ) t 起到明显放大作用,使其便于识别。
an
(2)步骤 2。降噪平滑。一般认为,实际监测数据往往含有不同程度的噪声。在处理含噪数据
j
时,为了最大限度还原真实信号,同时避免相移,先将输入序列 y ( ) t 按顺序滤波,再将滤波结果
1
j [35]
逆转并反向通过滤波器,最后将所得结果逆转后输出,即为降噪平滑序列 y ( ) t 。其数学描述 为:
2
j
j
j
ì z ( ) t = y ( ) t × h ( ) t
ï ï 1 1
j
j
ï ïz ( ) t = z (T - 1 - t )
í 2 j 1 j j (7)
ï ï z ( ) t = z ( ) t × h ( ) t
3
2
ï ï y ( ) t = z (T - 1 - t )
j
j
î 2 3
j
j
j
j
式中: h ( ) t 为所用数字滤波器冲激响应序列; z ( ) t 、 z ( ) t 分别为第一、二次滤波结果; z ( ) t 、
1 3 2
j
y ( ) t 分别为第一、二次滤波结果的逆转序列。
2
j
(3)步骤 3。数据变换。对平滑序列 y ( ) t 进行归一化处理,既能加快寻求最优解的速率,又能
2
避免给梯度更新带来数值问题。
(
j
j
y ( ) t - min y ( ) t )
j
y ( ) t = 2 2 (8)
(
(
3 j j
max y ( ) t ) - min y ( ) t )
2
2
(
(
j
j
j
式中: min y ( ) t ) 、 max y ( ) t ) 分别为平滑序列 y ( ) t 中的最小值和最大值。
2
2
2
j
需 要 说 明 的 是 , 上 述 步 骤 均 是 针 对 效 应 量 y ( ) t 而 言 , 若 是 对 影 响 因 子
j
i
i
x ( ) t ,t = 1,2,,T;i = 1,2,,I 进行前端处理,将 y ( ) t 替换为 x ( ) t 即可。此外,倘若优
j
化深度模型选择对效应量 y ( ) t 进行一元时序预测,就在上述步骤的基础上,补充运用分段三次 Her⁃
j
mite 插值函数 [36] 完成数据均匀化。为表述方便起见,下文将经过前端处理的效应量 y ( ) t (或因子
3
j
i
i
x ( ) t )仍称为 y ( ) t (或 x ( ) t )。
3
i,j
j
3.2 网络拓扑结构 全部数据(包括效应量 y ( ) t 及其影响因子 x ( ) t )经过预处理后,按照一定比
例划分为训练集 T 、验证集 V 和测试集 T ,随后采取以下措施对深层网络拓扑结构进行优化改进。
r
a
e
(1)并联搭建深层网络 LSTM 1和 LSTM(统称 LSTM ),其中 LSTM 1用于一元时序预测,直接根据
2 1,2
j
历史监测数据对效应量 y ( ) t 未来变化趋势进行外延分析;LSTM 则用于多元回归预测,即通过效应
2
j i,j
量 y ( ) t 及其影响因子 x ( ) t 间的因果关系构建数学模型,进而求解待估计参数。
— 74 —