Page 49 - 2023年第54卷第2期
P. 49
文模型一样精确的水文过程模拟 [5] 。
作为深度学习的主流技术,LSTM具备很强的学习能力,能解决很复杂的问题 [6] 。然而,LSTM的
性能在很大程度上受模型计算参数设置的影响,且在面对高度非平稳数据时可能无法充分捕捉水文过
程的所有特点。因此,在月径流预报中 LSTM模型预测精度和稳定性存在很大的改进空间。以往研究
表明,提高 LSTM的拟合和泛化能力通常有两种方式:(1)使用优化算法确定合适的模型超参数 [7 - 8] ,
如,采用启发式搜索、回溯搜索、蚁群算法、差分进化算法及贝叶斯优化算法(BayesianOptimization,
BO)对模型超 参 数 进 行 优 化;(2)利 用 数 据 预 处 理 技 术 对 原 始 水 文 时 间 序 列 中 的 隐 藏 子 信 号 进 行
分解 [9 - 10] 。
非线性、非平稳的自然径流序列可以看作是一个准周期信号,在不同流量水平下可能会受到各种
噪声信号的 污 染 [11] ,通 过 信 号 分 解 产 生 更 清 洁 的 子 序 列 作 为 模 型 输 入,可 以 得 到 更 好 的 预 测 指
标 [12 - 14] 。离散小波变换(DiscreteWaveletTransform,DWT)、奇异谱分析、经验模态分解、集合经验
模态分解( EnsembleEmpiricalModeDecomposition,EEMD)是几种重要的预处理技术,它们可以将非平
稳、非线性时间序列分解为一组更简单的分量,更容易建模。将数据预处理和机器学习模型相结合的
混合模型已被用于预测流量,这些混合模型既可以有效描述观测数据的统计特征,又可以挖掘隐藏在
观测数据中的其他先验信息 [15] 。
很多研究首先将整个径流时间序列分解成若干子序列,然后将子序列划分为训练集和测试集来建
立预测模型,导致一些测试阶段的数据,即未来信息作为分解参数被引入到分解和重构过程中,这是
一种 “追算实验” [16 - 17] 。而这些未来信息在实际预测,即 “预测实验” 中是不可获取的 [16,18 - 19] ,因
此,将数据预处理技术直接应用于整个时间序列是一种不切实际的方法,会导致部分信息从测试阶段
传输到数据驱动模型的训练过程中。近年来,实时分解 - 预测 - 集成模型开始研究 [20 - 21] ,重点在于时
序数据分解与重构中避免引入未来信息,但此类方法的研究还不成熟。本研究试图改进数据预处理策
略,设计一种不采用未来信息的自适应动态实时分解策略。与 “追算实验” 不同,其分解过程只要逐
步加入新的径流信息就能自适应调整,不引入任何未来信息。
另外,这些时间序列预处理技术不可避免地有一定的缺点,如 DWT的有效性在很大程度上依赖
于母小波和分解级数的预先确定 [12,22] ;经验模态分解不受基函数的限制 [23] ,但存在对噪声、采样的
敏感性,不适合实际的流量预测 [21] ;EEMD虽然是完全自适应的,但在理论上是没有充分依据的 [24] ;
奇异谱分解的效果受经验选取嵌入维数大小的影响。2014年,变分模态分解(VariationalModeDecom
position,VMD) [25] 被提出,该方法对噪声和采样更加敏感,性能稳健,可有效缓解模态混叠问题。因
此,本文采用 VMD作为数据预处理方法,对月径流序列进行分解。
综上所述,本研究的主要目的是在不使用任何未来信息的情况下,开发一个可靠、高效及实用的
分解- 预测- 集成模型,用于预测具有高度不规则性、复杂非线性和多尺度变异性的月径流序列。为
此,采用自适应分解策略对径流时序数据进行变分模态分解,结合贝叶斯优化算法和长短期记忆神经
网络模型,提出基于自适应变分模态分解和长短期记忆网络的分解 - 预测 - 集成月径流预测混合模型
(“预测实验”)。以金沙江上游主要控制断面石鼓水文站月径流(预见期 1个月)预报为研究实例,验
证该模型的有效性和可行性。
2 研究方法
2.1 变分模态分解 相比于经验模态分解方法递归地将信号分解为独立频谱波段子信号,变分模态分
解( VMD)非递归分解信号,具有较高的分解精度和较好的抗噪性能。VMD在变分框架内构造约束变
分问题,采用交替方向乘子算法( ADMM)迭代更新各模态函数及中心频率,将原始信号分解为指定个
数的调幅- 调频本征模态函数。
VMD将原始信号 f(t)分解为 L个本征模函数 u(t),k = 1 ,2,…,L,主要算法为:
k
( 1)定义 u(t)为一个调幅调频信号:
k
— 1 7 3 —