Page 78 - 2024年第55卷第5期
P. 78
在利用时间序列自相关特性进行预测的方法中,神经网络因其自身结构优势,模型表现普遍较
好 [11] 。丁雪慧 [12] 、宋春山 [13 - 14] 、张璐 [15] 等采用 BP神经网络分别预报了黑龙江省哈尔滨站、漠河站
和黄河万家寨水库的开河日期;王涛等 [10] 采用神经网络聚类法预报了黑龙江漠河站开河日期 [10] 。作
为神经网络在水文学领域中广泛应用的一种方法,长短期记忆模型( LongShortTerm Memory,LSTM)
将循环神经网络( RNN)优化,在保留 RNN善于处理时间序列数据优点的基础上解决了传统 RNN处理
长时间序列数据时出现的梯度消失和梯度爆炸的问题,提高了神经网络预报精度 [16] 。开河日期序列是
一种非平稳时间序列,其中包含的周期性、趋势性和随机性成份增加了序列状态的预报难度。信号分
解技术先将时间序列分解为多个子序列,再将子序列作为预报模型输入,可提高模型预报精度 [17 - 20] 。
在信号分解技术中,由于完全自适应集合经验模态分解( ComplementaryEnsembleEmpiricalModeDe
compositionwithAdaptiveNoise ,CEEMDAN)避免了模式混合问题,且分解误差微乎其微 [21] ,故被广泛
应用于水文领域 [22 - 24] 。
本文尝试先采用 CEEMDAN将开河日期序列分解为多个子序列,再采用 LSTM构建 CEEMDAN子
序列的预测模型,而后将各子序列预测结果同步叠加得到原始序列的预报结果。本研究将该方法命名
为 CEEMDAN - LSTM,并将其用于黑龙江省典型水文站开河日期的预测中以检验其预报性能。
2 数据与方法
2.1 数据来源 本研究以中国北方典型寒区- 黑龙江省为例。该省是中国位置最北、纬度最高的省份,
2
南起 43°26′N,北至 53°33′N,西起 121°11′E,东至 135°05′E(图 1)。黑龙江省总面积 47.3万 km ,境内
有三大山脉(大兴安岭山脉、小兴安岭山脉和完达山山脉)和两大平原(松嫩平原和三江平原)。气候
以寒温带和中温带大陆性季风气候为主,年平均气温 3~5℃,冬季漫长寒冷、平均温度- 17.1℃,河
流封冻期从 10月底至翌年 4月底,春季多风干燥、平均温度 4.8℃ [25] 。
图 1 研究区域图
依据黑龙江省地形和气候特点,选择 5个代表水文站作为河流开河日期研究对象,分别为漠河
站、伊春站、牡丹江站、齐齐哈尔站和宝清站。其中漠河站、伊春站、牡丹江站分别位于大兴安岭山
脉、小兴安岭山脉和完达山山脉,齐齐哈尔站位于松嫩平原,宝清站位于三江平原。5个代表站除漠
河站位于寒温带外,其余站均位于中温带。各站开河日期年积日序列长度、时间跨度、均值、标准差
和极差如表 1所示(本研究中,河流开河为河面 80%河冰融化,其对应日期为从当年 1月 1日起至开
河的天数,即年积日)。
— 5 7 —
8