Page 5 - 2025年第56卷第7期
P. 5

水      利       学      报

                2025 年 7 月                          SHUILI    XUEBAO                        第 56 卷  第 7 期

              文章编号:0559-9350(2025)07-0831-13

                         耦合气象信息和可解释深度学习方法的日径流预报



                                         廖胜利 ,王在能 ,程春田 ,吴慧军                     2
                                                           1
                                                                     1
                                                1
                                      (1.  大连理工大学  水电与水信息研究所,辽宁  大连  116024;
                                        2.  中国南方电网电力调度控制中心,广东  广州  510663)
                摘要:高精度的径流预报信息是水利防洪和水电调度的重要依据。然而,输入特征的选择、模型结构的确定及预报
                结果的可解释性等因素严重限制了数据驱动模型在径流预报中的应用。本文以实测径流、降雨和包含丰富气象信息
                的 ERA5 再分析数据等多源数据为输入,将沙普利可加性解释(SHAP)方法和卷积神经网络-双向长短期记忆网络
                (CNN-BiLSTM)模型相结合,建立了一种通过“事后”特征选择机制优化模型输入的可解释径流预报框架。首先,
                多源数据为框架提供了丰富的输入信息,CNN 和 BiLSTM 分别捕捉数据中的空间相关性和时序信息,提高模型预报
                精度。其次,模型训练后使用 SHAP 方法计算各输入特征的贡献度,通过比较不同输入条件下模型的预报表现,确
                定最佳输入特征及模型结构。最后,通过量化和可视化输入特征贡献度,提供了对模型预报机制和结果的解释。将
                所提方法应用于天生桥一级电站的区间入库流量预报并与通过偏自相关系数(PACF)、互相关系数(CCF)和随机森林
                (RF)等传统方法选择输入特征的模型进行比较。结果表明,与传统方法相比,SHAP 方法不仅优化了模型特征空间
                选择而且显著改善了数据驱动模型在径流预报中的输入特征选择困难、无效以及预报结果难以解释的局限性。
                关键词:径流预报;SHAP;CNN-BiLSTM;ERA5;输入特征;可解释性
                中图分类号:TV11                文献标识码:A                doi:10.13243/j.cnki.slxb.20240737

              1 研究背景


                  径流预报在水资源管理、防洪减灾和水电站运行中起着至关重要的作用 。准确的径流预报可以
                                                                                    [1]
              提供及时预警,减少洪灾损失,并为水资源的优化调度提供基本依据,保障水电站的高效运行。径流
                                                                       [2]
              预报主要有两种方法:基于过程的水文模型和数据驱动型模型 。尽管基于过程的模型有助于阐明水
                                                                                  [3]
              文机制,但其适用性和准确性需要大量高质量气象数据和流域下垫面资料 。此外,模型对输入数据
              的误差非常敏感,在输入数据、模型结构和参数集的多重不确定性影响下模型误差会被放大,使得模
                                     [4]
              型的应用和推广受到限制 。与基于过程的模型不同,数据驱动型模型根据已有数据进行训练来寻找
              预报变量和观测变量之间的映射关系,在历史数据丰富的情况下适应性强且表现合理。
                  深度学习模型能够通过多层网络结构捕捉到更复杂的非线性关系,与自回归模型(Autoregressive,
                                                                            [5]
              AR)、自回归移动平均模型(Autoregressive Moving Average,ARMA) 等传统数据驱动统计模型相比,
              深度学习模型在径流预报中优于其他数据驱动模型                         [6-7] 。此外,深度学习模型在处理时空数据和提高
              模型预报精度方面具有显著优势。例如,卷积神经网络(Convolutional Neural Networks,CNN)能够有效
              提取空间特征,而循环神经网络(Recurrent Neural Network,RNN)和双向长短期记忆网络(Bidirectional
              Long Short-Term Memory,BiLSTM) 能够处理时间序列数据,适用于径流预报中的时空数据建模。然
                                             [8]
              而,深度学习模型的“黑箱”性质使得理解其内部预报机制变得困难,限制了它在实际应用中的可信


                 收稿日期:2024-11-14;网络首发日期:2025-05-09
                 网络首发地址:https:/link.cnki.net/urlid/11.1882.tv.20250507.1411.001
                                /
                 基金项目:国家自然科学基金项目(52379004,51979023)
                 作者简介:廖胜利(1980-),博士生导师,教授,主要从事水文预报和发电调度研究。E-mail:shengliliao@dlut.edu.cn
                                                                                                — 831  —
   1   2   3   4   5   6   7   8   9   10