Page 7 - 2025年第56卷第7期
P. 7
图 1 天一位置及控制流域
时序信息,提高了模型的表达能力;(2)充分利用时序信息:BiLSTM 模型能够有效地捕捉时序数据
中的长期依赖关系,结合 CNN 模型的特征提取能力,CNN-BiLSTM 模型能够更好地利用时序信息进
行建模和预报;(3)参数共享与并行计算:CNN-BiLSTM 模型中,CNN 部分的参数共享和并行计算可
以 加 速 模 型 的 训 练 过 程 , 提 高 了 模 型 的 效 率 。 结 合 多 源 的 气 象 数 据 和 历 史 实 测 径 流 、 降 雨 数 据 ,
CNN-BiLSTM 模型能够同时从局部和全局,空间和时间多层次、双维度提取数据特征,达到更高的
预报精度。
3.2 贝叶斯优化算法 贝叶斯优化算法是一种通过建立目标函数的概率模型来寻找最优解的优化方
法。在超参数优化中,贝叶斯优化算法能够高效地搜索超参数空间找到最优的超参数组合,以提高模
型性能。相较于网格搜索等传统优化算法,贝叶斯优化算法有以下优点 [24-25] :(1)高效的搜索能力:
能够在较少的试验次数下找到较优的超参数组合;(2)自适应性:能够根据已有的数据,动态地调整
采样策略,更好地探索超参数空间。本文利用贝叶斯优化算法高效的搜索能力和自适应性快速实现对
CNN-BiLSTM 模型的超参数率定。
3.3 SHAP 解释模型 SHAP 是由 Shapley 值启发的可加性解释模型,Shapley 值是博弈论中一种公平
分配合作收益的方法。在 SHAP 方法中,用 SHAP 值衡量每个特征对模型输出的贡献。对于一个具有
多个特征的模型,SHAP 将每个特征视为博弈的参与者,遍历所有可能的特征子集,依次加入一个特
征,并计算加入特征后的模型预测输出与不加入该特征时的预测输出之间的差异,识别模型对不同特
征的依赖关系。SHAP 值的绝对值表示特征对模型输出的贡献的绝对大小,通过下式计算每个特征的
SHAP 值:
)
| | S ! ( M - | S -1 !
|
)
φ i = ∑ [ f ( x s ∪{i} - f ( x s)] (1)
}
S⊆{1,2,⋯,M \{ } i M!
式中:φ i 为第 i 个特征的 SHAP 值;M 为特征数量;x 为输入特征集合,x=( x 1 ,x 2 ,⋯,x M) ;x s 为不包
含特征 i 输入特征集合;f()为是一个对输入 x 进行预报的模型;S 为不包含特征 i 的特征子集;| S |为集
合 S 中特征的数量。
3.4 预报模型框架 CNN-BiLSTM-SHAP 模型结构如图 2 所示。首先,将所有预选特征因子都作为模
型输入进行预报。接着,通过 SHAP 方法整合模型预测过程,基于每个输入特征对输出的影响为其赋
予贡献度。最后,依次剔除一个最小贡献度特征,并重复上述过程直至特征数量为 1,以均方根误差
— 833 —