Page 10 - 2025年第56卷第7期
P. 10
ï ï ( II ̌ II ̌ II ̌ II )
ì
II
Q t =f θ t ,Q t ,R t ,W t
ï
ï
ïQ t =[ Q , Q , ⋯, Q t,p II ]
ï ̌ II
ï ï
í t,1 t,2 (3)
R t =[ R ,R ,⋯,R
ï ï ̌ II ]
ï t,1 t,2 t,q II
ï
ï
ï ̌ II 1 2 k II ]
î
ï ïW t =[W t , W t , ⋯, W t
II
I
I
II
式中:Q t 和 Q t 分别为 t 时段 CNN-BiLSTM-SHAP 和 PCR-CNN-BiLSTM 的预报值;θ t 、θ t 分别为 t 时段
̌ I
̌ I
̌ I
CNN-BiLSTM-SHAP 和 PCR-CNN-BiLSTM 模型的参数;Q t 、R t 、W t 分别是 t 时段通过 SHAP 选择的历
I
I
史径流和降雨以及气象特征;p 、q 、k I 分别是通过 SHAP 选择的输入集中径流和降雨的滞后阶段数
̌ II
̌ II
̌ II
以及气象因子数目;Q t 、R t 分别是 t 时段通过 PACF 和 CCF 选择的历史径流和降雨数据;W t 是 t 时段
II
II
RF 选 择 的 气 象 特 征 ; p 、 q 分 别 是 PACF 和 CCF 确 定 的 滞 后 阶 段 数 ; k II 是 由 RF 确 定 的 气 象 因 子
数目。
4 结果分析和讨论
4.1 输入选择 综合考虑以往研究和控制模型输入特征数量,选择滞后 1 到 10 天的径流数据作为预选
输入 [26] 。此外,由于降雨到达地表后,需要经过渗透、汇流等过程才能形成径流,对径流的影响并非
瞬时,而是存在一定的滞后,因此选择滞后 1 到 10 天的日平均面雨量作为预选输入。结合 36 个气象数
据类型,共计选取 56 个特征因子作为模型预选输入。
4.1.1 CNN-BiLSTM-SHAP 输入选择结果 为了减少输入特征之间相互联系对输出的影响,在每次剔
除最小贡献度特征后,都需要重新计算剩余特征的贡献度,并按照贡献度重新排序。此过程每次剔除
一个特征,直至输入特征减少到 1,表 2 展示了模型每次剔除的特征。为了减少单一评估指标带来的
偶然性偏差,采用多指标综合分析的方法来寻找最佳输入。在每一次减少输入特征后,基于测试集计
算 RMSE、MAE、CORR、KGE、IA、NSE 评估指标,结果如图 4 所示。除 MAE 外,其余各指标均在输
入特征为 15 时达到最优。综上,选择表 2 中第 1 ~ 15 个特征为 CNN-BiLSTM-SHAP 模型的输入,并计
算各输入特征的 SHAP 值绝对值,如表 3。
表 2 基于 SHAP 值大小依次剔除的输入特征
编号 输入特征 编号 输入特征 编号 输入特征 编号 输入特征
1 Q t-1 15 tcwv t-1 29 stl4 t-1 43 R t-9
2 stl2 t-1 16 Q t-10 30 pev t-1 44 istl3 t-1
3 Q t-2 17 Q t-4 31 Q t-9 45 R t-10
4 swvl3 t-1 18 R t-3 32 Q t-3 46 stl3 t-1
5 sp t-1 19 mx2t t-1 33 R t-2 47 istl2 t-1
6 R t-1 20 tcc t-1 34 e t-1 48 tcrw t-1
7 swvl1 t-1 21 d2m t-1 35 Q t-5 49 R t-8
8 mn2t t-1 22 Q t-7 36 cp t-1 50 tsn t-1
9 tcw t-1 23 tcsw t-1 37 lsp t-1 51 R t-4
10 swvl2 t-1 24 tciw t-1 38 ssro t-1 52 rsn t-1
11 sro t-1 25 stl1 t-1 39 R t-6 53 sf t-1
12 ro t-1 26 Q t-6 40 R t-7 54 smlt t-1
13 tp t-1 27 Q t-8 41 cbh t-1 55 sd t-1
14 swvl4 t-1 28 R t-5 42 istl1 t-1 56 istl4 t-1
— 836 —