Page 14 - 2025年第56卷第7期
P. 14
图 6 CNN-BiLSTM-SHAP 和 PCR-CNN-BiLSTM 模型的径流预报
图 7 CNN-BiLSTM-SHAP 和 PCR-CNN-BiLSTM 模型的预报径流与实测径流比较
两种模型输出结果的差异主要源于输入特征选择方法的不同,从而导致输入数据、模型结构和参
数的变化。比较表 3 中通过 SHAP 方法选择的 15 个输入特征与表 6 中通过 PACF、CCF 和 RF 选择的 16
个输入特征,发现仅有滞后 1 个时段和 2 个时段的径流、滞后 1 个时段的降雨、第 2 层土壤温度、第 2、
3、4 层土壤水体积等 7 个输入特征重叠,其余特征则不同,突显了两种特征选择方法对预报结果的影
响。PACF、CCF 和 RF 主要依赖于径流数据与气象数据和降雨数据之间的统计相关性进行特征选择,
通过“事前”确定模型输入和模型结构,存在以下局限性:(1)忽略了影响径流过程的的重要输入
特征,如表 3 中地表压力、总柱水等;(2)基于统计相关性的 PACF、CCF 特征选择方法无法捕捉数
据中的非线 性 关 系 , 导 致 较 多 选 择 滞 后 径 流 和 降 雨 等 线 性 相 关 的 数 据 从 而 限 制 了 模 型 的 预 报 能
力 ;(3)特 征 选 择 过 程 独 立 于 模 型 预 报 过 程 , 未 能 综 合 考 虑 输 入 特 征 在 CNN-BiLSTM 模 型 中 的 实
际 贡 献 。 SHAP 方 法 则 通 过 整 合 模 型 预 测 过 程 , 对 每 个 输 入 特 征 的 贡 献 度 进 行 量 化 , 将 特 征 选 择
与 模 型 校 准 过 程 紧 密 结 合 , 具 体 表 现 在 : SHAP 方 法 不 依 赖 于 径 流 、 降 雨 和 气 象 数 据 之 间 的 线
性 关 系 选 择 输 入 , 而 是 通 过 捕 捉 模 型 预 报 过 程 中 复 杂 的 非 线 性 关 系 从 而 识 别 出 影 响 模 型 预 报 性
的重要输入特征。
4.4 预报机制及结果解释 SHAP 方法不仅能通过计算输入特征贡献度的方法选择模型最优输入特征
还能对模型预测机制进行解释。图 8(a)展示了模型输入特征的 SHAP 值及其对模型输出的影响,每个
特征对应一条横向的散点图,点的 x 轴表示该特征的 SHAP 值,y 轴表示根据贡献度排序的输入特征。
图中不同颜色的点代表特征的原始值,从蓝色(较小值)到红色(较大值)渐变展示了特征值变化对
— 840 —