Page 68 - 2022年第53卷第12期
P. 68

f
              优。首先,根据以上计算得到的率定期预测结果{x(t)}(t = L + 2,L + 3,…,c)以及测试期预测结果
                                                             c
               f
                                                                                                        t
                                                                          c
              x(t)(t = c + 1 ,c + 2 ,…,T),分别计算率定期的均方误差(RMSE)和测试期的均方根误差(RMSE),
               t
                                                          t
                                                  c
              然后,应用 PSO优化算法搜寻当 RMSE和 RMSE中的最大值取得最小值时的待求参数。TSCPSO算法
              适应度函数的计算公式为:
                                                                         t
                                                                 c
                                             minimize {maximize(RMSE,RMSE)}                            (11)
                                             L,K,C, γ
                  求出未知参数( L,K,C,γ )后,保存训练好的分解集成模型等待预测。
              3.3 模型预测 令 k = T,重复 3.2小节中的分解步骤,直至 k = N - 1 。不同于训练期的是,只需将预测
              因子输入训练好的混合模型中,然后获得验证期的所有预测值,也就是点预测值。
                  区间预测的构建步骤为:首先计算训练期的误差,然后根据 KDE方法计算误差的概率密度函数,
              并积分得到相应的累积密度函数,据此获取一定置信水平 a的分位数值F                                       (t)和F       (t),最后
                                                                                 1 - (1 - a)?2  (1 - a)?2
              根据式( 12)可得预测区间[x (t),x (t)]。
                                                up
                                        low
                                                          f
                                                 { x(t) =x(t) + F 1 - (1 - a)?2 (t)                    (12)
                                                   up
                                                          f
                                                  x (t) =x(t) + F
                                                   low          (1 - a)?2 (t)
              式中:x (t)和 x(t)分别为 t时刻预测区间的下限和上限;F                              (t)和 F      (t)为累积密度函数
                     low      up                                       1 - (1 - a)?2  (1 - a)?2
              的分位数;给定的置信水平 a也称为名义置信水平。
              3.4 模型评价 为了验证 VMD - SVM- KDE模型的预测优势,将 VMD - SVM- KDE与 SVM- KDE模型进
              行比较。同样,为了验证 TSCPSO优化算法的优势,将 TSCPSO算法与传统的一阶段 PSO优化算法进
              行比较,传统 PSO算法没有将训练期进一步划分为率定 期 和测 试 期。具 体 地,首先 将 PSO优化的
              SVM(SVM- PSO)模型、TSCPSO优化的 SVM(SVM - TSCPSO)模型、PSO优化的 VMD - SVM(VMD - SVM-
              PSO )模型以及 TSCPSO优化的 VMD - SVM(VMD - SVM- TSCPSO)模型进行对比,分析评价模型的点预
              测性能。然后将 PSO优化的 SVM- KDE(SVM- KDE - PSO)模型、TSCPSO优化的 SVM- KDE(SVM- KDE -
              TSCPSO )模型、PSO优化的 VMD - SVM- KDE(VMD - SVM- KDE - PSO)模型以及 TSCPSO优化的 VMD -
              SVM- KDE(VMD - SVM- KDE - TSCPSO)模型进行对比,分析评价模型的区间预测性能。
                                                                                                2
                  模型的点预测性能均由平均相对误差( MAE)、最大均方根误差(RMSE)、确定系数(R)和纳什效
                                                                      2
              率系数(NSE)4个误差指标进行评估。MAE和 RMSE越小且 R和 NSE越大,表示模型的点预测性能越
              好。区间预测性能由预测区间覆盖率( PICP)、预测区间平均宽度(PINAW)和区间平均偏差(INAD)3
              个误差指标进行评估          [25] 。PICP小于预测区间名义置信水平时,说明区间预测结果不可信。在 PICP达
              到预测区间名义置信水平的前提下,PICP越大且 PINAW 越小代表区间预测性能越好。当不同模型的
              PICP和 PINAW值相差不大时,可用 INAD进行比较择优。INAD越小代表模型性能越好。

              4 实例应用


              4.1 数据分析 为验证文中模型的适用性,选取黄河流域民和、兰州、白马寺和黑石关 4个水文站的
              月径流数据进行预报模型研究。各水文站月径流数据资料均来源于水利部黄河水利委员会,其统计特
              征如表 1所示。由表 1可知,兰州站的月径流量均值依次小于民和站、黑石关站和白马寺站,离差系
              数依次大于民和站、黑石关站和白马寺站。各水文站月径流数据的偏度系数均为正数,民和、兰州和
              白马寺 3站月径流数据的峰度系数均小于 3,表明曲线峰值比正态分布低,而黑石关站的峰度系数大
              于 3,表明曲线峰值比正态分布高。按照整个径流序列长度的 60%、20%和 20%及时间先后顺序依次
              划分率定期、测试期和验证期。因此,民和、兰州和黑石关 3站的率定期长度为 30a,白马寺站率定
              期长度为 31a,测试期和验证期长度均为 10a。
              4.2 模型的点预测结果 将 SVM- PSO、SVM- TSCPSO、VMD - SVM- PSO和 VMD - SVM- TSCPSO这 4
              种模型分别记为模型 1、模型 2、模型 3和模型 4,表 2为以上模型的参数识别结果。由表 2可知,各
              站 SVM模型参数 C和 γ以及模型的输入参数 L随着模型种类变化。对于模型的输入参数 L,模型 1在

                     6
                —  1 4 0 —
   63   64   65   66   67   68   69   70   71   72   73