Page 68 - 2022年第53卷第12期
P. 68
f
优。首先,根据以上计算得到的率定期预测结果{x(t)}(t = L + 2,L + 3,…,c)以及测试期预测结果
c
f
t
c
x(t)(t = c + 1 ,c + 2 ,…,T),分别计算率定期的均方误差(RMSE)和测试期的均方根误差(RMSE),
t
t
c
然后,应用 PSO优化算法搜寻当 RMSE和 RMSE中的最大值取得最小值时的待求参数。TSCPSO算法
适应度函数的计算公式为:
t
c
minimize {maximize(RMSE,RMSE)} (11)
L,K,C, γ
求出未知参数( L,K,C,γ )后,保存训练好的分解集成模型等待预测。
3.3 模型预测 令 k = T,重复 3.2小节中的分解步骤,直至 k = N - 1 。不同于训练期的是,只需将预测
因子输入训练好的混合模型中,然后获得验证期的所有预测值,也就是点预测值。
区间预测的构建步骤为:首先计算训练期的误差,然后根据 KDE方法计算误差的概率密度函数,
并积分得到相应的累积密度函数,据此获取一定置信水平 a的分位数值F (t)和F (t),最后
1 - (1 - a)?2 (1 - a)?2
根据式( 12)可得预测区间[x (t),x (t)]。
up
low
f
{ x(t) =x(t) + F 1 - (1 - a)?2 (t) (12)
up
f
x (t) =x(t) + F
low (1 - a)?2 (t)
式中:x (t)和 x(t)分别为 t时刻预测区间的下限和上限;F (t)和 F (t)为累积密度函数
low up 1 - (1 - a)?2 (1 - a)?2
的分位数;给定的置信水平 a也称为名义置信水平。
3.4 模型评价 为了验证 VMD - SVM- KDE模型的预测优势,将 VMD - SVM- KDE与 SVM- KDE模型进
行比较。同样,为了验证 TSCPSO优化算法的优势,将 TSCPSO算法与传统的一阶段 PSO优化算法进
行比较,传统 PSO算法没有将训练期进一步划分为率定 期 和测 试 期。具 体 地,首先 将 PSO优化的
SVM(SVM- PSO)模型、TSCPSO优化的 SVM(SVM - TSCPSO)模型、PSO优化的 VMD - SVM(VMD - SVM-
PSO )模型以及 TSCPSO优化的 VMD - SVM(VMD - SVM- TSCPSO)模型进行对比,分析评价模型的点预
测性能。然后将 PSO优化的 SVM- KDE(SVM- KDE - PSO)模型、TSCPSO优化的 SVM- KDE(SVM- KDE -
TSCPSO )模型、PSO优化的 VMD - SVM- KDE(VMD - SVM- KDE - PSO)模型以及 TSCPSO优化的 VMD -
SVM- KDE(VMD - SVM- KDE - TSCPSO)模型进行对比,分析评价模型的区间预测性能。
2
模型的点预测性能均由平均相对误差( MAE)、最大均方根误差(RMSE)、确定系数(R)和纳什效
2
率系数(NSE)4个误差指标进行评估。MAE和 RMSE越小且 R和 NSE越大,表示模型的点预测性能越
好。区间预测性能由预测区间覆盖率( PICP)、预测区间平均宽度(PINAW)和区间平均偏差(INAD)3
个误差指标进行评估 [25] 。PICP小于预测区间名义置信水平时,说明区间预测结果不可信。在 PICP达
到预测区间名义置信水平的前提下,PICP越大且 PINAW 越小代表区间预测性能越好。当不同模型的
PICP和 PINAW值相差不大时,可用 INAD进行比较择优。INAD越小代表模型性能越好。
4 实例应用
4.1 数据分析 为验证文中模型的适用性,选取黄河流域民和、兰州、白马寺和黑石关 4个水文站的
月径流数据进行预报模型研究。各水文站月径流数据资料均来源于水利部黄河水利委员会,其统计特
征如表 1所示。由表 1可知,兰州站的月径流量均值依次小于民和站、黑石关站和白马寺站,离差系
数依次大于民和站、黑石关站和白马寺站。各水文站月径流数据的偏度系数均为正数,民和、兰州和
白马寺 3站月径流数据的峰度系数均小于 3,表明曲线峰值比正态分布低,而黑石关站的峰度系数大
于 3,表明曲线峰值比正态分布高。按照整个径流序列长度的 60%、20%和 20%及时间先后顺序依次
划分率定期、测试期和验证期。因此,民和、兰州和黑石关 3站的率定期长度为 30a,白马寺站率定
期长度为 31a,测试期和验证期长度均为 10a。
4.2 模型的点预测结果 将 SVM- PSO、SVM- TSCPSO、VMD - SVM- PSO和 VMD - SVM- TSCPSO这 4
种模型分别记为模型 1、模型 2、模型 3和模型 4,表 2为以上模型的参数识别结果。由表 2可知,各
站 SVM模型参数 C和 γ以及模型的输入参数 L随着模型种类变化。对于模型的输入参数 L,模型 1在
6
— 1 4 0 —