Page 67 - 2022年第53卷第12期
P. 67
证期 x(t)(t = T + 1,T + 2,…,N),其中 N为整个径流序列长度 x(t)的长度,T为训练期序列 x(t)的
v T
长度。为防止模型过拟合,进一步将训练期 x(t)划分为率定期 x(t)(t = 1 ,2,…,c)和测试期 x(t)
T c t
( t = c + 1 ,c + 2 ,…,T),其中 c为率定期序列 x(t)的长度。率定期、测试期和验证期径流序列长度依
c
次占整个数据的比例为 60%、20%和 20%。
图 1 VMD - SVM- KDE - TSCPSO模型框架
3.2 模型训练 模型的输入输出对于模型的训练来说至关重要。对于采样 k,令 k的初始值为 L + 1,
应用 VMD分解方法将径流序列子集 x(t)(t = 1 ,2,…,k)分解为 K个子序列{S },{S },…,
T
1(t)
2(t)
{S }(t = 1 ,2,…,k),其中{S(t)}(i = 1 ,2,…,k)代表第 i个子序列{S ,S ,…,S}。子序
K(t) i i1 i2 ik
列第 k列之前的前 L列序列{S },{S },…,{S }(i = 1,2,…,K)作为单个 SVM 模型
i(k - L) i(k - L + 1 ) i(k - 1 )
的输入变量,子 序 列 的 第 k列 序 列 {S }(i =1,2,…,k)作 为 单 个 SVM 模 型 的 输 出 变 量, 其 中
ik
{ S(t)}(t = k - L,k - L + 1 ,…,k)代表第 t列序列{S(t),S(t),…,S(t)}。以上的输入输出用来训
i
2
k
1
练 SVM模型的惩罚因子 C和核函数 γ 。将元素{S i(k - L + 1 ) },{S i(k - L + 2 ) },…,{S }(i = 1,2,…,K)
i(k)
作为训练 好 的 SVM 模 型 的 预 测 因 子, 用 来 求 出 子 序 列 第 k + 1列 的 预 测 值 {S f , S f , …,
2(k + 1)
1(k + 1)
f
S f },累加该值得到第 k + 1 的预测值 x(k + 1 )。令 k = k + 1 ,重复以上步骤,直至 k = T - 1 ,依次得到
K (k + 1)
f
f
率定期预测结果{ x(t)}(t = L + 2,L + 3,…,c)以及测试期预测结果{x(t)}(t = c + 1,c + 2,…,T)。
c t
为消除量纲单位不同造成的影响,同时提高模型的训练和收敛速度,对输入、输出和预测样本数据采
取的归一化处理,如式( 10)所示。
x(t) - x
x (t) = min (10)
norm
x - x
max min
式中:x 为样本的归一化结果;x 和 x 分别为样本的最小值和最大值。
norm min max
因此,在 VMD - SVM- KDE - TSCPSO模型中,待求的未知参数分别为:模型输入序列的长度 L、
VMD算法的分解个数 K、SVM模型的惩罚因子 C和核函数参数 γ 。其中,模型输入序列的长度 L和
VMD的分解个数 K影响模型的输入和输出,这对模型的确定至关重要。一般情况下,VMD的分解个
数由试错法确定,序列的输入长度 L通过自相关分析和偏相关分析等方法确定。SVM模型的惩罚因子
C和核函数参数 γ都是由智能优化算法优化确定。为了简化现有模型对所有未知参数推求的复杂性,
本文提出 TSCPSO优化算法可以在一个目标下同时对混合模型的 4个未知参数(L,K,C,γ )进行寻
4
— 1 5 9 —