Page 66 - 2022年第53卷第12期
P. 66
式中:α为二次惩罚因子;λ为拉格朗日乘子。λ (t)为 λ在第 t时刻的值;x(t)为 x在第 t时刻的值。
利用交替方向乘子迭代算法求解式( 2)的鞍点。
2.2 支持向量机 SVM模型建立在 VC维(Vapnik - ChervonenkisDimension)理论的基础上,并基于结
n
构风险最小化原理求解分类和回归问题。假设一组给定的训练样本集:{( x,y)} ,其中 x为第 i个
i
i
i = 1
i
输入向量,y为输出值,n为训练样本集的样本容量。SVM回归函数为:
i
y = w φ (x) + b (3)
式中:w为权重向量;φ (x)为映射函数;b为偏置向量。
根据结构风险最小化原理,式(3)的求解可转化为求解以下最小化问题:
1 n
2
minJ(w,e) = w + C ∑ e 2 (4)
i
2 i =1
T
式中:C为惩罚因子;e = [e,e,…,e]为误差变量。
1 2 n
引入拉格朗日函数和对偶理论,并用核函数代替式(3)的映射函数,可得到:
n
- )K(x,x) + b
f(x) = ∑ ( α i α i 1 i (5)
i =1
1
式中:α i 和 α i 为拉格朗日乘子;K(·)为核函数。
核函数的选取对 SVM的计算精度至关重要。常用的核函数有线性核函数、多项式核函数、径向
基( RadialBasisFunction,RBF)核函数和 Sigmoid函数。RBF核函数对于大小样本都具有较高的计算精
度,学习能力强,参数也相对较少。因此,本文选用 RBF核函数,如式(6)所示。
2
K(x,x) =exp ( - γ x- x ) (6)
1 i i
式中 γ为 RBF核函数参数。
因此,对于 SVM模型,主要的待求参数有惩罚因子 C和核函数参数 γ 。
2.3 核密度估计 KDE是一种非参数估计方法,可直接计算样本的概率密度,无需事先假设其分布。
N
对于一组样本数据{x} ,KDE的表达式为:
j j = 1
1 N x - x
^ ∑ K 2 ( ) (7)
j
f (x) =
Nh j =1 h
式中:N为样本长度;h为带宽;K(·)为核函数。
2
核函数和带宽的选择对 KDE计算影响较大。本文选用高斯核函数,公式为:
( ) 1 ( (x - x) 2
2 )
x - x
j
j
K 2 h = 2 π exp- 2h (8)
槡
对应的带宽公式为:
1
-
h = 1 .06SN 2 (9)
式中 S为样本的标准差。
3 模型构建
本文提出的 VMD - SVM- KDE - TSCPSO模型的总体 框架 如图 1所示。基 于 TSCPSO优 化 算法的
VMD - SVM- KDE逐步分解集成(VMD - SVM- KDE - TSCPSO)模型的构建步骤包括以下两步。第一步,
根据 VMD - SVM模型获取点预测结果。具体步骤为:将径流序列划分为率定期、测试期和验证期,使
用 VMD方法逐步分解率定期和测试期的径流序列获得子序列,根据这些子序列确定 SVM模型的输入
输出序列,并用 TSCPSO优化算法综合求解 VMD - SVM模型的未知参数,最后,根据 VMD - SVM模型
计算点 预 测 值。第二步,根 据点预 测误 差,采用 KDE方 法计 算 区 间预 测 结 果。VMD - SVM- KDE -
TSCPSO模型的具体构建步骤如下。
3.1 数据划分 首先,将径流序列 x(t)(t = 1 ,2,…,N)划分为训练期 x(t)(t = 1 ,2,…,T)和验
T
5
— 1 4 8 —