Page 48 - 水利学报2021年第52卷第2期
P. 48
3.2 KL 理论 KL 理论又被称为本征正交分解,本质是将一个随机过程按几组正交特征函数分解为
多项式和的形式,以此来近似拟合原随机过程,KL 分解涉及确定性函数(即特征函数 ψ (t))和随机变
k
量(ξ )的级数展开,其中确定性函数由自相关核函数确定,随机系数 ξ 的概率分布由于随机过程本
k
k
身信息的缺乏通常难以直接确定。
KL 展开的基本表达形式以一个可测度事件集合为基础,用于描述物理随机过程。设构成随机过
程事件集的函数为 U (t,θ ),t 为事件对应的随机过程检索序号系列, θ 为该随机事件。则根据 KL
)
展开理论, U (t,θ 表达式为:
) å
U (t,θ = λ ψ ( ) t ξ ( ) (12)
θ
i ≥ 1 i k
其中随机系数 ξ 应遵循以下数学定义:
k
θ
ξ ( ) = 1 (U (t,θ ),ψ (t ) ) (13)
k
λ i
具体来说,通过式(13)仅能证明随机变量的均值为 0、方差为 1,并且是相互正交的。通过式
)
(13)可知,KL 展开式中各事件描述函数 U (t,θ 对应的随机系数与事件本身有密切联系,因此在针
对不同特点的物理过程进行建模时,如何选择符合实际数据特征的连续或离散概率分布赋给随机系
θ
数 ξ( ) 是非常重要的,这一问题可以通过下文 3.5 节方法有效处理。
按照上述思路,本文采用截断型 KL 展开式对水电站的时段末水位过程进行表达,具体为:
- ∞
Z ( ) t = Z ( ) t + å λ ψ ( ) t ξ k (14)
k
k
k = 1
( )
式中:Z(t)为水电站 t 时段末的库水位; Z ˉ t 为实际调度样本集中 t 时段末的库水位均值; λ 与
k
ψ ( ) t 为正交特征值与对应的特征向量; ξ 为一系列独立的随机变量,其分布遵从均值为 0,方差为
k k
1,在求解过程中,该系数为问题的决策变量。在求解过程中, ξ 的概率分布形式直接影响到计算模
k
型的收敛速度以及结果精度。该分布可以选取符合均值为 0、方差为 1 的均匀分布、高斯分布或者
Beta 分布等。
利用式(14)解决离散型随机过程问题时可以进行离散近似处理,一般选择有限个数的离散特征
项进行 KL 展开,所以库水位变量的 KL 展开式可表述为:
- M
Z ( ) t ≈ Z ( ) t + å λ ψ ( ) t ξ k (15)
k
k
k = 1
式中,M 为样本选取特征项的个数,其大小取决于结果精度要求以及样本中各随机过程之间的相关
性。精度要求越高,则需采用的特征项个数越多。M 的取值存在一定范围,这取决于主成分分析的
计算结果。实际调度样本集数据的相关性越强,则特征项数目越少,M 的上限取值越小。反之,则
得到的特征项数目偏多,M 的上限数值变大,这种情况下需要在求解过程中对 M 值以及采用的特征
项进行优化计算以便于权衡选择。
可以看出,在采用 KL 展开方法过程中,水电站的调度决策变量从原先的时段末水位转变为针对
调度期若干特征项的系数,以此来确定调度期的库水位过程。进一步分析该方法的时间复杂度,一
般而言,水电调度问题始、末都只有一个状态变量,假定其余 T-1 个时段的状态变量离散为 S 份,则
)
对于经典 DP 算法,单个水库的计算次数为 S T - 1 ,I 个水电站的时间复杂度为 O(TS );对于 POA
I (T - 1
算法,计算次数与其迭代收敛条件有关,若算法收敛终止前整体需进行 n 次迭代,则算法的时间复杂
度为 O(nS I (T - 1 ) );对于 KL 展开方法,假定水电站的特征值个数为 k ,特征值可选离散权重值为 n,
i
单个水电站收敛需计算次数为s ,则 KL 展开方法的时间复杂度为 O(Is k n)。可以看出,KL 展开方
i
i
i
法的复杂度显著低于经典的 DP 及改进方法。
3.3 建立发电调度过程样本集 在采用主成分分析法提取水电站调度过程特征值与特征向量前,需
要建立各水电站的发电调度过程样本集。对于具有长系列实际调度数据的电站,直接采用历史的库
— 172 —