Page 101 - 水利学报2021年第52卷第4期

P. 101

û
ë
式中：p、q 均为正整数， p < q，q = L/p 。
为了确定 p、q 的最佳取值，引入类内距离评估指数作为指标［14］，类内距离评估指数越大，说明
同类样本间的差异越大，样本越分散；反之，样本越集中。
以典型工况（P ，H ）为例，假设该工况标准数据子库 S 中有 M 个信号，其中第 i 个信号的奇异
m
m
m
值为 s = [s ( ) 1 s ( ) 2  s ( ] ) p ，第 j 个信号的奇异值为 s = [ s ( ) 1 s ( ) 2  s ( ] ) p ，且 i≠j，类内
i
i
i
j
j
j
i
j
距离评估指数算法步骤为：
（1）计算 S 中不同信号奇异值的欧氏距离，如下式所示：
m
p 2
d i,j = å( s ( ) k - s ( ) k ) （3）
j
i
k = 1
然后将该值对所有样本求平均值，即：
M
å d i,j
ˉ
d = i,j = 1 （4）
)
M (M - 1 2
ˉ
（2）计算 d 的变差因子，如下式所示：
max ( )
d
b = i,j （5）
min( )
d
i,j
（3）计算类内距离评估指数，如下式所示：
β = b × d ˉ （6）
û
ë
将满足 p < q，q = L/p 的所有 p 值依次代入 SVD 算法和类内距离评估指数算法，类内距离评估指
数最小值对应的 p 值为最佳值。
确定 p 的最佳值后，将一维时域信号重构为 p×q 的矩阵 H，对 H 进行 SVD，得到 p 个奇异值，作
为信号时域特征。
3.1.3 时域差异特征运行条件波动，测量仪器灵敏度以及随机干扰都会导致水电机组状态监测信
号在测量时出现随机误差。因此，同一工况下，即使机组始终处于正常运行状态，信号特征也会发
生改变，但这种变化较小，而机组运行状态发生异常时，信号特征会发生较大改变。为了量化特征
变化程度，反映机组健康状态，本文提出了时域差异特征。以典型工况（P ，H ）为例，记该工况标
m
m
准数据子库为 S ，正常数据子库为 N ，时域差异特征计算步骤如下。
m
m
（1）对 S 中各样本进行中心化处理。中心化公式下式所示：
m
*
X = X - μ （7）
*
式中： X = [x ，x ，，x ] 表示一个给定时域信号；L 为数据长度； X 为中心化处理后的时域信
1 2 L
L
å x i
号； μ = i = 1 。
L
（2）根据类内距离评估指数确定 p 的最佳值，并计算 S 中每个样本的时域特征。
m
（3）采用聚类算法计算标准时域特征。K 均值聚类算法以最小化簇内所有样本到簇均值向量的欧
氏距离之和为目标寻找聚类中心，具有快速，实现简单等优点［15］，故本文采用 K 均值聚类算法求出
* é * * * ù
S 中全部时域特征值的聚类中心作为标准时域特征 s = s( ) 1 s( ) 2  s( ) p û 。
ë
m
（4）根据步骤（1）、（2）计算 N 中各样本的时域特征。然后根据式（3）计算 N 中各样本时域特征与
m
m
标准时域特征的欧氏距离作为时域差异特征。
3.1.4 时域劣化指标工况不变，机组正常运行时，时域差异特征值会在小范围内波动，如何确定正
常状态与异常状态的时域差异特征阈值是对机组进行健康状态评价的关键。由统计学方法可知，对于
一个有确定样本个数的未知分布，可用置信区间表示样本参数真实值以一定概率落在测量结果周围的

— 477 —

96 97 98 99 100 101 102 103 104 105 106