Page 99 - 水利学报2021年第52卷第4期
P. 99
征学习是机器学习方法之一,它能够从无标签训练数据中挖掘出有效特征或表示,发现数据中隐藏
的有用信息,在水电机组信号特征提取方面有极大应用潜力。
奇异值分解(Singular Value Decomposition,SVD)和自编码器是无监督特征学习领域的重要方法,
可有效提取信号特征。SVD 将包含信号信息的矩阵分解为一系列子矩阵和对应的奇异值,两者反映
了矩阵蕴含的信息量,且奇异值具有比例不变性和旋转不变性,是较为稳定的信号特征 [6-8] 。自编码
器(Auto-Encoder,AE)通过无监督方式来学习一组数据的关键特征,采用正常信号训练得到的自编
码器,其网络参数和特性都只适合重构正常信号,当有异常信号输入时,模型重构误差将发生较大
变化,通过分析自编码器重构误差的变化,可确定当前输入信号是否属于正常状态 [9-10] 。
为了充分利用水电机组正常数据,量化评价机组健康状态,本文提出了基于奇异值分解的时域
劣化指标和基于自编码器重构误差的频域劣化指标。同时,考虑到单纯的时、频域劣化指标描述水
电机组状态变化不够全面,提出了融合时、频域劣化信息的综合劣化指标,以反映机组健康状态的
劣化趋势和劣化程度,并采用实测数据验证了所提方法的有效性。
2 基于典型工况划分的水电机组健康状态实时评价
[2]
水电机组运行工况复杂,且机组状态监测数据与运行工况与紧密相关 ,因此在构建劣化指标时
应考虑工况差异,对不同工况建立不同标准特征库,通过计算机组特征实际值与同一工况标准值的
差异,量化评价机组当前健康状态。基于典型工况划分的水电机组健康状态实时评价分为离线和在
线两个阶段 [11] ,具体流程如图 1 所示。
在离线阶段,从水电机组状态监测系统中选取机组运行状态良好时段内采集的数据建立含工况
参数的正常记录,同时划分机组典型工况,建立典型工况正常记录库。当两个工况的水头之差 ∆H
和有功之差 ∆P 足够小时,可近似作为相同工况,据此可将水电机组运行工况按照水头、有功划分为
M 个典型工况。对于某一典型工况(P ,H )将所有符合 | p - P m | < ∆P/2 且 | h - H m | < ∆H/2 的(p ,h ,
i
j
m
m
i
j
x )处理成(P ,H ,x )。根据国标 GB/T 32584-2016 中定义水电机组稳态运行工况为流量(有功)、水
m
m
k
k
头等主要参数保持在±1.5%额定值以内,可取DH= 3%额定水头、DP= 3%额定有功 [12] 。之后将各典型
工况正常记录库中的数据分成两部分,分别构成标准数据子库 S 和正常数据子库 N 。利用 S 中的数
m
m
m
据计算得到标准时、频域特征,利用 N 中的数据分别求出时、频域差异特征的置信区间和正常阈值。
m
在线阶段,首先根据 p 和 h 求出机组当前归属的典型工况,分别从标准数据子库调出标准时、频
i
j
域特征,从正常数据子库中调出时、频域差异特征正常阈值。然后结合标准时,频域特征计算当前
状态监测信号 x 的时域差异特征 tdf 和频域差异特征 fdf ,根据正常阈值计算当前状态监测信号 x 的
k
k
k
k
时域劣化指标 TI 和频域劣化指标 FI。最后由 TI 和 FI 加权计算得到综合劣化指标 CI,CI 值小于等于 1
时,表明机组处于健康状态;CI 值越大,机组健康状态劣化程度越高。
3 基于无监督特征学习的时、频域劣化指标及综合劣化指标
3.1 时域劣化指标 时域劣化指标是在时间域内对信号进行特征提取,研究对象是信号幅值。对包
含信号幅值信息的矩阵进行 SVD,可将原矩阵分解到不同子空间中,突出信号本质特征。
3.1.1 基本原理 SVD 相当于将 1 个秩为 r 的实矩阵 A m×n 分解为 r 个秩为 1 的 m×n 阶矩阵的加权和,权
值即为矩阵 A 的奇异值,如下式所示:
r
A = UDV T = å λ v u T i (1)
i
i
i = 1
式中: U、V 为酉矩阵,且 U Î C m × m ,V Î C n × n ; λ 为 A A 的特征值, λ > 0 ;v 为 A 的右奇异向
T
i
i
i
}
量 ; u 为 A 的 左 奇 异 向 量 ; D 是 一 个 对 角 矩 阵 , D = diag{ λ ,λ ,,λ ,0,,0 ,
r
i
1
2
— 475 —