Page 111 - 2022年第53卷第3期
P. 111
度综合衡量时序信号复杂性,本文将注意熵和多尺度熵相结合,提出了多尺度注意熵(Multiscale atten⁃
tion entropy,MATE)。同时,针对传统多尺度熵粗粒化不足的问题,受文献[14]中时移方法思想启
发,提出了一种度量信号复杂度的工具——时移多尺度注意熵(Time-shifted multiscale attention entro⁃
py,TSMATE)。通过仿真实验验证,TSMATE 具有良好的抗噪性能,可以有效提取水电机组故障信息。
水电机组故障诊断的实质是模式识别。将特征信息输入到分类器中,利用分类器区分不同故障
信号。近些年,随着人工智能的不断发展,机器学习、深度学习等一系列模型被应用于水电机组模
型建立 [15] 、振动趋势预测 [16] 以及机组状态监测 [17] 等领域。文献[18-20]利用卷积神经网络、概率神经
网络以及支持向量机等算法充当分类器,实现了机组不同故障状态的准确识别。但是,存在超参数
难以调节、计算复杂度高等问题,阻碍了这些算法在机组故障诊断方面的进一步运用。随机森林
(Random forests,RF)作为集成学习的一种,不仅有精度和效率高的特点,还具备参数可解释性强、
变量敏感度分析等优势。在轴承故障诊断 [21] 、地理遥感 [22] 、作物生长 [23] 以及风速预测 [24] 等方面都有
着广泛的应用。本文引入 RF 算法作为分类器,完成对机组不同故障信号识别。仿真实验表明,RF
可以高效识别不同状态信号。
针对传统方法难以准确识别高噪声下不同状态的故障信号,本文提出了一种基于 TSMATE 和 RF 相
结合的水电机组故障诊断模型。首先,受时移思想启发,提出了一种衡量时间复杂度的工具——TS⁃
MATE。通过分析不同信噪比噪声下机组振动信号的特征分布情况,验证了 TSMATE 具有良好的抗噪性
能。然后,针对特征冗杂问题,本文引入主成分分析(Principal component analysis,PCA)进行降维处
理,提高了模型运行效率。最后,将降维后的低维特征输入到 RF中,实现了水电机组故障的精确诊断。
2 TSMATE-PCA-RF 故障诊断模型建立
2.1 注意熵 Yang 等 [13] 通过关注时间序列中关键点变化情况,提出了一种新的度量时序复杂度工具
——注意熵。对比传统熵,注意熵具有对时序长度鲁棒性强、无需设置超参数等优点,如图 1 所示,
计算时序注意熵可概括为以下几步:
(1)如果时间序列中的每一个点都被认为是一个系统,其状态的变化就可以看作是系统对环境的
调整。峰值点可以有效表征局部状态的上下界变化情况,因此将局部峰值点定义为关键点。
(2)按照{min-min}、{min-max}、{max-min}以及{max-max}4 种不同策略设定为关键点,并计算相
邻关键点的间隔点数。
(3)计算相邻关键点间隔香农熵,具体公式见式(1):
b
p
H ( ) x = - å ( ) x log p( ) x (1)
x = 1 2
式中: p( ) x 为 x 发生的概率;b 为间隔点种类个数。
(4)将 4 种不同策略计算得到的香农熵均值定义为注意熵。
2.2 时移多尺度注意熵 (TSMATE) 注意熵仅在单一尺度衡量时序复杂度,难以全面反映出信号
的有效信息。针对这个问题,Costa 等 [25] 提出多尺度熵概念,通过对时序信号进行分割,实现了多尺
度度量信号复杂度的目的。本文将多尺度熵和注意熵相结合,并基于分形理论,提出了 TSMATE,克
服了传统多尺度熵粗粒化程度不足以及参数难以调节等问题。TSMATE 具体计算过程如下:
(1)通过式(2)将长度为 N 的时序信号分割成 k 个子序列。
Y β = x ,x ,x ,…,x } (2)
k { β β + k β + 2k β + k (N - β ) k û
ë
β
式中:x 为原始信号的样本点;k 为分割子序列的个数;Y k 为第β个子序列。
(2)计算所有尺度时序信号的注意熵,并将这些注意熵的均值定义为该尺度 k 下的
( )
k
TSMA( ) k = 1 å ATE Y β (3)
k k
β = 1
— 359 —