Page 98 - 2023年第54卷第2期
P. 98
l
l + 1
P (j) =f{Z(m)} (3)
i i
l
式中:Z(m)为第 l层第 i个特征矩阵中第 m个神经元的值,m的范围为[(j - 1 )B + 1 ,jB],B为池化
i
l + 1
区域的宽度;P (j)为池化操作后第 l + 1层中神经元的对应值;f{·}函数即为取得池化区域内最大值
i
或池化区域内所有神经元值的平均值。
(3)经过卷积和池化操作之后,将提取的多列特征序列通过扁平层(Flatten)整合为一列,经过全
连接层( Dense)继续提取深层特征,其输出为:
= h(wp + b) (4)
δ j j j j
为全连接层的第 j个输出,共有 n个输出;w,b分别为第 j个神经元的权重
式中:j = 1,2,…,n;δ j
j j
和偏置,h(x)为全连接层所使用的激活函数。
( 4)在多分类问题中,输出层一般使用 Softmax函数作为输出神经元的激活函数,对于每一个神经
元来说,Softmax函数的输出值的计算公式如下:
e
δ j
) = (5)
F( δ j
n
∑ e
δ k
k =1
为经
式中 F( δ j )为每一个类别的最后输出的概率值,且大小在[0,1]之内,所有的概率值之和为 1。δ j
过全连接层及相应层激活函数之后输出的第 j个值,若只有一个全连接层,则全连接层的输出神经元
的个数 n对应为输出层中输出神经元的总数,即预测目标的类别数。
图 1 一维卷积神经网络
2.1.2 多尺度一维卷积神经网络结构设计 传统一维卷积神经网络使用的单一尺度卷积核所提取的特
征信息不够完整 [24] ,难以捕捉到泄漏信号中的多尺度特征,为提高网络对泄漏特征的学习性能,本文
尝试构建 MS1DCNN模型来改善。多尺度的卷积核具有不同的卷积视野,可以在不增加计算复杂度的
情况下,对细粒度的多尺度特征进行学习,从而提高模型的特征学习效率;同时研究考虑使用多通
路,然后将多个分支通路提取的特征融合,可望得到更加丰富完整的泄漏信息。
构建的 MS1DCNN模型网络结构和流程如图 2所示,包括输入层、特征提取处理层和融合输出层。
首先将预处理之后不同时刻的瞬态水压数据直接输入至输入层中,然后以相同维度输出并作为特征提
取处理层的输入。特征提取处理层由 4个单通路卷积分支组成,不同通路采用不同的结构设计,通路
1至通路 4中使用的卷积核个数依次减少,以提取不同维度的泄漏特征,图中 n× 1 、n× 1 、n× 1 、n× 1
1 2 3 4
对应为各通道卷积核尺寸。通路 1由两个连续的一维卷积层叠加组成,使用最多的卷积核个数以获取
更为整体的特征;通路 2在通路 1的基础上在每个卷积层后面连接一个最大池化层,提取卷积操作后
识别率更高的特征,以获得相对局部的特征信息;由于输入的数据特征之间相差较大,通过预处理之
2
— 2 2 —