Page 44 - 2024年第55卷第9期

P. 44

最佳处理效果。从以上步骤可看出本文所提方法自适应较强，主要体现在三个方面：（１）ＣＥＥＭＤＡＮ
算法自身已具备自适应性质。在分解过程中，自适应先前分解所得各分量数据特征，动态完成下阶分
量的计算，而非依靠某一固定公式完成所有计算，各分量之间并非相互割裂，而是存在递进关系。
（２）在阈值降噪过程中针对每一个分量单独设置阈值及函数，针对序列长度、第一阶分量的绝对变差
中值及各分量相应阶次进行综合考虑，依据数据特性进行动态调整。（３）利用ＧＷＯ对参数组合进行最
佳寻优，将其与ＣＥＥＭＤＡＮ及阈值降噪法相结合，依据包含噪声的实际时序数据特性进行自适应动态
组合寻优，而非不加判别针对任何数据序列均采用通用参数，从而自适应完成降噪。
２．２递归特征选择作为寻找最优特征集合的ＲＦＥＣＶ是一种包裹式特征选取 “贪心” 算法，通过反
复建立多种模型，借助可以赋予特征权重的ｃｏｅｆ＿属性或ｆｅａｔｕｒｅ＿ｉｍｐｏｒｔａｎｃｅｓ＿属性进行特征重要程度评
价［２３］。然后，经过修剪移除设定数量下相应的最不重要特征，在更新后的特征集合中递归重复该步
骤，对特征变量不断筛选直至遍历所有特征，最终得到所需特征数量相应的最优特征集合。
由于无法提前准确判断有效特征的个数，该方法虽然可以保留指定数量的特征集合，但有效信息
可能存在于被移除的特征中，导致模型在修剪后的数据集上所表现出的性能并非最优，这与方差过滤
法、单变量特征法类似，可能受到人为选择特征数量的主观影响；同时计算结果的稳定性与所选元学
习器具有相关性。因此本文将结合多种元学习器对所有可能的特征数量及相应特征集合进行遍历，基
于ｋ折交叉试验所得评价指标的均值来选取最优学习器与最优特征集合。该算法基本实现步骤如下：
步骤１：以原始数据集为初始特征集并确定需要保留的特征数量；
步骤２：选取学习器并使用当前特征集进行建模，计算每个特征的重要性；
步骤３：进行特征迭代，删除最不重要的Ｘ个（一般为１）特征，更新当前特征集；
步骤４：反复进行步骤２与步骤３，直到获得指定数量下的最优特征集合，终止迭代；
步骤５：进行ｋ折交叉试验，对比各指定特征数量下所得评价指标的均值，选取最优学习器与最
优特征集合。
２．３双向长短期记忆神经网络传统的循环神经网络
（ＲｅｃｕｒｒｅｎｔＮｅｕｒａｌＮｅｔｗｏｒｋ，ＲＮＮ）不能很好地处理数据信息流
动过程中的长期依赖关系与梯度爆炸问题，基于ＲＮＮ进行改
进的长短期记忆神经网络（ＬｏｎｇＳｈｏｒｔ－ＴｅｒｍＭｅｍｏｒｙ，ＬＳＴＭ）
通过遗忘门、输入门与输出门三个门控结构来控制信息传递，
有效克服了梯度爆炸与梯度消失等存在于传统ＲＮＮ中的缺
点，能够充分挖掘和传递数据特征，已广泛应用于长时间非
线性序列预测问题，其神经元结构如图１所示。
但传统ＬＳＴＭ常将过去的信息作为输入层和隐藏层，未
能很好考虑未来的有效信息，在面对大量时序数据时处理速图１ＬＳＴＭ神经元结构
度较慢。ＢｉＬＳＴＭ基于前后向双向传播原则，将历史信息与未来信息作为当前输入时序数据，采用２
个独立的隐藏层对时序数据分别进行正反向处理并连接至同一输出层，在过去与未来信息正向流动的
基础上，同步实现了未来与过去信息的反向流动，从而实现对双向信息前后关联性的有效挖掘，其网
络结构如图２所示。由于权重参数复用使得ＢｉＬＳＴＭ网络在处理连续时间序列时具有更加良好的性能。
此外，通过构建多个ＢｉＬＳＴＭ层来增加模型的容量，可以提高模型的预测能力，使得模型可以学习更
复杂的时间序列模式，其原理如下所示［２４－２５］：
（１）以前一时刻所得ｈ和当前时刻输入信息ｘ作为输入参数，通过运算遗忘门的Ｓｉｇｍｏｉｄ函数来
ｔ－１
ｔ
确定丢弃的无用信息，遗忘门的激活值ｆ由式（１０）得到：
ｔ
ｆ＝ σ （Ｗ ·［ｈ，ｘ］＋ｂ）（１０）
ｆ
ｆ
ｔ
ｔ
ｔ－１
式中：σ （·）为激活函数Ｓｉｇｍｏｉｄ；ｂ、Ｗ分别为遗忘门的偏置与权重矩阵。
ｆ
ｆ
（２）通过运算输入门的Ｓｉｇｍｏｉｄ函数与ｔａｎｈ函数决定ｈ和ｘ中重要且需要保留的信息，将上述
ｔ－１ｔ
“遗忘” 状态和 “当前” 状态相结合，并与遗忘门共同更新当前细胞状态，见式（１１）：
０
— １４９ —

39 40 41 42 43 44 45 46 47 48 49