Page 65 - 2022年第53卷第8期

P. 65

ＳＷＬＳＴＭ模型；
ｔａ
ｔａ
ｔａ
ｔｅ
ｔｅ
ｔｅ
步骤２：训练集特征输入［ｘ，ｘ，…，ｘ］和验证集特征输入［ｘ，ｘ，…，ｘ］分别输入到训练
１２Ｔａ１２Ｔｅ
ｔａ
ｔａ
ｔａ
完毕的ＳＷＬＳＴＭ模型中，完成第一次预测，得到训练集第一次预测结果［ｙ，ｙ，…，ｙ］和验证
１，１
１，２
１，Ｔａ
ｔｅ
ｔｅ
ｔｅ
集第一次预测结果［ｙ，ｙ，…，ｙ］；
１，１１，２１，Ｔｅ
ｔａ
ｔａ
ｔａ
ｔａ
ｔａ
ｔａ
步骤３：训练集第一次预测结果［ｙ，ｙ，…，ｙ］和观测值［Ｙ，Ｙ，…，Ｙ］构成第二次训
１，１１，２１，Ｔａ１２Ｔａ
ｔｅ
ｔｅ
ｔｅ
练集，将验证集第一次预测结果［ｙ，ｙ，…，ｙ］作为第二次预测特征输入，调用ＧＰＲ模型，得
１，Ｔｅ
１，２
１，１
ｔｅ
ｔｅ
ｔｅ
到验证集第二次预测结果［ｙ，ｙ，…，ｙ］；
２，２
２，Ｔｅ
２，１
ｔｅ
ｔｅ
ｔｅ
ｔｅ
ｔｅ
ｔｅ
步骤４：验证集第二次预测结果［ｙ，ｙ，…，ｙ］和验证集观测值［Ｙ，Ｙ，…，Ｙ］用来评
２，１２，２２，Ｔｅ１２Ｔｅ
价模型的预测精度和可靠性。
步骤中ｘ表示特征输入；ｙ表示第一次预测结果，由ＳＷＬＳＴＭ模型得到；ｙ表示第二次预测结
２，ｔ
ｔ
１，ｔ
果，由ＧＰＲ模型得到；Ｙ表示观测值；上标ｔａ和ｔｅ分别代表训练集和验证集标识；Ｔａ和Ｔｅ分别是训
ｔ
练集和验证集总样本数。
２．２基于０－１规划思想的特征组合优选在模型预测过程中，所有特征输入共同影响预测结果。一
组备选特征如何组合使模型预测精度达到最高是本研究的重点。
图３特征组合优化示意
假设ｎ个通过特征选择之后的备选特征为［Ｘ，Ｘ，…，Ｘ］，每个特征均有被选取加入特征组合
ｎ
１
２
中和不被选两种状态，但至少要保留一个特征作为输入，因此整个特征组合优化等价于０－１规划问
ｎ
题，搜索空间有２－１种组合情况。针对某一特征组合，采用预报模型进行训练和预报，可以获取该
特征组合对应的预报精度，通过比较不同特征组合的预报精度即可筛选出最优特征组合，如图３
所示。
显然，搜索空间大小随维度ｎ增加呈指数增长，当维度ｎ较大时，特征组合优化面临 “维数灾”
问题，在进行特征组合优化之前可以采用皮尔逊相关系数或者最大信息系数对特征进行初选，减少搜
索空间。针对不同维度ｎ，本研究采用不同策略寻优：（１）当０＜ｎ ≤４时，总搜索空间大小最大为１５，
此时采用穷举法获取全局最优特征组合；（２）当４＜ｎ ≤７时，总搜索空间大小范围是［１６，１２７］，此时
采用随机搜索算法，从整个搜索空间中随机选取１５种特征组合分别进行精度测评，以１５种特征组合
中的最优组合作为最终特征组合；（３）当ｎ＞７时，总搜索空间大小至少为１２８，此时采用启发式算法
进行搜索。
２．３基于贝叶斯优化算法的超参数优选预报模型的精度也受模型超参数的影响，以最小化损失函数
为例，超参数优化问题可以表示为：

ｈ＝ａｒｇｍｉｎ｛Ｌ（Ｐ，ｈ）｝（１１）
ｈ ∈Ｈ

式中：ｈ为最优超参数；Ｈ为超参数可选范围集合；Ｐ为预测模型；ｈ为当前超参数；Ｌ（Ｐ，ｈ）为预
测模型Ｐ在超参数ｈ下的损失函数。
本研究采用贝叶斯优化算法（ＢａｙｅｓｉａｎＯｐｔｉｍｉｚａｔｉｏｎＡｌｇｏｒｉｔｈｍ，ＢＯＡ）［３７］求解超参数优化问题。相比
于其他优化算法，贝叶斯优化算法通过估计整个损失函数概率分布使得新生成的超参数更接近最优结
果，从而能够在较少的函数评价次数内获取更优的超参数，其优化过程示意图如图４所示。
２
— ９５ —

60 61 62 63 64 65 66 67 68 69 70