Page 64 - 2023年第54卷第10期
P. 64
跳出局部最优的能力,从而提出改进的天鹰优化(IAO)算法。
Tent混沌映射是一个二维混沌映射,具有均匀的分布函数和良好的相关性。Tent混沌映射将正态
分布序列转换为混沌序列,能够增强种群间不同个体之间的联系,增加初始种群整体的随机性,从而
提升算法前期的全局搜索能力。采用 Tent混沌映射生成混沌序列初始化天鹰位置x 的过程如下:
i,j
首先,由 Tent混沌映射生成混沌序列:
1
2x 0 ≤x ≤
i,j i,j
2
x = (10)
i,j + 1
1
21 - x ) <x ≤1
(
i,j
i,j
2
式中:i = 1,2,…,N,N为种群中天鹰的总数;j = 1,2,…,D,D为待优化超参数的维数;x 为
i,j
[ 0,1]内的随机值。
然后,将式(10)中的混沌序列映射到解的搜索空间,得到混沌初始化种群:
new
x = LB+ x × (UB- LB) (11)
j
i,j + 1
j
j
i ,j + 1
式中LB和UB分别为第 j维待优化参数取值的下界和上界。
j
j
天鹰优化算法的全局搜索能力较强,但其局部开发能力较弱,容易陷入局部最优解而导致寻优精
度降低。虽然天鹰优化算法在开发阶段中引入了随机性较强的莱维( Levy)飞行策略,增强了算法跳出
局部最优的能力,但是莱维飞行策略在迭代后期容易出现搜索距离过大而导致难以发现全局最优位置
的问题。天鹰飞行速率G是天鹰优化算法在缩小开发阶段中的一个重要参数,对于提高算法优化性能
2
具有重要意义。然 而,天鹰 飞行 速率 G 随 着 迭 代 次 数 的 增 加 而 呈 现 线 性 下 降 的 变 化 趋 势。相 关 研
2
究 [28 - 30] 表明,智能优化算法中的非线性参数对于增强算法全局、局部搜索能力或提高收敛速度具有重
要作用。因此,采用非线性飞行速率更新策略对天鹰飞行速率G进行改进,以弥补算法后期局部搜索
2
能力较弱而使群体陷入早熟的缺陷。改进后的G可表示为 G′,表达式如下所示:
2 2
π t
G′ = 2 × (1 - sin( )) (12)
2
2I
式中:t为当前迭代次数;I为最大迭代次数。
种群混沌初始化增强了原算法的全局搜索能力,非线性飞行速率更新策略增强了原算法的局部搜
索能力,因此将两者结合起来可以增强天鹰优化算法的整体寻优能力。
3.2.2 IAO - XGBoost集成学习模型实现流程 利用 IAO算法的寻优能力和 XGBoost算法的学习能力,
提出基于 IAO算法改进的 XGBoost(IAO - XGBoost)集成学习模型,该模型充分通过 IAO算法找到 XG
Boost 训练过程中使其预测结果和模拟值之间误差最小时的一组最优参数值,达到改进 XGBoost算法预
测性能的目的。IAO - XGBoost集成学习算法的实现流程如图 2所示。
4 面向大坝渗流性态智能分析的可解释机器学习框架 SHAP
对于大坝渗流性态指标预测而言,除了准确性和预测速度之外,了解模型为何会对不同的样本输
入特征得出相应的预测结果,关系到模型预测结果的可信度,同样是大坝运行管理人员关心的问题。
机器学习算法在进行预测时,其内部运作过程类似于 “黑箱”,难以直观地被人类理解,因此有必要
对其预测结果进行可解释性分析 [31] 。在大坝渗流性态预测中,可解释性意味着找出影响大坝渗流性态
指标预测的关键特征,阐明模型的决策过程,从而提供大坝运行管理人员可理解的渗流性态指标预测
结果。
可解释机器学习是指使机器学习系统的行为和预测对人类可理解的算法或模型 [32] 。Shapley加性
解释(SHapleyAdditiveexPlanation,SHAP)是由 Lundberg等 [18] 提出的一种用于增强机器学习模型可解
释性的统一框架,可以对每一个样本的每一个特征变量计算出线性可加的贡献值,从而达到解释的效
果 [19] 。尽管传统的 XGBoost算法可以进行特征重要性分析,挖掘影响预测结果的关键特征,但是这只
0
— 1 2 0 —