Page 62 - 2023年第54卷第10期

P. 62

化（ＩＡＯ）算法，并将ＩＡＯ算法用于自适应优化ＸＧＢｏｏｓｔ算法的超参数ｎ＿ｅｓｔｉｍａｔｏｒｓ、ｌｅａｒｎｉｎｇ＿ｒａｔｅ和ｍａｘ＿
ｄｅｐｔｈ，从而建立基于ＩＡＯ－ＸＧＢｏｏｓｔ的大坝渗流性态指标预测模型，进一步提高大坝渗流性态指标预测
的精度。
（３）基于ＳＨＡＰ理论的预测结果解释。针对基于ＩＡＯ－ＸＧＢｏｏｓｔ的大坝渗流性态指标预测模型仅能
得出预测结果和输入特征的重要性排序，而难以深入分析各样本的特征如何影响预测结果的问题，将
可解释机器学习框架ＳＨＡＰ理论与ＩＡＯ－ＸＧＢｏｏｓｔ算法相结合，在对特征进行全局重要性分析，挖掘关
键特征的同时，分析输入特征对预测结果的正负相关性影响，并解释特征间交互作用以及单个样本的
特征对大坝渗流性态预测结果的影响，从而提高预测模型的可信度。
（４）案例研究。将所提模型应用于中国西南某土石坝工程，通过对比分析验证所提方法的有效性
和优越性。

３土石坝渗流性态分析的ＩＡＯ－ＸＧＢｏｏｓｔ集成学习模型

３．１ＸＧＢｏｏｓｔ集成学习模型ＸＧＢｏｏｓｔ是由Ｃｈｅｎ和Ｇｕｅｓｔｒｉｎ提出的一种基于梯度提升决策树（Ｇｒａｄｉｅｎｔ
ＢｏｏｓｔｉｎｇＤｅｃｉｓｉｏｎＴｒｅｅ，ＧＢＤＴ）模型优化的集成学习方法［６］。ＸＧＢｏｏｓｔ的基本思想是通过加入新的弱学
习器拟合前一次训练的残差，并在训练结束时得到每个样本的预测分数，最后将所有弱学习器中的预
测分数相加而获得样本的预测值［２５］。目前，ＸＧＢｏｏｓｔ已经成功应用于众多领域，且在训练样本有限、
训练时间较短等场景下具有独特优势［２５］。这些特性正好适合于根据渗流数值模拟数据建立大坝渗流性
态指标预测模型。基于ＸＧＢｏｏｓｔ建立大坝渗流性态指标预测模型的主要原理如下。
ｍ
(
{
假设渗流性态指标数据集为Ｄ＝ｘ，ｙ ) ：ｉ＝１，…，ｎ；ｘ ∈Ｒ；ｙ ∈Ｒ } ，其中每个样本ｘ有ｍ
ｉ
ｉ
ｉ
ｉ
ｉ
个特征，并且对应一个目标值ｙ，则对于第ｉ个渗流样本ｘ的渗流性态指标预测值＾ｙ可表示如下：
ｉｉｉ
Ｋ
＾＝
ｙｆ（ｘ），ｆ∈ Ｆ（１）
ｉ ∑ ｋｉｋ
ｋ＝１
式中：ｆ为一棵回归决策树；Ｆ为所有可能的回归决策树的集合；Ｋ为回归决策树的总数；ｆ（ｘ）为第
ｋｋｉ
ｋ棵回归决策树对第ｉ个渗流性态指标样本ｘ的计算分数。
ｉ
渗流性态指标预测模型训练过程中的目标函数是算法的核心，如下式所示：
ｎＫ
ｉ ∑
∑
Ｏｂｊ＝ｌ（ｙ，＾ｙ）＋ Ω （ｆ）
ｉ
ｋ
ｉ＝１ｋ＝１
（２）
１Ｔ
Ω （ｆ）＝γ Ｔ＋ λ ∑ ｗ２
ｊ
ｋ
２ｊ＝１
式中：ｌ为模型损失函数，用以衡量渗流性态指标预测值＾ｙ与渗流性态指标模拟值ｙ之间的拟合程度；
ｉ
ｉ
Ω （ｆ）为正则化项，用以惩罚复杂模型，避免过拟合；Ｔ表示第ｋ棵回归决策树的叶子节点数目；ｗ表
ｊ
ｋ
示第ｊ个叶子节点的输出分数；γ为叶子节点数目的惩罚项；λ为Ｌ２正则惩罚项。
在渗流性态预测模型训练过程中，采用梯度提升策略，一次添加一个新的回归决策树到已有模型
（ｔ－１）
中。假设第ｉ个渗流样本在第ｔ－１轮迭代的渗流性态指标预测值为＾ｙ，可将目标函数表达如下：
ｉ
ｎ
（ｔ－１）
（ｔ）
∑
Ｏｂｊ＝ｌ（ｙ，＾ｙ＋ｆ（ｘ））＋Ω （ｆ）＋ｃｏｎｓｔａｎｔ（３）
ｔ
ｉ
ｉ
ｉ
ｔ
ｉ＝１
式中ｆ（ｘ）为第ｔ轮迭代时新加入的回归决策树。
ｉ
ｔ
对上式进行二阶泰勒展开并去掉常数项ｃｏｎｓｔａｎｔ后，则目标函数表达为：
ｎ１
]
２
（ｔ）
Ｏｂｊ＝ ∑ [ ｇｆ（ｘ）＋ｈｆ（ｘ）＋Ω （ｆ）
ｉｉ
ｉｉ
ｉ
ｉ
ｔ
ｉ＝１２
（ｔ－１）
ｇ＝ ＾ｙ（ｔ－１）ｌ（ｙ，＾ｙ）（４）
ｉ
ｉ
ｉ
ｉ
（ｔ－１）
２
ｈ＝ ＾ｙ（ｔ－１）ｌ（ｙ，＾ｙ）
ｉ
ｉ
ｉ
ｉ
— １１８ —
９

57 58 59 60 61 62 63 64 65 66 67