Page 114 - 2025年第56卷第8期
P. 114
4.1 通风频率预测模型建立与结果分析 设置 IHPO - XDF模型的最大级联层数为 10,每层包含 4个
XGBoost基学习器,为了保证基学习器的多样性,其列采样率分别为 1、0.9、0.8、0.7,寻优的参数为
XGBoost基学习器的 n_trees,max_depth,min_samples_split。其中,n_trees是 XGBoost中回归树的数
量,此参数值越大,模型学习能力越强,但存在过拟合风险;max_depth限制了单个决策树的最大深
度,其值越大模型越复杂,但增加训练和预测的计算负担;min_samples_split控制了一个内部节点要
继续分裂所必需的最少样本数,此值越大模型越稳健,鲁棒性越强,但学习能力下降。在 IHPO算法
中,设置初始种群个数分别为 100、50、20,最大迭代次数为 500、200、50 [23] ,以均方差误差(Mean
SquareError ,MSE)为适应度函数,设置 n_trees、max_depth、min_samples_split的寻优范围分别为[2,
200]、[3,10]、[2,20],使用数据集的 80%作为训练集,20%作为测试集。完成模型训练后发现,
种群个数为 100、50和迭代次数为 500、200的两个模型精度相近,但是前者的训练成本较高;种群个
数为 50,迭代次数为 20的模型精度较差,无法满足预测要求;因此选择种群个数为 50,最大迭代次
数为 200次作为模型参数,其超参数 n_trees、max_depth以及 min_samples_split的寻优结果分别为
137、4和 5,以测试集对模型性能进行验证,测试结果如图 6所示。从图 6中可以看出,模型的预测
频率与风机的实际频率吻合度较高。进一步计算预测结果的误差指标,如图 7所示。IHPO - XDF模型
2
2
决定系数 R为 0.9326,均方误差 MSE为 1.0881Hz,均方根误差 RMSE为 1.0431Hz,平均绝对误差
为 MAE为 0.7266Hz,表明 IHPO - XDF模型具有出色的预测能力。
4.2 模型预测结果可解释性分析 进一步研究风机频率预测输入参数对频率的影响,将所有样本的所
有特征 SHAP值绘制成散点图,如图 8所示。使用颜色的渐变反映 SHAP值的大小,各点的颜色越红
表示其 SHAP值越大,反之,点的颜色越蓝,代表其 SHAP值越小;SHAP值的正负反映了它对预测结
果的正负影响关系,当 SHAP值大于 0,代表它对预测结果具有正向影响;反之,带有反向影响。
图 6 IHPO - XDF模型结果 图 7 IHPO - XDF模型误差指标结果
由图 8可知,3号点位粉尘的浓度大小对风机频率影响最大,表明 3号点位的粉尘是影响风机
频率预测最重要的特征,在模型预测过程中发挥最重要的作用,且该值越大对风机频率预测正向贡
献程度越高。同时,1号点位的粉尘与 1号点位的 CO浓度也对风机频率预测有较大的影响,且两
者对风机频率预测的正负效应与 3号点位粉尘类 似。其 次,1号、2号 和 3号 点位 的 温 度和风速对
风机频率的 预 测 影 响 不 显 著, 主 要 原 因 是 洞 室 内 温 度 相 对 稳 定, 而 风 速 呈 现 周 期 性 变 化, 使 其
SHAP值相对集中。
从测试集中随机挑选一个预测样本,采用 SHAP理论解释输入特征对样本预测结果的影响,如
图 9所示。图中横坐标为某个特征 SHAP值的大小,纵坐标为输入特征的数值,红色表示输入特征
的 SHAP值为正,蓝色表示输入 特征的 SHAP为 负;且 红 色和 蓝色 区域 的面 积越 大,表示 SHAP值
越大,则对样本预测结果的影响也越大。由图 10可 知,输 入 特 征中 对 该 预测 样本 影响 最大 的 1号
点位粉尘,最小的是 1号点位风速。其中,1号点位粉尘的 SHAP值为 1.57,表明 1号点位粉尘对
此预测样本产生正影响;开挖方量的 SHAP值为 - 0.06 ,表 明此 时 开 挖方 量 对 此预 测样 本产 生负影
响。风机频率预测模型输出的基线为 43.246Hz,在各 个 特征 的 共 同作 用 下,该样 本 的 最终预测值
为 49.106Hz。
7
— 1 0 8 —

