Page 8 - 2024年第55卷第7期
P. 8
3.4 输出数据 秦岭隧洞现场的岩爆事件十分频繁且以强烈等级的事件为主。统计各个预测时间段内
的岩爆最大等级发现:存在极强岩爆的样本占 21.53%,最大岩爆等级为强烈的样本占 39.08%,最大
岩爆等级为中等的样本仅占 9.98%,无最大岩爆等级为轻微的样本,未发生岩爆的样本占 29.41%。采
用现有数据直接预测岩爆等级会面临数据标签不均衡的问题,因而本文将岩爆发生时间及风险作为模
型预测的重点。将岩爆风险值作为模型输出,当样本的预测时间段内存在岩爆事件,发生岩爆的风险
值为 1;当样本的预测时间段内无岩爆事件,发生岩爆的风险值为 0。模型实质为二分类问题,输出
数据的格式为:
O = [O,O] (2)
1 2
式中 O为发生岩爆的风险值,0 ≤O≤1,O = 1 - O。根据岩爆记录台账,如果预测时间段内有岩爆事
2 2 1 2
件发生,则目标输出值为( 0,1);如无岩爆发生,则目标输出值为(1,0)。在实际预测中,模型输出
结果可反映预测时间段内岩爆发生可能性的高低,并且可以近似反映岩爆的等级。
3.5 训练样本 模型训练样本为 2017年 9月 3日—2020年 11月 23日所有微震监测、TBM施工数据
以及岩爆记录台账,见表 3。回溯时间取为 9d,由于现场存在隧道施工停工、微震监测系统调试等特
殊情况,如回溯时间内未包含任何微震记录信息,则将该样本舍弃,避免停工等因素干扰模型训练、
预测结果,数据经分割后,包含 24926个 n × 9的矩阵数据,n 为回溯时间段内微震事件数量最大
max max
值,在训练样本中,n 为 1318,对应的回溯时间段为 2020年 8月 1日 8时至 10日 8时。延迟时间
max
定为 0h,Δ t为 1h,预测时间段取为 2d,减小岩爆随机性对模型的影响。
为了避免不均匀标签对训练结果的影响,根据是否有岩爆将数据分为 2类,样本中 7291个未发生
岩爆,17635个发生岩爆,训练过程中,从未发生岩爆的样本中随机抽取 80% 的数据,并抽取相同数
量的发生岩爆样本,将两者混合后随机打乱生成训练集。验证集的生成方法与之类似,抽取数据的百
分比为 20%。
为了测试模型的有效性,将 2020年 11月 24日—2021年 4月 19日的微震事件数据以及岩爆事件
数据作为测试集,数据分割后,包含 1424组未发生岩爆和 1793组发生岩爆样本数据,两者数量较为
接近,可以较好地检验模型预测效果。
表 3 训练样本统计信息
数据集分类 样本数量 岩爆发生样本 岩爆未发生样本 回溯时间?d 预测时间?d Δ t?h
训练集 19941 14108 5833 9 2 1
验证集 4985 3527 1458 9 2 1
测试集 3217 1793 1424 9 2 1
4 模型参数分析
4.1 网络结构的影响 为了使模型具有较好的泛化能力,防止模型出现过拟合现象,图 3对比了不同
卷积和全链接层网络结构对预测结果的影响。随着卷积层数的增加,模型在训练集、验证集、测试集
的准确率开始均逐渐增加(图 3(a)),当卷积层数超过 4时,准确率停止增加,在 80%~85% 的范围
内波动。卷积核数量的增加对准确率的影响更为显著(图 3(b)),随着卷积核数量的增加,模型准确
率快速升高,然后在各个数据集的准确率维持在 80% 左右;当卷积核数量超过 128时,随着卷积核数
量的增加,训练集、验证集的准确率快速增加,而测试集的准确率却逐渐下降,此时模型出现过拟合
现象;全链接层数的增加将导致模型准确率的降低(图 3(c)),而全链接节点数量对模型结果的影响
不明显(图 3(d))。综合以上结果,模型最终选定 4个卷积层,前 2层采用 256个卷积核,后 2层采用
128个卷积核,全局平均池化后,模型采用 1个全链接层,节点数量为 64个。
0
— 7 6 —