Page 8 - 2024年第55卷第7期
P. 8

3.4 输出数据 秦岭隧洞现场的岩爆事件十分频繁且以强烈等级的事件为主。统计各个预测时间段内
              的岩爆最大等级发现:存在极强岩爆的样本占 21.53%,最大岩爆等级为强烈的样本占 39.08%,最大
              岩爆等级为中等的样本仅占 9.98%,无最大岩爆等级为轻微的样本,未发生岩爆的样本占 29.41%。采
              用现有数据直接预测岩爆等级会面临数据标签不均衡的问题,因而本文将岩爆发生时间及风险作为模
              型预测的重点。将岩爆风险值作为模型输出,当样本的预测时间段内存在岩爆事件,发生岩爆的风险
              值为 1;当样本的预测时间段内无岩爆事件,发生岩爆的风险值为 0。模型实质为二分类问题,输出
              数据的格式为:
                                                       O = [O,O]                                        (2)
                                                            1    2
              式中 O为发生岩爆的风险值,0 ≤O≤1,O = 1 - O。根据岩爆记录台账,如果预测时间段内有岩爆事
                    2                         2       1     2
              件发生,则目标输出值为( 0,1);如无岩爆发生,则目标输出值为(1,0)。在实际预测中,模型输出
              结果可反映预测时间段内岩爆发生可能性的高低,并且可以近似反映岩爆的等级。
              3.5 训练样本 模型训练样本为 2017年 9月 3日—2020年 11月 23日所有微震监测、TBM施工数据
              以及岩爆记录台账,见表 3。回溯时间取为 9d,由于现场存在隧道施工停工、微震监测系统调试等特
              殊情况,如回溯时间内未包含任何微震记录信息,则将该样本舍弃,避免停工等因素干扰模型训练、
              预测结果,数据经分割后,包含 24926个 n × 9的矩阵数据,n 为回溯时间段内微震事件数量最大
                                                      max                max
              值,在训练样本中,n 为 1318,对应的回溯时间段为 2020年 8月 1日 8时至 10日 8时。延迟时间
                                  max
              定为 0h,Δ t为 1h,预测时间段取为 2d,减小岩爆随机性对模型的影响。
                  为了避免不均匀标签对训练结果的影响,根据是否有岩爆将数据分为 2类,样本中 7291个未发生
              岩爆,17635个发生岩爆,训练过程中,从未发生岩爆的样本中随机抽取 80% 的数据,并抽取相同数
              量的发生岩爆样本,将两者混合后随机打乱生成训练集。验证集的生成方法与之类似,抽取数据的百
              分比为 20%。
                  为了测试模型的有效性,将 2020年 11月 24日—2021年 4月 19日的微震事件数据以及岩爆事件
              数据作为测试集,数据分割后,包含 1424组未发生岩爆和 1793组发生岩爆样本数据,两者数量较为
              接近,可以较好地检验模型预测效果。

                                                   表 3 训练样本统计信息
                 数据集分类         样本数量        岩爆发生样本       岩爆未发生样本        回溯时间?d       预测时间?d         Δ t?h

                   训练集           19941        14108         5833           9           2            1
                   验证集           4985         3527          1458           9           2            1
                   测试集           3217         1793          1424           9           2            1



              4 模型参数分析


              4.1 网络结构的影响 为了使模型具有较好的泛化能力,防止模型出现过拟合现象,图 3对比了不同
              卷积和全链接层网络结构对预测结果的影响。随着卷积层数的增加,模型在训练集、验证集、测试集
              的准确率开始均逐渐增加(图 3(a)),当卷积层数超过 4时,准确率停止增加,在 80%~85% 的范围
              内波动。卷积核数量的增加对准确率的影响更为显著(图 3(b)),随着卷积核数量的增加,模型准确
              率快速升高,然后在各个数据集的准确率维持在 80% 左右;当卷积核数量超过 128时,随着卷积核数
              量的增加,训练集、验证集的准确率快速增加,而测试集的准确率却逐渐下降,此时模型出现过拟合
              现象;全链接层数的增加将导致模型准确率的降低(图 3(c)),而全链接节点数量对模型结果的影响
              不明显(图 3(d))。综合以上结果,模型最终选定 4个卷积层,前 2层采用 256个卷积核,后 2层采用
              128个卷积核,全局平均池化后,模型采用 1个全链接层,节点数量为 64个。




                     0
                —  7 6  —
   3   4   5   6   7   8   9   10   11   12   13