Page 95 - 2024年第55卷第8期

P. 95

果，通过未采用强制学习策略、未添加注意力机制、未使用多任务学习的三个模型分别建立虚拟传感
２
器与基于ＴＦＡ－Ｓｅｑ２Ｓｅｑ建立的虚拟传感器进行对比分析。４个模型在训练过程中的ＭＳＥ和Ｒ分别如
图６和图７所示，最终虚拟传感器的精度对比和模型训练所需时间对比如表１所示。
２
２
基于未采用强制学习策略的ＴＦＡ－Ｓｅｑ２Ｓｅｑ虚拟传感器的Ｒ和ＭＳＥ分别为０．６８３７和０．０７９７ｃｍ?ｓ。
随机强制学习策略对虚拟传感器的精度影响最为显著，其原因是ＧＲＵ的循环神经网络每一个时间步
的输入都是前一个时间步输出的预测值，虽然ＴＦ层将地震信号转换为４１个时间步的时频单元，但是
由于误差在每个时间步的累计过程一直存在，导致难以进行有效和稳定的训练；相反，随机强制学习
策略在本训练过程中对Ｄｅｃｏｄｅｒ中ＧＲＵ的循环神经元随机输入真实值，此类训练干预策略在不暴露未
来时间步信息的同时能够显著提高模型的收敛性。
２
２
基于未添加注意力机制的ＴＦ－Ｓｅｑ２Ｓｅｑ虚拟传感器的Ｒ和ＭＳＥ分别为０．８９６６和０．０２６０ｃｍ?ｓ。相
较于ＴＦＡ－Ｓｅｑ２Ｓｅｑ虚拟传感器，未添加注意力机制会使虚拟传感器的平均精度下降６．８８％，其原因是
该虚拟传感器的Ｄｅｃｏｄｅｒ中输入的上下文向量ｃ认为各时间步的权重一致，难以提取有效信息。
２
２
基于单任务学习的ＴＦＡ－Ｓｅｑ２Ｓｅｑ虚拟传感器的Ｒ和ＭＳＥ分别为０．９３２２和０．０１９９ｃｍ?ｓ。可见添加
ＴＦ层和注意力机制是提高虚拟传感器精度的重要改进，但相较于多任务学习的ＴＦＡ－Ｓｅｑ２Ｓｅｑ精度仍有
３．３２％的下降。此外，基于单任务学习的ＴＦＡ－Ｓｅｑ２Ｓｅｑ虚拟传感器需要针对三个方向的地震信号分别
建模，训练时间和算力资源消耗较大，从表１可知单任务学习架构下的虚拟传感器模型参数量为所提
出模型的１．５倍，训练时间和预测所需时间也相应增加，其对算力资源消耗过大，不适合多输出虚拟
传感器的建模。

２
图６训练过程中的ＭＳＥ损失函数对比图７训练过程中的Ｒ对比

表１各虚拟传感器的精度和训练时间
虚拟传感器类型模型参数精度训练时间?ｈ平均预测时间?ｍｓ
ＴＦＡ－Ｓｅｑ２Ｓｅｑ３．３３ × １０６９６．５４％１１．９７１．３６
无强制学习ＴＦＡ－Ｓｅｑ２Ｓｅｑ３．３３ × １０６６８．３７％９．５０１．３４
ＴＦ－Ｓｅｑ２Ｓｅｑ３．３０ × １０６８９．６６％１１．８５１．２４
单任务ＴＦＡ－Ｓｅｑ２Ｓｅｑ５．０８ × １０６９３．２２％１８．３１１．９７
注：训练和预测均在ＮＶＩＤＩＡＱｕａｄｒｏＰ５０００设备上完成。

为进一步分析有无强制学习策略和单任务学习建立的三方向地震虚拟传感器的区别，选取地震发
生第１０ｓ的三种虚拟传感器感知的三方向地震加速度误差对比如图８所示，其中绿色曲线为本文提出
的多任务ＴＦＡ－Ｓｅｑ２Ｓｅｑ虚拟传感器输出的地震信号。从图８中可以看出，在地震发生的第１０ｓ至第
２０ｓ时间段内，无强制学习的虚拟传感器感知误差最大，且几乎每间隔一定的时间步都会出现较大误
２
差，尤其在Ｎ方向，最大误差超过０．０８ｃｍ?ｓ，仅在Ｅ方向的预测精度较为准确。而单任务学习的虚
拟传感器感知的地震加速度误差在第１０～１５ｓ内与最优虚拟传感器相差不大，但在第１５ｓ后误差显著
增大。结合图５分析可知，此时加速度幅值变化较大，单任务学习的虚拟传感器难以对此时的非平稳
信号特征做出准确的预测。

— ９７３ —

90 91 92 93 94 95 96 97 98 99 100