Page 46 - 2025年第56卷第9期
P. 46

训练集和测试集的损失值 Loss 及准确率 Acc 如                                   表 2 模型参数设置
              图 6 所示。                                                     参数                     值
                  模 型 的 训 练 曲 线 表 明 , 训 练 过 程 中 ,                        学习率                    0.001
              Epochs 在 0~30 之间时,模型性能提升较快,之                               优化器                    Adam
              后基本保持在小区间内上下波动。随着学习率                                      Batchsize                32
              lr 的自动变化,在 Epochs 约为 80 处,lr 降至预                    跨模态注意力隐向量维度                    256
              设的最低值,使模型性能保持在较为稳定的状                                   跨模态注意力层数                     2
              态 。 模 型 在 训 练 集 上 的 最 终 训 练 精 度 为                      跨模态注意力头数                     4
              98.14%, 在 测 试 集 上 的 训 练 精 度 为 95.83%。                 跨模态注意力 dropout               0.1
                                                                     单模态注意力层数                     3
              模型整体的精度较高,且训练过程中训练集与
                                                                     单模态注意力头数                     4
              测试集的学习曲线趋势接近,Loss 值最终都收
                                                                    单模态注意力 dropout               0.1
              敛于一个较低的值,证明模型具有较好的泛化
                                                                        损失函数                  CrossEntropy
              能力。
                                                                        激活函数                    ReLU
                  为全面评估模型的性能,选取准确率 Acc、
              精确率 P、召回率 R、F1 分数作为模型的评价























                                                      图 6 模型训练曲线

              指标。模型在测试集上的性能效果如图 7 所示,模
              型对于空载运输、挖掘土料、重载运输、倾倒土
              料 、 静 止 5 种 标 签 的 分 类 准 确 率 分 别 为 0.979、
              0.986、 0.985、 0.970、 0.997。 F1 分 数 是 精 确 率 和
              召回率的调和平均数,用于综合考虑精确率和召回
              率,模型的加权平均 F1 值为 0.968。综合考虑各项
              评 价 指 标 , 模 型 对 于 5 类 标 签 均 具 有 较 好 的 分 类
              效果。
                                                                           图 7 模型各标签分类性能效果
              5.3 对比分析
              5.3.1 不同模态数据对活动识别结果的影响  为深入分析不同模态数据在分类任务中的贡献,将单模
              态数据、双模态数据和三模态数据,分别作为独立数据源输入模型进行试验,并对其最终性能进行比较。
              不同模态数据的对比研究结果如表 3所示。
                  由以上结果可以得知,视觉数据对模型的贡献最大,声学数据次之,运动学数据贡献最少。为进
              一步探究不同模态数据对模型分类结果的影响及其内在原因,下面针对不同模态数据在不同标签上的
              效果进一步进行分析,试验结果如表 4 所示。

                — 1150   —
   41   42   43   44   45   46   47   48   49   50   51