Page 49 - 2024年第55卷第8期
P. 49

4.2 实验与分析 基于优化前后的标签标注后产生的数据集设置了两组实验。第一组实验对比了经过
              原始标签数据集以及优化标签数据集训练得到的模型的识别效果,用于检验标签优化对于微调模型识
              别能力的影响;第二组实验根据关系分组训练了多个专门抽取一组关系的 IE模型,用于探究将整体
              的调度方案细分后,针对每一分组训练的模型的抽取效果。
              4.2.1 非完美标签优化的实验 信息抽取模型采用了基于 ERNIE3.0                         [23] 的 UIE(UniversalInformationEx
              traction ),分别利用初始标签设计下得到的标注数据集以及优化标签设计下得到的数据集进行了模型
              微调,最终计算得到的评估指标如表 3所示。
                                                   表 3 微调模型评估指标                                    单位:%

                   标签集          评估对象           准确率           召回率            F 1 值         实体和关系完整度
                                  实体            89.66         78.93         83.95
                  初始标签                                                                        65.42
                                  关系            85.25         73.50         78.94
                                  实体            98.89         84.76         91.28
                  优化标签                                                                        71.72
                                  关系            90.80         79.80         84.95

                  通过实验结果可以看出,经过优化后的标签设计使得微调模型的识别效果在各指标上都有所提
              升。对比两个实验的实体和关系完整度,可以看到标签优化使得完整度从 65.45%提升到了 71.72%,
              证明了标签优化的良好效果。需要注意的是,成功的信息抽取结果致力于抽取出完整的实体和关系,
              而不是一些知识碎片,因此可用实体和关系的完整度来评判模型的识别效果。
                  然而,在以下几个方面,该模型的抽取性能还有待提升。首先是相对于准确率来说,召回率略
              低,这对于抽取出完整的调度方案是至关重要的;另外关系抽取的效果不如实体抽取,这一定程度上
              是因为关系抽取受到实体抽取的影响,实体抽取的抽取误差会传递给后续的关系抽取;最后,实体和
              关系完整率达到 70%以上,虽然相比于初始的标签设计已经有了大幅提升,但若要用于实际的工作中
              仍然有待提升。
              4.2.2 分组关系抽取的实验 在所有的关系中,筛选数据量丰富、代表性较强的一些关系参与分组,
              并对每一组关系单独训练了 IE模型。所有的微调模型都是基于 UIE - base进行微调的。实验结果如表
              4所示。
                                                 表 4 分组训练模型评估指标                                    单位:%

                      关系分组                是否分组              准确率              召回率                F 1 值
                                           未分组              90.91            83.33              86.96
                     触发、关联
                                           已分组              87.50 ↓          87.50 ↑           87.50 ↑
                                           未分组              83.33            78.95              81.08
                   调度、限制、保护
                                           已分组              66.67 ↓          94.74 ↑           78.26 ↓
                                           未分组              81.25            68.42              74.29
                    控制要素(触发)
                                           已分组              88.24 ↑          78.95 ↑           83.33 ↑
                                           未分组              91.67            73.33              81.48
                        采用
                                           已分组             100.00 ↑          93.33 ↑           96.55 ↑
                                           未分组              64.71            57.89              61.11
                    最大值、最小值
                                           已分组              62.96 ↓          89.47 ↑           73.91 ↑

                  可以看出,分别为 5组关系进行单独的模型训练后,抽取效果在一定程度上都得到了提升。具体
              来看,除了 “调度、限制、保护” 关系组的 F 值略微下降,其他 4组的 F 值都得到了提升。以 “控
                                                        1                         1
              制要素(触发)” “采用” “最大值、最小值” 三个关系组最为明显,他们的 F 值都得到了较大的提
                                                                                      1
              升。这意味着他们使用单独训练的模型进行抽取的效果相对于整体调度方案抽取模型的抽取效果更

                                                                                                —  9 2 7 —
   44   45   46   47   48   49   50   51   52   53   54