Page 49 - 2024年第55卷第8期

P. 49

４．２实验与分析基于优化前后的标签标注后产生的数据集设置了两组实验。第一组实验对比了经过
原始标签数据集以及优化标签数据集训练得到的模型的识别效果，用于检验标签优化对于微调模型识
别能力的影响；第二组实验根据关系分组训练了多个专门抽取一组关系的ＩＥ模型，用于探究将整体
的调度方案细分后，针对每一分组训练的模型的抽取效果。
４．２．１非完美标签优化的实验信息抽取模型采用了基于ＥＲＮＩＥ３．０［２３］的ＵＩＥ（ＵｎｉｖｅｒｓａｌＩｎｆｏｒｍａｔｉｏｎＥｘ
ｔｒａｃｔｉｏｎ），分别利用初始标签设计下得到的标注数据集以及优化标签设计下得到的数据集进行了模型
微调，最终计算得到的评估指标如表３所示。
表３微调模型评估指标单位：％

标签集评估对象准确率召回率Ｆ１值实体和关系完整度
实体８９．６６７８．９３８３．９５
初始标签６５．４２
关系８５．２５７３．５０７８．９４
实体９８．８９８４．７６９１．２８
优化标签７１．７２
关系９０．８０７９．８０８４．９５

通过实验结果可以看出，经过优化后的标签设计使得微调模型的识别效果在各指标上都有所提
升。对比两个实验的实体和关系完整度，可以看到标签优化使得完整度从６５．４５％提升到了７１．７２％，
证明了标签优化的良好效果。需要注意的是，成功的信息抽取结果致力于抽取出完整的实体和关系，
而不是一些知识碎片，因此可用实体和关系的完整度来评判模型的识别效果。
然而，在以下几个方面，该模型的抽取性能还有待提升。首先是相对于准确率来说，召回率略
低，这对于抽取出完整的调度方案是至关重要的；另外关系抽取的效果不如实体抽取，这一定程度上
是因为关系抽取受到实体抽取的影响，实体抽取的抽取误差会传递给后续的关系抽取；最后，实体和
关系完整率达到７０％以上，虽然相比于初始的标签设计已经有了大幅提升，但若要用于实际的工作中
仍然有待提升。
４．２．２分组关系抽取的实验在所有的关系中，筛选数据量丰富、代表性较强的一些关系参与分组，
并对每一组关系单独训练了ＩＥ模型。所有的微调模型都是基于ＵＩＥ－ｂａｓｅ进行微调的。实验结果如表
４所示。
表４分组训练模型评估指标单位：％

关系分组是否分组准确率召回率Ｆ１值
未分组９０．９１８３．３３８６．９６
触发、关联
已分组８７．５０ ↓ ８７．５０ ↑ ８７．５０ ↑
未分组８３．３３７８．９５８１．０８
调度、限制、保护
已分组６６．６７ ↓ ９４．７４ ↑ ７８．２６ ↓
未分组８１．２５６８．４２７４．２９
控制要素（触发）
已分组８８．２４ ↑ ７８．９５ ↑ ８３．３３ ↑
未分组９１．６７７３．３３８１．４８
采用
已分组１００．００ ↑ ９３．３３ ↑ ９６．５５ ↑
未分组６４．７１５７．８９６１．１１
最大值、最小值
已分组６２．９６ ↓ ８９．４７ ↑ ７３．９１ ↑

可以看出，分别为５组关系进行单独的模型训练后，抽取效果在一定程度上都得到了提升。具体
来看，除了 “调度、限制、保护” 关系组的Ｆ值略微下降，其他４组的Ｆ值都得到了提升。以 “控
１１
制要素（触发）” “采用” “最大值、最小值” 三个关系组最为明显，他们的Ｆ值都得到了较大的提
１
升。这意味着他们使用单独训练的模型进行抽取的效果相对于整体调度方案抽取模型的抽取效果更

— ９２７ —

44 45 46 47 48 49 50 51 52 53 54