Page 47 - 2024年第55卷第8期
P. 47

模型专门处理一类实体和关系,最终可以提高整个结果的识别效果。


              4 实例分析


              4.1 防洪调度知识图谱的数据集构建方法
              4.1.1 本体设计 防洪调度方案是指导防洪工程或防洪系
              统运用的主要依据,通常包括原则要求、基础资料、防御
              方案、实施措施等。这些防洪调度规则通常包含在官方文
              档的句子 中,因 此 为 了 能够 从文本 中抽 取出防 洪 调 度 规
              则,在相关领 域 知 识 的 帮助 下设计 了防 洪调度 规 则 的 本
              体,以供标签设计以及信息抽取的需要。本文工作主要依
              据和处理的调度方案本体概念              [22] ,如图 8所示。
                  按照直接映射的方式,根据本体直接生成了对应的实
              体关系标签,如表 1所示。
              4.1.2 实体关系标签的优化 迭代次数以及完整度阈值的
              设置对于实体关系标签的优化效果以及效率至关重要。如                                         图 8 防洪调度方案本体
              图 9所示,我们对迭代次数和完整度阈值的设置进行了不同参数的对比。从图中的趋势可以看出,分
              别在迭代次数达到 4次、完整度阈值达到 0.7时,实体关系的完整度改变不再显著。因此在防洪调度
              规则的标签优化实践中,将迭代次数设置为 4,将完整度阈值设置为 0.7,这两个选择共同实现了标签
              优化的效果和效率的平衡。

                                               表 1 直接映射获得的标签三元组
                          头实体类型                         关系类型                          尾实体类型
                         方案触发时机                           触发                           调度方案
                         方案触发时机                           关联                           触发对象
                           调度方案                           调度                           调度对象
                           调度方案                           限制                           限制对象
                           调度方案                           保护                          防洪保护对象
                           调度方案                           采用                           控制方式
                    触发对象?控制方式?限制对象                      控制要素                             属性
                            属性                           属性值                            属性值

















                                            图 9 迭代次数和完整度阈值对标签优化的影响

                  在同名关系标签的细化中,<控制要素>关系具有三类不同的头实体,根据头实体前缀细化为三类
              新的关系,分别与三类头实体对应。在内隐实体标签的生成过程中,<控制要素(触发)>以及<属性值>
              关系标签的完整度较低,经过大语言模型对尾实体的分类和排序后,选取 Top - 5的尾实体标签作为候
              选,经过人工审核后确定了新的尾实体标签。在语义关系标签的更名中,([属性],<属性值 >,[属

                                                                                                —  9 2 5 —
   42   43   44   45   46   47   48   49   50   51   52