Page 47 - 2024年第55卷第8期
P. 47
模型专门处理一类实体和关系,最终可以提高整个结果的识别效果。
4 实例分析
4.1 防洪调度知识图谱的数据集构建方法
4.1.1 本体设计 防洪调度方案是指导防洪工程或防洪系
统运用的主要依据,通常包括原则要求、基础资料、防御
方案、实施措施等。这些防洪调度规则通常包含在官方文
档的句子 中,因 此 为 了 能够 从文本 中抽 取出防 洪 调 度 规
则,在相关领 域 知 识 的 帮助 下设计 了防 洪调度 规 则 的 本
体,以供标签设计以及信息抽取的需要。本文工作主要依
据和处理的调度方案本体概念 [22] ,如图 8所示。
按照直接映射的方式,根据本体直接生成了对应的实
体关系标签,如表 1所示。
4.1.2 实体关系标签的优化 迭代次数以及完整度阈值的
设置对于实体关系标签的优化效果以及效率至关重要。如 图 8 防洪调度方案本体
图 9所示,我们对迭代次数和完整度阈值的设置进行了不同参数的对比。从图中的趋势可以看出,分
别在迭代次数达到 4次、完整度阈值达到 0.7时,实体关系的完整度改变不再显著。因此在防洪调度
规则的标签优化实践中,将迭代次数设置为 4,将完整度阈值设置为 0.7,这两个选择共同实现了标签
优化的效果和效率的平衡。
表 1 直接映射获得的标签三元组
头实体类型 关系类型 尾实体类型
方案触发时机 触发 调度方案
方案触发时机 关联 触发对象
调度方案 调度 调度对象
调度方案 限制 限制对象
调度方案 保护 防洪保护对象
调度方案 采用 控制方式
触发对象?控制方式?限制对象 控制要素 属性
属性 属性值 属性值
图 9 迭代次数和完整度阈值对标签优化的影响
在同名关系标签的细化中,<控制要素>关系具有三类不同的头实体,根据头实体前缀细化为三类
新的关系,分别与三类头实体对应。在内隐实体标签的生成过程中,<控制要素(触发)>以及<属性值>
关系标签的完整度较低,经过大语言模型对尾实体的分类和排序后,选取 Top - 5的尾实体标签作为候
选,经过人工审核后确定了新的尾实体标签。在语义关系标签的更名中,([属性],<属性值 >,[属
— 9 2 5 —