Page 50 - 2024年第55卷第8期
P. 50

好。通过分析精确率可以看出,单独训练的模型会加入更多的错误抽取结果,导致精确率下降;但是
              从召回率来看,单独训练的模型使得召回率得到了较大的提升,更有利于召回完整的调度方案。
                  总的来说,针对每组关系单独训练的 IE模型的抽取效果要优于整体调度方案的 IE模型,虽然抽
              取结果中噪声增加,但是对调度方案中各个部分关系信息的召回率有较大的提升。
              4.2.3 知识图谱可视化及应用 Neo4j能够以结点和边的形式存储实体以及实体之间的关系,并且允
              许使用 Cypher进行关系链的查询。为了将模型抽取得到的信息进行可视化,使用 Neo4j进行了防洪调
              度方案的可视化存储。相较于使用记录和字段形式存储的方式,调度规则的存储粒度局限于一个完整
              的短句;而通过标签优化后的知识图谱可以将存储粒度细致到水利对象的单个属性,实体信息更为细
              致、关系更为复杂。知识图谱形式的调度规则直观地存储数据关系,便于表示复杂关系并整合其他数
              据源进行联动,这对洪水预报和防洪调度工作具有重要价值。此外,知识图谱可以利用逻辑推理发现
              数据中的隐含关系,进一步增强洪水预测和防洪调度的准确性。
                  在本文防洪调度知识图谱中,可以根据特定的 Cypher语句进行调度方案的查询,并返回特定方案
              触发时机所触发的调度方案关系链。如图 11所示,调度规则原文为: “牛头山水库:(2)洪水初期,
              库水位低于 53.12m时,当大田港闸外灵江水位低于 3.2m 时,且大田港闸上水位未超警戒时,水库
                                         3
              控制最大泄流量不超过 200m ?s下泄;” 在图中,第一行 3个结点从左到右分别为[方案触发时机]
              (洪水初期…警戒时)、[调度方案](水库控制…下泄)、[调度对象](牛头山水库);第二行红色结点
              为[触发对象](牛头山水库、大田港闸、大田港闸外灵江),粉色结点为[控制方式];第三行蓝色结
              点为[控制要素],橙色结点为[事件]。原文本中的内容都被正确地标注为了对应的标签,并构建了
              正确的关系。在图谱结果中,通过三个触发对象的控制要素进行匹配,能够关联到对应的方案触发时
              机;方案触发时机获得对应的调度方案后,再通过调度方案获取需要调度的调度对象;最后,可以得
              到调度对象需要采取的控制方式以及相应的限制。所有的数值信息通过属性的方式存储在控制要素的
              节点中。上述内容所构成的防洪调度标注数据集以及知识图谱,能够作为防洪调度知识工程未来工作
              的基础,为后续工作提供参考。




























                                                    图 11 防洪调度规则实例


              5 结论及展望


                  从防洪调度规则中抽取相关的调度信息并进行结构化存储,对于防洪调度系统以及防洪调度知识
              库的构建具有重要意义。但由于防洪调度规则的区域属性,难以获得统一标签的大型标注数据集,针
              对防洪调度的信息抽取工作难以开展。为此,本文提出一种大语言模型辅助的非完美标签优化方法,

                —  9 2  —
                     8
   45   46   47   48   49   50   51   52   53   54   55