Page 86 - 2024年第55卷第1期
P. 86

识的建模和表达,构建了水利综合知识图谱,基于该图谱实现水利知识的跨域查询与检索。这些水利
              知识图谱实现了对大规模复杂水利数据的整合与管理,但缺少对水利细分学科领域的知识组织与应用
              研究,缺乏足够多的应用场景和实用案例,知识图谱对水利领域智能化知识服务的支撑能力尚未得到
              充分挖掘,同时,在水利领域的命名实体识别中,如何处理稀疏样本和识别长尾实体等问题还需要深
              入研究   [15] 。
                  针对以上问题,本研究以水文模型方案推荐为知识应用场景,提出水文模型相关知识的组织模
              型,建立以文献文本为数据源、以 BidirectionalEncoderRepresenstationsfrom Transformers(BERT)模型
              为核心的多策略知识抽取和融合方法,构建水文模型知识图谱实例,为模型方案推荐等知识服务提供
              支撑,为水利知识图谱构建提供方法和应用场景参考。


              2 水文模型知识图谱构建框架与流程


                  水文模型是对自然界复杂水文现象与过程的一种综合近似描述                              [16] ,在水文测报、水资源调度、防
              汛抗旱等业务应用中发挥重要作用。在应用水文模型时,需要先了解水文模型的适用条件、参数取值
              的经验与已有应用案例精度等知识。这些知识大量蕴含于非结构化文本(期刊文献、研究报告等)中,
              一般采用人工查阅结合经验分析的方式得到,对于知识的获取速度慢,且无法形成对这类零散知识的
              高效管理。水文模型知识图谱的构建可以从海量文本中快速准确地提取出水文模型知识,并对其进行
              高效合理的管理、共享与应用              [17] 。
                  本文面向水文模型推荐等应用场景,构建水文模型知识图谱并实现图谱的应用。知识图谱的构建
              方式大体可以分为自顶向下与自底向上两种                     [18] 。自顶向下的构建方式指预先确定知识的组织架构,再
              根据知识模型抽取数据填充知识库,较依赖于人工参与。相反,自 底 向 上 的 构 建 方 式 指 先 进 行 数 据
              的抽取,再对抽取的数据进行归纳,向上合并形成本体与关系模式,但缺少在专家经验的指导下定
              义的明确框架与标准,抽取的 结果与 领域 学科知 识体系 匹 配 度难 以 保 证,不 适 用 于 垂 直 领 域 图 谱
              构建  [19] 。
                  水文模型知识图谱属于水利垂直领域知识图谱,专业性强,有更严格的层次结构与表达形式,因
              此本文采用自顶向下的方式构建知识图谱。水文模型知识图谱构建框架与流程如图 1所示,主要包括
              需求分析与本体建模、数据获取与处理、知识抽取与融合、知识存储 4个部分。
                  ( 1)需求分析与本体建模。根据水文模型方案检索与推荐场景的知识需求,确定需采集的知识边
              界及其中的概念与关系,构建知识模型,确定水文模型本体及关系结构。
                  ( 2)数据获取与处理。采集水文模型相关的非结构化文本,作为知识抽取与融合的基础语料;对
              文本进行清洗去噪、文本分句、人工标注等一系列处理,得到用于知识抽取的数据集。
                  ( 3)知识抽取与融合。构建知识抽取策略,综合深度学习模型与模式识别等多种方法,进行水文
              模型命名实体识别与实体关系抽取,进行知识融合与加工,得到水文模型实体关系。
                  (4)知识应用。确定数据库类型与结构,将抽取融合后的实体关系数据转换为相应的数据结构导
              入数据库中,实现知识 存 储 与 更 新;数 据 库 可 与 服 务 平 台 连 接,支 撑 知 识 查 询 检 索、分 析 推 荐 等
              应用。

              3 图谱构建关键技术与方法


              3.1 本体建模 本体是描述特定领域中概念及其相互之间关系的概念模型                                   [20] 。通过本体层实现对领
              域知识体系的描述并规范数据之间的关系,便于计算机与人类理解。本文采用六步 “循环法”                                            [21] 构建
              水文模型知识图谱本体的主要过程如下:
                  (1)需求分析。根据场景知识需求,确定知识图谱的知识边界,为水资源调度、防洪抗旱等业务
              推荐水文模型方案,所涉及的知识包括已有水文模型的适用条件、已有应用及精度等内容。

                                                                                                 —  8 1 —
   81   82   83   84   85   86   87   88   89   90   91