Page 66 - 2024年第55卷第9期
P. 66
水 利 学 报
2024年 9月 SHUILI XUEBAO 第 55卷 第 9期
文章编号:0559 - 9350(2024)09 - 1071 - 14
基于本体和自然语言处理的土石坝险情知识图谱
构建方法研究
1
2
1
张继勋 ,王虞清 ,焦修明 ,张玉贤 1
(1.河海大学 水利水电学院,江苏 南京 210098;
2.浙江省水利河口研究院(浙江省海洋规划设计研究院),浙江 杭州 310020)
摘要:土石坝在运维阶段可能受施工质量低、极端环境灾害等因素的影响,从而发生滑坡、裂缝、洪水漫顶等一
系列险情。现阶段与土石坝险情相关的大量数据存储分散、结构多样,难以直接转化为经验和知识得到有效利
用,快速指导险情处置。本研究针对土石坝险情领域提出了基于本体和自然语言处理(NLP)的知识图谱(KG)构
建方法,分别采用自顶向下与自底向上法,构建图谱的模式层和数据层。模式层围绕险情类型、险情原因、险情
措施三大概念,从土石坝结构、过程、环境、材料 4方面建立领域本体库,搭建 KG的概念结构。数据层通过数
据预处理、知识抽取、语义对齐等操作,运用 NLP对文本进行处理并根据语料的特征建立相应的提取规则,获得
数据层的具体知识内容。最后以三元组形式存储不同类型的实例和相互关系,运用 Neo4j图数据库进行土石坝险
情领域 KG的可视化表达及查询应用,使领域内分散数据向集成知识转化,为土石坝安全管理和险情处置提供技
术和理论支持。
关键词:土石坝险情;知识图谱;本体;自然语言处理
文献标识码:A doi:10.13243?j.cnki.slxb.20230800
中图分类号:TV641
1 研究背景
全国已建水库 95296座中,有小型水库 90290座,占比高达 94.75% [1] 。小型水库早期多由当地
农民投工投劳修建,建设标准偏低、工程隐患较多,存在管理条件差、老化失修等严重问题。其中小
型土石坝受自身结构及筑坝材料影响,抗冲刷能力差且容易渗漏 [2] ,成为水库除险加固的主要对象,
必须运用专业、科学的知识进行除险处置,以最大程度地避免人员伤亡与财产损失。从水库除险加固
的海量数据中抽取知识,进而服务于土石坝安全管理已成为水利信息化领域一个重要的研究内容。
知识图谱( KnowledgeGraph,KG)是由 Google于 2012年 5月提出的一种知识库,目的是增强其搜
索引擎的功能 [3] 。在 21世纪互联网信息领域的飞速发展下,KG除了起到知识库的作用外,还可被认
为是一种表示概念、实体及其相互关系的语义表达,它能将多源异构数据整合为结构化知识并以图的
方式向用户反馈 [4] 。因此,针对水利工程行业数据存储分散、结构多样的问题,构建 KG能有效地对
数据进行利用,更好地转化、组织和管理水利工程知识。近年来,KG在道路交通、洪涝分析、煤矿
安全等领域得到了一定程度的发展。刘广宇等 [5] 采用基于本体的方法构建了公路工程安全领域 KG,
并将知识模型与建筑信息模型( BIM)联动以实现智能化应用;沈伟豪等 [6] 融合了洪涝灾害领域内影
像、文本等多元异构数据,建立了多模态 KG以用于受灾分析及救灾决策中;赵丽丽 [7] 构建了煤矿安
收稿日期:2023 - 12 - 20;网络首发日期:2024 - 09 - 24
网络首发地址:https:??link.cnki.net?urlid?11.1882.TV.20240923.1552.002
基金项目:浙江省水利河口研究院院长科学基金项目(ZIHE21Z004);云南省重大科技专项计划项目(202102AF080001)
作者简介:张继勋( 1974 - ),博士,副教授,主要从事水工结构地下工程与水利信息化研究。E - mail:zhangjixun@hhu.edu.cn
通信作者:王虞清(2000 - ),硕士生,主要从事水工结构工程、水利信息化研究。E - mail:krystal@hhu.edu.cn
0
— 1 7 1 —