Page 41 - 2023年第54卷第6期
P. 41
表 2 险情抢险体系总体方案部分实体实例
实体类别(关键词) 实体实例(短文本)
设备 反铲、人工辅助作业工具;螺旋钻机、注浆机、人工辅助作业工具
物资 塑料防水膜,水泥、天然砂石料;塑料防水膜、钢筋、水泥、天然砂石料
存储位置 塑料防水膜存放在管理处抢险物资仓库,水泥、天然砂石料当地采购
险情后果 严重变形形成滑坡隐患;小规模滑坡形成溃口隐患;大规模滑坡导致渠道堵塞
险情发生部位 渠坡坡顶;渠坡中部;一级马道附近;建筑物外侧填土坡
3.3 知识融合 应急方案领域资料主要存在实例共指现象,在图谱构建过程中需要进行共指消解,从
而得到规范统一的描述。考虑到融合的实例大多以词语形式出现,并且在抽取的知识中基本包含所需
映射的实例,因此本文基于链接的方式实现实例的共指消解。南水北调中线工程应急方案知识图谱属
于垂直领域知识图谱,数据源稀缺,本图谱仅考虑对工程、风险事件、风险因子三种实体进行实体融
合。以 “刁河渡槽地基渗漏失稳” 为例,抽取所得风险事件实体 “渗漏”,经过上下文实体指代扩充
成 “地基渗漏”,通过候选实体生成得到一组实体 “集中渗漏、渠道渗漏、管涌等”,最后通过候选
实体排序,融合等价于图谱中的风险事件实体 “集中渗漏”。
3.4 知识存储 考虑到南水北调中线工程应急方案知识图谱数据规模较小,下游应急方案生成任务对
关系表达要求较高,并且图数据库对比关系型数据库具有遍历效率较高、关系表达能力强等特点,因
此本研究采用实体关系查询效率高的 Neo4j原生图数据库来实现知识存储。将知识抽取、知识融合得
到的实体关系整理成三元组格式 〈实体 1,关系,实体 2〉 并存储,如 〈管涌,存在风险因子,蚂蚁
鼠洞危害〉 〈张庄大桥,风险量值,4.0〉 等。
4 南水北调中线工程应急方案智能生成
应急方案本质为一种知识的组织形式,其生成离不开知识图谱的结构化知识。基于南水北调中线
工程应急方案知识图谱,提出面向工程巡检文本的应急方案智能生成方法,主要流程如图 3。首先对
巡检文本进行实体识别,识别出险情相关的关键实体,如工程、风险事件、险情发生部位等;其次进
行实体对齐,将识别的风险事件实体与知识图谱中的风险事件进行匹配;最后基于设计的应急方案模
板,利用图谱检索推理技术 [30 - 31] 智能生成应急方案。
图 3 南水北调中线工程应急方案智能生成流程
4.1 险情相关实体识别 由于巡检人员大多为非专业人士,缺乏水利领域专业知识,导致每个巡检人
员提交的巡检文本存在较大差异,对同一个风险事件也会有不同描述,因此,巡检文本中会存在大量
多词同义现象。因此首先要对巡检文本进行语义分析,识别文本中的风险事件、工程等关键险情相关
实体。考虑到水利专业领域词典稀缺以及应急方案标注数据不足,基于深度学习方法,构建 BERT +
BilSTM+ CRF模型识别险情文本实体,其具体结构如图 4。以输入险情信息 “邓州高填方渠道衬砌板
裂开” 为例,模型最初通过编码层将文本转化为机器可识别的数字编码列表;传入 BERT层,抽取巡
— 6 6 9 —