Page 40 - 2023年第54卷第6期
P. 40
图 1 应急方案知识图谱构建流程
3.1 知识建模 知识建模即为本体建模,本体模型是知识图谱的骨架与核心。通过南水北调中线工程
应急方案本体建模,可以将应急方案以结构化知识的方式进行组织与管理,为应急方案知识图谱构建
提供底层数据模式,同时也是应急方案智能生成的基础。本文以南水北调中线工程 47个管理处的风
险防控手册以及一期工程总干渠工程险情抢险体系总体方案设计报告为数据源,结合自顶向下与自底
向上定义知识图谱本体以及本体间的关系,构建南水北调中线工程应急方案知识图谱本体模型,如
图 2。
图 2 南水北调中线工程应急方案知识图谱本体模型
3.2 知识抽取 根据领域资料不同特点,采取不同的方式实现知识抽取。考虑到应急方案领域资料大
多以半结构化表格为主,非结构化数据包含的实体关系稀少且分散,难于构建有效的学习样本,而基于
统计模型以及基于深度学习的方法需要大量标注数据,因此本文主要采用基于规则的方法完成知识抽取。
3.2.1 风险防控管理手册知识抽取 由于风险防控管理手册数据主要由半结构化数据构成,非结构化
数据包含的实例数据稀少,因此选用简单高效的人工提取结合正则模板方式实现知识抽取。部分实例
如表 1。
表 1 风险防控管理手册部分实体实例
实体类别 实体实例
工程 易县高填方渠道、釜山隧洞、荆轲山分水口、东楼山西沟排水倒虹吸
风险事件 管身冲刷失稳、过流能力减小、洪水浸泡渠坡、上部渠基破坏
地点 邓州市、陶岔县、南阳市、辉县
管理处 大宁管理处、西四环管理处、卫辉管理处、镇平管理处
3.2.2 险情抢险体系总体方案知识抽取 险情抢险体系总体方案主要为非结构化数据,但其具备清晰
的文本结构,且大多为短文本数据。因此利用 “关键词 + 短文本” 的方式抽取实体关系,部分实例如
表 2。
— 6 6 —
8