Page 44 - 2023年第54卷第6期
P. 44
5.2.2 图谱结果展示 由于南水北调中线工程 表 6 南水北调中线工程抽取关系统计
应急方案知识 图谱 实体关 系数 量众 多,本文 以 实体类型 1 关系类型 实体类型 2 关系数量
部分实体关系进行图谱展示,如图 6。图中包含 工程 存在风险事件 风险事件 13162
信息:刁河渡槽地处邓州市,其所属 工程 为 渠 工程 工程风险量值 风险量值 3567
系建筑物,所属管理处为邓州管理 处;该 工 程
工程 工程风险级别 风险等别 3567
包含风险事件 地基 渗漏失 稳,地基渗 流失稳 属
工程 所在地点 地点 3599
于建筑物地基 失稳,其又 包含 建筑物 地基承 载
地点 包含备料点 备料点 188
能力不足以及集中渗漏导致地基水土流失两类
工程 所属工程 工程 3600
子风险事件;各类子 风险 事件 对应各 类风 险 因
工程 所属管理处 管理处 3599
子,风险事 件、风 险 因 子 分 别 对 应 控 制 措 施、
风险事件 存在风险因子 风险因子 8718
预防措施;其中控制措施中涉及抢 险设备、抢
风险事件 导致后果 险情后果 411
险物资两大类 实体,不同 风险 事件与 不同险 情
风险事件 相关风险事件 风险事件 564
发生部位对应不同控制措施。由此将各类工程、
风险事件 发生于 险情发生部位 102
风险事件、控 制措 施、抢 险 设 备、抢 险 物 资 等
工程 包含部位 险情发生部位 102
实体相关联。
风险事件 对应控制措施 控制措施 2918
5.3 实体识别模型结果分析 该实体识别模型
控制措施 抢险设备 设备 92
主要识别巡 查 文 本 中 的 工 程、桩 号、地 点、管
控制措施 抢险物资 物资 92
理处、风险 量 值、风 险 事 件、风 险 因 子、险 情
设备 存放于 存储位置 92
发生部位共 8类实体。通过人工标 注数 据,切
物资 存放于 存储位置 92
分成独立不 同 的 训 练 集、验 证 集、测 试 集,基
风险因子 对应预防措施 预防措施 8487
于模板利用数据增强方法扩充训练集和验证集,
进而输入 BERT + BiLSTM+ CRF模型进行训练,模型训练结果如表 7。
图 6 部分实体关系知识图谱展示
结果表明,该模型的 F1值达 96.21%,能够准确识别风险事件及其相关实体,并且该模型在以后
图谱更新阶段,可以用于知识抽取,具有较高价值。
5.4 实体相似度算法结果分析 本文设计基于 Word2Vec模型的 Jaccard实体相似度算法,手动构建风
险事件相似度算法测试集,对比了单一 Word2vec模型与单一 Jaccard算法在此测试集上的效果。三组
算法评测结果见表 8。
2
— 6 7 —