Page 44 - 2023年第54卷第6期
P. 44

5.2.2 图谱结果展示 由于南水北调中线工程                              表 6 南水北调中线工程抽取关系统计
              应急方案知识 图谱 实体关 系数 量众 多,本文 以                       实体类型 1      关系类型       实体类型 2      关系数量
              部分实体关系进行图谱展示,如图 6。图中包含                             工程      存在风险事件       风险事件         13162
              信息:刁河渡槽地处邓州市,其所属 工程 为 渠                            工程      工程风险量值       风险量值         3567
              系建筑物,所属管理处为邓州管理 处;该 工 程
                                                                 工程      工程风险级别       风险等别         3567
              包含风险事件 地基 渗漏失 稳,地基渗 流失稳 属
                                                                 工程        所在地点         地点         3599
              于建筑物地基 失稳,其又 包含 建筑物 地基承 载
                                                                 地点       包含备料点        备料点          188
              能力不足以及集中渗漏导致地基水土流失两类
                                                                 工程        所属工程         工程         3600
              子风险事件;各类子 风险 事件 对应各 类风 险 因
                                                                 工程       所属管理处        管理处         3599
              子,风险事 件、风 险 因 子 分 别 对 应 控 制 措 施、
                                                                风险事件     存在风险因子       风险因子         8718
              预防措施;其中控制措施中涉及抢 险设备、抢
                                                                风险事件       导致后果       险情后果          411
              险物资两大类 实体,不同 风险 事件与 不同险 情
                                                                风险事件     相关风险事件       风险事件          564
              发生部位对应不同控制措施。由此将各类工程、
                                                                风险事件        发生于      险情发生部位         102
              风险事件、控 制措 施、抢 险 设 备、抢 险 物 资 等
                                                                 工程        包含部位      险情发生部位         102
              实体相关联。
                                                                风险事件     对应控制措施       控制措施         2918
              5.3 实体识别模型结果分析 该实体识别模型
                                                                控制措施       抢险设备         设备          92
              主要识别巡 查 文 本 中 的 工 程、桩 号、地 点、管
                                                                控制措施       抢险物资         物资          92
              理处、风险 量 值、风 险 事 件、风 险 因 子、险 情
                                                                 设备         存放于       存储位置          92
              发生部位共 8类实体。通过人工标 注数 据,切
                                                                 物资         存放于       存储位置          92
              分成独立不 同 的 训 练 集、验 证 集、测 试 集,基
                                                                风险因子     对应预防措施       预防措施         8487
              于模板利用数据增强方法扩充训练集和验证集,
              进而输入 BERT + BiLSTM+ CRF模型进行训练,模型训练结果如表 7。




























                                                 图 6 部分实体关系知识图谱展示
                  结果表明,该模型的 F1值达 96.21%,能够准确识别风险事件及其相关实体,并且该模型在以后
              图谱更新阶段,可以用于知识抽取,具有较高价值。
              5.4 实体相似度算法结果分析 本文设计基于 Word2Vec模型的 Jaccard实体相似度算法,手动构建风
              险事件相似度算法测试集,对比了单一 Word2vec模型与单一 Jaccard算法在此测试集上的效果。三组
              算法评测结果见表 8。




                     2
                —  6 7  —
   39   40   41   42   43   44   45   46   47   48   49