Page 42 - 2023年第54卷第6期
P. 42

检文本中的通用语义特征并生成字向量;通过 BiLSTM 层使字向量携带巡检文本上下文语义信息;利
              用全连接层将字向量转换成水利实体标签;最后利用条件随机场对水利标签进行修正,输出最优的水
              利实体标签序列。















































                                          图 4 结合险情信息的 BERT + BiLSTM+ CRF模型架构


              4.2 多特征融合的实体对齐 从水利工程险情巡检文本中抽取的风险事件往往不完全相同于图谱中
              的风险事件,存在缩略词、同义词等现象,例如 “恐怖袭击” 对应于缩略词 “恐袭”, “排水孔淤
              堵” 对应于同义词 “排水孔堵塞” 等。考虑到不 同工程、不同 险 情 发生 部 位 的风 险事 件对 应控制
              措施的不一致性,设计基于 Word2Vec模型的 Jaccard实体相似度算 法, 融 合 巡 检 文 本 中 工 程、 险
              情发生部位、风险事件三类实体特征,实现巡检文本风险事件对齐于图谱风险事件。其中部分 风
              险事件实体对齐情况如表 3,通过输入巡检文本中的风险 事 件, 对 齐 图 谱 中 匹 配 度 最 高 的 5个 风
              险事件。
                                             表 3 部分图谱风险事件实体匹配情况

                   风险事件          匹配风险事件 1       匹配风险事件 2      匹配风险事件 3        匹配风险事件 4         匹配风险事件 5
                     恐袭            恐怖袭击          无人机袭击         恐怖劫持事件          控制系统故障          排水渡槽漫溢
                 泥石流淤塞渠道           渠道堵塞           灌渠淤积          管道淤堵           下穿管道淤堵          阀井淤泥堵塞
                 大规模滑坡堵塞         挖方渠道堵塞         渠道边坡塌滑         渠道边坡开裂       边坡开裂滑塌钢管渗漏         堤坡塌滑失稳
                渠坡防渗体系破坏         下穿管道渗漏        渠堤一级边坡渗漏        裹头边坡渗漏            钢管渗漏          渠坡冲刷破坏
                坡面保护措施损坏         护坡裂缝破坏        运维养护施工不当        渠坡冲刷破坏          渠堤渗流破坏          附属设施破损

                —  6 7  —
                     0
   37   38   39   40   41   42   43   44   45   46   47