Page 68 - 2021年第52卷第8期
P. 68
水 利 学 报
2021 年 8 月 SHUILI XUEBAO 第 52 卷 第 8 期
文章编号:0559-9350(2021)08-0948-11
水利综合知识图谱构建研究
段 浩,韩 昆,赵红莉,蒋云钟,李 豪,毛文山
(中国水利水电科学研究院,北京 100038)
摘要:基于对水利知识特点的分析,提出了水利综合知识体系的描述方法,包括水利知识的定义、组成与关联;
构建了水利知识图谱的构建框架和关键技术体系,以水利行业结构化业务数据的实体关系转换为基础,采用双向
长 短 期 记 忆 神 经 网 络(Bi-directional Long Shot-Term Memory Neural Network, BiLSTM)与 条 件 随 机 场(Conditional
Random Fields,CRF)方法识别半结构化、非结构化学科知识文本以及互联网数据中的水利实体,使用模式匹配
和共现网络分析方法抽取各实体间关系,对涉水对象及其属性进行补充,基于风险最小化的最小风险映射模型
(Risk Minimization based Ontology Mapping,RiMOM)进行了多源异构水利实体的融合,实现了涉水对象与水利学
科知识的融合与关联,形成水利综合知识的建模和表达。在图谱构建过程中,累计抽取水利实体 136 万个,构建
实体关系 300 余万条,抽取的水利实体对象的标注准确率在 80%以上。基于该图谱可实现水利知识的跨域查询与
检索,学科图谱与水网图谱间关系查询,挖掘不同水利实体间的隐含关系,提高水利知识检索的效率和知识挖掘
发现的能力。
关键词:知识图谱;水利综合知识;水资源管理;学科知识;BiLSTM;CRF
中图分类号:TP391 文献标识码:A doi:10.13243/j.cnki.slxb.20200924
1 研究背景
[1]
知识图谱(Knowledge Graph)是一种通用语义知识形式化描述框架 ,Google 公司于 2012 年首次
提出这一概念,用于提高信息资源的搜索能力。这项技术主要是利用可视化技术描述知识资源及其
载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系,为人们提供了一种高效地组
[2]
织、管理和分析海量数据的方法 ,从而更加便捷地获取知识。
随着社会服务智能化需求的提升,知识图谱技术正得到快速发展,按知识图谱的构建过程又可
分为知识抽取、知识融合、知识应用等内容。知识抽取是从海量数据中获取有效信息的过程,包括
[3]
对实体、关系及属性的抽取,其中实体抽取的方法主要包括基于规则 、机器学习和面向海量数据的
[4]
抽取;关系的抽取包括基于模板、监督学习和无监督学习的抽取方法 等;知识融合主要是对从多源
数据抽取的知识进行处理,可包括实体的融合及跨域图谱的融合 [5-6] 等。
与此同时,面向特定领域的知识图谱应用逐步发展,被用来组织、分析和挖掘领域内的知识。
起初,学者们多使用通用知识图谱技术进行专业文献的计量学分析 [7-9] ,以获得相关专业知识结构框
架及研究脉络,分析研究热点及未来发展方向。随后多个专业领域开展了专业知识图谱构建技术与
应用的研究,如余建明等 [10] 、刘津等 [11] 和李智星等 [12] 运用知识图谱技术研究了电力领域专业术语
关系以及电网企业运营指标关系,提出了电力行业的面向智能调控领域知识图谱构建方法;吴雪
收稿日期:2020-11-08;网络首发时间:2021-04-19
网络首发地址:http:/kns.cnki.net/kcms/detail/11.1882.TV.20210419.1508.001.html
/
项目资助:中国工程科技知识中心水利专业知识服务系统(CKCEST-2020-2-9)
作者简介:段浩(1989-),博士,工程师,主要从事遥感水文、水利信息化研究。E-mail:dhao@iwhr.com
通讯作者:赵红莉(1973-),教授级高级工程师,主要从事水文水资源、水利信息化及水资源遥感研究。
E-mail:zhaohl@iwhr.com
— 948 —