Page 21 - 2025年第56卷第9期
P. 21
(2)在决策制定方面,数据驱动的算法必须基于大量真实数据进行模拟和预演,通过丰富的案例
学习,AI 能够掌握水文过程中的动态变化,从而在新情境下提供优于传统经验的决策支持。因此,在
水库调度中,精细化的历史数据仿真是算法研究的关键前提,只有这样,AI 算法才能逐步学习不同情
景下调度策略的效果,从而为管理者提供更合理的建议。
(3)为扩展数据的应用,还需关注数据的多源整合及不同难度数据的优先利用。例如,同样是降
雨数据,再分析数据集或融合后的降雨产品由于较易获得和较高的准确性,可先被广泛应用于水文水
资源研究;而利用全球尺度的 AI 气象预报数据做流域尺度水文预报,则需要考虑不确定性因素和尺度
转换问题。有策略地整合各类数据,才能更实际地发挥其作用。
在具体的算法上,DL 的快速更新迭代为水文研究提供了丰富的技术选择,见表 2。近年来,神经网
络 从 多 层 感 知 机(Multi-Layer Perceptron, MLP)、 LSTM、 卷 积 神 经 网 络(Convolution Neural Network,
CNN)发 展 到 KAN 网 络(Kolmogorov-Arnold Networks)、 Transformer、 扩 散 模 型 、 图 神 经 网 络(Graph
Neural Network,GNN)等,为处理有不同特点数据的问题提供了多样选择 [66-69] 。例如,LSTM 在处理具
有长期依赖关系的时间序列数据(如降雨径流、水位变化等)时表现出色,能够有效捕捉水文时序数据
中的动态特征;而 Transformer 则凭借其自注意力机制,在处理长序列数据时具有更强的全局建模能
力,且有显著的计算效率优势。CNN 擅长提取空间特征和模式,适用于遥感信息提取、水体图像识别
等任务;而 GNN 则适合处理具有复杂空间结构和节点依赖关系的数据,如河网等系统的模拟。
表 2 不同的 DL 算法与训练模式
方法 特点 适用场景
LSTM 适合处理具有长期依赖关系的时间序列数据 适用于降雨径流等水文时序数据建模
CNN 擅长提取空间特征和模式 适用于遥感信息提取、水体图像识别等
算法 GNN 适合处理具有复杂空间结构和节点依赖关系的数据 适用于模拟具有拓扑关系的河网、管网等
凭借自注意力机制,在处理长序列数据时具有更强的
Transformer 适用于多变量、多尺度的水文预测任务
全局建模能力
迁移学习 适合跨区域知识迁移,减少新区域的数据需求 适用于少资料地区水文预报
利用来自不同模态的数据(如文本、图像、音频、时间序列等) 适用于报告文本、历史洪水记录、音视频
多模态学习
进行模型训练,捕捉更全面的信息,提高模型的性能和泛化能力 等非结构化数据的利用
同时预测多个相关水文变量,适用于综合
多任务学习 适合相关任务的联合学习,提升模型的整体性能和效率
性的水文分析
模式 适合数据不足、不精确或存在噪声情况下的模型训练,降低了对
弱监督学习 适用于众包观测数据的利用
高质量数据的需求
适合动态决策和策略优化问题,通过不断学习和调整策略实现最 适 用 于 优 化 水 库 调 度 策 略 和 水 资 源 管 理
强化学习
优决策 决策
适合不共享原始数据情况下,跨区域、跨机构的协同建模,以提 适用于水文数据无法共享情境下的大模型
联邦学习
高模型的泛化性能 训练
此外,迁移学习、多模态学习、弱监督学习、强化学习等不同学习模式也适用于水文领域的不同
场景。迁移学习可以支持大样本上学习规律在缺资料地区的利用 [70] ,多模态学习可以将非结构化数据
(如文本描述的调度规则或历史洪水记录)转化为结构化数据,以支持模型对多源信息的利用 [71] ;弱监
督学习则适合应用在众包观测数据上,通过调节不同数据源的权重来优化模型效果 [72] ;强化学习尤其
适用于决策制定,能够帮助 AI 系统在复杂环境中持续优化策略,逐步接近最佳决策 [36] 。
3.2.2 AI 与领域知识融合 数据为中心的目的是从数据中凝练知识,而已有的知识也能发挥重要作
用,将 AI 与领域知识充分融合,是接下来算法研究的重点。一方面,AI 能利用领域知识或发掘新知
识(AI for Water)。在特定子领域利用已有的 AI 方法来优化保真度较高的物理机制方程是最直接的方
— 1125 —

