Page 20 - 2025年第56卷第9期
P. 20

雷达测站,但雷达数据直接应用于防洪需求仍面临一定挑战,一方面是许多气象雷达未能完全满足水
              利需求,另一方面是后续算法处理流程尚不完善。因
              此,如何整合硬件制造与应用端需求,建立满足水利
              需求的监测体系是关键。如图 3 所示,监测设备的设计
              及使用周期包括“研发、测试、使用及维护”4 个阶
              段,在供给侧,生产者在研发与测试阶段需充分考虑
              需求侧的使用端对设备性能、操作简便性和维护需求
              的具体要求。为此,供需双方应通过广泛的交互机制,
              根据实际需求开发专项设备,以实现硬件设计与应用
              需求的精准匹配。直接面向终端需求研发可望进一步
                                                                             图 3 监测设备设计及使用周期
              提升监测设备在水利行业的实用性和效能。
                  (2)某 些 监 测 设 备 成 本 较 高 , 难 以 支 撑 大 规 模 布
              设,而水文水资源研究对象通常尺度大范围广。例如,水质监测方面,现阶段的数据采集成本普遍较
              高。低成本传感设备的研发和应用,能为广域监测网络的建立提供重要补充。基于 Arduino 等开源硬
              件和 3D 打印技术,可以构建价格低廉的传感设备                      [54] 。例如,基于开源硬件项目 OpenOBS            [55] ,Lang⁃
              horst 等 [56] 在成本仅为传统设备十分之一的条件下,成功在几十公里的河流上布设了十多个水质传感
              器,测量了温度、压力和浊度,实现了对河流水质的长期高分辨率监测,且表现出与商用设备相近的
              精度。又因其低成本和易于部署的特性,适合在偏远或资金有限的地区使用,能够显著提升观测的覆
              盖率和实时性。同时,低成本监测与大型监测设备一致,也应遵循图 3 所示的 4 个阶段,以保障研发
              设备能更高效服务于生产实际。另一方面,通过机会感知、众包等近乎零建设成本的手段则能进一步
              补充监测。例如,可以利用通讯基站信号衰减监测降水                          [57] 或从社交媒体提取洪水信息           [58] ,以弥补传统
              监测手段在特定区域的不足。尽管这些数据的质量不及标准化观测数据,但通过多源数据融合等手
              段,有望形成真正的泛在感知。
                  (3)异常和不规则数据可能会使 AI 学习错误规律,因此数据清洗是确保信息质量的关键步骤。气
              象水文等领域已有不少研究关注数据异常处理                      [59] ,AI 算法也常用于数据清洗        [60] ,将两者结合有望提供
              更可靠的数据清洗方案。在数据共享方面,对于非敏感数据,可以推动标准化数据集的构建和公开共
              享;对于敏感数据,可采用联邦学习等方法在保护隐私的前提下进行模型共享与训练。联邦学习不仅
              能保障数据安全,还支持多方联合建模,这一方法在水利行业已有研究应用                                    [61] 。
              3.2 算法 —— AI 与领域知识双驱动 在大数据与小数据并存的局面下,AI 驱动的水文水资源研究需
              要有效整合 AI 与领域知识。不仅需要进一步推进以数据为中心的研究,充分发挥 AI 算法潜力                                        [62] ;而
              且应结合领域知识,将 AI 与现有的水文水资源理论有机融合,既利用已有的理论弥补数据不足,也通
              过大数据驱动形成新理论            [63] 。通过数据和知识的双驱动,为专业领域研究提供更全面的智能支持。
              3.2.1 以数据为中心 算据部分主要讨论了数据的特点、获取和处理方式等,本节从算法的角度探讨
              如何充分利用数据资源,发挥 AI 在规律挖掘和决策支持中的潜力。
                  (1)强调以数据为中心,即突出数据质量在模型表现中的核心作用——优质且具有代表性的数据
              往往比更复杂的算法更容易带来显著的成果                     [64] 。以流域尺度水文规律挖掘为例,广泛的数据覆盖与代
              表性对于实现共性规律的学习至关重要。当前的大样本水文数据集在流域数量和空间覆盖上具备较好
              基础,但流域间的气候、地形、土地利用等特征差异较大,如何确保数据能够充分代表多样性,仍是
              关键挑战。因此扩展流域多样性,探索是否有规模效应是需要开展的工作。此外,水循环不仅仅是降
              水和径流之间的关系,而且现有驱动因子多为气象变量,可能难以全面描述复杂水文过程,这会制约
              AI 在降雨径流关系上的表达。为此,通过引入更多关联变量,增强变量完备性,不仅能完善对物理过
              程的表达,还可望借助多变量的相关性,实现数据多变量对数据少变量的增强,在数据不平衡的条件
              下,增强对数据不足变量的预测能力                 [65] 。

                — 1124   —
   15   16   17   18   19   20   21   22   23   24   25