Page 19 - 2025年第56卷第9期
P. 19

数据的可靠性和准确性。另一方面,小数据虽然通常具有较高的精度和时效性,但其在空间覆盖和样
              本量上的局限,使得其在大尺度流域水文研究中的应用面临挑战。因此,推进数据建设需要在大数据
              和小数据之间找到平衡,既要充分整合可利用大数据,也要重视高精度优势小数据的积累,构建更全
              面和高效的水文感知体系。
              3.1.1 大数据 对地观测数据的海量积累为水文水资源研究提供了宝贵的信息资源,如表 1 所示。
                  (1)遥感数据为下垫面基础信
                                                                     表 1 水文大数据情况
              息的获取提供了丰富信息源,适
                                                      数据类型               数据举例                 数据使用
              用于需长期积累和广域覆盖的需
                                                      静态数据            DEM 等下垫面数据         提供基础信息辅助建模
              求,如流域的地形地貌和河湖形
                                                          历史数据    ERA5-Land、MSWEP 等数据集 为 AI 训练提供大数据条件
              态等。这类数据时效性相对较差,
                                                   时序
              但能为水文水资源研究提供关键                       数据    近实时数据     IMERG、GSMaP 等遥感数据     为无资料流域提供支持
              数据支撑。例如,高精度 DEM 在                           预报数据        AI 气象预报产品等             延长预见期
              洪水建模中具有重要作用,结合
              数字影像处理和 DL 可以进一步提升地形数据的精度                       [41] 。此外,历史洪水信息、人口分布和交通网络
              等社会经济数据,为灾害预判和历史复盘提供了基础支持                           [42] 。
                  (2)不同时域范围的大量时空序列数据有不同价值。历史数据方面,高质量的水文气象数据集经
              过数据同化和融合处理,为大数据条件下的气象和水文预报带来了新机遇。ERA5-Land 再分析数据
              集 [43] 和 MSWEP 降水数据   [44] 等,通过整合多年的模型预测和观测信息并经过后处理,提供了高时空分
              辨率的全球气象水文数据。这类数据在 AI 模型训练中展现出巨大价值。例如,气象领域的 AI 预报模
              型普遍基于 ERA5 数据集构建,表现出比传统数值预报更好的效果。同样的思路也可应用于水文预报
              训练模型,帮助 AI 更准确地捕捉大尺度水文变化规律。实时数据方面,尽管遥感数据通常难以完全实
              时提供信息,但近实时遥感数据依然可以为无资料流域的观测和预测提供及时支持,特别是在跨界河
              流管理中,这类数据在缺乏地面监测的区域有重要作用                          [45-46] 。例如,IMERG  [47] 和 GSMaP [48] 等全球降水
              观测产品可提供小时级降水数据,延迟仅数小时,能用于短期水文预报和灾害预警。在预报数据方面,
              随着 AI 技术在气象预报中的突破性进展,全球范围的气象预报水平在不断提升,提前数小时至数天提
                                                                                                  [8]
              供降水、气温等变量的预测数据可望为延长水文预报预见期和提高决策响应速度提供重要价值 。
                  (3)随着微纳卫星(CubeSat)的增多,遥感观测向更高时空分辨率发展,为广域、连续的水文水资
              源监测带来了新的可能。例如,Planet 公司的 CubeSat 技术已使流量观测达到了全球范围的日尺度高分
              辨率,数据量可达传统卫星形成的虚拟站点的数倍                         [49] 。我国的水利专用卫星也已开始规划和实施                  [50] ,
              未来将为各类水文水资源应用提供更多信息,推动大数据资源的丰富与应用。
                  然而,大数据的应用也伴随着许多挑战。首先,数据的庞大规模和复杂性对存储和快速读写提出
              了较高要求。随着数据量的增加,若缺乏有效管理,大数据可能转变为负担。处理和分析大数据所需
              的计算资源和技术支持也在不断增长,这对研究机构的硬件设施和技术能力提出了更高要求。此外,
              相较于地面观测数据,遥感数据的质量可能不够高,基于这些数据训练的 AI 模型可能学习到不准确的
              规律,从而影响模型的可靠性。
              3.1.2  小数据  遥感数据因其时延和现阶段精度水平,还无法替代地面观测,且和直觉相悖的是,由
              于校准等需要,遥感观测的增多并未减少对地面观测的需求                             [51] 。地面观测仍是现阶段更为可靠的数据
              来源,对有实时数据需求的研究和应用来说,更是如此。因此,仍需进一步完善地面数据感知网络。
                  (1)我国在基础监测设施的制造能力上处于世界领先地位,相关生产厂商众多。然而,由于监测
              设备的生产者和使用者之间存在专业背景差异等因素,供需两端可能存在不匹配的问题。以流域防洪
              为例,雨水情监测预报有“三道防线”                   [52] ,其中,雷达系统因其能测云中雨属于第一道防线。一些发
              达国家已建立了完善的雷达监测网络并应用于防洪等方面,例如美国的 MRMS 雷达系统能够以 1 km、
              2 min 的高时空分辨率实时提供全国降雨数据,常被用作地面观测真值                               [53] 。我国目前虽已建设了较多

                                                                                               — 1123  —
   14   15   16   17   18   19   20   21   22   23   24