Page 132 - 2025年第56卷第10期
P. 132

三处位置的积水模拟结果与估测值,结果显示,估测值与模拟值的绝对误差均不超过 3.5 cm,相对误
              差不超过 20%。模拟的误差和不确定性主要来源于概化管网数据、地面高程数据与实际情况之间的差
              异,以及地表径流计算网格的空间分辨率限制。此外,图中对比了两处未积水区域(无积水区域 1、
              2),结果显示,SERGHEI-SWMM 对未积水区域的模拟结果同样具有较高的准确性。结合图 5(b)分析
              可知,积水区域普遍位于地面高程较低的位置,表明地形因素是导致该区域积水事件的主要原因。在
              时间步长方面,上述强降雨洪涝模拟均基于 Nvidia L40 型号 GPU 进行加速运算,地表径流模块时间步
              长在 0.1 ~ 0.2 s 范围内,管道排水模块时间步长在 1 ~ 12 s 之间。

              4 模型并行性能和可移植性验证


                  研究表明,基于 Kokkos 异构编程框架的 C++计算模型可在多种超算平台上高效运行,表现出良好
              的可移植性和并行性能           [22,24] 。为系统评估 SERGHEI-SWMM 在不同硬件架构上的性能,本节以“普拉
              桑”台风引发的强降雨洪涝过程作为研究对象,分别在不同 CPU 和 GPU 设备上对其可移植性和并行性
              能进行测试分析。本研究使用的测试环境包括戴尔工作站(以下简称“工作站”)和同济大学科学计算

              中心的高性能计算平台(以下简称“超算平台”)。其中,工作站配置的 CPU 和 GPU 分别为:Intel
              Core i9-12900K(16 核 24 线 程 , 3.2 GHz 主 频 , 最 大 睿 频 5.2 GHz)和 Nvidia RTX A5000(24 GB 显 存 ,
              768 GB/s 带宽和 8192 个 CUDA 核心);超算平台配置的 CPU 和 GPU 分别为:Intel Xeon 9468(48 核 96 线

              程 , 2.1 GHz 主 频 , 最 大 睿 频 3.5
                                                                 表 5 工作站和超算平台环境参数
              GHz)和 Nvidia  L40(48  GB 显 存 ,
                                                      配置类别                 工作站                  超算平台
              864 GB/s 带宽及 18 176 个 CUDA 核
              心)。测试过程中,各平台均使用                          CPU             Intel Core i9-12900K   Intel Xeon 9468
              单个 GPU 进行计算,CPU 线程数                      GPU              Nvidia RTX A5000       Nvidia L40
              则 根 据 设 备 性 能 特 点 进 行 调 整 ,             操作系统        Windows Subsystem for Linux(WSL)  Linux
              具体测试环境参数如表 5 所示。                        编译器                  gcc 11.4.0           gcc 8.5.0
                                                     Kokkos 版本                      4.3.00
                  图 9 对比了 SERGHEI-SWMM
              在不同类型 CPU 上的模拟时间与                   OpenMP/CUDA 版本           4.5/12.0             4.5/11.8
              加 速 比 , 其 中 , T 表 示 总 计 算 耗
              时,T 和 T        分别表示地表径流模块和管道排水模块的计算耗时。本研究中将加速比定义为相同任
                    swe  drainage
              务在单线程环境与并行计算环境中计算耗时的比值                       [43] ,理想情况下加速比应与并行线程数呈线性关系。



























                                       图 9 “普拉桑”台风案例中 SERGHEI-SWMM 模拟时间与加速比

                                                                                               — 1379  —
   127   128   129   130   131   132   133   134   135   136   137