Page 132 - 2025年第56卷第10期

P. 132

三处位置的积水模拟结果与估测值，结果显示，估测值与模拟值的绝对误差均不超过 3.5 cm，相对误
差不超过 20%。模拟的误差和不确定性主要来源于概化管网数据、地面高程数据与实际情况之间的差
异，以及地表径流计算网格的空间分辨率限制。此外，图中对比了两处未积水区域（无积水区域 1、
2），结果显示，SERGHEI-SWMM 对未积水区域的模拟结果同样具有较高的准确性。结合图 5（b）分析
可知，积水区域普遍位于地面高程较低的位置，表明地形因素是导致该区域积水事件的主要原因。在
时间步长方面，上述强降雨洪涝模拟均基于 Nvidia L40 型号 GPU 进行加速运算，地表径流模块时间步
长在 0.1 ~ 0.2 s 范围内，管道排水模块时间步长在 1 ~ 12 s 之间。

4 模型并行性能和可移植性验证

研究表明，基于 Kokkos 异构编程框架的 C++计算模型可在多种超算平台上高效运行，表现出良好
的可移植性和并行性能［22，24］。为系统评估 SERGHEI-SWMM 在不同硬件架构上的性能，本节以“普拉
桑”台风引发的强降雨洪涝过程作为研究对象，分别在不同 CPU 和 GPU 设备上对其可移植性和并行性
能进行测试分析。本研究使用的测试环境包括戴尔工作站（以下简称“工作站”）和同济大学科学计算

中心的高性能计算平台（以下简称“超算平台”）。其中，工作站配置的 CPU 和 GPU 分别为：Intel
Core i9-12900K（16 核 24 线程， 3.2 GHz 主频，最大睿频 5.2 GHz）和 Nvidia RTX A5000（24 GB 显存，
768 GB/s 带宽和 8192 个 CUDA 核心）；超算平台配置的 CPU 和 GPU 分别为：Intel Xeon 9468（48 核 96 线

程， 2.1 GHz 主频，最大睿频 3.5
表 5 工作站和超算平台环境参数
GHz）和 Nvidia L40（48 GB 显存，
配置类别工作站超算平台
864 GB/s 带宽及 18 176 个 CUDA 核
心）。测试过程中，各平台均使用 CPU Intel Core i9-12900K Intel Xeon 9468
单个 GPU 进行计算，CPU 线程数 GPU Nvidia RTX A5000 Nvidia L40
则根据设备性能特点进行调整，操作系统 Windows Subsystem for Linux（WSL） Linux
具体测试环境参数如表 5 所示。编译器 gcc 11.4.0 gcc 8.5.0
Kokkos 版本 4.3.00
图 9 对比了 SERGHEI-SWMM
在不同类型 CPU 上的模拟时间与 OpenMP/CUDA 版本 4.5/12.0 4.5/11.8
加速比，其中， T 表示总计算耗
时，T 和 T 分别表示地表径流模块和管道排水模块的计算耗时。本研究中将加速比定义为相同任
swe drainage
务在单线程环境与并行计算环境中计算耗时的比值［43］，理想情况下加速比应与并行线程数呈线性关系。

图 9 “普拉桑”台风案例中 SERGHEI-SWMM 模拟时间与加速比

— 1379 —

127 128 129 130 131 132 133 134 135 136 137