Page 132 - 2025年第56卷第10期
P. 132
三处位置的积水模拟结果与估测值,结果显示,估测值与模拟值的绝对误差均不超过 3.5 cm,相对误
差不超过 20%。模拟的误差和不确定性主要来源于概化管网数据、地面高程数据与实际情况之间的差
异,以及地表径流计算网格的空间分辨率限制。此外,图中对比了两处未积水区域(无积水区域 1、
2),结果显示,SERGHEI-SWMM 对未积水区域的模拟结果同样具有较高的准确性。结合图 5(b)分析
可知,积水区域普遍位于地面高程较低的位置,表明地形因素是导致该区域积水事件的主要原因。在
时间步长方面,上述强降雨洪涝模拟均基于 Nvidia L40 型号 GPU 进行加速运算,地表径流模块时间步
长在 0.1 ~ 0.2 s 范围内,管道排水模块时间步长在 1 ~ 12 s 之间。
4 模型并行性能和可移植性验证
研究表明,基于 Kokkos 异构编程框架的 C++计算模型可在多种超算平台上高效运行,表现出良好
的可移植性和并行性能 [22,24] 。为系统评估 SERGHEI-SWMM 在不同硬件架构上的性能,本节以“普拉
桑”台风引发的强降雨洪涝过程作为研究对象,分别在不同 CPU 和 GPU 设备上对其可移植性和并行性
能进行测试分析。本研究使用的测试环境包括戴尔工作站(以下简称“工作站”)和同济大学科学计算
中心的高性能计算平台(以下简称“超算平台”)。其中,工作站配置的 CPU 和 GPU 分别为:Intel
Core i9-12900K(16 核 24 线 程 , 3.2 GHz 主 频 , 最 大 睿 频 5.2 GHz)和 Nvidia RTX A5000(24 GB 显 存 ,
768 GB/s 带宽和 8192 个 CUDA 核心);超算平台配置的 CPU 和 GPU 分别为:Intel Xeon 9468(48 核 96 线
程 , 2.1 GHz 主 频 , 最 大 睿 频 3.5
表 5 工作站和超算平台环境参数
GHz)和 Nvidia L40(48 GB 显 存 ,
配置类别 工作站 超算平台
864 GB/s 带宽及 18 176 个 CUDA 核
心)。测试过程中,各平台均使用 CPU Intel Core i9-12900K Intel Xeon 9468
单个 GPU 进行计算,CPU 线程数 GPU Nvidia RTX A5000 Nvidia L40
则 根 据 设 备 性 能 特 点 进 行 调 整 , 操作系统 Windows Subsystem for Linux(WSL) Linux
具体测试环境参数如表 5 所示。 编译器 gcc 11.4.0 gcc 8.5.0
Kokkos 版本 4.3.00
图 9 对比了 SERGHEI-SWMM
在不同类型 CPU 上的模拟时间与 OpenMP/CUDA 版本 4.5/12.0 4.5/11.8
加 速 比 , 其 中 , T 表 示 总 计 算 耗
时,T 和 T 分别表示地表径流模块和管道排水模块的计算耗时。本研究中将加速比定义为相同任
swe drainage
务在单线程环境与并行计算环境中计算耗时的比值 [43] ,理想情况下加速比应与并行线程数呈线性关系。
图 9 “普拉桑”台风案例中 SERGHEI-SWMM 模拟时间与加速比
— 1379 —

