Page 36 - 2025年第56卷第10期
P. 36
本文采用 HRES 初始场作为气象大模型的驱动数据。主要原因在于:ERA5 数据通常滞后约 5 天更
新,难以满足时效性要求 [28] ;HRES 初始场能够有效检验气象大模型业务性能,并且大模型预报数据
与 HRES 预报数据源自同一初始场,保证了性能对比的公平性和科学性 [23] 。硬件配置方面,本文使用
Ubuntu 22.04 系统的工作站,中央处理器(CPU)为 AMD EPYC 7532(32 核,64 线程,2.4 GHz 主频),内
存为 128 GB,显卡为 NVDIA RTX A6000(48 GB 显存),GraphCast、FuXi 和 AIFS 模型占用的总存储空
间为 11 GB。经过测试,气象大模型业务预报各个步骤的耗时如表 1 所示。
3.2 评估方法 利用受试者操作
表 1 气象大模型业务预报耗时 单位:s
特征(Receiver Operating Character‐
业务运行步骤 GraphCast FuXi AIFS
istic,ROC)曲线对气象大模型降
HRES 初始场下载 178.8±95.5 151.1±80.7 198.4±105.9
水预报性能进行评估,计算 ROC
初始场数据准备 10.4±0.4 4.5±0.1 8.6±0.7
技 能 分 数(ROCSS)。 ROC 曲 线 是
首次生成 10 d 预报 152.3±8.1 92.9±4.1 66.8±1.9
以假阳性率为横坐标,真阳性率 业务生成 10 d 预报 72.7±0.9 78.8±0.4 56.3±0.5
为纵坐标绘制的曲线,ROC 技能
分数(ROCSS)衡量命中和误报之间的整体判别能力 [39] 。计算公式如下:
ROCSS = 2( AUC - 0.5) (1)
式中 AUC 为 ROC 曲线下的面积,计算公式如下:
1
AUC = ∫ HdF (2)
0
式中 H 和 F 分别代表真阳性率和假阳性率,计算公式如下:
I
∑ n = 1 ( f n > q|o n > q )
N
H (q) = N (3)
I
∑ n = 1 ( o n > q )
N
I
∑ n = 1 ( f n > q|o n ≤ q )
F (q) = N ) (4)
∑ n = 1 ( o n ≤ q
I
ì 1, f n > q
I( f n > q) = í (5)
î 0, 其他
式中:N 为网格数量;f n 和 o n 分别为网格 n 的预报降水量和观测降水量;q 为设定的降水阈值。对所有
可能的降水阈值 q 计算 H 和 F,绘制 ROC 曲线并计算 ROCSS,以综合考虑所有网格不同量级降水的信
息 [23,31] 。ROCSS 的取值范围为-1~1,数值越高,预报性能越好 [39] 。
4 结果分析
4.1 逐 6 h 降水量预报检验 针对北江“2022.6”和“2024.4”区域平均逐 6 h 降水量,各模型暴雨预
报的 ROCSS 如图 2 所示。预见期为 6 h 时,GraphCast 的 ROCSS 中位数为 0.50 和 0.47,FuXi 的为 0.59 和
0.53,AIFS 的为 0.57 和 0.53,HRES 的为 0.46 和 0.41。随着预见期从 6 h 增加到 240 h,各模型的降水预
报性能均呈现下降趋势。当预见期低于 2 d 时,各模型的 ROCSS 基本大于 0,表明其预报性能优于随机
猜测;当预见期超过 2 d 时,出现较多负值 ROCSS,说明模型的预报性能开始低于随机水平。值得指
出的是,当降水量较大时,各模型的降水预报表现均呈现一定程度的下降,热力图中强降水时段与
ROCSS 值较低的条带在时间上耦合。相比 HRES,GraphCast、FuXi、AIFS 在预报较小降水量时的表现
更好,显示出气象大模型在预报较小降水量时的优势。FuXi 在预见期 5 ~ 6 d 时表现出明显的性能变
化,热力图中这一时段呈现出清晰的水平分界线,这与其 1 ~ 5 和 6 ~ 10 d 预见期采用不同子模型的级
联架构密切相关 [21] 。
[30]
根据 6 h 降水量划分出小雨[0.1mm,2.5mm)、中雨[2.5mm,7.5 mm)和大雨[7.5mm,+∞) ,评
估不同预见期和降水强度下预报性能,结果如图 3 所示。GraphCast、FuXi、AIFS 和 HRES 的降水预报
— 1283 —

