Page 6 - 2024年第55卷第9期
P. 6
数据以反距离插值方法进行插值,将插值结果作为该站的降雨数据,插值公式如下:
s - 1
∑ (R ?d)
i,t
i
i =1
R = (1)
t s - 1
∑ (1?d)
i
i =1
式中:R为异常雨量站第 t时刻的降雨量;d为异常雨量站到流域内其它第 i个雨量站的距离;R 为其
i,t
i
t
它第 i个雨量站 t时刻的降雨量;s为雨量站个数(i = 1,2,…,s)。
将清洗后的数据进行场次划分,步骤如下:(1)以研究范围内所有雨量站为研究对象,当有一个
站 5min降雨量超过 0.1mm,则认为出现了有效降雨;(2)当所有站连续超过 30min的 5min降雨量
均小于 0.1mm,则认为无有效降雨,以此标准划分两个独立场次;(3)划分好降雨场次以后,从中筛
选单个雨量站 1h雨量超过 10mm且单个雨量站场次累积雨量大于 30mm的降雨过程。按照上述标
准,共筛选出 2002—2023年间降雨过程 115场,形成降雨洪水样本库。
2.2 研究方法 分别利用流形学习算法中的局部
嵌入算法(LocallyLinearEmbedding,LLE)和 K均
值动态聚类算法( K - Means,KM),获得各类降雨
动态时空分布特征,并进行识别和匹配,得到与
当前降雨趋势最相似的历史降雨过程,通过对应
的历史洪水过程预测当前降雨趋势下未来洪水过
程,具体技术流程如图 2所示:
图 2 技术流程图
(1)降雨时 空 分 布 动 态 特 征 矩 阵 构 建。不 同
场次的降雨量存在较大差异,为了让不同降雨过程的动态特征可以比较,本文构建时间和空间维度占
比矩阵,来描述降雨的时空分布特征,并构建历史样本集 Ω,如式(2)(3)所示。
Ω= (P,P,…,P ) (2)
1
N
2
式中:Ω为历史降雨样本集,包括 N场降雨;P 为第 j次降雨占比矩阵,j = 1 ,2,…,N。
j
j
j
j
r r… r
11 12 1t
j
j
j
r r… r
21
2t
22
P= (3)
j
j
j
j
r r… r
i 1
i 2
it
j
式中:t为时段数(t = 1 ,2,…,m);r为 j次降雨过程中第 i个雨量站 t时刻的降雨量占该时刻所有
it
站降雨量的百分比,具体如式( 4)所示。
s
j
j
r =R ? R j (4)
it∑
it it
i =1
j
式中R 为第 j次降雨过程中,第 i雨量站 t时刻的降雨量。矩阵 P中,行向量描述的是降雨随时间的变
j
it
化,列向量描述的是降雨在空间的变化,从而描述了整场降雨的时空分布特征。
( 2)降维分析。描述降雨时空分布特征的高维数据样本库是非线性高维数据空间,直接分析具有
一定的不确定性,故需先对其进行降维分析。降维是指将原始数据由维数较少的 “有效” 特征数据,
在不减少原始数据所包含信息量的基础上,表示原始数据的主要特征。通过降维,可有效提高分析效
率,提高分析结果的准确性 [20] 。本文利用局部线性嵌入算法(LocallyLinearEmbedding,LLE),对该
高维数据进行降维分析。该算法是 S.T.Roweis等 [21] 提出的一种针对非线性数据的无监督降维方法,能
够使降维的数据保持原有数据的拓扑结构。由于 LLE算法在低维空间中保持了高维空间的局部线性特
征,因此在低维空间中的分类结果在高维空间中也是合理的。
LLE算法首先假设数据在其周围较小范围内是线性的,每个样本点可以用其周围邻近的数据点线
性表达,且在高维空间和低维空间该局部线性关系保持不变。主要包括三部分:
0
— 1 1 1 —