Page 119 - 2022年第53卷第8期
P. 119
法之一,也是 GEV分布参数估计中最为常用的估计方法。Smith等 [23] 和 Coles等 [24] 指出 k> - 0.5时,
MLM具有一般的渐近性质;- 1<k< - 0.5,MLM结果存在,但不具有渐近性质;k< - 1时,MLM结果通
常不存在;k>0.5时,不存在二阶矩和高阶矩,此时极值分布有一个非常短的有界右尾,这在极值分
布的应用中极少出现。因此,极大似然理论的局限性在实际应用中影响不大。
矩法(MethodofMoments,MOM)的基本假设为样本矩等于相应的总体矩,对未知参数进行求解。
详细的求解过程参见文献[ 25 - 27]。
3 充分样本长度确定方法
3.1 充分样本长度界定及确定方法 在一定的正则条件下,MLM 估计下的参数在样本长度趋于无穷
^
时渐近服从正态分布 [28] 。即样本长度足够大时,未知参数的最大似然估计量 θ 具有渐近正态性,此时
MLM估计下的参 数 服 从 正 态 分 布,其 均 值 为 真 值 θ ,方 差 为 克 拉 美 罗 劳 下 界 [29] (Cramer - Raolow
bound ,CRLB),MLM估计渐近有效说明了在样本长度充分的情况下,MLM 估计的参数应服从正态分
布。假设充分样本长度为 n,当 n<n,最大似然估计量无法通过正态性检验,其计算结果并非是有效
a
a
的;n ≥n时,最大似然估计量通过正态性检验,说明样本长度足够充分,估计是渐近有效的。基于
a
上述数理统计理论,本文给出充分样本长度 n的概念界定:当 n ≥n时,最大似然估计量应服从正态
a a
分布。
以 GEV分布为例,数值模拟可以假设总体规模足够大,足以进行充分样本长度的分析。然而,
在实际的工程设计中,选用的数据有限,必须论证选用资料长度估计结果的准确性和所需的充分样本
长度。基于 bootstrap的数学分析方法 [30] 采用 Shapiro - Wilk方法 [31] 检验设计值的正态性,计算充分样
本长度 n,判断计算数据长度是否足以进行参数估计。原假设定义为:样本长度为 n时,MLM 设计
a
值服从正态分布。如果拒绝原假设,说明在给定显著性水平 α下,样本长度不足,需要采集更多的样
本,并再次应用上述方法进行检验,直到增加样本至无法拒绝原假设。详细步骤如下。
步骤一:给定参数 θ ( μ ,σ ,k),生成 n = 600 服从 GEV分布的随机样本 Y = (y,y,…,y)。
1
n
2
步骤二:根据 bootstrap法,从 Y中抽取 M- 1组相同容量的样本,得到再生样本 Y = (y ,y ,
m2
m
m1
…,y ),其中 m= 2,…,M。
mn
(1)
(1)
步骤三:给定初值 n= 10 ,j = n,…,n,选取 Y(m= 1 ,2,…,M)的前 j项,记为 z ,z =
mj
0
mj
m
0
(y ,y ,…,y )。
m1 m2 mj
(k)
(1)
步骤四:根据 z 样本进行再抽样,得到 K - 1组 bootstrap样本 z (k = 2,…,K)。
mj mj
(k)
步骤五:根据步骤二至步骤四,获得 M× K组样本长度均为 j的样本 z ,拟合 GEV分布,采用
mj
(k)
MLM估计参数,得到给定频率 P下设计值 x ,m= 1,2,…,M;j = n,…,n;k = 1,2,…,K。
mj 0
(k)
步骤六:对 x (k = 1 ,…,K)进行 Shapiro - Wilk正态检验,得到统计值 p ,m= 1 ,2,…,M,
mj
mj
j = n,…,n,t为 T分布下自由度为 M- 1的临界值,计算 95%的上下置信区间。
0
1 M 2 1 M 2
j ∑
珋 =
p)
p p ,s= ∑ (p - 珋 (5)
j
mj
mj
j
M m=1 M- 1 m=1
[ s s ]
j
j
α∈ 珋 - t , 珋 + t (6)
p
p
j
j
槡 M 槡 M
s s
j
j
步骤七:设存在 n,α = 0.05 ,任何 j>n的样本均满足 珋 - t > α , 珋 - t 为置信区间的下限,
p
p
a a j j
槡 M 槡 M
则 n为 95%置信水平下得到指定频率设计值所需的充分样本长度。
a
3.2 样本长度与频率、参数及估计方法的关系 曲线拟合法是基于极限近似理论,用解析表达式来逼
近离散数据 [32] 。选取 95%的相对置信区间(Relativeconfidenceinterval,RCI) [10] ,平均相对误差(the
meanrelativeerror,RMAE) [33] 两种不确定性分析指标。在水文频率的不确定性分析中,通常根据置信
0
— 1 0 6 —