Page 119 - 2022年第53卷第8期
P. 119

法之一,也是 GEV分布参数估计中最为常用的估计方法。Smith等                             [23] 和 Coles等  [24] 指出 k> - 0.5时,
              MLM具有一般的渐近性质;- 1<k< - 0.5,MLM结果存在,但不具有渐近性质;k< - 1时,MLM结果通
              常不存在;k>0.5时,不存在二阶矩和高阶矩,此时极值分布有一个非常短的有界右尾,这在极值分
              布的应用中极少出现。因此,极大似然理论的局限性在实际应用中影响不大。
                  矩法(MethodofMoments,MOM)的基本假设为样本矩等于相应的总体矩,对未知参数进行求解。
              详细的求解过程参见文献[ 25 - 27]。

              3 充分样本长度确定方法


              3.1 充分样本长度界定及确定方法 在一定的正则条件下,MLM 估计下的参数在样本长度趋于无穷
                                                                                     ^
              时渐近服从正态分布          [28] 。即样本长度足够大时,未知参数的最大似然估计量 θ 具有渐近正态性,此时
              MLM估计下的参 数 服 从 正 态 分 布,其 均 值 为 真 值 θ ,方 差 为 克 拉 美 罗 劳 下 界                 [29] (Cramer - Raolow
              bound ,CRLB),MLM估计渐近有效说明了在样本长度充分的情况下,MLM 估计的参数应服从正态分
              布。假设充分样本长度为 n,当 n<n,最大似然估计量无法通过正态性检验,其计算结果并非是有效
                                       a
                                                a
              的;n ≥n时,最大似然估计量通过正态性检验,说明样本长度足够充分,估计是渐近有效的。基于
                       a
              上述数理统计理论,本文给出充分样本长度 n的概念界定:当 n ≥n时,最大似然估计量应服从正态
                                                        a                   a
              分布。
                  以 GEV分布为例,数值模拟可以假设总体规模足够大,足以进行充分样本长度的分析。然而,
              在实际的工程设计中,选用的数据有限,必须论证选用资料长度估计结果的准确性和所需的充分样本
              长度。基于 bootstrap的数学分析方法            [30] 采用 Shapiro - Wilk方法  [31] 检验设计值的正态性,计算充分样
              本长度 n,判断计算数据长度是否足以进行参数估计。原假设定义为:样本长度为 n时,MLM 设计
                      a
              值服从正态分布。如果拒绝原假设,说明在给定显著性水平 α下,样本长度不足,需要采集更多的样
              本,并再次应用上述方法进行检验,直到增加样本至无法拒绝原假设。详细步骤如下。
                  步骤一:给定参数 θ ( μ ,σ ,k),生成 n = 600 服从 GEV分布的随机样本 Y = (y,y,…,y)。
                                                                                          1
                                                                                                      n
                                                                                             2
                  步骤二:根据 bootstrap法,从 Y中抽取 M- 1组相同容量的样本,得到再生样本 Y = (y ,y ,
                                                                                                        m2
                                                                                              m
                                                                                                   m1
              …,y ),其中 m= 2,…,M。
                   mn
                                                                                                  (1)
                                                                                                       (1)
                  步骤三:给定初值 n= 10 ,j = n,…,n,选取 Y(m= 1 ,2,…,M)的前 j项,记为 z ,z =
                                                                                                       mj
                                     0
                                                                                                  mj
                                                               m
                                               0
              (y ,y ,…,y )。
                m1   m2       mj
                                                                            (k)
                                (1)
                  步骤四:根据 z 样本进行再抽样,得到 K - 1组 bootstrap样本 z (k = 2,…,K)。
                                mj                                          mj
                                                                                  (k)
                  步骤五:根据步骤二至步骤四,获得 M× K组样本长度均为 j的样本 z ,拟合 GEV分布,采用
                                                                                  mj
                                                      (k)
              MLM估计参数,得到给定频率 P下设计值 x ,m= 1,2,…,M;j = n,…,n;k = 1,2,…,K。
                                                      mj                       0
                              (k)
                  步骤六:对 x (k = 1 ,…,K)进行 Shapiro - Wilk正态检验,得到统计值 p ,m= 1 ,2,…,M,
                                                                                       mj
                              mj
              j = n,…,n,t为 T分布下自由度为 M- 1的临界值,计算 95%的上下置信区间。
                 0
                                                 1  M      2   1  M        2
                                              j ∑
                                             珋 =
                                                                         p)
                                             p       p ,s=       ∑  (p - 珋                              (5)
                                                           j
                                                                      mj
                                                      mj
                                                                          j
                                                M m=1        M- 1 m=1
                                                     [     s        s  ]
                                                            j
                                                                     j
                                                 α∈ 珋 - t    , 珋 + t                                    (6)
                                                      p
                                                               p
                                                                j
                                                       j
                                                          槡 M      槡 M
                                                                          s           s
                                                                                       j
                                                                          j
                  步骤七:设存在 n,α = 0.05 ,任何 j>n的样本均满足 珋 - t                    > α , 珋 - t  为置信区间的下限,
                                                                    p
                                                                                 p
                                   a                  a              j            j
                                                                         槡 M         槡 M
              则 n为 95%置信水平下得到指定频率设计值所需的充分样本长度。
                  a
              3.2 样本长度与频率、参数及估计方法的关系 曲线拟合法是基于极限近似理论,用解析表达式来逼
              近离散数据      [32] 。选取 95%的相对置信区间(Relativeconfidenceinterval,RCI)         [10] ,平均相对误差(the
              meanrelativeerror,RMAE)  [33] 两种不确定性分析指标。在水文频率的不确定性分析中,通常根据置信
                     0
                —  1 0 6 —
   114   115   116   117   118   119   120   121   122   123   124