Page 118 - 2022年第53卷第8期
P. 118

性质来推断总体参数。根据这一方法,李鸿雁等                       [12] 采用数值模拟方法对随机生成样本和代表性站点的
              均值、均方差进行分析,采用假设性检验证明 30年样本长度的充分性。然而样本长度的充分性与研
              究问题有关,标准很难界定。水文概率分布的复杂程度、待估计参数数目和统计推断方法的选取都与
              样本长度密切相关。这一经验法则,对于估计均值来说是充分合理的,而论证相对复杂且具有多个参
              数的分布是否充分值得商榷。其次,不同统计推理方法、不同参数的收敛速度差别较大                                          [15] ,因此,在
              n = 30的情况下,计算结果差别也很大。此外,30年的样本长度并不能为不同重现期的设计值计算提
              供有效参考。洪水频率分析中,计算较大重现期的设计值,要得到可靠的结果,需要的样本长度也相
              应更长   [16] 。Katz等  [17] 的分析结果表明,GEV分布的极端分位数估计在小样本(n<25)情况下非常不稳
              定。Robson等    [18] 认为采用 GEV分布进行频率计算需要的样本量是重现期的 4倍。Vanem等                             [19] 认为 35
              年数据足以估计 100年的设计值。Hu等                 [16] 结果显示估计重现期为 100年的设计值,35年的序列长度
              比 20年的误差小 50%。Merz等          [1] 的研究表明一定样本长度下,增加更多的数据并不意味着可以提高
              计算精度。Benson等       [20] 指出不超过序列长度两倍的重现期,能得到可靠的结果。而 Jeong等                             [21] 认为
              数据长度外推 3至 4倍的重现期,其频率计算是合理的。
                  以上研究表明:( 1)样本长度不充分,难以支撑分析结果的可靠性,模型的运行性能也会因样本
              短缺而受到影响。(2)30年样本长度这一标准并不能为不同频率下的设计值计算提供有效参考。(3)模
              拟和实例分析大都是基于固定长度的样本,样本长度分析方法较为主观。目前,不同频率下样本长度
              的充分性没有共识,水文频率分析中缺少一种基于严谨的数理统计推理而非经验法则的分析方法进行
              给定频率计算所需的充分样本长度推求,且在这一过程中,缺乏充分考虑到线型、参数估计方法、重
              现期的影响。基于此,本文应用渐近正态性质、极限近似理论原理,选用 GEV分布,研究不同参数
              下充分样本长度的确定方法,并验证其合理性。在此基础上,根据误差指标进行分析比较,采用数值
              模拟方法分析参数、频率、参数估计方法与样本长度的潜在关系及规律,可在实际工作中用于判断计
              算数据是否足够充分用于模型的建立和参数估计。文中方法以期为确定水文频率所需样本长度,提高
              水文设计值成果的可靠性等提供支撑。


              2 GEV分布及其参数估计方法


              2.1 GEV分布 理 论   广 义 极 值 分 布 (GeneralizedExtremeValueDistribution,GEV)的 概 率 密 度 函 数
              f(x)及其分布函数 F(x)分别为:
                                                                    1 - 1
                                                       1      x - μ  k       x - μ  1?k
                                                                        - 1 - k
                                       f(x;μ ,σ ,k) =    [   ( )]      e [  ( σ)]                       (1)
                                                          1 - k
                                                       σ       σ
                                                                            1?k
                                                                      x - μ
                                                                [ {  ( )] }
                                           F(x;μ ,σ ,k) =exp- 1 - k    σ                                (2)
                  极值Ⅰ型分布是 GEV分布的一个特例,形状参数 k = 0 ,极值Ⅰ型分布的概率密度函数 f(x)及其
              分布函数 F(x)分别为:
                                                         1       x - μ  - ( x - μ
                                                                            ]
                                                             [
                                            (
                                            fx;μ ,σ ) = exp -   ( )  - e  σ)                            (3)
                                                         σ        σ
                                                                     x - β
                                                F(x;μ ,σ ) =exp[ - e - ( α) ]                           (4)
              式中:σ为尺度参数;μ为位置参数;k为形状参数,当 k<0时,为极值Ⅱ型分布(或 Frechet分布),
              当 k>0时,为极值Ⅲ型分布(或 Weibull分布),k = 0 时,为极值Ⅰ型分布(或 Gumbel分布)。
              2.2 参数估计方法 最大似然法(MaximunLikelihoodMethod,MLM)是根据对数似然函数最大化进行
              概率分布参数估计的方法,要求对数似然函数是可微的                           [22 - 23] 。MLM与大多数参数估计方法相比,其
              优势在于它直接为 GEV分布参数估计提供近似的标准误差和误差边界,同时允许将协变量信息合并
              到参数估计中。此外,MLM具有良好的渐近性质。由于这些优点,MLM是目前最主要的参数估计方

                                                                                                   0
                                                                                              —   1 0 5 —
   113   114   115   116   117   118   119   120   121   122   123