Page 111 - 2022年第53卷第5期
P. 111
本文首先采用最小二乘法 [21-22] 对威布尔分布参数进行初步求解, 求得待估参数后,利用相关系
数公式(5)评估最小二乘法拟合直线的效果,该值的绝对值越接近于1说明拟合效果越好。然后为了使
初步得到的威布尔分布模型在一定程度上具有鲁棒性,本文采用K-S检验 [23] 对其进行拟合优度检验。
( ∑ X i Y i - · ∑ X i · ∑ Y i ) ) 2
( )(
n
n
n
1
( n 2 1 ( n 2 ) ) ( n 2 1 ( n 2 ) )
r = i = 1 n i = 1 i = 1 (5)
∑ X i - · ∑ X i ∑ Y i - · ∑ Y i
i = 1 n i = 1 i = 1 n i = 1
(2)参数化 Bootstrap 法增加样本信息量。采用最小二乘法初步拟合得到小样本威布尔分布后,为
了提高统计分析的精度,常需要设法增加样本信息量,目前工程中常用的方法是美国斯坦福大学 B.
Efron教授提出的 Bootstrap 法 [24] ,其基本思想是依据小样本信息来模拟未知分布,通过不断获取再生
样本从而实现小样本转换为大样本。传统的非参数 Bootstrap 方法在建立先验分布时存在抽样误差大
的问题,为了减少此误差,使经验分布函数的泛化能力更强,本文以威布尔分布作为先验样本的经
验分布 F ,然后再采用 Bootstrap 法从 F 中抽取再生样本,重复抽取 n 次,对每组样本分别使用最小
n
n
二乘法进行威布尔分布拟合得到n组形状参数ξ和尺度参数η。
(3)非参数核密度估计确定先验分布。为了减少抽样带来的误差,提高经验分布函数的泛化能
力,采用非参数核密度估计法从抽样数据特性出发拟合出对应的概率密度函数,计算出待估参数的
先验分布。核密度估计公式为 [25] :
n
1
( )
x - X i
f h x = ∑ K ( ) (6)
nh i = 1 h
式中:K(•)为核函数,当样本量比较大时,核函数的选择对估计结果的影响不大,本文选取最为常
1 ( ) - 1
1
2
5
用的高斯核函数 K( ) t = exp - t 作为核函数;h为窗宽,最佳窗宽的估计值为h opt = 1.06σn ,其
2π 2
中σ为样本标准差,n为样本数。
将 Bootstrap 方法抽样得到的 n组形状参数 ξ和尺度参数 η 分别代入式(6)即可得到待估参数 θ (形
状参数ξ或尺度参数η)的先验分布公式为:
n ( ) n ( 2( ) 2 )
( ) 1 ∑ K θ - θ i 1 1 θ - θ i , i = 1, 2, , n (7)
f h θ = = ∑ exp -
nh opt i = 1 h opt nh opt i = 1 h opt
本文先验分布确定方法有效降低了对评估样本数据量的需求,同时也避免了因威布尔分布参数
多而导致的计算复杂的问题。
2.3 后验分布的计算 在获得先验分布后,结合现场试验数据 X=(x ,x ,…,x ),可得到后验分
1 2 n
布公式为:
( ) n n ( 1 n )
ξ
ξ
g(ξ,η ) |x ∝ η ξ ∏ x i exp - ∑ x i f h(ξ,η ) (8)
ξ - 1
η
ξ
i = 1
i = 1
根据以上后验分布函数来计算待估参数的估计值时需要进行数值积分来逼近待估参数的期望和
方差,本文后验分布是非标准形式的密度函数,采用数值积分方法计算时会有高维积分出现,使得
逼近误差随着维数的增加而增加,同时也增加了计算难度 [26] 。马尔科夫链蒙特卡罗(Markov Chain
Monte-Carlo,MC-MC) 方法是解决此类问题的一种行之有效的方法,基本思想是通过建立平稳
[27-29]
分布为 g(θ|x)的 Markov 链来得到后验分布 g(θ|x)的样本,随数值仿真模拟的变化而实时抽取随机样
本,来动态模拟求取积分,基于这些样本可做各种统计推断。在贝叶斯方法中常见的构造马尔科夫
链的方法是 Gibbs 抽样,其常用来处理高维、非标准形式的后验分布。在抽样过程中后验分布 g(ξ,
η|x)若给定 η,则 g(ξ,η|x)仅为 ξ 的函数,此时称 g(ξ |x,η)为参数 ξ 的满条件分布。在 Gibbs 抽样过
程中,从没有显式形式的满条件分布中抽样比较困难,故本文引入 Metropolis 算法抽取随机数,将
—611 —