Page 65 - 2023年第54卷第2期
P. 65

程度(explainedvariability)。其中,分母 SST是因变量与其均值差值的平方和,是因变量(损失率)变动
              程度的总和;分子 SSR是拟合值与其均值差值的平方和,是拟合曲线可解释变量的变化程度总和。R                                              2
                                                     2
              的取值在[0,1]区间,在脆弱性曲线中,R 越大意味着危险性强度对损失率的解释程度越强。其次,
                                2
              从模型优化角度, R 值也可以理解为回归模型对零模型(NullModel)的改善程度。分母 SST是不引入
              任何解释变量的模型的残差平方和,分子 SSE是引入解释变量后的模型的残差平方和。SSE越小,R                                             2
              值越大,说明解释变量对零模型的改进程度越大。
                                                                                    2
                  对于因变量为损失状态的模型,由于无法利用最小二乘估计,传统的 R 值不再适用。但根据 R                                            2
                                                                  2
                                                                                    2
                                                                                                         2
              的第二种解释,可以利用最大似然估计结果构建类似于 R 的标准,称为伪 R 。如 McFadden的伪 R :
                                                                   ^
                                                                ln (L)
                                                          2
                                                  PseudoR = 1 -     m                                  (15)
                                                                  ^
                                                               ln(L )
                                                                   null
                    ^
                                            ^
                                                                                 2
              式中:L为回归模型的似然值;L 为零模型的似然值。McFadden的伪R从似然值角度,反映了回归
                      m                      null
                                                                                                        2
              模型对零模型的优化程度。其取值范围在[ 0,1]区间,值越大对零模型的优化效果越好。但伪 R通
                                                                                           2
                    2
              常比 R值小。McFadden基于心理学和行为学领域的研究,给出经验判断标准:伪 R在 0.2~0.4之间
              表明拟合优度足够高          [27] 。尽管如此,在灾害研究领域方面,由于调查数据离散性较大,现有文献给出
                                             2
                                                                                              2
              的损失状态脆弱性曲线拟合的伪 R值普遍低于 McFadden的标准                          [23 - 24] 。在实践中,伪 R主要用作不同
              模型选择时的相对指标,而非单一模型拟合程度评价的绝对指标。
                  AIC是基于最大似然估计的一个信息准则,通常的表达式为:
                                                     AIC =- 2ln(L) + 2k                                (16)
              式中:L为最大似然值;k为参数个数。AIC可以理解为考虑参数数量惩罚的最大似然情况。由于公式
              前面是负号,所以 AIC越小,表明在模型成立的假设下,获得样本数据的可能性(似然)越高,模型拟
              合度越好。由于 AIC是基于最大似然估计,所以 AIC对于损失率脆弱性曲线模型和损失状态脆弱性曲
              线模型都适用。
                                                              2
                  需要注意的是,在模型选择比较时,无论利用R值还是 AIC,其前提都是因变量相同。因变量尺
              度不同的模型不能进行比较。例如,比较 Linear模型和 Log - log模型拟合程度是不合适的。尽管可以
              对两种模型的因变量做几何平均变换之后进行相互比较                           [26] ,但其本质是使尺度差异过大的 Linear和
              Log因变量数据转换到同一尺度,产生了一定的可比性。这种转换后的比较在取值范围为[0,1]的损
              失率数据中是不可行的。


              3 案例:湖北恩施洪涝灾害商业停滞损失脆弱性曲线构建


              3.1 研究区与数据概况 2020年 7月 17日,湖北省恩施市遭遇 50年一遇的特大洪水,4.5h内三次
                                                                                3
                                                                 3
              升级城市防洪应急响应,清江恩施水文站流量从 1890m ?s上升到 3670m ?s,水位达 418.59m,超出警
                                              2
              戒水位 5m多。城区淹没面积 11km ,水深高达 2~3m,最深处 5m,淹没时长超过 12h。沿江商铺分布
              密集、种类繁多,且多为小微企业,损失严重。初步统计,2000多个体工商户遭受不同程度损失。
                  为定量研究受灾企业产能脆弱性,2021年 6月 1日至 7日,在地方部门的协助下,调研组采用面
              对面问卷调查方式,走访 399家受灾企业,搜集企业的产能(营业)损失率、淹没水深、淹没时长等信
              息。通过数据整理与分析,剔除缺失值、异常值等无效样本,最终研究样本 350份。样本主要分布在
              恩施市小渡船街道、六角亭街道和舞阳坝街道(图 1),主要类型为批发零售、居民服务、餐饮等非
              制造业企业。进一步,考虑样本的可融合性,将企业分为四大类,即批发零售业 214家、居民服务
              业 53家、住宿餐饮业 50家、其他服务行业 33家。研究区区位、淹没范围以及调查企业分布如图 1
              所示。






                                                                                                —  1 8 9 —
   60   61   62   63   64   65   66   67   68   69   70