Page 65 - 2023年第54卷第2期
P. 65
程度(explainedvariability)。其中,分母 SST是因变量与其均值差值的平方和,是因变量(损失率)变动
程度的总和;分子 SSR是拟合值与其均值差值的平方和,是拟合曲线可解释变量的变化程度总和。R 2
2
的取值在[0,1]区间,在脆弱性曲线中,R 越大意味着危险性强度对损失率的解释程度越强。其次,
2
从模型优化角度, R 值也可以理解为回归模型对零模型(NullModel)的改善程度。分母 SST是不引入
任何解释变量的模型的残差平方和,分子 SSE是引入解释变量后的模型的残差平方和。SSE越小,R 2
值越大,说明解释变量对零模型的改进程度越大。
2
对于因变量为损失状态的模型,由于无法利用最小二乘估计,传统的 R 值不再适用。但根据 R 2
2
2
2
的第二种解释,可以利用最大似然估计结果构建类似于 R 的标准,称为伪 R 。如 McFadden的伪 R :
^
ln (L)
2
PseudoR = 1 - m (15)
^
ln(L )
null
^
^
2
式中:L为回归模型的似然值;L 为零模型的似然值。McFadden的伪R从似然值角度,反映了回归
m null
2
模型对零模型的优化程度。其取值范围在[ 0,1]区间,值越大对零模型的优化效果越好。但伪 R通
2
2
常比 R值小。McFadden基于心理学和行为学领域的研究,给出经验判断标准:伪 R在 0.2~0.4之间
表明拟合优度足够高 [27] 。尽管如此,在灾害研究领域方面,由于调查数据离散性较大,现有文献给出
2
2
的损失状态脆弱性曲线拟合的伪 R值普遍低于 McFadden的标准 [23 - 24] 。在实践中,伪 R主要用作不同
模型选择时的相对指标,而非单一模型拟合程度评价的绝对指标。
AIC是基于最大似然估计的一个信息准则,通常的表达式为:
AIC =- 2ln(L) + 2k (16)
式中:L为最大似然值;k为参数个数。AIC可以理解为考虑参数数量惩罚的最大似然情况。由于公式
前面是负号,所以 AIC越小,表明在模型成立的假设下,获得样本数据的可能性(似然)越高,模型拟
合度越好。由于 AIC是基于最大似然估计,所以 AIC对于损失率脆弱性曲线模型和损失状态脆弱性曲
线模型都适用。
2
需要注意的是,在模型选择比较时,无论利用R值还是 AIC,其前提都是因变量相同。因变量尺
度不同的模型不能进行比较。例如,比较 Linear模型和 Log - log模型拟合程度是不合适的。尽管可以
对两种模型的因变量做几何平均变换之后进行相互比较 [26] ,但其本质是使尺度差异过大的 Linear和
Log因变量数据转换到同一尺度,产生了一定的可比性。这种转换后的比较在取值范围为[0,1]的损
失率数据中是不可行的。
3 案例:湖北恩施洪涝灾害商业停滞损失脆弱性曲线构建
3.1 研究区与数据概况 2020年 7月 17日,湖北省恩施市遭遇 50年一遇的特大洪水,4.5h内三次
3
3
升级城市防洪应急响应,清江恩施水文站流量从 1890m ?s上升到 3670m ?s,水位达 418.59m,超出警
2
戒水位 5m多。城区淹没面积 11km ,水深高达 2~3m,最深处 5m,淹没时长超过 12h。沿江商铺分布
密集、种类繁多,且多为小微企业,损失严重。初步统计,2000多个体工商户遭受不同程度损失。
为定量研究受灾企业产能脆弱性,2021年 6月 1日至 7日,在地方部门的协助下,调研组采用面
对面问卷调查方式,走访 399家受灾企业,搜集企业的产能(营业)损失率、淹没水深、淹没时长等信
息。通过数据整理与分析,剔除缺失值、异常值等无效样本,最终研究样本 350份。样本主要分布在
恩施市小渡船街道、六角亭街道和舞阳坝街道(图 1),主要类型为批发零售、居民服务、餐饮等非
制造业企业。进一步,考虑样本的可融合性,将企业分为四大类,即批发零售业 214家、居民服务
业 53家、住宿餐饮业 50家、其他服务行业 33家。研究区区位、淹没范围以及调查企业分布如图 1
所示。
— 1 8 9 —