Page 65 - 2024年第55卷第12期
P. 65

图 4 典型负荷特征抽取方法
              4.2.2 基于核密度估计的特征参数拟合 常规参数                                   表 1 负荷特征参数计算方法
              估计中均 需 先 假 设 样 本 点 分 布 的 概 率 密 度 函 数 形                指标           计算公式            统计时段
              式,如假设有误则会导致分布拟合错误,而非参数法                                            =
                                                                  日负荷率          x 1 P av ?P max   全天
              讲究无需要假设样本分布形式,直接根据样本中统计                             日峰谷差率      x 2 (P max P min )?P max  全天
                                                                              =
                                                                                   -
              得到概率密度分布。因此本文采用非参数估计中基于                                                          08∶00—11∶00
                                                                                 =
                                                                  峰期负载率        x 3 P peak_av ?P av
              核密度估计的方法对从负荷样本中提取的负荷特性指                                                          18∶00 —22∶00
              标进行概率密度拟合,进而确定典型的日负荷指标向                                                          0∶00—6∶00
                                                                                =
                                                                  谷期负载率        x 4 P middle_av ?P av
              量 CTP= [CTP ,CTP ,CTP ,CTP ,CTP ]。                                               22∶00—24∶00
                                  t2
                           t1
                    t
                                                      t5
                                                t4
                                         t3
                                                                                               6∶00—8∶00
                  假设第 j个特性指标 m 的 T个 样本 m ,m ,                     平期负载率        x 5 P low_av ?P av
                                                                                 =
                                        j
                                                           2j
                                                      1j
                                                                                               11∶00—18∶00
              m ,…,m ,则 m 点的核密度估计可以定义为:
                3j       Tj     j
                                                         1   T   m- m tj
                                                                   j
                                                 f(m) =    ∑   K ( )                                   (20)
                                                  k  j
                                                         Th t =1   h
              式中:h为带宽;T为天数,即样本个数;m 为第 t天 j个特性指标的样本值;K(·)为核函数。
                                                       tj
                  f(m)作为密度函数需保证非负和积分值为 1,经数学证明只需令核函数满足下述条件即可:
                      j
                   k
                                                      { K(x)≥ 0                                        (21)
                                                       ∫
                                                        K(x)dx =1
                  根据分布形式确定核函数种类后,拟合效果的优
              劣关键在于带宽 h的确定,本文采用多折交叉验证机
              制对带宽参数进行搜索(图 5)。相比于传统的模型评
              估的方式(划分出固定的训练集和测试集),交叉验证的
              优势在于:避免模型在训练集和验证集划分不合理造成
              的过拟合,这种情况在用小规模数据集训练模型时很容
              易出现,所以在小规模数据集上用交叉验证的方法。
                                                                              图 5 多折交叉验证机制
                  多折交叉验证机制具体的过程是,首先在训练集和
              验证集上对多种带宽的选择进行验证,选出平均误差最小的模型带宽;选出合适的模型带宽后,可以把
              训练集和验证集合并起来,再重新把模型训练一遍,得到最终的带宽;最后再用测试集测试其泛化能力。
              4.2.3 基于负荷特性指标的典型负荷抽取方法 选择某省某月的日 96点负荷数据,逐日提取负荷特
              征参数,构成每日负荷特征的指标向量 C= [C ,C ,C ,C ,C ]。
                                                             t2
                                                        t1
                                                    t
                                                                      t4
                                                                           t5
                                                                  t3
                                                                                                   4
                                                                                              —   1 7 7 —
   60   61   62   63   64   65   66   67   68   69   70