Page 83 - 2024年第55卷第11期

P. 83

抽取数据训练模型。如图１中，模型在与环境交互后得到的状态等数据除传递至计算网络输出该状态
下所有动作的价值外，还将存入模型记忆库中，以供后续学习。冻结Ｑ参数使模型中存在两个结构相
同但参数不同的神经网络，计算网络保持单步更新，目标网络［２５］每隔周期Ｗ更新参数，从而减少神
经网络参数与电站历史运行数据之间的强相关性。对于站内负荷分配问题，ＤＱＮ模型通过综合应用上
述两种方法，显著降低了模型对经验数量的需求，提高了数据的利用率。还能够打散历史经验序列，
切断数据之间的相关性，加快模型的收敛速度。

图１ＤＱＮ模型结构

２．４模型求解模型求解可分为两个阶段：第一阶段，依据当前电站的实际负荷指令，输出所有满足
约束条件的开机方案；第二阶段，以第一阶段输出的方案为基础，综合考虑预报信息，以累计目标函
ｍ
ｆ最小为判断标准，使用ＤＱＮ算法选择电站的最优机组开机组合方案，并在此开机组合间实现
数 ∑ ｉ
ｉ＝０
最优负荷分配。求解流程如图２，计算过程如下：
第一步，读取当前电站机组的运行状态、发电水头Ｈ、实际负荷指令Ｎ、实际入库流量Ｑ等电
０
０
０
站状态，读入ｍ组预报信息，包括预测电站负荷指令［Ｎ，Ｎ，…，Ｎ］与预测入库流量［Ｑ，Ｑ，…，
１２ｍ１２
Ｑ］，初始化ｉ＝０。
ｍ
第二步，根据电站的机组运行状态，计算在保证机组稳定运行的前提下，当前机组可承担的负荷
范围［Ｎ，Ｎ］。若Ｎ＜Ｎ，则关闭一台机组并更新［Ｎ，Ｎ］，重复该动作直至Ｎ∈ ［Ｎ，
ｍｉｎ
ｍｉｎ
ｉ
ｍａｘ
ｍｉｎ
ｉ
ｍｉｎ
ｍａｘ
Ｎ］；若Ｎ＞Ｎ，则开启一台机组并更新［Ｎ，Ｎ］，重复该动作直至Ｎ∈［Ｎ，Ｎ］。判断ｉ
ｍｉｎ
ｍａｘ
ｉ
ｍａｘ
ｍｉｎ
ｍａｘ
ｉ
ｍａｘ
是否为０，若为０至第三步，若不为０至第四步。
第三步，以第二步输出的机组开机台数为基础，设置开启一台机组、关闭一台机组两种新的开机
组合方案，若以上新组合中存在满足约束条件的可行组合，则至第四步；若不存在新的可行方案，则
至第五步。
第四步，按照目标函数与约束条件，利用构建的ＤＱＮ模型快速计算输出各方案在发电水头为Ｈ，
ｉ
入库流量为Ｑ下的目标函数ｆ值并记录。更新机组的运行状态，令ｉ＝ｉ＋１，判断ｉ＜ｍ＋１是否成立，若
ｉｉ
成立至第五步，反之返回第二步。
第五步，判断方案数量，若可行方案唯一，则此方案即为电站开机组合；若有多种可行方案，
ｍ
则选取累计目标函数值ｆ最小者为电站最优开机组合。根据选定的开机组合，按照目标函数与约
∑ ｉ
ｉ＝０
束条件，利用ＤＱＮ算法计算在水头Ｈ、负荷指令Ｎ、入库流量Ｑ下的负荷最优分配［Ｎ＃，Ｎ＃，…，
０
２
０
０
１
Ｎ＃］。
ｎ
３
— １４９ —

78 79 80 81 82 83 84 85 86 87 88