Page 80 - 2024年第55卷第11期
P. 80

于连续空间的优化问题,易于实现和理解,并行处理能力强,但容易陷入局部最优解;蚁群算法模拟
              蚂蚁寻找食物的行为,适用于路径规划、调度等组合优化问题,可通过信息素更新机制搜索近似最优
              解,但其收敛速度慢、计算成本较高;遗传算法模仿自然选择的过程,适用于函数优化、调度问题
              等,其全局搜索能力强,可用于解决离散或连续问题,但寻优耗时长,易陷入局部最优。强化学习
              ( ReinforcementLearning,RL) [20] 可使计算机在与环境的交互中学习策略,比遗传算法、粒子群算法等
              具有更强的复杂环境适应能力,目前在水电调度领域已有一定研究                                 [21] 。例如,运用 HSARSA算法优
              化水库长期调度策略          [22] 、利用 Q - Learning算法解决水风光短期运行问题              [23] 等,但早期强化学习算法
              因探索与利用平衡难、奖励稀疏、状态空间高维、环境非静态、策略评估复杂、局部最优、泛化能力
              差等问题,存在训练效率低、学习效果不稳定等不足。DQN(DeepQNetwork)算法是一种将深度学习
              中的神经网络和强化学习中的 Q - learning算法相结合的 RL算法,其可利用神经网络输出动作价值,
              经有效训练后可显著提高决策效率。站内负荷分配需协调不同发电机组间的负荷分配,分配动作个数
              多。水电站的状态包括水库水位、入库流量、发电机组运行状态和电网负荷需求等,状态复杂。而
              DQN算法适用于处理高维状态和连续动作空间,契合水电站站内负荷分配问题的特性。同时,该算法
              可不断学习并适应环境变化,优化负荷分配策略,这与水电站负荷分配中需要制定并执行最优发电策
              略的需求相吻合,因此,DQN算法与多状态、多动作的水电站内负荷分配问题相匹配,具有很强的应
              用潜力。
                  本文建立基于 DQN算法的水电站站内负荷优化分配方法,灵活满足不同时期多样变化的水利 - 电
              力调控要求,提高复杂工况下分配决策的效率和精度。首先,建立站内负荷优化分配模型,在完成电
              站负荷指令要求的前提下,通过灵活调整机组启停和负荷分配策略,满足水位或流量的调控要求。其
              次,采用具有大数据学习能力与高维度问题求解能力的 DQN算法,研究模型求解流程和计算方法,
              实现复杂解空间的高效寻优。最后,以大渡河流域的枕头坝水电站为实例,开展应用研究。


              2 基于 DQN的站内负荷优化分配模型


                  基于 DQN算法的站内负荷优化分配模型由两部分组成:(1)建立兼顾电站水利 - 电力调控需求的
              目标函数和约束集合,解决既往负荷优化分配 “重视电量调节需求(即电调)、忽略水量调节需求(即
              水调)” 问题;( 2)采用具有高效求解能力的 DQN算法,利用其在训练后可快速、准确输出最优决策
              的特性,提升电站负荷分配的速度与精度。
              2.1 负荷分配模型 水电站运行需要兼顾发电、防洪、航运等多目标调节需求,不同调度时期的目标
              优先级不同,重点调控对象也有差别。例如,汛期以防洪任务为主,电站运行主要以保证自身安全或
              下游防洪控制点安全为目标,按照 “控水位” 或者 “控出库” 的方式运行;枯水期以发电任务为主
              时,按照满足电力系统电量供给和电力调节的 “控出力” 方式运行。既往以耗水量最小为调度目标的
              负荷分配模型,主要适用于以发电为主的节水增发时期,存在重电调、轻水调的弊端。为此,本文构
              建了兼顾水电站电调、水调需求的负荷优化分配模型,其目标函数如下:
                                                         n total
                                          f = min Q target,t ∑ Q(N ,H) + cQ publish                     (1)
                                                       -
                                                                     t
                                                                i,t
                                                         i =1
              式中:f为站内负荷分配模型的目标函数;Q                     target,t 为 t时刻目标流量;Q(·)为发电耗流量函数,表示
              发电耗流量与水头、机组出力之间的函数关系;N 为 t时刻第 i台机组的出力;H为 t时刻发电水头;
                                                            i,t                          t
              n 为电站的机组总数;c为当前时段机组开机台数与上一时段机组开机台数之差的绝对值;Q                                             publish 为
               total
              机组启停机耗流量。
                  目标函数的核心是控制电站发电流量尽可能接近目标流量 Q                                。当以发电为主要任务需要 “控
                                                                         target,t
              出力” 时,目标流量可设定为水电站满足生态、航运等要求的最小下泄流量(见式( 2));当以下游防
              洪控制点的安全为主要任务需要 “控出库” 时,目标流量可设置为下游安全泄量(见式( 3));当以水
              电站水库自身防洪为主要任务需要 “控水位” 时,目标流量可由式(4)计算,实现满足负荷指令的同

                —  1 3 6 —
                     4
   75   76   77   78   79   80   81   82   83   84   85