Page 66 - 2025年第56卷第9期
P. 66

Ollama 下载页面(https:/ollama.com/),选择 Windows 系统版本的 Ollama 下载并安装;②安装完成后在
                                   /
              Windows PowerShell 中输入 Ollama 命令验证 Ollama 是否安装成功;③Ollama 安装成功后在 Ollama 模型
                      /
              库(https:/ollama.com/library)中选择 Qwen 2.5 模型,在 Windows PowerShell 中输入 ollama run qwen2.5:7b
              下载安装并运行该模型,从而实现大语言模型的本地化部署,如图 3 所示。
                  (3)验证与实例应用。本研究采用的 QwenLLM 是经过训练和验证后的模型,因此在实现本地化部
              署后,不需要对其参数重新进行训练。为了保证模型本地化部署后的准确性,通过知识问答和其他在
              线大语言模型的对比,验证 QwenLLM 的准确性和可靠性,结果显示 QwenLLM 可以准确回答相关问
              题。在实现大模型本地化部署后,采取知识问答的方式,将长江流域 53 座控制性水库群的联合防洪
              调度规则输入到模型当中,通过询问每一个水库的防洪调度规则中的关键决策变量和阈值是什么,
              以及将其标准化为 DT 的形式。在得到 DT 调度规则后,进一步采取人工检验的方式,对基于大语言
              模型的调度规则逐一和文本进行对比验证,保证 DT 调度规则的准确性,从而得到基于大语言模型
              的 DT 调度规则库。为了确保 QwenLLM 在不同运行环境下的稳定性和一致性,对同一套输入数据进
              行了多次模型运行测试。结果表明,在多次使用 QwenLLM 对同一套输入数据进行处理时,获得的结
              果基本一致。
              3.2 DT 调度规则的决策复杂度分析方法 基于本地化部署的大语言模型得到的不同水库 DT 调度规则
              之间最显著的差异主要在于两个方面:(1)不同水库的 DT 调度规则的决策变量不同。决策变量也就是
              DT 的决策判断节点,在不同水库的 DT 调度规则中决策变量类型和位置差异导致其重要性也不一样。
              例如,本研究针对长江流域控制性水库群的防洪调度规则进行研究,因此对所有水库来说是否处于汛
              期是首要的决策变量,而降雨预报信息在三峡水库的防洪调度中是一个重要的决策变量,但是金沙江
              中游梨园水库的防洪调度规则不考虑降雨预报信息。(2)由于主要决策变量的差异导致 DT 的形式也不
              同,也就是 DT 的节点个数(Node),叶子节点个数(Leaf node),和决策深度(Depth)不同。在本研究
              中,DT 的决策深度是从根节点到最深的叶子节点之间的最长路径上的节点数,节点包括内部节点和
              叶子节点,叶子节点是 DT 中的最终节点,表示最终做出的决策。一般来说,水库群的调度规则拥有
              的决策变量越多、形式越复杂,其进行调度决策时的复杂度也越高。那么,如何度量水库群调度的决
              策复杂度,水库的防洪库容越大是否其决策的复杂度越高。
                  为了回答上述问题,基于 DT 调度规则提出了一个加权复杂度评估模型,通过 DT 深度、节点个数
              以及叶子节点个数等计算调度规则的决策复杂度,旨在评估长江流域控制性水库群防洪调度规则的决
              策复杂度。决策复杂度评估模型如下:
                                                   C = ω 1 D + ω 2 N + ω 3 L                           (1)
              式中:C 为调度规则的决策复杂度;D 为 DT 深度;N 为 DT 节点个数;L 为 DT 叶子节点个数;ω 为加权
              系数,前期的结果分析表明加权系数的不同对决策复杂度的影响较小,因此本研究取 ω =ω =ω =1/3。
                                                                                             1  2   3
                  基于上述定义,DT 调度规则中的关键决策变量个数为 N-L,通过关键决策变量在 DT 中的位置,
              从而度量相应决策变量的重要性(位于 DT 深度越低的位置,决策变量的重要性越高)。
              3.3 调度规则与水库特征之间的关联分析方法 针对水库的防洪库容越大是否其决策复杂度越高的问
              题,进一步采用相关性分析和主成分分析(Principal Component Analysis, PCA)研究 DT 调度规则和水
              库特征(库容、入库径流、位置等)之间的关联关系                       [28] 。PCA 是一种无监督学习方法,通过降维和分类
              来揭示数据中的内在结构和关联。PCA 首先通过线性变换将 p 维原始数据 X 映射到一个新的坐标系中,
                                                                                  p
              计算映射后样本协方差矩阵的特征值和特征向量,选择前 k 个特征值对应的特征向量 a 作为主成分,
                                                                                              pi
              从而将高维数据集转换为低维表示。第 i 个主成分 F 为:
                                                             i
                                                                                (i = 1,2,…,k)                     (2)
                                               F i = a 1i X 1 + a 2i X 2 + … + a pi X p
                  在第 i 个主成分 F 中,指标 X 的系数越大,表示该指标对于该主成分的贡献越大。通过对比每个
                                            p
                                  i
              指标对相应主成分的贡献度大小,可以将每个主成分划分为不同的类别,从而实现对主成分的分类。
              在本研究中,由于水库群的特征变量包含库容大小、入库径流量、空间位置等,很难用一个特定的指

                — 1170   —
   61   62   63   64   65   66   67   68   69   70   71