Page 89 - 2023年第54卷第5期
P. 89

测试数据(目标域)具有相同 的特征 空间 分布。因此,一旦 特征 空间 或 测 试数 据 分 布发 生变 化,预
              测模型将不再有效,必须基于新的数据从头开始训练和建模。但在工程领域中,很多情况下收集训
              练数据需要很高的经济成本和时间成本,如本研究中的 PCCP断丝试验成本较高,单节 PCCP埋置
              管的成本在几十万元的量 级,而且 由于管 节尺寸 较大,切 割 以 及腐 蚀预 应 力 钢 丝 存 在 相 当 大 的 难
              度,信号收集也十分不易。因此,本研究采用知识迁移的方法构建分析 PCCP断丝信号数据,利用
              已训练好的模型重 构 信 号 特 征, 并 将 重 构 的 信 号 输 入 智 能 识 别 模 型, 最 终 构 建 PCCP断 丝 识 别
              模型。
                  通过对信号的短时傅里叶变换,将信号数据生成频谱图。采用 3种深度学习模型重构信号特征,
              将深度模型在大型数据集上所学到的知识迁移到信号特征重构中去,再将重构后的信号输入到不同的
              机器学习模型中并训练,最终通过测试结果对模型性能进行评价。3种深度学习模型分别选择 ResNet、
              Inception - v4和 Inception - ResNet - v2。本文采用的这 3个模型都是在 ImageNet数据集上训练的,该数
              据集的训练部分包括 120万个数据,因此这 3个模型作为预训练模型具有较大的潜力。
              3.3 智能学习算法 如图 4所示,PCCP原始断丝信号数据是 2s,采样频率是 1kHz,因此,每组断
              丝数据包含 2000个特征维度;但利用 ResNet、Inception - v4和 Inception - ResNet - v2三种深度模型进行
              信号特征重构后,断丝信号特征的维度分别为 1000、1001和 1536。与原始的断丝信号相比,重构后
              的特征维度降低了约 500~1000维,数据维度降低后可能造成信号信息的缺失。支持向量机(Support
              vectormachine,SVM)本质上是单层神经网络结构,但其核函数能够对数据空间进行构造,将低维特
              征映射到更高维度,建立高维空间超平面来进行分析,从而将低维空间的超曲面非线性问题转化为高
              维空间超平面的线性可分问题。核函数表示为两映射函数的内积,如下式所示:
                                                 K(x,x) = φ (x)·φ (x)                                   (5)
                                                     i  j      i      j
              变量 x和 x均为低维特征向量,函数 φ表示低维特征空间到高维特征空间的映射。
                    i
                        j

















                                            图 4 PCCP断丝信号短时傅里叶变换生成频谱图

                  为了解决数据空间低维度线性不可分的问题,核函数将当前维度空间中的样本映射到高维中去,
              在高维空间建立超平面方程。但在核函数计算中,采用的策略是使用低维特征进行计算,避免高维特
              征空间产生较大的计算量,所以采用核函数是低维度的计算结果,只是这一结果与将数据映射到高维
              空间计算向量点积是等价的。所以 SVM 既能利用高维空间对数据进行分析,又能避免高维空间的巨
              大计算量。
                  除了应用 SVM以外,本研究还将多种不同类型的智能算法应用于断丝信号识别中,包括 K邻近
              算法(K - NearestNeighbor,KNN)、极端随机树(Extra - Trees,ET)和多层感知机(MultilayerPerceptron,
              MLP)。ET为树形结构模型;KNN是无监督学习算法,通过数据类间距离进行判别;MLP是多层神经
              网络。基于不同理论的方法计算过程也不相同,因此可对比分析其在断丝信号识别中的性能,建立针
              对 PCCP断丝信号的智能识别模型。图 5为 PCCP断丝信号识别方法的构建流程。
              3.4 模型性能评价 本文采用混淆矩阵和模型准确率来评价模型结果的优劣。此处以二分类为例介绍
              混淆矩阵,参见图 6。在混淆矩阵中,横轴为预测类别,纵轴为实际类别,0和 1代表不同的类别,0

                                                                                                —  5 9 1 —
   84   85   86   87   88   89   90   91   92   93   94