Page 102 - 2023年第54卷第2期
P. 102
始流量的 1%,可通过预处理将 1%替换成数字 0,若通过 Softmax层输出的概率分布中最大概率值所在
索引为 0,则说明预测正确;由于每一个样本中不同时刻的瞬态压力值可能相差较大,为将数据归一
化到同一个维度,消除比重不平衡问题,使用零均值化,经过该标准化处理后的数据均值为 0,标准
差为 1,标准化公式如下:
x
x - 珋
x = (8)
σ
x为
式中:x 为标准化之后的样本数据;x为输入的样本数据; 珋 样本数据的均值;σ为样本数据的标
准差。
3.2 评价指标 采用准确率来评估模型分类性能,定义为预测正确的样本数占所有样本数的比例:
TP + TN
Acc = × 100 % (9)
TP + FP + TN + FN
由于打乱后的测试样本数据存在各类别样本数不等的问题,因此增加精确率、召回率、F值 3个
1
指标对模型的泛化能力进行评估。其中,精确率 P为真实为正样本预测为正样本占所有预测为正样本
的比例,召回率 R为真实为正样本预测为正样本占实际正样本的比例,F值综合考虑了精确率和召回
1
率两个评价指标,其范围为[ 0,1],当值越接近 1则说明模型的分类能力越好。各评价指标的计算公
式如下:
TP
P = × 100 % (10)
TP + FP
TP
R = × 100% (11)
TP + FN
2PR
F = × 100 % (12)
1
P + R
式中:TP为真实为正样本,预测为正样本;FP为真实为负样本,预测为正样本;FN为真实为正样
本,预测为负样本;TN指的是真实为负样本,预测为负样本。
3.3 模型训练及超参数优化 使用预处理的数据集对模型进行训练,在训练过程中对超参数不断优
化。模型训练过程中使用 Adam优化器;卷积层和全连接层 中 的 激活 函 数 均使 用 ReLU函数,配合
Adam优化器以加快收敛速度;为实现自适应学习率调整,使用指数衰减学习率。模型的详细参数如
表 2所示。
表 2 MS1DCNN模型详细参数
参数 数值 参数 数值 参数 数值
卷积核数量(通路 1) 128,128 卷积核步长(通路 1—4) 3,3,3,1 初始学习率 0.02
卷积核数量(通路 2) 64,64 全连接层大小 128 衰减率 0.9
卷积核数量(通路 3) 32,32 Softmax层大小(数据集 L) 199 Dropout系数 0.5
卷积核数量(通路 4) 16 Softmax层大小(数据集 Q) 20 最大迭代次数 200
池化层尺寸和步长 6 × 1,1 Softmax层大小(数据集 K) 5 BatchSize 64
卷积神经网络的训练过程的本质是采用误差反向传播法不断进行权重更新的迭代过程,在迭代过
程中,使损失函数值最小或降低到某一阈值。本文选择使用交叉熵损失函数计算 Softmax输出的概率
分布 q(x)与真实概率 p(x)分布之间的距离,损失函数公式如下:
∑
loss = H(p,q) =- p(x)logq(x) (13)
x
在其他超参数确定的前提下,为比较卷积核的多尺度对模型性能的影响,采用 8种不同卷积核尺
寸组合进行模型对比实验。使用数据集[ Q]对各模型随机进行 10组实验并取平均值作为最后测试结
果,如表 3所示。对比实验结果可知,当网络结构中通路 1至通路 4中卷积核的尺寸分别为 5 × 1、3 × 1、
6
— 2 2 —