Page 23 - 2023年第54卷第5期

P. 23

３．２ＨＲＮｅｔ运输车头部尾部关键点检测结果
（１）数据集准备。采集了２４０４张大场景监控视频图片制作运输车头部尾部关键点检测数据集，共
包含１７５８１个运输车样本，合计３５１６２个关键点。其中训练数据集１６８４张图片，共计１２２６８个运输
车训练样本，合计２４５３６个关键点；验证集２４０张图片，共计１７４４个运输车验证样本，合计３４８８个
关键点；测试集４８０张图像，共计３５６９个运输车测试样本，合计７１３８个关键点。使用Ｌａｂｅｌｍｅ图像
注释工具对运输车目标框及车头车尾关键点进行标注，制作数据集标签。
（２）实验结果分析。使用迁移学习对ＨＲＮｅｔ网络进行训练，加载ＩｍａｇｅＮｅｔ数据集上预训练的
ＨＲＮｅｔ模型权重，设置最大训练次数为２３０个ｅｐｏｃｈ，学习率初始为０．００１，在１７０个ｅｐｏｃｈ后变成
０．０００１，使用随机裁剪、旋转和翻转进行数据增强，Ｂａｔｃｈ为３２，使用Ａｄａｍ优化器。ＰＣＫ是衡量关键
点检测的主要评价指标［２６］，表示正确估计出的关键点比例，如式（７）所示。
Ｐｄ（ｐ）
∑ δ ｄｅｆ ( ｉ ≤ Ｔｋ )
ｋ
ＰＣＫ＝ｐ＝１ｄ（ｐ）（７）
ｉ
Ｐ
式中ｄ（ｐ）为第ｐ辆车中第ｉ个关键点预测
ｉ
ｄｅｆ
值和真实标注值的欧氏距离；ｄ（ｐ）为第ｐ辆
车目标框的尺度因子；Ｐ为总目标数。Ｔ为设
ｋ
定的第ｋ个阈值，在本研究中设为０．５；δ （ ）
为条件成立取１，不成立取０的函数。在本
研究中只有运输车头部和尾部两个关键点，平
ｋ
均精度即为两个关键点ＰＣＫ的算术平均值。
ｉ
在测试集上车头关键点的平均精度为０．８６２，
车尾关键点的平均精度为０．８２１，总平均精度
为０．８４２，图４可视化了运输车样本输出的关
键点高斯热图，验证了ＨＲＮｅｔ在大场景监控视
频中运输车车头和车尾关键点检测任务上的可
行性、有效性和较高的准确性。
３．３ＤＣＬ运输车料斗抬升细粒度分类结果
（１）数据集准备。从ＨＲＮｅｔ运输车头部尾
部关键点检测数据集中筛选了８８１５张运输车
图４运输车头部尾部关键点检测结果图
样本图片，分别包含４８００张料斗未抬升的样
本和４０１５张料斗抬升的样本，组成运输车料斗抬升细粒度分类数据集。在训练集中分别包括了４２５０
张料斗未抬升样本和３５７５张料斗抬升样本，验证集分别包括了５０张未抬升样本和４０张抬升样本，测
试集分别包括了５００张未抬升样本和４００张抬升样本。
（２）实验结果分析。使用迁移学习对ＤＣＬ网络进行训练，加载ＩｍａｇｅＮｅｔ数据集上预训练的
ＲｅｓＮｅｔ１８模型权重，设置最大训练次数为１００个ｅｐｏｃｈ，针对特征提取的骨干网络学习率初始为０．０００８，
另外３个分支网络学习率初始都为０．００８，在６０个ｅｐｏｃｈ后所有学习率都缩小１０倍，使用随机裁剪、
旋转和水平翻转进行数据增强，Ｂａｔｃｈ为３２，使用ＳＧＤ优化器。
在细粒度分类中，主要的评价指标是分类精度和计算时间［２８］。分类精度衡量了模型的准确性，如
式（８）所示。在测试集上的料斗抬升分类精度为０．９７３，料斗未抬升的分类精度为０．９６８，平均精度为
０．９７，一个Ｂａｔｃｈ的平均计算时间为０．００８５ｓ。
正确分类样本数
分类精度＝（８）
总样本数
３．４运输车卸料判断结果在运输车卸料判断实验中，本研究另外采集了４个总时长１４０ｍｉｎ１１ｓ的
视频片段，人工统计了视频中卸料运输车次和卸料时间，累计完整卸料运输车次１５０次。为了保证融

— ５２５ —

18 19 20 21 22 23 24 25 26 27 28