Page 30 - 2024年第55卷第1期
P. 30

的问题   [7] ,目前国内外学者已经提出了诸多线段检测方法并在许多领域得到了应用。其中,霍夫变换
              ( HoughTransform,HT)是最经典的传统线段检测方法之一                  [8] ,其原理是将笛卡尔坐标系下的直线映射
              到参数空间中的点,通过对参数空间检测局部峰值来检测图像中的直线。张培宣等                                        [9] 将霍夫变换应用
              于海冰厚度识别,从而自动获取海冰厚度参数。Matas等                         [10] 提出了一种渐进概率霍夫变换方法,通过
              为图像边缘投票的方式检测边缘所在的直线,并优化了检测直线所需的计算量。Lu等                                          [11] 提出了一种
              并行霍夫变换方法,用于高清视频中的实时直线检测。除了霍夫变换外,Von等                                     [12] 为了提高线段识别
              的准确性和效率,提出了 LSD(linesegmentdetection)算法,基于梯度构建每个像素点的特征来表征其
              可能所处的直线,并通过聚类和筛选得到直线检测的结果。许承权等                                  [13] 利用 LSD不受边缘检测结果
              影响的优点,将其应用于倾斜摄影直角相控点自动检测中。Cuneyt等                              [14] 根据亥姆霍兹原理(Helmholtz
              principle)提出了线段检测器 EDLines,该方法不用进行复杂的参数调整,且运行速度比 LSD快了近 10
              倍。邵云峰等       [15] 将该方法应用于输电线路异物智能检测中,通过将 EDLines与线段融合算法结合,获
              得输电线边缘直线。Lu等            [16] 提出了 CannyLines算法,该算法提高了边缘检测的效果,大大提升了检
              测结果的准确性,极少产生误检。然而,绘制横道图的施工日志是一个包含印刷文字、表格模板、手
              绘横道图和手写文字的图像,线段种类复杂繁多、相互交错。上述传统的线段检测方法仅能对图像中
              出现的所有线段进行检测,难以将手绘横道图从施工日志的其他复杂线段中区分出来。
                  随着人工智能的发展,将深度学习模型应用于线段检测领域已成为研究热点                                    [17] 。基于深度学习的
              线段检测模型主要依靠卷积神经网络( ConvolutionalNeuralNetwork,CNN)提取图像中的线框(线段和
              交点)特征,再利用提取到的特征确定线段和交点之间的相互连接关系                                  [14] 。Huang等  [7] 首次提出线框
              解析(WireframeParsing)的概念,并训练两个分离的神经网络分别从图像中预测交点和线段的热力图,
              再通过启发式线框融合算法将两种热力图组合生成最终的线段预测结果。Xue等                                     [18] 提出了将线段检测
              问题转换为基于 AttractionFieldMap(AFM)的图像区域划分问题,该方法首先利用语义分割模型生成
              AFM,最后利用 Squeeze模块将 AFM转化为线段图。Zhou等                     [17] 在此基础上首次提出了基于卷积神经
              网络的端到端线框解析模型 LCNN,利用堆叠沙漏网络(StackedHourglassNetwork)提取特征并从交点
              热力图中生成候选线段进行预测。董斌智                    [19] 在建筑平面图结构识别的多任务模型构建中,采用 LCNN
              构建了识别表示建筑墙、门与窗等线段的线段识别模块。Xue等                               [20] 在 LCNN的基础上进行改进提出
              Holistically - AttractedWireframeParsing(HAWP)算法,增加了对线段热力图的利用,提高了算法的精度
              和效率。随后,Lin等         [21] 将霍夫变换与堆叠沙漏网络结合提出了 HT - LCNN和 HT - HAWP,将霍夫变
              换融入端到端训练的深度网络,实现全局线段信息提取并减少训练所需数据量。上述基于深度学习的
              线段检测算法广泛应用于检测复杂环境 2D图像中的线段来实现 3D人造环境重构。与传统算法相比,
              HT - LCNN能够通过挖掘图像中更加复杂、细节的特征,有针对性地提取图像中特定的线段对象,从
              而从复杂交错的线段中识别出记录施工活动时间的手绘横道图线段。然而,HT - LCNN方法大多针对
              场景图像中的结构线,对于隧洞施工日志而言,其大量表格模板、文字与待检测的手绘横道图特征相
              似,因此仍然容易受到干扰而出现识别错误。
                  综上所述,当前以手绘横道图形式记录的施工日志,其活动时间信息提取往往依赖于人工阅读与
              手动统计,存在效率低、易出错等问题。本研究提出基于改进 HT - LCNN线段检测模型的隧洞施工活
              动时间信息智能提取方法。首先,基于单应性变换对存在倾斜、旋转、扭曲的施工日志图像进行预处
              理;其次,构建手绘横道图线段智能检测的改进 HT - LCNN模型,通过在 HT - LCNN中融入全局上下
              文注意力模块 GCNet,提高网络对目标横道图线段的注意力,克服原始 HT - LCNN方法容易受到施工
              日志中表格线和文字干扰的不足;最后,将所检测的横道图线段坐标自动转化为施工活动时间信息,
              实现对活动时间信息准确、高效、自动化提取。


              2 研究框架


                  针对采用手绘横道图记录施工活动的隧洞施工日志,本研究提出基于改进 HT - LCNN线段检测模

                                                                                                 —  2 5 —
   25   26   27   28   29   30   31   32   33   34   35