Page 114 - 2025年第56卷第10期
P. 114
缝图像与对应像素级标注的配对数据集(像素级标注通常由人工标注或半自动化方法生成)训练模型,
能够实现高精度裂缝分割。然而,在实际应用中,大坝环境复杂多变,样本数据集的风格差异明显,
已有的预训练模型在新场景使用时效果较差 [19] 。而针对特定场景获取足够数量标注样本既耗时又成本
高,限制了有监督方法的实际应用 [20] 。
相比之下,无监督方法无需使用标注数据,而是通过分析数据的内在特征和关系来提取有价值
的信息。根据不同的训练机制,无监督方法可以分为基于域自适应的方法 [20] 和基于图像重构 [21] 的方
法。其中,基于域自适应的方法通过分析源域与目标域的差异,对模型进行微调 [22-23] 或通过对抗训
练产生变换域的图像信息 [24] ,但在源域和目标域差异较大的场景时分割性能下降。基于图像重构的
方法 [25] 通过计算原图像与重构图像的差异分割损坏区域,但在背景噪声复杂的坝面情况下容易误
分割。
针对上述裂缝标注工作复杂以及坝体混凝土表面噪声多等问题,本文提出了一种基于注意力引导
重构网络的无监督大坝裂缝分割方法(Attention-Guided Reconstruction Network,AGR-CrackNet)。该方
法首先进行裂缝特征分析及模拟,以构造符合裂缝形貌特征的损坏图像。然后,利用包含注意力引
导机制的重构模型对裂缝区域进行重构,并通过计算重构图像与原图像的绝对差值定位裂缝区域。
最 后 , 在 两 个 数 据 集 上 对 AGR-CrackNet 的 分 割 性 能 进 行 验 证 , 并 对 其 局 限 性 以 及 扩 展 应 用 进 行
讨论。
2 裂缝特征分析及模拟
基于图像重构的无监督缺陷检测方法通常采用离散的像素方块 [25] 或规则的黑白棋盘格 [21] 作为掩膜
随机损坏图像,以生成训练数据。但在混凝土坝表面图像中,常存在大量颜色较深的噪声区域(如
图 2 所示),使得上述的重构方法在网络训练过程中误将所有颜色较深的区域识别为损坏区域进行重
构,从而在裂缝定位时引入较高的误判率。
图 2 包含大量颜色较深噪声区域的混凝土背景
混凝土裂缝图像通常具有明显的几何形状和灰度分布特征 [26] 。例如,裂缝的形态通常为方向和角
度不断变化的线状或树状 [27] ,并表现为纵向、横向以及斜向三种结构形式 [28] 。此外,混凝土裂缝的中
心区域通常具有较低的像素灰度值,且沿中心线垂直方向逐渐向两侧过渡至较高灰度值,整体呈现近
似高斯分布的特性 [29] 。在混凝土图像的随机损坏过程中,结合裂缝形貌特征的先验知识,可以生成更
符合实际裂缝特征的损坏区域,从而减少图像重构网络对噪声区域的误判。
混凝土图像的随机损坏过程可以通过将随机生成的掩膜和完好的混凝土图像逐像素点灰度值相乘
来实现 [21] 。为了更准确地模拟混凝土裂缝的几何形状和灰度分布,掩膜的生成过程设计如下:首先,
在与输入图像尺寸相同的纯白图像上,随机生成一系列方向变化的骨架点,连接相邻点形成裂缝骨
架,并随机重复上述操作以生成平行或交叉等复杂形态的裂缝骨架;然后,赋予裂缝骨架随机宽度,
并对生成的图像进行高斯卷积处理,使裂缝区域符合高斯分布;最后,应用 Frangi 滤波和形态学运
算 [30] 对生成的掩膜进行线性处理,去除非线性区域并平滑边缘,再与混凝土图像逐像素点灰度值相乘
形成符合实际裂缝特征的损坏图像。图 3 所示为损坏图像的生成过程,以及包含多种裂缝形态和结构
的损坏图像。
— 1361 —

