低信噪比环境下超声细微缺陷特征提取的协同增强网络方法

张旭; 辜远航; 郭玉琳; 吴樵; 冯盛; 苏歆然

doi:10.15983/j.cnki.jsnu.2026205

陕西师范大学学报(自然科学版) >

2026 , Vol. 54 >Issue 2: 41 - 52

DOI: https://doi.org/10.15983/j.cnki.jsnu.2026205

超声无损检测专题(主持人:李卫彬　邓明晰)

低信噪比环境下超声细微缺陷特征提取的协同增强网络方法

张旭 ^,¹^,^* ,
辜远航 ¹ ,
郭玉琳 ¹ ,
吴樵 ¹ ,
冯盛 ² ,
苏歆然 ³

展开

¹ 湖北工业大学机械工程学院湖北省现代制造质量工程重点实验室, 湖北武汉 430068
² 咸宁市质量与标准化研究中心, 湖北咸宁 437000
³ 浪潮云洲工业互联网有限公司, 山东济南 250101

^* 张旭,女,副教授,研究方向为智能无损检测技术。E-mail:zhangxu@mail.hbut.edu.cn

收稿日期: 2025-09-27

网络出版日期: 2026-03-24

基金资助

国家自然科学基金(52205564)

收起

A collaborative enhancement network for subtle ultrasonic defect feature extraction under low signal-to-noise ratio conditions

ZHANG Xu ^,¹^,^* ,
GU Yuanhang ¹ ,
GUO Yulin ¹ ,
WU Qiao ¹ ,
FENG Sheng ² ,
SU Xinran ³

Expand

¹ School of Mechanical Engineering, Hubei Key Laboratory of Modern Manufacturing Quality Engineering, Hubei University of Technology, Wuhan 430068, Hubei, China
² Xianning Quality and Standardization Research Center, Xianning 437000, Hubei, China
³ Inspur Cloud Continent Industrial Internet Co., Ltd., Jinan 250101,Shandong, China

Received date: 2025-09-27

Online published: 2026-03-24

Fold

摘要

针对低信噪比环境下超声细微缺陷特征提取难题,提出一种适用于低信噪比超声信号的门控残差与双级压缩-激励(squeeze and excitation, SE)注意力协同增强网络。该模型以卷积神经网络(convolutional neural network,CNN)为基础,通过残差块-SE模块-池化级联结构,在残差块内部嵌入普通SE模块进行初步通道筛选,在网络末端利用局部增强SE模块聚焦峰值信号,并采用门控残差连接从而动态保留原始细微特征,实现噪声抑制与特征增强的协同优化。结果显示:改进后模型的均方根误差(root mean square error,RMSE)均值为0.068 3、平均绝对误差(mean absolute error,MAE)均值为0.047 1,较基准CNN分别降低49.7%、41.7%,且模型显著优于仅使用单一注意力或残差块的改进模型,验证了双机制协同的优越性,且训练稳定性突出,低信噪比环境下仍保持高精度。所提模型的预测精度、抗干扰能力及稳定性显著优于传统方法与现有模型,为钢管超声无损检测提供高效技术方案,具有重要工业应用价值。

关键词： 无损检测; 缺陷长度预测; 卷积神经网络; 压缩与激励机制; 残差网络; 超声成像

本文引用格式

张旭 , 辜远航 , 郭玉琳 , 吴樵 , 冯盛 , 苏歆然 . 低信噪比环境下超声细微缺陷特征提取的协同增强网络方法[J]. 陕西师范大学学报(自然科学版), 2026 , 54(2) : 41 -52 . DOI: 10.15983/j.cnki.jsnu.2026205

Abstract

To address the challenge of extracting subtle ultrasonic defect features in low signal-to-noise ratio environments, this study proposes a gated residual and dual-attention collaborative enhancement network for low SNR ultrasonic signals. Based on convolutional neural network, the model adopts a ‘residual block squeeze-excitation(SE) module-pooling’ cascaded structure: a standard SE module is embedded in the residual block for initial channel screening, a locally enhanced SE module is used at the end of network stages to focus on peak signals, and gated residual connections are employed to dynamically preserve original subtle features, thus realizing collaborative optimization of noise suppression and feature enhancement. Experimental results show that the improved model achieves a mean root mean square error (RMSE) of 0.068 3 and a mean absolute error (MAE) of 0.047 1, which are 49.7% and 41.7% lower than those of the baseline CNN, respectively. It also outperforms models with only a single attention mechanism or residual blocks, verifying the superiority of dual-mechanism collaboration, while exhibiting excellent training stability and maintaining high accuracy in low SNR environments. In conclusion, the proposed model effectively overcomes the bottlenecks of noise interference and subtle feature learning. Its prediction accuracy, anti-interference capability, and stability are significantly superior to traditional methods and existing models, providing an efficient technical solution for ultrasonic non-destructive testing of steel pipes with important industrial application value.

Key words： nondestructive testing; defect length prediction; CNN; squeeze and excitation mechanism; residual neural network; ultrasonic imaging

在能源、石化及基础设施等工业领域,钢管道是流体运输的“生命线”。然而,管道在长期运行中,因制造缺陷(如焊趾裂纹)、服役应力(如应力腐蚀开裂)等会产生表面开口裂纹,此类缺陷若未及时精准检测与表征,可能引发泄漏、爆炸等严重安全事故,造成巨大经济损失与环境污染^[1]。在此背景下,无损检测技术成为保障管道运行安全的核心手段,其能在不破坏管道结构的前提下实现缺陷的检测、定位与表征,进而延长设备寿命、降低维护成本,为工业安全提供有力支撑。

在管道无损检测领域,搭载超声阵列的“清管器”内检测是应用最广泛的技术方案。清管器可沿管道行进数十公里,以1~10 mm间隔采集超声数据,通过后续分析重构缺陷信息^[1]。但该技术体系中的传统缺陷定径方法存在显著局限,以经典的6 dB下降法为例,其通过矩形框包裹超声图像中信号峰值6 dB范围内像素估算缺陷尺寸,实际应用中面临3大问题:一是预测精度低,针对长度1~5 mm、倾角最大20°的裂纹,长度与角度预测平均绝对误差分别达±1.1 mm和±8.6°;二是复杂场景适应性差,大倾角缺陷的弱反射信号易被排除在6 dB范围外,导致严重“欠定径”(如20°倾角缺陷欠定径达2.1 mm);三是无法利用多图像信息,仅依赖单一视图定径,难以整合多组超声视图的互补缺陷特征^[1]。这些局限使传统方法难以满足现代工业对管道缺陷高精度检测的需求。

机器学习的兴起为突破传统无损检测方法瓶颈提供了新路径^[2]。从广义上看,机器学习可分为浅层学习和深度学习两类。浅层学习在无损检测领域的应用可追溯至1991年,当时研究人员利用决策树,通过超声壁面反射的幅度损失来检测缺陷^[3],此后该领域的研究从未中断^[4]。例如:全连接神经网络已被用于根据超声测量结果对缺陷进行分类^[5-6]和估算材料属性^[7-8];支持向量机则被用于通过涡流场峰值来确定裂纹尺寸^[9]。浅层学习的优势在于,通过人工筛选参数,可降低输入数据的维度,进而减少训练所需的网络复杂度,同时降低对训练数据量的要求。然而,浅层学习网络的性能高度依赖于特征参数的正确选择,且大量可能有用的信息会被闲置。相比之下,深度学习因能够利用所有可用信息,生成更精准的结果^[10-11],同时提高自动化程度,降低人为误差导致错误的概率^[12]。

随着深度学习技术的突破,卷积神经网络凭借优异的局部空间特征提取能力,成为无损检测领域核心研究热点^[13-16]。与传统人工设计特征的方法不同,CNN以数据驱动方式自适应挖掘缺陷本质特征,适配无损检测领域缺陷形态多样、信号复杂的场景。CNN的“端到端”学习模式,更是突破了浅层学习的人工特征选择局限^[3]。此外,卷积神经网络在自然图像^[17]、医学图像^[18-20]及无损检测图像^[21-24]的处理中均已取得广泛成功。

然而,基于CNN的无损检测(nondestructive testing,NDE)模型研究在实际工程应用中仍存在明显不足。深度学习在无损检测中的核心挑战之一是低信噪比环境下的特征区分难题^[25],现有模型常因噪声抑制与特征保留失衡导致精度下降。一方面,多数模型侧重增加网络深度或宽度,却忽视对特征通道的针对性处理,对所有通道实施无差别化对待,难以抑制钢材晶粒噪声等结构噪声,无法有效凸显裂纹相关有效信号^[26]。另一方面,随着网络深度增加,梯度衰减问题凸显,制约了模型对短裂纹、小角度倾斜裂纹等复杂缺陷细微特征的学习能力^[3]。因此,如何在深层架构中实现对有效特征通道的提纯与对细微梯度的保护,成为当前研究的核心瓶颈。

为应对上述挑战,本文提出一种融合双级SE注意力机制与残差网络^[27]的双机制协同增强CNN架构,旨在突破现有模型在低信噪比环境下细微缺陷特征提取的瓶颈。该架构的核心贡献在于,其并非简单地堆叠模块,而是通过两方面的协同设计解决关键问题:首先,利用双级SE注意力机制对特征通道进行自适应重标定,使模型能够智能地“聚焦”于包含裂纹关键信息的通道,同时抑制噪声主导通道的干扰,从而有效解决低信噪比难题。其次,通过引入带跳跃连接的残差块构建梯度传递的“信息高速公路”,有效克服深层网络训练中的梯度衰减问题,显著提升模型对短裂纹、倾斜裂纹等细微形态的表征与学习能力。最后,通过“残差块-SE模块-池化”结构实现特征提取与特征优选的解耦与高效串联。通过详尽的消融实验证明,这种协同设计实现了超越单一机制的性能飞跃,为复杂信号背景下的高精度回归任务提供了新的架构思路,也为工业领域NDE技术的智能化升级提供了高效可靠的技术方案。

1 模型设计与实现

1.1 模型架构

1.1.1 基础CNN架构

本研究构建的模型基于CNN^[1](如图1所示),其采用“特征提取子网络+回归预测子网络”的2段架构。

显示原图|下载原图ZIP|生成PPT

图1 基准CNN完整模型架构图

注:网络版为彩图。

Fig.1 Schematic diagram of the complete architecture of the baseline CNN

特征提取子网络:包含多层卷积操作,卷积核尺寸多为3×3且通过填充(padding)以保持特征图边界信息,通道数依次经历4→48→96→192的变化;部分卷积层后紧跟ReLU激活函数,引入非线性特征表达。除特定卷积层外,多个卷积层后衔接2×2最大池化且步长为2,通过逐步缩小空间维度与增加通道数,实现超声图像中相关特征的抽象与降维。

回归预测子网络:以多层全连接网络为核心,先通过扁平化(flatten)操作将特征提取子网络输出的特征图转换为向量,再依次通过多组全连接层,最终输出单一数值作为预测结果;中间部分全连接层后加入Dropout层,通过随机丢弃部分神经元抑制过拟合。

虽然该基础网络能处理超声图片,但在实际场景中存在局限:一是对通道特征处理缺乏针对性,可能无法有效区分有效信号与噪声的重要性,导致关键特征受干扰;二是深层网络训练时易出现梯度相关问题,难以学习细微特征。为此,引入双级SE注意力机制与残差块对网络进行改进。

1.1.2 基于SE注意力机制与残差连接的增强型CNN架构

针对基准CNN模型在钢管超声无损检测中面临的噪声干扰和深层特征学习瓶颈,本文提出融合双级SE注意力模块与残差块的增强型CNN架构。该架构的核心设计逻辑是通过双级SE注意力模块精准筛选超声图像中短缺陷的有效特征、抑制噪声干扰,借助残差块构建梯度传递“高速通道”以保护短缺陷的细微特征,两者协同形成“特征精准提取-梯度高效传递”的闭环。

SE注意力机制作为一种轻量级通道注意力模块,能够根据输入特征的重要性进行自适应加权。在钢管超声图像中,背景噪声与缺陷信号并存,传统CNN模型难以有效区分。本文设计的“残差块-SE模块-池化”的高效级联结构(见图2),通过分场景嵌入两种SE变体,进一步强化了对钢管超声图像的特征筛选能力。

显示原图|下载原图ZIP|生成PPT

图2 增强型CNN完整模型架构图

注:网络版为彩图。

Fig.2 Schematic diagram of the complete architecture of the enhanced CNN

对于SE模块的“压缩-激励”过程,设输入特征图为X∈R^B^×^C^×^H^×^W(B为批量大小,C为通道数,H、W为特征图高、宽),首先通过池化操作完成“压缩”,将二维特征图转化为一维通道全局信息Z∈R^B^×^C;再通过全连接网络完成“激励”,输出各通道的权重系数ω∈R^B^×^C,最终加权得到输出特征Y=X·ω(·为通道维度的逐元素相乘)。

考虑到钢管缺陷特征可能存在局部峰值信号,本研究在网络阶段末尾嵌入局部增强SE模块,该模块在压缩操作中额外引入全局最大池化公式

(1) ${z}_{c}^{max}$= $ma{x}_{i=1}^{H}ma{x}_{j=1}^{W}${X_c_,_i_,_j}。

式中,

${z}_{c}^{max}$

为第c个通道的局部峰值信息。将全局平均特征z与局部峰值特征z^max沿通道维度拼接,得到融合特征z_fuse=[z,z^max]∈R^B^×2^C;再输入全连接网络学习权重ω_c,其公式为

(2)ω_c=σ(W'₂·ReLU(W'₁·z_fuse,_c))。

式中:W'₁、W'₂为局部增强SE的全连接层参数;σ为Sigmoid函数。这种设计能更精准地捕捉缺陷局部关键特征,进一步强化与缺陷相关的关键通道权重,同时深度抑制背景噪声干扰,其原理如图3所示。

显示原图|下载原图ZIP|生成PPT

图3 残差块-SE模块-池化级联结构图

Fig.3 Schematic diagram of the cascaded structure of residual block-SE module-pooling

另外,残差块中主路径模块细节如图4所示。该模块在压缩操作中仅执行全局平均池化,公式为

(3)z_c= $\frac{1}{H\times W}{\sum }_{i=1}^{H} {\sum }_{j=1}^{W} $X_c_,_i_,_j。

式中,z_c为第c个通道的全局平均信息。随后计算全连接网络学习权重ω_c,其表达式为

(4)ω_c=σ(W₂·ReLU(W₁·z_c))。

式中:W₁、W₂为全连接层参数;σ为Sigmoid函数。由于残差块是特征提取的基础单元,采用轻量化的普通SE模块可在控制计算复杂度的前提下,初步抑制与噪声相关的冗余通道,为后续特征融合奠定基础。通过这种“分层级、分场景”的SE模块嵌入策略,模型可在特征提取的不同阶段动态优化通道权重。既通过普通SE模块实现基础噪声过滤,又通过局部增强SE模块聚焦缺陷核心特征,最终显著提升对钢管超声图像的特征表达效率和抗噪声能力,为后续长度预测任务提供高质量的特征输入。

显示原图|下载原图ZIP|生成PPT

图4 残差块中主路径模块细节图

Fig.4 Detailed diagram of the main path module in the residual block

残差网络的引入旨在解决深层网络训练中普遍存在的梯度消失问题。在超声缺陷检测任务中,细微的裂纹特征需要通过多层网络进行传递和学习。当网络深度增加时,梯度衰减会导致这些重要特征信息在传递过程中逐渐丢失,影响最终的预测精度。本文设计的“残差块-SE模块-池化”的高效级联结构进一步适配了钢管超声图像的特征提取需求。

传统残差块通过捷径连接构建梯度“高速通道”,设残差块输入为x_l_-1,主分支输出为F(x_l_-1,K)(K为卷积层和SE模块参数,F为扁平化函数),捷径分支输出为S(x_l_-1)(通道数匹配时为恒等映射S(x)=x,不匹配时通过1×1卷积S(x)=K_s·x调整维度,K_s为1×1卷积参数),则残差块基础输出公式为

(5) ${x}_{l}^{base}$=F(x_l_-1,K)+S(x_l_-1)。

反向传播时,对损失函数L求输入x_l_-1的梯度

(6)$\frac{\partial \mathscr{L}}{\partial \boldsymbol{x}_{l-1}}=\frac{\partial \mathscr{L}}{\partial \boldsymbol{x}_{l}} \cdot\left(\frac{\partial F}{\partial \boldsymbol{x}_{l-1}}+\frac{\partial S}{\partial \boldsymbol{x}_{l-1}}\right) 。$

当S(x_l_-1)=x_l_-1时(即恒等映射),$\frac{\partial \mathscr{L}}{\partial \boldsymbol{x}_{l-1}}=\boldsymbol{I}$(单位矩阵),梯度可通过“+I”项保持非零,实现跨层直接传播,有效保护浅层学习到的细节特征。

较于传统残差块的“简单特征叠加”,本文的门控残差块额外引入门控模块,通过1×1卷积与Sigmoid函数计算动态权重

(7)α=σ(K_g·F(x_l_-1,K))。

式中,K_g为门控模块1×1卷积参数。最终通过公式动态融合主分支与捷径分支

(8)x_l=α·F(x_l_-1,K)+(1-α)·S(x_l_-1)。

式中,α∈[0,1]为逐像素权重系数。这种机制对钢管超声图像的适配性极强:当输入特征中缺陷信号微弱时,α自动降低主分支的权重,提升捷径分支即原始缺陷细节的权重;当输入特征中缺陷特征清晰时,则增大主分支的权重。

通过这种“按需分配权重”的方式,模型既能避免噪声对缺陷特征的干扰,又能充分利用深层抽象特征的表达能力,进一步提升对复杂噪声环境下钢管缺陷的特征传递效率。

1.2 数据来源与处理

本研究的数据来源于文献[1]。图像数据的采集采用5 MHz、40阵元相控阵探头阵列,以水为耦合介质,对厚度τ=10 mm的不锈钢试块进行检测(见图5)。探头与试块表面间距ε=20 mm,通过发射平面波在试块内激发ϕ=45°的横波, 实现对表面开口裂纹的多维度信号采集。实验中,裂纹的物理属性(倾斜角度θ、实际长度L)通过机械加工精准控制,覆盖角±20°、长度1~5 mm的多类缺陷场景。对全矩阵捕获的原始超声数据,通过延迟求和算法进行成像处理,生成4类不同视角的超声图像。不同视图由探头阵列与波形的组合决定,可分别凸显裂纹的尖端衍射、边界反射等关键特征,为后续特征分析提供多维度视觉信息。生成的图像数据以MATLAB矩阵格式存储,确保数据的可解析性与后续模型的兼容性,为裂纹特征分析与模型训练奠定可靠基础。

显示原图|下载原图ZIP|生成PPT

图5 超声裂纹检测数据集制作流程示意图

Fig.5 Schematic diagram of the production process of the ultrasonic crack detection dataset

文本标注数据来源于图像中裂纹的实际物理属性。通过提取裂纹视图位置、检测角度及实际长度等关键信息(见图 5),确保标签与图像内容精准匹配。该数据集聚焦超声无损检测场景,涵盖13组实验样本,每组包含135个“图像-标签”配对数据,样本覆盖多类裂纹视图位置、超声检测角度及裂纹长度,可充分支撑模型对超声裂纹特征的学习与泛化能力训练。

图像数据为经预处理的多通道超声特征矩阵,对应图像的分辨率为32×32像素,能精准记录裂纹区域的超声反射信号,清晰反映裂纹的形态轮廓与空间位置信息。自主制作的文本标注数据以结构化形式存储,记录裂纹实际长度且作为回归预测目标,并通过与图像文件统一的命名规则实现对应,确保每个超声图像样本均能匹配唯一的真实裂纹长度标签,为模型训练提供明确目标参考。

数据预处理阶段围绕模型输入适配与信号一致性优化展开。对图像数据进行维度格式转换,将原始“高度-宽度-通道”格式调整为深度学习模型常用的“通道-高度-宽度”格式,满足卷积运算对数据维度的要求。针对多通道超声信号的强度差异问题,采用通道级标准化处理,将各通道像素值统一映射至[0,1]区间,有效消除信号强度波动对模型训练收敛性的干扰,同时将图像数据与自主制作的文本标签数据均转换为适配模型计算精度的数值类型,保障后续计算过程的稳定性。

数据集划分采用分层抽样策略,按0.7∶0.15∶0.15的比例将全量数据划分为训练集、验证集与测试集。训练集占比70%,用于模型核心参数的迭代学习,确保模型充分掌握裂纹特征规律;验证集占比15%,用于实时监控训练过程中的过拟合风险,并动态调整学习率等超参数以优化模型性能;测试集占比15%,全程独立于训练流程,仅用于最终评估模型的泛化性能,避免训练过程对评估结果的干扰。划分过程中严格保持各子集的裂纹长度分布特征与全量数据一致,有效规避因样本分布偏差导致的实验结果失真问题。

1.3 训练与测试配置

本研究以前文提及CNN为基础架构,针对裂纹长度回归预测任务进行改进。使用32×32×4的输入维度设计以适配4通道超声特征,在卷积层间引入SE注意力机制模块以增强关键特征提取能力,并加入残差连接块优化深层网络训练的梯度流动。模型由特征提取与回归预测两部分构成,特征提取通过多组卷积(3×3)、批归一化、ReLU激活及最大池化实现特征降维,回归预测部分通过全连接层压缩特征维度并输出单一长度预测值。

训练参数设置结合改进模型特性微调。选用Adam优化器,设置初始学习率0.001以平衡参数更新效率与收敛稳定性,配合0.000 1的权重衰减通过L2正则化抑制过拟合;损失函数采用均方误差损失函数(MSE Loss),契合长度预测任务对绝对偏差优化的需求。批处理大小设为32,结合两张NVIDIA GeForce RTX 4080 Ti显卡的硬件,保证单批次数据显存占用合理。训练过程采用多层级控制策略,最大训练轮次100轮,预留足够迭代次数让SE注意力模块充分学习通道权重;早停策略设置参数patience为20,当验证集损失连续20轮未下降时终止训练;搭配ReduceLROnPlateau学习率调度(耐心值为10、衰减因子为0.5),在验证损失停滞时将学习率减半,确保后期参数精细调整。

硬件平台配备双NVIDIA RTX 4080 Ti显卡,并基于Ubuntu 22.04操作系统搭建训练环境。软件架构上,以Python 3.10为基础,依托PyTorch 2.6.0深度学习框架构建模型训练流水线,集成scipy.io实现mat格式数据解析、scikit-learn完成评估指标计算等辅助功能。

结合钢管缺陷长度回归预测任务对检测精度、整体误差分布及异常值敏感性的核心需求,构建以均方根误差(RMSE)和平均绝对误差(MAE)为核心的评价体系,二者从不同理论维度实现对模型性能的量化评估。

RMSE计算公式为

(9)$V_{\mathrm{RMSE}}=\sqrt{\frac{1}{n} \sum_{i=1}^{n}\left(y_{i}-\hat{y}_{i}\right)^{2}}$。

式中:y_i为第i个样本的真实缺陷长度;

${\widehat{y}}_{i}$

为模型预测值;n为样本总数。MAE计算公式为

(10)$V_{\mathrm{MAE}}=\frac{1}{n} \sum_{i-1}^{n}\left|y_{i}-\hat{y}_{i}\right| 。$

式中:y_i为第i个样本的真实缺陷长度;

${\widehat{y}}_{i}$

为模型预测值;n为样本总数。

2 实验结果与分析

2.1 对比实验设计

为系统验证双级SE注意力机制、残差块及两者协同作用对超声检测裂纹长度回归性能的提升效果,本研究以基础CNN为基准,通过控制变量法设计4个对照模型,确保实验条件一致。

4个模型均基于“特征提取子网络+回归预测子网络”框架,差异仅在于改进模块的集成情况,各模型结构参数与设计目标见表1所示。

表1 模型结构特征

Tab.1 Characteristic of model structures

编号	模型结构	结构特征
Model-1	基础CNN模型	沿用原有CNN架构
Model-2	基础CNN+SE模块	特征提取子网络每级卷积块后嵌入局部加强SE模块
Model-3	基础CNN+残差块	特征提取子网络通道数变化处构建SE门控残差块
Model-4	本文模型(CNN+SE+残差块)	残差块输出端嵌入SE模块,形成“残差块-SE模块-池化”结构

Model-1作为性能基线,与改进模型对比,验证网络架构的基础性能;Model-2单独验证SE机制对通道特征判别性的提升,评估其抑制超声噪声的效果;Model-3单独验证残差块对深层网络梯度传递的优化,评估其学习短裂纹等细微特征的能力;Model-4验证SE机制与残差块的协同效应,评估两者叠加对复杂裂纹表征精度的提升。

2.2 性能对比

为系统验证双级SE注意力机制、残差块及其协同作用对超声检测裂纹长度回归预测模型的优化效果,本研究对4个目标模型分别开展10次独立训练实验,通过多轮重复验证规避单次实验的偶然性误差,以RMSE与MAE为核心指标,综合评估模型的预测精度、训练稳定性及实际应用潜力。基于4个对照模型的实验结果如图 6所示。

从图6中可以看出,模型性能呈阶梯式提升,且精度与训练稳定性表现出显著的正相关特征。在预测精度层面,协同改进的Model-4表现最优,其RMSE均值低至0.068 3,较基准Model-1降低49.7%,MAE均值为0.047 1,较基准降低41.7%;单残差块改进的Model-3次之,RMSE与MAE均值分别为0.086 0与0.059 5,较基准的降幅分别达36.7%与26.4%;而单SE机制的Model-2提升效果有限,RMSE均值仅降至0.126 7,较基准降6.7%,MAE均值基本持平,仅略低于基准Model-1的0.080 8。导致此结果的可能原因是在深层网络中,若没有残差连接保护梯度,许多包含裂纹尖端衍射等信息的细微特征在传递过程中已经丢失。残差块对深层网络梯度传递的优化作用提升了模型对短裂纹细微特征的学习能力,而SE机制需与残差块协同才能充分发挥通道特征强化价值,单独应用时对精度的增益有限。

显示原图|下载原图ZIP|生成PPT

图6 不同参数损失值随实验次数的变化

Fig.6 Different loss value changing with the number of independent training runs

在训练稳定性方面,模型精度越高,10次训练结果的波动越小:Model-4的RMSE标准差仅0.002 5,MAE标准差为0.002 0,是所有模型中唯一标准差低于0.003的模型,其RMSE与MAE的极差分别仅为0.007 6与0.006 2,表现出极强的抗波动能力;相比之下,基准Model-1的稳定性最差,RMSE标准差达0.009 8,MAE标准差为0.006 3,极差分别为0.027 6与0.017 5,说明未引入特征优化机制的基准模型,易受初始化参数、数据批次抽样等随机因素影响,预测结果一致性较差。值得注意的是,Model-4的性能边界优势显著,其RMSE与MAE的最高值(0.071 2、0.049 6)仍低于Model-3的最低值(0.081 5、0.054 6),意味着即使在训练条件波动的情况下,Model-4仍能保持优于其他模型最优表现的精度水平,为工业场景中对超声裂纹检测的高精度需求提供了可靠保障。

实验不仅验证了“残差块-SE机制”协同结构的有效性,更通过多轮数据积累,为模型的性能评估与应用场景划分提供了科学依据,避免了单次实验可能导致的误判风险,提升了研究结论的可信度与实用价值。

2.3 可视化结果分析

2.3.1 学习曲线分析

为展现训练动态,发现过拟合、梯度消失等问题,借助学习曲线实现全流程监控,验证模型在实际场景的泛化稳定性。对目标模型各开展10次独立训练,选取其中一次实验数据,按固定间隔记录该次实验中的训练与验证损失,据此绘制成学习曲线(见图7)。

显示原图|下载原图ZIP|生成PPT

图7 训练与验证MSE损失值随轮数变化的曲线图

注:V_MSE= ${V}_{RMSE}^{2}$,网络版为彩图。

Fig.7 Curves of training and validation MSE loss values changing with epochs

从图7中可以看出,训练损失和验证损失的变化趋势基本一致,且在训练后期,验证损失与训练损失差距较小。这说明4个模型都没有出现明显的过拟合或欠拟合现象,在学习训练数据的同时,能够较好地泛化到验证数据上,具备良好的泛化能力,能有效应对超声检测裂纹长度预测的实际场景。

从训练曲线的可视化结果可清晰看出,随着双级SE注意力机制、残差块及其协同结构的引入,模型性能呈现阶梯式提升,尤其是Model-4,凭借“残差块-SE模块-池化”协同结构,在学习效率、预测精度和泛化能力上都达到最优,充分验证了该协同结构在超声检测裂纹长度回归预测任务中的有效性。

2.3.2 预测散点图分析

为直观呈现模型预测值与真实值的匹配分布特征,精准定位预测偏差较大的样本区间,借助预测散点图将模型的预测效果从数值转化为可视化分布,为评估模型的可靠性提供直接依据。对4个目标模型各开展10次独立训练,选取一次实验的训练完成模型,将其应用于测试数据集且含不同长度规格的超声裂纹样本,记录每个样本的模型预测长度值与实际裂纹长度值。以样本实际长度值为横轴、模型预测长度值为纵轴,绘制散点图,并添加表征“预测值与真实值完全一致”的参考对角线(见图8),图8清晰展现单次训练后模型的预测分布情况。

显示原图|下载原图ZIP|生成PPT

图8 预测长度与真实长度的散点图对比

Fig.8 Comparison of scatter plots between predicted length and actual length

结果显示,基准CNN模型(图 8a)散点分布最为分散,在真实长度5 mm区间偏离明显,RMSE高达0.149 75。当引入SE模块后(图 8b),散点分布显著收敛,RMSE降低至0.133 68,表明模型抗噪能力增强。当引入残差块后(图 8c),散点集中程度进一步提升,RMSE降低至0.084 81,对短裂纹等细微特征学习更具优势。而本文提出的融合模型(图 8d)的散点图几乎完全密集分布在(y=x)直线附近,RMSE和MAE分别低至0.068 3和0.047 1。这一结果直观地验证了SE模块与残差连接的协同作用,使得模型在复杂超声图像中既能有效抑制噪声,又能精准捕捉和传递细微缺陷特征,最终实现了最高的预测精度。

随着双级SE注意力机制、残差块及其协同结构的应用,模型对超声检测裂纹长度的预测效果逐步提升,Model-4凭借协同结构,在预测值与真实值的贴合度以及对极端值的预测能力上都表现最优,充分证明了该协同结构在超声检测裂纹长度回归预测任务中的出色性能。

3 结论与展望

3.1 结论

针对钢管超声平面波成像中存在的噪声干扰与缺陷特征捕捉不力问题,本文提出了一种融合双级SE注意力机制与残差网络的深度卷积神经网络模型,用于高精度预测钢管缺陷长度。本研究基于实验数据构建的超声数据集,通过详细的实验对比,验证了所提模型的有效性与优越性。模型在钢管缺陷长度回归预测任务中表现卓越,RMSE 和 MAE 均值分别为 0.068 3、0.047 1,较基准 CNN 模型分别降低 49.7% 和 41.7%。预测稳定性与精度优异,预测值与真实值高度契合,低信噪比环境下仍保持稳健性能。本文方法突破传统方法与现有 CNN 模型技术瓶颈,为钢管超声无损检测提供高效稳健的智能方案,具有重要工程应用价值与推广前景。

3.2 展望

尽管本模型取得了良好效果,但仍存在以下局限:首先,本研究使用的数据集源于实验室环境下的不锈钢试块,其噪声模式相对单一。在真实的工业管道检测中,可能面临更复杂的材料噪声、结构反射以及耦合不稳等干扰,模型的泛化能力有待进一步验证。其次,本文模型主要针对单一表面开口裂纹的长度进行预测,对于多裂纹并存或体积型缺陷(如腐蚀坑)的表征能力尚未探讨。

未来研究将着重于将该模型扩展至多缺陷类型(如凹坑、腐蚀)的识别与分类任务,以期构建一个更为全面和智能化的无损检测系统。一方面通过扩充涵盖不同管径、材质及工业现场复杂干扰场景的数据集,并结合数据增强技术提升样本多样性,系统验证并增强模型的泛化能力;另一方面优化注意力机制融合策略,引入空间注意力模块构建“通道-空间”双维度注意力结构,强化对分叉、不规则边缘等复杂形态裂纹的特征表征能力,在此基础上,进一步探索将注意力与残差协同架构迁移至钢轨、风电叶片等其他工业构件的超声无损检测场景,持续拓展技术的应用价值与适用范围。

参考文献

原文顺序 | 文献年度倒序 | 文中引用次数倒序

[1]	PYLE R J, BEVAN R L T, HUGHES R R, et al. Deep learning for ultrasonic crack characterization in NDE[J]. IEEE Transactions on Ultrasonics,Ferroelectrics,and Frequency Control, 2021, 68(5):1854-1865. DOI

[2]	WANG B Z, NONG S N, PAN L C, et al. Machine learning-based non-destructive testing model for high precision and stable evaluation of mechanical properties in bamboo-wood composites[J]. European Journal of Wood and Wood Products, 2024, 82(3):621-633. DOI

[3]	ZHUANG B Z, ARCARO A, GENCTURK B, et al. Non-destructive evaluation and machine learning methods for inspection of spent nuclear fuel canisters:a state-of-the-art review[J]. Progress in Nuclear Energy, 2025, 185:105697. DOI

[4]	TAHERI H, SALIMI BENI A. Artificial intelligence,machine learning,and smart technologies for nondestructive evaluation[M]// Handbook of nondestructive evaluation 4.0. Berlin: Springer,2025:853-881.

[5]	SAMBATH S, NAGARAJ P, SELVAKUMAR N. Automatic defect classification in ultrasonic NDT using artificial intelligence[J]. Journal of Nondestructive Evaluation, 2011, 30(1):20-28. DOI

[6]	UDPA L, UDPA S S. Neural networks for the classification of nondestructive evaluation signals[J]. IEEE Proceedings of Radar and Signal Processing, 1991, 138(1):41-45.

[7]	AMIRI N, FARRAHI G H, KASHYZADEH K R, et al. Applications of ultrasonic testing and machine learning methods to predict the static & fatigue behavior of spot-welded joints[J]. Journal of Manufacturing Processes, 2020, 52:26-34. DOI

[8]	MISHRA M, BHATIA A S, MAITY D. Predicting the compressive strength of unreinforced brick masonry using machine learning techniques validated on a case study of a museum through nondestructive testing[J]. Journal of Civil Structural Health Monitoring, 2020, 10(3):389-403. DOI

[9]	BERNIERI A, FERRIGNO L, LARACCA M, et al. Crack shape reconstruction in eddy current testing using machine learning systems for regression[J]. IEEE Transactions on Instrumentation and Measurement, 2008, 57(9):1958-1968. DOI

[10]	LIN Z B, PAN H, GUI G Q, et al. Data-driven structural diagnosis and conditional assessment:from shallow to deep learning[C]// Sensors and Smart Structures Technologies for Civil,Mechanical,and Aerospace Systems,March 4-8,2018,Denver. Bellingham: SPIE, 2018,38.

[11]	YE J X, ITO S, TOYAMA N. Computerized ultrasonic imaging inspection:from shallow to deep learning[J]. Sensors, 2018, 18(11):3820. DOI

[12]	BERTOVIC M. Human factors in non-destructive testing (NDT): risks and challenges of mechanised NDT[D]. Berlin: Technische Universitaet, 2015.

[13]	RAWAT W, WANG Z H. Deep convolutional neural networks for image classification:a comprehensive review[J]. Neural Computation, 2017, 29(9):2352-2449. DOI

[14]	余泽禹, 袁洪强, 卫小龙, 等. 基于深度学习的管道焊缝超声检测缺陷识别方法[J]. 科学技术与工程, 2022, 22(30):13288-13292. YU Z Y, YUAN H Q, WEI X L, et al. Defect identification method of pipeline weld ultrasonic testing based on deep learning[J]. Science Technology and Engineering, 2022, 22(30):13288-13292.

[15]	谢娟英, 张建宇. 图卷积神经网络综述[J]. 陕西师范大学学报(自然科学版), 2024, 52(2): 89-101. XIE J Y, ZHANG J Y. The review of the graph convolutional neural networks[J]. Journal of Shaanxi Normal University(Natural Science Edition). 2024, 52(2): 89-101.

[16]	罗东亮, 蔡雨萱, 杨子豪, 等. 工业缺陷检测深度学习方法综述[J]. 中国科学:信息科学, 2022, 52(6):1002-1039. LUO D L, CAI Y X, YANG Z H, et al. Survey on industrial defect detection with deep learning[J]. Scientia Sinica (Informationis), 2022, 52(6):1002-1039.

[17]	BHANDARE A, BHIDE M, GOKHALE P, et al. Applications of convolutional neural networks[J]. International Journal of Computer Science and Information Technologies, 2016, 7(5): 2206-2215.

[18]	KAYALIBAY B, JENSEN G, VAN DER SMAGT P. CNN-based segmentation of medical imaging data[EB/OL].[2025-09-01]. https://arxiv.org/abs/1701.03056.

[19]	LI Q, CAI W D, WANG X G, et al. Medical image classification with convolutional neural network[C]// 2014 13th International Conference on Control Automation Robotics & Vision(ICARCV),December 10-12,2014,Singapore. New York: IEEE, 2015:844-848.

[20]	SHIN H C, ROTH H R, GAO M C, et al. Deep convolutional neural networks for computer-aided detection:CNN architectures,dataset characteristics and transfer learning[J]. IEEE Transactions on Medical Imaging, 2016, 35(5):1285-1298. DOI

[21]	ALDRIN J C, FORSYTH D S. Demonstration of using signal feature extraction and deep learning neural networks with ultrasonic data for detecting challenging discontinuities in composite panels[J]. AIP Conference Proceedings, 2019, 2102:020012.

[22]	HUANG H W, LI Q T, ZHANG D M. Deep learning based image recognition for crack and leakage defects of metro shield tunnel[J]. Tunnelling and Underground Space Technology, 2018, 77:166-176. DOI

[23]	FENG J, LI F M, LU S X, et al. Injurious or noninjurious defect identification from MFL images in pipeline inspection using convolutional neural network[J]. IEEE Transactions on Instrumentation and Measurement, 2017, 66(7):1883-1892. DOI

[24]	CHA Y J, CHOI W, BÜYÜKÖZTÜRK O. Deep learning-based crack damage detection using convolutional neural networks[J]. Computer-Aided Civil and Infrastructure Engineering, 2017, 32(5):361-378. DOI

[25]	HU J, SHEN L, SUN G. Squeeze-and-excitation networks[C]// 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition,June 18-23,2018,Salt Lake City. New York: IEEE, 2018:7132-7141.

[26]	张宸嘉, 朱磊, 俞璐. 卷积神经网络中的注意力机制综述[J]. 计算机工程与应用, 2021, 57(20):64-72. DOI ZHANG C J, ZHU L, YU L. Review of attention mechanism in convolutional neural networks[J]. Computer Engineering and Applications, 2021, 57(20):64-72. DOI

[27]	HE K M, ZHANG X Y, REN S Q, et al. Deep residual learning for image recognition[C]// 2016 IEEE Conference on Computer Vision and Pattern Recognition(CVPR),June 27-30,2016,Las Vegas. New York: IEEE, 2016:770-778.

Options

文章导航

模态框（Modal）标题

摘要

本文引用格式

Abstract

1 模型设计与实现

1.1 模型架构

1.1.1 基础CNN架构

图1 基准CNN完整模型架构图

1.1.2 基于SE注意力机制与残差连接的增强型CNN架构

图2 增强型CNN完整模型架构图

图3 残差块-SE模块-池化级联结构图

图4 残差块中主路径模块细节图

1.2 数据来源与处理

图5 超声裂纹检测数据集制作流程示意图

1.3 训练与测试配置

2 实验结果与分析

2.1 对比实验设计

表1 模型结构特征

2.2 性能对比

图6 不同参数损失值随实验次数的变化

2.3 可视化结果分析

2.3.1 学习曲线分析

图7 训练与验证MSE损失值随轮数变化的曲线图

2.3.2 预测散点图分析

图8 预测长度与真实长度的散点图对比

3 结论与展望

3.1 结论

3.2 展望

参考文献