无线电工程

方法	Avg Dice↑	Avg HD95↓
U-Net	79.08	15.94
UNet++	82.76	14.68
Attention U-Net	87.83	14.05
MultiResUNet	88.74	12.17
MEDT	84.63	14.59
Swin-UNet	88.46	12.93
UDTransNet	89.02	11.62
VM-UNet V2	90.31	11.47
UltraLight VM-UNet	90.89	11.21
AW-SkinNet	91.86	10.16

方法	Avg Dice↑	Avg HD95↓
U-Net	79.08	15.94
UNet++	82.76	14.68
Attention U-Net	87.83	14.05
MultiResUNet	88.74	12.17
MEDT	84.63	14.59
Swin-UNet	88.46	12.93
UDTransNet	89.02	11.62
VM-UNet V2	90.31	11.47
UltraLight VM-UNet	90.89	11.21
AW-SkinNet	91.86	10.16

方法	Avg Dice↑	Avg HD95↓
U-Net	88.15	14.57
UNet++	88.97	12.31
Attention U-Net	89.05	13.34
MultiResUNet	89.20	12.70
MEDT	87.67	15.28
Swin-UNet	88.80	12.75
UDTransNet	89.91	10.85
VM-UNet V2	89.73	11.03
UltraLight VM-UNet	89.65	11.56
AW-SkinNet	91.43	10.63

方法	Avg Dice↑	Avg HD95↓
U-Net	88.15	14.57
UNet++	88.97	12.31
Attention U-Net	89.05	13.34
MultiResUNet	89.20	12.70
MEDT	87.67	15.28
Swin-UNet	88.80	12.75
UDTransNet	89.91	10.85
VM-UNet V2	89.73	11.03
UltraLight VM-UNet	89.65	11.56
AW-SkinNet	91.43	10.63

方法	Avg Dice↑	Avg HD95↓
Baseline	89.91	10.85
w/o WCAM&LASU	89.96	10.93
w/o LASU	90.77	10.76
AW-SkinNet	91.43	10.63

方法	Avg Dice↑	Avg HD95↓
Baseline	89.91	10.85
w/o WCAM&LASU	89.96	10.93
w/o LASU	90.77	10.76
AW-SkinNet	91.43	10.63

基于注意力机制与小波变换的皮肤病变分割方法

PDF下载

李明蓉

无线电工程 | 工程与应用 2025,55(11): 2274-2282

收起

无线电工程 | 工程与应用 2025, 55(11): 2274-2282

基于注意力机制与小波变换的皮肤病变分割方法

全屏

李明蓉

作者信息

贵州大学大数据与信息工程学院,贵州贵阳 550025

李明蓉女，（2000—），硕士研究生。主要研究方向：图像分割、深度学习。

A Skin Lesions Image Segmentation Method Based on Attention Mechanism and Wavelet Transform

Mingrong LI

Affiliations

College of Big Data and information Engineering, Guizhou University, Guiyang 550025, China

出版时间: 2025-11-05 doi: 10.3969/j.issn.1003-3106.2025.11.015

文章导航

摘要

收起

皮肤病变发病率上升，使皮肤癌早期筛查变得尤为关键。皮肤病变图像分割任务在通道信息建模、结构适应性及特征融合方面存在不足，易导致病变边界识别不准确和关键上下文信息利用不充分。针对这些问题，提出一种基于注意力机制与小波变换的皮肤病图像分割方法——AW-SkinNet。该方法通过双分支协同注意力提取空间与通道依赖特征，结合小波变换增强频域表征，并利用轻量注意力引导的子像素上采样提升细节恢复与上下文理解。在ISIC-2017和ISIC-2018皮肤病变分割数据集上的实验表明，所提方法相较于现有皮肤病变图像分割方法实现了更高的分割精度。

关键词

皮肤病 / 图像分割 / 注意力机制 / 小波变换

Abstract

收起

The rising incidence of skin lesions has made early screening for skin cancer increasingly critical. However, existing methods for skin lesion image segmentation often suffer from limitations in channel-wise information modeling, structural adaptability, and feature fusion, which can lead to inaccurate boundary delineation and insufficient utilization of crucial contextual information. To address these issues, a skin lesions image segmentation method based on attention mechanism and wavelet transform, termed AW-SkinNet, is proposed. The proposed approach employs a dual-branch collaborative attention module to extract spatial and channel-dependent features, integrates wavelet transform to enhance frequency-domain representations, and incorporates lightweight attention-guided sub-pixel upsampling to improve detail restoration and contextual understanding. Experimental results on the ISIC-2017 and ISIC-2018 skin lesion segmentation datasets demonstrate that the proposed method achieves higher segmentation accuracy compared with existing approaches for skin lesion image segmentation.

Key words

skin lesion / image segmentation / attention mechanism / wavelet transform

引用本文

李明蓉. 基于注意力机制与小波变换的皮肤病变分割方法. 无线电工程, 2025 , 55 (11) : 2274 -2282 . DOI: 10.3969/j.issn.1003-3106.2025.11.015

Mingrong LI. A Skin Lesions Image Segmentation Method Based on Attention Mechanism and Wavelet Transform[J]. Radio Engineering, 2025 , 55 (11) : 2274 -2282 . DOI: 10.3969/j.issn.1003-3106.2025.11.015

正文

收起

0　引言

收起

近年来,皮肤病变的发病率持续上升^[1],引发了医学界对皮肤癌的高度关注。皮肤癌具有显著的致死风险,但通过早期检测和及时干预,可显著提升患者的生存率。传统的皮肤病变识别主要依赖临床医生的视觉判断与经验积累,此类方式在效率与准确性方面均存在一定局限^[2]。为提高诊断的客观性与自动化水平,计算机辅助诊断（Computer-Aided Diagnosis,CAD）技术应运而生。在CAD系统中,对病灶区域的精确分割是至关重要的一步,其质量直接决定了后续诊断流程的有效性。因此,皮肤病变图像的自动分割问题已成为近年来深度学习研究领域的重点方向,促使多种先进模型与算法不断被提出与优化。

早期针对皮肤病变区域的分割研究主要依托传统图像处理技术,涵盖人工精细标注、半自动化方法以及多种自动化策略,如基于灰度阈值^[3]、边缘检测^[4]以及图论模型^[5]的实现方案。尽管上述方法在计算上较为高效,适用于特定场景,但普遍存在鲁棒性不足的问题,易受到伪影、遮挡物以及标注误差的影响。其中,阈值法和区域合并策略常面临过度分割现象,而图论方法虽然具备较强的建模能力,却因算法复杂性较高、适应性较差等问题,难以在多样化的临床图像中广泛推广。

随着深度学习技术的迅猛发展,其在挖掘大规模图像数据潜在特征以及自动学习高层语义表示方面展现出显著优势,为克服传统分割方法的性能瓶颈提供了全新思路。在众多模型中,卷积神经网络（Convolutional Neural Network,CNN）^[6]作为关键基础架构,在医学图像分割任务中取得了突破性进展。2017年,Shelhamer等^[7]提出的全卷积网络,首次实现了对图像的像素级预测,为后续研究提供了范式参考。然而,这类早期模型在建模图像全局上下文信息和融合多尺度特征方面能力有限,难以充分适应皮肤病变图像中常见的边界模糊、形态变化复杂等挑战,影响了分割精度的进一步提升。

U-Net^[8]架构及其系列变体因其编码器-解码器的结构优势,在医学图像分割领域迅速占据主导地位。为进一步增强模型性能,研究者提出了多种结构优化方案。例如,UNet++^[9]通过引入深层次嵌套和多级跳跃连接,改善了特征融合效果,但在处理低对比度图像时仍存在性能瓶颈。DoubleU-Net^[10]通过双重U-Net结构增强语义信息提取,但代价是模型参数量和训练时间的大幅提升。CE-Net^[11]结合空洞卷积与多尺度池化模块,在处理边界模糊图像上展现出一定优势,但在应对稀有病变时表现仍不理想。王国凯等^[12]提出的MSBF-Net网络,通过分裂池化、全尺度特征融合和边界融合的方法,有效减少了空间信息损失并增强了上下文信息传递。白雪飞等^[13]针对病变区域边界模糊问题提出的BEMA-UNet通过空间多尺度注意力和边缘增强机制提升了分割精度。

近年来,Transformer^[14]架构的引入为分割精度带来新突破,如TransUNet^[15]利用自注意力机制有效捕捉长距离依赖关系,实现更为细致的区域分割,但其庞大的参数规模导致训练过程中易出现梯度消失或爆炸等问题。陶惜婷等^[16]提出的并行双分支网络架构PDTransCNN,通过ResNet34提取局部上下文特征,并结合Vision Transformer来捕获长距离依赖关系,然而模型计算复杂度和参数量较高。此外,部分研究探索了融合CNN、Transformer和Mamba^[17]等结构的混合模型,并引入深度可分离卷积^[18]、频域变换^[19]等技术以扩大感受野与提升特征表达能力。然而,这类模型往往伴随着计算资源消耗过大、泛化能力不强或特征连续性不足等局限性。

尽管以CNN为基础的方法在皮肤病变分割领域取得了显著进展,并在实际应用中占据主导地位,但其固有的结构特性仍存在一定局限。具体而言,在视觉感知任务中Transformer架构已被广泛应用以建模图像中长距离的依赖关系,然而现有注意力机制在处理视觉特征时存在通道维度信息建模不足和空间注意力缺乏结构适应性的问题。此外,在语义分割^[20]、图像恢复^[21]等任务中,现有通道注意力机制多集中于特征响应强度的自适应调整,缺乏对图像频域结构的显式建模,这可能导致对高频纹理区域和边界的抑制,从而影响分割边缘的精度。另一方面,常规的上采样操作虽然能够提升分辨率,但在信息传递中缺乏对跳跃连接特征通道重要性的建模,且在多尺度特征融合时容易引入冗余甚至噪声信息,导致解码器无法充分利用关键上下文,影响最终分割质量。

针对上述问题,本文提出了一种AW-SkinNet模型,以解决医学图像分割模型中通道维度信息建模不足和空间注意力缺乏结构适应性,缺乏对图像频域结构的显式建模以及常规的上采样操作缺乏对跳跃连接特征通道重要性的建模等问题,从而提高医学图像分割模型的分割精度。

1　研究方法

收起

1.1　AW-SkinNet模型框架

本文提出的AW-SkinNet模型建立于编码器与解码器架构之上,网络模型结构如图1所示。

首先,针对皮肤病变形态多变且边界模糊的特性,模型通过双分支协同注意力机制（Dual-Branch Collaborative Attention,DBCA）对输入图像进行特征提取。其中,对比协方差通道注意力（Contrastive-Covariance Channel Attention,CCA）分支通过建模通道间的协方差关系捕获不同通道特征之间的全局依赖关系与语义协同结构,解决通道维度信息建模不足的问题,以更充分地利用上下文信息并提升对病变整体语义的理解。空间感知引导注意力（Spatially-Aware Guided Attention,SGA）分支针对空间注意力缺乏结构适应性的问题,通过建模不同空间位置间的动态交互关系,引导模型聚焦与病变结构更相关的区域,增强对不规则形状病变的空间感知能力。

随后,针对常规方法缺乏对图像频域结构建模、易抑制高频边界细节的问题,模型引入基于小波变换的通道注意力模块（Wavelet-based Channel Attention Module,WCAM）。该模块利用小波变换的多尺度分解能力在频域处理特征,以更好地保留和增强对分割至关重要的高频边界信息,并结合通道注意力机制实现更强的上下文感知与细粒度结构建模能力。

最后,为提升解码器语义信息恢复的准确性和空间结构重建的质量,同时兼顾计算效率,设计了一种轻量而高效的轻量注意力引导的子像素上采样模块（Lightweight Attention-guided Sub-pixel Upsampling Module,LASU）来替代传统解码器中的上采样操作,以提升解码器对细节的恢复能力与整体上下文的理解能力,实现图像重建并获得最终的预测输出图像。

1.2　DBCA

为了更有效地捕捉图像特征中的通道依赖结构与空间上下文信息,本文提出了一种DBCA。整个模块包括2个分支：CCA分支与SCA分支,其结构如图2所示。

传统通道注意力主要依赖平均池化或一维卷积对每个通道进行单独加权,忽略了通道之间的协同关系。为此,引入协方差矩阵作为统计工具,用以捕捉不同通道之间的变化相关性,从而建立更为鲁棒和表达力更强的通道注意力建模方式。

在空间维度上,为解决传统自注意力对长距离依赖建模能力强但对局部结构表达不足的问题,设计了基于空间感知的卷积注意力模块,利用Query向量通过函数映射生成一个用于局部感知的卷积核,并作用于Key和Value特征,从而实现内容自适应的局部卷积操作,使空间注意力具备更强的动态建模能力。

1.2.1　CCA

设输入特征为X_C∈R^B^×^L^×^C,其中B为批量大小, L为展平后的空间维度,C为通道数。首先,对每个通道进行中心化处理以去除均值偏移：

式中：

表示中心化处理的特征,通过线性映射将其映射到一个较低维度r,以减少协方差计算的复杂度。

式中：W_r∈R^C^×^r表示一个线性变换权重矩阵。对每个样本独立地计算协方差矩阵：

式中：

表示第b个批次的协方差矩阵,其编码了通道嵌入之间的线性关系。通过非线性变换后将其投影回原通道空间：

式中：W_a∈R^r^×^C表示用于将协方差矩阵映射回通道维度的权重矩阵。最后,通过逐通道乘法将统计学习得到的协同注意力作用于原始通道表示：

式中：σ（·）表示逐元素Sigmoid激活。这种方式不再对每个通道独立加权,而是依据其与其他通道的统计协同程度进行联合建模,从而提升表示的全局一致性和结构表达能力。

1.2.2　SCA

设X_S为输入特征（与X_C相同）,W_q, W_k,W_v∈R^C^×^d为线性投影矩阵,d为空间注意力的维度,Q_S, K_S,V_S∈R^B^×^L^×^d为空间位置上的查询（Query）、键（Key）和值（Value）：

通过一个轻量级的感知机为每个token动态生成一组卷积核权重：

式中：k为局部卷积核大小。接下来,对于每一个token,利用其对应的权重对整个Key和Value序列执行1D卷积操作：

得到局部结构增强后的Key与Value表示。采用标准点积注意力结构计算token与其上下文之间的匹配程度,单个注意力头的空间注意力计算如下：

然后通过加权求和得到注意力输出特征O_n：

1.2.3　双分支特征融合

双分支分别建模通道统计依赖和空间区域局部上下文信息,并通过并行协同融合,提升整体网络在多尺度视觉信息表达上的性能与泛化能力。通过相加的方式进行特征融合得到输出特征Y：

1.3　WCAM

为了解决传统通道注意力模块在建模跨尺度上下文关系时易忽略多频率信息的问题,提出了一种基于小波变换^[22]的通道注意力模块,其结构如图3所示。

该模块通过引入小波域的多尺度分解能力,增强特征图在频域下的表征能力,并结合通道注意力机制,实现更强的上下文感知与细粒度结构建模能力。

在该模块中,设解码器分支提取的特征图输入为D∈R^B^×^C^×^H^×^W,其中,H、W是空间维度。

首先,本文对该特征图进行小波增强操作,使用自定义的Wavelet Transform卷积层（WTConv2D）对其进行频率域建模,得到增强后的特征D_wt：

该WTConv2D模块内部首先执行若干层离散小波变换（Discrete Wavelet Transform, DWT）分解操作,将输入图像分解为低频子带LL与多个高频子带{LH,HL,HH}。随后,对各个子带施加深度卷积操作,并通过逆小波变换（Inverse Wavelet Transform, IWT）将其重建回原始空间维度,增强了高频细节和结构轮廓的表达能力。

接着,将增强后的特征D_wt进行块嵌入,通过一个步长为patch size的卷积将其转换为序列表示：

式中：

,P为patch的边长。引入来自Transformer分支的中间特征

,并对二者分别进行线性投影以生成查询、键和值向量：

式中：W_q、W_k、W_v为学习得到的权重矩阵。接下来计算通道注意力的相关性矩阵。将Query与Key相乘,得到相似性矩阵：

为提升注意力分布的稳定性与泛化能力,本文在softmax前对其施加Instance Normalization操作：

随后利用该注意力矩阵与Value相乘,生成通道增强后的响应特征：

再通过一个线性投影W_o将其变换回原始通道维度,并通过重建恢复空间尺寸,得到初步融合特征：

为了进一步提升该特征的频域表达能力,将F_rec再次进行小波重建增强：

最后,将F_rec与F_wt沿通道维度拼接,并通过1×1卷积进行特征融合：

式中：W_f∈R^2C×C表示融合卷积权重。输出的F_fused作为解码器与Transformer间融合后的特征传递至上采样模块,继续完成分割预测。

1.4　LASU

本文提出了一种轻量而高效的LASU,用于替代传统解码器中的上采样单元,以提升语义信息恢复的准确性和空间结构重建的质量,其结构如图4所示。该模块集成了PixelShuffle^[23]子像素重排方式、通道注意力引导机制与深度可分离卷积结构,实现了解码器在性能与效率之间的有效权衡。

具体而言,在上采样阶段,采用PixelShuffle算法进行子像素级别的空间重建,相较于传统转置卷积,PixelShuffle可避免棋盘伪影的出现,并具备更平滑的上采样过程。

LASU模块的输入包括2个分支：解码器分支输入特征图记作D∈R^C^×^H^×^W,编码器分支提供的经过跳跃连接的特征记作E∈R^C^×^H^×^W。首先,对解码器特征进行上采样,提升其空间分辨率至与编码器特征相同,再使用子像素重排函数将通道维映射至更高分辨率的空间维度：

式中：Conv_3×3（·）表示通道扩展卷积操作,π（·）表示PixelShuffle操作,r表示上采样倍数,本文设定为2。

在融合来自编码器的跳跃连接特征时,引入了通道注意力机制,通过全局平均池化（Global Average Pooling,GAP）与多层感知机（Multilayer Perceptron,MLP）生成通道权重向量α∈R^C,对该特征进行动态加权：

式中：σ（·）表示Sigmoid激活函数,用于将注意力向量归一化至（0,1）,保证每个通道的重要性权重处于合理范围。该加权特征E_attn与上采样后的解码器特征D_up进行通道级拼接,形成融合特征。为进一步提高参数效率,利用深度可分离卷积替代传统卷积层,得到最终的特征：

2　损失函数

收起

为提升二分类医学图像分割任务中对目标区域的识别能力,并有效缓解目标与背景之间的类别不平衡问题,采用了加权二元交叉熵损失（Binary Cross Entropy Loss,BCE）^[24]与加权Dice损失^[25]的加权组合,构成最终的复合损失函数Loss,其表达式如下：

式中：λ_Dice与λ_BCE分别表示骰子系数（Dice）与BCE损失的权重系数,L_Dice表示加权Dice损失,L_BCE表示加权BCE。

该损失函数结合了Dice损失对区域重叠的敏感性与BCE在像素层面上的稳定优化效果,尤其适用于目标稀疏或类间不平衡严重的医学图像分割场景。

3　实验结果与分析

收起

3.1　实验准备

3.1.1　数据集

ISIC-2017与ISIC-2018^[26]皮肤病变分割数据集均由国际皮肤图像协作组织（International Skin Imaging Collaboration,ISIC）构建,并作为国际医学图像计算与计算机辅助干预会议（International Conference on Medical Image Computing and Computer-Assisted Intervention,MICCAI）旗下皮肤病变分析挑战赛的核心基准数据集,旨在推动CAD技术在皮肤病变自动识别与分割中的应用与发展。这2个数据集设计用于皮肤镜图像中黑色素瘤等皮肤病变的检测与分割任务,为相关研究提供了标准化的图像资源与标注依据。需要注意的是,尽管该挑战赛也提供了独立的测试集用于最终评估,但其真实标注结果并未公开。因此,为了确保实验结果的可靠性、公平性和可重复性,本文均采用五折交叉验证方法对训练集进行划分与评估。具体做法是将训练集划分为5个大小相近的子集,在每一轮实验中使用其中4个子集进行训练,剩余一个子集用于验证,并循环进行5轮实验。最终的评估结果为5次实验结果的平均值,能够有效减小由于样本划分带来的偶然性误差,提升模型性能评价的稳健性。

3.1.2　实验环境与参数配置

本文实验在NVIDIA 4060 Laptop GPU上进行训练,基于Python3.8及PyTorch深度学习框架实现。将所有图像的大小调整为224 pixel×224 pixel,然后输入网络。优化器为AdamW^[27],根据初步实验结果,模型在200个训练轮次内即达到收敛。学习率为0.001,权重衰减为0.0005。

3.1.3　评价指标

为了有效评价网络的分割性能,选择Dice和95% Hausdorff^[28]距离（HD95）作为验证和测试的评估指标。

式中：TP、FP、FN分别表示真阳性、假阳性和假阴性。为了使结果更加稳定和令人信服,进行了5次交叉验证,并获得了平均值和标准差。

3.2　对比实验

为了验证AW-SkinNet模型在ISIC-2017和ISIC-2018数据集上的性能,将其与当前多种先进的分割方法进行了全面对比。这些方法涵盖了不同结构和机制的设计,包括传统的U-Net^[6]及其多个变体,例如引入嵌套和密集跳跃连接的UNet++^[7]、采用注意力机制的Attention U-Net^[29],以及融合多分辨率特征的MultiResUNet^[30]。此外,还比较了近年来将Transformer引入医学图像分割的代表性模型,如MEDT^[31]、Swin-UNet^[32]和UDTransNet^[33],以及基于状态空间模型Mamba的医学图像分割架构VM-UNet V2^[34]和UltraLight VM-UNet^[35]。

表1展示了在ISIC-2017数据集上与基于U-Net及其变体的方法相比,AW-SkinNet模型在平均Dice得分上较最优的MultiResUNet提升了3.12%,在平均HD95上减少了2.01%。与结合Transformer的方法比,AW-SkinNet模型在平均Dice得分上较最优的UDTransNet提升了2.84%,在平均HD95上降低了1.46%。与基于Mamba的方法比,AW-SkinNet模型在平均Dice得分上较最优的UltraLight VM-UNet提升了0.97%,在平均HD95上降低了1.05%。

表2展示了在ISIC-2018数据集上与基于U-Net及其变体的方法相比,AW-SkinNet模型在平均Dice得分上较最优的MultiResUNet提升了2.23%,同时在平均HD95上减少了2.07%。与结合Transformer的方法相比,AW-SkinNet模型在平均Dice得分上较最优的UDTransNet提升了1.52%,在平均HD95上降低了0.22%。与基于Mamba的方法相比,AW-SkinNet模型在平均Dice得分上较最优的UltraLight VM-UNet提升了1.78%,在平均HD95上降低了0.93%。

综合来看,这些数据充分证明了AW-SkinNet模型在整体分割性能上的显著优势。

3.3　消融实验

为验证AW-SkinNet中各个模块的有效性, ISIC-2018数据集上进行了消融实验,探索DBCA、WCAM和LASU对模型性能的贡献,如表3所示。

本实验中采用的Baseline为UDTransNet,在去除所有模块的基础模型上,Dice和HD95的平均值分别为89.91%和10.85%。引入DBCA模块后,模型通过建模通道间相关性与空间依赖关系,增强局部与全局特征的表达能力,平均Dice提升至89.96%,验证了其对特征表征的优化作用。进一步加入WCAM模块后，模型的平均Dice达到90.77%,平均HD95降至10.76%,说明多层次注意力融合结构在提升语义区分能力方面有显著效果。

最终,当3个模块全部集成形成完整的AW-SkinNet时,模型取得了最优性能,平均Dice提高至91.43%,平均HD95降至10.63%,全面优于其他组合,表明DBCA、WCAM与LASU模块在提高模型精度、细化边界表达以及保持结构完整性方面均发挥了关键作用,三者协同构成了高效的分割结构。

3.4　可视化分析

该模型在ISIC-2017数据集和ISIC-2018数据集上进行了训练和验证。为了进一步说明分割结果和验证所提出的方法的有效性,如图5和图6所示, AW-SkinNet模型在多个任务中的定量分割结果与真实标注高度一致。在边界清晰或边界模糊等不同情况下,现有方法常出现分割不足或过度分割的现象。而实验结果显示,AW-SkinNet在这2类场景下均取得了更为鲁棒的分割效果。定量分析表明,该模型实现了在子区域的精确分割,验证了模型在皮肤病变分割任务中的有效性,提升了分割精度。

4　结束语

收起

本文提出了一种AW-SkinNet模型。通过DBCA分别捕捉空间和通道间的依赖关系,融合小波变换以增强频域特征表达,并引入轻量级注意力引导的子像素上采样模块,提高了细节还原和上下文感知能力,从而实现精确的皮肤病变图像分割。在ISIC-2017和ISIC-2018皮肤病变分割数据集上的可视化分析与ISIC-2018数据集上进行的消融实验表明,本文方法优于其他先进的方法,实现了皮肤病灶的精确分割,并生成了高质量的分割图。

参考文献

收起

文献

收起

参考文献引证文献

排序方式：

[1]

YADAV

, BHAT

. A Systematic Literature Survey on Skin Disease Detection and Classification Using Machine Learning and Deep Learning[J]. Multimedia Tools and Applications,2024,83(32):78093-78124.

[2]

孔令军,王茜雯,包云超,等.一种基于深度学习的臂丛神经超声图像分割网络[J].无线电工程,2021,51(9):841-847.

[3]

X P

,SONG

H D

,JIA

,et al. An Improved V-Net Lung Nodule Segmentation Model Based on Pixel Threshold Separation and Attention Mechanism[J]. Scientific Reports,2024,14(1):4743.

[4]

Y F

,XU

,HUANG

Y H

,et al. DiffusionEdge:Diffusion Probabilistic Model for Crisp Edge Detection[EB/OL]. (2024-01-04)[2025-05-10]. https://arxiv.org/abs/2401.02032.

[5]

KUMAR

J S

,ARCHANA

,MURALIDHARAN

,et al. Graph Theory:Modelling and Analyzing Complex System[J]. Metallurgical and Materials Engineering, 2025, 31(3):70-77.

[6]

陈彦桥,张泽勇,陈金勇,等.基于CNN和RFC的极化SAR图像分类[J].无线电工程,2021,51(2):87-91.

[7]

SHELHAMER

,LONG

,DARRELL

. Fully Convolutional Networks for Semantic Segmentation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2017,39(4):640-651.

[8]

RONNEBERGER

,FISCHER

,BROX

. U-Net:Convolutional Networks for Biomedical Image Segmentation[C]//International Conference on Medical Image Computing and Computer-Assisted Intervention. Munich:Springer International Publishing,2015:234-241.

[9]

ZHOU

Z W

,SIDDIQUEE

M M R

,TAJBAKHSH

,et al. UNet++:A Nested U-Net Architecture for Medical Image Segmentation[C]//International Workshop on Deep Learning in Medical Image Analysis. Granada: Springer International Publishing,2018:3-11.

[10]

JHA

, RIEGLER

M A

, JOHANSEN

, et al. DoubleU-Net: A Deep Convolutional Neural Network for Medical Image Segmentation[C]//2020 IEEE 33rd International Symposium on Computer-Based Medical Systems (CBMS). Rochester:IEEE,2020:558-564.

[11]

Z W

,CHENG

,FU

H Z

,et al. Ce-Net:Context Encoder Network for 2D Medical Image Segmentation[J]. IEEE Transactions on Medical Imaging,2019,38(10):2281-2292.

[12]

王国凯,张翔,王顺芳.多尺度和边界融合的皮肤病变区域分割网络[J].计算机科学与探索,2024,18(7):1826-1837.

[13]

白雪飞,靳智超,王文剑,等.融合边缘增强与多尺度注意力的皮肤病变分割[J].计算机科学,2023,50(4):96-102.

[14]

VASWANI

,SHAZEER

,PARMAR

,et al. Attention Is All You Need[EB/OL]. (2017-06-12)[2025-05-11]. https://arxiv.org/abs/1706.03762.

[15]

CHEN

J N

,MEI

J R

,LI

X H

,et al. Transunet:Rethinking the U-Net Architecture Design for Medical Image Segmentation Through the Lens of Transformers[J]. Medical Image Analysis,2024,97:103280.

[16]

陶惜婷,叶青.融合CNN和Transformer的并行双分支皮肤病灶图像分割[J].计算机应用研究,2024,41(8):2554-2560.

[17]

X P

,ZHANG

X K

, PUN

M O

. Rs³ Mamba: Visual State Space Model for Remote Sensing Image Semantic Segmentation[J]. IEEE Geoscience and Remote Sensing Letters,2024,21:1-5.

[18]

CHOLLET

. Xception: Deep Learning with Depthwise Separable Convolutions[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition. Honolulu:IEEE, 2017:1800-1807.

[19]

MAKIHARA

, SAGAWA

, MUKAIGAWA

, et al. Gait Recognition Using a View Transformation Model in the Frequency Domain[C]//European Conference on Computer Vision. Berlin:Springer,2006:151-163.

[20]

ZHU

Q F

,CAI

Y Z

,FANG

,et al. Samba:Semantic Segmentation of Remotely Sensed Images with State Space Model[J]. Heliyon,2024,10(19):38495.

[21]

GUO

,LI

J M

,DAI

,et al. Mambair:A Simple Baseline for Image Restoration with State-Space Model[C]//European Conference on Computer Vision. Cham: Springer, 2024:222-241.

[22]

LIU

Y J

,FAN

K F

,ZHOU

W J

. FPWT:Filter Pruning via Wavelet Transform for CNNs[J]. Neural Networks,2024, 179:106577.

[23]

IBRAHEM

,SALEM

,KANG

H S

. Pixel Shuffling Is All You Need:Spatially Aware Convmixer for Dense Prediction Tasks[J]. Pattern Recognition, 2025, 158:111068.

[24]

HURTIK

, TOMASIELLO

, HULA

, et al. Binary Cross-entropy with Dynamical Clipping[J]. Neural Computing and Applications,2022,34(14):12029-12041.

[25]

SUDRE

C H

,LI

W Q

, VERCAUTEREN

,et al. Generalised Dice Overlap as a Deep Learning Loss Function for Highly Unbalanced Segmentations[C]//international Workshop on Deep Learning in Medical Image Analysis.[S. l.]:Springer,2017:240-248.

[26]

ZHU

W H

,TIAN

J Y

, CHEN

M Z

, et al. MSS-Unet: A Multi-spatial-shift MLP-based Unet for Skin Lesion Segmentation[J]. Computers in Biology and Medicine,2023, 168:107719.

[27]

ZHOU

,XIE

X Y

,LIN

Z C

,et al. Towards Understanding Convergence and Generalization of Adamw[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2024,46(9):6486-6493.

[28]

TAHA

A A

,HANBURY

. An Efficient Algorithm for Calculating the Exact Hausdorff Distance[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2015, 37(11):2153-2163.

[29]

OKTAY

,SCHLEMPER

,FOLGOC

L L

,et al. Attention U-Net:Learning Where to Look for the Pancreas[EB/OL]. (2018-04-11)[2025-05-11]. https://arxiv.org/abs/1804.03999.

[30]

IBTEHAZ

, RAHMAN

M S

. MultiResUNet: Rethinking the U-Net Architecture for Multimodal Biomedical Image Segmentation[J]. Neural Networks,2020,121:74-87.

[31]

Q F

,LIN

L Y

,ZHANG

,et al. MEDT:Using Multimodal Encoding-Decoding Network as in Transformer for Multimodal Sentiment Analysis[J]. IEEE Access,2022, 10:28750-28759.

[32]

CAO

,WANG

Y Y

,CHEN

,et al. Swin-Unet:Unet-like Pure Transformer for Medical Image Segmentation[C]//European Conference on Computer Vision. Tel Aviv:Springer,2022:205-218.

[33]

WANG

H N

,CAO

,YANG

J Z

,et al. Narrowing the Semantic Gaps in U-Net with Learnable Skip Connections:The Case of Medical Image Segmentation[J]. Neural Networks,2024,178:106546.

[34]

ZHANG

M Y

,YU

,JIN

,et al. VM-UNET-V2:Rethinking Vision Mamba UNet for Medical Image Segmentation[C]//International Symposium on Bioinformatics Research and Applications. Kunming:Springer,2024:335-346.

[35]

R K

,LIU

Y H

, LIANG

P C

, et al. UltraLight VMUNet:Parallel Vision Mamba Significantly Reduces Parameters for Skin Lesion Segmentation[EB/OL]. (2024-04-24)[2025-05-11]. https://arxiv.org/pdf/2403.20035.

2025年第55卷第11期

PDF下载

120

引用本文

BibTeX

文章信息

doi: 10.3969/j.issn.1003-3106.2025.11.015

接收时间：2025-07-16
首发时间：2026-04-17
出版时间：2025-11-05

补充材料

相关文章

文章信息

作者

出版历史

收稿日期：2025-07-16

基金

作者信息

贵州大学大数据与信息工程学院,贵州贵阳 550025

参考文献

分享链接

https://castjournals.cast.org.cn/joweb/wxdgc/CN/10.3969/j.issn.1003-3106.2025.11.015

分享至

全文二维码

扫描看全文

引用本文

BibTeX

本文的引用情况

2种不同金属材料的力学参数

科 Family	属数 Number of genus	种数 Number of species	占总种数比例 Percentage of total species (%)	属 Genus	种数 Number of species	占总种数比例 Percentage of total species (%)
鹅膏菌科Amanitaceae	2	11	5.26	鹅膏菌属 Amanita	10	4.78
小菇科 Mycenaceae	2	12	5.74	丝盖伞属 Inocybe	5	2.39
多孔菌科 Polyporaceae	8	14	6.70	蜡蘑属 Laccaria	5	2.39
红菇科 Russulaceae	3	23	11.00	小皮伞属 Marasmius	6	2.87
				小菇属 Mycena	11	5.26
				光柄菇属 Pluteus	5	2.39
				红菇属 Russula	17	8.13
				栓菌属 Trametes	5	2.39

关闭全屏

BibTeX
EndNote
RefWorks
TxT