蝴蝶是节肢动物门、昆虫纲、鳞翅目、锤角亚目动物的统称,在全世界分布广泛,约有18 000多种
[1]。蝴蝶对栖息地环境专一性强,蝴蝶的种群动态和群落结构特征能够反映环境的细微变化
[2],因此蝴蝶是重要的环境指示昆虫,对指示生态系统平衡具有重要意义。党的二十大报告中指出“要推动美丽中国建设,提升生态系统多样性、稳定性、持续性,加快实施重要生态系统保护和修复重大工程”,因此识别自然环境中的蝴蝶种类成为当前一项重要任务。然而,为了识别自然环境中的蝴蝶,通常需要从野外环境中采集蝴蝶,制作成标本,然后昆虫学家再利用长期积累的专业知识和经验对蝴蝶进行种类鉴别,该过程费时费力。随着深度学习的发展,涌现出一系列基于野外环境下拍摄的蝴蝶生态图像的蝴蝶物种自动识别研究
[3-10]。然而,蝴蝶为了躲避天敌而与生俱来的拟态性使蝴蝶具有与周围环境非常相似的颜色、纹理以及图案,因此,蝴蝶生态图像中的蝴蝶与背景相似度极高,使基于含有环境背景的蝴蝶生态图像的蝴蝶自动化识别准确率远低于采用剔除了大部分环境背景的蝴蝶生态图像的蝴蝶物种自动化识别准确率
[3]。为了提高基于生态图像的蝴蝶自动化识别准确率,减少蝴蝶生态图像中复杂环境背景对深度学习网络学习获取的蝴蝶特征的影响,蝴蝶生态图像分割亟待研究。
谢娟英等
[11]发布的蝴蝶数据集为蝴蝶生态图像分割提供了支持,其中的蝴蝶图像来自2018年的中国数据挖掘竞赛
[12]训练集,是目前唯一可用于分割的全部由蝴蝶生态图像组成的公开蝴蝶生态图像数据集,本文将其命名为Butterfly_2018。Sun等
[13]指出,更大的网络模型和更多带有标签的数据是深度学习在计算机视觉领域获取成功的关键。Butterfly_2018仅含有721个样本,样本容量较小,难以直接训练出具有强大泛化能力的模型。Kirillov等
[14]提出分割一切的大模型SAM(segment anything model),以其优秀的zero-shot分割能力为蝴蝶生态图像分割提供了基础。然而SAM在特定下游任务中依然存在分割边界不清等问题
[15],分割出的图像质量难以令人满意,因此需要根据具体任务对SAM进行微调。然而,SAM参数量巨大,直接训练全部参数的微调方式成本高昂,目前下游任务中对SAM进行微调的主要方式是增加适配器
[16-18]。但是,这种方式破坏了SAM原本的完整性,在训练样本不足情况下,可能会降低SAM模型的分割能力。
为了解决SAM在具体下游任务中存在的局限性,使SAM能扩展用于解决生态图像中的蝴蝶分割问题,本文在SAM基础上,提出一种增强SAM 模型SABM(segment any butterfly model),该模型不对SAM插入适配器Adapter,而是将SAM编码器的信息传入双路卷积模块进一步提取特征,将双路卷积模块提取的特征与SAM解码器产生的掩码特征进行融合,得到蝴蝶特征(butterfly feature),然后通过新的蝴蝶词元(butterfly token)和一个3层的MLP(multi-layer perceptron)对蝴蝶特征进行调整,将其上采样,得到最终分割掩码。真实蝴蝶生态图像数据集的实验测试表明,提出的增强分割模型SABM对蝴蝶生态图像的分割能力优于SAM及一系列SAM改良模型,且在较大蝴蝶生态图像数据集具有很强的泛化能力,医学图像分割实验验证了SABM的鲁棒性。