123,123,123

基于改进Mask R-CNN的非结构环境小目标语义分割算法

电子技术应用

何兆蓉，郭健，徐琦，韩锐

南京理工大学自动化学院

摘要： 计算机视觉对于小目标物体语义识别在非结构环境下有着较好的工程应用前景，但由于小目标零部件结构多变、样本少、环境复杂，传统方法对小目标分割识别的准确率较低。针对此问题，设计了一种基于注意力机制的Mask R-CNN改进模型。在原网络结构的基础上将FNP与融合注意力模块相结合，提出了一种A-FNP模块。以空间卫星作为非结构环境实验场景，对卫星帆板以及爆炸螺栓进行实验。实验结果表明，该方法对卫星帆板及其零部件的识别准确率提高了5.36％，相较于原模型优势显著。

關(guān)鍵詞： 语义分割注意力机制 MaskR-CNN 非结构环境

中圖分類號：TP391.41 文獻標志碼：A DOI: 10.16157/j.issn.0258-7998.245136
中文引用格式： 何兆蓉，郭健，徐琦，等. 基于改進Mask R-CNN的非結(jié)構(gòu)環(huán)境小目標語義分割算法[J]. 電子技術(shù)應(yīng)用，2024，50(10)：76-81.
英文引用格式： He Zhaorong，Guo Jian，Xu Qi，et al. Small target semantic segmentation algorithm for unstructured environment based on improved Mask R-CNN[J]. Application of Electronic Technique，2024，50(10)：76-81.

Small target semantic segmentation algorithm for unstructured environment based on improved Mask R-CNN

He Zhaorong，Guo Jian，Xu Qi，Han Rui

School of Automation， Nanjing University of Science and Technology

Abstract： Computer vision has a good engineering application prospect for semantic recognition of small target objects in non-structural environments, but due to the changeable structure, small samples and complex environment of small target parts, the accuracy of traditional methods for small target segmentation recognition is low. To solve this problem, an improved Mask R-CNN model based on attention mechanism is designed in this paper. Based on the original network structure, an A-FNP module is proposed by combining FNP and fusion attention module. Taking the space satellite as the unstructured environment test scene, the satellite sails and explosive bolts are tested. The experimental results show that the accuracy of the proposed method is improved by 5.36%, which is significantly superior to the original model.

Key words : semantic segmentation；attention mechanism；Mask R-CNN；unstructured environment

引言

隨著計算機技術(shù)的持續(xù)進步，傳統(tǒng)的語義分割算法對于大規(guī)模的對象檢測網(wǎng)絡(luò)模型具有很高的識別精度，但是，這些算法在識別小目標對象時面臨著不少的挑戰(zhàn)，如存在錯誤識別或者由于候選框之間相互重疊而無法識別的相關(guān)問題。在非結(jié)構(gòu)環(huán)境中，處理零部件的數(shù)據(jù)存在許多挑戰(zhàn)，如缺陷樣本的數(shù)量較少、狀態(tài)特征存在顯著差異、特征粒度差異性較小等。傳統(tǒng)的語義分割方法檢測的性能比較容易受到環(huán)境因素的影響，如照明強度、場景遮擋等，從而導(dǎo)致檢測的準確性較低、適應(yīng)能力較弱。深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)具有許多優(yōu)勢，包括強大的泛化能力、高檢測準確性以及對環(huán)境照明變化的抵抗力強等，因此，深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)被引入整合到小目標零件的檢測中。

在復(fù)雜環(huán)境下針對小目標的語義分割研究中，魏永超等[1]提出了一種基于Mask R-CNN 算法的改進算法，以解決對缺陷類型的有限和對非結(jié)構(gòu)化環(huán)境中對小目標缺陷的語義分割效果差強人意的問題。通過添加SENet模塊并改善NMS算法，使新模型的準確性得到了顯著提高。文韜[2]解決了傳統(tǒng)Mask R-CNN中小目標對象的低識別率的問題，并使用GFPN作為Mask R-CNN模型的功能采集。該模型通過融合從GFPN獲得的特征來設(shè)置各種特征的權(quán)重。茍軍年等[3]解決了復(fù)雜背景、小像素目標以及Mask R-CNN模型對于傳輸電路中絕緣子缺陷檢測不充分的問題。將卷積注意力模塊（Convolutional Block Attention Module, CBAM）引入特征提取網(wǎng)絡(luò)中，以達到從空間和通道角度提高小目標的特征保留。

本文以空間衛(wèi)星作為非結(jié)構(gòu)環(huán)境的實驗場景，以衛(wèi)星帆板展開機構(gòu)的爆炸螺栓作為待檢測的小目標物體。衛(wèi)星帆板展開異常是空間衛(wèi)星故障中最常見的形式之一，造成這種故障的原因主要是爆炸螺栓未完全。此時解決故障的方式一般是通過識別未完全爆炸或未爆炸的螺栓進行補充剪切操作。針對衛(wèi)星帆板的維修任務(wù)，首先需要檢測并識別出空間衛(wèi)星中的一些目標物體，如衛(wèi)星帆板的反光板面以及未完全爆炸的螺栓等。

針對小目標零件的語義分割研究，程敦誠等[4]使用U-net8將螺母、螺桿和其他信息標記成為不同顏色，并對其圖片進行語義分割，以檢測螺栓是否處于正常的狀態(tài)。羅隆福等[5]提出一種基于深度學(xué)習(xí)的螺栓裂紋檢測方法，該方法使用DeepLab v3 plus 算法在螺栓上執(zhí)行語義分割。李紅衛(wèi)等[6]利用深度學(xué)習(xí)框架Mask R-CNN[7]智能分析了通過機械臂視覺傳感器獲得的視覺信息，并根據(jù)RGB圖像數(shù)據(jù)實現(xiàn)了小目標零部件的語義分割。

本文在上述研究的基礎(chǔ)上，結(jié)合衛(wèi)星帆板中爆炸螺栓的結(jié)構(gòu)特征，提出了一種基于注意力機制的Mask R-CNN語義分割優(yōu)化算法，在改進模型中完成對爆炸螺栓的語義分割，并與原Mask R-CNN的網(wǎng)絡(luò)模型進行性能對比，改進后模型優(yōu)勢顯著。

本文詳細內(nèi)容請下載：

http://m.ihrv.cn/resource/share/2000006182

作者信息：

何兆蓉，郭健，徐琦，韓銳

（南京理工大學(xué) 自動化學(xué)院，江蘇南京 210094）

Magazine.Subscription.jpg

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容