《電子技術應用》
您所在的位置:首頁 > 其他 > 设计应用 > 基于改进Mask R-CNN的非结构环境小目标语义分割算法
基于改进Mask R-CNN的非结构环境小目标语义分割算法
电子技术应用
何兆蓉,郭健,徐琦,韩锐
南京理工大学 自动化学院
摘要: 计算机视觉对于小目标物体语义识别在非结构环境下有着较好的工程应用前景,但由于小目标零部件结构多变、样本少、环境复杂,传统方法对小目标分割识别的准确率较低。针对此问题,设计了一种基于注意力机制的Mask R-CNN改进模型。在原网络结构的基础上将FNP与融合注意力模块相结合,提出了一种A-FNP模块。以空间卫星作为非结构环境实验场景,对卫星帆板以及爆炸螺栓进行实验。实验结果表明,该方法对卫星帆板及其零部件的识别准确率提高了5.36%,相较于原模型优势显著。
中圖分類號:TP391.41 文獻標志碼:A DOI: 10.16157/j.issn.0258-7998.245136
中文引用格式: 何兆蓉,郭健,徐琦,等. 基于改進Mask R-CNN的非結構環(huán)境小目標語義分割算法[J]. 電子技術應用,2024,50(10):76-81.
英文引用格式: He Zhaorong,Guo Jian,Xu Qi,et al. Small target semantic segmentation algorithm for unstructured environment based on improved Mask R-CNN[J]. Application of Electronic Technique,2024,50(10):76-81.
Small target semantic segmentation algorithm for unstructured environment based on improved Mask R-CNN
He Zhaorong,Guo Jian,Xu Qi,Han Rui
School of Automation, Nanjing University of Science and Technology
Abstract: Computer vision has a good engineering application prospect for semantic recognition of small target objects in non-structural environments, but due to the changeable structure, small samples and complex environment of small target parts, the accuracy of traditional methods for small target segmentation recognition is low. To solve this problem, an improved Mask R-CNN model based on attention mechanism is designed in this paper. Based on the original network structure, an A-FNP module is proposed by combining FNP and fusion attention module. Taking the space satellite as the unstructured environment test scene, the satellite sails and explosive bolts are tested. The experimental results show that the accuracy of the proposed method is improved by 5.36%, which is significantly superior to the original model.
Key words : semantic segmentation;attention mechanism;Mask R-CNN;unstructured environment

引言

隨著計算機技術的持續(xù)進步,傳統(tǒng)的語義分割算法對于大規(guī)模的對象檢測網(wǎng)絡模型具有很高的識別精度,但是,這些算法在識別小目標對象時面臨著不少的挑戰(zhàn),如存在錯誤識別或者由于候選框之間相互重疊而無法識別的相關問題。在非結構環(huán)境中,處理零部件的數(shù)據(jù)存在許多挑戰(zhàn),如缺陷樣本的數(shù)量較少、狀態(tài)特征存在顯著差異、特征粒度差異性較小等。傳統(tǒng)的語義分割方法檢測的性能比較容易受到環(huán)境因素的影響,如照明強度、場景遮擋等,從而導致檢測的準確性較低、適應能力較弱。深度學習卷積神經網(wǎng)絡具有許多優(yōu)勢,包括強大的泛化能力、高檢測準確性以及對環(huán)境照明變化的抵抗力強等,因此,深度學習卷積神經網(wǎng)絡已經被引入整合到小目標零件的檢測中。

在復雜環(huán)境下針對小目標的語義分割研究中,魏永超等[1]提出了一種基于Mask R-CNN 算法的改進算法,以解決對缺陷類型的有限和對非結構化環(huán)境中對小目標缺陷的語義分割效果差強人意的問題。通過添加SENet模塊并改善NMS算法,使新模型的準確性得到了顯著提高。文韜[2]解決了傳統(tǒng)Mask R-CNN中小目標對象的低識別率的問題,并使用GFPN作為Mask R-CNN模型的功能采集。該模型通過融合從GFPN獲得的特征來設置各種特征的權重。茍軍年等[3]解決了復雜背景、小像素目標以及Mask R-CNN模型對于傳輸電路中絕緣子缺陷檢測不充分的問題。將卷積注意力模塊(Convolutional Block Attention Module, CBAM)引入特征提取網(wǎng)絡中,以達到從空間和通道角度提高小目標的特征保留。

本文以空間衛(wèi)星作為非結構環(huán)境的實驗場景,以衛(wèi)星帆板展開機構的爆炸螺栓作為待檢測的小目標物體。衛(wèi)星帆板展開異常是空間衛(wèi)星故障中最常見的形式之一,造成這種故障的原因主要是爆炸螺栓未完全。此時解決故障的方式一般是通過識別未完全爆炸或未爆炸的螺栓進行補充剪切操作。針對衛(wèi)星帆板的維修任務,首先需要檢測并識別出空間衛(wèi)星中的一些目標物體,如衛(wèi)星帆板的反光板面以及未完全爆炸的螺栓等。

針對小目標零件的語義分割研究,程敦誠等[4]使用U-net8將螺母、螺桿和其他信息標記成為不同顏色,并對其圖片進行語義分割,以檢測螺栓是否處于正常的狀態(tài)。羅隆福等[5]提出一種基于深度學習的螺栓裂紋檢測方法,該方法使用DeepLab v3 plus 算法在螺栓上執(zhí)行語義分割。李紅衛(wèi)等[6]利用深度學習框架Mask R-CNN[7]智能分析了通過機械臂視覺傳感器獲得的視覺信息,并根據(jù)RGB圖像數(shù)據(jù)實現(xiàn)了小目標零部件的語義分割。

本文在上述研究的基礎上,結合衛(wèi)星帆板中爆炸螺栓的結構特征,提出了一種基于注意力機制的Mask R-CNN語義分割優(yōu)化算法,在改進模型中完成對爆炸螺栓的語義分割,并與原Mask R-CNN的網(wǎng)絡模型進行性能對比,改進后模型優(yōu)勢顯著。


本文詳細內容請下載:

http://m.ihrv.cn/resource/share/2000006182


作者信息:

何兆蓉,郭健,徐琦,韓銳

(南京理工大學 自動化學院,江蘇 南京 210094)


Magazine.Subscription.jpg

此內容為AET網(wǎng)站原創(chuàng),未經授權禁止轉載。

相關內容