《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 其他 > 设计应用 > 一种基于改进Mask R-CNN模型的遥感图像目标识别方法
一种基于改进Mask R-CNN模型的遥感图像目标识别方法
信息技术与网络安全
余慧明,周志祥,彭 杨,崔志斌
(武汉兴图新科电子股份有限公司 平台产品部,湖北 武汉430073)
摘要: 目标识别技术作为机器视觉领域的一个重要分支,在各个领域有着重要的应用。鉴于一般的目标识别模型在遥感图片中表现不佳,另外需要识别的目标数量较多,尺寸大小不一,因此在经典的目标识别Mask R-CNN模型的基础上,提出了一种融合了通道注意力机制和数据增强技术的模型Mask R-CNN模型。在输入图片数据时,首先通过Random-Batch images操作对数据进行增强处理,提高模型对尺寸大小不一的目标识别的准确率;然后提取特征时,将原Mask R-CNN模型中的FPN改进为BiFPN,使提取到的特征能更好体现原本的图片信息;在最后的Mask阶段,增加了通道注意力机制,使得模型更多地得到需要的信息。经过实验表明,此模型在遥感图像的特殊目标细粒度识别中有良好的表现。对于同一个数据集,其评价指标在各个方面都要优于其他对比算法。
中圖分類(lèi)號(hào): TP389.1
文獻(xiàn)標(biāo)識(shí)碼: A
DOI: 10.19358/j.issn.2096-5133.2021.03.007
引用格式: 余慧明,周志祥,彭?xiàng)睿? 一種基于改進(jìn)Mask R-CNN模型的遙感圖像目標(biāo)識(shí)別方法[J].信息技術(shù)與網(wǎng)絡(luò)安全,2021,40(3):38-42,47.
A remote sensing image target recognition method based on improved Mask R-CNN model
Yu Huiming,Zhou Zhixiang,Peng Yang,Cui Zhibin
(Wuhan Xing Tu Xin Ke Co.,Ltd.,Platform Products Department,Wuhan 430073,China)
Abstract: As an important branch in the field of machine vision, target recognition technology has important applications in various fields. In view of the fact that the general target recognition model does not perform well in remote sensing images, the number of targets that need to be recognized is large, and the sizes are different, based on the classic target recognition Mask R-CNN model, a Mask R-CNN model fusing channel attention mechanism and data enhancement technology is proposed. When inputting image data, the data through the Random-Batch images operation to improve the accuracy of the model′s recognition of targets of different sizes is first enhanced; then, when extracting features, the FPN in the original Mask R-CNN model is improved to BiFPN, so that the extracted features can better reflect the original picture information; in the final Mask stage, the channel attention mechanism is added, so that the model can get more information. Experiments show that this model is used in remote sensing images. It has a good performance in the fine-grained recognition of special targets. For the same data set, its evaluation indicators are superior to other comparison algorithms in all aspects.
Key words : target recognition;Mask R-CNN;channel attention;data enhancement

0 引言

隨著人工智能的興起,深度學(xué)習(xí)[1]算法各個(gè)領(lǐng)域的優(yōu)勢(shì)被體現(xiàn)出來(lái)。對(duì)視頻、圖像中的多目標(biāo)、細(xì)粒度的目標(biāo)識(shí)別技術(shù),可以方便人們?cè)趶?fù)雜的情景中快速定位到所需要的檢測(cè)目標(biāo)。隨著場(chǎng)景的復(fù)雜度加深,基于基礎(chǔ)模型的各種改進(jìn)版本層出不窮。

在過(guò)去近10年中,目標(biāo)識(shí)別技術(shù)又有了飛速的發(fā)展,從最開(kāi)始的機(jī)器學(xué)習(xí)算法,再到目前主流的深度學(xué)習(xí)目標(biāo)識(shí)別算法,如RCNN[2]、SSP-Net[3]、Fast R-CNN[4]、Faster R-CNN[5],目標(biāo)識(shí)別技術(shù)已經(jīng)在各個(gè)領(lǐng)域都有了很好的應(yīng)用。但是,由于數(shù)據(jù)集的制約,針對(duì)遙感圖像的軍事目標(biāo)識(shí)別卻是一個(gè)例外。另外,軍事碼頭物體數(shù)量眾多,需要檢測(cè)的目標(biāo)與其他物體交錯(cuò)相間,大大降低了模型的準(zhǔn)確性。對(duì)于一些密集型的目標(biāo)檢測(cè),PAN X[6]等人提出了一個(gè)由特征選擇模塊(Feature Selection Module,F(xiàn)SM)和動(dòng)態(tài)優(yōu)化頭(Dynamic Refinement Head,DRH)組成的動(dòng)態(tài)優(yōu)化網(wǎng)絡(luò)。FSM使神經(jīng)元能夠根據(jù)目標(biāo)物體的形狀和方向調(diào)整接受野,而DRH使模型能夠以一種對(duì)象感知的方式動(dòng)態(tài)地改進(jìn)預(yù)測(cè)。何代毅[7]等人就提出了一種基于改進(jìn) Mask-RCNN[8]的建筑物自動(dòng)提取方法,在網(wǎng)絡(luò)的設(shè)計(jì)中添加了路徑聚合網(wǎng)絡(luò)和特征增強(qiáng)功能,通過(guò)監(jiān)督和遷移學(xué)習(xí)的方式在Inria航空影像標(biāo)簽數(shù)據(jù)集中進(jìn)行多線程迭代訓(xùn)練與模型優(yōu)化學(xué)習(xí),實(shí)現(xiàn)了建筑物的自動(dòng)精確分割和提取。對(duì)于數(shù)據(jù)集缺乏等問(wèn)題,林通[9]等人通過(guò)遷移姿態(tài)生成對(duì)抗網(wǎng)絡(luò)生成姿態(tài)不同的行人圖片,對(duì)數(shù)據(jù)集進(jìn)行了擴(kuò)充。


本文詳細(xì)內(nèi)容請(qǐng)下載:http://m.ihrv.cn/resource/share/2000003422




作者信息:

余慧明,周志祥,彭  楊,崔志斌

(武漢興圖新科電子股份有限公司 平臺(tái)產(chǎn)品部,湖北 武漢430073)


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容