《電子技術(shù)應用》
您所在的位置:首頁 > 其他 > 设计应用 > 基于深度学习的杆塔三维姿态实时估计
基于深度学习的杆塔三维姿态实时估计
2021年电子技术应用第6期
李国强1,彭炽刚1,汪 勇1,向东伟2,杨成城2
1.广东电网有限责任公司 机巡作业中心,广东 广州510062;2.武汉汇卓航科技有限公司,湖北 武汉430070
摘要: 针对目前无人机航拍影像杆塔识别算法中,普遍是无人机通过倾斜摄影技术获取到杆塔的原始遥观影像数据,经过机器学习训练,识别其余图片数据中的杆塔。其中存在获取机器训练所需的图片数据来源缓慢、只能二维识别图片中杆塔等问题。提出了基于深度学习的杆塔三维姿态实时估计的算法。首先,通过三维平台合成影像数据;其次,通过Deep-Object-Pose训练及其处理;然后测试真实的图片数据或者实时视频,达到智能识别杆塔的三维空间姿态信息。该算法为无人机自动寻找杆塔目标和智能精细化巡检提供新的思路。
中圖分類號: TN014;TP183
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.200280
中文引用格式: 李國強,彭熾剛,汪勇,等. 基于深度學習的桿塔三維姿態(tài)實時估計[J].電子技術(shù)應用,2021,47(6):87-91,95.
英文引用格式: Li Guoqiang,Peng Chigang,Wang Yong,et al. Real-time estimation of three-dimensional attitude of towers based on deep learning[J]. Application of Electronic Technique,2021,47(6):87-91,95.
Real-time estimation of three-dimensional attitude of towers based on deep learning
Li Guoqiang1,Peng Chigang1,Wang Yong1,Xiang Dongwei2,Yang Chengcheng2
1.Machine Operation Center,Guangdong Power Grid Co.,Ltd.,Guangzhou 510062,China; 2.Wuhan Huizhuohang Technology Co.,Ltd.,Wuhan 430070,China
Abstract: According to the current aerial image tower identification algorithm of UAV, it is common for UAV to obtain the original remote viewing image data of the tower through tilt photography technology, and identify the tower in the rest image data through machine learning training.Among them, there are some problems such as slow source of image data needed for machine training and two-dimensional identification of the tower in the picture.In this paper, an algorithm based on deep-object-pose is proposed for real-time aerial aerial aerial aerial recognition of the three-dimensional attitude of the tower.Firstly, image data is synthesized by three-dimensional platform.Secondly, deep-object-pose training and treatment were carried out.Then test the real picture data or real-time video, to achieve intelligent recognition of the tower's three-dimensional attitude information.The experimental results show that this algorithm will provide a new idea for uav to automatically find the target of tower and intelligent fine inspection.
Key words : Deep-Object-Pose;3D attitude recognition of tower;UAV;aerial image

0 引言

    隨著國民經(jīng)濟的增長和無人機在電網(wǎng)的逐步應用推廣,繁重的無人機作業(yè)任務讓無人機的智能化顯得尤為重要。同時,機器學習技術(shù)的飛速發(fā)展,給無人機的智能化提供了新的思路。但是,機器視覺的目前所需要的訓練數(shù)據(jù)是通過無人機等手段采集的,不僅耗時長、耗人力,而且檢測往往只是針對單張圖片,進行二維平面上的識別,面對實時視頻檢測比較卡頓,同樣無法識別物體三維空間姿態(tài)。

    因此,需要改善視頻實時識別的卡頓,改進訓練數(shù)據(jù)的采集技術(shù)。傳統(tǒng)的目標檢測算法大多數(shù)以圖像識別為基礎(chǔ)。一般可以在圖片上使用窮舉法或者滑動窗口選出所有物體可能出現(xiàn)的區(qū)域框,對這些區(qū)域框提取特征并使用圖像識別分類方法,得到所有分類成功的區(qū)域后,通過非極大值抑制輸出結(jié)果。近些年來相關(guān)學者提出采用人工智能的方法實現(xiàn)目標檢測,其中包括K最近鄰KNN[1]、隨機森林Random Forest[2]、線性向量機SVM[3]。這些淺層機器學習方法在建模過程中功能簡單,復雜函數(shù)和分類問題的表達有限,魯棒性差,準確度和精度低。而對于難以應對指數(shù)增長的遙感圖像目標特征提取,也不能達到很好的特征分析和識別效果。




本文詳細內(nèi)容請下載:http://m.ihrv.cn/resource/share/2000003580。




作者信息:

李國強1,彭熾剛1,汪  勇1,向東偉2,楊成城2

(1.廣東電網(wǎng)有限責任公司 機巡作業(yè)中心,廣東 廣州510062;2.武漢匯卓航科技有限公司,湖北 武漢430070)





wd.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容