中文引用格式:鄧琬巾,文新,李維皓,等. 面向無(wú)人機(jī)網(wǎng)絡(luò)攻擊檢測(cè)的兩級(jí)特征選擇方法[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2026,45(4):35-44.
英文引用格式:Deng Wanjin, Wen Xin, Li Weihao,et al. A twostage feature selection method for network attack detection in UAV networks
[J].Cyber Security and Data Governance,2026,45(4):35-44.
引言
隨著低空經(jīng)濟(jì)的快速發(fā)展,無(wú)人機(jī)(Unmanned Aerial Vehicles,UAVs)在農(nóng)業(yè)、物流、交通和災(zāi)害響應(yīng)等領(lǐng)域的應(yīng)用日益廣泛。這類無(wú)人機(jī)具備一定的自主性,能夠提升效率并融入日常生活。然而,無(wú)人機(jī)因其開放的通信信道、無(wú)保護(hù)的傳感器輸入和有限的計(jì)算防護(hù)能力,容易受到安全威脅攻擊,攻擊者會(huì)采取各種辦法來(lái)阻礙、擾亂和控制無(wú)人機(jī)[1]。Warnakulasooriya等人[2]提到,2012年到2022年間的商業(yè)無(wú)人機(jī)受到多種網(wǎng)絡(luò)攻擊的威脅。Wang等人[3]總結(jié)出無(wú)人機(jī)群可能受到的攻擊有20種,攻擊涉及網(wǎng)絡(luò)、傳感器和機(jī)器學(xué)習(xí)模型。這些網(wǎng)絡(luò)攻擊會(huì)導(dǎo)致無(wú)人機(jī)在任務(wù)執(zhí)行過(guò)程中出錯(cuò),不僅損害無(wú)人機(jī)本身的價(jià)值,還可能造成公眾安全風(fēng)險(xiǎn)和經(jīng)濟(jì)損失。
入侵檢測(cè)系統(tǒng)(Intrusion Detection System,IDS)為緩解UAVs的網(wǎng)絡(luò)安全威脅提供了一種解決方案[3]?;跈C(jī)器學(xué)習(xí)或深度學(xué)習(xí)算法構(gòu)建模型,通過(guò)對(duì)網(wǎng)絡(luò)流量進(jìn)行分類和異常檢測(cè),來(lái)監(jiān)控和識(shí)別UAVs通信中的異常行為,精準(zhǔn)檢測(cè)網(wǎng)絡(luò)攻擊行為,為后續(xù)防御措施的觸發(fā)提供前提條件。決策樹[4]、隨機(jī)森林[5]、支持向量機(jī)[6]構(gòu)建的IDS準(zhǔn)確率已高達(dá)95%,而長(zhǎng)短時(shí)記憶循環(huán)神經(jīng)網(wǎng)絡(luò)[7](Long Short Term Memory and Recurrent Neural Network,LSTMRNN)、卷積長(zhǎng)短時(shí)記憶[8](Convolutional Long ShortTerm Memory,ConvLSTM)等深度學(xué)習(xí)算法的引入,又將準(zhǔn)確率推向了99%的高峰。然而,問(wèn)題也接踵而至:計(jì)算資源有限的UAVs無(wú)法承載模型對(duì)高算力的要求,且模型本身的高計(jì)算復(fù)雜度也產(chǎn)生了部署困難、實(shí)時(shí)性能低的挑戰(zhàn)。因此,特征工程成為解決問(wèn)題的關(guān)鍵,通過(guò)特征選擇減少數(shù)據(jù)維度、剔除冗余信息,不僅能減少模型推理的計(jì)算開銷、降低模型對(duì)算力的需求,還能提升檢測(cè)準(zhǔn)確率,避免過(guò)擬合風(fēng)險(xiǎn),從而使IDS更適用于無(wú)人機(jī)網(wǎng)絡(luò)安全防護(hù)。
目前,已有若干工作圍繞IDS模型的特征工程進(jìn)行了研究。在入侵檢測(cè)領(lǐng)域,信息增益(Information Gain, IG)是廣泛采用的特征選擇準(zhǔn)則,但傳統(tǒng)方法常依賴固定分箱對(duì)連續(xù)屬性進(jìn)行離散化,增加了重要特征信息丟失與漏選風(fēng)險(xiǎn)。Shi等人[9]提出基于信息損失與粗糙集的動(dòng)態(tài)離散化算法,驗(yàn)證了固定分箱在KDDCup99數(shù)據(jù)集上的局限性;Hassan[10]進(jìn)一步通過(guò)實(shí)驗(yàn)證明,固定分箱會(huì)顯著降低樸素貝葉斯等分類器的檢測(cè)效果;Zhang等人[11]也指出,固定分箱容易忽略特征間細(xì)微差異,導(dǎo)致部分高判別性特征被漏選。這些研究共同表明,傳統(tǒng)固定分箱方法在IG特征選擇中存在明顯缺陷,亟需能夠提升IG特征選擇準(zhǔn)確性的方案。
為了應(yīng)對(duì)上述挑戰(zhàn),本文提出了兩級(jí)特征選擇方法,設(shè)計(jì)了啟發(fā)式信息增益搜索(Heuristic Information Gain Feature Selection, HIS)算法,針對(duì)傳統(tǒng)信息增益算法的核心缺陷,即統(tǒng)一分箱策略可能導(dǎo)致重要特征因不恰當(dāng)離散化而被漏選,提出了自適應(yīng)優(yōu)化方案。該方法通過(guò)啟發(fā)式搜索改進(jìn)IG計(jì)算,精準(zhǔn)量化特征的判別能力,結(jié)合卡方檢驗(yàn)的初步篩選,實(shí)現(xiàn)了統(tǒng)計(jì)顯著性篩選與信息量?jī)?yōu)化的協(xié)同,構(gòu)建了更具系統(tǒng)性和精準(zhǔn)性的特征工程流程,為無(wú)人機(jī)入侵檢測(cè)系統(tǒng)中高維數(shù)據(jù)的高效處理提供了有力支撐。
本文的主要工作如下:
(1)提出了新的無(wú)人機(jī)網(wǎng)絡(luò)攻擊檢測(cè)方案TSFS,解決了機(jī)器學(xué)習(xí)模型的高檢測(cè)率對(duì)算力的高要求和低算力環(huán)境之間的矛盾。本文通過(guò)特征選擇與機(jī)器學(xué)習(xí)模型相結(jié)合,在保證檢測(cè)性能的前提下大幅降低計(jì)算開銷和模型復(fù)雜度,使TSFS能夠在資源受限的邊緣設(shè)備上實(shí)時(shí)運(yùn)行,解決了高性能檢測(cè)與低功耗部署之間的核心沖突,使其能夠部署在算力受限的無(wú)人機(jī)平臺(tái)上。
(2)為了解決所提出的問(wèn)題,設(shè)計(jì)了兩級(jí)特征選擇方法,對(duì)每個(gè)候選特征自適應(yīng)搜索出局部最優(yōu)分箱方案,準(zhǔn)確量化其真實(shí)判別能力。同時(shí)將所選特征的數(shù)量作為超參數(shù)納入模型訓(xùn)練的調(diào)優(yōu)過(guò)程,通過(guò)貝葉斯優(yōu)化實(shí)現(xiàn)特征選擇與XGBoost分類器的協(xié)同優(yōu)化,實(shí)現(xiàn)了以模型性能為導(dǎo)向的特征評(píng)估和篩選。
(3)實(shí)驗(yàn)結(jié)果表明,相較傳統(tǒng)信息增益方法,本文的兩級(jí)特征選擇方法能夠選出判別能力更強(qiáng)的特征子集,顯著提升分類模型的準(zhǔn)確率、召回率和F1分?jǐn)?shù),并且在準(zhǔn)確率超過(guò)95%的同時(shí),模型訓(xùn)練時(shí)間和推理時(shí)間大幅減少,能夠滿足實(shí)時(shí)檢測(cè)需求。與其他機(jī)器學(xué)習(xí)算法相比,本文方法在計(jì)算效率方面具有明顯優(yōu)勢(shì),更適合部署在資源受限的無(wú)人機(jī)平臺(tái)上,驗(yàn)證了所提方案在實(shí)際應(yīng)用場(chǎng)景中的可行性和有效性。
本文詳細(xì)內(nèi)容請(qǐng)下載:
http://m.ihrv.cn/resource/share/2000007057
作者信息:
鄧琬巾1,文新2,李維皓1,張瑋石1,白猛1
(1.華北計(jì)算機(jī)系統(tǒng)工程研究所,北京100083;
2.中國(guó)電子信息產(chǎn)業(yè)集團(tuán)有限公司,廣東深圳518057)

