123,123

面向无人机网络攻击检测的两级特征选择方法

网络安全与数据治理

邓琬巾1，文新2，李维皓1，张玮石1，白猛1

1.华北计算机系统工程研究所; 2.中国电子信息产业集团有限公司

摘要： 针对机器学习算力需求高与无人机（Unmanned Aerial Vehicles, UAVs）计算资源有限的矛盾，以及传统基于固定分箱的信息增益特征选择方法存在高判别力特征被低估的缺陷，提出一种基于两级特征选择方法的无人机入侵检测方案。该方案采用“卡方检验初筛—启发式信息增益搜索精选”方法，为每个特征自适应确定最优分箱，从而准确量化其判别能力。同时将特征数量作为超参数，与XGBoost分类器协同优化。基于UAV-NIDD数据集的实验表明，该方法在保持高检测性能的同时，将模型检测时间减少了约97.5%。实验验证，该方案有效平衡了检测精度与计算开销，可为资源受限的无人机平台提供高效实时的入侵检测能力。

關(guān)鍵詞： 无人机入侵检测特征选择信息增益自适应离散化

中圖分類號(hào)：TP393文獻(xiàn)標(biāo)志碼：ADOI:10.19358/j.issn.2097-1788.2026.04.005
中文引用格式：鄧琬巾，文新，李維皓，等. 面向無(wú)人機(jī)網(wǎng)絡(luò)攻擊檢測(cè)的兩級(jí)特征選擇方法［J］.網(wǎng)絡(luò)安全與數(shù)據(jù)治理，2026，45（4）：35-44.
英文引用格式：Deng Wanjin, Wen Xin, Li Weihao，et al. A twostage feature selection method for network attack detection in UAV networks
［J］.Cyber Security and Data Governance，2026，45（4）：35-44.

A two-stage feature selection method for network attack detection in UAV networks

Deng Wanjin1, Wen Xin2, Li Weihao1, Zhang Weishi1, Bai Meng1

1. National Computer System Engineering Research Institute of China; 2. China Eletronics Corporation

Abstract： To address the dual challenges of high computational demands in machine learning and the limited computing resources of unmanned aerial vehicles (UAVs), as well as the drawback of traditional fixed-binning information gain feature selection methods which underestimate highly discriminative features, this paper proposes a UAV intrusion detection scheme based on a two-level feature selection approach. The scheme adopts a "Chi-square test preliminary screeningHeuristic Information Gain Feature Selection (HIS) fine selection" method, which adaptively determines the optimal binning for each feature to accurately quantify its discriminative power. Meanwhile, the number of features is treated as a hyperparameter and jointly optimized with the XGBoost classifier. Experiments on the UAV-NIDD dataset demonstrate that the proposed method maintains high detection performance while reducing model detection time by approximately 97.5%. The results verify that this scheme effectively balances detection accuracy and computational cost, providing an efficient and realtime intrusion detection capability for resourceconstrained UAV platforms.

Key words : UAVs; intrusion detection; feature selection; information gain; adaptive discretization

引言

隨著低空經(jīng)濟(jì)的快速發(fā)展，無(wú)人機(jī)（Unmanned Aerial Vehicles，UAVs）在農(nóng)業(yè)、物流、交通和災(zāi)害響應(yīng)等領(lǐng)域的應(yīng)用日益廣泛。這類無(wú)人機(jī)具備一定的自主性，能夠提升效率并融入日常生活。然而，無(wú)人機(jī)因其開放的通信信道、無(wú)保護(hù)的傳感器輸入和有限的計(jì)算防護(hù)能力，容易受到安全威脅攻擊，攻擊者會(huì)采取各種辦法來(lái)阻礙、擾亂和控制無(wú)人機(jī)［1］。Warnakulasooriya等人［2］提到，2012年到2022年間的商業(yè)無(wú)人機(jī)受到多種網(wǎng)絡(luò)攻擊的威脅。Wang等人［3］總結(jié)出無(wú)人機(jī)群可能受到的攻擊有20種，攻擊涉及網(wǎng)絡(luò)、傳感器和機(jī)器學(xué)習(xí)模型。這些網(wǎng)絡(luò)攻擊會(huì)導(dǎo)致無(wú)人機(jī)在任務(wù)執(zhí)行過(guò)程中出錯(cuò)，不僅損害無(wú)人機(jī)本身的價(jià)值，還可能造成公眾安全風(fēng)險(xiǎn)和經(jīng)濟(jì)損失。

入侵檢測(cè)系統(tǒng)（Intrusion Detection System，IDS）為緩解UAVs的網(wǎng)絡(luò)安全威脅提供了一種解決方案［3］?；跈C(jī)器學(xué)習(xí)或深度學(xué)習(xí)算法構(gòu)建模型，通過(guò)對(duì)網(wǎng)絡(luò)流量進(jìn)行分類和異常檢測(cè)，來(lái)監(jiān)控和識(shí)別UAVs通信中的異常行為，精準(zhǔn)檢測(cè)網(wǎng)絡(luò)攻擊行為，為后續(xù)防御措施的觸發(fā)提供前提條件。決策樹［4］、隨機(jī)森林［5］、支持向量機(jī)［6］構(gòu)建的IDS準(zhǔn)確率已高達(dá)95%，而長(zhǎng)短時(shí)記憶循環(huán)神經(jīng)網(wǎng)絡(luò)［7］（Long Short Term Memory and Recurrent Neural Network，LSTMRNN）、卷積長(zhǎng)短時(shí)記憶［8］（Convolutional Long ShortTerm Memory，ConvLSTM）等深度學(xué)習(xí)算法的引入，又將準(zhǔn)確率推向了99%的高峰。然而，問(wèn)題也接踵而至：計(jì)算資源有限的UAVs無(wú)法承載模型對(duì)高算力的要求，且模型本身的高計(jì)算復(fù)雜度也產(chǎn)生了部署困難、實(shí)時(shí)性能低的挑戰(zhàn)。因此，特征工程成為解決問(wèn)題的關(guān)鍵，通過(guò)特征選擇減少數(shù)據(jù)維度、剔除冗余信息，不僅能減少模型推理的計(jì)算開銷、降低模型對(duì)算力的需求，還能提升檢測(cè)準(zhǔn)確率，避免過(guò)擬合風(fēng)險(xiǎn)，從而使IDS更適用于無(wú)人機(jī)網(wǎng)絡(luò)安全防護(hù)。

目前，已有若干工作圍繞IDS模型的特征工程進(jìn)行了研究。在入侵檢測(cè)領(lǐng)域，信息增益（Information Gain, IG）是廣泛采用的特征選擇準(zhǔn)則，但傳統(tǒng)方法常依賴固定分箱對(duì)連續(xù)屬性進(jìn)行離散化，增加了重要特征信息丟失與漏選風(fēng)險(xiǎn)。Shi等人［9］提出基于信息損失與粗糙集的動(dòng)態(tài)離散化算法，驗(yàn)證了固定分箱在KDDCup99數(shù)據(jù)集上的局限性；Hassan［10］進(jìn)一步通過(guò)實(shí)驗(yàn)證明，固定分箱會(huì)顯著降低樸素貝葉斯等分類器的檢測(cè)效果；Zhang等人［11］也指出，固定分箱容易忽略特征間細(xì)微差異，導(dǎo)致部分高判別性特征被漏選。這些研究共同表明，傳統(tǒng)固定分箱方法在IG特征選擇中存在明顯缺陷，亟需能夠提升IG特征選擇準(zhǔn)確性的方案。

為了應(yīng)對(duì)上述挑戰(zhàn)，本文提出了兩級(jí)特征選擇方法，設(shè)計(jì)了啟發(fā)式信息增益搜索（Heuristic Information Gain Feature Selection, HIS）算法，針對(duì)傳統(tǒng)信息增益算法的核心缺陷,即統(tǒng)一分箱策略可能導(dǎo)致重要特征因不恰當(dāng)離散化而被漏選，提出了自適應(yīng)優(yōu)化方案。該方法通過(guò)啟發(fā)式搜索改進(jìn)IG計(jì)算，精準(zhǔn)量化特征的判別能力，結(jié)合卡方檢驗(yàn)的初步篩選，實(shí)現(xiàn)了統(tǒng)計(jì)顯著性篩選與信息量?jī)?yōu)化的協(xié)同，構(gòu)建了更具系統(tǒng)性和精準(zhǔn)性的特征工程流程，為無(wú)人機(jī)入侵檢測(cè)系統(tǒng)中高維數(shù)據(jù)的高效處理提供了有力支撐。

本文的主要工作如下：

（1)提出了新的無(wú)人機(jī)網(wǎng)絡(luò)攻擊檢測(cè)方案TSFS，解決了機(jī)器學(xué)習(xí)模型的高檢測(cè)率對(duì)算力的高要求和低算力環(huán)境之間的矛盾。本文通過(guò)特征選擇與機(jī)器學(xué)習(xí)模型相結(jié)合，在保證檢測(cè)性能的前提下大幅降低計(jì)算開銷和模型復(fù)雜度，使TSFS能夠在資源受限的邊緣設(shè)備上實(shí)時(shí)運(yùn)行，解決了高性能檢測(cè)與低功耗部署之間的核心沖突，使其能夠部署在算力受限的無(wú)人機(jī)平臺(tái)上。

（2)為了解決所提出的問(wèn)題，設(shè)計(jì)了兩級(jí)特征選擇方法，對(duì)每個(gè)候選特征自適應(yīng)搜索出局部最優(yōu)分箱方案，準(zhǔn)確量化其真實(shí)判別能力。同時(shí)將所選特征的數(shù)量作為超參數(shù)納入模型訓(xùn)練的調(diào)優(yōu)過(guò)程，通過(guò)貝葉斯優(yōu)化實(shí)現(xiàn)特征選擇與XGBoost分類器的協(xié)同優(yōu)化，實(shí)現(xiàn)了以模型性能為導(dǎo)向的特征評(píng)估和篩選。

（3)實(shí)驗(yàn)結(jié)果表明，相較傳統(tǒng)信息增益方法，本文的兩級(jí)特征選擇方法能夠選出判別能力更強(qiáng)的特征子集，顯著提升分類模型的準(zhǔn)確率、召回率和F1分?jǐn)?shù)，并且在準(zhǔn)確率超過(guò)95%的同時(shí)，模型訓(xùn)練時(shí)間和推理時(shí)間大幅減少，能夠滿足實(shí)時(shí)檢測(cè)需求。與其他機(jī)器學(xué)習(xí)算法相比，本文方法在計(jì)算效率方面具有明顯優(yōu)勢(shì)，更適合部署在資源受限的無(wú)人機(jī)平臺(tái)上，驗(yàn)證了所提方案在實(shí)際應(yīng)用場(chǎng)景中的可行性和有效性。

本文詳細(xì)內(nèi)容請(qǐng)下載：

http://m.ihrv.cn/resource/share/2000007057

作者信息：

鄧琬巾1，文新2，李維皓1，張瑋石1，白猛1

（1.華北計(jì)算機(jī)系統(tǒng)工程研究所，北京100083;

2.中國(guó)電子信息產(chǎn)業(yè)集團(tuán)有限公司，廣東深圳518057）

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容