《電子技術應用》
您所在的位置:首頁 > 通信與網(wǎng)絡 > 設計應用 > 兩階段物聯(lián)網(wǎng)資產識別模型的研究
兩階段物聯(lián)網(wǎng)資產識別模型的研究
網(wǎng)絡安全與數(shù)據(jù)治理
權曉文1,2,汪連連2,韓衛(wèi)東2,任高峰2,楊家海1
1.清華大學網(wǎng)絡科學與網(wǎng)絡空間研究院; 2.遠江盛邦(北京)網(wǎng)絡安全科技股份有限公司
摘要: 提出了一種兩階段的物聯(lián)網(wǎng)資產識別模型。首先,對異構協(xié)議進行分析,解決多樣化協(xié)議流量特征提取困難問題。其次,利用輕量級模型SqueezeNet過濾非物聯(lián)網(wǎng)設備,提高識別效率并降低計算負擔。為進一步解決數(shù)據(jù)不均衡問題,引入生成對抗網(wǎng)絡(GAN)生成合成樣本數(shù)據(jù),平衡數(shù)據(jù)分布。最后,采用 XLNet與注意力機制結合的模型來識別物聯(lián)網(wǎng)設備的類型,有效提升了模型在大規(guī)模物聯(lián)網(wǎng)網(wǎng)絡環(huán)境中的識別精度和效率。實驗結果表明,模型在公開數(shù)據(jù)集上的準確率達到99.48%,召回率提升2.02%,F(xiàn)1分數(shù)提高1.85%,并在真實環(huán)境中保持99.01%的準確率。該模型為物聯(lián)網(wǎng)資產管理和安全管理提供了有效的解決方案。
中圖分類號:TP309文獻標識碼:ADOI:10.19358/j.issn.2097-1788.2025.04.002
引用格式:權曉文,汪連連,韓衛(wèi)東,等. 兩階段物聯(lián)網(wǎng)資產識別模型的研究[J].網(wǎng)絡安全與數(shù)據(jù)治理,2025,44(4):10-18.
Research on two-stage IoT asset identification model
Quan Xiaowen1,2, Wang Lianlian2, Han Weidong2, Ren Gaofeng2, Yang Jiahai1
1. Institute of Network Science and Cyberspace, Tsinghua University; 2. WebRay(Beijing) Technology Co., Ltd.
Abstract: This article proposes a two-stage IoT asset identification model. Firstly, this article analyzes heterogeneous protocols to address the difficulty of extracting traffic characteristics from diverse protocols. Secondly, this article utilizes the lightweight model SqueezeNet to filter non IoT devices, improving recognition efficiency and reducing computational burden. To further address the issue of data imbalance, a Generative Adversarial Network (GAN) is introduced to generate synthetic sample data and balance the data distribution. Finally, this article adopts a model combining XLNet and attention mechanism to identify the types of IoT devices, effectively improving the recognition accuracy and efficiency of the model in large-scale IoT network environments. The experimental results show that the accuracy of the model on public datasets reaches 99.48%, the recall rate increases by 2.02%, the F1 score increases by 1.85%, and maintains an accuracy of 99.01% in real environments. This model provides an effective solution for IoT asset management and security management.
Key words : IoT;feature selection; equipment filtering; asset recognition; sample balancing; deep learning

引言

物聯(lián)網(wǎng)(IoT)作為信息科技產業(yè)的第三次革命,正迅速擴展,尤其在工業(yè)物聯(lián)網(wǎng)、車聯(lián)網(wǎng)、衛(wèi)星互聯(lián)網(wǎng)等領域[1]。然而,伴隨物聯(lián)網(wǎng)設備的激增,傳統(tǒng)的設備資產管理方式不僅需要大量人力物力,還對管理員的專業(yè)能力提出了更高要求。物聯(lián)網(wǎng)設備通過多種無線方式接入網(wǎng)絡,使用多種協(xié)議,其中許多為專有或非標準協(xié)議,如何快速、準確地識別和管理這些設備成為亟待解決的難題。

傳統(tǒng)的主被動資產摸底檢測方式容易將物聯(lián)網(wǎng)設備誤分類,忽略其獨特屬性。同時,物聯(lián)網(wǎng)設備的安全問題不容忽視,受攻擊的設備不僅會喪失功能,還可能被利用作為跳板威脅整個網(wǎng)絡的安全[2]。因此,有效識別物聯(lián)網(wǎng)設備顯得尤為緊迫。

物聯(lián)網(wǎng)資產識別技術在物聯(lián)網(wǎng)系統(tǒng)中具有重要作用[3]:它幫助管理員建立全面的設備清單,支持漏洞管理、補丁分發(fā)和訪問控制;能夠發(fā)現(xiàn)未授權或異常設備,有效降低安全風險;同時,精準識別和跟蹤設備活動是滿足隱私保護法規(guī)的前提。

近年來,物聯(lián)網(wǎng)設備識別和異常檢測工作成為研究熱點,主要針對以下幾個方面:

(1)針對物聯(lián)網(wǎng)特征提取問題,文獻[4]提出了一種稱為DPFEN的獨特雙相特征提取技術,用于對IoT設備上的網(wǎng)絡攻擊進行分類,但所提出的方法在數(shù)據(jù)集的選擇和應用范圍上存在一定的局限性,會影響其在實際IoT環(huán)境中的有效性和可靠性。文獻[5]使用云計算的多特征提取極限學習機(MFEELM)算法,檢測和發(fā)現(xiàn)對云節(jié)點的網(wǎng)絡入侵。但MFE-ELM算法只在特定的云環(huán)境上進行訓練和測試,無法很好地泛化到其他不同的網(wǎng)絡環(huán)境和攻擊類型。

(2)針對樣本不均衡問題,文獻[6]根據(jù)語義邊界檢測任務的特點,提出了一種損失函數(shù)來解決樣本不平衡的問題,可以以不同的方式處理樣本,讓網(wǎng)絡更加關注難以分類的樣本。文獻[7]提出了樣本平衡策略模塊來優(yōu)化訓練樣本之間的不平衡,尤其是正和負、簡單和困難樣本之間的不平衡。但這兩種方法,在處理極端不平衡的數(shù)據(jù)集時,會限制模型的泛化能力,導致預測精度較低。

(3)針對物聯(lián)網(wǎng)資產識別問題,文獻[8]提出一種基于流量特征的兩層物聯(lián)網(wǎng)設備類型定義和識別方法,可以訓練物聯(lián)網(wǎng)設備類型并識別每種類型下的設備。文獻[9]提出一種基于網(wǎng)絡流量的物聯(lián)網(wǎng)設備識別方法,此方法通過提取協(xié)議統(tǒng)計特征和流級統(tǒng)計特征,有效降低了特征提取的成本。IoT設備類型眾多,特征構造復雜,但當新的設備類型被引入網(wǎng)絡或現(xiàn)有設備的行為因制造商的合法固件升級而發(fā)生變化時,文獻[8]需要為每種設備類型定制特征模型,而文獻[9]則必須針對所有類別重新訓練所有型號。上述兩種方法均表現(xiàn)了其在實現(xiàn)上具有較高的算法復雜度。

上述方法雖然能夠識別出網(wǎng)絡中的物聯(lián)網(wǎng)設備,但依舊存在局限性:(1)隨著物聯(lián)網(wǎng)設備種類和特征的增加,模型計算復雜度和資源需求顯著提高;(2)設備加密通信的普及,流量內容特征無法直接獲取;(3)設備流量分布不均,某些設備流量稀少,導致訓練數(shù)據(jù)不平衡,影響模型性能,可能導致過擬合。

為解決上述問題,本文提出了兩階段物聯(lián)網(wǎng)資產識別技術。第一階段,采用異構協(xié)議融合的流量特征選擇算法,從網(wǎng)絡流量中提取關鍵特征,有效應對多樣化協(xié)議環(huán)境和加密流量特征提取困難問題。同時,利用輕量化SqueezeNet模型過濾非物聯(lián)網(wǎng)設備,減少不必要的計算資源消耗。第二階段,引入GAN模型生成稀缺類別樣本,平衡數(shù)據(jù)分布,提升模型的泛化能力。在此基礎上,結合XLNet-Attention模型進一步對物聯(lián)網(wǎng)資產類型進行識別。該方法有效應對了計算復雜度、加密流量分析和數(shù)據(jù)不均衡問題,為物聯(lián)網(wǎng)資產管理和安全防護提供了可行技術路徑。


本文詳細內容請下載:

http://m.ihrv.cn/resource/share/2000006407


作者信息:

權曉文1,2,汪連連2,韓衛(wèi)東2,任高峰2,楊家海1

(1.清華大學網(wǎng)絡科學與網(wǎng)絡空間研究院,北京100084;

2.遠江盛邦(北京)網(wǎng)絡安全科技股份有限公司,北京100085)


Magazine.Subscription.jpg

此內容為AET網(wǎng)站原創(chuàng),未經(jīng)授權禁止轉載。