《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信与网络 > 设计应用 > 基于有限记忆、概率学习的双时间尺度切片资源分配方法
基于有限记忆、概率学习的双时间尺度切片资源分配方法
电子技术应用
邵锋1,孙君1,2
1.南京邮电大学 通信与信息工程学院;2.江苏省无线通信重点实验室
摘要: 网络切片是使网络能够满足不同垂直领域的不同服务需求的关键要素,为解决网络中切片类型动态变化的问题,提出了一种联邦-多智能体强化学习双时间尺度资源分配(F-MALML)算法。大时间尺度下,通过有限记忆学习算法为每个基站分配资源;小时间尺度内各基站使用F-MALML算法进一步为切片中的用户动态分配资源。引入了一种概率学习机制,根据前一时隙的分配结果和网络实际状态,动态调整每个时间尺度的分配策略。仿真结果表明,所提算法相比于其他两种基准算法在新增切片的切片满意度及系统频谱效率方面都有较大提升,且表现出更好的稳定性。
中圖分類號(hào):TN929.5 文獻(xiàn)標(biāo)志碼:A DOI: 10.16157/j.issn.0258-7998.246123
中文引用格式: 邵鋒,孫君. 基于有限記憶、概率學(xué)習(xí)的雙時(shí)間尺度切片資源分配方法[J]. 電子技術(shù)應(yīng)用,2025,51(3):17-24.
英文引用格式: Shao Feng,Sun Jun. Dual time scale network slice resource allocation method based on limited memory and probability learning[J]. Application of Electronic Technique,2025,51(3):17-24.
Dual time scale network slice resource allocation method based on limited memory and probability learning
Shao Feng1,Sun Jun1,2
1.College of Telecommunications & Information Engineering, Nanjing University of Posts and Telecommunications; 2.Jiangsu Key Laboratory of Wireless Communications
Abstract: Network slicing is crucial for enabling networks to meet the diverse service demands of various verticals. To address the issue of dynamic changes in slice types, a Federated Multi-Agent Reinforcement Learning (F-MALML) algorithm with dualtime scale resource allocation is proposed. At the large time scale, a finite memory learning algorithm allocates resources to each base station. At the small time scale, each base station uses F-MALML to dynamically allocate resources to users. A probabilistic learning mechanism is introduced to adjust the allocation strategy based on previous results and the current network state. Simulation results show that the proposed algorithm achieves significant improvements in slice satisfaction for newly added slices and system spectral efficiency compared to the two benchmark algorithms, while demonstrating better stability.
Key words : network slicing;resource allocation;dual time scale;deep reinforcement learning;slicing satisfaction

引言

5G-A和6G移動(dòng)網(wǎng)絡(luò)將帶來增強(qiáng)的網(wǎng)絡(luò)能力和性能,為不同的行業(yè)和個(gè)人提供各種用例[1]。不同的應(yīng)用程序在帶寬、時(shí)延、能源效率、移動(dòng)性等方面有不同甚至相互矛盾的要求,而網(wǎng)絡(luò)切片技術(shù)可以有效地解決這一需求。網(wǎng)絡(luò)切片通常包括接入網(wǎng)切片和核心網(wǎng)切片,對(duì)無線接入網(wǎng)(Radio Access Network,RAN)來說,向用戶分配無線電資源是一項(xiàng)極其復(fù)雜的操作,通常面臨著資源稀缺和異構(gòu)服務(wù)質(zhì)量(QoS)的問題[2]。因此,如何將通信資源以最佳方式分配到切片和用戶成為關(guān)鍵問題。Zangooei 等人比較綜合地調(diào)研了在RAN切片中處理資源分配問題最先進(jìn)的強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL)方法,并且給出了RL方法在網(wǎng)絡(luò)切片中可能存在的問題以及解決方案[3]。Hua等人針對(duì)最大化網(wǎng)絡(luò)切片中的系統(tǒng)頻譜效率(Spectral Efficiency,SE)、系統(tǒng)效用等參數(shù)做出了研究[4-7]。Filali等人針對(duì)服務(wù)水平協(xié)議(Service Level Agreement,SLA)滿意度以及資源塊(Resource Block,RB)分配效率、尋求最優(yōu)的RB分配策略問題做出了研究[8-11]。新興的6G網(wǎng)絡(luò)預(yù)計(jì)將為異構(gòu)需求提供更多的服務(wù),這是由許多垂直行業(yè)創(chuàng)建的[12],因此網(wǎng)絡(luò)切片的類型更加多樣,粒度需要更加精細(xì),且可能發(fā)生動(dòng)態(tài)變化?;谏鲜鎏魬?zhàn),本文針對(duì)多基站多切片、切片類型動(dòng)態(tài)變化場(chǎng)景下的資源分配問題做出了研究,提出了一種更加智能化的算法,并通過仿真驗(yàn)證了算法的性能。


本文詳細(xì)內(nèi)容請(qǐng)下載:

http://m.ihrv.cn/resource/share/2000006353


作者信息:

邵鋒1,孫君1,2

(1.南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210003;

2.江蘇省無線通信重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210003)


Magazine.Subscription.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。