摘要:提高移動通信話務(wù)量的預(yù)測精度對提高網(wǎng)絡(luò)性能、增進(jìn)用戶體驗(yàn)具有重要意義。由于多種因素會影響到移動通信話務(wù)量的準(zhǔn)確預(yù)測,故選擇多因素灰色話務(wù)量預(yù)測模型來預(yù)測話務(wù)量。先對數(shù)據(jù)進(jìn)行預(yù)處理,用關(guān)聯(lián)分析法找到影響話務(wù)量預(yù)測的主要因素。但此模型對波動較大的數(shù)據(jù)預(yù)測精度較低,用支持向量機(jī)的模型來改善預(yù)測結(jié)果,選取擁有較強(qiáng)的斂散性和全局尋優(yōu)能力的復(fù)高斯小波核函數(shù)優(yōu)化向量機(jī)。從仿真結(jié)果可以看出該模型有更好的收斂作用和較為理想的預(yù)測效果。
關(guān)鍵詞:復(fù)高斯小波核函數(shù);支持向量機(jī);多因素;話務(wù)量預(yù)測
0引言
話務(wù)量預(yù)測,是指以歷史話務(wù)量數(shù)據(jù)為基礎(chǔ),從一定的規(guī)律性與特點(diǎn)出發(fā),通過統(tǒng)計(jì)調(diào)查,運(yùn)用科學(xué)有效的建模方法對未來某一時(shí)段的話務(wù)量進(jìn)行預(yù)測。通過對預(yù)測結(jié)果的分析,可以清楚地知道哪些網(wǎng)絡(luò)需要擴(kuò)容,哪些網(wǎng)絡(luò)需要優(yōu)化壓縮。通常情況下預(yù)測話務(wù)量所采用的方法有線性自回歸移動平均模型(ARIMA)[1]、人工神經(jīng)網(wǎng)絡(luò)(ANN)[2]、支持向量機(jī)(SVM)[3]等。其中線性自回歸移動平均模型[4]要求訓(xùn)練數(shù)據(jù)的時(shí)間序列應(yīng)具有正態(tài)分布、全局平穩(wěn)等特征,但在實(shí)際應(yīng)用中,話務(wù)量的時(shí)間序列往往是不規(guī)則、非平穩(wěn)且非線性的。人工神經(jīng)網(wǎng)絡(luò)[5]相比線性自回歸移動平均模型有較好的非線性預(yù)測能力,但要求訓(xùn)練樣本數(shù)據(jù)量較大,且易于陷入局部極值,會導(dǎo)致最終的預(yù)測效果不穩(wěn)定。普通的預(yù)測模型大多數(shù)是根據(jù)過去的話務(wù)量去預(yù)測未來的話務(wù)量,但并沒有將相關(guān)因素考慮在內(nèi),如果沒有考慮影響因子,預(yù)測結(jié)果就會有一定的失真。為了能夠準(zhǔn)確地預(yù)測未來話務(wù)量的變化趨勢,本文從多因素的角度,提出了一種改進(jìn)的復(fù)高斯小波核函數(shù)優(yōu)化支持向量機(jī)的多因素灰色預(yù)測模型[6]。根據(jù)收集到的話務(wù)量數(shù)據(jù)和影響因素,用灰色關(guān)聯(lián)分析法計(jì)算出對話務(wù)量影響較大的因素有系統(tǒng)接通率、忙時(shí)用戶數(shù)、開機(jī)用戶數(shù)、小區(qū)切換次數(shù)。使用MATLAB進(jìn)行仿真,將預(yù)測結(jié)果與粒子群優(yōu)化支持向量機(jī)的多因素灰色模型、多因素灰色模型、真實(shí)值比較,本文算法的預(yù)測結(jié)果與真實(shí)值更接近。
1本文改進(jìn)的多因素灰色模型相關(guān)原理及算法
1.1數(shù)據(jù)的選擇及預(yù)處理
分析往年的話務(wù)量數(shù)據(jù)可以發(fā)現(xiàn),話務(wù)量會隨著時(shí)間和季節(jié)的改變而明顯發(fā)生變化,比如白天的話務(wù)量比夜晚高,節(jié)假日的話務(wù)量明顯高于平時(shí)。假如將話務(wù)量看做一個(gè)時(shí)間序列,那它具有季節(jié)性和周期性。
由于收集到的話務(wù)量數(shù)據(jù)有限,本文將側(cè)重于傳統(tǒng)節(jié)假日忙時(shí)話務(wù)量的預(yù)測。收集了安慶移動2011年~2015年每年五一之前20天的話務(wù)量數(shù)據(jù)以及影響因素的資料。在此基礎(chǔ)上,對其在五一的忙時(shí)數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn),預(yù)測忙時(shí)話務(wù)量數(shù)據(jù)。首先將實(shí)際數(shù)據(jù)進(jìn)行歸一化,將歸一化后的數(shù)據(jù)通過灰色關(guān)聯(lián)分析后得出結(jié)果數(shù)據(jù),再用提出的改進(jìn)模型進(jìn)行預(yù)測。
1.2灰色關(guān)聯(lián)分析
由于話務(wù)量受多種因素的影響,本文采用灰色關(guān)聯(lián)分析法[7]來判斷話務(wù)量與多種影響因素間的相關(guān)度大小,選擇與話務(wù)量相關(guān)性較大的因素。
灰色關(guān)聯(lián)分析的主要原理是根據(jù)序列曲線幾何形狀的相似程度來判別其聯(lián)系是否緊密。通過計(jì)算數(shù)據(jù)間相關(guān)度的大小來判別話務(wù)量與各因素相關(guān)性的大小。
(1)設(shè)系統(tǒng)特征序列X1,相關(guān)因素序列Xk:
?。?)對各數(shù)據(jù)序列進(jìn)行處理:
Yk=Xk/xk(1)=(yk(1),yk(2),...yk(m))
k=1,2,...,m(2)
?。?)計(jì)算相關(guān)系數(shù):
?。?)根據(jù)各數(shù)據(jù)序列關(guān)聯(lián)系數(shù)的大小,計(jì)算關(guān)聯(lián)度的值:
對話務(wù)量影響較大的因素與話務(wù)量間的關(guān)聯(lián)度結(jié)果如表1所示。
1.3多因素灰色模型
多因素灰色模型MGM(1,n)[8]是利用n元一階常微分方程組來描述n元相關(guān)聯(lián)變量的狀態(tài),并進(jìn)行未知狀態(tài)預(yù)測。核心思想是先進(jìn)行數(shù)據(jù)預(yù)處理,使得新生成的數(shù)列具有單調(diào)性,再對新生成的序列構(gòu)建n個(gè)一元微分方程組,優(yōu)化目標(biāo)函數(shù),找到相對誤差最小的模型參數(shù),最終可以實(shí)現(xiàn)預(yù)測未來的話務(wù)量。算法步驟如下:
假設(shè)某個(gè)系統(tǒng)經(jīng)過灰色關(guān)聯(lián)分析后有n個(gè)影響因子,每個(gè)影響因子有m個(gè)數(shù)據(jù):
?。?)輸入原始序列,進(jìn)行累加:
x1={x1i(j)}(5)
其中{x1i(j)}=∑kj=1x0i(j),i=1,2,...,n,j=1,2,...,m
?。?)多變量灰色模型MGM(1,n)對累加后的數(shù)據(jù)建立n元一階微分方程組,簡寫為:
其中X(1)=(x(1)1(j),x(1)2(j),...,x(1)n(j))
令D=(A,B)T=[ai1ai2…ainbi]T,i=(1,2,…,n),若LTL可逆,則可得D的辨識值:
D′=(A′,B′)T=(LTL)-1LTY,i=1,2,...,n(8)
計(jì)算模型參數(shù)的估計(jì)值,由式(8)得到A、B的辨識值A(chǔ)′、B′:
?。?)計(jì)算模型的擬合值或預(yù)測值。由式(6)可得到預(yù)測值:
x′(1)i(j)=eλ(j-1)(x(1)i(1)+A′-1B)-A′-1B′(10)
最終的預(yù)測值為:
x′(0)i(1)=x′(1)i(1)
x′(0)i(j)=x′(1)i(j)-x′(1)i(j-1), j=2,3,…(11)
通過以上多因素灰色模型的計(jì)算公式,可計(jì)算出時(shí)間序列的模擬值。但對于波動較大的時(shí)間序列,計(jì)算出的模擬值誤差較大。把安慶移動2011年~2015年每年“五一”之前20天的話務(wù)量數(shù)據(jù)及表1中相關(guān)因素的數(shù)據(jù)作為MGM(1,4)模型的輸入變量進(jìn)行預(yù)測,可得到2015年“五一”話務(wù)量的預(yù)測趨勢,預(yù)測結(jié)果如圖1。
圖1基于多因素灰色模型2015年5月1日的話務(wù)量預(yù)測值
1.4基于復(fù)高斯小波核函數(shù)優(yōu)化的向量機(jī)
支持向量機(jī)預(yù)測模型[9]的預(yù)測精度,主要受到兩個(gè)參數(shù)的影響:懲罰因子和核函數(shù)。由于復(fù)高斯小波核函數(shù)[10]擁有較強(qiáng)的斂散性和全局尋優(yōu)能力,為了進(jìn)一步提高預(yù)測精度,提出了基于復(fù)高斯小波核函數(shù)的支持向量機(jī)預(yù)測模型對殘差序列進(jìn)行預(yù)測[11]。殘差序列是由原始的真實(shí)序列與上一步多變量灰色模型得到的模擬值對應(yīng)相減得到。
設(shè)有樣本集{(xi,yi),i=1,2,...,n},其中xi∈Rd為輸入樣本,yi為輸出,不敏感損失函數(shù)ε的定義是:
回歸函數(shù)的表達(dá)式為:
f(x)=[ω·φ(x)]+b(13)
其中φ(x)是從低維到高維的映射函數(shù),ω表示權(quán)值參數(shù),b表示偏差參數(shù)。
回歸函數(shù)的優(yōu)化目標(biāo)函數(shù)為:
minω,b,ξ12ω2 +C∑ni = 1(ξi + ξ*i )(14)
目標(biāo)函數(shù)的約束條件為:
st|yi -(ω·φ(x))-b|≤ε + ξ*i
其中,ξi ≥0,ξ*i ≥0,i = 1,2,...,n。
構(gòu)造拉格朗日函數(shù),將帶約束條件的目標(biāo)函數(shù)轉(zhuǎn)變?yōu)闊o條件下的目標(biāo)規(guī)劃問題。
L(ω,b,ξ,ξ*)=12ω2+C∑ni=1(ξi+ξ*i)-
∑ni=1αi[ε+ξi-(yi-(ω·φ(x))-b)]-
∑ni=1α*i[ε+ξ*i-(yi-(ω·φ(x))-b)]-
∑ni=1(βiξi+βiξ*i)′(15)
對上式中的參數(shù)分別求導(dǎo),并令偏導(dǎo)為零:
maxα,α*,β,β*-12∑ni=1∑nj=1[(αi-α*i)(αj-α*j)K(xi-xj)]-
上式中,α,α*中至少有一個(gè)為零,α≠0對應(yīng)的樣本點(diǎn)xi被定義為支持向量,根據(jù)支持向量進(jìn)行求解,便可得到支持向量機(jī)的預(yù)測函數(shù)表達(dá)式:
K(xi, x)為支持向量機(jī)預(yù)測函數(shù)表達(dá)式中的核函數(shù), 采用的是復(fù)高斯小波核函數(shù)[12]。
使用安慶移動2011~2014四年的“五一”前20天的數(shù)據(jù)以及2015年“五一”數(shù)據(jù)的殘差序列作為已知數(shù)據(jù)來訓(xùn)練預(yù)測模型,仿真結(jié)果如圖2所示。
1.5本文算法主要思想
?。?)用灰色關(guān)聯(lián)分析法計(jì)算出特征序列與各相關(guān)因素序列之間相關(guān)度的大小,根據(jù)相關(guān)度的大小,找出影響話務(wù)量較大的因素。
?。?)將對話務(wù)量影響較大的因素作為MGM(1,n)模型的輸入,實(shí)現(xiàn)對話務(wù)量基本規(guī)律的預(yù)測,并得到預(yù)測的殘差序列。
?。?)利用復(fù)高斯小波核函數(shù)優(yōu)化的支持向量機(jī)模型建立殘差序列預(yù)測模型,從而實(shí)現(xiàn)對殘差序列的預(yù)測。
?。?)將MGM(1,n)的預(yù)測結(jié)果與殘差序列預(yù)測結(jié)果疊加,實(shí)現(xiàn)對話務(wù)量的預(yù)測。
2仿真實(shí)驗(yàn)結(jié)果分析
為了驗(yàn)證本文所提算法的預(yù)測結(jié)果,選取了粒子群[13]優(yōu)化的支持向量機(jī)的多因素灰色模型、多因素灰色模型作為比較模型。其中粒子群算法的基本參數(shù)為:粒子群種群規(guī)模m=100,最大迭代次數(shù)為1 000,學(xué)習(xí)因子c1=c2=2,慣性權(quán)重ω=09,松弛因子ε=054,粒子的初始化速度為0,最小適應(yīng)值ξ=001,通過粒子群優(yōu)化算法確定C=0616 0,g=10983 6。對2015年“五一”的忙時(shí)話務(wù)量進(jìn)行預(yù)測,仿真結(jié)果如圖3所示?! ?/p>
通過對話務(wù)量的仿真分析,證明了該模型相較傳統(tǒng)的多因素灰色模型預(yù)測精度高,對波動較大的數(shù)據(jù)預(yù)測比較準(zhǔn)確。采用相對誤差的方法對預(yù)測結(jié)果進(jìn)行分析,計(jì)算結(jié)果如表2所示。
3結(jié)論
本文選擇預(yù)測精度較高的預(yù)測模型對話務(wù)量進(jìn)行預(yù)測,話務(wù)量的預(yù)測精度越高,對移動網(wǎng)絡(luò)通信的指導(dǎo)意義就越大,越能及時(shí)應(yīng)對網(wǎng)絡(luò)可能出現(xiàn)的擁塞情況。在研究了國內(nèi)外預(yù)測領(lǐng)域的最新進(jìn)展后,針對話務(wù)量的預(yù)測,本文提出了基于復(fù)高斯小波核函數(shù)改進(jìn)支持向量機(jī)的多因素灰色預(yù)測模型。在進(jìn)行預(yù)測之前,搜集了大量話務(wù)量的歷史數(shù)據(jù)和相關(guān)因素?cái)?shù)據(jù),對2015年“五一”的忙時(shí)話務(wù)量進(jìn)行了預(yù)測。
由于話務(wù)量受多種因素的影響,選擇多因素灰色話務(wù)量預(yù)測模型。此模型適合由多種因素影響的話務(wù)量的預(yù)測,而且算法比較簡單。但是當(dāng)數(shù)據(jù)波動較大時(shí),多因素灰色預(yù)測模型預(yù)測精確度較低,針對這種情況,本文提出用支持向量機(jī)的模型來修正灰色模型的預(yù)測結(jié)果。
核函數(shù)與支持向量機(jī)的預(yù)測精度相關(guān),通過改進(jìn)核函數(shù),可提高預(yù)測精度。復(fù)高斯小波核函數(shù)擁有較強(qiáng)的斂散性和全局尋優(yōu)的能力,通過實(shí)驗(yàn)仿真,得出改進(jìn)的模型相比多因素灰色模型、粒子群優(yōu)化支持向量機(jī)補(bǔ)償?shù)亩嘁蛩鼗疑P陀懈玫氖諗啃Ч洼^為理想的預(yù)測結(jié)果。
參考文獻(xiàn)
?。?] 彭宇,雷苗,郭嘉,等.基于先驗(yàn)知識的移動通信話務(wù)量預(yù)測[J].電子學(xué)報(bào),2011,39(1):190-194.
?。?] 張一農(nóng),劉伯龍,王文婷.基于神經(jīng)網(wǎng)絡(luò)的客服中心話務(wù)量預(yù)測模型[J].吉林大學(xué)學(xué)報(bào)(信息科學(xué)版),2011,29(2):97-101.
?。?] Chen Dianbo, Xu Fucang, Wu Min. Traffic based on clustering and support vector machine forcasting model [J]. Journal of Control Engineering, 2009, 16(2):195-198.
[4] 張偉, 張新波. 移動GSM網(wǎng)話務(wù)量的ARIMA模型的建立及其預(yù)測[J].數(shù)學(xué)理論與應(yīng)用,2008(2):70-74.
?。?] 吳永明,吳晟. 改進(jìn)的遺傳算法在神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化中的應(yīng)用[J]. 微型機(jī)與應(yīng)用,2011,30(3):79-81,85.
[6] Pai Pingfeng,LIN C. A hybrid ARIMA and support vector machines model in stock price forecasting[J].Omega,2005,33(6):497-505.
?。?] 李鵬,劉思峰.基于灰色關(guān)聯(lián)分析和D—S證據(jù)理論的區(qū)間直覺模糊決策方法[J].自動化學(xué)報(bào), 2011, 37(8): 993-998.
?。?] LUO Y. Nonequidistant MGM(1,n) based on vector continued factions theory and its application[J]. Information Technology Journal, 2014,13(6) ,1186-1191.
?。?] 陳電波,徐福倉,吳敏. 基于聚類和支持向量機(jī)向量機(jī)的話務(wù)量預(yù)測模型[J]. 控制工程, 2009, 16( 2) : 195-199.
?。?0] 陳中杰,蔡勇,蔣剛.基于復(fù)高斯小波核函數(shù)的支持向量機(jī)的研究[J].計(jì)算機(jī)應(yīng)用研究,2012, 29(9):3263-3265.
?。?1] 侯偉真,潘美芹. 高斯核支持向量機(jī)最優(yōu)模型參數(shù)選擇搜索算法[C]. 中國運(yùn)籌學(xué)會第八屆學(xué)術(shù)交流會論文集. 2006:716-722.
?。?2] 林繼鵬, 劉君華. 基于小波的支持向量機(jī)算法研究[J]. 西安交通大學(xué)學(xué)報(bào), 2005,39(8):816-819.
?。?3] WANG F S, CHEN L H. Particle swarm optimization(PSO)[J]. Encyclopedia of Systems Biology, 2013,12(8):1649-1650.