摘 要: 針對(duì)小樣本、多類煤礦頂板的狀態(tài)檢測(cè)問題,提出了基于支持向量機(jī)集成的算法。采用深度優(yōu)先搜索對(duì)支持向量機(jī)集成參數(shù)進(jìn)行優(yōu)化,并結(jié)合煤礦頂板敲擊聲信號(hào)的人耳聽覺功率譜特征,對(duì)煤礦頂板中浮石、剝層等現(xiàn)象進(jìn)行分類識(shí)別。實(shí)驗(yàn)表明,該算法能夠?qū)Χ囝愴敯鍫顟B(tài)進(jìn)行有效分類,且識(shí)別率較高,能夠作為安全開采的保障手段。
關(guān)鍵詞: 支持向量機(jī)集成;人耳聽覺功率譜;頂板狀態(tài)檢測(cè);深度優(yōu)先搜索
我國(guó)是一個(gè)煤炭大國(guó),煤炭資源豐富,且煤炭消費(fèi)量逐年增加。為保證國(guó)民經(jīng)濟(jì)的持續(xù)健康發(fā)展,需要有計(jì)劃地大規(guī)模開采煤炭資源。然而,我國(guó)在煤炭開采中的安全事故經(jīng)常發(fā)生。其中,冒頂事故是最常見的安全事故之一,給國(guó)家和人民帶來了巨大的損失。而要避免和減少冒頂事故的發(fā)生,關(guān)鍵就是要對(duì)頂板的安全性能進(jìn)行及時(shí)、有效地檢測(cè),以便工程技術(shù)人員及時(shí)排除安全隱患。
敲幫問頂(wall tapping and roof sounding)是依靠人耳極其靈敏的聽覺系統(tǒng)和長(zhǎng)期的實(shí)踐經(jīng)驗(yàn)來判斷頂板的安全穩(wěn)定性的,是目前被廣泛沿用的對(duì)頂板進(jìn)行安全檢測(cè)的重要途徑。但這種方法對(duì)工人自身技能要求較高,且對(duì)工人的人身安全有一定的安全隱患。因此,研究新的檢測(cè)技術(shù)就顯得非常迫切。其中,基于模式識(shí)別的檢測(cè)是目前研究的重要方向之一。在應(yīng)用現(xiàn)代模式識(shí)別技術(shù)對(duì)頂板進(jìn)行狀態(tài)監(jiān)測(cè)和故障診斷中,功率特征提取和分類器模型設(shè)計(jì)是兩個(gè)至關(guān)重要的因素。本文采用基于聽覺模型和支持向量機(jī)集成算法?;诼犛X模型的聲信號(hào)特征提取、分類、識(shí)別的研究,近年來得到了國(guó)內(nèi)外學(xué)者的高度重視,特別在語音信號(hào)處理方面。但是針對(duì)煤礦頂板敲擊聲音信號(hào)方面重視較少。支持向量機(jī)SVM(Support Vector Machines)是Vapnik等人根據(jù)統(tǒng)計(jì)學(xué)習(xí)理論中結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則提出的。而支持向量機(jī)集成SVME(Support Vector Machine Ensemble)可以提高支持向量機(jī)的分類性能[1-2]。
本文正是基于以上原因,針對(duì)小樣本、多類煤礦頂板,提出了基于支持向量機(jī)集成算法對(duì)煤礦頂板安全性能進(jìn)行檢測(cè)的方法。
1 人耳聽覺功率譜特征提取
人們通過對(duì)生理聲學(xué)、心理聲學(xué)和信號(hào)處理的研究和分析[3-4],建立了人耳聽覺模型,并且利用此模型來對(duì)聲音信號(hào)進(jìn)行聽覺譜特征提取。該聽覺譜特征[5]提取過程如圖1所示。
通過對(duì)模仿人的聽覺感知機(jī)理進(jìn)行分析,聽覺譜特征提取算法主要有三個(gè)方面的處理:(1)臨界頻帶段分析處理;(2)等響度級(jí)預(yù)處理;(3)等響度轉(zhuǎn)換。利用臨界頻帶分析,計(jì)算模型考慮了耳蝸的分頻特性,由此可以反映人耳的掩蔽效應(yīng)。
在循環(huán)體中,首先從給出的訓(xùn)練樣本集X中按照一定的概率抽取樣本并獲得新的訓(xùn)練樣本Xt;然后,依據(jù)新獲得的訓(xùn)練樣本Xt來優(yōu)化選擇個(gè)體SVMC核函數(shù)參數(shù),并訓(xùn)練SVM以獲得分類超平面ft(Xt);再次,計(jì)算出該分類超平面的加權(quán)分類錯(cuò)誤率;最后,做出一個(gè)判斷:即判斷計(jì)算出的加權(quán)分類錯(cuò)誤率是否≥0.5或=1。如果條件成立,則結(jié)束該循環(huán),并運(yùn)用加權(quán)多數(shù)投票法集成個(gè)體SVMC;反之,則改變加權(quán)系數(shù),進(jìn)行下一輪循環(huán),直至條件成立,退出循環(huán)。
要想獲得一個(gè)高性能和高精度的支持向量機(jī)集成模型,就必需要對(duì)優(yōu)化不敏感損失函數(shù)ε、懲罰系數(shù)c和核參數(shù)γ等參數(shù)進(jìn)行優(yōu)化處理,而這些參數(shù)之間相互影響。實(shí)際上,選擇過程是一個(gè)優(yōu)化搜索的過程,由于深度優(yōu)先算法具有全局搜索性能力強(qiáng)、并行性和啟發(fā)式等優(yōu)點(diǎn),所以本文采用深度優(yōu)先算法對(duì)SVMC參數(shù)進(jìn)行尋優(yōu)。深度優(yōu)先算法[6]是一種基于圖論的優(yōu)化算法,其基本思想:為了求得問題的解,先選擇某一種可能情況向前(子結(jié)點(diǎn))探索,在探索過程中,一旦發(fā)現(xiàn)原來的選擇不符合要求,則回溯至父親結(jié)點(diǎn)重新選擇另一結(jié)點(diǎn),繼續(xù)向前探索。如此反復(fù)進(jìn)行,直至求得最優(yōu)解。深度優(yōu)先搜索的實(shí)現(xiàn)方式可以采用遞歸或者棧來實(shí)現(xiàn)。
采用深度優(yōu)先搜索對(duì)SVMC參數(shù)c、γ和ε進(jìn)行優(yōu)化的具體步驟如下:
?。?)對(duì)SVMC中的參數(shù)c、γ和ε進(jìn)行初始范圍的確定,按照步長(zhǎng)對(duì)參數(shù)c、γ和ε進(jìn)行等量劃分,以此獲得離散數(shù)組。
(2)首先利用LIBSVM軟件采用交叉驗(yàn)證方法對(duì)參數(shù)c、γ和ε進(jìn)行建立模型和預(yù)測(cè);然后對(duì)每組均方根誤差進(jìn)行比較;最后選擇最小的均方根誤差所對(duì)應(yīng)的參數(shù)為本次的SVMC最佳參數(shù)組合。
?。?)將本次最優(yōu)參數(shù)和上一次最優(yōu)參數(shù)的均方根誤差進(jìn)行比較,如果均方根誤差小于上一次均方根誤差,則跳轉(zhuǎn)到步驟(4),否則跳轉(zhuǎn)到步驟(5)。
?。?)根據(jù)上一次的最優(yōu)參數(shù),并且采用啟發(fā)式方式在該參數(shù)附近進(jìn)行參數(shù)范圍修改,從而加快參數(shù)搜索速度;然后跳轉(zhuǎn)到步驟(1),重新進(jìn)行遞歸運(yùn)算。
?。?)參數(shù)優(yōu)化結(jié)束后,退出運(yùn)算,取此時(shí)的參數(shù)c、γ和ε為SVMC的最優(yōu)參數(shù)。
深度優(yōu)先搜索參數(shù)優(yōu)化流程圖如圖3所示。
3 實(shí)驗(yàn)及結(jié)果
3.1 實(shí)驗(yàn)數(shù)據(jù)集
本文實(shí)驗(yàn)數(shù)據(jù)是從我國(guó)東北某大型煤礦井下頂板上采集的,共有4類目標(biāo):一類是安全頂板,另3類是3種危險(xiǎn)頂板(浮石、剝層和斷裂)。信號(hào)的采樣頻率是20 000 Hz,每個(gè)樣本長(zhǎng)度為4 096個(gè)點(diǎn)。安全頂板、浮石頂板、剝層頂板和斷裂頂板的樣本數(shù)目分別為2 000、200、500、150。由于受到實(shí)驗(yàn)數(shù)據(jù)采樣頻率(20 000 Hz)的限制,本文只在20~10 000 Hz頻率范圍內(nèi)(即前22個(gè)臨界頻帶內(nèi))提取了4類頂板的敲擊聲信號(hào)的聽覺譜特征。
3.2 實(shí)驗(yàn)
在分類實(shí)驗(yàn)中,訓(xùn)練樣本數(shù)目和測(cè)試樣本數(shù)目的比值是1﹕4,提取樣本的聽覺譜特征后,分別用SVME算法和單個(gè)SVMC對(duì)4類目標(biāo)進(jìn)行頂板狀態(tài)診斷實(shí)驗(yàn)。為了避免樣本選取的隨機(jī)性對(duì)實(shí)驗(yàn)結(jié)果帶來的誤差,實(shí)驗(yàn)分別進(jìn)行了20次,最終結(jié)果為20次實(shí)驗(yàn)結(jié)果的平均值。檢測(cè)結(jié)果如表1所示。
從表1可以看出,支持向量機(jī)集成算法可以有效識(shí)別安全頂板和危險(xiǎn)頂板,并進(jìn)行狀態(tài)診斷,而且其識(shí)別4類目標(biāo)的正確識(shí)別率都比單個(gè)SVMC要高。特別是本文所提出的算法對(duì)危險(xiǎn)頂板的正確識(shí)別率比單個(gè)SVMC提高了2.57%~3.22%。實(shí)驗(yàn)結(jié)果證明,本文提出的支持向量機(jī)集成(SVME)算法是有效的,可以應(yīng)用于煤礦頂板狀態(tài)識(shí)別和故障診斷中。
本文提出了支持向量機(jī)集成(SVME)算法,采用了深度優(yōu)先搜索對(duì)支持向量機(jī)集成參數(shù)進(jìn)行優(yōu)化,并結(jié)合敲擊聲信號(hào)的人耳聽覺譜特征用于頂板狀態(tài)的分類識(shí)別。實(shí)驗(yàn)證明,本文所提出的SVME算法識(shí)別率較高,可以滿足現(xiàn)場(chǎng)檢測(cè)的要求,為煤礦頂板狀態(tài)診斷提供了新的方法。
參考文獻(xiàn)
[1] VAPNIK V. The nature of statistical learning theory[M]. New York: Springer-Verlag, 1999.
[2] 楊宏暉,孫進(jìn)才.基于支持向量機(jī)集成的水下目標(biāo)自動(dòng)識(shí)別系統(tǒng)[J].測(cè)控技術(shù), 2006, 25(12).
[3] ZWICKER E, FASTL H. Psychoacoustics facts and models [M]. NewYork: Springer-Verlag,1999.
[4] HERMANSK H. Perceptual linear predictive(PLP) analysisof speech[J]. Journal of the Acoustical Society ofAmeri-ca, 1990, 87(4): 1738-1751.
[5] 楊宏暉,侯宏,曾向陽.基于聲信號(hào)人耳聽覺譜特征的風(fēng)機(jī)故障診斷[J].儀器儀表學(xué)報(bào),2009,30(1).
[6] 李立紅,許元飛.深度優(yōu)先搜索的支持向量機(jī)參數(shù)優(yōu)化算法[J].計(jì)算機(jī)仿真,2011,28(7):216-219.