尹虹毅
?。ㄍ瑵?jì)大學(xué) 電子與信息工程學(xué)院,上海 201804)
摘要:精神分裂癥是最常見的精神疾病之一,目前具體病因尚未明確,準(zhǔn)確診斷患病與否是治療該疾病的前提。深度學(xué)習(xí)是一種構(gòu)造多層神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)方法,具有發(fā)現(xiàn)數(shù)據(jù)中隱藏的分布式特征表示的能力。針對(duì)精神分裂癥患者的腦電信號(hào),提出了一種棧式自編碼網(wǎng)絡(luò)深度模型,以達(dá)到根據(jù)腦電信號(hào)自動(dòng)識(shí)別受試者是否患病的效果。
關(guān)鍵詞:深度學(xué)習(xí); 精神分裂癥;腦電
0引言
精神分裂癥是一種持續(xù)、慢性的精神疾病,臨床上表現(xiàn)為思維、情感、行為等多方面精神障礙,是精神病里最常見、最嚴(yán)重的一種[1]。精神分裂癥病程多遷延并呈進(jìn)行性發(fā)展,如果能夠在患病早期準(zhǔn)確診斷,并給予合理治療,多數(shù)患者的病情是可以得到控制的。目前,科學(xué)家們尚未找出精神分裂癥的具體成因,但研究顯示,精神分裂癥患者的大腦總體來說與非患者的大腦有區(qū)別[2]。
腦電(Electroencephalogram, EEG)是由腦部神經(jīng)活動(dòng)產(chǎn)生并且始終存在于中樞系統(tǒng)的自發(fā)性、節(jié)律性的電位活動(dòng)。腦電是大腦的活動(dòng)狀態(tài)的反映,是幫助診斷大腦疾病的一種輔助檢查方法。人類腦電波由5個(gè)主要波段構(gòu)成:delta波(1~3 Hz)、theta波(4~7 Hz)、alpha波(8~13 Hz)、beta波(14~30 Hz)和gamma波(31~50 Hz)[3]。這5個(gè)波段的特征對(duì)于精神分裂癥的診斷有著重要的參考價(jià)值。
本文提出了一種基于深度學(xué)習(xí)的精神分裂癥患者的腦電分析方法:利用精神分裂癥患者和正常對(duì)照者的腦電信號(hào),訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),使該模型具有根據(jù)輸入腦電信號(hào),自動(dòng)判別受試者是否患有精神分裂癥的功能。
1深度學(xué)習(xí)網(wǎng)絡(luò)
“機(jī)器學(xué)習(xí)”的概念自20世紀(jì)50年代提出以來就備受科技界的關(guān)注,而近年來“深度學(xué)習(xí)”逐漸成為機(jī)器學(xué)習(xí)研究中的一個(gè)新的領(lǐng)域[4],并在計(jì)算機(jī)視覺和語音識(shí)別方面取得相關(guān)成果。
1.1多層特征學(xué)習(xí)
深度學(xué)習(xí)網(wǎng)絡(luò)源于人工神經(jīng)網(wǎng)絡(luò)。目前,大部分機(jī)器學(xué)習(xí)算法都屬于淺層學(xué)習(xí),其局限性表現(xiàn)為對(duì)復(fù)雜分類問題圖1深度學(xué)習(xí)網(wǎng)絡(luò)的多層架構(gòu)
的泛化能力受到制約。深度學(xué)習(xí)網(wǎng)絡(luò)提供了一種多層特征學(xué)習(xí)的策略,即通過學(xué)習(xí)一種多層非線性網(wǎng)絡(luò)結(jié)構(gòu),實(shí)現(xiàn)復(fù)雜函數(shù)逼近,表征輸入數(shù)據(jù)從低層到高層的不同表示[5],其多層架構(gòu)示意圖如圖1所示。
這種基于多層特征學(xué)習(xí)的深度結(jié)構(gòu)由一個(gè)輸入層、多個(gè)隱藏層和一個(gè)輸出層構(gòu)成。該模型的訓(xùn)練分為兩個(gè)階段:逐層貪婪訓(xùn)練階段和微調(diào)階段。在逐層貪婪訓(xùn)練階段,每次只訓(xùn)練網(wǎng)絡(luò)中的一層,即首先訓(xùn)練一個(gè)只含一個(gè)隱藏層的網(wǎng)絡(luò),僅當(dāng)這層網(wǎng)絡(luò)訓(xùn)練結(jié)束之后才開始訓(xùn)練一個(gè)有兩個(gè)隱藏層的網(wǎng)絡(luò),以此類推,直到訓(xùn)練完所有網(wǎng)絡(luò)。在每一步中,把已經(jīng)訓(xùn)練好的前層k-1固定,即把已經(jīng)訓(xùn)練好的k-1層的輸出作為第k層的輸入。在微調(diào)階段,這些層單獨(dú)訓(xùn)練所得到的權(quán)重被用來初始化最終的深度網(wǎng)絡(luò)的權(quán)重,然后使用梯度下降算法對(duì)網(wǎng)絡(luò)中所有的權(quán)重值進(jìn)行優(yōu)化。
深度學(xué)習(xí)通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發(fā)現(xiàn)數(shù)據(jù)中隱藏的分布式特征表示[6],這對(duì)于復(fù)雜模型的分析具有相當(dāng)重要的作用。當(dāng)數(shù)據(jù)充足時(shí),該算法可以學(xué)習(xí)到豐富的信息,故訓(xùn)練的數(shù)據(jù)越多,其效果越好。因此,深度學(xué)習(xí)適用于數(shù)據(jù)信息量較大的分析場(chǎng)合。
1.2棧式自編碼網(wǎng)絡(luò)
1.2.1自編碼網(wǎng)絡(luò)
自編碼神經(jīng)網(wǎng)絡(luò)是一種無監(jiān)督學(xué)習(xí)算法,它通過設(shè)置目標(biāo)值等于輸入值,來學(xué)習(xí)輸入數(shù)據(jù)的編碼方式。圖2是一個(gè)自編碼神經(jīng)網(wǎng)絡(luò)的示例。
假設(shè)有一個(gè)固定無標(biāo)簽樣本x(1),…,xm,它包含m個(gè)樣例。對(duì)于單個(gè)樣例 x,定義其代價(jià)函數(shù)為:
其中,W為網(wǎng)絡(luò)的權(quán)重,b為網(wǎng)絡(luò)的偏差,hW,b(x)為網(wǎng)絡(luò)的輸出。
對(duì)于全部樣本,定義整體代價(jià)函數(shù)為:
其中,λ為權(quán)重衰減參數(shù)。第一項(xiàng)為每個(gè)樣例的代價(jià)函數(shù)的平均;第二項(xiàng)為權(quán)重衰減項(xiàng),其目的是減小權(quán)重的幅度,防止過度擬合。
自編碼神經(jīng)網(wǎng)絡(luò)的目標(biāo)是嘗試逼近一個(gè)恒等函數(shù),從而使得輸出hW,b(x)接近于輸入x。通過在自編碼神經(jīng)網(wǎng)絡(luò)加入某些限制,可以從輸入數(shù)據(jù)中提取出一些有用的結(jié)構(gòu)。例如,輸入x是一個(gè)100維的數(shù)據(jù),即m=100,若隱藏層有50個(gè)神經(jīng)元,即L2=50,輸出也是100維的,hW,b(x)∈R100。由于隱藏層只有50個(gè)神經(jīng)元,自編碼神經(jīng)網(wǎng)絡(luò)被迫去學(xué)習(xí)輸入數(shù)據(jù)的壓縮表示。如果輸入數(shù)據(jù)中隱含著一些特定的結(jié)構(gòu),比如某些輸入特征是彼此相關(guān)的,那么通過這一算法就可以發(fā)現(xiàn)輸入數(shù)據(jù)中的這些相關(guān)性。即使在隱藏層神經(jīng)元的數(shù)量較大的情況下,甚至多于輸入層神經(jīng)元的數(shù)目,仍可通過給自編碼神經(jīng)網(wǎng)絡(luò)施加一些其他的限制條件,例如稀疏性限制[7],來發(fā)現(xiàn)輸入數(shù)據(jù)的結(jié)構(gòu)。
1.2.2稀疏性
假設(shè)神經(jīng)元的激活函數(shù)是sigmoid函數(shù),當(dāng)神經(jīng)元的輸出接近于1時(shí)認(rèn)為它被激活,而輸出接近于0時(shí)認(rèn)為它被抑制,那么使得神經(jīng)元大部分的時(shí)間都處于被抑制狀態(tài)的限制稱為稀疏性限制[8]。
若在給定輸入為x情況下,自編碼神經(jīng)網(wǎng)絡(luò)隱藏神經(jīng)元j的激活度為a(2)j,則該隱藏神經(jīng)元j在訓(xùn)練集上的平均活躍度為:
根據(jù)稀疏性的定義,限制隱藏神經(jīng)元j的平均活躍度接近于0,即:
其中,ρ是稀疏性參數(shù),通常取一個(gè)接近于0的較小的值。
同時(shí),在代價(jià)函數(shù)中加入一個(gè)額外的懲罰因子,懲罰那些ρ∧j和ρ有顯著不同的情況,從而使得隱藏神經(jīng)元的平均活躍度保持在較小范圍內(nèi)。本算法選擇相對(duì)熵(KL divergence),即懲罰因子:
∑s2j=1KL(ρρ∧j)(5)
其中,KL(ρρ∧j)=ρlogρρ∧j+(1-ρ)log1-ρ1-ρ∧j是一個(gè)以ρ為均值和一個(gè)以ρ∧j為均值的兩個(gè)伯努利隨機(jī)變量之間的相對(duì)熵。
在加入了稀疏性限制后,總體代價(jià)函數(shù)可以表示為:
Jsparse(W,b)=J(W,b)+β∑s2j=1KL(ρρ∧j)(6)
其中,J(W,b)如之前所定義,而β為控制稀疏性懲罰因子的權(quán)重。
1.2.3棧式自編碼算法
棧式自編碼網(wǎng)絡(luò)是由多層稀疏自編碼網(wǎng)絡(luò)組成的神經(jīng)網(wǎng)絡(luò),其前一層自編碼網(wǎng)絡(luò)的輸出作為其后一層自編碼網(wǎng)絡(luò)的輸入[9]。棧式自動(dòng)編碼網(wǎng)絡(luò)的結(jié)構(gòu)示意圖如圖3所示。
棧式自編碼網(wǎng)絡(luò)的訓(xùn)練方法如下:在訓(xùn)練每一層參數(shù)時(shí),固定其他各層參數(shù)保持不變。在上述預(yù)訓(xùn)練過程完成之后,進(jìn)行微調(diào),即通過反向傳播算法同時(shí)調(diào)整所有層的參數(shù)以改善結(jié)果。
1.3Softmax回歸
Softmax回歸解決的是多類分類問題,其思想如下:對(duì)于給定的測(cè)試輸入樣例(x,y),利用假設(shè)函數(shù)計(jì)算屬于每一個(gè)類別j的概率值p(y=j|x),則該假設(shè)函數(shù)hθ(x)形式如下:
2基于棧式自編碼的精神分裂癥腦電分析
2.1數(shù)據(jù)集
本文所用數(shù)據(jù)均為醫(yī)院采集的真實(shí)數(shù)據(jù),其中有62個(gè)精神分裂癥患者,88個(gè)健康對(duì)照者。被試者的EEG信號(hào)均在靜息閉眼的狀態(tài)下采集。EEG的信號(hào)使用含有 64 個(gè)導(dǎo)聯(lián)的放大器進(jìn)行數(shù)據(jù)的采集,采樣頻率為1 000 Hz,所采集的樣本數(shù)據(jù)都包含64個(gè)導(dǎo)聯(lián)上2~3 min的時(shí)域數(shù)據(jù)。
2.2腦電特征提取
因?yàn)榫穹至寻Y是由于大腦異常引起的,在得到的64個(gè)導(dǎo)聯(lián)的信號(hào)中,選取了59個(gè)最能直接反映大腦活動(dòng)狀態(tài)的導(dǎo)聯(lián),分別是AF3、AF4、AF7、AF8、C1、C2、C3、C4、C5、C6、CP1、CP2、CP3、CP4、CP5、CP6、CPz、Cz、F1、F2、F3、F4、F5、F6、F7、F8、FC1、FC2、FC3、FC4、FC5、FC6、Fp1、Fp2、Fpz、FT7、FT8、Fz、O1、O2、Oz、P1、P2、P3、P4、P5、P6、P7、P8、PO3、PO4、PO7、PO8、POz、Pz、T7、T8、TP7、TP8。
由于深度學(xué)習(xí)網(wǎng)絡(luò)需要大量訓(xùn)練樣本,在此,對(duì)每個(gè)人的時(shí)域數(shù)據(jù)進(jìn)行截取多個(gè)時(shí)間片段樣本的處理,將每個(gè)時(shí)域數(shù)據(jù)截成長度為2 s、重疊為25%的多個(gè)片段樣本。通過這樣處理后,獲得8 709個(gè)精神分裂癥患者的時(shí)間片段,11 542個(gè)健康對(duì)照者的時(shí)間片段樣本。
對(duì)每個(gè)樣本,采用快速傅里葉變換獲取其功率譜密度。接著,提取其在頻域中5個(gè)頻帶的能量作為特征,即delta波段(1~3 Hz)、theta波段(4~7 Hz)、alpha波段(8~13 Hz)、beta波段(14~30 Hz)和gamma波段 (31~50 Hz)的能量。最后,每個(gè)樣本提取到295個(gè)特征,作為棧式自編碼網(wǎng)絡(luò)的輸入。
2.3棧式自編碼網(wǎng)絡(luò)的實(shí)現(xiàn)
本文提出的用于精神分裂癥腦電分析的棧式自編碼網(wǎng)絡(luò)由多個(gè)自編碼網(wǎng)絡(luò)和一個(gè)Softmax回歸層構(gòu)成。在完成訓(xùn)練后,這個(gè)棧式自編碼網(wǎng)絡(luò)能夠根據(jù)測(cè)試腦電信號(hào)實(shí)現(xiàn)自動(dòng)判別該腦電所屬實(shí)驗(yàn)者是否患有精神分裂癥。
這個(gè)棧式自編碼網(wǎng)絡(luò)首先對(duì)網(wǎng)絡(luò)中的每層到進(jìn)行逐層貪婪訓(xùn)練:輸入的數(shù)據(jù)(295個(gè)頻域能量特征)被用于訓(xùn)練第一個(gè)稀疏自編碼網(wǎng)絡(luò),以獲取輸入數(shù)據(jù)的初級(jí)特征h(1)。在此,使用梯度下降方法來最優(yōu)化代價(jià)函數(shù),從而學(xué)習(xí)出第一個(gè)網(wǎng)絡(luò)的最佳權(quán)重參數(shù)。
在最佳權(quán)重學(xué)習(xí)完畢后,使用輸入數(shù)據(jù)在第一個(gè)網(wǎng)絡(luò)進(jìn)行前向傳播,得到輸入數(shù)據(jù)的初級(jí)特征h(1)。而第一個(gè)網(wǎng)絡(luò)得到的特征h(1)被用作第二個(gè)網(wǎng)絡(luò)的輸入,采用同樣的方法獲取第二個(gè)網(wǎng)絡(luò)的特征h(2)。將前一層網(wǎng)絡(luò)學(xué)習(xí)到的特征作為下一層網(wǎng)絡(luò)的輸入,循環(huán)以上步驟,可獲得每層網(wǎng)絡(luò)的最佳權(quán)重參數(shù)。最后一層隱藏層的特征h(n-1)被用作Softmax回歸層的輸入,以獲取其最佳權(quán)重參數(shù)。
在完成了逐層最佳權(quán)重參數(shù)學(xué)習(xí)后,對(duì)整個(gè)網(wǎng)絡(luò)進(jìn)行微調(diào),以獲得最佳全局權(quán)重。
3實(shí)驗(yàn)分析
本實(shí)驗(yàn)將從兩個(gè)方面進(jìn)行分析。為探究隱藏層節(jié)點(diǎn)數(shù)對(duì)識(shí)別效果的影響,先探究只含有一個(gè)隱藏層的自編碼網(wǎng)絡(luò)的隱藏層節(jié)點(diǎn)數(shù)對(duì)識(shí)別效果的影響,之后再探究棧式自編碼網(wǎng)絡(luò)的隱藏層層數(shù)對(duì)識(shí)別效果的影響。
3.1單層網(wǎng)絡(luò)隱藏層節(jié)點(diǎn)數(shù)對(duì)實(shí)驗(yàn)結(jié)果的影響
首先構(gòu)造了一個(gè)輸入層含有295個(gè)節(jié)點(diǎn)、輸出層為2個(gè)節(jié)點(diǎn)Softmax回歸層的單隱藏層自編碼網(wǎng)絡(luò),令其隱藏層節(jié)點(diǎn)數(shù)為10~1 000,以觀察隱藏層節(jié)點(diǎn)數(shù)對(duì)精神分裂癥腦電的識(shí)別率,實(shí)驗(yàn)結(jié)果如圖4所示。
從圖4可以看到,采用了稀疏自編碼網(wǎng)絡(luò)對(duì)精神分裂癥腦電具有較好的識(shí)別效果,不同隱藏層節(jié)點(diǎn)所獲得的識(shí)別準(zhǔn)確率均在72%左右,其中當(dāng)隱藏層節(jié)點(diǎn)數(shù)為80、110、200時(shí),識(shí)別率最高,超過了74%。
3.2網(wǎng)絡(luò)層數(shù)對(duì)實(shí)驗(yàn)結(jié)果影響
為探究棧式自編碼網(wǎng)絡(luò)的隱藏層層數(shù)對(duì)識(shí)別效果的影響,分別構(gòu)造了隱藏層層數(shù)為2層、3層和4層的棧式自編碼網(wǎng)絡(luò),具體網(wǎng)絡(luò)參數(shù)和實(shí)驗(yàn)結(jié)果如表1所示。
從表1結(jié)果可以看到,當(dāng)隱藏層數(shù)目增加時(shí),該棧式自編碼網(wǎng)絡(luò)對(duì)精神分裂癥腦電的識(shí)別率有小幅度的提升。
4結(jié)論
針對(duì)精神分裂癥難以診斷的問題,本文提出了利用深度神經(jīng)網(wǎng)絡(luò)對(duì)精神分裂癥腦電進(jìn)行分析判別的方法。該方法通過建立含有多個(gè)隱層結(jié)構(gòu)的棧式自編碼網(wǎng)絡(luò),從大量腦電數(shù)據(jù)中獲取隱含結(jié)構(gòu)信息,以提高分類識(shí)別以及預(yù)測(cè)的準(zhǔn)確性。實(shí)驗(yàn)驗(yàn)證了所提出的方法的有效性,對(duì) 62個(gè)精神分裂癥患者和88個(gè)健康對(duì)照者的腦電數(shù)據(jù)的識(shí)別準(zhǔn)確率較高,且有較好的適應(yīng)性。從實(shí)驗(yàn)分析可得,實(shí)驗(yàn)結(jié)果與理論分析基本相符。
在未來的研究中,要解決的主要問題有:(1)深度神經(jīng)網(wǎng)絡(luò)層數(shù)的極限在哪里,是否存在某個(gè)固定的層數(shù)使得該網(wǎng)絡(luò)達(dá)到性能最優(yōu);(2)如何決定某類問題深度學(xué)習(xí)的層數(shù)和隱藏層節(jié)點(diǎn)的個(gè)數(shù)。
參考文獻(xiàn)
?。?] 管麗麗,杜立哲,馬弘. 精神分裂癥的疾病負(fù)擔(dān)(綜述)[J]. 中國心理衛(wèi)生雜志,2012,26(12):913919.
?。?] 宋安林. 精神分裂癥腦組織各部位神經(jīng)病理改變對(duì)比研究[D].重慶:重慶醫(yī)科大學(xué),2010.
?。?] TEPLAN M. Fundamentals of EEG measurement [J]. Measurement Science Review, 2002, 2(2): 110.
?。?] YOSHUA B, COURVILLE A, VINCENT P. Representation learning: a review and new perspectives[J].IEEE Transactions on Pattern Analysis & Machine Intelligence, 2013,35(8):17981828.
?。?] SCHLKOPF B, PLATT J,HOFMANN T. Greedy layerwise training of deep networks[J]. Advances in Neural Information Processing Systems,2007,19:153160.
?。?] HINTON G E, SALAKHUTDINOV R R. Reducing the dimensionality of data with neural networks[J]. Science, 2006,313(5786):504507.
[7] OLSHAUSEN B A, FIELD D J. Sparse coding with an overcomplete basis set: a strategy employed by VI?[J]. Vision Research,1997,37(23): 33113326.
[8] LEE H, BATTLE A, RAINA R, et al. Efficient sparse coding algorithms[C]. Conference on Neural Information Processing Systems, 2007:801808.
?。?] YOSHUA B, DELALLEAU O. On the expressive power of deep architectures[C]. Interrational Couference on Discovery Science,2011,6925:1836.