摘 要: 傳統(tǒng)Snake模型采用基于輪廓的圖像能,分割結(jié)果受圖像噪聲和強(qiáng)邊界的影響較大。本文在Snake模型中引入?yún)^(qū)域統(tǒng)計信息,并對彈性能做了改進(jìn),克服了僅用邊界信息描述目標(biāo)輪廓的不足。把改進(jìn)的Snake模型用于運動目標(biāo)" title="運動目標(biāo)">運動目標(biāo)的跟蹤,提高了跟蹤的準(zhǔn)確性。
關(guān)鍵詞: 運動目標(biāo)跟蹤" title="目標(biāo)跟蹤">目標(biāo)跟蹤 Snake模型 主動輪廓模型 區(qū)域統(tǒng)計特征
?
運動目標(biāo)的分割和跟蹤技術(shù)一直是圖像處理和計算機(jī)視覺領(lǐng)域重要的基礎(chǔ)性課題,其研究成果已廣泛應(yīng)用在視頻分割與壓縮、智能交通以及生物醫(yī)學(xué)等領(lǐng)域。在目前眾多的視頻對象跟蹤技術(shù)中,有一類是基于主動輪廓線模型的算法。
主動輪廓模型也稱為Snake模型[1],最初是作為一種圖像分割" title="圖像分割">圖像分割算法提出來的。按照輪廓線表示方法的不同,Snake模型可分為離散Snake模型和Geodesic主動輪廓模型兩類。本文針對離散Snake模型存在的問題提出了改進(jìn)方法。
傳統(tǒng)的Snake模型存在的不足主要有:輪廓線的初始位置必須接近目標(biāo)邊緣;結(jié)果容易受噪聲影響;算法計算量大等。針對這些問題,研究者提出了許多改進(jìn)模型,如通過在模型中引入氣球力[2]、梯度矢量流[3],擴(kuò)大了模型作用的有效范圍,但是曲線受噪聲影響仍很大;Jim Ivins等人[4]將圖像數(shù)據(jù)統(tǒng)計特征引入Snake模型,提出統(tǒng)計蛇模型(也稱為主動區(qū)域模型),在一定程度上提高了分割紋理不同區(qū)域的能力,但是該模型使用時若圖像任意像素的灰度服從統(tǒng)一的高斯分布,適用范圍將受到很大限制。
依據(jù)最大似然準(zhǔn)則,本文在傳統(tǒng)Snake模型中引入了新的區(qū)域能量,對彈性能亦做了修改,并用動態(tài)規(guī)劃法實現(xiàn)目標(biāo)的分割。對運動目標(biāo)跟蹤時,將Snake模型與對目標(biāo)的運動估計相結(jié)合,以提高跟蹤的準(zhǔn)確性。通過對比實驗說明,本文算法能減少噪聲和強(qiáng)邊界對輪廓線的干擾,提高了分割和跟蹤的有效性。
1 Snake模型原理
主動輪廓線是一條有能量的樣條曲線,可用若干控制點組成的集合來表示。通過減少曲線總能量,使其向特征位置靠近,以實現(xiàn)對目標(biāo)的分割。Kass等人用函數(shù)Esnake(v(s))表示曲線總能量[1]。其中,s為空間參數(shù),函數(shù)v(s)=v(x(s),y(s))表示從參數(shù)域s∈[0,1)到圖像表面曲線的映射。曲線總能量定義為:

其中,α(s)、β(s)為各項權(quán)值。Eext稱為外部能量,用于引導(dǎo)曲線演化。Eext由兩部分組成,即Eext(v)=Eimage(v)+Econ(v)。圖像能Eimage(v)表示目標(biāo)輪廓,可以定義為Eimage(v)=-γ(s)▽Gσ*I(v)。其中,γ(s)為各項權(quán)值,I表示圖像,Gσ是標(biāo)準(zhǔn)差" title="標(biāo)準(zhǔn)差">標(biāo)準(zhǔn)差為σ的二維高斯函數(shù)。當(dāng)σ較小時,檢測到的邊緣位置精度高、細(xì)節(jié)變化多[5]。Econ(v)則產(chǎn)生一種外部控制力,具體形式可根據(jù)需要構(gòu)造。
2 基于區(qū)域統(tǒng)計信息的Snake模型
傳統(tǒng)Snake模型主要利用邊界信息引導(dǎo)輪廓線的演化,曲線受噪聲和強(qiáng)邊界影響大。針對該問題,本文構(gòu)造了一種新的區(qū)域能量Eregion,并對彈性能量的形式做了改進(jìn)。 2.1 區(qū)域能量的定義
區(qū)域能量是圖像能的一種,為與Eimage相區(qū)別,將其用Eregion表示。首先,假定可用域值化方法把圖像或其一部分Ω分成感興趣區(qū)域O和背景C兩個區(qū)域,同時滿足Ω=O∪C,O∩C=Φ,用μo、μC、σo、σC分別表示各部分的灰度均值和標(biāo)準(zhǔn)差,X表示Ω內(nèi)任意像素。那么,Ω一旦給定,先驗概率P(O)、P(C)就成為常數(shù)。根據(jù)最大似然函數(shù)準(zhǔn)則,當(dāng)
成立時,可以按灰度將像素X歸于區(qū)域O,反之則將其歸入背景C中。由此定義判決函數(shù)分別表示為
do(X)=-2[lnP(X|O)-lnP(O)]和dC(X)=-2[lnP(X|C)-lnP(C)]。詳細(xì)證明可參閱文獻(xiàn)[6]。
據(jù)此,可定義區(qū)域能量為:

若把輪廓線選在目標(biāo)附近,那么Ω只需要考慮目標(biāo)邊緣附近的區(qū)域就可以了,而且最終輪廓線將收斂到目標(biāo)與背景的邊界上,所以可以認(rèn)為P(O)≈P(C)。把(4)、(5)式帶入(3)式,整理得:

通過調(diào)整λo、λC的取值可以減小(6)式由于忽略常數(shù)項引起的誤差。容易知道,當(dāng)Eregion趨于0時,控制點處于穩(wěn)定狀態(tài)。
2.2 彈性能的改進(jìn)
設(shè)控制點總數(shù)為N,且第N個控制點序號可以為0,在Kass Snake模型中,離散化的彈性能可用樣條曲線各段長度表示,即:

其中i∈[1,N]。在曲線演化過程中,該能量只有使控制點相互靠近的作用,它的不足是非常明顯的。針對該問題,Williams等人[7]將彈性能定義為:
?
當(dāng)控制點間距差別不大時,彈性力達(dá)到平衡,即控制點最終趨于等間距分布。這種方法避免了控制點的過度集中,但對等間距的要求過于嚴(yán)格。在實際應(yīng)用中,控制點常會落入某一紋理一致的區(qū)域內(nèi),該部分曲線可能因為彈性能與圖像能趨于0而達(dá)到穩(wěn)定。為解決該問題,可以對彈性能做適當(dāng)改進(jìn),使目標(biāo)內(nèi)的控制點在彈性力作用下相互遠(yuǎn)離,而背景中的控制點相互靠近。
據(jù)此原則,在Willimas 彈性能中引入系數(shù)λi,并定義為:
?
3 實驗結(jié)果與討論
為滿足Eimage的使用條件,只選擇目標(biāo)附近的區(qū)域作為背景。對內(nèi)部能量Eint、圖像能Eimage、區(qū)域能Eregion做歸一化處理,可得:
?
將模型用于有噪聲的灰度圖像的分割,傳統(tǒng)Snake模型與本文算法圖像分割結(jié)果的比較如圖1所示,其中圖像大小為256×256。噪聲的存在使目標(biāo)邊界并不明顯,同時待分割的目標(biāo)由平均灰度不同的兩部分組成,而右側(cè)部分并不規(guī)則,僅用圖像能很難把它描述清楚。圖1(a)為原始圖像和人為設(shè)定的初始輪廓。圖1(b)和圖1(c)為相同條件下分別用傳統(tǒng)Snake模型與本文改進(jìn)模型得到的分割結(jié)果。兩圖比較可以明顯看出,后者能更準(zhǔn)確地分割出目標(biāo)輪廓。圖1(d)是兩種模型迭代前后輪廓線總能量的差值曲線,它可以用迭代前輪廓線總能量減去一次迭代后輪廓線總能量得到。其中帶點的折線對應(yīng)于傳統(tǒng)Snake模型,另一條折線則對應(yīng)于本文的改進(jìn)模型,并規(guī)定輪廓線總能量的起始值為5。從圖中可以看出,傳統(tǒng)Snake模型盡管收斂很快,只需12次迭代即可,但在第12次迭代以后,本文算法的能量變化產(chǎn)生的振蕩幅度小于傳統(tǒng)Snake,且第17次迭代后的能量變化趨近于0。這說明,此時絕大多數(shù)的控制點處在更穩(wěn)定的狀態(tài),所得分割結(jié)果也更準(zhǔn)確。
?
對室外監(jiān)控場景圖像序列的運動目標(biāo)進(jìn)行跟蹤。其中,每幀圖像的大小為512×512,圖2(a1)~(a2)、(b1)~(b2)、(c1)~(c2)、(d1)~(d2)分別是序列的第1、20、25、30幀的局部。此序列中被跟蹤目標(biāo)通過的背景區(qū)域較復(fù)雜,且相鄰幀間目標(biāo)的位移較大。為提高跟蹤的準(zhǔn)確性,由當(dāng)前幀的分割結(jié)果與幀間運動矢量相疊加作為下一幀目標(biāo)的初始輪廓。圖2(a1)~(d1)是基于傳統(tǒng)Snake模型的跟蹤結(jié)果,(a2)~(d2)則是在相同條件下基于本文算法所得結(jié)果??梢钥闯?,前20幀中,兩種算法所得結(jié)果相差不大。但20幀后,基于傳統(tǒng)Snake的跟蹤結(jié)果明顯受到強(qiáng)邊界的影響而被吸引到目標(biāo)內(nèi)部,如圖2(c1)、(d1)所示。而基于本文Snake模型得到的曲線卻能較好地反映目標(biāo)輪廓,如圖2(c2)、(d2)所示。因此,基于本文Snake模型的跟蹤算法" title="跟蹤算法">跟蹤算法可以在很大程度上減少來自背景和強(qiáng)邊界的干擾,跟蹤結(jié)果更準(zhǔn)確、更穩(wěn)定。
本文在離散Snake模型中引入一種區(qū)域能量,提出了一種對原有彈性能的改進(jìn)方法。從實驗結(jié)果的比較可以看出,本文算法減少了目標(biāo)內(nèi)外局部干擾對輪廓線整體性能的影響,提高了跟蹤的準(zhǔn)確性。而其不足之處在于:首先,區(qū)域的統(tǒng)計特性的估計值是否準(zhǔn)確對結(jié)果有很大的影響,因此對它們的估計要盡量準(zhǔn)確;其次,算法本身的計算量大,運行時間長。所以進(jìn)一步提高Snake模型跟蹤的有效性和運算效率將是下一步研究的重點。
參考文獻(xiàn)
1 Kass M,Witkin A,Terzopoulous D.Snakes:active contour models[A].In:Processing of first international conference on computer vision[C],London,England,1987:259~268
2 Cohen L D.On active contour models and balloons[J].CVGIP Image Understanding,1991;53(2):221~218
3 Xu C,Prince J L.Snakes:shapes and gradient vector flow[J]. IEEE Transactions on Imaging Processing,1998;7(3):359~369
4 Ivins J,Porrill J.Active region models for segmenting medical images.In:IEEE ICIP,1994
5 章毓晉.圖像分割[M].北京:科學(xué)出版社,2001
6 Bow S T.Pattern recognition and image processing[M].New York:Marcel Dekker Inc,2002
7 Williams D J,Shah M.A fast algorithm for active contours and curvature estimation[J].CVGIP:Image Understanding,1992;55(1):14~26


