《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技术 > 设计应用 > 基于相位调制的立体声音频数字水印
基于相位调制的立体声音频数字水印
侯 剑,付永生,郭 恺
摘要: 提出了一种可进行盲检测的数字音频水印算法。该算法利用人类听觉系统对音频相位变化的不敏感性,通过时变的全通滤波器,对原始音频信号进行相位调制。为了实现盲检测,将水印信号通过频移键控(PSK)赋值到立体声信号的左右声道上,然后采用短时离散傅立叶变换的方法对嵌入水印的音频信号进行检测。实验结果证明该算法具有良好的不可感知性和鲁棒性。
關(guān)鍵詞: 数字水印 音频
Abstract:
Key words :

  摘 要: 提出了一種可進(jìn)行盲檢測的數(shù)字音頻" title="音頻">音頻水印算法。該算法利用人類聽覺系統(tǒng)對(duì)音頻相位變化的不敏感性,通過時(shí)變的全通濾波器,對(duì)原始音頻信號(hào)進(jìn)行相位調(diào)制。為了實(shí)現(xiàn)盲檢測,將水印信號(hào)通過頻移鍵控(PSK)賦值到立體聲信號(hào)的左右聲道上,然后采用短時(shí)離散傅立葉變換的方法對(duì)嵌入水印的音頻信號(hào)進(jìn)行檢測。實(shí)驗(yàn)結(jié)果證明該算法具有良好的不可感知性和魯棒性。
  關(guān)鍵詞: 數(shù)字音頻水印 相位調(diào)制 頻移鍵控 短時(shí)離散傅立葉變換


  數(shù)字水印" title="數(shù)字水印">數(shù)字水印是一項(xiàng)為保護(hù)多媒體知識(shí)產(chǎn)權(quán)而發(fā)展起來的技術(shù),其作用就是將數(shù)字、文字、圖像等版權(quán)信息嵌入到多媒體數(shù)據(jù)(載體信號(hào))中。數(shù)字音頻水印就是將版權(quán)信息嵌入到音頻載體信號(hào)中,以實(shí)現(xiàn)版權(quán)保護(hù)、加密通信及鑒別數(shù)據(jù)真?zhèn)蔚裙δ堋?br />   嵌入載體信號(hào)的水印必須有較好的魯棒性和不可感知性。為此,需要利用人類聽覺系統(tǒng)(HAS)的一些特性進(jìn)行水印的嵌入[1]。目前的研究表明,人類聽覺系統(tǒng)對(duì)音頻信號(hào)的相位是不敏感的[2]。具體表現(xiàn)為:在高頻段,人耳對(duì)音頻信號(hào)的相對(duì)相位變化不敏感;在低頻段,人耳對(duì)聲音的絕對(duì)相位不敏感。因此,許多研究者針對(duì)這些性質(zhì)提出了一些水印算法。例如,相位編碼法[3],該算法是在保證相鄰相位差不變的情況下,改變信號(hào)的絕對(duì)相位,這種做法的結(jié)果是相鄰頻率分量的相對(duì)相位關(guān)系與原始音頻信號(hào)的相對(duì)相位關(guān)系有較大的差別;另一種方法是,將音頻信號(hào)通過無限脈沖響應(yīng)(IIR)的全通濾波器,從而將水印信息嵌入到原始音頻信號(hào)的相位上[4],無限脈沖響應(yīng)的全通濾波器通常具有較復(fù)雜的相位特性,所以使用這種方法嵌入的水印一般具有較差的不可感知性。
  本文通過總結(jié)以上方法,提出一種新的水印算法。將原始音頻信號(hào)通過全通濾波器,循環(huán)地改變?nèi)V波器的群時(shí)延,以達(dá)到嵌入水印信號(hào)的目的。信號(hào)通過全通濾波器后,改變的只是它的相頻特性,因此,該方法又稱為動(dòng)態(tài)相位調(diào)制法。
1 水印的嵌入與檢測
1.1 相位調(diào)制

  通過一個(gè)時(shí)變的全通濾波器對(duì)原始音頻信號(hào)進(jìn)行相位調(diào)制。全通濾波器利用一個(gè)IIR濾波器來實(shí)現(xiàn)。根據(jù)數(shù)字信號(hào)處理的知識(shí),這個(gè)IIR濾波器可以通過一組有限脈沖響應(yīng)(FIR)的濾波器來近似地實(shí)現(xiàn),這樣做的好處是利用這些線性相位濾波器,使時(shí)變的全通濾波器的群時(shí)延在整個(gè)頻率范圍內(nèi)變?yōu)橐恢?,然后通過一個(gè)正弦函數(shù)控制群時(shí)延,使該濾波器的相位特性循環(huán)變化。該全通濾波器的相位特性可以用下式表示:

  式中,τpm表示最大群時(shí)延,ωpm表示調(diào)制率(調(diào)制角頻率),Φpm表示初相位。τpm和ωpm的取值能影響水印的可見性,因此它們是該相位調(diào)制濾波器(PMF)的重要參數(shù)。通過對(duì)ωpm進(jìn)行頻移鍵控,可以實(shí)現(xiàn)水印的嵌入。
  考慮到需要對(duì)水印信號(hào)進(jìn)行盲檢測,同時(shí)為了提高檢測出的水印的信噪比,本文對(duì)其中一個(gè)聲道的調(diào)制信號(hào)加上一個(gè)相偏π,于是得到:
  

式中,h(i,n) {i∈0,……M-1}隨C(n)變化。
1.2 相位解調(diào)
  本文利用短時(shí)離散傅立葉變換對(duì)加入了水印的音頻信號(hào)進(jìn)行解調(diào)。
  在時(shí)刻t,調(diào)制后的音頻信號(hào)的相頻特性可以表示為:


  由此可以看出,檢測到的水印信號(hào)具有3dB的信噪比增益。
1.3 基于FSK的水印編碼
  (1)嵌入過程:頻移監(jiān)控(FSK)的通常定義為:
  Ci(t)=Acos(ωit+Φ),i=1,……M
  式中,頻率ωi從M個(gè)離散值中選擇,初始相位Φ取任意值。
  通過擴(kuò)展帶寬可以得到MFSK編碼,擴(kuò)頻的大小與所取的M值有關(guān)。水印嵌入時(shí),將相應(yīng)的數(shù)字信息賦值給相應(yīng)的ωi,從而產(chǎn)生一個(gè)相位調(diào)制信號(hào)Ci(t),這就是基于FSK調(diào)制的相位調(diào)制信號(hào)。上面提到的相位調(diào)制濾波器(PMF),其相位特性就是隨這個(gè)相位調(diào)制信號(hào)而變化。水印嵌入過程就是將原始音頻信號(hào)同PMF的脈沖響應(yīng)做卷積來實(shí)現(xiàn)的。
  (2)檢測過程:首先,利用DFT計(jì)算出解調(diào)信號(hào)(t)的能量譜;然后,計(jì)算出這個(gè)能量譜峰值處的頻率,通過解碼這個(gè)峰值頻率得到一個(gè)水印信息;最后,將解碼出的水印信息組合,得到完整的水印信息。
2 仿真實(shí)驗(yàn)
  本文采用采樣率為44.1kHz的16bit編碼的雙聲道音頻信號(hào),信號(hào)長度為180s。水印信號(hào)采用一個(gè)64×64的二值圖像。嵌入時(shí)的具體參數(shù)如表1所示。


  在水印信號(hào)嵌入前,可以采用擴(kuò)頻技術(shù)[5],通過原始數(shù)據(jù)的頻域擴(kuò)展,實(shí)現(xiàn)水印信息的加入。從而提高水印的檢測精度,并能隨機(jī)產(chǎn)生一個(gè)密鑰,但同時(shí)也增加了嵌入水印的數(shù)據(jù)量。
  本文采用的相位調(diào)制濾波器由256個(gè)有限脈沖響應(yīng)(FIR)濾波器組成,如圖1所示。

 


  水印檢測時(shí),每65 536點(diǎn)作為一個(gè)數(shù)據(jù)段,對(duì)其進(jìn)行采樣間隔為16的N點(diǎn)短時(shí)離散傅立葉變換,其中取N=256。結(jié)構(gòu)如圖2所示。
  本文采用識(shí)別率(SHR)對(duì)檢測到的水印進(jìn)行性能上的估測。識(shí)別率定義為正確識(shí)別的水印與嵌入水印之比。公式如下:
  
  采用不同音頻信號(hào)提取后的識(shí)別率如表2所示。


  為了驗(yàn)證算法的魯棒性,需對(duì)該嵌入水印的音頻信號(hào)進(jìn)行攻擊處理。這些攻擊包括:低通濾波、時(shí)域壓縮、添加噪聲等。對(duì)受攻擊后檢測出的水印性能的評(píng)測,也是利用識(shí)別率來衡量的。實(shí)驗(yàn)結(jié)果表明(如表3),該算法對(duì)時(shí)域壓縮有明顯的抵抗力,對(duì)其他攻擊也有較好的魯棒性。


  本文討論了一種基于相位調(diào)制的數(shù)字音頻水印算法,同時(shí)給出了該水印的盲檢測算法。由該算法產(chǎn)生的水印具有較好的不可見性;又因?yàn)榍度胨r(shí),運(yùn)用多種保密技術(shù),該算法對(duì)多種攻擊處理具有良好的魯棒性。與以往的水印算法相比,水印的不可見性和魯棒性都有不同程度的提高。由本文的檢測算法可得:當(dāng)該立體聲信號(hào)被濾掉一個(gè)聲道時(shí),水印將不再起作用。
參考文獻(xiàn)
1 A N Lemma,J Aprea,W Oomen et al.A temporal domain audio watermarking technique.IEEE Trans.Signal Processing,2003;51(4):1088~1097
2 Brain C J Moore.An introduction to the psychology of hear-ing,4th edition.New York:Academic,F(xiàn)eb,1997
3 W Bender,D Gruhl,N Morimoto et al.Techniques for data hiding.IBM SYSTEMS JOURNAL.1996;35(3&4)
4 Ciloglu T,Utku Karaaslan S.An improved all-pass water-marking scheme for speech and audio.In:IEEE International Conference on Volume 2,Aug 2000
5 Darko Kirovski,Henrique S.Malvar.Spread-Spectrum Water-marking of Audio Signals.IEEE Trans.Signal Processing,2003;51(4):1020~1033

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容