摘 要: 介紹了基于數(shù)字圖像的信息隱藏技術(shù)的基本內(nèi)容及方法,著重研究了圖像信息隱藏的反向檢測(cè)技術(shù)——隱寫(xiě)分析技術(shù),總結(jié)了其方法和分類。針對(duì)隱寫(xiě)分析中的RS(Regularand Singular groups method)檢測(cè)算法進(jìn)行了深入的研究,提出了改進(jìn)算法,在一定程度上減小了RS檢測(cè)算法對(duì)統(tǒng)計(jì)假設(shè)的依賴性,并且在不改變像素間相關(guān)特性的同時(shí)可以對(duì)圖像進(jìn)行二次檢驗(yàn),增加了檢測(cè)結(jié)果的準(zhǔn)確性。在不同的掩碼和嵌入率下進(jìn)行了大量實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果驗(yàn)證了該改進(jìn)算法的有效性,基于該改進(jìn)算法編寫(xiě)了檢測(cè)程序,實(shí)現(xiàn)了對(duì)灰度及彩色圖像的LSB(Least Significant Bit)隱藏檢測(cè)。
關(guān)鍵詞: 信息隱藏;隱寫(xiě)分析;RS檢測(cè);LSB隱藏
0 引言
隨著數(shù)字化信息時(shí)代的到來(lái),各種各樣的數(shù)字媒體越來(lái)越多,數(shù)字圖像的信息安全問(wèn)題越來(lái)越受到重視,基于圖像的信息隱藏技術(shù)以及其反向檢測(cè)技術(shù)——隱寫(xiě)分析技術(shù),成為了新的研究熱點(diǎn)[1]。
信息隱藏技術(shù)是將隱秘信息隱藏在其他媒體中,通過(guò)載體媒體的傳輸,實(shí)現(xiàn)隱秘信息的傳遞甚至達(dá)到跟蹤和校驗(yàn)信息來(lái)源的目的。隱寫(xiě)分析技術(shù)作為信息隱藏的反向技術(shù),目的是檢測(cè)載體中是否含有隱藏信息。對(duì)該技術(shù)研究,除了可以檢測(cè)隱藏信息之外,還可以了解正向隱藏的缺陷,指導(dǎo)研究者設(shè)計(jì)更健壯的信息隱藏技術(shù),確保嵌入信息的抗攻擊性。RS[2-3]檢測(cè)算法作為一種重要的反向分析方法,對(duì)無(wú)損嵌入容量的LSB信息隱藏有很好的檢測(cè)效果。本文基于該算法,通過(guò)對(duì)大量不同掩碼及嵌入率下的數(shù)據(jù)比較,證實(shí)了參數(shù)對(duì)檢測(cè)結(jié)果的影響,并對(duì)該檢測(cè)算法提出了改進(jìn),提高了檢測(cè)的準(zhǔn)確性。
1 信息隱藏技術(shù)
信息隱藏應(yīng)用主要有隱寫(xiě)術(shù)、數(shù)字水印技術(shù)[4]。隱寫(xiě)術(shù)是將秘密信息隱藏到普通的信息(如數(shù)字圖像)中進(jìn)行傳輸。方法主要有利用高空間頻率的圖像數(shù)據(jù)隱藏信息、采用最低有效位(LSB)方法將信息隱藏到宿主信號(hào)中、使用信號(hào)的色度隱藏信息、在數(shù)字圖像的像素亮度的統(tǒng)計(jì)模型上隱藏信息等。
數(shù)字水印技術(shù)是將一些標(biāo)識(shí)信息(數(shù)字水?。┰诓挥绊懺d體的使用并且不易被他人探知和修改的前提下嵌入到數(shù)字載體(圖片、文檔、軟件等)當(dāng)中。數(shù)字水印被廣泛應(yīng)用于防偽溯源、版權(quán)保護(hù)、隱藏標(biāo)識(shí)、認(rèn)證和安全隱蔽通信中。數(shù)字水印可以劃分為時(shí)(空)域數(shù)字水印、頻域數(shù)字水印、時(shí)/頻域數(shù)字水印和時(shí)間/尺度域數(shù)字水印。
2 信息隱藏分析技術(shù)
信息隱藏分析技術(shù)也叫隱寫(xiě)分析技術(shù),是對(duì)圖像、音頻、視頻等進(jìn)行檢測(cè),判斷其中是否嵌有秘密信息。原始數(shù)據(jù)由于秘密信息的嵌入,導(dǎo)致自身統(tǒng)計(jì)特性發(fā)生變化,使得分析者可以通過(guò)分析載體數(shù)據(jù)的異常變化來(lái)檢測(cè)秘密信息的存在,即使無(wú)法提取出秘密信息,也能破壞其隱秘通信并追查秘密信息的收發(fā)方。由于原始載體很難獲得,因此盲檢測(cè)是最常遇到的情況。盲檢測(cè)主要是通過(guò)統(tǒng)計(jì)和算法來(lái)對(duì)數(shù)字圖像特征進(jìn)行分析,從特征的改變來(lái)判斷是否存在信息的嵌入。
根據(jù)隱寫(xiě)分析提取特征的不同,可以分為專用隱寫(xiě)分析和通用隱寫(xiě)分析。根據(jù)特征所在域的不同又分為時(shí)空域和頻率域隱寫(xiě)分析。時(shí)空域分析方法主要針對(duì)LSB信息隱藏,該方法實(shí)現(xiàn)簡(jiǎn)單,但是檢測(cè)能力有限。頻率域方法則是通過(guò)在頻域檢測(cè)特征的變化來(lái)判斷信息嵌入,包括傅里葉、拉普拉斯、離散余弦和小波變換等。
針對(duì)盲檢測(cè)本身難度已較大,要進(jìn)行通用隱寫(xiě)分析更是很難實(shí)現(xiàn),所以現(xiàn)在的隱寫(xiě)分析主要是專用隱寫(xiě)分析。包括下面一些經(jīng)典方法:
?。?)Chi-Square統(tǒng)計(jì)檢測(cè)方法。該方法統(tǒng)計(jì)調(diào)色板圖像嵌入信息前后相對(duì)顏色對(duì)的概率比來(lái)檢測(cè)秘密信息的嵌入,但是對(duì)信息的隨機(jī)嵌入無(wú)法檢測(cè)。
(2)基于無(wú)損嵌入容量的檢測(cè)方法,即本文介紹的RS分析法。
?。?)基于JPEG兼容性檢測(cè)方法。該方法僅適用于JPEG格式的圖像,有比較高的靈敏度,甚至可以檢測(cè)到單個(gè)像素的改變,當(dāng)信息嵌入量較大時(shí),還可以估計(jì)出信息嵌入的長(zhǎng)度。
(4)DCT(Discrete Cosine Transform)系數(shù)分析法。通過(guò)估計(jì)隱秘載體圖像的DCT系數(shù)直方圖和原始估計(jì)直方圖的相關(guān)改變量來(lái)估計(jì)秘密信息嵌入量,該方法對(duì)具有特殊網(wǎng)格結(jié)構(gòu)的圖像檢測(cè)無(wú)效。
3 數(shù)字圖像RS隱寫(xiě)分析技術(shù)及改進(jìn)
3.1 RS隱寫(xiě)分析
假設(shè)有一個(gè)M×N個(gè)像素的圖像,它的像素值用集合P來(lái)表示(例如一個(gè)8 bit的灰度圖像,P={0…255})。把圖像分割成像素接近的N個(gè)組:{x1…xn},定義一個(gè)辨別函數(shù)f:
則每一個(gè)像素組G=(x1…xn)對(duì)應(yīng)一個(gè)實(shí)數(shù)值f(x1…xn)∈R。像素組G的噪聲越大,辨別函數(shù)f的值就越大。而LSB的信息嵌入等同于疊加了噪聲,這樣會(huì)引起f值的增加。
定義一個(gè)基于集合P的可逆操作F,稱之為翻轉(zhuǎn)。翻轉(zhuǎn)可以認(rèn)為是一個(gè)灰度級(jí)的置換,它具有以下性質(zhì):
對(duì)x∈P有F2=F和F(F(x))=x。
對(duì)于8 bit灰度圖像,定義翻轉(zhuǎn)如下:
為保持完備性,還定義一個(gè)恒等翻轉(zhuǎn):
F0(x)=x
以上翻轉(zhuǎn)都滿足:
F-1(x)=F1(x+1)-1 x∈P(2)
用辨別函數(shù)f和翻轉(zhuǎn)操作F就可以將G歸類到三種類型的像素組:R(規(guī)則組)、S(奇異組)、U(無(wú)用組),分類規(guī)則如下:
用Rm來(lái)表示處理后的規(guī)則組的數(shù)量,Sm表示異常組的數(shù)量,上述翻轉(zhuǎn)等同于模擬疊加了噪聲,導(dǎo)致了f值的增加,因此規(guī)則組的總數(shù)將大于異常組,即:
Rm>Sm(3)
如圖1所示,隨著隱藏信息長(zhǎng)度的增加,當(dāng)嵌入率為50%時(shí),Rm和Sm的值趨于相等。
此外,大量的試驗(yàn)表明下面的統(tǒng)計(jì)假設(shè)都是正確有效的:
RS隱寫(xiě)分析正是建立在式(4)的統(tǒng)計(jì)假設(shè)之上,再利用式(3)來(lái)判斷是否有信息嵌入,最后利用二次方程(5):
2(d1+d0)x2+(d-0-d-1-d1-3d0)x+d0-d-0=0(5)
其中:d0=Rm(p/2)-Sm(p/2)
d1=Rm(1-p/2)-Sm(1-p/2)
d-0=R-m(p/2)-S-m(p/2)
d-1=R-m(1-p/2)-S-m(1-p/2)
x的取值為兩個(gè)根中絕對(duì)值小的那一個(gè),代入式(6)可得出嵌入信息的長(zhǎng)度P:
P=x/(x-1/2)(6)
3.2 算法改進(jìn)
基于RS算法的改進(jìn)方法,可以分為以下幾個(gè)步驟:
?。?)將圖像看成是一個(gè)M×N的像素組,將其分成n個(gè)小的像素組,每個(gè)組的元素個(gè)數(shù)根據(jù)情況指定。
?。?)對(duì)每個(gè)小的像素組進(jìn)行式(1)的f運(yùn)算。
?。?)對(duì)每個(gè)小的像素組進(jìn)行正翻轉(zhuǎn),翻轉(zhuǎn)規(guī)則為:像素值為偶,其值加1;像素值為奇,其值減1。
?。?)對(duì)翻轉(zhuǎn)后的小像素組重復(fù)步驟(2),比較未翻轉(zhuǎn)的像素組和翻轉(zhuǎn)后的像素組的f運(yùn)算后的值,如果翻轉(zhuǎn)后的值大于翻轉(zhuǎn)前的值,就將該像素組歸為R類,反之歸為S類,相等則歸為U類。
(5)對(duì)每個(gè)小的像素組進(jìn)行負(fù)翻轉(zhuǎn),翻轉(zhuǎn)規(guī)則為:像素值為偶數(shù)則減1,奇數(shù)則加1,然后重復(fù)步驟(4)。
(6)對(duì)原始圖像整體翻轉(zhuǎn),規(guī)則為:像素值為偶數(shù)則加1奇數(shù)則減1,對(duì)得到的新像素組重復(fù)步驟(1)~(5)。
(7)將上面得到的多個(gè)情況下的R、S組的數(shù)量代入到上面二元方程(5)中求解,由等式(6)就可以得到P值。根據(jù)大量實(shí)驗(yàn)數(shù)據(jù)設(shè)定了一個(gè)閾值為5%,一般P值大于5%就可以認(rèn)為圖像中含有隱藏信息。
上述的步驟(3)和(5)在一定程度上減小了RS檢測(cè)算法對(duì)統(tǒng)計(jì)假設(shè)的依賴性,步驟(6)對(duì)圖像的整體反轉(zhuǎn),使得在不改變像素間相關(guān)特性的同時(shí),可以對(duì)圖像進(jìn)行了二次檢驗(yàn),增加了判決結(jié)果的準(zhǔn)確性。
3.3 實(shí)驗(yàn)結(jié)果和分析
通過(guò)以上RS算法的改進(jìn),基于數(shù)字圖像處理[5],利用VC編寫(xiě)了一個(gè)基于RS隱寫(xiě)檢測(cè)算法的檢測(cè)工具,該工具可用于檢測(cè)BMP格式的灰度和彩色圖像中是否含有隱藏信息,并顯示算法中用到的關(guān)鍵參數(shù)。檢測(cè)程序主界面如圖2所示,檢測(cè)參數(shù)如圖3所示。
實(shí)驗(yàn)中利用了下面3個(gè)經(jīng)典的信息隱藏工具:eShow、S-Tools和Hide4PGP。在檢測(cè)過(guò)程中,統(tǒng)計(jì)比較了用不同隱藏工具在不同的嵌入率和不同掩碼下檢測(cè)算法的有效性,如表1所示。
通過(guò)對(duì)大量實(shí)驗(yàn)數(shù)據(jù)進(jìn)行分析,總結(jié)了下面幾個(gè)影響檢測(cè)結(jié)果的因素:
?。?)嵌入率越高,檢測(cè)的準(zhǔn)確率越高。
?。?)掩碼對(duì)檢測(cè)結(jié)果有影響。比較實(shí)驗(yàn)的兩個(gè)掩碼,低嵌入率情況下,掩碼為0110時(shí),檢測(cè)效果更好。
(3)初始偏差對(duì)檢測(cè)結(jié)果精確度有影響。初始偏差(表1中第1列數(shù)據(jù))是指原始載體由于隨機(jī)變化而產(chǎn)生的微小初始非零信息長(zhǎng)度。初始偏差可能是正或負(fù),它限制了隱寫(xiě)分析的精確度。統(tǒng)計(jì)數(shù)據(jù)表明初始偏差對(duì)JPEG圖像、未壓縮的圖像及高分辨率圖像來(lái)說(shuō)相當(dāng)?shù)?,而且彩色圖的初始偏差大于灰度圖。
?。?)圖像中信息比特的位置。圖像中信息是隨機(jī)分布時(shí),RS隱寫(xiě)分析的精確度較高;而當(dāng)圖像中信息集中分布在局部區(qū)域時(shí),RS隱寫(xiě)分析的精確度較低。
4 結(jié)論
本文針對(duì)LSB信息隱藏的RS檢測(cè)算法提出了改進(jìn),減少了該方法對(duì)檢測(cè)樣本原始統(tǒng)計(jì)假設(shè)的依賴性,并在不改變圖像元素間相關(guān)性的前提下增加了二次檢驗(yàn),提高了檢測(cè)準(zhǔn)確率,實(shí)驗(yàn)結(jié)果也印證了改進(jìn)的有效性。通過(guò)比較大量實(shí)驗(yàn)數(shù)據(jù),總結(jié)了影響檢測(cè)結(jié)果的因素。由于本文的實(shí)驗(yàn)是基于嵌入率大于30%的BMP圖像,因此在下一步研究中,還需要考慮多種格式和低嵌入率情況下的算法有效性,并針對(duì)文中提出的影響檢測(cè)準(zhǔn)確性的因素來(lái)加以改進(jìn)。
參考文獻(xiàn)
[1] 汪小帆,戴躍偉,茅耀斌.信息隱藏技術(shù)-方法與應(yīng)用[M].北京:機(jī)械工業(yè)出版社,2001.
[2] FRIDRICH J, GOLJAN M, DU R. Detecting LSB steganography in color and gray-scale images[J]. IEEE Multimedia, Special Issue on Security, 2001,8(4):22-27.
[3] FRIDRICH J, DU R, MENG L. Steganalysis of LSB encoding in color Images[C]. IEEE International Conference on Multimedia and Expo, IEEE Press, N.J. 2000.
[4] NAOR M, SHAMIR A. Visual cryptography[C]. EUROCRYPT,1994:1-12.
[5] 阮秋琦.數(shù)字圖像處理學(xué)[M].北京:電子工業(yè)出版社,2001.