活動圖像專家組(MPEG)針對數(shù)字音頻和視頻的編碼原則制定了MPEG標準,通過MPEG壓縮引擎,實現(xiàn)了以經(jīng)濟的成本為消費者提供高質(zhì)量的數(shù)字多媒體內(nèi)容的理想,也為多媒體市場帶來了無限商機。最新開發(fā)的MPEG-4,旨在為機頂盒、互聯(lián)網(wǎng)、移動設(shè)備等應(yīng)用實現(xiàn)更高質(zhì)量的壓縮和更靈活的格式,提供更加豐富的選擇。
MPEG-4標準目前已發(fā)展為ISO/IEC-14496第一版和第二版。隨著MPEG-4 第十部分H.264/先進的視頻編碼(AVC)的提出,MPEG標準進一步演進。與此同時,中國自主知識產(chǎn)權(quán)的數(shù)字音視頻編解碼標準(AVS)的制定也為便攜式多媒體技術(shù)開創(chuàng)了新的發(fā)展空間。
高質(zhì)量有效傳輸數(shù)字多媒體內(nèi)容
MPEG-4可同時處理各種“媒體對象(視頻和音頻內(nèi)容的統(tǒng)稱)”,形成視聽場景,為整套工具包提供互動和個性化媒體內(nèi)容的視聽數(shù)據(jù),同時,還可壓縮/解壓其他媒體對象,如文本、圖像、語音、動畫、2D和3D對象等。為實現(xiàn)該標準的有效實施,MPEG-4系統(tǒng)對子集、視頻和音頻工具集都進行了定義,以應(yīng)用于各種特殊應(yīng)用,為音頻/視頻對象的編碼提供更豐富的工具。

圖1 H.264/AVC宏塊視頻編碼層框圖
H.264/AVC打造MPEG-4新特性
MPEG-4 第十部分H.264/AVC在本質(zhì)上與MPEG-2等其他標準類似,是由時間預測和空間預測的綜合體與編碼轉(zhuǎn)換共同組成的,但這一新標準并不會取代現(xiàn)有的MPEG-4 第二部分“編碼解碼器”,也不與其兼容。
除此之外,H.264/AVC還采用了視頻編碼領(lǐng)域的最新研究成果。由于采用了幀內(nèi)預測、整數(shù)轉(zhuǎn)換、可變的塊尺寸運動評估/補償和去塊過濾等現(xiàn)有先進技術(shù),H.264/AVC與之前的標準相比又增加了新的特性,在幫助其他現(xiàn)有的標準在維持相同視頻質(zhì)量的同時,還可平均降低50%的位率。
表1 H.264/AVC與其他標準的比較
幀間預測功能
H.264/AVC可根據(jù)每個宏塊片編碼類型的不同,以幾種編碼類型中的一種進行傳輸,并且所有片編碼類型可支持INTRA-4×4和INTRA-16×16兩種類別的幀內(nèi)編碼類型。在以往的視頻編碼標準中,預測操作都是在轉(zhuǎn)換域中進行的,而在H.264/AVC標準中,這一操作往往是根據(jù)已編碼塊中的相鄰樣本,在空間域中進行的。幀內(nèi)預測不能跨越片邊界,以保持片與片之間的相互獨立性。
P片中的活動補償
除幀內(nèi)宏塊編碼類型外,H.264/AVC還包含多種針對P片宏塊的預測性或活動補償性的編碼類型。宏塊被分割在用于活動描述的大小固定的塊中,每個P類宏塊對應(yīng)一個特定的宏塊分區(qū)。活動補償?shù)木葹橐粋€樣本距離的四分之一。
一般情況下,H.264/AVC的語法可支持無限制的活動矢量,即活動矢量可以超出畫面區(qū)域,但活動矢量元件預測不能跨越片邊界。
整數(shù)轉(zhuǎn)換
此外,與以往的視頻編碼標準相似,H.264/AVC也采用預測剩余的轉(zhuǎn)換編碼,但這種轉(zhuǎn)換僅應(yīng)用于4×4塊,而且計算中采用了與4×4離散余弦轉(zhuǎn)換(DCT)特性基本相同的分離整數(shù)轉(zhuǎn)換,以此取代了4×4DCT。由于整個逆轉(zhuǎn)換過程由精確整數(shù)運算定義,因此避免了逆轉(zhuǎn)換過程中的不錯配現(xiàn)象。而對于轉(zhuǎn)換系數(shù)的量化,H.264/AVC運用了標量化的方法。塊中的量化轉(zhuǎn)換系數(shù)通常按照之字形順序進行掃描,并采用平均信息量編碼的方式傳輸。只要16位整數(shù)值相加,并在16位整數(shù)值的基礎(chǔ)上進行位移操作,H.264/AVC 中的所有轉(zhuǎn)換就都能實現(xiàn)。

圖2 一個H.264的P片宏塊的分區(qū)結(jié)構(gòu)

圖3 多畫面活動補償預測
