《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 业界动态 > 可配置视频引擎颠覆传统视频方案

可配置视频引擎颠覆传统视频方案

2007-12-27
作者:牛虻

??? 用手機(jī)等移動(dòng)終端作為傳播載體的移動(dòng)流媒體,在影視、交通、廣告等領(lǐng)域的應(yīng)用正被越來越看好,同時(shí)隨著終端和網(wǎng)絡(luò)的升級(jí),以及市場(chǎng)的成熟,價(jià)格的走低,多媒體功能" title="多媒體功能">多媒體功能已不再是高端手機(jī)的專利,未來多媒體功能將成為主流手機(jī)的標(biāo)準(zhǔn)配置?!暗?006年底,全球移動(dòng)用戶將達(dá)到27億,且將繼續(xù)迅速發(fā)展。未來手機(jī)將成為一部真正的多媒體移動(dòng)終端?!比駽MO執(zhí)行副總裁、諾基亞集團(tuán)執(zhí)行委員會(huì)成員Robert Anderson先生表示。據(jù)In-Stat公司預(yù)測(cè):2010年僅美國就將會(huì)有3000萬手機(jī)提供移動(dòng)視頻服務(wù)。

??? 同時(shí),消費(fèi)類電子的另一個(gè)熱點(diǎn)PMP,借助于方案供應(yīng)商和OEM廠商的大力推動(dòng)以及上游供應(yīng)商在成本上做出的調(diào)整,無論是國際還是國內(nèi),PMP市場(chǎng)一改往日“雷聲大,雨點(diǎn)小”的局面。從2005年年末開始, 都出現(xiàn)了一個(gè)很高的增長。據(jù)水清木華研究中心預(yù)測(cè),2007年P(guān)MP在中國市場(chǎng)的出貨量將會(huì)再一次飛速增長,年增長率將超過200%。

??? 傳統(tǒng)方案遭遇功耗和靈活性瓶頸

??? 伴隨著著兩個(gè)市場(chǎng)的不斷拓展,消費(fèi)者對(duì)多媒體功能的要求也在不斷增加。因此終端生產(chǎn)商對(duì)多媒體芯片的要求也越來越高,視頻功能作為多媒體功能的標(biāo)志之一,視頻處理" title="視頻處理">視頻處理的傳統(tǒng)方案正面臨著更大的挑戰(zhàn)。

??? 典型的視頻架構(gòu)如圖1所示。主要包括主機(jī)/系統(tǒng)控制器任務(wù)、媒體管理任務(wù)、視頻解碼" title="視頻解碼">視頻解碼任務(wù)、顯示任務(wù)四個(gè)層面。

?

?

?? 圖1 典型視頻系統(tǒng)架構(gòu)

?

??? 其中實(shí)現(xiàn)視頻解碼任務(wù)的視頻解碼器傳統(tǒng)上有兩種方案,一種是RISC CPU+硬件(RTL)加速器,另一種是RIDC CPU+媒體DSP引擎+硬件(RTL)加速器。兩種方案都需要用CPU來處理網(wǎng)絡(luò)抽象層、圖象層、條代層的大部分工作,同時(shí),比特流分析通常會(huì)部分采用RTL實(shí)現(xiàn),部分用軟件在主機(jī)上實(shí)現(xiàn),這樣一來不僅會(huì)增加復(fù)雜度,同時(shí),任務(wù)的分解也導(dǎo)致了主機(jī)處理器和解碼器之間過多的數(shù)據(jù)交換,這無疑會(huì)增加更多的功耗。

??? 兩種傳統(tǒng)方案的最大區(qū)別在熵解碼—去塊濾波器部分,第一種方案全部用RTL來實(shí)現(xiàn),第二種方案則把熵解碼后面的部分采用通用多媒體DSP來實(shí)現(xiàn)。前一種方案中,不僅用來專門實(shí)現(xiàn)熵編碼(尤其是CABAC)的RTL會(huì)帶來更多地功耗,而且系統(tǒng)缺乏靈活性,當(dāng)標(biāo)準(zhǔn)或者需求變化時(shí)必須添加新的硬件模塊,這意味著必須設(shè)計(jì)新的芯片,而原終端產(chǎn)品必須作廢。后一種方案雖然在一定程度上增加了系統(tǒng)的靈活性,可以適應(yīng)部分的變化,但是熵解碼部分仍然必須用特定的RTL硬件模塊來實(shí)現(xiàn),這將會(huì)要求傳統(tǒng)DSP引擎的頻率高達(dá)700-900Mhz——更高的頻率將帶來更多的功耗。同時(shí),當(dāng)新算法出現(xiàn)時(shí),有時(shí)不是僅僅通過修改軟件就能解決的,一方面可能會(huì)影響硬件RTL模塊導(dǎo)致重新流片的風(fēng)險(xiǎn),另外也會(huì)造成處理器和RTL模塊之間過多的總線傳輸。

????新方案打破功能和功耗博弈困境

????“消費(fèi)者一方面要求終端產(chǎn)品功能不斷增加,另一方面又要求盡量降低功耗,傳統(tǒng)方案在這種看似矛盾的雙重壓力下已顯得捉襟見肘?!盩ensilica公司移動(dòng)多媒體方案市場(chǎng)總監(jiān)Larry Przywara表示,“Tensilica已準(zhǔn)備好向那些將開發(fā)高品質(zhì)視頻產(chǎn)品的半導(dǎo)體制造商和系統(tǒng) OEM公司提供全部經(jīng)過測(cè)試的新產(chǎn)品解決方案。”

????該公司近期發(fā)布了預(yù)定制的四款用于SoC設(shè)計(jì)的Diamond Standard VDO(ViDeO)處理器引擎,可以支持多標(biāo)準(zhǔn)多分辨率視頻模塊。面向移動(dòng)手機(jī)和個(gè)人媒體播放器(PMPs)應(yīng)用,這些視頻子系統(tǒng)的設(shè)計(jì)是完全可編程,可以支持所有流行的VGA和SD(也稱D1)視頻編解碼算法。包括H.264 Main Profile、VC-1 Main Profile, MPEG-4 Advanced Simple Profile (ASP)和MPEG-2 Main Profile。其算法的分辨率支持720x480 (NTSC) 和720x576 (PAL),同時(shí)也支持較低分辨率,如QCIF、QVGA、 CIF 和VGA。

????Tensilica完整的視頻解決方案如圖2所示。Diamond Standard VDO 引擎在處理器上通過軟件方式幾乎承擔(dān)了從讀取編碼流到向幀存儲(chǔ)器寫出的全部視頻解碼任務(wù)。包括網(wǎng)絡(luò)抽象層、圖像層、條代層(slice layer)、比特流解析、以及熵解編碼,包括在H.264 Main Profile解碼器中進(jìn)行CABAC(Context-Adaptive Binary Arithmetic Coding)解碼。而大多數(shù)其他解決方案都忽略了該功能,或采用獨(dú)立的復(fù)雜且不可編程的" title="可編程的">可編程的硬件模塊,或利用700MHz普通CPU來實(shí)現(xiàn)該功能(這種方法明顯增加功耗)。

?

圖2? Tensilica基于處理器的視頻編解碼架構(gòu)

?

????由于該方案通過運(yùn)用Xtensa處理器的一種特征-細(xì)粒度門控時(shí)鐘再結(jié)合可編程的電源管理指令(可以降低各種負(fù)載情況下視頻處理的功耗),其動(dòng)態(tài)功耗被降至最低。同時(shí),由于大部分任務(wù)由Tensilica視頻引擎完成,不僅避免了對(duì)大體積、大功耗CPU的需求,而且由于很多處理都是在內(nèi)部完成,而不用在總線上進(jìn)行反復(fù)的數(shù)據(jù)交換,從而進(jìn)一步降低了功耗。

????四新品針對(duì)不同應(yīng)用

????Diamond VDO系列包括Diamond 381VDO、Diamond 383VDO、Diamond 385VDO、Diamond 388VDO四款產(chǎn)品,提供Baseline Profile和Main Profile兩種解決方案 –Main Profile提供更佳的數(shù)據(jù)壓縮率和視頻質(zhì)量,是面向高級(jí)手機(jī)和PMP應(yīng)用的D1或者更高分辨率的更好的編解碼機(jī)制。四款Diamond Standard VDO引擎的主要特性如表1所示??蓾M足消費(fèi)類市場(chǎng)中多變的需求。
???
表1 Diamond VDO系列編解碼功能一覽

?


????Diamond VDO雙核架構(gòu)如圖3所示。其中包括基于Xtensa架構(gòu)配置得到的一個(gè)流處理" title="流處理">流處理器和一個(gè)像素處理器。流處理器指令集對(duì)視頻數(shù)據(jù)(熵解碼、運(yùn)動(dòng)向量的預(yù)測(cè)等等)的串行式處理進(jìn)行了優(yōu)化。流處理器需要32K字節(jié)的本地?cái)?shù)據(jù)存儲(chǔ)器,40K本地指令存儲(chǔ)器。其指令的寬度優(yōu)化到32位。像素處理器指令集采用SIMD(單指令多數(shù)據(jù))技術(shù),對(duì)像素?cái)?shù)據(jù)的并行式處理進(jìn)行了優(yōu)化。像素處理器需要40K本地?cái)?shù)據(jù)存儲(chǔ)器,24K本地指令存儲(chǔ)器。處理器之間的內(nèi)部通信是通過一個(gè)128位的直連接口實(shí)現(xiàn)的,而外部視頻引擎接口通信是通過2個(gè)32位的總線實(shí)現(xiàn)的。

????Tensilica在Diamond VDO系列中定義了400多條視頻專用指令,與通用DSP或通用32位微處理器相比,性能顯著提升。這些指令是針對(duì)視頻處理中性能要求苛刻的部分優(yōu)化得到的,這些算法部分包括:CABAC,它可得到H.264 Main profile視頻的更高壓縮效果;CAVLC(Context-adaptive variable-length coding),是一種用于H.264 Baseline Profile和 Main Profile的低復(fù)雜度壓縮算法;Deblocking:去塊效應(yīng),可減少在高壓縮視頻碼流中的由塊效應(yīng)所引起的失真;Transforms:各種變換(H.264中有很多種變換,在這是說支持多種變換)進(jìn)行空間域的壓縮變換,類JPEG處理;運(yùn)動(dòng)補(bǔ)償和運(yùn)動(dòng)估計(jì),用于在低速碼率條件下得到高質(zhì)量畫面的算法。

?

?


??? 圖3?? Diamond 38X VDO雙核架構(gòu)


???????
????獨(dú)特架構(gòu)打造小體積、高靈活性

????從上面分析可以看出,新Diamond VDO引擎相比與基于硬件的視頻加速器和常規(guī)CPU結(jié)合的傳統(tǒng)方式在體積和靈活性方面凸現(xiàn)優(yōu)勢(shì)。首先,Diamond VDO IP核減少了系統(tǒng)主控CPU的全部視頻解碼任務(wù)– 包括全部比特流解析。傳統(tǒng)的硬件加速器僅可減少如運(yùn)動(dòng)估計(jì)那樣的像素處理工作,而將大部分計(jì)算負(fù)擔(dān)(經(jīng)常需要100MHz的持續(xù)的主控CPU開銷)交由系統(tǒng)控制器來完成。

????其次,當(dāng)Diamond VDO引擎沒有被用于進(jìn)行視頻處理時(shí),可隨時(shí)以一種相當(dāng)于有500多 Dhrystone MIPS處理能力的通用CPU 來執(zhí)行其他系統(tǒng)任務(wù) – 相反一個(gè)特定的視頻硬件模塊是不能被重用的。此外,由于Diamond VDO引擎是可編程的,因此可支持今后出現(xiàn)的視頻標(biāo)準(zhǔn)而不必增加硬件或者重新流片。最后,Diamond VDO引擎面積小,其面積在130nm工藝下包括處理器邏輯和內(nèi)部存儲(chǔ)器在內(nèi)僅有8mm2。這對(duì)備受體積困擾的便攜式消費(fèi)類產(chǎn)品無疑意義深遠(yuǎn)。

????此外,為幫助客戶縮短產(chǎn)品開發(fā)時(shí)間,Tensilica還針對(duì)新Diamond VDO引擎開發(fā)了編碼器和解碼器,以及全套與之適配的軟件開發(fā)工具鏈,該開發(fā)工具包括一個(gè)基于ECLIPSE框架的高級(jí)集成開發(fā)環(huán)境、一個(gè)世界級(jí)編譯器、一個(gè)周期精確(cycle-accurate)并兼容SystemC的指令集仿真器、以及完整的工業(yè)標(biāo)準(zhǔn)GNU工具鏈。同時(shí),Tensilica廣泛的合作伙伴網(wǎng)絡(luò)還將提供操作系統(tǒng)、調(diào)試工具、ICE解決方案、以及其他有助于將Tensilica處理器快速設(shè)計(jì)進(jìn)其產(chǎn)品中的支持。

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。

相關(guān)內(nèi)容