文獻標(biāo)識碼: A
文章編號: 0258-7998(2011)09-139-03
網(wǎng)絡(luò)視頻監(jiān)控是一種基于寬帶網(wǎng)絡(luò)為用戶提供圖像和各種報警信號遠程采集、傳輸、儲存、處理等功能的全新電信業(yè)務(wù)。這是一個由前端、中間端、后端三部分組成的網(wǎng)絡(luò)視頻監(jiān)控系統(tǒng)。其中解碼模塊將收到的完整數(shù)據(jù)幀放入解碼器中進行解碼,生成實時視頻影像。
H.264是繼MPEG4之后的新一代數(shù)字視頻壓縮格式,它既保留了以往壓縮技術(shù)的優(yōu)點和精華,又具有其他壓縮技術(shù)無法比擬的優(yōu)點。H.264最具價值的部分是更高的數(shù)據(jù)壓縮比。在同等的圖像質(zhì)量條件下,H.264的數(shù)據(jù)壓縮比能比當(dāng)前DVD系統(tǒng)中使用的MPEG-2高2~3倍,比MPEG-4高1.5~2倍。正因為如此,經(jīng)過H.264壓縮的視頻數(shù)據(jù),在網(wǎng)絡(luò)傳輸過程中所需要的帶寬更少,也更加經(jīng)濟。所以本系統(tǒng)選擇采用H.264格式視頻。
DirectX軟件開發(fā)包是微軟公司提供的一套在Windows操作平臺上開發(fā)高性能圖形、聲音、輸入、輸出和網(wǎng)絡(luò)游戲的編程接口。可以用來開發(fā)游戲以及作為其他各類多媒體應(yīng)用程序的底層API函數(shù)集。它是一種基于COM的系統(tǒng),既不屬于驅(qū)動程序?qū)樱膊粚儆趹?yīng)用程序?qū)?。作為DirectX的一個COM組成元素,Directshow應(yīng)用程序編程接口是一個Windows平臺上的流媒體架構(gòu),提供各種格式的高品質(zhì)多媒體流的捕獲、處理、傳送和回放。Directshow集成了DirectX其他組件中的先進技術(shù),能做到自動檢測、使用視頻和音頻硬件加速設(shè)備。它不僅支持基于WDM驅(qū)動程序的硬件設(shè)備,也向上兼容Video for Windows驅(qū)動程序的硬件設(shè)備。Directshow采用多線程多任務(wù)的方式,還支持寬松的格式變化。Directshow為播放視頻監(jiān)控中涉及到的各種類型的音頻、視頻數(shù)據(jù)提供了非常有效的途徑。因此本系統(tǒng)采用Directshow來實現(xiàn)視頻監(jiān)控系統(tǒng)中H.264視頻的解碼。
1 Directshow體系結(jié)構(gòu)
Directshow基于模塊化結(jié)構(gòu),每個功能模塊都采取COM組件方式,稱為Filter。Filter負責(zé)執(zhí)行一些多媒體流的處理過程,采用Filter Graph模型來管理整個數(shù)據(jù)流的處理過程。Directshow的體系結(jié)構(gòu)圖如圖1所示。它通過提供各種功能的Filter完成總體應(yīng)用框架的工作,從而使多媒體應(yīng)用程序設(shè)計變得簡單。每個Filter都分別具有一個不同的應(yīng)用功能,F(xiàn)ilter之間通過Pin相互連接。每個過濾器都擁有屬于自己的針腳。針腳分為輸入針腳和輸出針腳,輸入針腳把過濾器外部的數(shù)據(jù)接收到過濾器中進行處理,輸出針腳把過濾器中處理后的數(shù)據(jù)傳送到下一個過濾器。經(jīng)過輸入輸出針腳的傳遞,數(shù)據(jù)從一個過濾器傳送到了下一個過濾器中。當(dāng)兩個pin連接的時候,必須有一個pin提供一個allocator。Directshow定義了一系列函數(shù)調(diào)用來確定由哪個pin提供allocator,以及buffer的數(shù)量和大小。在數(shù)據(jù)流開始之前,allocator會創(chuàng)建一個內(nèi)存池pool of buffer,在開始發(fā)送數(shù)據(jù)流以后,源Filter就會將數(shù)據(jù)填充到內(nèi)存池中一個空閑的buffer中,然后傳遞給下一個的Filter。
1.1 Filter的原理
Directshow技術(shù)的最核心就是作為過濾器的可插入標(biāo)準(zhǔn)組件,它是具有特殊功能的COM對象。過濾器又可分為:源過濾器(Source Filter)、變換過濾器(Trans-form Filter)、提交過濾器(Renderer Filter)等。源過濾器引入數(shù)據(jù)到過濾器圖表中,數(shù)據(jù)來源可以是文件、網(wǎng)絡(luò)、照相機等。不同的源過濾器處理不同類型的數(shù)據(jù)源,然后將數(shù)據(jù)往下傳輸;變換過濾器的工作是獲取輸入流,處理數(shù)據(jù),并生成輸出流,其對數(shù)據(jù)的處理包括編解碼、格式轉(zhuǎn)換、壓縮解壓縮等;提交過濾器主要負責(zé)數(shù)據(jù)的最終去向,接收數(shù)據(jù)并把數(shù)據(jù)提交給外設(shè)。Directshow使Filter Graph Manager中的Filter按一定的順序連接成一條“流水線”協(xié)同工作,F(xiàn)ilter Graph的結(jié)構(gòu)如圖2所示。過濾器通過文件讀寫、修改數(shù)據(jù)和顯示數(shù)據(jù)輸出設(shè)備來操作流媒體。為了完成整個任務(wù),必須將所有的過濾器Filter連接起來。應(yīng)用程序只需要通過COM接口訪問過濾器圖表、控制流媒體或者接收過濾器事件來完成視頻的播放。
1.2 COM組件
Directshow是基于COM系統(tǒng)的開發(fā)包。而COM組件對象模型是一種軟件架構(gòu),它定義了不同的對象使用一致同意的協(xié)議進行通信的一套機制。所有的COM對象都支持相同的接口規(guī)范,這使得COM對象可以不依賴于具體的語言和系統(tǒng)平臺。每個COM都至少有一個接口,這里所說的接口是指一套函數(shù)和它們參數(shù)的定義。每個COM有它自己的GUID-CLSID,每個接口也有它自己的GUID-IID。GUID是一串128 bit數(shù)字,由專門的程序產(chǎn)生,可以保證每個GUID的全球唯一性。當(dāng)知道了一個COM的CLSID和它的接口IID,就可以用CoCreateInstance函數(shù)來實例化該COM對象的其他接口,可用該接口的IID作參數(shù),調(diào)用QueryInterface查詢接口函數(shù)來完成[1]。得到COM的接口后,就可以用它訪問該接口的一些函數(shù)。
2 Directshow的應(yīng)用
本系統(tǒng)采用VC++6.0開發(fā)多媒體應(yīng)用程序,開發(fā)應(yīng)用程序之前先要配置開發(fā)和編譯環(huán)境,在寫應(yīng)用程序時要包含頭文件Dshow.h并連接到庫文件strmbased.lib;在VC++的Library和Include中要加入DirectX SDK中的Lib和Include文件,并且放在標(biāo)準(zhǔn)的VC目錄之前[2]。利用Directshow開發(fā)應(yīng)用程序的步驟 :(1) 創(chuàng)建Source Filter、
Trans-form Filter、Renderer Filter; (2) 創(chuàng)建FilterGraph管理各個Filter,并且負責(zé)和應(yīng)用程序交互實現(xiàn)播放控制等。
由于Directshow使用COM技術(shù)實現(xiàn),首先要調(diào)用CoInitialize函數(shù)進行初始化。接著創(chuàng)建用于組建過濾器的過濾器組件管理器和Capture -GraphBuilder組件,定義接口指針并獲取接口[3]。
2.1 COM對象的創(chuàng)建
COM對象的創(chuàng)建要經(jīng)過以下步驟:
(1) CoCreateInstance調(diào)用CoGetClassObject函數(shù);
(2) COM庫找到DLL程序并進入進程;
(3) 調(diào)用DLLGetClassObject函數(shù);
(4) DLLGetClassObject函數(shù)創(chuàng)建類工廠;
(5) DLLGetClassObject把類工廠接口指針返回給CoGetClassOjbect函數(shù);
(6) CoGetClassObject把類工廠接口指針返回給CoGetClassObject函數(shù);
(7) CoCreateInstance得到類工廠后,調(diào)用類工廠的對象創(chuàng)建函數(shù);
(8) 類工廠創(chuàng)建COM對象;
(9)類工廠把COM對象返回給CoCreateInstance函數(shù),CoCreateInstance函數(shù)返回;
(10) 客戶直接調(diào)用COM對象。
2.2 開發(fā)DirectShow一般過程
(1) 創(chuàng)建一個Filter Graph Manager
IGraphBuilder *pGraph=NULL
HRESULThr=CoCreateInstance(CLSJD_FilterGraph, NULL,CLSCTX_INPROC_SERVER,IDD_IGraphBuilder,(void**)& pGraph)
(2) 根據(jù)實際應(yīng)用,創(chuàng)建一條完整的Filter鏈路。
(3) 調(diào)用Filter Graph Manager上各個接口的方法進行控制,并且完成Filter Graph Manager 與應(yīng)用程序的事件交互。調(diào)用ImediaControl接口的方法控制Filter Graph的狀態(tài)轉(zhuǎn)換:
IMediacontol *pControl=NULL
hr=pGraph->QueryInterface(IID_IMediaControl,(void**)&pControl)
hr=pControl->Run()
2.3媒體類型的檢測
當(dāng)兩個Filter連接的時候,它們會采用某一種媒體類型達成一致的協(xié)議。媒體類型定義了處于源頭的Filter將要給下一個與其相連接的Filter發(fā)送什么樣的數(shù)據(jù),以及數(shù)據(jù)的physical layout。兩個Filter必須支持同一種類型的媒體格式[4]。
3 解碼器設(shè)計
在Directshow環(huán)境中播放一個H.264格式的文件,需要一個能夠?qū).264格式的壓縮視頻進行解碼的解碼器。由于Directshow沒有提供H.264的解碼Filter,所以H.264視頻解碼器需要自行開發(fā)。
3.1 Filter的設(shè)計
為了實現(xiàn)H.264視頻解碼器,可設(shè)計一個名為H264 Decoder的Transform Filter,包含一個出pin、一個輸入pin,用于接收H.264的視頻流輸入,解碼后輸出YUV格式的圖像幀序列。
Filter的注冊名:“H.264 Decoder”
Filter類型:Transform Filter
CLSID:CLSID_FilterH.264
Merit值:MERIT_DO_NOT_USE
此Filter的功能是接收視頻流的輸入,解碼后輸出YUV格式的圖像幀序列。而輸入輸出視頻流是通過不同功能的Filter連接完成的。Filter的連接實際上是Filter上pin的連接,連接的方向一般是從上一級Filter的輸出pin指向下一級Filter的輸入pin。只有兩個Filter都在Graph里,連接才能成功。應(yīng)用程序可以通過IFilterGraph::AddFilter將Filter添加Graph中,當(dāng)一個Filter被添加到graph中時,F(xiàn)ilter圖標(biāo)管理器通過IbaseFilter::JoinFilterGraph來通知Filter。pin連接的過程為:
(1) Filter Graph Manager表管理器首先調(diào)用輸出pin上的IPin::Connect;
(2)如果輸出pin接受連接,就調(diào)用輸入pin上的IPin::ReceiveConnection;
(3) 如果輸入pin也接受連接,則雙方連接成功。
從Directshow的基類繼承得到Filter以實現(xiàn)一個獨立的線程,專門用于H.264的解碼輸出。在輸入pin上實現(xiàn)媒體類型檢查(CheckMediaType)。
HRESULT CheckMediaType(const CMediaType *mtOut)
{if(mDecodeFilter->mMpegInputPin->IsConnerted())
{if((mtOut->subtype==MEDIASUBTYPE_YUV||mtOut->subtype==MEDIASUBTYPE_RGB24)&&mtOut->formattype==FORMAT_VideoInfo)
{VIEDEOINFOHEADED*pFormat=(VIDEOINFOHEADER*)mtOut->pbFormat;
if(pFormat->bmilteader.biHeight==mDecodeFilter->mImageHeight&&pFormat->bmiHeader.biWidth==mDecodeFilter->mImageWidth)
{ return S_OK}
}
}
Return E_FAIL
}
3.2基類的選擇
可以選擇的基類有:CTransformFitler、CTransInPlaceFilter、CVideoTransformFilter、CBaseFilter。當(dāng)Filter的輸入pin接收數(shù)據(jù)后,經(jīng)過一定的處理由輸出pin再輸出數(shù)據(jù),一般選擇CTransformFilter或者CTransInPlaceFilter。由于在Filter上的兩個pin要求的媒體類型互不相同,而CTransInPlaceFilter的輸入和輸出pin上一般使用相同的媒體類型進行連接,并且使用相同的Sample管理器,所以這個Filter不適合用CTransInPlaceFilter。而CBaseFitler是個一最基本的類,需要做比其他的基類更多的工作。此視頻解碼Filter最后選擇了CTransformFilter類。
CTransformFilter類是從CBaseFilter繼承而來,其最大特征是將pin上必須實現(xiàn)的函數(shù)委托到了Filter上。一般不需要重新寫輸入和輸出pin類,只需要在Filter上實現(xiàn)相應(yīng)的函數(shù)即可。CTransformFilter類使用時需要重載函數(shù):
CTransformFilter::CheckInputType
CTransformFilter::CheckTransform
CTransformFilter::DecideBufferSize
CTransformFilter::GetMediaType
CTransformFilter::Transform
由于微軟公司推出的Directshow沒有提供H.264的視頻解碼器。因此本文還需要使用ffmpeg中提取出的、經(jīng)過優(yōu)化的H.264視頻解碼組件。
本系統(tǒng)采用Directshow設(shè)計了H.264視頻的解碼器,并且利用ffmpeg提取出了H.264解碼代碼,實現(xiàn)了H.264視頻的解碼播放,如圖3所示。
參考文獻
[1] 潘愛民.COM原理與應(yīng)用[M].北京:清華大學(xué)出版社,1999.
[2] 陸其明.Directshow開發(fā)指南[M].北京:清華大學(xué)出版社,2003.
[3] 陸其明. Directshow實務(wù)精選[M]. 北京:科學(xué)出版社,2004.
[4] 侯春明.MPEG-2視頻解碼器在Directshow中的實現(xiàn)[J].計算機技術(shù)與自動化,2007(4):86-88.