數(shù)字電視原理第四章_第1頁
數(shù)字電視原理第四章_第2頁
數(shù)字電視原理第四章_第3頁
數(shù)字電視原理第四章_第4頁
數(shù)字電視原理第四章_第5頁
已閱讀5頁,還剩108頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、數(shù)字電視原理第4章 數(shù)字圖像緊縮編碼的國際規(guī)范第4章 數(shù)字圖像緊縮編碼的國際規(guī)范 前面我們討論了數(shù)字圖像數(shù)據(jù)緊縮的必要性、能夠性和可行性。討論了數(shù)字圖像壓縮的根本原理,但是從軟硬件如何實現(xiàn),從工程上如何實現(xiàn)還未展開討論。要做到工程實現(xiàn),還有許許多多地技術問題。第4章 數(shù)字圖像緊縮編碼的國際規(guī)范 首先,制定規(guī)范的問題。 為了使先進的圖像數(shù)據(jù)緊縮技術和高性能的數(shù)字圖像處置技術獲得更廣泛的運用,必需對圖像緊縮編碼技術建立一個能在全世界范圍通用的規(guī)范規(guī)范。第4章 數(shù)字圖像緊縮編碼的國際規(guī)范實現(xiàn)規(guī)范化的目的: 處置后的數(shù)據(jù)信號才干在一樣性能目的和一樣容量的數(shù)據(jù)網(wǎng)絡中傳送或儲存設備中儲存; 世界各國設備消

2、費廠家的產品才具有兼容性和通用性; 才干投入大批量開發(fā)消費,大幅度降低產品本錢,才干使圖像數(shù)據(jù)緊縮技術得到迅速應用和推行。實現(xiàn)圖像緊縮編碼技術規(guī)范化的國際組織 國際規(guī)范化組織(ISO) 國際電報咨詢委員會(CCITT) 國際電工委員會(IEC) 結合圖片專家組(JPEG) 活動圖像專家組(MPEG) 常見數(shù)字圖像緊縮編碼的規(guī)范一,H.261規(guī)范、H.264規(guī)范、H.263建議;二,MPEG1、MPEG2、MPEG4、 MPEG7、MPEG21;三,JPEG、 JPEG2000;四,我國擁有自主知識產權的AVS; 規(guī)范產生的背景傳輸?shù)男诺溃?規(guī)范的運用場所; 規(guī)范的編碼、解碼的過程; 圖像數(shù)據(jù)的

3、組織; 規(guī)范的特點及相互比較;常見數(shù)字圖像緊縮編碼的國際規(guī)范 H261規(guī)范,通常稱為p64規(guī)范。主要用于可視和電視會議的聲像業(yè)務,已于1990年由CCITT完成并經過。 JPEG規(guī)范,其目的是對靜止彩色圖片實現(xiàn)數(shù)據(jù)緊縮,主要用于衛(wèi)星圖片的傳輸與儲存,圖像文獻資料處置與儲存,新聞圖片、彩色印刷圖片的傳輸與儲存等,此規(guī)范于1991年由JPEG完成并經過。 常見數(shù)字圖像緊縮編碼的國際規(guī)范 MPEG規(guī)范的目的是對高質量全彩色活動圖像實現(xiàn)緊縮規(guī)范化,使經過緊縮和解碼復原后的圖像質量到達廣播電視的質量目的,同時要求對伴音的聲音數(shù)據(jù)進展緊縮處置和傳輸。該規(guī)范已于1992年完成并經過,目前已有MPEG1、MP

4、EG2、MPEG4、MPEG7、MPEG21、H26I及H264等多種規(guī)范。 41 H261規(guī)范 411 H261規(guī)范的由來與用途 H261規(guī)范方案的開發(fā)目的是利用CCITT(Consultative Committee on International Telephone and Telegraph)引薦的綜合業(yè)務數(shù)據(jù)網(wǎng)絡(ISDN)一次群即基群通道,來實現(xiàn)可視和電視會議數(shù)字圖像信號的實時傳送。 在當時的條件下,互聯(lián)網(wǎng)和光纖通訊還沒有開展到現(xiàn)代的程度,實現(xiàn)圖像數(shù)據(jù)的傳輸還得依托傳統(tǒng)的通訊網(wǎng),語音通訊信道的帶寬還不能滿足圖像數(shù)據(jù)的實時傳輸?shù)囊?,為此將多路語音通訊話路并行運用。傳統(tǒng)的語音通訊信

5、道的特點: 一次群通道容量(北歐規(guī)范)為2048kbs,包含32路數(shù)字信號,每路數(shù)字信號的數(shù)據(jù)位率為 2048kbs3264kbs,此數(shù)值稱為根本通道位率,以B表示。 起初,CCITT引薦圖像緊縮規(guī)范為 m384kbs, m15。 傳統(tǒng)的語音通訊信道的特點: 384kbs是來自6B=664kbs=384kbs,稱為H0通道。當m5時,那么數(shù)據(jù)位率為 m384kbs5H056B1920kbs,這相當于30路數(shù)字的最高位率。 由于選384kbs位率作為起點太高,于1988年CCITT經過了p64kbs ( p=1,2,30 )視音頻編碼規(guī)范。最后,又把p擴展到32,故緊縮后的最高位率不應超越326

6、4kbs。這實踐上又達到了數(shù)據(jù)綜合業(yè)務網(wǎng)絡(ISDN)一次群的最高位率,約為2Mbs。該規(guī)范于1990年完成,并由CCITT正式引薦為H261規(guī)范,簡稱p64規(guī)范。 國際電報咨詢委員會CCITT于1985年開場制定H261規(guī)范,這個建議主要針對會議電視、可視等運用,且當時思索到H261規(guī)范面臨世界上兩種不同電視的掃描行數(shù)與幀數(shù)的規(guī)范,即52530和62525兩種互不兼容的規(guī)范問題, CCITT為H261找出一種通用的中間格式CIF(Common Intermediate Format),這樣一來,62525和52530都可以經過預處置和后處置模塊轉換到CIF或從CIF轉換而來。 1會議電視 會

7、議電視是經過電信網(wǎng)絡將遠在各地的多個會議點銜接起來,以互送聲音和圖像的方式召開會議的一種通訊方式。該方式還可傳送文件和圖表及計算機數(shù)據(jù)文件,使遠在各地的與會者好似在同一個會議室開會。會議電視不僅可用于開會,還可運用在遠程教育、遠程醫(yī)療診斷及遠程監(jiān)控等許多領域中。會議電視既節(jié)約時間和資金,又大大提高了工作效率。2可視 1964年美國貝爾實驗室首先研制勝利Picturephone I型,以后日本、法國等國家先后研制出可視,但由于這些可視均采用模擬傳輸方式,占用頻帶寬,傳輸本錢高,很長一段時間未能得到開展。 20世紀80年代以來,圖像緊縮編碼技術的快速開展,同時促進了可視的安康開展。1986年美國I

8、BM公司研制成在PSTN網(wǎng)上傳送黑白靜止圖像的可視機,日本也相繼研制勝利此類的可視機,并于1988年制定了日本TTC電報技術委員會規(guī)范。繼MPEG1及MPEG2緊縮編碼標準發(fā)布之后,于1995年11月ITU發(fā)布了低數(shù)碼率視頻編碼的H263建議。它是能將圖像信號緊縮到64kbs以內數(shù)碼率的緊縮編碼方案,使可視在共用交換網(wǎng)(PSTN)中傳輸成為能夠。符合H263建議的可視已進入商用。2可視 在互聯(lián)網(wǎng)已進入家家戶戶的今天,利用PC機進行緊縮編碼及顯示終端組成的可視也已進入市場QQ視頻,能完成圖像及聲音緊縮編解碼及復用功能的單片集成電路曾經消費,這無疑為可視的普及發(fā)明了極好的條件。 3綜合業(yè)務數(shù)字網(wǎng)(

9、ISDN) ISDN(綜合業(yè)務數(shù)字網(wǎng))又稱“一線通業(yè)務,它把多種數(shù)字業(yè)務綜合在一個網(wǎng)內處置并傳輸。 ISDN分為兩種方式, 窄帶NISDN,為2Mbs以下,通常上網(wǎng)速率到達128kbs。 寬帶BISDN,為2Mbs以上。BISDN將以一致的交換與傳輸方式支持網(wǎng)內從遙控遙測幾bs到高明晰度電視HDTV100Mbs150Mbs的業(yè)務,并且用光纖傳輸替代了現(xiàn)有的主干線電纜傳輸。 3綜合業(yè)務數(shù)字網(wǎng)(ISDN) ISDN可把、數(shù)據(jù)、可視、會議電視等綜合在一個通訊網(wǎng)內實現(xiàn),凡參與了這個網(wǎng)的用戶,都可實現(xiàn)只用一對線銜接不同的終端進展不同類型的業(yè)務通訊,簡言之,BISDN就是多業(yè)務便利數(shù)字化終端挪動終端互換性

10、費用低。 3綜合業(yè)務數(shù)字網(wǎng)(ISDN) H261主要用于ISDN綜合業(yè)務數(shù)字網(wǎng)上進展電視會議傳輸,當p1或2時,只支持QCIF(Quarter Common Intermediate Format)格式。64kbs中圖像為40kbs,余下的給聲音。對于CIF格式,一幅圖像的有效像素點按幾何位置分為12個塊組,每塊組分33個宏塊,每個宏塊包含4個亮度塊及色差各1個,每塊那么由88的像素組成。CIF和QCIF最大幀率為30實踐是29.97幀秒,即最高圖像速率30000100129.9730。當每像素為8bit時,碼率分別為36.5Mbs和9.1Mbs,在64Kb/s或2.048Mbs上傳輸,必需緊

11、縮。留意計算412 H26l圖像亮色信號像素與子像塊 H261規(guī)范圖像層次構造 H261規(guī)范CIF格式規(guī)定了圖像亮度信號每行352個像素,縱向為288個像素;而色差Cb、Cr的縱橫像素數(shù)分別為亮度的一半,如圖41所示。QCIF各參數(shù)為CIF的一半。圖41 CIF格式亮度與色度取樣H261規(guī)范圖像層次構造 實踐圖像數(shù)據(jù)的組織 QCIF各參數(shù)為CIF的一半。同一格式其幀率和比特率64kbits為基準并非是固定的,后者的量正比于前者。在H261規(guī)范中,把一幅幀圖像數(shù)據(jù)分為四個層次構造:幀層、塊組層、宏塊層和塊層。假設選用CIF格式,那么一幀圖像包含12個塊組,橫向2個,縱向6個;選QCIF,一幀含3

12、個縱向的塊組。這種H261規(guī)范圖像的層次構造如圖42所示。(兩個色差分別為一個宏塊) 圖42 H261規(guī)范圖像的亮度層次構造4. 1. 3 H261的CIF宏塊特點與數(shù)據(jù)構造 H261的CIF一個宏塊包括4個亮度像塊和色差各1個像塊,共6個像塊。在宏塊中亮度與色差在同一像區(qū)時,由于Y像塊數(shù)目為色差的4倍,故一個亮度像塊的面積是一個色度的14,相反一個色差像素的面積是亮度的4倍。H261的CIF宏塊構造如圖43所示,該圖的構造對其他規(guī)范的宏塊也有借鑒意義。亮度 色度圖43 H261的CIF宏塊構造相當于420的采樣格式第n行4:2:2第n1行 4:0:0圖43 H.261的CIF宏塊構造YUVY

13、宏塊是運動估值和運動補償?shù)母締挝?,也是視頻處置及編輯的根本單位。H261(p64khjs)數(shù)據(jù)構造如圖44所示。圖44 H.261p64kb/s數(shù)據(jù)構造H.261數(shù)據(jù)構造闡明:1幀標題包括起始碼,編碼格式CIF/QCIF幀編號及其它信息,20bit fixed length。2塊組GOB:Groups of Block標題包括塊組起始碼,塊組位置編號及其它信息。3第三行的宏塊標題包括宏塊地址、幀內幀間標志、量化步長、能否有環(huán)路濾波消除運動補償?shù)母哳l噪聲、能否有運動估值及其它附加信息。4第四行為塊層構造,包含DCT變換系數(shù)、編碼的碼流,最后是一個塊終了的定長碼End of Block。構成一幅

14、圖像詳細的碼流即數(shù)據(jù)流由復用編碼器完成。至于CCITT H.261編碼器構造框圖如圖45所示。圖45 H261編碼器構造框圖量化濾波器運動估計運動補償幀內,幀間選擇緩沖存儲器信道編碼414 H261運動補償范圍與H263根本特點 運動補償(MC)單元是使幀間差最小,運動估計(ME)的任務過程是從當前輸入圖像中取一個宏塊如1616亮度像素面積并在其上一幀編碼圖像中搜索,搜索的大小在程度和垂直方向上都是15個像素數(shù)。通常只對亮度信號作ME,但MC既要對亮度,也要對色度亮度像素位移的一半,即矢量的長度減半進展。處理方法是:鑒于MC的過程僅僅是逼近,尤其是高頻成分對新編碼的圖像數(shù)據(jù)匹配很差,所以在MC

15、后面用一個空間濾波器Loop Filter,它是一個低通濾波器,其作用是去掉匹配很差的分量,可以按宏塊切入或切出,它只在檢測到非零MV時才切入。414 H261運動補償范圍與 H263根本特點 運動補償(MC)單元是使幀間差最小,運動估計(ME)的任務過程是從當前輸入圖像中取一個宏塊如1616亮度像素面積并在其上一幀編碼圖像中搜索,搜索的大小在程度和垂直方向上都是15個像素數(shù)。通常只對亮度信號作ME,但MC既要對亮度,也要對色度亮度像素位移的一半,即矢量的長度減半進展。處理方法是:鑒于MC的過程僅僅是逼近,尤其是高頻成分對新編碼的圖像數(shù)據(jù)匹配很差,所以在MC后面用一個空間濾波器Loop Fil

16、ter,它是一個低通濾波器,其作用是去掉匹配很差的分量,可以按宏塊切入或切出,它只在檢測到非零MV時才切入。42 JPEG規(guī)范 彩色圖像編碼規(guī)范化任務是由國際規(guī)范化組織(ISO)開場制定的,其目的是用現(xiàn)有的64kbs通訊網(wǎng)絡來傳送滿足一定要求的規(guī)范靜止數(shù)字圖像信號。把每個彩色像素用1比特的數(shù)據(jù)表達時,應能獲得足夠理想的彩色圖像質量。于是,1986年ISO組織與CCITT結合組成了結合圖片專家組JPEG(Joint Photographic Experts Group),研討延續(xù)色調包括灰度和彩色的靜止圖像緊縮算法的國際規(guī)范(1987年又參與了國際電工委員會IEC),JPEG規(guī)范于1992年正式

17、經過。在JPEG的努力下,該規(guī)范已運用到彩色、彩色印刷及新聞圖片等靜止圖像的緊縮與傳輸。42 JPEG規(guī)范 按照JPEG引薦的規(guī)范,包括以下兩種根本壓縮算法: (1)以離散余弦變換(DCT)為根底的有損緊縮算法,即不可逆的緊縮方式,其緊縮比較高,是JPEG規(guī)范及其他許多規(guī)范的根底,運用最廣。 (2)以二維差值預測脈沖編碼(DPCM)為根底的可逆緊縮編碼方式,該方式解碼后能完全準確地恢復原圖像采樣值,其緊縮比低于有損緊縮方式的緊縮比。42 JPEG規(guī)范JPEG還包括多種任務方式: (1)順序方式。在該方式中每一個圖像分量按從左到右、從上到下的順序被掃描,一次掃描完成編碼。實踐運用中最多的是有損緊

18、縮的順序方式。 42 JPEG規(guī)范 (2)累進方式。該方式中的每一幅圖像的編碼要經過多次掃描才干完成,因此為到達累進的目的,在量化器的輸出端即熵編碼前添加一個足夠大的圖像緩沖區(qū),用于存儲量化后DCT系數(shù),這些系數(shù)在多次掃描中分批地編碼,即第一次掃描只對主要系數(shù)進展一次粗緊縮編碼,接納端可以在較短的時間內重建一幅質量較低的可識別圖像。在隨后的掃描中再傳送添加信息即細節(jié)信息,進而可重建一幅質量更高的圖像,以此不斷累進,直到到達稱心的圖像質量為止。42 JPEG規(guī)范 (3)可分級方式。分級編碼方式是對原始圖像空間分辨率分成多個分辨率進展錐形的編碼,其程度方向和垂直方向分辨率的下降以2的倍數(shù)改動。在信

19、道傳送速率慢、接納端顯示器分辨率不高的情況下,只需進展低分辨率圖像解碼,就不用進展高分辨率解碼。可見,該方式與累進方式一樣,適宜因特網(wǎng)的動態(tài)帶寬傳輸不同質量圖像的編碼特點。 42 JPEG規(guī)范421 JPEG的有損順序緊縮編碼方案 圖46所示的就是一個基于DCT的JPEG有損順序緊縮編解碼系統(tǒng)框圖。圖46 JPEG有損順序緊縮編解碼系統(tǒng)框圖42 JPEG規(guī)范JPEG編解碼算法主要有以下幾個主要步驟: 第一步:DCT變換。輸入端把符合JPEG編碼規(guī)范的亮度數(shù)字信號和兩個色差數(shù)字信號分別有順序地分成88像素塊之后,送入DCT變換器中,目的是消除空間冗余。在進展DCT變換之前,將R、G、B信號按JP

20、EG規(guī)范的信號計算公式導出亮度信號和色差信號,計算公式為: 由于色差信號有正有負,故先將電平上移50,即各加0.5,目的是使Cr和Cb值均為正值。這樣,數(shù)字化后的Y、Cr,和Cb,均在0255之間,便于降低傳輸碼率。解碼端再下移50(相當于128級電平),即可恢復出原有的色差信號。 第二步:量化。利用人眼的視覺特性設計量化表,JPEG規(guī)范為此在大量的實驗和視覺統(tǒng)計的基礎上,引薦了亮度信號和色度信號兩種量化表,分別如表42和表43所示。表42 亮度量化表Q(u,v) 表43色度量化表Q(u,v)第三步:Z形掃描與熵編碼。 結合例題進展分析422 基于DCT的量化例【3一l】,設一個亮度大小為88

21、的塊圖像信號,其取樣值f(x,y)為:利用下式對f(x,y)實施DCT變換。得到大小為88的頻率信號F(u,v)為:利用亮度量化表Q(u,v)表42 1611101624405161121214192658605514131624405769561417222951878062182237566810910377243555648110411392496478871031211201017292959811210010399uv 留意取整式中 表示小于x的最大整數(shù),而且上述公式舍入到最接近的整數(shù)。例如: round(816)round(05)1; round(716)round(04375)0

22、 round(815)round(0533)1; round(715)round(0466)0423 基于DCT的游程編碼 所謂游程長度編碼是指一個碼可以同時表示碼的值和前面有幾個零,這樣就發(fā)揚“之字型(或稱Z型)讀出的優(yōu)點。由于“之字型讀出,出現(xiàn)連零的時機比較多,特別到最后,假設都是零,在讀到最后一個數(shù)后,只要給出“塊終了EOB(End of Block)碼,就可以終了輸出,因此節(jié)省了很多碼率。 按照前面的例題有:其游程編碼的順序為(39,3,2,1,1,1,0,0,0,0,0,1,EOB),解碼端收到EOB后自動補0,直到補足64個系數(shù)為止。 在實施可變長操作時,也可以表示為39,3,2,

23、1,1,1,50,1,520。 250,30,20,10,10,15,1EOB圖48 RLC碼字的構成4. 3 MPEG1規(guī)范 隨著數(shù)字技術與計算機技術的開展,計算機網(wǎng)絡的開展,迫切需求把計算機系統(tǒng)與廣播電視結合起來建立一個包括各種終端在內的一致的信息網(wǎng)絡,即多媒體網(wǎng)絡。 H.261是基于線路交換的, MPEG主要是基于互聯(lián)網(wǎng)的。 1 9 9 2年完成了緊縮碼率達1.0 Mbs1.5 Mbs的MPEG-1規(guī)范方案, 1 9 9 3年初提出的緊縮碼率在4 Mbsl 0M bs的MPEG-2規(guī)范。4. 3 MPEG1規(guī)范 MPEG-1規(guī)范的目的主要包括以下幾個方面: (1)在聲像質量上高于電視或電

24、視會議的聲像質量,至少應到達V H S錄像機或CD-ROM的放像質量。 (2)緊縮后的數(shù)據(jù)量能存儲在光盤、數(shù)字錄音帶或可改寫光盤等媒體中。 (3)緊縮后的數(shù)據(jù)率與目前的計算機網(wǎng)絡傳輸碼率相匹配,即以1.2 Mbs為宜。 (4)在通訊網(wǎng)絡上該規(guī)范能順應多種通訊網(wǎng)絡的傳輸。 (5)該規(guī)范充分思索到更廣泛的運用領域,例如電子圖像出版物、電子圖像雙向傳送、電子圖像編輯及雙向電子圖像通訊等。 規(guī)范產生的背景傳輸?shù)男诺繦.261 PSTN(ISDN) p64kb/sp:13264kb/s2.048Mb/sMPEG-1 方便計算機處置 互聯(lián)網(wǎng)傳輸 多種通訊網(wǎng)絡 1Mb/s1.5Mb/s (1.2Mb/s)規(guī)

25、范的運用場所H.261 MPEG1低質量視頻,可視 視頻會議圖像格式: CIF、QCIF 非隔行 352288 30/s中等質量視頻, VCD或CD-ROM 會議電視、遠程醫(yī)療圖像格式: CIF 352288 25/s SIF 352240 30/s兩者具有一樣的象素速率 留意:象素速率、碼率、緊縮率、編碼率的計算規(guī)范的編碼、解碼的過程;H.261 MPEG1DCT,量化,熵編碼游程編碼,運動補償預測編碼MPEG1是在H.261根底上開展起來的編碼方法根本一樣,主要區(qū)別在于將圖像幀分為I、P、B幀,對于不同的圖像幀采用不同的緊縮處置方法,進一步提高緊縮比。圖像數(shù)據(jù)的組織H.261 MPEG1運

26、動圖像序列層幀組層幀層塊組層宏塊層塊層幀層塊組層宏塊層塊層與H.261規(guī)范類似規(guī)范的特點及相互比較 MPEG1規(guī)范是在H.261規(guī)范根底上開展起來的,在很多方面存在類似的地方。詳細的差別見前面的內容。4. 3 MPEG1規(guī)范表47 MPEG一1的兩種圖像編碼格式 圖像格式SIFCIF掃描參數(shù)525行60場2:1,4:3625行50場2:1,4:3亮度有效像素數(shù)240行幀,352像素行288行幀,352像素行色度有效像素數(shù)120行幀,176像素行144行幀,176像素行像素速率38016 M像素s編碼率0316 bit像素8比特量化后的碼率304128 MbS光盤中每幀字節(jié)數(shù)5千字節(jié)幀6千字節(jié)幀

27、表48 CCIR601、MPEG-1和H.261視頻格式比較CCIR601MPEG-1H.261FormatPALNTSCSIFCIFQCIFFrames/s25/I30/I25/P30/P29.97/PLines/frameY576480288240288144Cr Cb28824014412014472Pixels/lineY720360352176Cr Cb36018017688IInterleave Scanning , PProgressive Scanning4. 3 MPEG1規(guī)范由表47可見,MPEG一1有如下特點: (1)像素速率: 30幀每秒的格式為(352240+2176

28、120)303.8016M像素每秒; 25幀每秒的格式為 (352288+2176144)253.8016M像素每秒。兩者具有一樣的像素速率。4. 3 MPEG1規(guī)范 (2)8 bit量化后的碼率:像素速率8 bit象素3.8016M像素每秒8 bit象素30.4128 Mbs。假設在計算機網(wǎng)絡中傳輸,按照網(wǎng)絡傳輸容量為1.2 Mbs計算,那么必需的緊縮比為30.128Mbs1.2Mbs=25.2。這是理想的緊縮比,思索到實踐情況需加輔助信息,故緊縮比應更高。 (3)編碼率:它代表經過編碼后平均每個像素所用的比特數(shù),闡明了緊縮的程度。編碼率等于傳輸碼率像素速率1.2 Mbs3.8016 M像素

29、每秒0.316bit像素。即量化后的每像素用8bit編碼,而經緊縮后每個像素僅用0.316bit編碼。 4.4 MPEG2規(guī)范441 MPEG2規(guī)范根本特征 MPEG2是對MPEG1規(guī)范的承繼和發(fā)展。 MPEG2規(guī)范開場于1990年,全稱為“活動圖像及有關聲音信息的通用編碼,該規(guī)范完成于1993年底, 4.4 MPEG2規(guī)范MPEG2規(guī)范的特點: 系統(tǒng)部分處理多個視頻、音頻和數(shù)據(jù)根本碼流的組合問題,產生兩種用于不同環(huán)境下的碼流:節(jié)目碼流和傳送碼流。節(jié)目碼流是由打包的根本碼流組合而成,并共享同一個時基信號,用于誤碼相對較小的環(huán)境,且節(jié)目碼流的包可變也相對較長。傳送包是將時基相互獨立的打包的根本碼

30、流組合成單一的碼流,適用于誤碼較多的環(huán)境,傳送包長度固定188byte。 按明晰度將圖像分為4個等級,同時按運用的工具和方法不同分5種處置類型。4.4 MPEG2規(guī)范MPEG2的型與級 它充分思索了各種運用的不同要求,同時也巧妙地處理了特殊性與通用性的問題。詳細實現(xiàn)時, MPEG一2規(guī)定了4種輸入圖像格式,稱為級(Level) “級定義了從有限明晰度的VCD圖像質量到高明晰度的HDTV圖像質量,即提供了靈敏的信源編碼格式。此外,MPEG一2還規(guī)定了不同的緊縮處置方法,稱為型或檔次“Profile。 ProfileLevel簡 單Simple主 類MainSN RScalableSpatialS

31、calable高 類High高級19201920108030 19201l5225420I,P,B80MbS422,420 I,P,B100MbS高1440級14401152251440108030420I,P,B60MbS420I,P,B60MbS422,420 I,P,B80MbS主級72057625 72048029.97420I,P15MbSSPML420I,P,B15MbSMPML420I,P,B15MbSSNPML422,420 I,P,B20MbSHPML低級 35228829.97420I,P,B4MbS420I,P,B4MbS 表49 MPEG一2系統(tǒng)構造 主要檔次主要等級(

32、MPM L)涉及的正是數(shù)字常規(guī)電視,其適用價值最大。低等級相當于ITUT的H261的CIF或MPEG一1的SIF,主要等級和常規(guī)電視相對應,高1440等級粗略地與每掃描行1440樣點的HDTV對應,高等級大體上與每掃描行1920取樣點的HDTV對應。在MPEG一2系統(tǒng)構造中,較高檔次的編碼除運用較低檔次的編碼工具外,還運用了一些較低檔次沒有運用的附加工具。因此,較高檔次的編碼器除能解碼本檔次編碼的圖像外,還能解碼用較低檔次編碼的圖像,即MPEG一2的“檔之間具有向下兼容性。 2區(qū)分場和幀 在MPEG2編碼中為了更好地處置隔行掃描的電視信號,分別設置了“按幀編碼和“按場編碼兩種方式,并相應地對運

33、動補償也作了擴展。這樣,常規(guī)隔行電視圖像的緊縮編碼與單純的按幀編碼相比,其效率顯著提高。例如在某些場所,場間運動補償能夠比幀間運動補償好,而在另外一些場所那么相反。類似地,在某些場所,用于場數(shù)據(jù)的DCT的質量比用于幀數(shù)據(jù)的DCT的質量能夠有所改良??梢奙PEG2對于場幀運動補償和場幀DCT進行選擇(自順應或非自順應)就成為改良圖像質量的一個關鍵措施之一。3. 可分級性 同一檔次的不同級別間的圖像分辨率和視頻碼率相差甚大。為堅持解碼器向下兼容性,MPEG一2采用了信噪比可分級性和空間可分級性兩種分級編碼技術。信噪比可分級性表示可分級改動DCT系數(shù)的量化步長;空間可分級性利用對像素的抽取和內插來實

34、現(xiàn)不同級別的轉換,如1440HDTV信號按MPEG一2緊縮編碼后的數(shù)據(jù)流分成兩個子集,對優(yōu)先權高的子集解碼后即可獲得常規(guī)電視質量的圖像(主要檔主要級,15Mbits碼率),相當于SDTV圖像;而對兩個子集一同解碼才干獲得1440HDTV電視質量的圖像。上述過程可用表示圖413來說明。圖41 3 向下兼容的MPEG一2解碼表示圖 MPEG一2的主要特點表如今運用的靈敏性。根據(jù)運用需求將圖像分成“級與“類 ,它的級包括空域分級、時域分級、SNR分級和數(shù)據(jù)分流。 空域分級:用于實現(xiàn)不同大小圖像的兼容傳送; 時域分級:主要用于不同幀頻圖像的傳送; SNR分級:主要用于實現(xiàn)不同質量的視頻效力兼容; 數(shù)據(jù)

35、分流:將有關解碼的重要信息,例如控制信息,運動矢量,DCT低頻分量等放在一同,占用部分頻帶以較高的性噪比發(fā)射,以保證接納。而在另外的頻帶中放置相對次要的數(shù)據(jù),以較低些的能量發(fā)射,從而降低總的發(fā)射功率。MPEG-2與MPEG-1比較 MPEG-1規(guī)范是針對CIF圖像格式的,MPEG-2與MPEG-1相比,它支持圖像格式符合CCIR.601建議支持逐行掃描,也支持隔行掃描和16:9的寬高比,它充分思索了各種運用的不同要求,規(guī)定了不同的緊縮處置方法即“型以及編碼器輸入端不同的信源圖像格式即“級,處理了特殊性和通用性的問題,它包含了HDTV的規(guī)范,使其運用更加靈敏,更加廣泛;在一個系統(tǒng)碼流中可以有多個

36、視頻信道; MPEG-2向下兼容,MPEG-1是MPEG-2的一個子集,任何MPEG-2的解碼器可以解MPEG-1的碼流;MPEG-2支持多種圖像預測方式,可以采用分級搜索方法進展運動補償;MPEG-2分別設置了“按幀編碼和“按場編碼兩種方式,其編碼效率得到提高;MPEG-2采用了性噪比可分級性和空間可分級性兩種分級編碼技術,以滿足不同傳輸帶寬和不同用戶的需求;支持不同的彩色圖像采樣格式,支持8bit的圖像也可支持10bit的圖像。 在圖像數(shù)據(jù)流組織方面, MPEG-2中有兩類數(shù)據(jù)碼率,傳送數(shù)據(jù)流和節(jié)目數(shù)據(jù)流,用于不同的場合。節(jié)目碼流中小包的長度相對較長且不固定,適合用于相對無誤差的環(huán)境。傳輸

37、碼流是在傳輸流的根底上復用而成的,傳輸流中的包長度固定為188字節(jié),適宜于在有誤差的環(huán)境中傳送。 4. 5 MPEG4的根本內容4. 5. 1 MPEG4的根本特點 MPEG1和MPEG2已得到廣泛運用,但仍需求一個用于表述、集成和變換音視頻信息的標準,如在固定的寬帶系統(tǒng)及挪動通訊窄帶系統(tǒng)中的運用。 MPEG一4規(guī)范化任務始于:1 9 9 3年9月,初衷是制定一個碼率在6 4 k b p s以下的通用的視頻編碼規(guī)范,其主要目的是低碼率視像通訊。八大功能:(1)基于內容的操作和位流的編輯;(2)基于內容的多媒體數(shù)據(jù)的訪問工具;(3)基于內容的可分級性;(4)自然合成數(shù)據(jù)的混合編碼;(5)多個并發(fā)

38、數(shù)據(jù)流的編碼;(6)改良編碼效率;(7)甚低碼率下時軸訪問的改良;(8)緊縮數(shù)據(jù)在過失環(huán)境下的堅韌性。MPEG一4與以往的MPEGl2規(guī)范最主要區(qū)別于:(1)MPEG4的數(shù)據(jù)描畫是基于內容的或者說是基于對象的編碼機制,類似于軟件領域中的“面向過程的言語。(2)MPEG4是一個開放的系統(tǒng),它支持傳統(tǒng)的規(guī)范又不排斥新規(guī)范。從運用層面來看,MPEG4包括了傳統(tǒng)的方式訪問數(shù)據(jù)庫。(3)MPEG4支持多種類的A V信息:自然的或合成的;二維的或三維的;單頻譜的或多頻譜的;實時的或非實時的,等等。MPEG4所提供的新功能包括: (1)具有對于稱之為音像對象的混合媒體數(shù)據(jù)的高效編碼才干。這些混合媒體數(shù)據(jù)包括

39、:視頻圖像、圖形、文本、音頻、言語的數(shù)據(jù)。 (2)用合成的文本組合的混合媒體對象來產生多媒體信息表現(xiàn)的才干。 (3)緊縮數(shù)據(jù)在噪聲信道傳輸中恢復過失的堅韌性。 (4)對恣意視頻對象進展編碼的才干,即不要求分塊的編碼圖像是矩形,每塊區(qū)域內可以包含特定圖像或感興趣的視頻內容即視頻對象平面VOP( Video Object Plane)。VOP不再是MPEG12傳統(tǒng)的矩形編碼,編碼器對任不測形的VOP編碼時,VOP被限定在一個長、寬均為1 6整數(shù)倍的窗口內,同時保證VOP窗門中非VOP的宏塊數(shù)最少,如VOP宏塊,規(guī)范的矩形幀可以以為是VOP的特例。 (5)在網(wǎng)絡信道傳輸所提供的適宜于特有對象性質的業(yè)

40、務質量下音像對象數(shù)據(jù)的復用和同步。 (6)在接納端具有進展音像場景交互的才干。 MPEG一4所支持的這些功能使其有著廣泛應用,諸如從交互式挪動可視、交互式家庭商店、無線可視監(jiān)控到基于內容的多媒體數(shù)據(jù)庫的查詢、搜索、索引、檢索及互聯(lián)網(wǎng)上多媒體表現(xiàn)以致數(shù)字廣播、DVD接納等。一個能支持各種不同的功能和各種各樣的運用的規(guī)范是非常復雜的,特別指出MPEG4是表現(xiàn)多媒體的一種工具,而不是詳細編碼算法的一種規(guī)范。 MPEG4由4大要素構成: (1)語法:它是一種可擴展的言語,允許選擇、描畫工具規(guī)范以及框架的下載。 (2)工具:它是一種特殊的方法。MPEG4不僅提供了視頻編碼的規(guī)范化工具,也提供了音頻、圖形

41、和文本編碼的規(guī)范化工具。 (3)算法:是實現(xiàn)一個或多種功能的工具的集合。 (4)框架:是適用于特殊運用的一個或多個算法。452 MPEG4精細可分級編碼與流媒 體技術 精細可分級編碼FGS( Fine Granular Scalability)是MPEG4提供的一種質量可分級編碼技術。MPEG4 FGS編碼方法將視頻序列編碼成兩個碼流:根本層碼流和加強層碼流,根本層采用傳統(tǒng)的視頻編碼技術編碼,生成一個碼率比較低的碼流,根本層碼流傳輸必需是正確的;加強層碼流采用位平面(BitPlane)技術編碼源圖像和根本層重構之間的差值。 通常的視頻緊縮可以分為可擴展和不可擴展的緊縮。其中不可擴展的緊縮只生成

42、一個位流Bit-stream;而可擴展的緊縮生成多個子位流Sub-stream,其中一個位流是根本位流,它可以獨立解碼,輸出粗糙質量的視頻序列;其他的子位流那么起質量加強的作用;一切的子位流一同復原出最好質量的視頻序列。相應地,僅有部分的子位流必須包括根本位流,那么輸出的視頻在圖像質量,或者大小,或者幀速率上較差,這三個方面構成了壓縮在質量信噪比SNR空間和時間上的擴展性編碼。流媒體技術與多媒體技術流媒體技術: 媒體在因特網(wǎng)/局域網(wǎng)中播放時,所采用的流式傳輸方式不是媒體的方式。邊下載,邊播放。 而流式傳輸方式那么要將整個多媒體文件經過特殊的緊縮方式分成一個個緊縮包,由視頻效力器向用戶計算機實時

43、延續(xù)地傳送。用戶不用像采用下載方式那樣等到整個文件全部下載終了(需求本地硬盤),而是只需經過幾秒或幾十秒的啟動延時(在客戶端的內存中開辟一個緩沖區(qū))即可在用戶的計算機內利用解壓設備對緊縮的多媒體文件解壓后進展播放和觀看,而剩余部分將在后臺的效力器內繼續(xù)下載。多媒體技術: 單獨說多媒體是沒有意義的,它是一個描畫詞,不是一個名詞。 信息的載體媒體 多種媒體的方式文本、圖形、圖像、動畫、音頻、視頻等等 多媒體通訊的特征綜合性、交互性、同步性 4. 7 MPEG規(guī)范編碼特點 MPEG視頻定義了三類圖像:I幀、P幀、B幀;一個GOP通常為1215幀,將其分成三類。 I幀幀內編碼幀,通常是變換場景后的第一

44、幀,作為預測基準的獨立幀,該幀僅利用本幀內部的相關性采取幀內緊縮算法,諸如DCT之類緊縮,實現(xiàn)中等程度的緊縮編碼,它不包含運動矢量的信息,它是P幀和B幀的參考幀。 I幀編碼質量的好壞直接影響到整個GOP的重建。 緊縮后每個象素占用12bit。(152kbit/幀) P幀前向預測編碼幀,它用前邊最近的I幀或P幀作為參考幀,進展幀間差值預測緊縮編碼運動補償預測編碼,該幀同時進展幀內和幀間預測編碼,編碼率較低。 (80kbit/幀) B幀雙向預測編碼幀,該幀即以前幀I幀或P幀為參考,又以后幀P幀為參考進展預測編碼雙向運動補償預測編碼,即B幀可以采用幀內、前向、后向或雙向4種緊縮編碼技術,其壓縮程度最

45、高。(23kbit/幀) 按緊縮比的高低排序:B幀、P幀、I幀 152380823576kbit12幀為一組 57612251.2MbpsI1B2B3P4B5B6P7前向預測后向預測圖420 MPEG編碼幀的構造方式 I B B P B B P I P B B P B B1 2 3 4 5 6 7 1 4 2 3 7 5 6顯示順序傳送順序圖421 MPEG視頻碼流(幀)顯示順序與傳送順序 一個圖像組中各類幀的緊縮、傳送和解壓(碼) 、顯示順序是不同的,編解碼順序與畫面顯示順序不同。圖像需求經過重新排序緩沖器再顯示。圖42 2 MPEG一2緊縮編碼原理框圖圖423 一個MPEG解碼原理圖4.1

46、0 先進音視頻編碼規(guī)范(AVS) AVS規(guī)范是系列標準的簡稱,其中心是把數(shù)字視頻和音頻數(shù)據(jù)緊縮為原來的,幾非常之一甚至百分之一以下。數(shù)字音視頻編解碼技術規(guī)范任務組(簡稱AVS T作組)由中國國家信息產業(yè)部科學技術司于2002年6月同意成立。4.10 先進音視頻編碼規(guī)范(AVS) 任務組的義務是:面向我國的信息產業(yè)需求,結合國內企業(yè)和科研機構,制(修)訂數(shù)字音視頻的緊縮、解緊縮、處置和表示等共性技術規(guī)范,為數(shù)字音視頻設備與系統(tǒng)提供高效經濟的編解碼技術,效力于高分辨率數(shù)字廣播、高密度激光數(shù)字存儲媒體、無線寬帶多媒體通訊、互聯(lián)網(wǎng)寬帶流媒體等艱苦信息產業(yè)運用。表4-1 5 AVS與其他主要規(guī)范的技術參

47、數(shù)對比編碼工具AVSH.264MPEG-2幀內編碼41 01 AVS視頻編解碼的主要內容 AVS視頻中具有特征性的中心技術包括:整數(shù)變換、量化、幀內預測、14精度的像素插值、特殊的幀間預測運動補償、二維熵編碼、去塊效應環(huán)內濾波等。 AVS規(guī)范中視頻解碼過程的根本處置單元是宏塊。一個宏塊包括1 6l 6的亮度樣值塊和對應的色度樣值塊,宏塊可進一步劃分到最小88的樣本塊來進展預測,共有4種用于運動補償?shù)暮陦K劃分l 61 6、1 68、81 6、88,如圖42 9所示。013210001881616168816圖429 AVS中4種用于運動補償?shù)暮陦K劃分 AVS中的變換以88樣本塊為根本單元,變換系

48、數(shù)采用標量量化。整數(shù)變換、標量量化計算及其逆過程可以完全經過整數(shù)運算實現(xiàn),比原先的浮點運算能有效提高計算速度,也有利于硬件實現(xiàn)實時系統(tǒng);同時由于是整數(shù)變換,運算結果準確度高,不存在浮點運算及取整,因此可以有效地防止反變換誤匹配問題,即消除了編碼器與解碼器之間的失配景象。 AVS規(guī)范對于幀內編碼塊亮度系數(shù)、幀間編碼塊亮度系數(shù)和色度系數(shù)分別定義了多個變長碼表。根據(jù)解析所得語法元素的值,經過查變長碼碼表可以得到量化系數(shù)值(Level)和量化系數(shù)游程(Run)。解碼得到一個系數(shù)值和游程后,下一個解碼量化系數(shù)所參考的碼表將根據(jù)前一個解碼量化系數(shù)值進展選擇。 在預測方面,AVS同樣支持多幀參考,但其P幀或

49、B幀最多可有兩個參考幀圖像。對于亮度塊和色度塊的幀內預測,AVS分別定義了5種和1種方式不運用88以下的方式,是由于這些方式對編碼性能的影響極小。與H.264規(guī)范類似,AVS在編碼Intra圖像時可以用幀內預測,幀內預測運用空間預測方式消除圖像間的冗余,幀間預測運用基于塊的運動矢量消除圖像間的冗余,幀間預測有如圖42 9所示的4種方式,其預測運動矢量的精度到達14像素(H2 6 4支持到達18像素精度)。 在亮度解碼時,首先進展12樣本和14樣本的插值,然后根據(jù)運動矢量得到相應的參考樣本;色度樣本插值運用對應亮度塊的運動矢量,利用被插值樣本周圍的4個整數(shù)樣本值進展線性插值。至于14像素樣本值的

50、獲得可以分兩步:第一步是由多個整數(shù)點像素樣本值經過FIR濾波器輸出得到部分12像素精度插值,再利用得到的12像素值繼續(xù)經過一樣的FIR濾波器得到余下的l2像素值;第二步是利用12像素值進展雙向線性插值得到14像素值。在低分辨率挪動運用中,AVS幀間預測只需P幀類型,與MPEG4H2 6 4的Baseline Profile一樣,性能也相當。 AVS采用自順應環(huán)路濾波,即以宏塊為單位,根據(jù)塊邊境兩側塊類型確定邊境強度,采取不同濾波策略,消除邊境上產生的失真景象。在解碼器中,去塊濾波器在重建和顯示宏塊之前發(fā)生作用,根據(jù)宏塊以及宏塊中88亮度塊的運動矢量,求得邊境濾波強度,再由塊程度或垂直邊境兩側樣

51、本點求得塊邊境閾值,根據(jù)兩者關系,確定能否進展濾波以及濾波的方式。去塊濾波可以使邊境變得平滑,提高在高緊縮比下解碼圖像的視覺效果。當前幀參考幀重構幀運動估計運動補償壞路濾波幀內預測變量、量化熵編碼反變換反量化幀內方式選擇幀內幀間圖430 AVS編碼器框圖 輸入視頻序列依次進展I幀、P幀和B幀編碼,I幀編碼采用幀內方式,其預測方式有5種,選擇最佳的一種方式進展幀內預測。P幀編碼采用幀間模式,根據(jù)先前已編碼的參考幀(可以是I幀或P幀)進行幀間預測。B幀根據(jù)先前已編碼幀,可以有3種模式進展預測,即跳過方式、直接方式和雙向預測模式,預測值與當前幀的差值構成殘差信號,其殘差經過變換、量化以后,再經過熵編碼器進展編碼。這個過程中,視頻在空間域、時間域以及統(tǒng)計上的冗余信息得到了有效的去除,大大提高了緊縮比,成為AVS編碼碼流。 設置環(huán)路濾波之目的是去塊效應(或去馬賽克)濾波,由于圖像中由于運動補償、變換及量化產生的虛偽邊境可以被平滑,降低圖像塊效應,提高了客觀視覺效果。此外,濾波后的幀用于后續(xù)幀的運動補償預測,從而防止了虛偽邊境誤差積累,導致圖像質量的進一步下降。關于AVS的熵解碼。變長編解碼技術在現(xiàn)代多媒體技術中得到廣泛的運

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論