圖像信號組成與編碼_第1頁
圖像信號組成與編碼_第2頁
圖像信號組成與編碼_第3頁
圖像信號組成與編碼_第4頁
圖像信號組成與編碼_第5頁
已閱讀5頁,還剩152頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

視聽信息系統(tǒng)導(dǎo)論電子工程系信息認(rèn)知與智能系統(tǒng)1第六章圖像信號的組成與編碼2Image

positionand

Coding第六章

圖像信號的組成與編碼圖像掃描原理??信號基本參量信號的頻譜圖像的彩色變換典型的

測試信號圖像信號的數(shù)字化圖像壓縮編碼技術(shù)《圖像信息系統(tǒng)原理》3.23.34.23第六章

圖像信號的組成與編碼圖像掃描原理??信號基本參量信號的頻譜圖像的彩色變換典型的

測試信號圖像信號的數(shù)字化圖像壓縮編碼技術(shù)4圖像掃描原理HS

fS

x,

y

,

t視網(wǎng)膜成二維圖像(雙目視

)感光細(xì)胞成像→空間上分割為像素視覺暫留現(xiàn)象→時間上分成幀順序傳送:像素亮度、色度轉(zhuǎn)換成電信號按照時間順序逐個傳輸。H

f

x,

y

,

t圖像是

空間的連續(xù)函數(shù)V

fV

x,

y

,

t5圖像掃描原理傳輸通道6開關(guān)同步順序傳送圖像掃描原理圖像掃描方式機(jī)械式、束偏轉(zhuǎn)式、移位式隨機(jī)掃描、光柵掃描、螺旋掃描等10行機(jī)械掃描

(Nipkow圓盤,1883)7“電望遠(yuǎn)鏡”圖像掃描原理掃描光柵掃描(raster

scan):直線形,圓形,螺旋形等。直線形掃描:直線勻速掃描從左往右(行掃描,行頻fh),自上而下(場掃描,場頻fv),組成矩形光柵。偏轉(zhuǎn)方式:電偏轉(zhuǎn)(示波管等),磁偏轉(zhuǎn)(顯像管等)。行同步點(diǎn)場同步點(diǎn)8圖像掃描原理行正程行逆程場逆程9圖像掃描原理行偏轉(zhuǎn)線圈電流波形場偏轉(zhuǎn)線圈電流波形掃描過程分正程和逆程階段,行逆程α占行周期的約18%,場逆程β占場周期的約8%。在逆程的開始受同步信號的前沿控制,使掃描進(jìn)入

回掃的逆程階段。10圖像掃描原理隔行掃描11圖像掃描原理逐行(progressive)掃描與隔行(interlaced)掃描逐行掃描:fh

=Z

fv

(一幀掃描總行數(shù)Z)隔行掃描:常用隔行比2:1,fh

=(Z/2)fv。隔行掃描比逐行掃描行頻降低一倍。隔行掃描的問題奇數(shù)行和偶數(shù)行起點(diǎn)終點(diǎn)不在同一水平位置上。兩場的掃描波形不一致,導(dǎo)致電路復(fù)雜化。12圖像掃描原理隔行掃描用奇數(shù)行,奇偶場各有一個半行,從而使兩場掃描波形一致。電視通常是525或625行。13圖像掃描原理14圖像掃描原理隔行掃描電流波形15圖像掃描原理Why隔行掃描?臨界閃爍頻率CFF:30~50Hz逐行fv

=fF(幀頻),隔行fv

=2fF。同樣的帶寬下隔行提供更高的場頻。隔行掃描的缺點(diǎn))行間閃爍(interline并行現(xiàn)象運(yùn)動物體的水平鋸齒垂和垂直拖尾隨著顯示設(shè)備的發(fā)展CFF

a

log

L

b16圖像掃描原理電流掃描的同步:收、發(fā)兩端的掃描點(diǎn)應(yīng)有一一對應(yīng)的幾何關(guān)系。掃描頻率和初始相位相同。掃描的幅型一致且線性良好。hmax

hmin正常 行非線性 場非線性非線性系數(shù)一般要求

β<5~10%vmaxvminH

2hmax17

hmin

hmax

hmin

v

2

vmax

vmin

vmax

vmin

圖像掃描原理行不同頻場不同頻場頻略高:圖像向下移動;場頻略低:圖像向上移動行頻略高18行頻略低原圖象圖像掃描原理行、場不同相12456783

23待傳送圖像掃描相差半行掃描相差半場456784519圖像掃描原理為了實(shí)現(xiàn)同步掃描,發(fā)送端每當(dāng)掃描完一行時加入一個行同步脈沖;每當(dāng)掃描完一場時加入一個場同步脈沖。系統(tǒng)框圖20圖像掃描原理

光柵幾何畸變(<3%)

D

W

HgH

W

DgV

H2122圖像掃描原理我國隔行掃描的基本參數(shù)隔行掃描,每幀625行,每幀兩場,每場312.5行幀頻:fF=25Hz場頻:fv=50Hz場周期:Tv=20ms(Tvf=18.4ms,Tvr=1.6ms)行頻:fH=25(幀)×625(行)=15625Hz行周期:TH=64μs (THf

=52μs

,THr

=12μs)第六章

圖像信號的組成與編碼圖像掃描原理??信號基本參量信號的頻譜圖像的彩色變換典型的

測試信號圖像信號的數(shù)字化圖像壓縮編碼技術(shù)23信號基本參量信號(模擬電視)圖像信息+掃描同步信號像素亮度(色度)→脈沖的幅度掃描逆程圖像信號處于消隱狀態(tài)彩色屬性:黑白傳輸要求:分量信號,彩

信號信號,復(fù)合 信號24信號基本參量25信號基本參量幅型比(aspect

ratio)K(即W/H)清晰視野:20°(W)15°(H)距離D決定圖像高度H

對應(yīng)的角度,常用D/H表示。最佳視距

D/H

=4

~6。顯像管尺寸用對角線衡量,投影屏幕用長×寬。常用幅型比4:3;增加

感用16:9,寬銀幕、環(huán)幕掃描行數(shù)Z:標(biāo)準(zhǔn)清晰度525/625; 晰度為標(biāo)準(zhǔn)清晰度的2倍以上。26信號基本參量1953年前的

與標(biāo)準(zhǔn)清晰度電視采用4:3晰度電視采用16:9,與標(biāo)準(zhǔn)寬銀幕

相近。27信號基本參量場頻:大于人眼CFF,一般取電源頻率50/60Hz。分解力:分解與綜合圖像細(xì)節(jié)的能力,單位TVL。有效行數(shù):(1-β)Z,理想垂直分解力。Kell效應(yīng)垂直分解力:考慮Kell效應(yīng)后為M=Ke(1-β)Z。水平分解力:N=KKe(1-β)Z。(0.5<Ke<1)隔行掃描須再乘上一個隔行因子0.6<Ki<0.728信號基本參量制式總行數(shù)有效行最佳視距幅型比H分解力V分解力H視場角V視場角HDTV-I112510803.316:96005403017NTSC-I5254847.04:3330242118NTSC-P5254845.04:33303401612PAL-I6255756.04:34252901310PAL-P6255754.34:34254001813SECAM-I6255756.04:34652901310SECAM-P6255754.34:34654001813逐行P,隔行I。垂直V分解力對于逐行為有效行的70%,對隔行為50%。

帶寬(亮度):HDTV 20MHz、

NTSC4.2MHz、PAL

5.5MHz/6MHz、SECAM

6MHz。29信號基本參量圖像信號帶寬:最低頻率為0(圖像的平均亮度),最高頻率為一黑一白兩個像素的時間倒數(shù)1/(2td),td=(1-α)Th/N。逐行掃描:隔行掃描:我國電視標(biāo)準(zhǔn):K

=

4/3

,

fV

=

50Hz, Z

=625,

α=18%,

β=8%

, Ke=0.76

則:fmax

=5.6MH

z,寬松一些取6MHzfmax2KKe

(1

)

fF

Z2(1

)KKe

(1

)

fV

Z24(1

)fmax30信號基本參量1600μs

(25H)行消隱12

μs消隱脈沖消隱:掃描逆程期間信號電平為黑電平,截止,屏幕為黑色。行消隱脈沖:脈寬為12

μs場消隱脈沖:脈寬為1600

μs黑電平 行消隱白電平行正程52μs12μs場消隱信號基本參量復(fù)合同步脈沖行同步脈沖:發(fā)送端行掃描正程結(jié)束后發(fā)出的脈沖信號,控制接收端行掃描逆程的開始。場同步脈沖:發(fā)送端場掃描正程結(jié)束后發(fā)出的脈沖信號,控制接收端場掃描逆程的開始同步脈沖應(yīng)疊加在消隱脈沖之上。1.6μs5.7μs4.7μs同步電平100%12μs行消隱脈沖前肩后肩黑電平70%行同步脈沖32信號基本參量160μs160μs

(2.5TH)(2.5TH)1600μs

(25TH)場同步脈沖與場消隱脈沖行同步場同步312.5行2.5行復(fù)合同步信號33信號基本參量同步脈沖分離同步脈沖從

信號中用幅度分離。行同步用微分電路分離。場同步用積分電路分離。InputoutputAB行同步脈沖略去負(fù)跳變脈沖34信號基本參量outputinputAC場同步脈沖35信號基本參量為解決在場同步期間,行同步失落的問題,在場同步脈沖中開槽,對應(yīng)每行的位置開一個槽,槽寬為:4.7μs。場同步脈沖36信號基本參量奇數(shù)場偶數(shù)場切割電平A點(diǎn)波形B點(diǎn)波形C點(diǎn)波形37信號基本參量由于最后一個行同步到達(dá)奇數(shù)場、偶數(shù)場的場同步前沿的時間不同,造成積分后積分電容上的起始電壓不等,使奇偶相鄰兩場的積分波形不同。奇偶相鄰兩場的開槽位置不同也使積分波形不同。奇偶相鄰兩場到達(dá)同一觸發(fā)電平時刻不同(相差Δt),使相鄰兩場的逆程始點(diǎn)相差Δt使相鄰兩場掃描起始位置不同,影響了隔行掃描的準(zhǔn)確性。

增加均衡脈沖、槽脈沖,使相鄰兩場的復(fù)合同步信號通過積分后波形一致。38信號基本參量奇數(shù)場偶數(shù)場39信號基本參量圖像非線性失真和γ校正亮度的非線性失真γ

校正:取適當(dāng)?shù)?/p>

γ2,使得總體的

γ

1

(

γ=

1

.26)色度的非線性失真:當(dāng)系統(tǒng)γ≠1時,白色、基色及其補(bǔ)色的重現(xiàn)不受影響;其他顏色當(dāng)γ>1飽和度加大,

γ<1飽和度減小。景物L(fēng)0處理E顯像LdE040信號基本參量γ系數(shù)的影響γ=1γ>1γ<141信號基本參量γ校正前γ校正后42LLmin信號基本參量圖像的亮度層次相對亮度辨別閾:Weber

分?jǐn)?shù)(W)設(shè)最小亮度為L1;第二級亮度L1=(1+W)L1

;第n級亮度為Ln=(1+W)n-1L1

。級對比度C=Ln

/L1

=(1+W)n-1亮度層次

n=1+lnC/ln(1+W)

lnC/W

(W→0)一般景物的對比度~100,取W=0.02,則n=230。因此多采用256級灰度。43第六章

圖像信號的組成與編碼圖像掃描原理??信號基本參量信號的頻譜圖像的彩色變換典型的

測試信號圖像信號的數(shù)字化圖像壓縮編碼技術(shù)44信號的頻譜圖像信號按行頻、場頻頻率重復(fù)變化的相似信號,故其頻譜是按行頻、場頻規(guī)律變化的梳狀頻譜。只在水平方向有亮度變化的圖像,頻譜是線狀譜,位于行頻fH及其諧波nfH上。45信號的頻譜垂直方向也有亮度變化的圖像。頻譜成份為nfH±m(xù)fV,其頻譜分布是離散譜線簇(譜線群),主譜線為nfH。能量集中在行頻fH及其各次諧波nfH的主譜線上,在每個主譜線兩旁存在著場頻及其諧波的許多副譜線。46信號的頻譜垂直方向有精細(xì)變化的圖像。兩場信號會有較明顯差異,信號以幀為單位重復(fù),故頻譜成份為nfH±m(xù)fZ。47信號的頻譜對于運(yùn)動的物體,形成的幀周期信號波形表現(xiàn)為副譜線兩側(cè)的連續(xù)頻譜。因視頻圖像相鄰行間相關(guān)較大,因此以行頻及其各次諧波為中心的相鄰群之間有信號能量的空白區(qū),形成梳狀頻譜。48第六章

圖像信號的組成與編碼圖像掃描原理??信號基本參量信號的頻譜圖像的彩色變換典型的

測試信號圖像信號的數(shù)字化圖像壓縮編碼技術(shù)49圖像的彩色變換彩色分光方式分段式連續(xù)式吸收(截止)濾光片(帶通)濾光片二向色反射鏡棱鏡光柵50圖像的彩色變換恒定亮度原理:彩

信號中應(yīng)包含黑白亮度信號和色度信號,而重現(xiàn)的亮度由亮度信號完全決定。大面積原理:人眼對于亮度分辨能力強(qiáng),而對于色度分辨率低,只需傳送大面積彩色,配以亮度細(xì)節(jié)?;旌细哳l原理:亮度用全部帶寬,色度只用較窄帶寬。51圖像的彩色變換由NTSC亮度方程可知,只需要傳送一個Y信號和兩個色度信號即可。

Y=0.299Re+0.587Ge+0.114Be如果直接傳送基色信號,亮度信號Y與兩個

基色所包含的亮度參量重復(fù),相互干擾嚴(yán)重,因此傳送色差信號:(R-Y),(B-Y)。帶寬為

1.3MHz。Ge-Y=-0.509(Re-Y)-0.194(Be-Y)幅值較小,不利于傳輸。52圖像的彩色變換601標(biāo)準(zhǔn)系數(shù)歸一化的Y、CR、CB

(書p.148)YUV:PAL制采用。U=0.493(Be-Y),V=0.877(Re-Y)YQI:NTSC制采用。進(jìn)一步壓縮色度帶寬以適應(yīng)4.2MHz通道帶寬。53圖像的彩色變換例一:飽和品紅色設(shè):Re=1,Ge=0,Be=1Y=0.299+0.114=0.413Re-Y=1-0.413=0.587Be-Y=1-0.413=0.587接收端恢復(fù):Re=(Re-Y)+Y=1Be=(Be-Y)+Y=1Ge

=-0.509(Re-Y)-0.194(Be-Y)+Y

=

0對于白色Y=1,而飽和品紅色Y=0.413,所以在黑白電視機(jī)上顯示為暗灰色。54圖像的彩色變換例二:不飽和品紅色設(shè):Re=1,Ge=0.2,Be=1Y=0.299+0.587*0.2+0.114=0.530Re-Y=1-0.530=0.470Be-Y=1-0.530=0.470接收端恢復(fù):Re=(Re-Y)+Y=1Be=(Be-Y)+Y=1Ge

=-0.509(Re-Y)-0.194(Be-Y)+Y

=

0.2亮度信號比飽和品紅色高(0.530>0.413),所以在黑白電視機(jī)上顯示為淺一些的灰色。55圖像的彩色變換例二:不飽和黃色設(shè):Re=1,Ge=1,Be=0.2Y=0.299+0.587+0.114*0.2=0.915Re-Y=1-0.915=0.085Be-Y=1-0.915=0.085接收端恢復(fù):Re=(Re-Y)+Y=1Be=(Be-Y)+Y=0.2Ge

=-0.509(Re-Y)-0.194(Be-Y)+Y

=

1亮度信號接近1,所以在黑白電視機(jī)上顯示為接近白色淺灰色。56圖像的彩色變換彩色消除(Color

Removal)57圖像的彩色變換58彩色消除(Color

Removal)Impression,

SunriseClaude

Monet,

1872圖像的彩色變換59彩色消除(Color

Removal)Photoshop

轉(zhuǎn)換成灰度圖圖像的彩色變換60彩色消除(Color

Removal)A.A.

Gooch,

S.C.

Olsen,

J.Tumblin

B.

Gooch,

"Color2Gray:Salience-Preserving

Color

Removal",

SIGGRAPH

2005第六章

圖像信號的組成與編碼圖像掃描原理??信號基本參量信號的頻譜圖像的彩色變換典型的

測試信號圖像信號的數(shù)字化圖像壓縮編碼技術(shù)61典型的

測試信號標(biāo)準(zhǔn)彩條信號:不同的標(biāo)準(zhǔn)彩條根據(jù)有色條和黑白條的幅值和電平來劃分。用于調(diào)試彩色編和器。互補(bǔ)色62典型的

測試信號彩條的四位數(shù)命名法前兩位數(shù)字代表黑白條的R、G、B的幅度最大值(%)和最小值(%);后兩位代表組成有色

條的R、G、B的幅度最大值(%)和最小值(%)。以上幅度是γ校正前。BBC彩條:100/0/100/0EBU彩條:100/0/75/0,為我國廣播電視采用。63典型的

測試信號彩條的百分比表示法:γ校正前的信號中,設(shè)有色條中R、G、B的幅度最大值和最小值分別為

Emax,Emin

,而EW為白條的幅度值。幅度=Emax/EW×100%飽和度=(1–Emin/Emax)×100%例如:100%飽和度,100%幅度彩條(100/0/100/0)—彩條最小幅度為0,最大幅度為175%飽和度,100%幅度彩條(100/0/100/25)—彩條最小幅度為0.25,最大幅度為1100%飽和度,75%幅度彩條

(100/0/75/0)—彩條最小幅度為0,彩條最大幅度為0.756465RGBYR-YB-YBBC彩條EBU彩條彩條信號的分量波形典型的

測試信號測試行信號用來實(shí)時地監(jiān)視、調(diào)整和改善電視的傳輸質(zhì)量。場消隱包含25個消隱行,均衡脈沖和場同步脈沖只占用約8行,在考慮積分電路的延遲,每場的消隱期間有約8個消隱行可以利用。國際無線電咨詢

(CCIR)規(guī)定:在場消隱的17、18行和330、331行

國際插入測試信號;在場消隱的19、20行和332、333行

國內(nèi)

測試信號。66典型的

測試信號(a)

第19行

試信號:條信號主要含幾百千赫以下的頻率成分;用彩色副載波填充的2T和10T正弦平方脈沖分別用來測試亮度與色度信號通道的頻率特性。(b)

第20行 試信號:頻域測量用的多波群信號,系統(tǒng)的幅頻特性直接影響圖像分解力,對625/50掃描標(biāo)準(zhǔn),每1MHz對應(yīng)80線。67第六章

圖像信號的組成與編碼圖像掃描原理??信號基本參量信號的頻譜圖像的彩色變換典型的

測試信號圖像信號的數(shù)字化圖像壓縮編碼技術(shù)68圖像信號的數(shù)字化模擬信號的數(shù)字化抽樣:將時間和空間上連續(xù)變化的模擬信號離散化;量化:將幅度連續(xù)變化的信號,轉(zhuǎn)換成為幅度離散的信號;編碼:依照一定的規(guī)則,將離散的信號用對應(yīng)的二進(jìn)制或者多進(jìn)制的代碼表示。前置濾波器S~

f

/2抽樣fS量化編碼模擬信號

g(x)數(shù)字信號

g(n)69圖像信號的數(shù)字化70圖像的抽樣與量化時間上,將連續(xù)的場轉(zhuǎn)化為數(shù)字圖像序列;空間上,數(shù)字圖像是把畫面分割

(抽樣離散化)成像素(離散點(diǎn));各像素的灰度值用離散值(量化成整數(shù))表示。圖像信號的數(shù)字化空間抽樣的方式正方形點(diǎn)陣等邊三角形點(diǎn)陣正六角形點(diǎn)陣12水平、垂直方向上的相鄰像間的距離=1斜方向上的相鄰像21各方向上的相鄰像間的距離=1素間的距離=正方形點(diǎn)陣情況正三角、六角形情況71圖像信號的數(shù)字化空間抽樣的頻率特性為避免抽樣圖像的頻譜交疊,必須滿足抽樣定理(Nyquist

sampling

theorem,

1928),即抽樣頻率應(yīng)至少兩倍于圖像最高頻率分量;設(shè)帶寬限定的像場為

g(x,y);空間抽樣函數(shù)為:

72S

(

x

,

y)

=

δ

(

x -

i

Δ

x

,

y

-j

Δ

y

)

i=

-

j=

-

則抽樣圖像為:gs

(x,

y)=

g(x,

y)S(x,

y)=

g(iΔx,

jΔy)δ(x-

iΔx,

y-jΔy)i=-

j=-圖像信號的數(shù)字化73抽樣圖像的頻譜是原圖像頻譜的無限重復(fù),在滿足抽樣定理的條件下,用適當(dāng)?shù)闹亟V波器對樣k

l

y

xyxxy

k

1

,

f

l

1

空間抽樣的頻率特性則抽樣圖像的頻譜為:

G

f

,

f

1

G

fs

x

y抽樣頻率fsfxf

yfx1y1x本進(jìn)行空間濾波,可以精確地重建原圖像。f

y抽樣圖像信號的數(shù)字化xgxG

f

g

xsxGs

f

抽樣fs

2

fhxxg

xsGs

f

抽樣fs

2

fh圖像信號的數(shù)字化75前置濾波器

Anti-aliasingfilter數(shù)字化A2D…

…模擬化D2A模擬信號

g(x)重構(gòu)模擬信號

g‘(x)重構(gòu)濾波器

Reconstructionfilter模擬、數(shù)字混合系統(tǒng)

fh

fhBrick-wall

Filter無限脈沖響應(yīng)(IIR)濾波器有限脈沖響應(yīng)(FIR)濾波器……sinxx時域圖像信號的數(shù)字化76縮小(抽樣)放大(重構(gòu))最近鄰插值雙三次插值圖像信號的數(shù)字化77原圖像直接拉伸Seam

carvingSeam

carving圖像信號的數(shù)字化78原圖像直接壓縮圖像信號的數(shù)字化A.

Shamir,

S.

Avidan,

“Seam

Carving

for

MediaRe

ing”,

Communications

of

the

ACM,

Volume

52,Number1,

200979圖像信號的數(shù)字化抽樣標(biāo)準(zhǔn)全電視信號編碼,抽樣頻率采用3~4

fsc(PAL:fsc=4.43MHz;采用4fsc便于色度相位處理);彩色電視分量編碼:對圖像的分量信號(R/G/B,Y/U/V,Y/CR/CB,…)直接進(jìn)行數(shù)字化編碼:對R/G/B分量均采用13.5MHz抽樣頻率,也稱為4:4:4抽樣;彩

數(shù)字化標(biāo)準(zhǔn)

(ITU-R

BT601標(biāo)準(zhǔn))規(guī)定,對Y/CR/CB

的抽樣頻率為

13.5/6.75/6.75MHz

(

均為525/625掃描制式的行頻整倍數(shù)

),有4:2:2、4:2:0、4:1:1三種不同的采樣結(jié)構(gòu)。80圖像信號的數(shù)字化抽樣標(biāo)準(zhǔn)數(shù)字有效行:每一行的抽樣點(diǎn)數(shù)為亮度720點(diǎn),色差360點(diǎn)(4:2:2),其中包含了部分的行消隱。81圖像信號的數(shù)字化抽樣標(biāo)準(zhǔn)亮度、色差信號的抽樣結(jié)構(gòu):Y/CR/CB的亮度與色差的奇數(shù)抽樣點(diǎn)空間同位,兩色差的抽樣點(diǎn)都在空間同位,均為正交抽樣結(jié)構(gòu)(正方形或矩形點(diǎn)陣);相鄰的像素公用一個色差信號;有時采用較低色差信號帶寬或較少的采用行數(shù)以降低碼率。●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●4:2:24:2:04:1:18283圖像信號的數(shù)字化ITU-R

BT601分量抽樣標(biāo)準(zhǔn)4:2:2標(biāo)準(zhǔn)/625行4:2:0標(biāo)準(zhǔn)/625行4:1:1標(biāo)準(zhǔn)/625行4:2:2標(biāo)準(zhǔn)/525行4:2:0標(biāo)準(zhǔn)/525行4:1:1標(biāo)準(zhǔn)/525行每幀有效行數(shù)亮度色度576576576480480480576288576480240480每行有效像素亮度色度720720720720720720360360180360360180幀頻/Hz252525303030幅型比4:34:34:34:34:34:384圖像信號的數(shù)字化CIFQCIFSQCIF行數(shù)/幀像素/行行數(shù)/幀像素/行行數(shù)/幀像素/行亮度288352色差144CCITT中等分辨率格式(CIF)HDTV

:數(shù)字有效行(亮度1920

、色差960);Y/CR/CB的抽樣頻率為72/36/36MHz(1250/50)和74.25/37.125/37.125MHz(1125/60),也均為掃描制式525/625的行頻的整倍數(shù)。85圖像信號的數(shù)字化抽樣信號的量化量化:用離散(整數(shù))的形式表示采樣信號;標(biāo)量量化:連續(xù)幅度樣本序列的量化通常按順序進(jìn)行,其中每一樣本可視為標(biāo)量獨(dú)立進(jìn)行量化。按照量化等級間隔可以分為:等間隔量化(均勻量化或線性量化);不等間隔量化:對數(shù)量化、最小均方誤差量化、錐形量化等;矢量量化:若考慮序列中各樣本的相關(guān)性,可將若干個標(biāo)量數(shù)據(jù)組成為一個矢量,在矢量空間進(jìn)行整體量化,同樣失真度下量化級數(shù)可以減少。最小均方誤差量化信號的pdf輸入輸出圖像信號的數(shù)字化抽樣信號的量化圖像數(shù)字化一般采用標(biāo)量方式均勻量化;脈沖編碼調(diào)制(Pulse-code

modulation,PCM):是一種均勻的標(biāo)量量化方式,將抽樣后信號的強(qiáng)度依照相等的間隔分成數(shù)段,每一段用一個記號加以量化;量化信號模擬信號量化誤差量化誤差噪聲輸出輸入均勻量化86圖像信號的數(shù)字化87kzkdzzz

q

P

i12k

zk

1脈沖編碼調(diào)制(PCM)假設(shè)輸入信號幅度[0,

A],量化間隔q=A/2n則量化點(diǎn)選擇為:q/2,

3q/2,…,A-q/2,量化誤差范圍為[-q/2,+q/2];需要的編碼位數(shù)為:n=log2A;A/D需要比較器的個數(shù):2n-1;量化噪聲信噪比:Spp/Nrms

=6.02n+10.8dB;圖像一般采用8或10bit量化。設(shè)待量化圖像z,其分布概率P(z),抽樣點(diǎn)數(shù)k,量化

電平z1,z2,…,zk-1,量化輸出圖像為q1,q2,…,qk,量化圖像的均方量化誤差:圖像信號的數(shù)字化編碼方式將量化后得到的數(shù)值編成二進(jìn)制碼;常用自然二進(jìn)碼(權(quán)重碼)或交替二進(jìn)碼(Gray碼)。圖像亮度(單極性)用自然二進(jìn)碼;色差(雙極性)用偏移二進(jìn)碼(零電平處在量化級的中點(diǎn),可以把最視為符號位)。量化等級01234567自然二進(jìn)制碼000001010011100101110111Gray碼0000010110101101111011008889圖像信號的數(shù)字化像素數(shù)(N*N),量化級數(shù)(K=2n)與圖像質(zhì)量的關(guān)系N選擇256以上可得到質(zhì)量較令人滿意的圖像,N<64后像素成塊狀(Mosaic效應(yīng));K選擇64以上可得到質(zhì)量較令人滿意的圖像,

K<32圖像出現(xiàn)假輪廓(原來平滑變化的灰度產(chǎn)生了較大的差別),它類似油畫粗獷的現(xiàn)象

(Painting效應(yīng))。第六章

圖像信號的組成與編碼圖像掃描原理??信號基本參量信號的頻譜圖像的彩色變換典型的

測試信號圖像信號的數(shù)字化圖像壓縮編碼技術(shù)90圖像壓縮編碼技術(shù)圖像壓縮編碼(信源編碼)在保證一定的圖像質(zhì)量的前提下,對圖像數(shù)字化得到的PCM碼進(jìn)行壓縮,其基本原理是利用圖像的相關(guān)性(統(tǒng)計冗余)和人類視覺系統(tǒng)特性提高圖像表示的有效性,有利于圖像數(shù)據(jù)的與檢索.91圖像壓縮編碼技術(shù)圖像信源編碼的原理與分類從統(tǒng)計特性上看,圖像信息存在大量的空間和時間冗余,利用這些冗余減小信源熵,可以實(shí)現(xiàn)無損的信息保持壓縮編碼(JPEG-LS);人類視覺系統(tǒng)的特性導(dǎo)致人在對圖像的空間、時間分辨能力上存在視覺掩蓋效應(yīng),利用這些效應(yīng)將

上難以覺察的信息(視覺冗余)丟棄,保持有效信息,可以實(shí)現(xiàn)信息有損但視覺感知無損的非信息保持壓縮編碼

(JPEG,

MPEG,

H.264,…)。92圖像壓縮編碼技術(shù)圖像的統(tǒng)計特點(diǎn)和處理空間相關(guān)性(幀內(nèi)相關(guān)性):圖像內(nèi)容和亮度等在空間多是漸變,自然圖像通??煞譃樗念悈^(qū)域:均勻/準(zhǔn)均勻、低對比度細(xì)節(jié)區(qū)、高對比度細(xì)節(jié)區(qū)、邊緣區(qū),前三類均可用Markov過程近似;時間相關(guān)性(幀間相關(guān)性):掃描生成圖像的場或幀

周期的時空結(jié)構(gòu)因為自然場景不會突變而變化很小,相鄰場/幀對應(yīng)點(diǎn)信號接近;解除相關(guān)性的方法: ,解除像素序列的相關(guān)性,但完全去相關(guān)需知概率特性;變換,解除矢量的相關(guān),有許多變換矩陣供選擇以適應(yīng)不同的信源,在信源概率特性未知時適用。9394圖像壓縮編碼技術(shù)人類視覺系統(tǒng)可利用特性人眼不能同時對空間細(xì)節(jié)、亮度對比和圖像運(yùn)動具有最高分辨能力,對圖像的空間分辨率和時間分辨率具有互補(bǔ)特性;對圖像信號的幅度誤差的可覺察門限隨圖像內(nèi)容變化而變化,在空間邊緣(輪廓)與時間邊緣(變換場景)的門限值是遠(yuǎn)離邊緣處的門限值的3~4倍,即邊緣處存在視覺掩蓋效應(yīng)。圖像壓縮編碼技術(shù)圖像壓縮編碼技術(shù)頻譜間置的帶寬壓縮:利用圖像頻譜的梳狀特性,適當(dāng)?shù)倪x擇低于Nyquist頻率的抽樣頻率,使得頻譜混疊部分恰好落入梳狀頻譜的空白區(qū)域,實(shí)現(xiàn)sub-Nyquist抽樣;空間分辨率和幀頻壓縮:不同的空間區(qū)域采用不同的

分辨率,對于運(yùn)動圖像,減少運(yùn)動區(qū)域的空間分辨率;

Baldwin的實(shí)驗確定了圖像間斷效應(yīng)允許的最低幀率:例如,對會話類特寫鏡頭的最低幀率可在12幀/秒;95圖像壓縮編碼技術(shù)圖像壓縮編碼技術(shù)圖像間置技術(shù):隔行掃描作為一種行間置技術(shù),使得同樣場頻下帶寬壓縮一半,也可采用點(diǎn)間置技術(shù),將一幀圖像分解成多個不 的場,從而降低帶寬;編碼技術(shù):從已接收到的符號(相鄰像素,如左鄰,上鄰,左上鄰等)來(當(dāng)前像素)最可能值;將即將接收到的符號值與實(shí)際值之間的差(通常接近零)進(jìn)行編碼,常采用線性 函數(shù);一個典型的代表就是差分脈沖編碼調(diào)制(DPCM);96圖像壓縮編碼技術(shù)圖像壓縮編碼技術(shù)變換編碼技術(shù):對圖像數(shù)據(jù)做正交變換(DCT,DFT),去除圖像數(shù)據(jù)中相關(guān)性,使得變換后系數(shù)在某些區(qū)域(低頻區(qū)域) ,從而便于采用統(tǒng)計編碼技術(shù)加以壓縮;統(tǒng)計編碼(熵編碼)技術(shù):針對圖像信號幅值分布不

均勻性,采用變長編碼(variablelengthcoding,VLC)以降低碼率;針對圖像中經(jīng)常存在連續(xù)相同像素的情況,采用行程編碼(run

length

coding, RLC)等;算術(shù)編碼

(arithmetic coding),將數(shù)據(jù)編碼成為一個實(shí)數(shù);97圖像壓縮編碼技術(shù)圖像壓縮編碼技術(shù)基于模型的編碼:對圖像進(jìn)行分割,提取緊湊和必要的信息,構(gòu)建一些數(shù)據(jù)量不大的模型參數(shù),再傳送它們;接收端將參數(shù)作用于模型,再圖像。主要有基于物體編碼和基于語義的編碼。在人臉圖像的編碼中有使用,屬于下一代的圖像壓縮編碼技術(shù)。在圖像壓縮編碼技術(shù)上,數(shù)字電視系統(tǒng)很大程度上借鑒或是直接使用了多技術(shù),主要綜合使用變換編碼、熵編碼和編碼。98圖像壓縮編碼技術(shù)差分脈沖編碼調(diào)制(DPCM)基于最佳線性

理論,由Bell

的Cutler在1952年提出;根據(jù)信息論,相關(guān)性很強(qiáng)的信源,其條件熵可遠(yuǎn)小于無條件熵,解除相關(guān)性使信源輸出轉(zhuǎn)化為獨(dú)立序列可壓縮碼率;就是從已收到的符號來 未收到符號的最可能的值作為于獨(dú)立信源,值;并對它與實(shí)際值之差編碼。對就沒有意義(誤差大)。99圖像壓縮編碼技術(shù)差分脈沖編碼調(diào)制(DPCM)若值的數(shù)學(xué)期望等于原來物理量,就稱為無偏估計;若值與原物理量之間的均方誤差最小,就稱為最佳估計;要得到最佳估計,必須確知各變量聯(lián)合概率密度函數(shù),在一般情況下是的。因而常用線性的方法來達(dá)到次最佳的結(jié)果。如果信源是非平穩(wěn)的或非概率性的,無法獲得確切和恒定的相關(guān)函數(shù),不能構(gòu)成線性函數(shù),則可采用自適應(yīng)。100圖像壓縮編碼技術(shù)101差分脈沖編碼調(diào)制(DPCM)線性

編碼

(linear

predictive

coding,

LPC)采用線性的函數(shù),即 值是前幾個符號的線性組合。編碼可采用兩種方式:用實(shí)際值與 值之差進(jìn)行編碼

(差值編碼);或是根據(jù)差值的大小,決定是否需傳送該信源符號。nX?量化器器編++enen’+Xn’器器+

+en’nX?發(fā)送端輸出Xn’接收端-輸入XnDPCM系統(tǒng)框圖N

a

Xn'i

nii1X?X’AXX’B

X’C

X’D前一行當(dāng)前行另一場圖像壓縮編碼技術(shù)差分脈沖編碼調(diào)制(DPCM)i,式中N為器階數(shù),a

為n;幀內(nèi)

編碼:所有同一掃描線上稱為一維;若在不同掃描線上稱為二維

。隔行掃描方式僅場內(nèi)預(yù)Ni

nii1a

X

'值X?

n?n

n

nX

'系數(shù),再生值

X?

e'

,

e

’是

誤差的量化值,

誤差

en

Xn

X?

n

,

實(shí)際值與再生值n

n

X

'

e

e'n

n

n與被

像素都在之差即是量化誤差

q

X測,其像素結(jié)構(gòu)如圖:公式設(shè)計:先后關(guān)系, 像素權(quán)值高,最小均方誤差;102圖像壓縮編碼技術(shù)差分脈沖編碼調(diào)制(DPCM)Prisch

公式([P.Pirsch,1980]):典型的圖像

編碼系統(tǒng)中,可以用Laplacian分布來近似描述:誤差幅度1814182'D'C'BAX?

1

X

'

XXXXB’XC’XD’XA’Xepe2eexp22ee的標(biāo)準(zhǔn)差103104圖像壓縮編碼技術(shù)差分脈沖編碼調(diào)制(DPCM)如按照最小均方誤差準(zhǔn)則設(shè)計的量化器,設(shè)置0,±7,±16,±27,±38,±51,±66等13個量化級,即使用定字長編碼也只需要每抽樣

log213=3.7bits,比8bit節(jié)省4.3bit,改用變長Huffman編碼還可進(jìn)一步壓縮碼率;對人眼敏感的平緩/慢運(yùn)動部分量化誤差小,對存在視覺掩蓋效應(yīng)的圖像輪廓區(qū)和快運(yùn)動部分量化誤差大;DPCM主要缺點(diǎn)是抵御誤碼能力差,傳輸中產(chǎn)生的誤碼會使誤差擴(kuò)散到圖像中較大的區(qū)域,通常要加入糾錯保護(hù)的信道編碼并且隔一段時間傳輸一次原始像素的基準(zhǔn)值。圖像壓縮編碼技術(shù)無損JPEG圖像壓縮(JPEG-LS)無損的圖像壓縮,用于一些對于圖像信息完整性要求交高的場合,如醫(yī)學(xué)圖像;壓縮率大約為2;采用DPCM的基本思想,采納了惠普LOCO

算法([Weinberger,

2000]);XB’XC’XD’XA’XotherwiseAA

CBA

CA

CA

C

B

X

'

X

'C

B

X

''''

''

'if

X

'

min'

'X

,

X

X

max(

X

,

X

)minX

,

X

if

X

'

maxX

,

X

?10060659860556058121121121+52-55555258121118105圖像壓縮編碼技術(shù)圖像幀間DPCM思想的拓展,利用性,消除圖像時間冗余;圖像相鄰幀之間的相似對逐行掃描,幀為基本單位;對隔行掃描,由兩個場圖像組成幀,以圖像組為單位。前向雙向I

B

B

P

B

B

I106圖像壓縮編碼技術(shù)圖像幀間I幀:采用幀內(nèi)編碼,編碼不依賴于其它圖像。作為P幀和B幀編/ 的參考幀。使用周期性的I幀便于初始化

和捕獲頻道。I幀出現(xiàn)的頻率可選;P幀:前向 編碼幀,像素(圖像塊)的

值為其前面一幀I幀或P幀中相應(yīng)像素(圖像塊)值;B幀:雙向 編碼幀,像素(圖像塊)的

值為其前后相鄰的I幀或P幀相應(yīng)像素(圖像塊)值的平均。B幀

其它幀的編碼參考。107圖像壓縮編碼技術(shù)108圖像幀間最簡單的幀間用編碼幀和參考幀直接做差‘waterfall’10差圖像‘stefan’20幀‘stefan’24幀差圖像運(yùn)動補(bǔ)償圖像壓縮編碼技術(shù)具有運(yùn)動補(bǔ)償?shù)膸g對每個編碼幀中的16x16圖像宏塊,在參考幀中一定搜索范圍內(nèi),搜索與它亮度最相似的圖像宏塊(匹配宏塊),確定運(yùn)動矢量。運(yùn)動矢量編碼幀參考幀109圖像壓縮編碼技術(shù)具有運(yùn)動補(bǔ)償?shù)膸g運(yùn)動矢量:編碼幀到參考幀像素運(yùn)動方向和距離;運(yùn)動估計:比較參考幀與編碼幀圖像,求出運(yùn)動物體像素的運(yùn)動矢量;運(yùn)動補(bǔ)償:考慮了運(yùn)動矢量的幀間 稱為具有運(yùn)動補(bǔ)償?shù)膸g

;塊匹配運(yùn)動估計:對每個像素進(jìn)行運(yùn)動估計運(yùn)算量巨大,在許多情況下物體上的相鄰像素(圖像塊)做相同的運(yùn)動,這時只需估計其整體的運(yùn)動。110圖像壓縮編碼技術(shù)當(dāng)MSE

(MAD)

達(dá)到最小值的時候,認(rèn)為兩個像素塊匹配,運(yùn)動矢量為對應(yīng)的(i,

j);全搜索運(yùn)算量大,加速算法有三步法、二維對數(shù)法等,但效果不如全搜索,全搜索仍然是通用的方法。最小均方差(MSE)x1

y12N

2x

i,

y

je

rI

x,

y

I

具有運(yùn)動補(bǔ)償?shù)膸g圖像塊匹配的判定常用兩種準(zhǔn)則之一:N

N

1MSEi,

j最小平均絕對差(MAD)x1

y1N

2Ie

x,

y

Ir

x

i,

y

jN

NMSEi,

j

1

111圖像壓縮編碼技術(shù)具有運(yùn)動補(bǔ)償?shù)膸g運(yùn)動估計的搜索精度可以是半像素(MPEG-2),甚至是四分之一像素的(H.264),亞像素級的運(yùn)動補(bǔ)償,需要在參考幀中根據(jù)已知整像素值,用插值方法得到半像素和四分之一像素值以后,再進(jìn)行塊匹配計算;相鄰的運(yùn)動矢量通常具有很強(qiáng)的相關(guān)性,因此可以采用差分編碼的方式降低碼率。112圖像壓縮編碼技術(shù)具有運(yùn)動補(bǔ)償?shù)膸g匹配圖像塊之間的殘差en,可以通過變換編碼的方式進(jìn)一步壓縮。113圖像壓縮編碼技術(shù)變換編碼圖像的正交變換:從不同域描述同一圖像的變換關(guān)系為正交矩陣。主要應(yīng)用有提取特征( 變換中直流項代表圖像平均亮度,高頻項表示邊緣變化的強(qiáng)度和方向)、減少計算維數(shù)(丟棄小變換系數(shù))、壓縮編碼(解除空間相關(guān)性,獨(dú)立信源編碼使數(shù)據(jù)得到壓縮)。Parseval定理:圖像變換前后的總能量(平方和)不變,但能量分布變了。114圖像壓縮編碼技術(shù)變換低頻高頻高頻高頻高頻115圖像壓縮編碼技術(shù)變換編碼能量在空域分布較分散并具隨機(jī)性(隨圖像內(nèi)容變化),但在變換域中減少相關(guān)性后,能量相對集中在局部區(qū)域,可以對能量較少的區(qū)域少分配或者不分配編碼字(限失真編碼)。在眾多的正交變換中,從解除相關(guān)性的意義上說葉變換并不是一種很好的變換。要有效地解除相關(guān)性,正交函數(shù)系必須根據(jù)信源相關(guān)函數(shù)來選擇。按均方誤差最小準(zhǔn)則,K-L變換(Karhunen-Loeve Transform)后的隨 量之間互不相關(guān)。一般認(rèn)為K-L變換是壓縮

編碼的最佳變換,常用作評價其它變換時的參照物,最大缺點(diǎn)是計算復(fù)雜且尚無快速算法。116圖像壓縮編碼技術(shù)變換編碼在變換編碼中數(shù)字圖像先被分割成方塊(例如8×8像素塊),用矩陣X表示的像塊經(jīng)過正交變換后,成為相互獨(dú)立的(8×8)系數(shù)塊,用矩陣Y表示。二維正交變換和反變換:

Y=CXCT(正變換);

X=CTY

C

(反變換)。其中

C

是正交變換矩陣

,

滿足正交矩陣性質(zhì):CCT=CTC=I(單位陣),

CT=C-1

。正交變換方塊化(M

×N)量化編碼正交反變換和解量化發(fā)送端輸入X接收端輸入Y編碼輸出Y輸出X117圖像壓縮編碼技術(shù)變換編碼自然圖像的大部分區(qū)域可以用一階Markov過程(離散隨機(jī)序列中每個元素取值的條件概率只依賴于它前面一個元素)來近似,若相鄰兩元間的相關(guān)系數(shù)(Correlation

Coefficient)接近于1,則K-L變換可以很好的用離散余弦變換(Discrete

Cosine

Transform,

DCT)變換來近似。因此在 壓縮中,DCT被認(rèn)為是性能最接近K-L變換的準(zhǔn)最佳變換;DCT變換1974年由Ahmed等人提出,相當(dāng)于僅包含余弦項離散 變換。118圖像壓縮編碼技術(shù)X(n)離散葉變換119圖像壓縮編碼技術(shù)二維DCT變換圖像塊為8x8,像素下標(biāo)為x,

y:1coscosf

(x,

y)cosC(u)C(v)F

(u,

v)cosx0

y0u0

v0(2x

1)u16(2x

1)u16(2

y

1)v16(2

y

1)v

167

74147

7正變換F(u,

v)

=

C(u)C(v)反變換f

(x,y)=

11201式中:C(u),C(v)=

2u,v

0其他圖像壓縮編碼技術(shù)變換后系數(shù)矩陣隨著行(列)號u(v)增加,行(列)向量的振蕩頻率遞增,構(gòu)成64個基圖像。系數(shù)矩陣Y的右下角對應(yīng)空間頻分量,左上角對應(yīng)空間低分量,其中(0, 0)對應(yīng)空間直流分量稱為DC系數(shù),其高頻余像,63個對應(yīng)交流分量,稱為AC系數(shù)。和 變換相似

能量向低空間頻率集中。因此MPEG-2中

DC

系數(shù)

12bit表示, AC系數(shù)用9bit表

示,而且很多為零。u=8v=8121圖像壓縮編碼技術(shù)DCT變換低頻高頻高頻高頻122圖像壓縮編碼技術(shù)DCT變換DC系數(shù)123AC系數(shù)圖像壓縮編碼技術(shù)1原圖絕對值小于40的DCT系數(shù)置0;所有DCT系數(shù)取整;實(shí)際編碼中使用量化矩陣的方法;987-386620-55000-18701480-5800048700-5800000-52-430000000000000000000000000000000000000反DCT變換24圖像壓縮編碼技術(shù)統(tǒng)計編碼圖像(去相關(guān)之后)存在信息的統(tǒng)計冗余度:某些符號經(jīng)常出現(xiàn),某些符號極少出現(xiàn)。表達(dá)圖像所需的平均碼長的下界等于圖像信息源的信息熵;統(tǒng)計編碼基本思路:用較短的碼字表示高概率出現(xiàn)的符號,而用較長的碼字表示低概率出現(xiàn)的符號;使最終的平均碼長趨近信息熵;最常用的兩種統(tǒng)計編碼:Huffman編碼,游程編碼均屬于分組碼(符號和碼字對應(yīng));算術(shù)編碼(組碼)。125圖像壓縮編碼技術(shù)統(tǒng)計編碼假設(shè)一個信源以概率q1,q2,…,qn

發(fā)出符號s1,s2,…,sn,則該信源的熵定義為:比特/符號nH

s

qi

log2

qii1假設(shè)某種二進(jìn)制編碼,碼字的長度為:l1,

l2,

…,

ln,則其編碼的平均碼長為:nL

l

q

比特/符號

i

ii1L編碼效率

H

sr

1冗余度k

自然二進(jìn)制碼長L壓縮比2126i

E l

2

L

碼方差127圖像壓縮編碼技術(shù)Huffman編碼用概率匹配方法進(jìn)行編碼,概率大的符號編以短碼,概率小的編以長碼,平均碼長最短,接近信源熵,是最佳分組碼和即時碼(任意一個碼字都不是其它碼字的前綴,即時可譯);編碼算法(1)將n個信源符號作為節(jié)點(diǎn),按出現(xiàn)的概率大小依次排列;(2)取兩個最小概率用二叉樹(分別配以0和1碼元),將這兩個概率相加合并成一個新節(jié)點(diǎn),并與其他節(jié)點(diǎn)重新排隊;(3)

對重排后的兩個概率最小的節(jié)點(diǎn)重復(fù)步驟(2);圖像壓縮編碼技術(shù)Huffman編碼編碼算法(接上)(4)不斷繼續(xù)上述過程,直到最后兩個節(jié)點(diǎn) 根節(jié)點(diǎn),并配以0和1為止;(5)從最后一級開始,向前返回可得到各個信源符號所對應(yīng)的碼元序列(即相應(yīng)碼字)。Huffman編碼得到的碼字不唯一。編碼過程中配以0和1是任意的(但全過程必須一致),結(jié)果會得到不同的碼

(但不影響碼長度);合并后重排隊時概率相同節(jié)點(diǎn)的位置次序也可任意,而得到不同的碼(會影響碼長度)。一般重排隊時將合并的概率放在上面盡可能高的位置就可獲得較小的碼方差。128圖像壓縮編碼技術(shù)離散獨(dú)立信號源

S

:0.41s

s2

s3

s4

s5

0.2

0.2

0.1

0.10.1s50.1s40.2s30.2s21.00.4

0.60.40.4s1編碼過程概率qi信源符號si0011400104000301211碼字碼長li1000.2

10.40.20.2

0.2

100.4

10方法一129

2.1219

0.96452.2r

0.0355

3k

2.2

1.362

1.36圖像壓縮編碼技術(shù)

2.1219

0.96452.2r

0.03553k

1.362.22

0.16信源符號si概率qi編碼過程碼長li碼字s10.410.4

0.20.2

10.2

0

0.40.4

10.2

00.60.4101.0211s20.2201s30.2200s40.13101方法二s50.131000130圖像壓縮編碼技術(shù)

2.1219

0.96452.2r

0.03553k

1.362.22

0.16信源符號si概率qi編碼過程碼長li碼字s10.400.4

0.20.2

00.2

1

0.40.4

00.2

10.60.4011.0200s20.2210s30.2211s40.13010方法三s50.130111131圖像壓縮編碼技術(shù)Huffman編碼誤碼擴(kuò)散:由于碼字的長度可變,造成一個比特位的誤碼可能影響到多個碼字的

。信源:s1

s2

s3

s4

s5方法一:1010000010001100100000100011s4

s3

s2

s3

s1

s1方法二:110100101100010100101100s2

s2

s3

s4

s5132圖像壓縮編碼技術(shù)Huffman編碼

Huffman編碼仍存在一些分組碼(每個符號依照固定的碼表

成一個固定碼字)所具有的缺點(diǎn):概率特性必須精確測定,其變化導(dǎo)致碼表更換;對于二元信源(例0,1),常需多個符號 編碼才可能取得好的效果;隨著合并的符號數(shù)增大,碼表中的碼字?jǐn)?shù)很多時設(shè)備將越來越復(fù)雜;對相關(guān)信源編碼效果不令人滿意。133圖像壓縮編碼技術(shù)Huffman編碼的問題信源的符號數(shù)據(jù)很少0a1341ba=0,

b=1圖像壓縮編碼技術(shù)Huffman編碼的問題信源的符號概率嚴(yán)重不對稱A

=

{a,b,c},

P(a)

=

0.95,

P(b)

=

0.02,

P(c)

=0.03H

=

0.335

bits/symbolHa.uf0fman編碼:1110L

=

1.05bits/symbol冗余度=1-H/L

=68%!Can

we

do

better

?10c1350a1b136圖像壓縮編碼技術(shù)考慮符號的序列而不是單個符號LetterProbabilityCodeaa0.90250ab0.0190111ac0.0285100ba0.01901101bb0.0004110011bc0.0006110001ca0.0285101cb0.0006110010cc0.0009110000L

=

1.222/2

=

0.611冗余度=45%137圖像壓縮編碼技術(shù)該思想還可以繼續(xù)擴(kuò)展考慮長度為n的所有可能的mn

序列(已做了32)理論上:考慮更長的序列能提高編碼性能實(shí)際上:字母表的指數(shù)增長將使得這不現(xiàn)實(shí)例如:對長度為3的ASCII序列:2563

=224

=16M需要對長度為n的所有序列產(chǎn)生碼本;很多序列的概率可能為0分布嚴(yán)重不對稱是真正的大問題:A

=

{a,

b,

c},

P(a)

=

0.95,

P(b)

=

0.02,

P(c)

=

0.03H

=

0.335bits/symbolL1

=

1.05,

L2

=

0.611,

…當(dāng)n

=8時編碼性能才變得可接受但此時|alphabet|=38

=6561

!!!圖像壓縮編碼技術(shù)算術(shù)編碼:從另一種角度對很長的信源符號序列進(jìn)行有效編碼對整個序列信源符號串產(chǎn)生一個唯一的標(biāo)識(

tag)直接對序列進(jìn)行編碼(不是碼字的串聯(lián)):

組碼不用對該長度所有可能的序列編碼標(biāo)識是[0,1)之間的一個數(shù)(二進(jìn)制小數(shù),可作為序列的二進(jìn)制編碼)138圖像壓縮編碼技術(shù)考慮對a1a2a3編碼:A

=

{a1,

a2,

a3},

P

=

{0.7,

0.1,

0.2)139圖像壓縮編碼技術(shù)長度為n的序列的算術(shù)編碼的平均碼長為:效率高:當(dāng)信源符號序列很長,平均碼長接近信源的熵140141圖像壓縮編碼技術(shù)游程編碼(Run

Length

Coding)不直接對像素值編碼,而是逐個比較相鄰像素(系數(shù))的值,記錄每個值連續(xù)出現(xiàn)(游程)的長度;一般用一系列二元組(run,level)表示,run可以表示某個值連續(xù)出現(xiàn)的長度,level可以表示游程結(jié)束后像素(系數(shù))的值;一般較適用于二元序列(多元信源需做處理)。序列中“0”和“ 1”可連續(xù)出現(xiàn),連“ 0”這一段稱為“

0”游程,連“

1”這一段稱為“

1”游程,可以僅由各個游程的run來編碼。142圖像壓縮編碼技術(shù)二元序列游程編碼二元序列:011101000000110,1游程交錯編碼:1281551162僅使用0游程編碼:10850000160轉(zhuǎn)換成多元序列之后,可以再進(jìn)行Huffman編碼等;圖像壓縮編碼技術(shù)987386621480-55000-18700-5800048700-5800000-52

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論