版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第5章 限失真信源編碼1.信息率失真函數(shù)2.限失真信源編碼定理3.常用信源編碼方法第三章我們討論了無失真信源編碼。但是,在很多場(chǎng)合,特別是對(duì)于連續(xù)信源,因?yàn)槠浣^對(duì)熵為無限大,若要求無失真地對(duì)其進(jìn)行傳輸,則要求信道的信息傳輸率也為無限大,這是不現(xiàn)實(shí)的。因此也就不可能實(shí)現(xiàn)完全無失真?zhèn)鬏?。另一方面,從無失真信源編碼定理來考慮,由于要求碼字包含的信息量大于等于信源的熵,所以對(duì)于連續(xù)信源,要用無限多個(gè)比特才能完全無失真地來描述。即使對(duì)于離散信源,由于處理的信息量越來越大,使得信息的存儲(chǔ)和傳輸成本很高,而且在很多場(chǎng)合,過高的信息率也沒有必要,例如:由于人耳能夠接收的帶寬和分辨率是有限的,因此對(duì)數(shù)字音頻傳輸
2、的時(shí)候,就允許有一定的失真,并且對(duì)欣賞沒有影響。又如對(duì)于數(shù)字電視,由于人的視覺系統(tǒng)的分辨率有限,并且對(duì)低頻比較敏感,對(duì)高頻不太敏感,因此也可以損失部分高頻分量,當(dāng)然要在一定的限度內(nèi)。等等,這些,都決定了限失真信源編碼的重要性。在限失真信源編碼里,一個(gè)重要的問題就是在一定程度的允許失真限度內(nèi),能把信源信息壓縮到什么程度,即最少用多少比特?cái)?shù)才能描述信源。這個(gè)問題已經(jīng)被香農(nóng)解決。香農(nóng)在1948年的經(jīng)典論文中已經(jīng)提到了這個(gè)問題,在1959年,香農(nóng)又在他的一篇論文“保真度準(zhǔn)則下的離散信源編碼定理”里討論了這個(gè)問題。研究這個(gè)問題并做出較大貢獻(xiàn)的還有前蘇聯(lián)的柯爾莫郭洛夫(Kolmogorov)以及伯格(T.
3、 Berger)等。信息率失真理論矢量化、數(shù)摸轉(zhuǎn)換、頻帶壓縮和數(shù)據(jù)壓縮的理論基礎(chǔ)。本章主要介紹信息率失真理論的基本內(nèi)容,包括信源的失真度和信息率失真函數(shù)的定義與性質(zhì),離散信源和連續(xù)信源的信息率失真函數(shù)計(jì)算,介紹一些常用的限失真編碼方法等。5.1 平均失真和信息率失真函數(shù)平均失真和信息率失真函數(shù)一、失真函數(shù)設(shè)某信源輸出的隨機(jī)變量為X,其值集合為 ,經(jīng)過編碼后輸出為 ,設(shè) 對(duì)應(yīng) ,如果 則認(rèn)為沒有失真。當(dāng) 時(shí),就產(chǎn)生了失真,失真的大小,用失真函數(shù)來衡量。失真函數(shù)的定義為,21nxxxX,21myyyYixjyjiyx mjni, 2 , 1;, 2 , 1jiyx 由于輸入符號(hào)有n個(gè),輸出符號(hào)有m
4、個(gè),所以共有 個(gè),寫成矩陣形式,就是d被稱為失真矩陣。jijijiyxyxaayxd00),(),(jiyxdmn),(),(),(),(1111mnnmyxdyxdyxdyxdd失真函數(shù) 的函數(shù)形式可以根據(jù)需要適當(dāng)選取,如平方代價(jià)函數(shù)、絕對(duì)代價(jià)函數(shù)、均勻代價(jià)函數(shù)等:平方失真:絕對(duì)失真:相對(duì)失真:誤碼失真:),(jiyxd2)(),(jijiyxyxdjijiyxyxd),(ijijixyxyxd/),(其它, 1, 0),(),(jijijiyxyxyxd 也可以按其它的標(biāo)準(zhǔn),如引起的損失、風(fēng)險(xiǎn)、主觀感覺上的差別等來定義失真函數(shù)。二、平均失真 由于信源X和信宿Y都是隨機(jī)變量,所以符號(hào)失真度函
5、數(shù)也是一個(gè)隨機(jī)變量,傳輸時(shí)引起的平均失真應(yīng)該是符號(hào)失真度函數(shù) 在信源概率空間和信宿概率空間求平均,即),(jiyxdnimjjiijiYXnimjjijiyxdxypxpyxdyxpyxdyxpD11,11),()/()(,(),(),(),()平均失真是符號(hào)失真函數(shù)在信源空間和信宿空間平均的結(jié)果,是描述某一信源在某一信道傳輸時(shí)失真的大小,是從整體上描述系統(tǒng)的失真情況。三、信源符號(hào)序列的失真從上面的單符號(hào)失真函數(shù),可以得到信源符號(hào)序列的失真函數(shù)和平均失真度。由于序列時(shí)相當(dāng)于是一個(gè)由單符號(hào)隨機(jī)變量組成的隨機(jī)矢量,仿照單符號(hào)時(shí)的情況,可得:設(shè)信源輸出的符號(hào)序列為 ,其中的每一個(gè)隨機(jī)變量 取自同一符
6、號(hào)集 ,所以X共有 種不同的符號(hào)序列,記為 ,接收到的符號(hào)為 式中每一個(gè)符號(hào)取自符號(hào)集 ,所以Y共有 種不同的符號(hào)序列,記為 ,則 LkjkikjiLyxdd1),(),(,21rxxxix,L21xxxxixLrL21Y,Y,YY,21syyyiYLsij 失真函數(shù)矩陣應(yīng)該是一個(gè) 的矩陣。故對(duì)L長(zhǎng)的信源序列,其平均失真度為 平均每個(gè)符號(hào)的平均失真度為當(dāng)信源無記憶時(shí), ,而LLsr LLrisjjijiYXdpyxdyxpLD11,),(),(),(),()()(1LDLD LkkDLD1)(LkkDLD11 若平均失真度不大于我們所允許的失真D,即 我們稱此為保真度準(zhǔn)則。四、信息率失真函數(shù)
7、在信源給定,并且也定義了具體的失真函數(shù)之后,我們總是希望在滿足一定的失真限度要求的情況下,使信源最后輸出的信息率R盡可能地小。也就是說,要在滿足保真度準(zhǔn)則下( ),尋找信源輸出信息率R的下限值。如果將信源編碼也看成是一個(gè)信道,構(gòu)成了一類假想信道,DD DD 稱為D允許信道(或D失真許可的試驗(yàn)信道),記為 對(duì)于離散無記憶信道,有 我們的目的,就是要在上述允許信道 中,尋找到一個(gè)信道P(Y/X),使得從輸入端傳送過來的信息量最少,即I(X;Y)最小。這個(gè)最小的互信息就稱為信息率失真函數(shù)R(D),簡(jiǎn)稱為率失真函數(shù),即: )/(DDxypPD, 2 , 1;, 2 , 1;: )/(mjniDDxyp
8、PijDDP 其單位是比特/信源符號(hào)。應(yīng)當(dāng)注意,在研究R(D)時(shí),我們引用的條件概率 并沒有實(shí)際信道的含義,只是為了求平均互信息的最小值而引用的、假想的可變?cè)囼?yàn)信道。實(shí)際上這些信道反應(yīng)的僅是不同的有失真信源編碼,或稱信源壓縮。所以改變?cè)囼?yàn)信道求最小值,實(shí)質(zhì)上是選擇一種編碼方式式信息傳輸率為最小,也就是在保真度準(zhǔn)則下,使信源的壓縮率最高。nimjjijijiPPPPypxypxypxpYXIDRDijDij11)(/(log)/()(min);(min)())/(xyp五、信息率失真函數(shù)的性質(zhì) 1. R(D)的定義域 R(D)的定義域,即D的取值范圍。(1)因?yàn)镈是非負(fù)函數(shù)d(x,y)的數(shù)學(xué)期望
9、,因此D也是非負(fù)函數(shù),其下界為0。此時(shí),意味著不允許失真,所以信道的信息率等于信源的熵,即)()0()(XHRDR(2)平均失真D也有一上界值 。根據(jù)R(D)的定義,R(D)是在一定的約束條件下,平均互信息量I(X;Y)的最小值,其下界為0。R(D)和D的關(guān)系曲線一般如下圖所示。當(dāng)D大到一定程度,R(D)就達(dá)到其下界0,我們定義這時(shí)的D為 。maxDmaxD 的計(jì)算:設(shè)當(dāng)平均失真 時(shí),R(D)以達(dá)到其下界0。當(dāng)允許更大失真時(shí),即 時(shí),R(D)仍只能繼續(xù)是0。因?yàn)楫?dāng)X和Y統(tǒng)計(jì)獨(dú)立時(shí),平均互信息I(X;Y)=0,可見當(dāng) 時(shí),信源X和接收符號(hào)Y已經(jīng)統(tǒng)計(jì)獨(dú)立了,因此 ,與x無關(guān)。 maxDR(D)DR
10、(D)0R(D)=0maxDmaxDD maxDD maxDD )()/(ypxyp因此, 就是在R(D)=0的條件下,看在什么樣的分布下,能夠得到的平均失真D的最小值,即也可以改寫成maxD)(ypYXypyxdypxpD,)(max),()()(minYypYXypydypyxdxpypD)()(min),()()(min)()(max也就是說,要求 的數(shù)學(xué)期望的最小值。這個(gè)最小值是一定存在的。比如 這樣分布:當(dāng)某一個(gè) 使得 為最小時(shí),就取 ,而其余的 ,此時(shí)求得的 的數(shù)學(xué)期望一定是最小的。此時(shí),有)(yd)(yp)(jydjy1)(jypjiypi , 0)()(ydXYYyxdxpyd
11、D),()(min)(minmax求解:0110),(),(),(),(22122111yxdyxdyxdyxddmaxD3132,31min032131, 132031min),()(min),()(min)(min2, 12, 1212, 1maxjjijiijXYYyxdxpyxdxpydD例題1:設(shè)輸入輸出符號(hào)表為X=Y=0,1,輸入概率分布為 ,失真矩陣為3/2 , 3/1)(xp而輸出符號(hào)概率為. 1)(, 0)(21ypyp例題2:輸入輸出符號(hào)表同上題,失真矩陣為求解:12121),(),(),(),(22122111yxdyxdyxdyxddmaxD11 ,23min13213
12、1,2322131min),()(min2, 12, 1212, 1maxjjijiijyxdxpD. 1)(, 0)(21ypyp此時(shí),(2)R(D)函數(shù)的單調(diào)遞減性和連續(xù)性R(D)的單調(diào)遞減性是很容易理解的。因?yàn)樵试S的失真越大,所要求的信息率就可以越小。根據(jù)R(D)的定義,他是在平均失真度小于或等于允許失真度D的所有試驗(yàn)信道集合 中,取I(X;Y)的最小值。當(dāng)允許失真D擴(kuò)大,則 的集合也擴(kuò)大,當(dāng)然仍然包含原來滿足條件的所有信道。這是在擴(kuò)大了的 集合中找I(X;Y)的最小值,DPDPDP顯然或者是最小值不變,或者是變小了,所以R(D)是非增的。關(guān)于R(D)的連續(xù)性,這里我們就不再證明了。所以
13、,R(D)有如下基本性質(zhì): ,定義域?yàn)?,當(dāng) 時(shí),R(D)=0。R(D)是關(guān)于D的連續(xù)函數(shù)。R(D)是關(guān)于D的嚴(yán)格遞減函數(shù)。0)(DRmax0DmaxDD 因此,當(dāng)規(guī)定了允許失真,又找到了適當(dāng)?shù)氖д婧瘮?shù) ,就可以找到該失真條件下的最小信息率R(D),用不同的方法進(jìn)行數(shù)據(jù)壓縮時(shí)(在允許的失真限度D內(nèi)),其壓縮的程度如何,可以用R(D)來衡量。由它可知是否還有壓縮潛力,有多大的壓縮潛力。因此,有關(guān)R(D)的研究也是信息論領(lǐng)域的一個(gè)研究熱點(diǎn)。ijd5.2 R(D)的計(jì)算的計(jì)算已知信源的概率分布和失真函數(shù) ,就可以求得信源的R(D)函數(shù)。求R(D)函數(shù),實(shí)際上是一個(gè)求有約束問題的最小值問題。即適當(dāng)選取
14、試驗(yàn)信道的 使平均互信息最小化,并使 滿足以下約束條件)/(xypmimjjijijiypxypxypxpYXI11)()/(log)/()();()/(xypijd 應(yīng)用拉格朗日乘子法,原則上總是可以求出上述問題的界。但一般來說,求解會(huì)是非常復(fù)雜的。這里不準(zhǔn)備做復(fù)雜的推導(dǎo)過程,只給出幾個(gè)結(jié)果。Dyxdxypxpnimjjiiji11),()/()(), 2 , 1;, 2 , 1( , 0)/(mjnixypij1)/(1mjijxyp ,(2)當(dāng) , 時(shí), ,(3)當(dāng) , 時(shí), ,DDRlog)(yxyxd),(xexp2)(DDR1log)(),(),(yxyxdpxppxp1) 1(,
15、) 0()()()(DHpHDR2maxD/1maxD2/112/1maxppppD(1)當(dāng) , 時(shí),2)(),(yxyxd)2exp(21)(22xxp5.3 限失真信源編碼定理(香農(nóng)第三定理)限失真信源編碼定理(香農(nóng)第三定理)設(shè)R(D)為一離散無記憶平穩(wěn)信源的信息率失真函數(shù),并且有有限的失真測(cè)度。則對(duì)于任意的 和 ,當(dāng)信息率RR(D)時(shí),一定存在一種編碼方法,其譯碼失真小于或等于 ,條件是編碼的信源序列長(zhǎng)度L足夠長(zhǎng)。反之,如果RR(D),則無論采用什么編碼方法,其譯碼失真必大于D。 定理說明,在允許失真為D的條件下,信源最小可達(dá)的信息傳輸率是信源的R(D)。0D0D保真度準(zhǔn)則下的信源編碼定
16、理(限失真信源編碼定理)是有失真信源壓縮的理論基礎(chǔ)。定理說明了在允許失真 D 確定后,總存在一種編碼方法,使編碼的信息傳輸率大于 R(D) 且可以任意接近R(D),而平均失真度小于允許失真D。而當(dāng)信息傳輸率小于 R(D) 時(shí),編碼的平均失真將大于 D。可見,R(D) 是允許失真度為 D 的情況下信源信息壓縮的下限值。比較香農(nóng)第一定理和香農(nóng)第三定理可知,當(dāng)信源給定后,無失真信源壓縮的極限值是信源熵 H(X) ,而有失真信源壓縮的極限值是信息率失真函數(shù)R(D)。在給定D后,一般R(D)H(X)。R(D)可以作為衡量各種壓縮編碼方法性能優(yōu)劣的一種尺度。但香農(nóng)第三定理同樣是一個(gè)指出存在性的定理,至于如
17、何尋找這種最佳壓縮編碼方法,定理中沒有給出。在實(shí)際應(yīng)用中,該理論主要存在以下兩類問題: (1)符合實(shí)際信源的R(D)函數(shù)的計(jì)算相當(dāng)困難。首先,對(duì)需要對(duì)實(shí)際信源的統(tǒng)計(jì)特性有確切的數(shù)學(xué)描述,其次,需要符合主客觀實(shí)際的失真度量。這些都不是很容易的事情。即使有了這些,信息率失真函數(shù)的計(jì)算也是相當(dāng)困難的。(2)即使求得了符合實(shí)際的信息率失真函數(shù),還需要研究采用何種編碼方法,才能達(dá)到或接近極限值R(D)。5.6常用信源編碼方法簡(jiǎn)介常用信源編碼方法簡(jiǎn)介 1. 游程編碼 在二元序列中,只有“0”和“1”兩個(gè)碼元,我們把連續(xù)出現(xiàn)的“0”叫做“0”游程,連續(xù)出現(xiàn)的“1”叫做“1”游程。連續(xù)出現(xiàn)“0”或者“1”碼元
18、的個(gè)數(shù)叫做游程長(zhǎng)度。這樣,一個(gè)二元序列可以轉(zhuǎn)換成游程序列,例如:二元序列0001100111100010可以變換成3224311,若規(guī)定游程必須從“0”游程開始,則上述變換是可逆的。如果連“0”或連“1”非常多,則可以達(dá)到信源壓縮的目的。游程編碼是無失真信源編碼。2. 矢量量化 連續(xù)信源進(jìn)行編碼的主要方法是量化,即將連續(xù)的樣值 離散化成為 。n是量化級(jí)數(shù),這樣就把連續(xù)值轉(zhuǎn)化為n個(gè)實(shí)數(shù)中的一個(gè),可以用0,1,2,n等n個(gè)數(shù)字來表示。由于 是一個(gè)標(biāo)量,因此稱為標(biāo)量量化標(biāo)量量化。在量化的過程中,將會(huì)引入失真,量化是必須使這些失真最小。 要想得到更好的性能,僅采用標(biāo)量量化是不可xniyi, 2 , 1
19、,x 能的。從前面的討論我們已經(jīng)知道,把多個(gè)信源符號(hào)組成一個(gè)符號(hào)序列進(jìn)行聯(lián)合編碼可以提高編碼效率。連續(xù)信源也是如此,當(dāng)把多個(gè)信源符號(hào)聯(lián)合起來形成多維矢量,然后進(jìn)行量化,可以進(jìn)一步壓縮碼率,這種量化方法叫做矢量矢量量化量化。 實(shí)驗(yàn)證明,即使各信源符號(hào)相互獨(dú)立,矢量量化也可以壓縮信息率,因此,人們對(duì)矢量量化非常感興趣,是當(dāng)前信源編碼的一個(gè)熱點(diǎn),而 且不僅限于連續(xù)信源,對(duì)離散信源也可以如此。如圖像編碼時(shí)采用矢量量化,但由于聯(lián)合概率密度不易測(cè)定,目前常用的是訓(xùn)練序列的方法,如圖像編碼時(shí)就要采用訓(xùn)練序列的方法,找到其碼書,進(jìn)行量化。還可以與神經(jīng)網(wǎng)絡(luò)方法結(jié)合,利用神經(jīng)網(wǎng)絡(luò)的自組織來得到訓(xùn)練集。 3. 預(yù)測(cè)
20、編碼 預(yù)測(cè)就是從已收到的符號(hào)來提取關(guān)于末收到的符號(hào)的信息,從而預(yù)測(cè)其最可能的制作為預(yù)測(cè)值。并把它與實(shí)際值之差進(jìn)行編碼,由于這個(gè) 差值一般都比較小,所以在編碼時(shí)會(huì)出現(xiàn)很多連“0”值,再采用游程編碼,就可以大大地壓縮碼率。由此可見,預(yù)測(cè)編碼是利用信源符號(hào)之間的相關(guān)性來壓縮碼率的,對(duì)于獨(dú)立信源,預(yù)測(cè)就沒有可能。 4. 變換編碼 變換是一個(gè)廣泛的概念。變換編碼就是經(jīng)變換后的信號(hào)能更有效地編碼,也就是通過變換來 解除或減弱信源符號(hào)間的相關(guān)性,以達(dá)到壓縮碼率的效果(如單頻率正弦波信號(hào),變換到頻域)。一般地,對(duì)一個(gè)函數(shù) ,變換式為: 而反變換為:)(tf0),()(iitiatfTidttitfa0),()
21、( 要使上式成立,要求 必須是正交完備的(相當(dāng)于歐氏空間的坐標(biāo)投影),求 的公式,實(shí)際上就是內(nèi)積運(yùn)算,把函數(shù) 投影到 上去。 信源編碼常用的變換有:DCT(discrete Cosine Transform)變換:如JPEG、MPEG等圖像壓縮標(biāo)準(zhǔn)中,就是主要采用的這種變換壓縮方法。K-L變換:K-L變換是均方誤差準(zhǔn)則下的最佳變換。),( tiia)(tf),( ti 它是一種正交變換,變幻后的隨機(jī)變量之間互不相關(guān),一般認(rèn)為,K-L變換是最佳變換,其最大缺點(diǎn)是計(jì)算復(fù)雜,除了需要測(cè)定相關(guān)函數(shù)和解積分方程外,變換時(shí)的運(yùn)算也十分復(fù)雜,也沒有快速算法,因此,K-L變換不是一種實(shí)用的變換編碼方法,但經(jīng)常用來作為標(biāo)準(zhǔn),評(píng)估其他方法的優(yōu)劣。小波(Wavelet Transform)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- DB51T 1767-2014 煙草漂浮育苗技術(shù)規(guī)程
- DB51T 1598.4-2023 低壓線路電氣火災(zāi)原因認(rèn)定 第4部分:接觸不良
- DB51T 1523-2012 桑蠶白僵病診斷技術(shù)規(guī)程
- 滑觸線項(xiàng)目創(chuàng)業(yè)計(jì)劃書
- 玻璃鏡片項(xiàng)目立項(xiàng)申請(qǐng)報(bào)告
- 橡膠機(jī)械項(xiàng)目實(shí)施方案
- 橡膠成型機(jī)生產(chǎn)加工項(xiàng)目可行性研究報(bào)告
- 2024-2030年新版中國(guó)稀土有機(jī)肥項(xiàng)目可行性研究報(bào)告
- 2024-2030年撰寫:中國(guó)節(jié)水灌溉項(xiàng)目風(fēng)險(xiǎn)評(píng)估報(bào)告
- 2024-2030年撰寫:中國(guó)生物質(zhì)燃?xì)庠O(shè)備項(xiàng)目風(fēng)險(xiǎn)評(píng)估報(bào)告
- 綠色施工技術(shù)在道路工程中的經(jīng)濟(jì)效益與社會(huì)效益
- 2024年中考作文十二大高頻熱點(diǎn)主題1-至愛親情(素材)
- 奧的斯GECS配有 MESD 的 GCS扶梯控制軟件扶梯服務(wù)器調(diào)試手冊(cè)2015
- clsim100-32藥敏試驗(yàn)標(biāo)準(zhǔn)2023中文版
- 廠務(wù)動(dòng)力系統(tǒng)培訓(xùn)課件
- 30題解決方案工程師崗位常見面試問題含HR問題考察點(diǎn)及參考回答
- 浙江2024年01月高考:《政治》科目考試真題與參考答案
- (2024年)臨床檢驗(yàn)醫(yī)學(xué)課件
- 英才計(jì)劃面試常見問題及解答
- 2024年度《蟬》(完美版)課件
- 中科院物理所固體物理考博試題
評(píng)論
0/150
提交評(píng)論