第3章無失真信源編碼-廖-2013-本科生_第1頁(yè)
第3章無失真信源編碼-廖-2013-本科生_第2頁(yè)
第3章無失真信源編碼-廖-2013-本科生_第3頁(yè)
第3章無失真信源編碼-廖-2013-本科生_第4頁(yè)
第3章無失真信源編碼-廖-2013-本科生_第5頁(yè)
已閱讀5頁(yè),還剩168頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第3章

離散信源無失真編碼第3章離散信源無失真編碼

內(nèi)容提要用盡可能少的符號(hào)來傳輸信源消息,目的是提高傳輸效率,這是信源編碼應(yīng)考慮的問題,這章討論在不允許失真情況下的信源編碼。等長(zhǎng)編碼定理給出了等長(zhǎng)編碼條件下,其碼長(zhǎng)的下限值,變長(zhǎng)編碼定理(香農(nóng)第一定理)給出了信源無失真變長(zhǎng)編碼時(shí)其碼長(zhǎng)的上、下限值。本章還介紹了三種通用信源編碼方法:香農(nóng)編碼法、Fano編碼法和霍夫曼編碼法。離散信源:消息集X為離散集合。即時(shí)間和幅度取值都離散的信源。3.1概述為了實(shí)現(xiàn)高質(zhì)量、高效率的通信,引入了信源編碼和信道編碼。信源編碼和信道編碼主要需要解決以下兩個(gè)問題。提高傳輸效率

增強(qiáng)通信的可靠性

信息論的研究對(duì)象--通信系統(tǒng)模型,信源,編碼器,信道,譯碼器,信宿。(1)提高傳輸效率,用盡可能少的信道傳輸符號(hào)來傳遞信源消息,目的是提高傳輸效率,這是信源編碼主要應(yīng)考慮的問題。這里又分兩種情況討論,即允許接收信號(hào)有一定的失真或不允許失真。綜上所述,提高抗干擾能力往往是以降低信息傳輸效率為代價(jià)的,而為了提高傳輸效率又往往削弱了其抗干擾能力。這樣,設(shè)計(jì)者在取舍之間就要作均衡考慮。

(2)

增強(qiáng)通信的可靠性如何增加信號(hào)的抗干擾能力,提高傳輸?shù)目煽啃裕@是信道編碼主要考慮的問題。解決這一問題,一般是采用冗余編碼法,賦予信碼自身一定的糾錯(cuò)和檢錯(cuò)能力,只要采取適當(dāng)?shù)男诺谰幋a和譯碼措施,就可使信道傳輸?shù)牟铄e(cuò)概率降到允許的范圍之內(nèi)。信源編碼包括兩個(gè)功能:(1)

將信源符號(hào)變換成適合信道傳輸?shù)姆?hào);(2)

壓縮信源冗余度,提高傳輸效率。7由于信源符號(hào)之間存在分布不均勻和相關(guān)性,使得信源存在冗余度,信源編碼的主要任務(wù)就是減少冗余,提高編碼效率。

8信源編碼的基本途徑有兩個(gè):使序列中的各個(gè)符號(hào)盡可能地互相獨(dú)立,即解除相關(guān)性;使編碼中各個(gè)符號(hào)出現(xiàn)的概率盡可能地相等,即概率均勻化。9信源編碼的基礎(chǔ)是信息論中的兩個(gè)編碼定理:無失真編碼定理---香農(nóng)第一定律,給出了信源無失真變長(zhǎng)編碼時(shí)其碼長(zhǎng)的上、下限值。限失真編碼定理

無失真編碼只適用于離散信源

對(duì)于連續(xù)信源,只能在失真受限制的情況下進(jìn)行限失真編碼

無失真信源編碼:能夠精確地復(fù)現(xiàn)信源的輸出,保證信源產(chǎn)生的全部信息無損地送給信宿,這時(shí)的信源編碼就是無失真信源編碼。3.1.1信源編碼的相關(guān)概念

編碼器3.1圖3.1信源編碼器3.1書上例子:3.1,3.2信源編碼有以下3種主要方法:(1)匹配編碼根據(jù)信源符號(hào)的概率不同,編碼的碼長(zhǎng)不同:概率大的信源符號(hào),所編的代碼短;概率小的信源符號(hào)所編的代碼長(zhǎng),這樣使平均碼長(zhǎng)最短。將要講述的香農(nóng)編碼、哈夫曼編碼、費(fèi)諾碼都是概率匹配編碼,都是無失真信源編碼。(2)變換編碼先對(duì)信號(hào)進(jìn)行變換,從一種信號(hào)空間變換為另一種信號(hào)空間,然后針對(duì)變換后的信號(hào)進(jìn)行編碼。(3)識(shí)別編碼識(shí)別編碼主要用于印刷或打字機(jī)等有標(biāo)準(zhǔn)形狀的文字符號(hào)和數(shù)據(jù)的編碼,比如中文文字和語(yǔ)音的識(shí)別。后兩種信源編碼均為有失真的信源編碼。無失真信源編碼主要針對(duì)離散信源,連續(xù)信源在量化編碼的過程中必然會(huì)有量化失真,所以對(duì)連續(xù)信源只能近似地再現(xiàn)信源的消息。信源編碼可看成是從信源符號(hào)集到碼符號(hào)集的一種映射,即將信源符號(hào)集中的每個(gè)元素(可以是單符號(hào),也可以是符號(hào)序列)映射成一個(gè)長(zhǎng)度為n的碼字。對(duì)于同一個(gè)信源,編碼方法是多種的?!纠?.3】用{u1

,u2

,u3,u4}表示信源的四個(gè)消息,碼符號(hào)集為{0,1},表3-1列出了該信源的幾種不同編碼。表3-1同一信源的幾種不同編碼信源消息各消息概率碼1碼2碼3碼4u1q(u1)000001u2q(u2)1101110u3q(u3)101000100u4q(u4)11111110003.1.2碼的分類3.變長(zhǎng)碼若碼字集合C中的所有碼字cm(m=1,2,…,M),其碼長(zhǎng)不都相同,碼中的碼字長(zhǎng)短不一,稱碼C為變長(zhǎng)碼,表3-1中列出的碼3、碼4就是變長(zhǎng)碼。2.等長(zhǎng)碼在一組碼字集合C中的所有碼字cm(m=1,2,…,M),其碼長(zhǎng)都相同,碼中所有碼字的長(zhǎng)度,都相同,則稱這組碼C為等長(zhǎng)碼,表3-1中列出的碼1、碼2就碼長(zhǎng)n=2等長(zhǎng)碼。一般,可以將碼簡(jiǎn)單的分成如下幾類:1.二元碼若碼符號(hào)集為{0,1},則碼字就是二元序列,稱為二元碼,二元碼通過二進(jìn)制信道傳輸,這是數(shù)字通信和計(jì)算機(jī)通信中最常見的一種碼,表3-1列出的4種碼都是二元碼。5.非奇異碼從信源消息到碼字的影射是一一對(duì)應(yīng)的,每一個(gè)不同的信源消息都用不同的碼字對(duì)其編碼,若一組碼中所有碼字都不相同,則稱為非奇異碼。例表3-1中的碼2、碼3和碼4都是非奇異碼。4.奇異碼對(duì)奇異碼來說,從信源消息到碼字的影射不是一一對(duì)應(yīng)的。若一組碼中有相同的碼字,則稱為奇異碼。例表3-1中的碼1,信源消息u2和u4都用碼字11對(duì)其編碼,因此這種碼就是奇異碼,奇異碼不具備惟一可譯性。

擴(kuò)展信源

信源編碼器

信源符號(hào){a1,a2,…,aK}

信道符號(hào)(碼符號(hào)){b1,b2,…,bD}

消息

u1

…uN=(u11u12…

u1L)…

(uN1uN2…

uNL)N次擴(kuò)展碼字

c1

…cN=(c11c12…

c1n)…

(cN1cN2…

cNn)圖3-2N次擴(kuò)展信源編碼器模型

原碼的N次擴(kuò)展碼是將信源作N次擴(kuò)展得到的新信源符號(hào)序列u(N)=u1

…uN=(u11u12…

u1L)…

(uN1uN2…

uNL),對(duì)應(yīng)碼符號(hào)序列c(N)=c1

…cN=(c11c12…

c1n)…

(cN1cN2…

cNn),記集合C(N)={c1(N),c2(N),…},C

(N)即原碼C的N次擴(kuò)展碼。6.原碼C的N次擴(kuò)展碼原碼C的N次擴(kuò)展碼中的每個(gè)元素是N次擴(kuò)展信源中的序列所對(duì)應(yīng)的N個(gè)碼字組成的序列。草稿對(duì)于定長(zhǎng)碼,若原碼是惟一可譯碼,則它的N次擴(kuò)展碼也是惟一可譯的,而對(duì)于變長(zhǎng)碼則不盡然,見表3-2。信源消息各消息概率碼1碼2碼3u1q(u1)011u2q(u2)11001u3q(u3)00100001u4q(u4)1110000001表3-2同一信源的幾種不同變長(zhǎng)編碼表3-2同一信源的幾種不同變長(zhǎng)編碼

7.惟一可譯碼定義3.1如果碼的任意N次擴(kuò)展碼都是非奇異碼,則稱該碼為惟一可譯碼。NYY對(duì)于碼1,由于它的每一個(gè)信源符號(hào)對(duì)應(yīng)不同的碼字,所以它本身是唯一可譯,但將它進(jìn)行二次擴(kuò)展后得到的二次擴(kuò)展碼就不唯一可譯,例如,二次擴(kuò)展碼中的u1u3和u3u1對(duì)應(yīng)同一個(gè)碼字000,u2u4和u4u2對(duì)應(yīng)同一個(gè)碼字111,因此碼1不是唯一可譯碼。對(duì)于碼2,碼3不僅本身是唯一可譯碼,進(jìn)行N次擴(kuò)展后得到的N次擴(kuò)展碼也是唯一可譯的,按照定義3.1,碼2、碼3是唯一可譯碼。第三章:離散信源無失真編碼

編碼器碼的分類

1.二元碼:若碼符號(hào)集為{0,1},則碼字就是二元序列,稱為二元碼;2.等長(zhǎng)碼:碼中所有碼字的長(zhǎng)度,都相同;3.變長(zhǎng)碼:碼中的碼字長(zhǎng)短不一;4.奇異碼:若一組碼中有相同的碼字,則稱為奇異碼;5.非奇異碼:若一組碼中所有碼字都不相同。6.原碼C的N次擴(kuò)展碼7.惟一可譯碼:如果碼的任意N次擴(kuò)展碼都是非奇異碼,則稱該碼為惟一可譯碼。8.即時(shí)碼對(duì)于變長(zhǎng)碼,又有如下定義定義3.2

對(duì)于碼字c

=c1c2…

cn,稱c、

=c1c2…

ci(i<n)為碼字c的字頭(前綴)。定義3.3若碼中任一碼字都不是另一碼字的字頭,稱該碼為異字頭碼(無前綴碼)。碼3是無前綴碼,碼1和2都不是無前綴碼表3-2中碼3,收到“1”后就知道一個(gè)碼字已經(jīng)完結(jié),無須等待下一個(gè)符號(hào)抵達(dá),所以無前綴碼能夠即時(shí)譯碼,稱之為即時(shí)可譯碼,簡(jiǎn)稱即時(shí)碼。而對(duì)于碼2,收到“1”后,并不能立即做出判決,就是收到“10”也不能立即做出判決,則還要收到下面的碼元才能做出判決。所以非異字頭碼不能即時(shí)譯碼,稱為非即時(shí)碼,由于非異字頭碼的其中一些碼字是另一些碼字的延長(zhǎng),故也稱延長(zhǎng)碼。顯然,即時(shí)碼是惟一可譯碼,而惟一可譯碼不一定是即時(shí)碼。因?yàn)橛行┓羌磿r(shí)碼(延長(zhǎng)碼)具有唯一可譯性,但不滿足前綴條件,不能即時(shí)譯碼即時(shí)碼可用樹圖法來構(gòu)造。對(duì)給定碼字的全體集合來說,可以用碼樹來描述它,例子下面。所謂樹,既有根,枝,又有節(jié)點(diǎn)。樹中最頂部的節(jié)點(diǎn)稱為根節(jié)點(diǎn),從根出發(fā)向下伸出樹枝,樹枝的數(shù)目等于碼符號(hào)的總數(shù)r。沒有子節(jié)點(diǎn)的節(jié)點(diǎn)稱為葉子節(jié)點(diǎn)。所有根節(jié)點(diǎn)的子節(jié)點(diǎn)稱為一階節(jié)點(diǎn),所有一階節(jié)點(diǎn)的子節(jié)點(diǎn)稱為二階節(jié)點(diǎn),依此類推。n階節(jié)點(diǎn)最多有個(gè)。節(jié)點(diǎn)的階次又稱為節(jié)點(diǎn)的深度。當(dāng)某一節(jié)點(diǎn)被安排為碼字后,它就不再繼續(xù)伸枝,此節(jié)點(diǎn)稱為終端節(jié)點(diǎn),用粗黑點(diǎn)表示。圖3-3用樹圖法編碼樹根編碼深度u1:1u2:01u3:001u4:00011

0u1u2u3u41

1

1

00【例3.4】用樹圖法表示表3-2中的碼3,如圖3-3所示(D=2)。復(fù)習(xí)上次課的內(nèi)容:編碼器碼的分類復(fù)習(xí)上次課的內(nèi)容:碼的分類

1.二元碼:若碼符號(hào)集為{0,1},則碼字就是二元序列,稱為二元碼;2.等長(zhǎng)碼:碼中所有碼字的長(zhǎng)度,都相同;3.變長(zhǎng)碼:碼中的碼字長(zhǎng)短不一;4.奇異碼:若一組碼中有相同的碼字,則稱為奇異碼;5.非奇異碼:若一組碼中所有碼字都不相同。6.原碼C的N次擴(kuò)展碼7.惟一可譯碼:如果碼的任意N次擴(kuò)展碼都是非奇異碼,則稱該碼為惟一可譯碼。8.即時(shí)碼:無需考慮后續(xù)的碼符號(hào)就可以從碼符號(hào)序列中譯出碼字,這樣的唯一可譯碼稱為即時(shí)碼。8.即時(shí)碼對(duì)于變長(zhǎng)碼,又有如下定義定義3.2

對(duì)于碼字c

=c1c2…

cn,稱c、

=c1c2…

ci(i<n)為碼字c的字頭(前綴)。定義3.3若碼中任一碼字都不是另一碼字的字頭,稱該碼為異字頭碼(無前綴碼)。碼3是無前綴碼,碼1和2都不是無前綴碼表3-2中碼3,收到“1”后就知道一個(gè)碼字已經(jīng)完結(jié),無須等待下一個(gè)符號(hào)抵達(dá),所以無前綴碼能夠即時(shí)譯碼,稱之為即時(shí)可譯碼,簡(jiǎn)稱即時(shí)碼。而對(duì)于碼2,收到“1”后,并不能立即做出判決,就是收到“10”也不能立即做出判決,則還要收到下面的碼元才能做出判決。所以非異字頭碼不能即時(shí)譯碼,稱為非即時(shí)碼,由于非異字頭碼的其中一些碼字是另一些碼字的延長(zhǎng),故也稱延長(zhǎng)碼。顯然,即時(shí)碼是惟一可譯碼,而惟一可譯碼不一定是即時(shí)碼。因?yàn)橛行┓羌磿r(shí)碼(延長(zhǎng)碼)具有唯一可譯性,但不滿足前綴條件,不能即時(shí)譯碼即時(shí)碼可用樹圖法來構(gòu)造。對(duì)給定碼字的全體集合來說,可以用碼樹來描述它,例子下面。所謂樹,既有根,枝,又有節(jié)點(diǎn)。樹中最頂部的節(jié)點(diǎn)稱為根節(jié)點(diǎn),從根出發(fā)向下伸出樹枝,樹枝的數(shù)目等于碼符號(hào)的總數(shù)r。沒有子節(jié)點(diǎn)的節(jié)點(diǎn)稱為葉子節(jié)點(diǎn)。所有根節(jié)點(diǎn)的子節(jié)點(diǎn)稱為一階節(jié)點(diǎn),所有一階節(jié)點(diǎn)的子節(jié)點(diǎn)稱為二階節(jié)點(diǎn),依此類推。n階節(jié)點(diǎn)最多有個(gè)。節(jié)點(diǎn)的階次又稱為節(jié)點(diǎn)的深度。當(dāng)某一節(jié)點(diǎn)被安排為碼字后,它就不再繼續(xù)伸枝,此節(jié)點(diǎn)稱為終端節(jié)點(diǎn),用粗黑點(diǎn)表示。圖3-3用樹圖法編碼樹根編碼深度u1:1u2:01u3:001u4:00011

0u1u2u3u41

1

1

00【例3.4】用樹圖法表示表3-2中的碼3,如圖3-3所示(D=2)。即時(shí)碼的樹圖構(gòu)造法我們可以用樹圖的形式構(gòu)造即時(shí)碼,如01001111010010001碼4的樹圖10110000101001000碼3的樹圖樹根——碼字的起點(diǎn)樹枝數(shù)——碼的數(shù)節(jié)點(diǎn)數(shù)——碼字的一部分節(jié)數(shù)——碼長(zhǎng)端點(diǎn)——碼字滿樹——等長(zhǎng)碼非滿樹——變長(zhǎng)碼書上例子3.59同價(jià)碼

同價(jià)碼:每個(gè)碼符號(hào)所占的傳輸時(shí)間都相同的碼。對(duì)同價(jià)碼來說,等長(zhǎng)碼中每個(gè)碼字的傳輸時(shí)間相同。而變長(zhǎng)碼中的每個(gè)碼字的傳輸時(shí)間不一定相同。電報(bào)中常用的莫爾斯碼是非同價(jià)碼,其碼符號(hào)點(diǎn)(.)和劃(-)所占的傳輸時(shí)間不相同。最早的摩爾斯電碼是一些表示數(shù)字的點(diǎn)和劃。數(shù)字對(duì)應(yīng)單詞,需要查找一本代碼表才能知道每個(gè)詞對(duì)應(yīng)的數(shù)。用一個(gè)電鍵可以敲擊出點(diǎn)、劃以及中間的停頓。雖然摩爾斯發(fā)明了電報(bào),但他缺乏相關(guān)的專門技術(shù)。他與艾爾菲德·維爾簽定了一個(gè)協(xié)議,讓他幫自己制造更加實(shí)用的設(shè)備。艾爾菲德·維爾構(gòu)思了一個(gè)方案,通過點(diǎn)、劃和中間的停頓,可以讓每個(gè)字元和標(biāo)點(diǎn)符號(hào)彼此獨(dú)立地發(fā)送出去。他們達(dá)成一致,同意把這種標(biāo)識(shí)不同符號(hào)的方案放到摩爾斯的專利中。這就是現(xiàn)在我們所熟知的美式摩爾斯電碼。10.分組碼和非分組碼

定義

將信源符號(hào)集中的每個(gè)信源符號(hào)固定地映射成一個(gè)碼字Wi,這樣的碼稱為分組碼。用分組碼對(duì)信源符號(hào)進(jìn)行編碼時(shí),為了使接收端能夠迅速準(zhǔn)確地將碼譯出,分組碼必須具有一些直觀屬性。與分組碼對(duì)應(yīng)的是非分組碼,又稱為樹碼、樹碼編碼器輸出的碼符號(hào)通常與編碼器的所有信源符號(hào)都有關(guān)。si圖3-5碼的分類結(jié)構(gòu)圖

圖3-5是碼的分類結(jié)構(gòu)圖

由上面的結(jié)構(gòu)圖可看出,我們只討論非奇異碼。非奇異碼又分為惟一可譯碼和非惟一可譯碼兩大類,我們只討論惟一可譯碼。

3.1.3平均碼長(zhǎng)的計(jì)算

對(duì)于變長(zhǎng)碼,碼集C的平均碼長(zhǎng),用符號(hào)表示,定義為碼C中每個(gè)碼字cm(m=1,2,…,M)其碼長(zhǎng)的概率加權(quán)平均值為 (3-1)式中nm是碼字cm所對(duì)應(yīng)的碼字的長(zhǎng)度,p(cm

)是碼字cm出現(xiàn)的概率。對(duì)于等長(zhǎng)碼,由于碼集C中的每個(gè)碼字的碼長(zhǎng)都相同,平均碼長(zhǎng)就等于每個(gè)碼字的碼長(zhǎng)書上例子P54頁(yè),計(jì)算平均碼長(zhǎng)n1,n2,n3,n4N次擴(kuò)展碼的平均碼長(zhǎng)等于擴(kuò)展碼中碼字長(zhǎng)度的概率加權(quán)平均值。對(duì)于2次擴(kuò)展碼,有:

(3-2)設(shè)nm,

ns分別是原信源消息um,

us所對(duì)應(yīng)的碼長(zhǎng),cm,

cs是um,

us所對(duì)應(yīng)的碼字,則式(3-2)中的nm+ns是擴(kuò)展后新的信源序列nmns所對(duì)應(yīng)的碼字cmcs的長(zhǎng)度,q(um)q(us)是cmcs出現(xiàn)的概率。書上的例子3.63.1.4信息傳輸速率信道的信息傳輸速率為信道單位時(shí)間內(nèi)所傳輸?shù)膶?shí)際信息量。若信息量以比特為單位,時(shí)間以秒為單位,則信息傳輸率定義為: (比特/秒)(3-3)若信息量以比特為單位,時(shí)間以碼元時(shí)間(傳輸一個(gè)碼符號(hào)的時(shí)間)為單位,則信息傳輸率記為

(比特/碼元時(shí)間) (3-4)

為編碼后的平均碼長(zhǎng);H(X)為信源熵;式中:t為傳輸一個(gè)碼符號(hào)的時(shí)間??梢钥闯觯叫?,則越大,信息傳輸率就越高,因此我們感興趣的碼是使平均碼長(zhǎng)最短的碼。書上例子。3.7【例3.8】

給定信源,為提高傳輸效率,使平均碼長(zhǎng)盡可能短,遵照概率大取碼長(zhǎng)短,概率小取碼長(zhǎng)長(zhǎng)的原則對(duì)上述信源進(jìn)行二進(jìn)制不等長(zhǎng)編碼,得到,求編碼后的信息傳輸率RD。解:根據(jù)定義如果碼的任意N次擴(kuò)展碼都是非奇異碼,則稱該碼為惟一可譯碼。(非奇異碼為碼中所有碼字都不相同)DS2S3:10110,S5S1:10110FS1S4:0110S6S1:0110信源S共有q=4個(gè)信源符號(hào),s1,s2,s3,s4,現(xiàn)進(jìn)行二元等長(zhǎng)編碼,其中碼符號(hào)個(gè)數(shù)r=2,則根據(jù)5.1式可知,存在唯一可譯等長(zhǎng)碼的條件是碼長(zhǎng)l必須不小于2如果N=1,則,則與前面的5.1式一樣。l/N是平均每個(gè)信源符號(hào)所需要的碼符號(hào)個(gè)數(shù),表明對(duì)于等長(zhǎng)唯一可譯碼,每個(gè)信源符號(hào)至少需要用個(gè)碼符號(hào)來變換,也就是說,每個(gè)信源符號(hào)所需最短的碼長(zhǎng)為個(gè)。當(dāng)r=2(二元碼)時(shí),logr=1.則式5.2成為這結(jié)果表明,對(duì)于二元等長(zhǎng)唯一可譯碼,每個(gè)信源符號(hào)至少需要用logq個(gè)二元符號(hào)來變換,也表明對(duì)信源進(jìn)行二元等長(zhǎng)不失真編碼時(shí),每個(gè)信源符號(hào)所需碼長(zhǎng)的極限值為logq個(gè)。定理3.1

等長(zhǎng)編碼定理

設(shè)離散無記憶信源S={x1

,x2

,…,xk}的熵為H(X),S的L維擴(kuò)展信源為,對(duì)信源輸出的L長(zhǎng)序列si,i=1,2,…,KL進(jìn)行等長(zhǎng)編碼,碼字是長(zhǎng)度為n的D進(jìn)制符號(hào)串,當(dāng)滿足條件,則L→∞時(shí),可使譯碼差錯(cuò)pe<δ(ε、δ為無窮小量);反之,當(dāng) 時(shí),則不可能實(shí)現(xiàn)無差錯(cuò)編碼。定理3.1

等長(zhǎng)編碼定理將定理要求的下界與式(3-6)要求的下界作一個(gè)比較:H(X)是單符號(hào)信源S={x1

,x2

,…,xk}的熵,根據(jù)極大離散熵定理,信源等概分布時(shí)熵值最大,其最大值為logk,即有H(X)

logK,這就說明了定理3.1要求的下界比式(3-6)要求的下界更緊致,對(duì)的要求更低。

仍然考慮[例3-7]中所列舉的英文字符信源,根據(jù)式(3-6),可求出根據(jù)定理3.1要求,可求出顯然n1>n2,實(shí)際上由于要求碼長(zhǎng)取整數(shù),故只能取n1=n2=5。n為碼長(zhǎng)----lK信源的符號(hào)個(gè)數(shù)----qD碼符號(hào)個(gè)數(shù)---rn為碼長(zhǎng)----lL為信源序列長(zhǎng)度---N編碼效率定理3.1要求,即,可看出比值是一個(gè)小于1的無量綱純數(shù),定義它為等長(zhǎng)編碼的編碼效率,記為

(3-7)

定理3.1要求,是為了實(shí)現(xiàn)無差錯(cuò)編碼每個(gè)信源符號(hào)所需要的最少碼符號(hào)數(shù),這是等長(zhǎng)碼編碼時(shí)的理論極限。事實(shí)上這種幾乎無失真的代價(jià)是要求信源序列長(zhǎng)L→∞,L大就意味著實(shí)現(xiàn)的復(fù)雜性及譯碼的時(shí)延加大。n為碼長(zhǎng)----lL為信源序列長(zhǎng)度---ND碼符號(hào)個(gè)數(shù)---r例子3.9P583.3變長(zhǎng)碼及變長(zhǎng)編碼定理

3.3.1變長(zhǎng)碼對(duì)變長(zhǎng)碼的討論是在L足夠大的條件下得到的結(jié)論,當(dāng)L為有限值時(shí),則總會(huì)帶來一定程度的失真。對(duì)于變長(zhǎng)碼,往往在L不是很大的情況下就可編出高效且無失真的碼。變長(zhǎng)碼也要求原碼的任意L次擴(kuò)展碼也是惟一可譯的。變長(zhǎng)碼分為即時(shí)碼和延長(zhǎng)碼,為保證即時(shí)譯碼,要求變長(zhǎng)惟一可譯碼采用即時(shí)碼。對(duì)于變長(zhǎng)碼,要求整個(gè)碼集的平均碼長(zhǎng)力求最小,此時(shí)編碼效率最高。對(duì)于給定信源,使平均碼長(zhǎng)達(dá)到最小的編碼方法,稱為最佳編碼,得到的碼集稱為最佳碼。3.3.2克拉夫特不等式定理3.2

D進(jìn)制碼字集合C={c1,c2,…,cM},碼集中每一cm(m=1,2,…,M)都是一個(gè)D進(jìn)制符號(hào)串,設(shè)c1,c2,…,cM對(duì)應(yīng)的碼長(zhǎng)分別是n1,n2,

…,nM

,則存在唯一可譯碼的充要條件是

(3-10)

式(3-10)也稱克拉夫特不等式

定理3.2只是說是存在惟一可譯碼的充要條件,這里強(qiáng)調(diào)的是“存在”,但它并不是唯一可譯碼的充要條件,換言之,惟一可譯碼一定滿足克拉夫特不等式,反之,滿足克拉夫特不等式的碼不一定是惟一可譯碼。

575.1編碼的定義例:設(shè)二進(jìn)制碼樹中X(a1,a2,a3,a4),l1=1,l2=2,l3=2,l4=3,應(yīng)用上述判斷定理:

因此不存在滿足這種li的唯一可譯碼。

585.1編碼的定義a1=1

01

01

01a2=01a3=001a4=000{1,01,001,000}

惟一可譯碼;{1,01,101,000}

不是惟一可譯碼;均滿足克勞夫特不等式595.1編碼的定義克勞夫特不等式只是用來說明唯一可譯碼是否存在,并不能作為唯一可譯碼的判據(jù)。3.3.3變長(zhǎng)編碼定理定理3.3

給定熵為H(X)的離散無記憶信源,及有D個(gè)元素的碼符號(hào)集,則總可找到一種無失真編碼方法,構(gòu)成惟一可譯碼,其平均碼長(zhǎng)滿足: (3-19)證明:(1)先證下界,即證。設(shè)離散無記憶信源含M個(gè)消息,信源熵為H(X),其統(tǒng)計(jì)模型為

則:(利用克拉夫特不等式)當(dāng)即

時(shí),上式中等號(hào)成立,有

→這時(shí)得到的碼就是緊致碼,意味著信源消息概率分布q(xm)必須有(hm為整數(shù))的形式,直接取各消息碼字的碼長(zhǎng)nm等于q(xm)所對(duì)應(yīng)的指數(shù)hm即可。這就是[例3.8]所例舉的情況,在[例3.8]中,信源分布可以表示為取信源各消息相應(yīng)的碼字的碼長(zhǎng)等于其分布概率所對(duì)應(yīng)的指數(shù),即n0=2n1=2n2=3n3=3n4=4n5=4n6=4n7=4得到的信源編碼就是緊致碼(最佳碼)。[定理3.3]說明,只有滿足否則惟一可譯碼不存在。但平均碼長(zhǎng)應(yīng)該小于,這是按應(yīng)盡可能短的要求,這時(shí)得到的碼是最佳碼,其實(shí),也能找到惟一可譯碼。

,才能構(gòu)成惟一可譯碼,【例3.10】

信源對(duì)信源進(jìn)行二進(jìn)制變長(zhǎng)編碼,D=2,信源各消息概率恰好表示成D=2的整數(shù)次冪,取碼長(zhǎng)等于其冪次,即取n1=1n2=2n3=3n4=3對(duì)信源各消息編碼,得到的碼就是緊致碼,下面計(jì)算RD。(碼元/符號(hào))因?yàn)樾畔鬏斅蔙D的值小于等于1,所以上述RD=1達(dá)到最大值,得到的碼集為緊致碼。(比特/碼元時(shí)間)【例3.11】對(duì)下述信源進(jìn)行二進(jìn)制變長(zhǎng)編碼,

根據(jù)式(3-20),即碼長(zhǎng)nm

應(yīng)滿足tm

nm<

tm

+1

,tm是消息xm(m=1,2,3,4,5)的2次冪概率所對(duì)應(yīng)的冪次,取{x1,x2,x3,x4,x5}所對(duì)應(yīng)的碼字的碼長(zhǎng)分別為n1=3n2=4n3=2n4=3

n5=2,計(jì)算出平均碼長(zhǎng)熵

=2.228(比特/符號(hào))

滿足式(3-19)

則有

定理3.4

變長(zhǎng)編碼定理(Shannon第一定理)

給定熵為H(X)的離散無記憶信源,其L次擴(kuò)展信源的熵記為H(X),給定有D個(gè)元素的碼符號(hào)集,對(duì)擴(kuò)展信源進(jìn)行編碼,總可以找到一種惟一可譯碼,使碼長(zhǎng)滿足(3-23)

定理3.3推廣到L次擴(kuò)展信源,就得到如下定理,即Shannon第一定理記為信源每個(gè)符號(hào)所對(duì)應(yīng)的平均碼字?jǐn)?shù),則式(3-23)為

(3-24)

Shannon第一定理的物理意義在于:對(duì)信源進(jìn)行編碼,使編碼后的碼集中各碼字盡可能等概分布,如果將這碼集看成為一個(gè)新的信源,這時(shí)新信源所含信息量最大。定義編碼效率(3-26)η是一個(gè)無量綱的數(shù),一般情況下η<1,在極限情況下η=1。講書上例子3.12,3.13,P66對(duì)于同一種信源,三種編碼法中以香農(nóng)編碼法的編碼效率最低,費(fèi)諾編碼法也不是一種最佳編碼法,但用這種方法有時(shí)候也能找到緊致碼。一般情況下,霍夫曼編碼法得到的平均碼長(zhǎng)最短,即編碼效率最高。3.4變長(zhǎng)碼的編碼方法香農(nóng)(Shannon)編碼法費(fèi)諾(Fano)編碼法霍夫曼(Huffman)編碼法變長(zhǎng)編碼法:705.2無失真信源編碼最佳變長(zhǎng)編碼

凡是能載荷一定的信息量,且碼字的平均長(zhǎng)度最短,可分離的變長(zhǎng)碼的碼字集合稱為最佳變長(zhǎng)碼。

715.2無失真信源編碼能獲得最佳碼的編碼方法主要有:香農(nóng)(Shannon)費(fèi)諾(Fano)哈夫曼(Huffman)等

725.2無失真信源編碼香農(nóng)(Shannon)編碼1.將信源消息符號(hào)按其出現(xiàn)的概率大小依次排列2.確定滿足下列不等式的整數(shù)碼長(zhǎng)Ki。735.2無失真信源編碼為了編成唯一可譯碼,計(jì)算第i個(gè)消息的累加概率將累加概率Pi變換成二進(jìn)制數(shù)。取Pi二進(jìn)數(shù)的小數(shù)點(diǎn)后Ki位即為該消息符號(hào)的二進(jìn)制碼字。745.2無失真信源編碼例設(shè)信源共7個(gè)符號(hào)消息,其概率和累加概率如下表所示。---后面有題目

【例3.14】對(duì)給定信源

進(jìn)行D=2進(jìn)制香農(nóng)編碼。消息符號(hào)ai消息概率qi-log2qi碼長(zhǎng)ni累加概率碼字cia10.22.3430000a20.192.4130.2001a30.182.4830.39011a40.172.5630.57100a50.152.7430.74101a60.103.3440.891110a70.016.6670.991111110

表3-8香農(nóng)編碼

765.2無失真信源編碼信源消息符號(hào)ai符號(hào)概率(ai)累加概率Pi-logp(ai)碼字長(zhǎng)度Ki碼字a10.2002.323000a20.190.22.393001a30.180.392.473011a40.170.572.563100a50.150.742.743101a60.100.893.3241110a70.010.996.6471111110以消息x5為例,對(duì)其進(jìn)行編碼:計(jì)算出-logq(x5)=-log0.15=2.74,取整數(shù)n5=3作為x5的碼字的碼長(zhǎng),計(jì)算出消息x1,x2,x3,x4累加概率將0.74變換成二進(jìn)制小數(shù)(0.74)10=(0.1011110)2,取小數(shù)點(diǎn)后面三位101作為x5的代碼。

計(jì)算該編碼的編碼效率

先算出信源熵=2.61(比特/符號(hào))平均碼長(zhǎng)=3.14(比特/符號(hào))則編碼效率

785.2無失真信源編碼以i=4為例,復(fù)習(xí)上一次課的主要內(nèi)容一、平均碼長(zhǎng)的計(jì)算二、等長(zhǎng)編碼定理三、變長(zhǎng)編碼定理(Shannon第一定理)3.1.3平均碼長(zhǎng)的計(jì)算

對(duì)于變長(zhǎng)碼,碼集C的平均碼長(zhǎng),用符號(hào)表示,定義為碼C中每個(gè)碼字cm(m=1,2,…,M)其碼長(zhǎng)的概率加權(quán)平均值為 (3-1)式中nm是碼字cm所對(duì)應(yīng)的碼字的長(zhǎng)度,p(cm

)是碼字cm出現(xiàn)的概率。對(duì)于等長(zhǎng)碼,由于碼集C中的每個(gè)碼字的碼長(zhǎng)都相同,平均碼長(zhǎng)就等于每個(gè)碼字的碼長(zhǎng)3.1.4信息傳輸速率信道的信息傳輸速率為信道單位時(shí)間內(nèi)所傳輸?shù)膶?shí)際信息量。若信息量以比特為單位,時(shí)間以秒為單位,則信息傳輸率定義為: (比特/秒)(3-3)若信息量以比特為單位,時(shí)間以碼元時(shí)間(傳輸一個(gè)碼符號(hào)的時(shí)間)為單位,則信息傳輸率記為

(比特/碼元時(shí)間) (3-4)

為編碼后的平均碼長(zhǎng);H(X)為信源熵;式中:t為傳輸一個(gè)碼符號(hào)的時(shí)間??梢钥闯?,越小,則越大,信息傳輸率就越高,因此我們感興趣的碼是使平均碼長(zhǎng)最短的碼。信源S共有q=4個(gè)信源符號(hào),s1,s2,s3,s4,現(xiàn)進(jìn)行二元等長(zhǎng)編碼,其中碼符號(hào)個(gè)數(shù)r=2,則根據(jù)5.1式可知,存在唯一可譯等長(zhǎng)碼的條件是碼長(zhǎng)l必須不小于2如果N=1,則,則與前面的5.1式一樣。l/N是平均每個(gè)信源符號(hào)所需要的碼符號(hào)個(gè)數(shù),表明對(duì)于等長(zhǎng)唯一可譯碼,每個(gè)信源符號(hào)至少需要用個(gè)碼符號(hào)來變換,也就是說,每個(gè)信源符號(hào)所需最短的碼長(zhǎng)為個(gè)。當(dāng)r=2(二元碼)時(shí),logr=1.則式5.2成為這結(jié)果表明,對(duì)于二元等長(zhǎng)唯一可譯碼,每個(gè)信源符號(hào)至少需要用logq個(gè)二元符號(hào)來變換,也表明對(duì)信源進(jìn)行二元等長(zhǎng)不失真編碼時(shí),每個(gè)信源符號(hào)所需碼長(zhǎng)的極限值為logq個(gè)。定理3.1

等長(zhǎng)編碼定理

設(shè)離散無記憶信源S={x1

,x2

,…,xk}的熵為H(X),S的L維擴(kuò)展信源為,對(duì)信源輸出的L長(zhǎng)序列si,i=1,2,…,KL進(jìn)行等長(zhǎng)編碼,碼字是長(zhǎng)度為n的D進(jìn)制符號(hào)串,當(dāng)滿足條件,則L→∞時(shí),可使譯碼差錯(cuò)pe<δ(ε、δ為無窮小量);反之,當(dāng) 時(shí),則不可能實(shí)現(xiàn)無差錯(cuò)編碼。定理3.1

等長(zhǎng)編碼定理編碼效率定理3.1要求,即,可看出比值是一個(gè)小于1的無量綱純數(shù),定義它為等長(zhǎng)編碼的編碼效率,記為

(3-7)

定理3.1要求,是為了實(shí)現(xiàn)無差錯(cuò)編碼每個(gè)信源符號(hào)所需要的最少碼符號(hào)數(shù),這是等長(zhǎng)碼編碼時(shí)的理論極限。事實(shí)上這種幾乎無失真的代價(jià)是要求信源序列長(zhǎng)L→∞,L大就意味著實(shí)現(xiàn)的復(fù)雜性及譯碼的時(shí)延加大。n為碼長(zhǎng)----lL為信源序列長(zhǎng)度---ND碼符號(hào)個(gè)數(shù)---r3.3變長(zhǎng)碼及變長(zhǎng)編碼定理

3.3.1變長(zhǎng)碼對(duì)變長(zhǎng)碼的討論是在L足夠大的條件下得到的結(jié)論,當(dāng)L為有限值時(shí),則總會(huì)帶來一定程度的失真。對(duì)于變長(zhǎng)碼,往往在L不是很大的情況下就可編出高效且無失真的碼。對(duì)于變長(zhǎng)碼,要求整個(gè)碼集的平均碼長(zhǎng)力求最小,此時(shí)編碼效率最高。對(duì)于給定信源,使平均碼長(zhǎng)達(dá)到最小的編碼方法,稱為最佳編碼,得到的碼集稱為最佳碼。3.3.2克拉夫特不等式定理3.2

D進(jìn)制碼字集合C={c1,c2,…,cM},碼集中每一cm(m=1,2,…,M)都是一個(gè)D進(jìn)制符號(hào)串,設(shè)c1,c2,…,cM對(duì)應(yīng)的碼長(zhǎng)分別是n1,n2,

…,nM

,則存在唯一可譯碼的充要條件是

(3-10)

式(3-10)也稱克拉夫特不等式

定理3.2只是說是存在惟一可譯碼的充要條件,這里強(qiáng)調(diào)的是“存在”,但它并不是唯一可譯碼的充要條件,換言之,惟一可譯碼一定滿足克拉夫特不等式,反之,滿足克拉夫特不等式的碼不一定是惟一可譯碼。

3.3.3變長(zhǎng)編碼定理定理3.3

給定熵為H(X)的離散無記憶信源,及有D個(gè)元素的碼符號(hào)集,則總可找到一種無失真編碼方法,構(gòu)成惟一可譯碼,其平均碼長(zhǎng)滿足: (3-19)[定理3.3]說明,只有滿足否則惟一可譯碼不存在。但平均碼長(zhǎng)應(yīng)該小于,這是按應(yīng)盡可能短的要求,這時(shí)得到的碼是最佳碼,其實(shí),也能找到惟一可譯碼。

,才能構(gòu)成惟一可譯碼,定理3.4

變長(zhǎng)編碼定理(Shannon第一定理)

給定熵為H(X)的離散無記憶信源,其L次擴(kuò)展信源的熵記為H(X),給定有D個(gè)元素的碼符號(hào)集,對(duì)擴(kuò)展信源進(jìn)行編碼,總可以找到一種惟一可譯碼,使碼長(zhǎng)滿足(3-23)

定理3.3推廣到L次擴(kuò)展信源,就得到如下定理,即Shannon第一定理記為信源每個(gè)符號(hào)所對(duì)應(yīng)的平均碼字?jǐn)?shù),則式(3-23)為

(3-24)

Shannon第一定理的物理意義在于:對(duì)信源進(jìn)行編碼,使編碼后的碼集中各碼字盡可能等概分布,如果將這碼集看成為一個(gè)新的信源,這時(shí)新信源所含信息量最大。定義編碼效率(3-26)η是一個(gè)無量綱的數(shù),一般情況下η<1,在極限情況下η=1。對(duì)于同一種信源,三種編碼法中以香農(nóng)編碼法的編碼效率最低,費(fèi)諾編碼法也不是一種最佳編碼法,但用這種方法有時(shí)候也能找到緊致碼。一般情況下,霍夫曼編碼法得到的平均碼長(zhǎng)最短,即編碼效率最高。3.4變長(zhǎng)碼的編碼方法香農(nóng)(Shannon)編碼法費(fèi)諾(Fano)編碼法霍夫曼(Huffman)編碼法變長(zhǎng)編碼法:945.2無失真信源編碼香農(nóng)(Shannon)編碼1.將信源消息符號(hào)按其出現(xiàn)的概率大小依次排列2.確定滿足下列不等式的整數(shù)碼長(zhǎng)Ki。955.2無失真信源編碼計(jì)算第i個(gè)消息的累加概率將累加概率Pi變換成二進(jìn)制數(shù)。取Pi二進(jìn)數(shù)的小數(shù)點(diǎn)后Ki位即為該消息符號(hào)的二進(jìn)制碼字。例1,對(duì)單符號(hào)離散信源編二進(jìn)制香農(nóng)碼,并計(jì)算其編碼效率。解:①將xi按概率進(jìn)行降序排列xip(xi)pa(xj)ki碼字x10.5x20.3x30.15x40.05②令p(x0)=0,計(jì)算第j-1個(gè)碼字的累加概率pa(x1)=0pa(x2)=0+0.5=0.5pa(x3)=0.5+0.3=0.8pa(x4)=0.8+0.15=0.95③確定第i個(gè)碼字的碼長(zhǎng)ki:④將pa(xj)用二進(jìn)制表示,取小數(shù)點(diǎn)后ki位作為xi的碼字pa(x1)=0.0=(0.0)2→0pa(x2)=0.5=(0.10)2→10pa(x3)=0.8=(0.110…)2→110pa(x4)=0.95=(0.11110…)2→11110xip(xi)pa(xj)ki碼字x10.5010x20.30.5210x30.150.83110x40.050.95511110信息傳輸率=1035.2無失真信源編碼費(fèi)諾編碼方法費(fèi)諾編碼屬于概率匹配編碼(1)將信源消息符號(hào)按其出現(xiàn)的概率大小依次排列:(2)將依次排列的信源符號(hào)按概率值分為兩大組,使兩個(gè)組的概率之和近于相同,并對(duì)各組賦予一個(gè)二進(jìn)制碼元“0”和“1”。1045.2無失真信源編碼(3)將每一大組的信源符號(hào)進(jìn)一步再分成兩組,使劃分后的兩個(gè)組的概率之和近于相同,并又賦予兩個(gè)組一個(gè)二進(jìn)制符號(hào)“0”和“1”。(4)如此重復(fù),直至每個(gè)組只剩下一個(gè)信源符號(hào)為止。(5)信源符號(hào)所對(duì)應(yīng)的碼字即為費(fèi)諾碼。1055.2無失真信源編碼例對(duì)以下信源進(jìn)行費(fèi)諾編碼。

消息符號(hào)ai各個(gè)消息概率p(ai)第一次分組第二次分組第三次分組第四次分組二元碼字碼長(zhǎng)Kia10.2000002a20.19100103a30.1810113a40.1710102a50.15101103a60.101011104a70.011111141065.2無失真信源編碼

碼元/符號(hào)

bit/符號(hào)

1095.2無失真信源編碼

哈夫曼編碼方法(1)將信源消息符號(hào)按其出現(xiàn)的概率大小依次排列,(2)取兩個(gè)概率最小的字母分別配以0和1兩個(gè)碼元,并將這兩個(gè)概率相加作為一個(gè)新字母的概率,與未分配的二進(jìn)符號(hào)的字母重新排隊(duì)。Thesixthweek1105.2無失真信源編碼(3)對(duì)重排后的兩個(gè)概率最小符號(hào)重復(fù)步驟(2)的過程。(4)不斷繼續(xù)上述過程,直到最后兩個(gè)符號(hào)配以0和1為止。(5)從最后一級(jí)開始,向前返回得到各個(gè)信源符號(hào)所對(duì)應(yīng)的碼元序列,即相應(yīng)的碼字?!纠?.15】

對(duì)[例3.14]給出的信源進(jìn)行費(fèi)諾編碼

(1)將信源消息分成兩個(gè)子集{

x1,x2,x3}和{

x4,x5,x6,x7},兩個(gè)子集的和概率分別為0.2+0.19+0.18=0.57與0.17+0.15+0.10+0.01=0.43,賦予第一個(gè)子集碼元“0”,賦予第二個(gè)子集碼元“1”;

(2)又將子集分成和概率盡可能接近相等的兩個(gè)子集,分別賦予第一個(gè)子集碼元“0”,賦予第二個(gè)子集碼元“1”;

(3)一直進(jìn)行下去,直到每個(gè)子集僅含一個(gè)消息為止。

該編碼的編碼效率:[例3.14]中已算出信源熵H(X)=2.61(比特/符號(hào))

平均碼長(zhǎng)=2.74則編碼效率:

1125.2無失真信源編碼例對(duì)以下信源進(jìn)行哈夫曼編碼

信源符號(hào)ai概率p(ai)碼字Wi碼長(zhǎng)Kia10.20102a20.19112a30.180003a40.170013a50.150103a60.1001104a70.01011141135.2無失真信源編碼0.20 0.200.260.350.390.611.00.190.190.200.260.350.390.180.180.190.200.260.170.170.180.190.150.150.170.100.110.010101010101011145.2無失真信源編碼

碼元/符號(hào)

bit/符號(hào)

1215.2無失真信源編碼哈夫曼編碼方法得到的碼并非唯一的每次對(duì)信源縮減時(shí),賦予信源最后兩個(gè)概率最小的符號(hào),用0和1是可以任意的,所以可以得到不同的哈夫曼碼,但不會(huì)影響碼字的長(zhǎng)度。1225.2無失真信源編碼對(duì)信源進(jìn)行縮減時(shí),兩個(gè)概率最小的符號(hào)合并后的概率與其它信源符號(hào)的概率相同時(shí),這兩者在縮減信源中進(jìn)行概率排序,其位置放置次序是可以任意的,故會(huì)得到不同的哈夫曼碼。此時(shí)將影響碼字的長(zhǎng)度,一般將合并的概率放在上面,這樣可獲得較小的碼方差。1235.2無失真信源編碼例設(shè)有離散無記憶信源1245.2無失真信源編碼信源符號(hào)ai概率p(ai)碼字Wi1碼長(zhǎng)Ki1碼字Wi2碼長(zhǎng)K’i2a10.411002a20.2012102a30.20003112a40.1001040103a50.1001140113

其有兩種哈夫曼編碼方法:1255.2無失真信源編碼0.40.40.40.61.00.20.20.40.40.20.20.20.10.20.10.40.40.40.61.00.20.20.40.40.20.20.20.10.20.101010101010101011265.2無失真信源編碼

碼元/符號(hào)

1275.2無失真信源編碼1285.2無失真信源編碼

進(jìn)行哈夫曼編碼時(shí),為得到碼方差最小的碼,應(yīng)使合并的信源符號(hào)位于縮減信源序列盡可能高的位置上,以減少再次合并的次數(shù),充分利用短碼。

1295.2無失真信源編碼哈夫曼碼是用概率匹配方法進(jìn)行信源編碼。哈夫曼碼的編碼方法保證了概率大的符號(hào)對(duì)應(yīng)于短碼,概率小的符號(hào)對(duì)應(yīng)于長(zhǎng)碼,充分利用了短碼;縮減信源的最后二個(gè)碼字總是最后一位不同,從而保證了哈夫曼碼是即時(shí)碼。r進(jìn)制哈夫曼編碼考慮習(xí)題:書P3.18本

結(jié)

本章討論在不允許失真前提下對(duì)信源的編碼,分為兩種情況,等長(zhǎng)編碼和變長(zhǎng)編碼。等長(zhǎng)編碼定理和變長(zhǎng)編碼定理分別給出了這兩種情況,在無失真和碼長(zhǎng)盡可能短這兩個(gè)約束條件下的平均碼長(zhǎng)的上界和下界。等長(zhǎng)編碼定理

記H(X)為單符號(hào)信源熵,L為擴(kuò)展信源輸出序列長(zhǎng)度,n為碼字長(zhǎng)度,D為碼符號(hào)集元素個(gè)數(shù),當(dāng)滿足條件,則L→∞時(shí),可使譯碼差錯(cuò)pe<δ(ε、δ為無窮小量);反之,當(dāng)時(shí),則不可能實(shí)現(xiàn)無差錯(cuò)編碼。變長(zhǎng)編碼定理(Shannon第一定理)記H(X)為單符號(hào)信源熵,L為擴(kuò)展信源輸出的序列長(zhǎng)度,為信源每個(gè)符號(hào)所對(duì)應(yīng)的平均碼字?jǐn)?shù),D為碼符號(hào)集元素個(gè)數(shù),則對(duì)信源進(jìn)行編碼,總可以找到一種惟一可譯碼,使碼長(zhǎng)滿足平均碼長(zhǎng)

克拉夫特不等式

本章還介紹了常見的三種變長(zhǎng)碼的編碼方法:香農(nóng)編碼法、Fano編碼法和霍夫曼編碼法。對(duì)于同一信源的編碼,三種方法中,以霍夫曼編碼的編碼效率最高。香農(nóng)編碼法沒有太多實(shí)用價(jià)值,但它在證明變長(zhǎng)編碼定理時(shí)起了重要作用,F(xiàn)ano編碼法是遵照變長(zhǎng)編碼定理(香農(nóng)第一定理)的指導(dǎo)思想導(dǎo)出的一種編碼方法。

作業(yè):書P3.18復(fù)習(xí)上次課的內(nèi)容:編碼器碼的分類等長(zhǎng)編碼定理變長(zhǎng)編碼定理(Shannon第一定理)變長(zhǎng)碼的編碼方法復(fù)習(xí)上次課的內(nèi)容:碼的分類

1.二元碼:若碼符號(hào)集為{0,1},則碼字就是二元序列,稱為二元碼;2.等長(zhǎng)碼:碼中所有碼字的長(zhǎng)度,都相同;3.變長(zhǎng)碼:碼中的碼字長(zhǎng)短不一;4.奇異碼:若一組碼中有相同的碼字,則稱為奇異碼;5.非奇異碼:若一組碼中所有碼字都不相同。6.原碼C的N次擴(kuò)展碼7.惟一可譯碼:如果碼的任意N次擴(kuò)展碼都是非奇異碼,則稱該碼為惟一可譯碼。8.即時(shí)碼:無需考慮后續(xù)的碼符號(hào)就可以從碼符號(hào)序列中譯出碼字,這樣的唯一可譯碼稱為即時(shí)碼。9.同價(jià)碼:每個(gè)碼符號(hào)所占的傳輸時(shí)間都相同的碼。10.分組碼將信源符號(hào)集中的每個(gè)信源符號(hào)固定地映射成一個(gè)碼字Wi,這樣的碼稱為分組碼。定理3.1

等長(zhǎng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論