版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、精選優(yōu)質(zhì)文檔-傾情為你奉上精選優(yōu)質(zhì)文檔-傾情為你奉上專心-專注-專業(yè)專心-專注-專業(yè)精選優(yōu)質(zhì)文檔-傾情為你奉上專心-專注-專業(yè)通信的數(shù)學理論近年來像PCM和PPM這些交換信號噪音比帶寬等的多種調(diào)制方法的發(fā)展已經(jīng)增強了我們對一般通信理論的興趣。這種理論的基礎包括在重要的報紙 and 中關于此學科的內(nèi)容。在當今的報紙中我們將延伸這種理論從而包括許多新的因素,特別是噪聲通道的影響,和存儲可能的基于最初信息統(tǒng)計的結構和基于數(shù)據(jù)的最后目的性性質(zhì)。通信的基本問題是再制造一點或者準確地或者近似地一個從別處挑選的信息。通常信息有意義;那是他們提到的或是依照一些特定物質(zhì)或概念上實體的系統(tǒng)的相互關聯(lián)。這些與語意有
2、關的通信方面是不切題的工程問題。重要的方面是真實的信息是從一組可能的信息挑選來的。系統(tǒng)一定要有計劃的操作每個可能的選擇, 而不僅僅是哪一個因為在設計的時候是未知者將會被選擇。如果設備的信息數(shù)目是有限的,那么這組數(shù)字或一些具有單調(diào)功能的數(shù)字可以被當做對信息被關閉后再創(chuàng)造的測度, 所有的選擇有相同的可能。像Hartley所指出的,最自然的選擇是對數(shù)的功能。雖然當我們考慮統(tǒng)計信息的影響力以及對信息的持續(xù)排列這個定義必須被凝練地概括,我們將在所有情況下用一個本質(zhì)為對數(shù)的量度標準。對數(shù)的測度更方便,主要有以下多方面的理由:它在實踐上更有用。工程的重要參數(shù),像時間、帶寬、數(shù)字的分程傳遞等等,趨向于隨可能數(shù)
3、字的對數(shù)線性改變。 舉例來說,增加一個繼電器到小組會加倍數(shù)字的可能情形。 它加1到以2為底的對數(shù)。加倍時間大致得到可能信息數(shù)目的平方,或加倍其對數(shù),等等。2. 它以適當?shù)某叽缃咏覀兊闹庇X感觀。如果我們直覺地用共同的標準線性比較測量實體,它將接近相關到(1)。有一個想法,舉例來說,二張穿孔卡片與一張相比有兩倍的信息儲藏能力,并且二個通道與一個相比有兩倍的傳輸數(shù)據(jù)的能力。3.它在數(shù)學方面更合適。許多極限運算在對數(shù)方式下很簡單,但是在普通數(shù)字下卻需要笨拙的重述。對數(shù)底的選擇對應測量信息單位的選擇。如果以2為底,產(chǎn)生的單位可以叫二進位數(shù)字,或比較簡要地叫比特,一個由J.W.Tukey建議的詞。一個擁
4、有兩個穩(wěn)定位置的設備,像一個繼電器或一個雙穩(wěn)態(tài)多諧振蕩器,可以存儲一比特的信息。N個如此的裝置能存儲N比特的信息,因為可能情形的總數(shù)是。信息來源 傳達者 接受者 目的地 信號 接收信號 信息 干擾源 圖1一個常規(guī)信息系統(tǒng)原理圖并且。如果以10為底產(chǎn)生的單位可以叫十進制數(shù)字。因為。,“某些影響通報速度的因素”貝爾系統(tǒng)科技刊物,1924年4月,第324頁;“電報傳輸理論中某些總聯(lián)機程序和信息控制系統(tǒng)”, A.I.E.E. Trans.v.47,1924年4月,第617頁。,“信息傳輸”, 貝爾系統(tǒng)科技刊物,1928年7月,第535頁。一個十進制數(shù)大約比特。書桌上的一個阿拉伯數(shù)字計數(shù)器有十個穩(wěn)定的位
5、置并且因此擁有存儲十進制數(shù)字的能力。有時在綜合和區(qū)分的解析工作中底數(shù)很有用處。以此為底的信息結果將被叫做自然對數(shù)。將底數(shù)由a改為b僅僅需要乘以。 對于通信系統(tǒng)我們想要用一個系統(tǒng)的示意圖圖1闡明。它包括五個重要的部分:1.一個制造信息或排序信息的信息源將被傳達到終端。信息可能有各種不同類型:(a)電傳打字系統(tǒng)的電報中的字母序列;(b)無線電話中的一個單一時間函數(shù)f(t);(c)一個時間函數(shù)和其它應用在黑白電視機中的變量在這里信息可能被當做一個二個空間坐標和時間的函數(shù)f(x,y,t);在點(x,y)的光強度,在光的金屬板上獲得的時間t;(d)二或更多的時間函數(shù),分別為f(t)、g(t),h(t)這
6、是“三維”聲音傳播的情形,或者若系統(tǒng)有意維修個別多元通道;(e)一些變量的一些函數(shù)在彩色電視機中有三個函數(shù)f(x,y,t),g(x,y,t),h(x,y,t),定義在一個三維空間的閉聯(lián)集中我們也可能想像這三個函數(shù)作為一個定義在區(qū)域矢量場的向量分量同樣地,個別黑白電視機消息來源是許多三個變量的函數(shù);(f)不同的混合物也會發(fā)生,例如在電視機中有聯(lián)合的音頻信道。2.用一些方法操作信息以產(chǎn)生在信道上傳輸?shù)暮线m信號的傳達者。在電話制造中這種操作包括的僅僅是替換躁聲壓力為電流。在電信技術中我們有產(chǎn)生一系列點、莫爾斯電碼、空間等相關信息信道的編碼、譯碼的操作。在一個多元的PCM系統(tǒng)不同的語音函數(shù)必須被取樣壓
7、縮, 量子化和編碼,而且最后完全交叉存取地構造信號。聲音傳播機系統(tǒng)、電視和頻率調(diào)制器是其他的聯(lián)合體操作應用于信息以獲取信號的例子。3.信道只是用來從傳達者到接收者傳送信號的媒介。它可能是一雙電線、一個同橋電纜、一條無線電電波,一個光束,等等。4.接收者通常完成由傳達者做的反運算,重建來自信號的信息。5.目的地是信息對其有意的人(或者事物)。我們希望考慮特定的一般問題用于信息系統(tǒng)。這首先需要描述不同數(shù)學實體的相關原理,將他們的物理副本合理的理想化。我們大致把通信系統(tǒng)分為三大類:離散的,連續(xù)的和混和的。離散系統(tǒng)對于我們就意味著信息和信號是一系列的離散符號。一個典型的情形是在電信技術中消息是一系列的
8、字母和信號點、莫爾斯電碼及空間。連續(xù)型的系統(tǒng)就是一個信息和信號都被看作是連續(xù)函數(shù)的系統(tǒng),例如無線電通信或電視機?;旌舷到y(tǒng)中既有離散的又有連續(xù)的變量,例如PCM語言傳輸。我們首先考慮離散的情形。這種情形不僅應用于通信理論,而且應用于計算機理論,電話局和其他領域的設計。另外離散的情形構成在下半頁要處理的連續(xù)和混合情形的基礎。 第一部分:離散的無噪聲系統(tǒng) 1離散的無噪聲信道 電傳打字機和電信技術是離散信道上信息傳輸?shù)膬蓚€簡單例子。一般來講,一個離散信道就意味著一個系統(tǒng)怎么從可以從一個點傳到另一個點被傳輸?shù)挠邢藜显胤栠x擇次序。每一個符號被假定有確定的連續(xù)時間秒(對于不同的沒必要相同,例如電信技術
9、中的點和莫爾斯電碼)。這不需要有可能傳輸?shù)较到y(tǒng)的的所有可能排序,確定次序僅僅是可能被允許。這將在信道產(chǎn)生可能的信號。這樣在電信技術中可以推想符號有:(1)一個點,包括一個單位時間的關閉和一個單位時間的線性開啟;(2)一個莫爾斯電碼,包括三個單位時間的關閉和一個單位時間的開啟;(3)一個包括三個單位時間線性開啟的字母空間;(4)一個包括六個單位時間線性開啟的詞空間。我們可能放置約束在允許的無間隔的次序(因為如果兩個字母的間隔是接近的,它同一個字空間是一樣的)。我們現(xiàn)在要考慮的問題是如何測量這樣一個信道傳輸信息的能力。在電傳打字的情況下所有符號有同樣的持續(xù)時間,并且32個符號任何排序答案是簡單的。
10、每個符號擁有5比特的信息量。如果系統(tǒng)每秒傳輸n個字符,那么自然來說信道有一個每秒5n比特的傳輸能力。這并不意味電傳打字信道總是這個傳輸速度,這是可能的最大值并且實際比率能否達到最大值取決于進入信道不久將會出現(xiàn)的信息源。在不同長度的符號和約束的允許序列的更普通情形中,我們作以下定義:定義:一個離散信道容量C由此公式給出:其中N(T)是持續(xù)時間為T時允許信號數(shù)目。 很容易看出在電傳打字的情形下降低了當前的結果??梢钥闯鰡栴}中的極限在多數(shù)情況的影響下存在一個最終的數(shù)目。假使所有符號的次序都可能發(fā)生,并且這些符號的持續(xù)時間為。信道容量是多少?如果N(T)代表為期t的次序數(shù)目,我們就有總數(shù)目等于以為結尾
11、的序列數(shù)目的總和并且是。根據(jù)一個著名的有限差結果,N(t)于是漸進大數(shù)t到,其中是特征方程式的最大解: 因此在允許序列受限制的情況下我們也有一個此種類型的不同方程式并且從特征方程式中得到C。在以上提到的電信技術我們知道依照最后或幾乎最后出現(xiàn)的序列計算符號序列。因此C等于。其中是方程的根。我們可以解得C=0.539。一個置于允許序列約束的普通類型如下:我們想象一個可能的數(shù)字序列。對于每一種情形僅僅設置中的某些符號可以被傳輸(不同的子集有不同的情形)。當其中之一被傳輸,就產(chǎn)生一個取決于老狀態(tài)和當前傳輸信號的新狀態(tài)。發(fā)電報就是這其中的一個簡單例子。存在兩個取決于是否是一個空間最后傳輸信號的狀態(tài)。如果
12、這樣的話,那么僅僅一個點或一個莫爾斯電碼可以被發(fā)送并且狀態(tài)經(jīng)常改變。如果不是的話,一些信號可以傳輸并且若空間被發(fā)送狀態(tài)將改變,否則它保持不變。這種情形可以在線狀圖圖2中闡明。 莫爾斯電碼 點 點 字母空間 莫爾斯電碼 詞空間 圖2電報符號約束的圖表 狀態(tài)和線相應的那些連接點指示著狀態(tài)中的可能符號和結果狀態(tài)。在附錄1中可以看出如果允許序列的條件可以被描述在形態(tài)C中,結果將存在并且計算出它與以下結果一致:定理1:以為從狀態(tài)i到狀態(tài)j的允許符號的周期。那么信道容量C等于,其中W是行列式方程式的最大實根:=0其中若i=j則,否則。例如,在電報情形(圖2)中行列式是:=0。在擴充式中這將導出以上這種情形
13、所給的方程式。2.信息的離散信源我們已經(jīng)看到在普通情況下可能信號的數(shù)目的對數(shù)在離散信道中隨時間線性增長。信道容量可以由給出的增長率說明,每秒的比特數(shù)目需要詳細說明所用的特殊符號。我們現(xiàn)在考慮信息源。如何將信息源用數(shù)學方式描述,在所給信源每秒產(chǎn)生多少信息位呢?這個問題的關鍵是關于降低信源必需的信道容量的統(tǒng)計知識的影響,通過利用適當?shù)男畔⒕幋a。在電信技術中,例如,包括字母序列的被傳輸信息。然而,這些序列并不是完全隨意的。一般而言,他們組成句子并且有所謂英文的統(tǒng)計結構。字母E比字母F出現(xiàn)的頻繁,序列TH比序列XP出現(xiàn)的頻繁,等等。這個結構的存在通過適當?shù)鼐幋a信息序列到信號序列能節(jié)省時間(或信道容量)
14、。這已經(jīng)被用來通過利用最短的符號信道、點、最常見的英文字母E限制寬度,然而少見的字母Q,X,Z用長點的點和莫爾斯電碼表示。這個方法還被廣泛應用于商業(yè)編碼,其中常見字和短語是由極大地縮短平均時間的4或5位信碼群表示?,F(xiàn)在運用的標準問候和周年紀念電報擴充這一點到編碼一到兩個句子為相關的短的數(shù)字序列。我們可以考慮一個離散信源作為由符號產(chǎn)生的信息、符號。它通過某些可能的依靠選擇連續(xù)的符號,一般的,在前述的選擇,像問題中的特殊符號。一個物理系統(tǒng),或是一個產(chǎn)生由可能集合支配的符號序列的系統(tǒng)的數(shù)學模型,叫做隨機過程。我們可以考慮一個離散信源,因此,將通過一個隨機過程描述。相反地,有一些隨機過程,它們產(chǎn)生離散
15、的選自被認為是離散信源的有限集的符號序列。這將包括如下情形:自然書寫語言如英語、德語、漢語。由量子化過程離散呈遞的連續(xù)信息源。例如由PCM發(fā)射機發(fā)送的量子化演說,或者一個量化電視信號。在數(shù)學情形中我們僅僅定義抽象的產(chǎn)生符號序列的隨機過程。如下是最終資源類型的例子。(A)假設我們有5個都以0.2的可能性被選擇的字母A、B、C、D、E,連續(xù)選擇是不受約束的。這將產(chǎn)生一個序列,如下就是一個典型例子。它利用隨機數(shù)字表格構造的。B D C B C E C C C A D C B D D A A E C E E AA B B D A E E C A C E E B A E E C B C E A D,例如
16、, S. Chandrasekhar,“物理學和天文學中隨機問題,”現(xiàn)代物理學的回顧,v.15,No.1,1943年一月,第一頁.,隨機取樣數(shù)字的表格, 劍橋,1939.(B)用五個發(fā)生概率分別為0.4,0.1,0.2,0.2,0.1的同樣字母, 連續(xù)選擇是不受約束的。一個來自信源的典型如下:A A A C D C B D C E A A D A D A C E D AE A D C A B E D A D D C E C A A A A A D。(C)如果連續(xù)的符號沒有被獨立地選擇,但是他們的概率取決于在前的字母,一個更復雜的結構將會獲得。在簡單的情況下,這種類型的選擇取決于在前的字母并且不
17、是它們之前的。統(tǒng)計結構然后就通過一個躍進概率集合描述,字母j的發(fā)生概率在i之后。復數(shù)i和j涉及所有的可能符號。第二個相等方法的指定結構是給出兩個字母的概率p(i,j),也就是兩個字母i,j的相關概率。字母頻率p(i),(字母i的概率),躍進概率和連字概率有如下公式的關系:舉一個具體的例子,假設有三個如下概率表所示的字母A,B,C: j i p(i) j A B C A B C A 0 A A 0 i B 0 B B 0 C C C 一個消息源的典型信息如下:A B B A B A B A B A B A B A B B B A B B B B B A B A B A B A B A B B B
18、 A C A C A BB A B B B B A B B A B A C B B B A B A.其次,復雜性的增加將包括最多三組字母的頻率。字母的選擇將依賴在前的兩個字母而不是之前的信息點。一個三組字母頻率p(i,j,k)的集合或者等同的蛻變概率的集合是必需的。這種方法持續(xù)進行將獲得更多持續(xù)的復雜的隨機過程。在普通的n元情形中用一個n元概率或者轉變概率的集合來指定統(tǒng)計結構是必需的。(D)隨機過程也可以由產(chǎn)生一段包括序列“字”的正文來定義。假設有語言中的五個字母A,B,C,D,E和16個“字”,且它們的聯(lián)合概率如下: 10 A 16 BEBE 11CABED 04DEB 04ADEB 04B
19、ED 05CEED 15DEED 05ADEE 02BEED 08DAB 01EAB 01BADD 05CA 04DAD 05EE假設連續(xù)的“字”被獨立地選擇并且被空間隔離。一個典型可能信息為:DAB EE A BEBE DEED DEB ADEE ADEE EE DEB BEBE BEBE BEBE ADEE BED DEEDDEED CEED ADEE A DEED DEED BEBE CABED BEBE BED DAB DEED ADEB。如果所有的字長度有限,這個過程就相當于前述類型的其中之一,但是如果按照字結構和概率描述可以更簡單。我們也在此歸納并且介紹字之間的蛻變概率,等等。 人
20、工語言在構造簡單的問題和說明不同可能性的例子是有用的。我們也可以通過一系列簡單的人造語言的方法接近自然語言。零號近似值可以通過等可能并且獨立地選擇字母來獲得。一號近似值可以通過獨立地選擇連續(xù)的字母獲得,但是每個字母像自然語言那樣擁有同等的發(fā)生概率。這樣在一號近似值中對于英語來說,E以0.12(它在標準英語中出現(xiàn)的頻率)的概率被選擇并且W的發(fā)生概率為0.02,但是鄰接字母之間沒有影響并且沒有形成像TH,ED這樣的首選連字,等等。在二號近似值中介紹了連字結構。一個字母被選擇后,下一個字母與頻率被一致地選擇,其中不同的字母跟隨第一個字母。這需要一個連字頻率的表格。在三號近似值中介紹了三組字母結構。每
21、個字母被等可能選擇并且取決于前兩個字母。 3.英文近似值的連續(xù)性給一個這個系列過程如何接近一門語言的形象想法,英文近似值的典型序列已經(jīng)被構造并且在下面給出。在所有情形中我們假定一個27字符的“字母表”,26個字母和一個空格。1.零號近似值(符號獨立且等可能出現(xiàn))XFOML RXKHRJFFJUJ ZLPWCFWKCYJ FFJEYVKCQSGHYD QPAAMKBZAACIBZL-HJQD.2. 一號近似值(符號獨立但是以英語原文的頻率出現(xiàn))OCRO HLI RGWR NMIELWIS EU LL NBNESEBYA TH EEI ALHENHTTPA OOBTTVANAH BRL.3.二號近
22、似值(英語中的連字結構)ON IE ANTSOUTINYS ARE T INCTORE ST BE S DEAMY ACHIN D ILONASIVE TUCOOWEAT TEASONARE FUSO TIZIN ANDY TOBE SEACE CTISBE.4.三號近似值(英語中的三組字母結構)IN NO IST LAT WHEY CRATICT FROURE BIRS GROCID PONDENOME OF DEMONSTURESOF THE REPTAGIN IS REGOACTIONA OF CRE.5.一號字近似值。勝于連續(xù)的四個字母,.,n元結構更簡單并且更好地接受點到字單元,在此
23、字被獨立地選擇,不過是以它們適當?shù)念l率被選擇。REPRESENTING AND SPEEDILY IS AN GOOD APT OR COME CAN DIFFERENT NATURALHERE HE THE A IN CAME THE TOOF TO EXPERT GRAY COME TO FURNISHESTHE LINE MESSAGE HAD BE THESE.6.二號字近似值。字蛻變概率是恰當?shù)?但是不包括更深的結構。THE HEAD AND IN FRONTAL ATTACK ON AN ENGLISH WRITER THAT THE CHARACTEROF THIS POINT
24、IS THEREFORE ANOTHER METHOD FOR THE LETTERS THATTHE TIME OF WHO EVER TOLD THE PROBLEM FOR AN UNEXPECTED.普通英語原文的類同之處在以上每步顯著增加。注意這些樣品有適度優(yōu)良的結構,計算它們的造句,表現(xiàn)出兩倍的范圍。這樣在(3)中對于兩字母次序統(tǒng)計過程確保了合理的原文,但是字母,連字和三組字母頻率在1939年由Fletcher Pratt, Blue Ribbon Books所著的緊急秘密。字頻率在由G. Dewey所著、哈佛大學出版社印刷的英語語言的相關頻率中被列成表格。樣品中四字母次序通常適用
25、于好句子。在(6)中四個或更多的字可以很容易地放在句子中而沒有不平常的、做作的句子。十個詞的詳細次序“attack on an English writer that the character of this(抨擊這種特征的英國作家)”根本不合理。由此看來一個十分復雜的隨機過程將會給離散信源一個滿意的表示法。頭兩個例子是應用隨意數(shù)字的一本書構造的,其中隨意數(shù)字關聯(lián)一個字母頻率表格(對于例2)。這種方法可能已經(jīng)延續(xù)到(3),(4)和(5),雖然連字、三組字母和字母頻率表格是有用的,但是一個更簡單的等價方法正被應用。比如構造(3),一個人隨機地打開一本書,并且在該頁隨機地選擇一個字母。將此字母記
26、錄。然后打開該書的另外一頁并且讀到這個字母出現(xiàn)時,隨后的字母然后被記錄。翻到另外一頁找到第二個字母并隨后記錄,等等。一個簡單的過程被用在(4),(5)(6)中。如果深一層近似值被構造,那將會是有趣的。但是下一階段相關的詳細分析變得龐大。 4.一個馬爾可夫過程的圖形表示法以上描述的這種類型的隨機過程在數(shù)學中叫做離散的馬爾可夫過程,并且在文獻中廣闊地研究。大體情況可以描述為如下:存在一個有限個數(shù)的系統(tǒng)的可能狀態(tài);。另外有一套蛻變概率,如果此刻系統(tǒng)狀態(tài)是,將達到狀態(tài)的概率是。要將馬爾可夫過程轉變?yōu)樾畔⒃次覀儍H僅需要假定字母是由每次從一個狀態(tài)轉變到另一個狀態(tài)時產(chǎn)生的。狀態(tài)符合來自前述字母的“剩余物的影
27、響”。 該情形可以被描述為圖表,在圖3,4和5中顯示。 A 4 1 B E 2 1 C D 2 圖3一個符合例B中信源的圖表此狀態(tài)是圖中的連接點,并且概率和字母產(chǎn)生的轉變在旁邊的相應直線給出。圖3對應第2部分的例B。而圖4符合例C。在圖3中,因為連續(xù)字母不受約束,只有一個狀態(tài)。 C B A A 2 5 5 8 B C B 4 5 1 圖4一個符合例C中消息源的圖表在圖4中有字母數(shù)目相等數(shù)目的狀態(tài)。如果構造一個三組字母的例子,將出現(xiàn)至多個狀態(tài),符合前述被選擇的可能出現(xiàn)的字母對。圖5是一個說明在例D中詞結構情形的曲了解詳細的處理見M.Frechet,數(shù)據(jù)加密,巴黎,高塞爾-維拉斯,1938年8月線
28、圖。這里S代表“間隔”符號。5.遍歷信源和混合信源 正如我們以上已經(jīng)說明的,按我們意原的離散信源可以被看作是由馬爾可夫過程描述。在可能的離散馬爾可夫過程中有一個在通信理論中有意義的特殊性質(zhì)的組。特殊類包括“遍歷”過程,我們把相應的信源叫做遍歷信源。盡管一個遍歷過程的嚴格定義有些棘手,其常規(guī)思想是簡單的。在一個遍歷過程中由此過程產(chǎn)生的序列的統(tǒng)計特性是相同的。這樣的字母頻率、連字頻率等等從特殊序列在獲得,將隨著序列長度的增加,接近不受特殊序列約束的確定極限。事實上這對每個序列并不全對,但是錯誤的概率幾乎為零。大致上遍歷性意味著統(tǒng)計一致性。以上所給的所有人工語言的例子是遍歷的。這種特性涉及到相應圖表
29、的結構。如果圖表有如下兩個性質(zhì),相應過程將被遍歷: 1.這個圖表不包括兩個獨立的部分A和B,這樣就不可能順著圖中曲線的箭頭方向從A部分的連接點到B部分的連接點,也不可能從B部分的連接點到A部分的連接點。2.圖表中的封閉譜線系伴隨線上的所有箭頭指向同樣的方位叫做一個“回路”?;芈返摹伴L度”是其中直線數(shù)目的個數(shù)。這樣在圖5中系列BEBES是長度為5的回路。第二個需要的特性是圖表中所有回路長度的最大公約數(shù)是一。 D E E B E B S A D E B A D E S B E D C A E E B B D E A D B E E A S 圖5一個符合例D中消息源的圖表如果滿足第一個條件,但是由于
30、最大公約數(shù)等于d1而不滿足第二個條件,序列將有一個確定的周期結構類型。不同的序列分成d種類型,它們統(tǒng)計上相同,除了起源的變化(也就是,序列中的字母被叫做字母1)。通過從0到d-1的移位一些序列可以統(tǒng)計上等于其它的構造。d=2時的一個簡單例子如下:有三個可能的字母a,b,c。a后出現(xiàn)b或c的可能性分別為。a后面跟隨著b或c。這樣的一個典型序列是 a b a c a c a c a b a c a b a b a c a c。這種情形的類型對我們的工作不太重要。這些根據(jù)在Frechet中給出的圖表條件被重述如果不滿足第一種條件,圖表可能被分成一系列滿足第一種條件的子圖。我們假定每個子圖也滿足第二種
31、條件。我們有這種由許多純粹成分組成的叫做“混合”信源的情形。其成分符合各種各樣的子圖。如果是信源成分,我們可以寫出 其中是信源成分的概率。 自然的描繪情形如下:有幾個不同的信源每個都有同類的統(tǒng)計結構(也就是,它們是遍歷的)。我們不知道預先將被用到的,但是一旦序列以所給的純信源成分開始,它依照那種成分的統(tǒng)計結構不確定地延續(xù)。作為一個例子我們可以獲得兩個以上定義的過程,并且假定。一個來自混合信源的序列將通過首先以0.2和0.8的概率選擇和,此選擇之后產(chǎn)生來自任意一個被選擇的序列。除了當反面是一定的,我們設想信源將被遍歷。假設能夠讓我們順著一個伴隨全體可能序列平均數(shù)(差異的概率為零)的序列確定平均數(shù)
32、。例如在一個特殊無限字母序列中A的相關概率將可能等于序列全體中它的相關頻率。如果是狀態(tài)的發(fā)生概率并且是到狀態(tài)的蛻變概率,然后過程將會固定,顯然必須滿足均衡條件:。在遍歷情形中可以看出伴隨著一些起動條件狀態(tài)j在N個符號后的概率是,當時逼近平衡價值。 6.選擇、不確定性和熵我們已經(jīng)將離散信源描繪為一個馬爾可夫過程。我們能否定義一個參量,它在某種意義上測量這樣一個過程或字母產(chǎn)生多少信息,以什么樣的比率產(chǎn)生信息。假如我們有一組發(fā)生概率為的可能事件。這些概率是知道的,但是那是我們所有知道的關于將發(fā)生的事件。我們能否找到一個相關事件有多少“選擇”或結果有多少不確定性的量度標準呢?如果有這樣一個量度標準,比
33、方說,如下所需的性質(zhì)是合理的:1.在概率下是連續(xù)的。2.如果所有的概率等于,那么應該是一個關于n的單調(diào)遞增函數(shù)。當存在更多可能的事件時,等可能事件有更多選擇或不確定性。 3.如果一個選擇被分為兩個連續(xù)的選擇,最初的應該是的個體價值的加權和。這句話的意義會在圖6中舉例說明,在左圖中我們有三個概率。在右圖我們 1/2 1/2 1/3 1/2 2/3 1/6 1/2 1/3 1/3 1/6 圖6三個可能選擇事件的分解先以的概率選擇兩個可能事件,如果第二步以的概率做另一步選擇。最后的結果有同以前同樣的概率。我們在這種特殊情況下得出 。系數(shù)是因為第二個選擇以一半的時間發(fā)生。在附錄2,有如下確定結果:定理
34、2:滿足以上三個假設的有如此形式:其中是一個確定的常數(shù)。 這個理論,和對其進行證明所需的假設,對于當前理論并不需要。這首先給出一些我們稍后定義的有確定理由的參與。然而這些定義的真正理由隱藏在暗示中。形態(tài)的數(shù)量(恒量K僅僅等于度量單位的選擇)作為信息、選擇和不確定性的測度在情報理論中起到了一個中心的作用。形態(tài)被認作是熵,作為定義在一定的用公式表示的統(tǒng)計力學,其中是它的拓撲空間中系統(tǒng)處于單元的概率。然后,例如是Boltzmann的著名的定理。我們把叫做一系列概率的熵。如果是一個機遇數(shù),是它的熵,這樣的不是一個函數(shù)的自變量而是一個數(shù)字標志,區(qū)別于來說是概率y的熵。熵的兩種情形的概率分別為,即作為p的
35、一個函數(shù)在圖7中繪出。H值有許多有趣的性質(zhì),更深層地證實它是一個衡量選擇和信息的合理量度標準。1.如果除了一個,所有的概率都為0,那么,這個具有聯(lián)合價值。這樣僅僅是當我們確定H為0結果,否則H是正的。2.對于一個給出的n,H在所有相等,也就是()時取得最大值。這也是一個直觀的最不確定的情形。3.假設有兩個事件x和y,問題中前者有m種可能,后這有n種可能。若事件一發(fā)生的概率是,事件二發(fā)生的概率是,其聯(lián)合事件的概率是,那么聯(lián)合事件的熵是審視,實例R. C. Tolman,統(tǒng)計力學原理牛津大學出版部,1938 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 0
36、.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 圖7兩種概率分別為的情形的熵而 很容易知道 僅僅當事件獨立時等號成立(也就是)。聯(lián)合事件的不確定性小于等于個體不確定性的總和。4.對均等概率的一些改變會使增大。這樣如果并且我們等量地增加和,從而使和更接近,那么將會增大。一般地,如果我們執(zhí)行形態(tài)中均衡的操作,其中,并且所有的,那么將會增大。(除了轉變總數(shù)不超過的排列伴隨著保持不變的特殊情形)。5. 假設有兩個像3中的可能事件x和y,而且它們沒必要獨立。對任何事件x的值,可以假定有一個條件概率,其中事件y的值為。這由等式給出。我們定義y的條件熵作為對于每一個x值,y的熵
37、的平均數(shù),通過獲得特殊事件x的概率權衡。即。這個量測試當我們知道事件x時y的平均值的不確定性。取代的值我們得到 或 。聯(lián)合事件x,y的不確定性(或熵)等于事件x的不確定性加上當知道事件x時事件y的不確定性。6.從3到5我們得出 因此 。事件y的不確定性不會由于知道事件x而增加。除非事件x和y是獨立事件這種不確定性不變的情形,它將會減少。7、信源熵考慮一個有限離散信源的所有情況,對于每一個可能的狀態(tài),會有一系列可能發(fā)生的概率為。由此得到對于每一個可能的狀態(tài)下的熵,對所有發(fā)生的狀態(tài)的熵進行加權平均得到該信源的信源熵為:這是符號集里每個符號所攜帶的信息量,如果馬爾科夫過程在單位時間內(nèi)發(fā)生,則它為每秒
38、的平均信息量(為狀態(tài)出現(xiàn)的平均概率)顯然有: (m為平均每秒鐘產(chǎn)生的符號數(shù))表示信源平均每個符號(每秒)產(chǎn)生的信息量。如果選取以2為基數(shù),則單位為比特每符號(每秒)。如果所有的符號相互獨立,則可簡單的表示為。理所當然,在這種情況下,我們考慮一個由N個符號組成的長序列信息,它由出現(xiàn)概率相對高的字符組成,其第一個字符出現(xiàn)的次數(shù)為,第二個字符出現(xiàn)的次數(shù)為。這種信息出現(xiàn)的概率為:或 即大約等于這一序列信息的概率的倒數(shù)的對數(shù)除以序列的符號個數(shù),且對任意的信源都有這一結果。更精確的表達如下(見附錄3):定理3:對任意給點的和,存在,使得當這一序列信息的長度時有如下兩點成立:其發(fā)生的概率小于;所有的參數(shù)滿足
39、不等式也就是說當足夠大時,可以確定可以無限的接近。大量序列的不同概率會無限的接近某個結果,再考慮序列的長度,對它們按概率的遞減順序進行排列。我們定義為的那些序列中最有可能發(fā)生的概率且用來計算。定理4:當不等于0或1時,有當我們只考慮最有可能發(fā)生序列的總概率時,我們可以將解釋為指定某序列時所需要的比特數(shù),因此即為平均每個符號所需要的比特數(shù),這定理表明對于較大的數(shù),發(fā)生概率和熵相互獨立。所有可能序列數(shù)的對數(shù)的增長率由確定,與發(fā)生的可能性無關。結果的證明過程在附錄3中。對于長序列中,僅有個是最常用的,每一個被使用的概率為。下面的兩個定理表明和可以通過信息序列的統(tǒng)計數(shù)據(jù)直接算出來,不涉及狀態(tài)轉移概率。
40、定理5:設:為消息中符號序列的發(fā)生概率,(求和中要遍及所有含個符號的序列) 則:關于單調(diào)遞減,且。定理6:設:為同時發(fā)生的概率,為在條件下發(fā)生的概率。設 (求和中要遍及所有含個符號的序列和)則:,上述結果的證明過程在附錄3中,這表明一系列近似計算的方法可以通過僅考慮序列中的第1、2、個符號的統(tǒng)計數(shù)值表得到,是一個比較精確的近似值。實際上,為所有信源類型的個次序的近似值,也就是說下一個字符的產(chǎn)生只與前面的個符號相關,與再前面的符號無關,則。即為下一個符號產(chǎn)生的條件熵,當前面的個符號已確定時,則為個符號中平均每個符號的熵。當重復出現(xiàn)相同的字符時,信源熵的比率得到最大值,叫做相對熵。這就是對字母進行
41、編碼時的最大壓縮。不考慮超過8個字母長度的統(tǒng)計數(shù)值表,普通英語的冗余度大約為50%,這也就是當我們寫英語時,我們所寫的一半被語言結構所決定,另一半可以自由選擇。50%的數(shù)字是通過相鄰的結果再利用一些獨立的方法得到。一是通過計算英文的近似熵;第二種方法是從一個簡單的英文文章中刪掉一些確定的字母片,然后嘗試恢復它們,如果刪掉的50%都能被恢復出來,則冗余度就會大于50%;第三種方法是依靠密碼系統(tǒng)的已知結果。英語散文的兩種極端冗余度代表為基礎英語和詹姆斯喬伊斯的書“芬尼根的蘇醒”。基礎英語詞匯限制在850個單詞,且冗余度較高。當一段落翻譯成基礎英語時會出現(xiàn)反射性的擴充。喬伊斯在另一方面擴充詞匯,并且
42、聲明實現(xiàn)壓縮的內(nèi)容。語言的冗余度與縱橫字謎的存在有關,若冗余度為0,字母的任何次序在語言中都時合理的正文,并且任意的二維字符排列形成一個縱橫字謎。如果冗余度太高,這語言就可能會為比較多的縱橫字謎強派大量的約束,通過更多的明細分析得出:如果我們被語言強行約束會更加混亂、更無規(guī)則。當冗余度為50%時,大的縱橫字謎游戲僅僅成為可能,如果冗余度為33%,三位的字謎游戲就可成為可能。8.表示編碼和解碼的運算我們?nèi)匀恍枰镁幋a和解碼信息給傳輸者和接受者表示數(shù)學操作。它們中的任何一個都將被稱作傳感器。一連串的輸入標號被輸入進傳感器并且一連串的輸出標號被傳感器輸出。這個傳感器可能有一個內(nèi)存輸出,不但依靠當前的
43、輸入標號,而且依靠過去的標號。我們假設內(nèi)存有限,例如:存在一個有限的m代表傳感器,然后輸出一個函數(shù)表示當前的狀態(tài)和當前的標號。下一個狀態(tài)將有第二個函數(shù)和兩個變量。因此,這個傳感器可以用如下的兩個函數(shù)描述:這里:代表的輸入標號,代表的提出的輸入標號的傳感器狀態(tài),代表如果狀態(tài)是的已知的輸出標號(或者一連串的輸出標號)。如果這個傳感器的輸出標號可以在一秒內(nèi)辨認出輸入標號,它們可以連接到的結果也是一個傳感器。如果存在第二個傳感器,它操作輸出第一個并恢復原有的輸入,那么第一個傳感器將被稱作反向的。 定理7:被一個有限狀態(tài)統(tǒng)計資源促使的有限狀態(tài)傳感器的輸出是一個有限的狀態(tài)統(tǒng)計資源,熵(每單位時間)少于或者
44、等于輸入。如果這個傳感器是單個的,那么它們相等。讓代表資源的狀態(tài),它產(chǎn)生一連串的標號;讓代表狀態(tài)統(tǒng)計資源,它產(chǎn)生、輸出封閉的標號。這個鏈接的系統(tǒng)可以被“生產(chǎn)狀態(tài)區(qū)間”的“()”所代表。這兩點的區(qū)間()和()被一條線連接,如果可以得出x,從到,這條線是給出的在這種情況下可能的x。這條線是一個標簽的標號。這個輸出的熵可以像重量和等狀態(tài)那樣被計算出來。如果這個和的結果少于或者等于,那么熵不會增加。如果這個傳感器不是單個的,它輸出與反向的傳感器相一致。如果,和是輸出的這個資源的熵,那么,所以。假如我們有一個約束可能序列的系統(tǒng),其類型由像圖2的線狀圖描述。如果概率被分配到多樣的連接狀態(tài)到狀態(tài)的線條,這將
45、變?yōu)橐粋€信源。存在一個使熵結果取得最大值的特殊分配(見附錄4)。定理8:將約束系統(tǒng)考慮為一個容量為的信道。如果我們指派 其中是符號從狀態(tài)到狀態(tài)的周期,并且滿足 然后取得最大值并且等于。通過蛻變概率的適當指派,一個信道的符號熵可以在信道容量上取得最大值。 9. 無躁聲信道的基本原理我們現(xiàn)在證明對的解釋正如通過證明確定信道容量需要用最有效的譯碼產(chǎn)生信息的比率。定理9:取一個熵值為(比特每符號)的信源和一個容量為C(比特每秒)的信道。而后就有可能編碼信源的輸出,在信道上以這樣一種符號每秒的平均傳輸速率傳輸,其中是一個任意小的域。不可能以大于的速率傳輸。定理的相反部分,不可能被超越,可以記錄每秒輸入的
46、信道熵等于信源來證明,因為傳達者必須是非單一的,并且熵不能超越信道容量。因此,并且每秒的符號數(shù)目等于。定理的第一部分將以兩種不同的方法證明。第一種方法是考慮一系列由信源產(chǎn)生的N個字符的所有序列。對一個大數(shù)N,我們可以分成兩組,一組包括少于個成員,另一組包括少于個成員(其中R是不同符號數(shù)目的對數(shù)),并且有一個小于的總概率。隨著N的增加和趨向于0。信道中信號數(shù)目的周期T大于,T大的時候小。如果我們選擇 然后當和充分大(盡管很?。┣矣幸恍┰隽繒r對于高概率的組將有足夠的信道符號的序列數(shù)目。高概率組任意的一對一的方式編碼到集合。保留序列被大的序列描述,以不被用在高概率組的一個序列開始和結束。這個特殊序列
47、為一個不同的編碼擔當起始和結束的信號。在中間一個充分的時間被允許對所有低概率信息給出足夠不同的序列。這需要 其中很小。符號信息每秒的平均傳輸速度將會大于當N增加時,和趨向于0且速度趨向于。還有另一個履行譯碼的方法,因此定理的證明可以描述如下:以概率遞減的順序安排長度為N的信息,且假設它們的概率是。取,也就是是累積概率的結果,但不包括。我們首先編碼成一個二進制數(shù),信息的二進制碼是通過展開為二進制數(shù)獲得的。擴展式被執(zhí)行到位,其中是整數(shù)且滿足:。 這樣高概率的信息由短代碼描述,而低概率的信息由長代碼描述。從這些不等式我們有在一個或更多的位,的編碼將不同于所有繼后編碼,因為所有剩余至少這么大,并且它們的二進制擴展因此在第一個處不同。從而所有的編碼是不同的,并且有可能從它的編碼重新獲得信息。如果信道序列還不是二進制數(shù)字序列,它們可以以任意的方式被歸因于二進制數(shù),并且這樣二進制碼就轉化為適合信道的信號。二進制數(shù)字所用原始信息的每個符號的平均數(shù)目是容易估計的。我們有。但是, 因此 隨著的增加
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人力資源招聘及管理服務合同
- 團隊建設拓展活動設計與執(zhí)行方案書
- 生產(chǎn)流程標準化與智能制造試點項目
- 游戲語音交互系統(tǒng)研發(fā)與測試維護協(xié)議
- 經(jīng)典革命故事觀后感
- 游戲娛樂產(chǎn)業(yè)游戲開發(fā)與運營策略規(guī)劃
- 數(shù)學思維在生活中的運用解讀
- 企業(yè)數(shù)字化轉型戰(zhàn)略及實施路徑
- 泰安擋水圍堰施工方案
- 2024賓館加盟特許經(jīng)營合同(24篇)
- TSGD-(壓力管道安裝許可規(guī)則)
- 頸椎病的分型和治課件
- 國家開放大學Matlab語言及其應用期末考試復習資料匯編
- 中醫(yī)五臟課件
- 安谷鐵龍煤礦整合技改施工組織設計樣本
- 《新概念英語第二冊》電子書、單詞、筆記、練習冊(附答案)匯編
- 2023年云南大學滇池學院招聘考試真題
- 品質(zhì)助理述職報告
- 2023-2024學年湖南省長沙市雨花區(qū)外研版(三起)五年級上冊期末質(zhì)量檢測英語試卷
- 超越指標:存量時代降本增效的利器
- 部隊休假安全教育課件
評論
0/150
提交評論