




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第二章信息的統(tǒng)計度量第1頁,共51頁,2023年,2月20日,星期三第一節(jié)自信息量與條件自信息量自信息量與條件自信息量通過一定的過程或手段,對隨機信息源進行了解,從信息源獲得信息.獲得信息的同時減少了不確定性,信息源所包含的信息與隨機信源存在的不確定性有關.問題:隨機事件包含信息,那么信息的多少稱為信息量,如何度量呢?2.1.1自信息定義2.1.1任意隨機事件所包含的信息多少稱為自信息量,定義為該事件發(fā)生概率的對數的負值.第2頁,共51頁,2023年,2月20日,星期三自信息量與條件自信息量其中:1)2)I(ai)非負?{{若事件集合X中的事件的自信息:
★本書(以及通信理論中)當中,如無特殊說明,信息量的單位均默認為比特.第3頁,共51頁,2023年,2月20日,星期三自信息量與條件自信息量例2.1.1甲袋中有n個不同阻值的電阻,從中隨機取出一個,猜測所取得的是何種阻值的困難程度是多少?解:這相當于求事件的不確定性事件等概例2.1.2甲袋中有n(n+1)/2個不同阻值的電阻,其中1Ω的1個,2Ω的2個,……,nΩ的n個,從中隨機取出一個,求“取出阻值為i(0≤i≤n)的電阻”所獲得的信息量。解:“取出阻值為i的電阻”的概率是多少?第4頁,共51頁,2023年,2月20日,星期三自信息量與條件自信息量定義2.1.2二維聯合集XY上的元素()的聯合自信息量為:式中:為積事件,為積事件或者元素的二維聯合概率.其中:第5頁,共51頁,2023年,2月20日,星期三自信息量與條件自信息量例2.1.3箱中有90個紅球,10個白球,現從箱中隨機取出兩個球;求:(1)事件“兩個球中有紅、白球各一個”的不確定性;(2)事件“兩個球都是白球”所提供的信息量;(3)事件“兩個球都是白球”和“兩個球都是紅球”的發(fā)生,哪個事件更難猜測?解:三種情況都是求聯合自信息,分別設為,其中x為紅球數,y為白球數(1)第6頁,共51頁,2023年,2月20日,星期三自信息量與條件自信息量(2)事件“兩個球都是白球”所提供的信息量;(3)事件“兩個球都是白球”和“兩個球都是紅球”的發(fā)生,哪個事件更難猜測?因為,所以事件”倆個都是白球”的可能性更小,其發(fā)生更難猜測.第7頁,共51頁,2023年,2月20日,星期三自信息量與條件自信息量2.1.2條件自信息量(隨機變量)定義2.1.3二維聯合集XY中,對事件xi和yj,事件xi在事件yj給定的條件下的條件自信息量為:簡記同樣p(x|y)要滿足非負和歸一化條件,可以證明,無條件的自信息量總比條件的自信息量大,即:第8頁,共51頁,2023年,2月20日,星期三自信息量與條件自信息量例2.1.4箱中有90個紅球,10個白球,現從箱中隨機取出兩個球,現從箱中先拿出一球,再拿出一球,求(1)事件“在第一個是紅球,第二個是白球”的不確定性;(2)事件“在第一個是紅球,第二個是紅球”的不確定性;(3)事件“在第一個是白球,第二個是白球”的不確定性;(4)事件“在第一個是白球,第二個是紅球”的不確定性。解:設x表示紅球事件,y表示白球事件:(1)p(y|x)=10/99→I(y|x)=-logp(y|x)=-log(10/99)=3.3074(比特)(2)p(y|x)=89/99→I(y|x)=-logp(y|x)=-log(89/99)=0.1536(比特)(3)p(y|x)=9/99→I(y|x)=-logp(y|x)=-log(9/99)=?(4)p(y|x)=90/99→I(y|x)=-logp(y|x)=-log(90/99)=?第9頁,共51頁,2023年,2月20日,星期三例2.1.5有8×8=64個方格,甲將一棋子放入方格中,求讓乙猜順序號的困難程度:1)方格按順序編號,讓乙猜測棋子所在的方格序號;2)方格按行和列編號,且告訴乙方格的行號,讓乙猜測棋子所在的方格序號.自信息量與條件自信息量解:1)多少種可能性?642)多少種可能性?8第10頁,共51頁,2023年,2月20日,星期三互信息量與條件互信息量第二節(jié)互信息量與條件互信息量互信息是指倆個不同的事件XY相互從對方能夠獲得信息,把這類信息稱為互信息,大小稱為互信息量.其大小與倆事件之間的聯系有關,如果倆者之間聯系越大,及相關性越大,則互信息量越大,反之越小,如果倆者相互獨立,則互信息量為零,這種情況可以解釋成為,當倆者沒有任何聯系時,不可能從對方那里獲得任何信息.這種度量方式也用于其他學科里用來代替事件的相關性.互信息量是從通信過程當中定義出來的.第11頁,共51頁,2023年,2月20日,星期三互信息量與條件互信息量上圖所示為簡化的通信系統(tǒng)模型圖,其中假設發(fā)送端(信源)為離散符號集合X,接受端(信宿)為離散符號集合Y.現代通信系統(tǒng)一般為數字雙工通信模型.第12頁,共51頁,2023年,2月20日,星期三互信息量與條件互信息量2.2.1互信息量定義2.2.1倆個離散隨機事件集X與Y,對事件yj的出現給出關于xi的信息量(或者說xi從yj中獲得了信息量),定義為互信息量.其定義式為:第13頁,共51頁,2023年,2月20日,星期三例2.2.1e表示“降雨”,f表示“空中有烏云”,且P(e)=0.125,P(e|f)=0.8.互信息量與條件互信息量解:求:1)“降雨”的自信息2)“空中有烏云”條件下“降雨”的自信息3)“無雨”的自信息4)“空中有烏云”條件下“無雨”的自信息5)“降雨”與“空中有烏云”的互信息6)“無雨”與“空中有烏云”的互信息1)3bit2)0.322bit3)0.193bit4)2.322bit5)2.678bit6)-2.129bit第14頁,共51頁,2023年,2月20日,星期三互信息量與條件互信息量2.2.2互信息量的性質互信息量具有下述的性質1互信息量的互易性x與y的互信息等于x的自信息減去在y條件下x的自信息。I(x)表示x的不確定性,I(x|y)表示在y發(fā)生條件下x的不確定性;因此I(x;y)表示當y發(fā)生后x不確定性的變化。這種變化,反映了由y發(fā)生所得到的關于x的信息量第15頁,共51頁,2023年,2月20日,星期三互信息量與條件互信息量證明:第16頁,共51頁,2023年,2月20日,星期三互信息量與條件互信息量2當事件x,y統(tǒng)計獨立時,互信息為0,即I(x;y)=0;3互信息可正可負;4任何兩事件之間的互信息不可能大于其中任一事件的自信息.證明:第17頁,共51頁,2023年,2月20日,星期三2.2.3條件互信息定義2.2.2設聯合集XYZ,在給定z∈Z條件下x(∈X)與y(∈Y)之間的互信息定義為:互信息量與條件互信息量
除條件外,條件互信息的含義與互信息的含義與性質都相同.第18頁,共51頁,2023年,2月20日,星期三聯合集XYZ上還存在x與yz之間的互信息量,其定義式為:進一步表示為:互信息量與條件互信息量可見一對事件yz出現后所提供的關于x的信息量I(x;yz),等于事件y出現后提供的有關x的信息量I(x;y)加上給定事件y的條件下再出現事件z所提供的關于x的信息量.第19頁,共51頁,2023年,2月20日,星期三第三節(jié)離散集的平均自信息量離散集的平均自信息量現代通信技術是數字通信技術,在通信的信源部分是用離散符號集合來表示的.通信的實質是傳輸交換信息,信息的多少取決于信源,本節(jié)主要探討離散符號集合的信息度量.2.3.1平均自信息量(信源熵)通常離散信息源的離散符號集合用下面所示的符號集合和概率空間描述:第20頁,共51頁,2023年,2月20日,星期三離散集的平均自信息量定義2.3.1離散信源符號集合X上,隨機變量I(xi)的數學期望定義為平均自信息量.用H(X)表示,也稱為信息(源)熵.信源熵的的單位是哈特\比特\奈特/(信源)符號,如果對數符號的底數取2的話,單位是比特/符號.這也是最常用的單位符號,本書中如無特別強調,都采用此符號.例2.3.1一個信源X的符號集為{0,1},其中“0”符號出現的概率為p,求信源的熵?解:出現“1”的概率是多少?(1-p)那么:第21頁,共51頁,2023年,2月20日,星期三離散集的平均自信息量例2.3.2一電視屏幕的格點數為500×600=300000,每點有10個灰度等級,若每幅畫面等概率出現,求每幅畫面平均所包含的信息量?解:可能的畫面數是多少?代入公式:第22頁,共51頁,2023年,2月20日,星期三離散集的平均自信息量例2.3.3A、B兩城市天氣情況概率分布如下表:晴陰雨A城0.80.150.05B城0.40.30.3問哪個城市的天氣具有更大的不確定性?解:A、
B城市天氣情況的平均不確定性如下:所以,B城市的天氣具有更大的不確定性。第23頁,共51頁,2023年,2月20日,星期三離散集的平均自信息量例2.3.4有甲、乙兩箱球,甲箱中有紅球50、白球20、黑球30;乙箱中有紅球90、白球10。現做從兩箱中分別隨機取一球的實驗,問從哪箱中取球的結果隨機性更大?。解:設甲、乙分別用AB代表所以,從甲箱中取球的結果隨機性更大。第24頁,共51頁,2023年,2月20日,星期三2.3.2熵函數的性質熵函數具有如下性質,對稱性、非負性、擴展性、可加性、極值性、確定性、上凸性等。我們先看一個定義:定義2.3.2設f(X)=f(x1,x2,…,xn)為一多元函數.若對于任意一個小于1的正數a(0<a<1)以及函數f(X)定義域內的任意倆個矢量X1,X2有:
f[aX1+(1-a)X2]≥af(X1)+(1-a)f(X2)則稱f(X)為定義域上的上凸函數(Cap型函數).若:
f[aX1+(1-a)X2]>af(X1)+(1-a)f(X2)則稱f(X)為定義域上的嚴格上凸函數.反之:離散集的平均自信息量第25頁,共51頁,2023年,2月20日,星期三離散集的平均自信息量若:f[aX1+(1-a)X2]≤af(X1)+(1-a)f(X2)則稱f(X)為定義域上的下凸函數(Cup型函數).若:f[aX1+(1-a)X2]<af(X1)+(1-a)f(X2)則稱f(X)為定義域上的嚴格下凸函數.證明:本定義的證明相對比較復雜,我們只對f(x)為實連續(xù)函數,x為隨機變量的情況進行證明.在區(qū)間[x1x2]上取值x,且x1≤x≤x2,令:a=x2-x/x2-x1則1-a=x-x1/x2-x1∴x=ax1+(1-a)x2∴f(x)=f[ax1+(1-a)x2]第26頁,共51頁,2023年,2月20日,星期三離散集的平均自信息量如右圖所示,只需要求出h(x)的值,就可以得出我們想要的結論:h(x)=f(x1)+△x再由相似三角形定理有:上凸下凸第27頁,共51頁,2023年,2月20日,星期三引理2.3.1若f(x)是定義在[a、b]上的實值連續(xù)上凸函數,則對于任意一組x1,x2,…,xq∈[a、b]和任意一組非負實數λ1,λ2,…λq且滿足:離散集的平均自信息量則有:稱此為詹森不等式此引理的證明比較簡單,用數學歸納法即可證明,這是一個在本課程里很重要的引理,我們對它做一個簡單的推廣:也可以簡寫成:第28頁,共51頁,2023年,2月20日,星期三離散集的平均自信息量1對稱性概率空間當中,P=[p1,p2,…,pr]中各概率分量的次序任意變更時,其熵值不變.2非負性當且僅當概率空間中有一個符號的概率為”1”,其他所有概率為”0”時,等號成立.或者說成確定概率空間的熵為”0”.第29頁,共51頁,2023年,2月20日,星期三離散集的平均自信息量3擴展性這個性質的含義是,若符號集合X有q個事件,如果將這個符號集合擴展成為有q+1個事件的符號集合,這第(q+1)個事件可以看作是在第q個事件分離出來的概率為ε→0的事件,這樣擴展后的集合的熵值不會發(fā)生變化.或者說,一個事件集合中如果某事件的概率和其它事件概率相比很小時,它對整個集合熵值的影響可以忽略不計.第30頁,共51頁,2023年,2月20日,星期三離散集的平均自信息量4可加性隨機變量X、Y構成聯合事件集合XY,則二維隨機變量(X,Y)的熵等于其中一個變量X(或者Y)的無條件熵加上一個變量Y(或者X)給定時的另一個變量X(或者Y)的條件熵.或者:多變量時:當各個變量相互獨立時有:第31頁,共51頁,2023年,2月20日,星期三離散集的平均自信息量證明:聯合集概率空間為:其中:
第32頁,共51頁,2023年,2月20日,星期三離散集的平均自信息量第33頁,共51頁,2023年,2月20日,星期三離散集的平均自信息量5極值性離散集的熵值具有最大值:利用前面的詹森公式可以很簡單的證明這個性質:條件(1)(2)λk為非負實數(3)f(x)為上凸函數.第34頁,共51頁,2023年,2月20日,星期三離散集的平均自信息量即可得:當且僅當每個事件等概率出現時等號成立.6確定性
當事件集合中只有一個事件為必然事件,其余全為不可能事件,則此時事件集合的熵為零.第35頁,共51頁,2023年,2月20日,星期三離散集的平均自信息量7上凸性H(p)=H(p1,p2,…,pn)是(p1,p2,…,pn)的嚴格的上凸函數證明:設是倆個概率矢量,且取0<a<1,則:第36頁,共51頁,2023年,2月20日,星期三離散集的平均自信息量第四節(jié)離散集的其它熵及其關系2.4.1條件熵定義2.4.1聯合集XY上,條件自信息I(yj|xi)的概率加權平均值定義為條件熵值.定義式如下:第37頁,共51頁,2023年,2月20日,星期三2.4.2聯合熵(或稱共熵)定義2.4.2聯合集XY上,每對元素xiyj的自信息量的統(tǒng)計平均(加權平均)定義為聯合熵.定義式如下:2.4.3各種熵值的關系1聯合熵與信息熵、條件熵的關系離散集的平均自信息量當各個變量相互獨立時有:第38頁,共51頁,2023年,2月20日,星期三離散集的平均自信息量2聯合熵與信息熵的關系第39頁,共51頁,2023年,2月20日,星期三離散集的平均自信息量可以得出:推論:3條件熵與信息熵的關系(見P28-31例2.3.4)
熵的不增原理(條件熵不大于信息熵)證明思路:試證明H(Y)-H(Y|X)≥0推論:聯合熵不大于各信息熵的和:第40頁,共51頁,2023年,2月20日,星期三離散集的平均自信息量第五節(jié)離散集的平均互信息量互信息是通信問題中一個很重要的概念,通信(特別是數字通信)系統(tǒng)的輸入和輸出都可以看作離散符號集合,輸入與輸出之間的關聯程度用互信息來衡量.聯合集XY={xiyj;xi∈X,yj∈Y,i=1,2,···m;j=1,2,···,n}二維聯合概率為p(xiyj),且第41頁,共51頁,2023年,2月20日,星期三離散集的平均自信息量2.5.1平均互信息量定義2.5.1互信息在XY聯合空間上的統(tǒng)計平均值定義為平均互信息量.定義式如下:其中:或者:第42頁,共51頁,2023年,2月20日,星期三簡單說明:離散集的平均自信息量從通信的角度來看這個定義式,其中H(X)由概率p(xi)得出,可以看作是通信信源的不確定性,H(X|Y)由條件概率p(xi|yj)得出,可以看作是通信后在知道輸出信號集合Y的情況下對信源X仍存在的不確定性,倆這之差就是通信過程中平均每個符號所獲得的不確定性.第43頁,共51頁,2023年,2月20日,星期三離散集的平均自信息量2.5.2平均互信息量的性質1非負性當且僅當X與Y統(tǒng)計獨立時,等號成立,因為統(tǒng)計獨立時,倆這之間相互沒有任何聯系
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 后勤聘用合同范本
- 發(fā)行書分銷合同范本
- 雙方種植土地合同范本
- 供面合同范例
- 委托擔保保證合同范本
- 公司業(yè)務合同范本
- 臺球店員工合同范本
- 保潔修理員合同范例
- 農村場地出售合同范本
- 合同范本樣板格式
- 2025年湖南交通職業(yè)技術學院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 小學生傳統(tǒng)文化教育的家庭學校社會協(xié)同機制
- 兒童飲食健康指南
- 民用無人機操控員執(zhí)照(CAAC)考試復習重點題庫500題(含答案)
- 2025年春新北師大版物理八年級下冊課件 第六章 質量和密度 第三節(jié) 密度的測量與應用
- 2024-2025學年成都市高一上英語期末考試題(含答案和音頻)
- 課題申報書:大學生心理問題多維度感知系統(tǒng)研究
- 2025年上半年四川能投宜賓市敘州電力限公司招聘易考易錯模擬試題(共500題)試卷后附參考答案
- 2025年全國普通話水平測試50套復習題庫及答案
- 心理戰(zhàn)、法律戰(zhàn)、輿論戰(zhàn)
- 《餐飲感動服務》課件
評論
0/150
提交評論