貝葉斯估計(jì)在抽樣調(diào)查中的應(yīng)用課件_第1頁
貝葉斯估計(jì)在抽樣調(diào)查中的應(yīng)用課件_第2頁
貝葉斯估計(jì)在抽樣調(diào)查中的應(yīng)用課件_第3頁
貝葉斯估計(jì)在抽樣調(diào)查中的應(yīng)用課件_第4頁
貝葉斯估計(jì)在抽樣調(diào)查中的應(yīng)用課件_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

貝葉斯估計(jì)及其在

抽樣調(diào)查中的應(yīng)用貝葉斯估計(jì)及其在

抽樣調(diào)查中的應(yīng)用2

(Bayes,Thomas)(1702─1761)

貝葉斯是英國數(shù)學(xué)家.1702年生于倫敦;1761年4月17日卒于坦布里奇韋爾斯.

貝葉斯是一位自學(xué)成才的數(shù)學(xué)家.曾助理宗教事務(wù),后來長期擔(dān)任坦布里奇韋爾斯地方教堂的牧師.1742年,貝葉斯被選為英國皇家學(xué)會(huì)會(huì)員.

如今在概率、數(shù)理統(tǒng)計(jì)學(xué)中以貝葉斯姓氏命名的有貝葉斯公式、貝葉斯風(fēng)險(xiǎn)、貝葉斯決策函數(shù)、貝葉斯決策規(guī)則、貝葉斯估計(jì)量、貝葉斯方法、貝葉斯統(tǒng)計(jì)等等.2(Bayes,Thomas)(1702─1763貝葉斯方法(Bayesianapproach

)貝葉斯方法是基于貝葉斯定理而發(fā)展起來用于系統(tǒng)地闡述解決統(tǒng)計(jì)問題的方法(SamuelKotz和吳喜之,2000)。貝葉斯推斷的基本方法是將關(guān)于未知參數(shù)的先驗(yàn)信息與樣本信息綜合,再根據(jù)貝葉斯定理,得出后驗(yàn)信息,然后根據(jù)后驗(yàn)信息去推斷未知參數(shù)(茆詩松和王靜龍等,1998年)。

“貝葉斯提出了一種歸納推理的理論(貝葉斯定理),以后被一些統(tǒng)計(jì)學(xué)者發(fā)展為一種系統(tǒng)的統(tǒng)計(jì)推斷方法,稱為貝葉斯方法.”──摘自《中國大百科全書》(數(shù)學(xué)卷)3貝葉斯方法(Bayesianapproach)4第一章先驗(yàn)分布與后驗(yàn)分布

統(tǒng)計(jì)學(xué)有兩個(gè)主要學(xué)派:頻率學(xué)派與貝葉斯學(xué)派.它們之間有異同,貝葉斯統(tǒng)計(jì)是在與經(jīng)典統(tǒng)計(jì)的爭論中發(fā)展起來,主要的爭論有:1.未知參數(shù)可否作為隨機(jī)變量?2.事件的概率是否一定的頻率解釋?3.概率是否可用經(jīng)驗(yàn)來確定?

……….§1.1先介紹三種信息的概念經(jīng)典統(tǒng)計(jì)學(xué)派規(guī)定統(tǒng)計(jì)推斷使用兩種信息:

總體信息樣本信息而貝葉斯學(xué)派認(rèn)為是三種信息:

總體信息樣本信息先驗(yàn)信息4第一章先驗(yàn)分布與后驗(yàn)分布統(tǒng)計(jì)學(xué)有兩個(gè)主要5總體信息

即總體分布或總體所屬分布族給我們的信息。譬如,“總體是正態(tài)分布”就給我們帶來很多信息:密度函數(shù)是一條鐘形曲線;一切一階距都存在;有關(guān)正態(tài)變量(服從正態(tài)分布隨機(jī)變量)的一些事件的概率可以計(jì)算;由正態(tài)分布可以導(dǎo)出分布,分布和分布等重要分布,還有許多成熟的點(diǎn)估計(jì)、區(qū)間估計(jì)和假設(shè)檢驗(yàn)方法可供我們選用??傮w信息是很重要的信息,為了獲得此信息,往往耗資巨大。5總體信息即總體分布或總體所屬分布族給我們的6樣本信息

從總體中抽取的樣本給我們提供的信息。這是最“新鮮”的信息,并且愈多愈好。人們希望對樣本的加工和處理對總體的某些特征作出較為精確的統(tǒng)計(jì)推斷。沒有樣本就沒有統(tǒng)計(jì)學(xué)可言。這是大家都理解的事實(shí)。6樣本信息從總體中抽取的樣本給我們提供的信息。7

基于上述兩種信息進(jìn)行的統(tǒng)計(jì)推斷稱為經(jīng)典統(tǒng)計(jì)學(xué),它的基本觀點(diǎn)是把數(shù)據(jù)(樣本)看成是具有一定概率分布的總體,所研究的對象是這個(gè)總體而不局限于數(shù)據(jù)本身。這方面最早的工作是高斯(Gauss,C.F.1777~1855)和勒讓德(Legendre,A.M.1752~1833)的誤差分析,正態(tài)分布和最小二乘法。從十九世紀(jì)末到二十世紀(jì)上半葉,經(jīng)皮爾遜(Pearson,K.1857~1936)、費(fèi)歇(Fisher,R.A.1890~1962)奈曼(Neyman.J.)等人的杰出工作創(chuàng)立了經(jīng)典統(tǒng)計(jì)學(xué)。隨著經(jīng)典統(tǒng)計(jì)學(xué)的持續(xù)發(fā)展與廣泛的應(yīng)用,它本身的缺陷也逐漸暴露出來了。7基于上述兩種信息進(jìn)行的統(tǒng)計(jì)推斷稱為經(jīng)典統(tǒng)計(jì)學(xué),8先驗(yàn)信息

即在抽樣之前有關(guān)統(tǒng)計(jì)問題的一些信息,一般說來,先驗(yàn)信息主要來源于經(jīng)驗(yàn)和歷史資料。例1:有一英國婦女,對奶茶能辨別出先倒進(jìn)茶還是先倒進(jìn)奶,做十次試驗(yàn)她都正確說出。

某學(xué)生第一次看到他的數(shù)學(xué)老師,即有反應(yīng):老師30歲到40之間,極可能35歲左右(左右可理解為正負(fù)3歲,極可能可理解為90%的可能).P(32≤X≤38)=0.908先驗(yàn)信息即在抽樣之前有關(guān)統(tǒng)計(jì)問題的一9910三種信息

基于上述三種信息(總體信息、樣本信息和先驗(yàn)信息)進(jìn)行的統(tǒng)計(jì)推斷被稱為貝葉斯統(tǒng)計(jì)學(xué)。它與經(jīng)典統(tǒng)計(jì)學(xué)的主要差別在于是否利用先驗(yàn)信息。貝葉斯統(tǒng)計(jì)學(xué)派把任意一個(gè)未知參數(shù)都看成隨機(jī)變量,應(yīng)用一個(gè)概率分布去描述它的未知狀況,該分布稱為先驗(yàn)分布。10三種信息基于上述三種信息(總體信息、11貝葉斯的信息處理路徑11貝葉斯的信息處理路徑12后驗(yàn)分布是三種信息的綜合,先驗(yàn)分布反應(yīng)人們在抽樣前對參數(shù)的認(rèn)識(shí),后驗(yàn)分布反應(yīng)人們在抽樣后對參數(shù)的認(rèn)識(shí)Bayes統(tǒng)計(jì)推斷原則:對參數(shù)所作任何推斷(參數(shù)估計(jì),假設(shè)檢驗(yàn)等)都必須建立在后驗(yàn)分布基礎(chǔ)上.12后驗(yàn)分布是三種信息的綜合,先驗(yàn)分布反應(yīng)人們在抽樣前對參數(shù)13共軛分布法

后驗(yàn)分布和先驗(yàn)分布是同一個(gè)類型13共軛分布法14

定義:設(shè)是總體分布中的參數(shù)(或參數(shù)向量),是的先驗(yàn)密度函數(shù),假如由抽樣信息算得的后驗(yàn)密度函數(shù)與有相同的密度函數(shù)形式,則稱是的(自然)共軛先驗(yàn)分布。

應(yīng)該著重指出,共軛先驗(yàn)分布是對某一分布中的參數(shù)而言的。如正態(tài)均值、正態(tài)方差、泊松均值等。離開指定參數(shù)及其所在的分布去談?wù)摴曹椣闰?yàn)分布是沒有意義的。14定義:設(shè)是總體分布中的參數(shù)(或參數(shù)向量),是的先15正態(tài)均值(方差已知)的共軛先驗(yàn)分布是正態(tài)分布15正態(tài)均值(方差已知)的共軛先驗(yàn)分布是正態(tài)分布1616171718常用共軛先驗(yàn)分布18常用共軛先驗(yàn)分布19共軛先驗(yàn)分布的優(yōu)點(diǎn)19共軛先驗(yàn)分布的優(yōu)點(diǎn)20貝葉斯估計(jì)在抽樣推斷中的應(yīng)用

貝葉斯估計(jì)法也是一種需要利用與調(diào)查變量相關(guān)的輔助變量(先驗(yàn)信息)進(jìn)行估計(jì)的方法,但其方法和思路與其他方法相比有自己的特色。貝葉斯估計(jì)法的基本思路是,要對某一指標(biāo)或目標(biāo)進(jìn)行估計(jì),則總體以前該指標(biāo)的水平,即先驗(yàn)指標(biāo)與目前欲估計(jì)的指標(biāo)(即目標(biāo)量)也稱后驗(yàn)指標(biāo)有關(guān),可以利用先驗(yàn)指標(biāo)對后驗(yàn)指標(biāo)進(jìn)行估計(jì)。20貝葉斯估計(jì)在抽樣推斷中的應(yīng)用貝葉斯估21設(shè),欲對總體均值進(jìn)行估計(jì),根據(jù)該總體以往的資料有該指標(biāo)的平均數(shù)和方差,現(xiàn)從總體N中抽出容量為n的樣本,計(jì)算得樣本平均數(shù)和該平均數(shù)的方差,則總體均值的貝葉斯估計(jì)法的估計(jì)量為:

21設(shè),欲對總體均值進(jìn)行估計(jì),根據(jù)該總體以往的資料有該22其中:

估計(jì)量的方差為:

22其中:23

顯然是相關(guān)的同一指標(biāo)的兩個(gè)取值水平,則上式的可以看做是以方差的倒數(shù)和為權(quán)數(shù)的加權(quán)算術(shù)平均,實(shí)際上此方差的倒數(shù)是估計(jì)精度的倒數(shù),即方差的值越大,其倒數(shù)便越小,則相應(yīng)平均數(shù)作為估計(jì)的精度就越低,通俗的講是該平均數(shù)的代表性越差;反之,方差越小,其倒數(shù)越大,相應(yīng)平均數(shù)的估計(jì)精度越高。23顯然是相關(guān)的同一指標(biāo)的兩24

貝葉斯估計(jì)量方差的意義是先驗(yàn)指標(biāo)和抽樣指標(biāo)精度之和的倒數(shù)。而以上估計(jì)式有非常直觀的含義:貝葉斯估計(jì)量的精度為先驗(yàn)指標(biāo)精度與抽樣指標(biāo)精度之和,這意味著貝葉斯估計(jì)量的精度要高于中任何一個(gè)作為估計(jì)量的估計(jì)精度,即:

24貝葉斯估計(jì)量方差的意義是先驗(yàn)指標(biāo)和抽樣指標(biāo)精25

例如,某市有居民家庭共97670戶,根據(jù)上年的統(tǒng)計(jì),居民人均月貨幣收入為2580元,其方差為5804.22,現(xiàn)從該總體中隨機(jī)抽出100戶,調(diào)查目前居民人均收入水平情況,有關(guān)調(diào)查結(jié)果和計(jì)算見表8.25例如,某市有居民家庭共97670戶26262727282829293030313132323333343435353636373738383939貝葉斯估計(jì)及其在

抽樣調(diào)查中的應(yīng)用貝葉斯估計(jì)及其在

抽樣調(diào)查中的應(yīng)用41

(Bayes,Thomas)(1702─1761)

貝葉斯是英國數(shù)學(xué)家.1702年生于倫敦;1761年4月17日卒于坦布里奇韋爾斯.

貝葉斯是一位自學(xué)成才的數(shù)學(xué)家.曾助理宗教事務(wù),后來長期擔(dān)任坦布里奇韋爾斯地方教堂的牧師.1742年,貝葉斯被選為英國皇家學(xué)會(huì)會(huì)員.

如今在概率、數(shù)理統(tǒng)計(jì)學(xué)中以貝葉斯姓氏命名的有貝葉斯公式、貝葉斯風(fēng)險(xiǎn)、貝葉斯決策函數(shù)、貝葉斯決策規(guī)則、貝葉斯估計(jì)量、貝葉斯方法、貝葉斯統(tǒng)計(jì)等等.2(Bayes,Thomas)(1702─17642貝葉斯方法(Bayesianapproach

)貝葉斯方法是基于貝葉斯定理而發(fā)展起來用于系統(tǒng)地闡述解決統(tǒng)計(jì)問題的方法(SamuelKotz和吳喜之,2000)。貝葉斯推斷的基本方法是將關(guān)于未知參數(shù)的先驗(yàn)信息與樣本信息綜合,再根據(jù)貝葉斯定理,得出后驗(yàn)信息,然后根據(jù)后驗(yàn)信息去推斷未知參數(shù)(茆詩松和王靜龍等,1998年)。

“貝葉斯提出了一種歸納推理的理論(貝葉斯定理),以后被一些統(tǒng)計(jì)學(xué)者發(fā)展為一種系統(tǒng)的統(tǒng)計(jì)推斷方法,稱為貝葉斯方法.”──摘自《中國大百科全書》(數(shù)學(xué)卷)3貝葉斯方法(Bayesianapproach)43第一章先驗(yàn)分布與后驗(yàn)分布

統(tǒng)計(jì)學(xué)有兩個(gè)主要學(xué)派:頻率學(xué)派與貝葉斯學(xué)派.它們之間有異同,貝葉斯統(tǒng)計(jì)是在與經(jīng)典統(tǒng)計(jì)的爭論中發(fā)展起來,主要的爭論有:1.未知參數(shù)可否作為隨機(jī)變量?2.事件的概率是否一定的頻率解釋?3.概率是否可用經(jīng)驗(yàn)來確定?

……….§1.1先介紹三種信息的概念經(jīng)典統(tǒng)計(jì)學(xué)派規(guī)定統(tǒng)計(jì)推斷使用兩種信息:

總體信息樣本信息而貝葉斯學(xué)派認(rèn)為是三種信息:

總體信息樣本信息先驗(yàn)信息4第一章先驗(yàn)分布與后驗(yàn)分布統(tǒng)計(jì)學(xué)有兩個(gè)主要44總體信息

即總體分布或總體所屬分布族給我們的信息。譬如,“總體是正態(tài)分布”就給我們帶來很多信息:密度函數(shù)是一條鐘形曲線;一切一階距都存在;有關(guān)正態(tài)變量(服從正態(tài)分布隨機(jī)變量)的一些事件的概率可以計(jì)算;由正態(tài)分布可以導(dǎo)出分布,分布和分布等重要分布,還有許多成熟的點(diǎn)估計(jì)、區(qū)間估計(jì)和假設(shè)檢驗(yàn)方法可供我們選用??傮w信息是很重要的信息,為了獲得此信息,往往耗資巨大。5總體信息即總體分布或總體所屬分布族給我們的45樣本信息

從總體中抽取的樣本給我們提供的信息。這是最“新鮮”的信息,并且愈多愈好。人們希望對樣本的加工和處理對總體的某些特征作出較為精確的統(tǒng)計(jì)推斷。沒有樣本就沒有統(tǒng)計(jì)學(xué)可言。這是大家都理解的事實(shí)。6樣本信息從總體中抽取的樣本給我們提供的信息。46

基于上述兩種信息進(jìn)行的統(tǒng)計(jì)推斷稱為經(jīng)典統(tǒng)計(jì)學(xué),它的基本觀點(diǎn)是把數(shù)據(jù)(樣本)看成是具有一定概率分布的總體,所研究的對象是這個(gè)總體而不局限于數(shù)據(jù)本身。這方面最早的工作是高斯(Gauss,C.F.1777~1855)和勒讓德(Legendre,A.M.1752~1833)的誤差分析,正態(tài)分布和最小二乘法。從十九世紀(jì)末到二十世紀(jì)上半葉,經(jīng)皮爾遜(Pearson,K.1857~1936)、費(fèi)歇(Fisher,R.A.1890~1962)奈曼(Neyman.J.)等人的杰出工作創(chuàng)立了經(jīng)典統(tǒng)計(jì)學(xué)。隨著經(jīng)典統(tǒng)計(jì)學(xué)的持續(xù)發(fā)展與廣泛的應(yīng)用,它本身的缺陷也逐漸暴露出來了。7基于上述兩種信息進(jìn)行的統(tǒng)計(jì)推斷稱為經(jīng)典統(tǒng)計(jì)學(xué),47先驗(yàn)信息

即在抽樣之前有關(guān)統(tǒng)計(jì)問題的一些信息,一般說來,先驗(yàn)信息主要來源于經(jīng)驗(yàn)和歷史資料。例1:有一英國婦女,對奶茶能辨別出先倒進(jìn)茶還是先倒進(jìn)奶,做十次試驗(yàn)她都正確說出。

某學(xué)生第一次看到他的數(shù)學(xué)老師,即有反應(yīng):老師30歲到40之間,極可能35歲左右(左右可理解為正負(fù)3歲,極可能可理解為90%的可能).P(32≤X≤38)=0.908先驗(yàn)信息即在抽樣之前有關(guān)統(tǒng)計(jì)問題的一48949三種信息

基于上述三種信息(總體信息、樣本信息和先驗(yàn)信息)進(jìn)行的統(tǒng)計(jì)推斷被稱為貝葉斯統(tǒng)計(jì)學(xué)。它與經(jīng)典統(tǒng)計(jì)學(xué)的主要差別在于是否利用先驗(yàn)信息。貝葉斯統(tǒng)計(jì)學(xué)派把任意一個(gè)未知參數(shù)都看成隨機(jī)變量,應(yīng)用一個(gè)概率分布去描述它的未知狀況,該分布稱為先驗(yàn)分布。10三種信息基于上述三種信息(總體信息、50貝葉斯的信息處理路徑11貝葉斯的信息處理路徑51后驗(yàn)分布是三種信息的綜合,先驗(yàn)分布反應(yīng)人們在抽樣前對參數(shù)的認(rèn)識(shí),后驗(yàn)分布反應(yīng)人們在抽樣后對參數(shù)的認(rèn)識(shí)Bayes統(tǒng)計(jì)推斷原則:對參數(shù)所作任何推斷(參數(shù)估計(jì),假設(shè)檢驗(yàn)等)都必須建立在后驗(yàn)分布基礎(chǔ)上.12后驗(yàn)分布是三種信息的綜合,先驗(yàn)分布反應(yīng)人們在抽樣前對參數(shù)52共軛分布法

后驗(yàn)分布和先驗(yàn)分布是同一個(gè)類型13共軛分布法53

定義:設(shè)是總體分布中的參數(shù)(或參數(shù)向量),是的先驗(yàn)密度函數(shù),假如由抽樣信息算得的后驗(yàn)密度函數(shù)與有相同的密度函數(shù)形式,則稱是的(自然)共軛先驗(yàn)分布。

應(yīng)該著重指出,共軛先驗(yàn)分布是對某一分布中的參數(shù)而言的。如正態(tài)均值、正態(tài)方差、泊松均值等。離開指定參數(shù)及其所在的分布去談?wù)摴曹椣闰?yàn)分布是沒有意義的。14定義:設(shè)是總體分布中的參數(shù)(或參數(shù)向量),是的先54正態(tài)均值(方差已知)的共軛先驗(yàn)分布是正態(tài)分布15正態(tài)均值(方差已知)的共軛先驗(yàn)分布是正態(tài)分布5516561757常用共軛先驗(yàn)分布18常用共軛先驗(yàn)分布58共軛先驗(yàn)分布的優(yōu)點(diǎn)19共軛先驗(yàn)分布的優(yōu)點(diǎn)59貝葉斯估計(jì)在抽樣推斷中的應(yīng)用

貝葉斯估計(jì)法也是一種需要利用與調(diào)查變量相關(guān)的輔助變量(先驗(yàn)信息)進(jìn)行估計(jì)的方法,但其方法和思路與其他方法相比有自己的特色。貝葉斯估計(jì)法的基本思路是,要對某一指標(biāo)或目標(biāo)進(jìn)行估計(jì),則總體以前該指標(biāo)的水平,即先驗(yàn)指標(biāo)與目前欲估計(jì)的指標(biāo)(即目標(biāo)量)也稱后驗(yàn)指標(biāo)有關(guān),可以利用先驗(yàn)指標(biāo)對后驗(yàn)指標(biāo)進(jìn)行估計(jì)。20貝葉斯估計(jì)在抽樣推斷中的應(yīng)用貝葉斯估60設(shè),欲對總體均值進(jìn)行估計(jì),根據(jù)該總體以往的資料有該指標(biāo)的平均數(shù)和方差,現(xiàn)從總體N中抽出容量為n的樣本,計(jì)算得樣本平均數(shù)和該平均數(shù)的方差,則總體均值的貝葉斯估計(jì)法的估計(jì)量為:

21設(shè),欲對總體均值進(jìn)行估計(jì),根據(jù)該總體以往的資料有該61

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論