統(tǒng)計(jì)量及其抽樣分布2_第1頁
統(tǒng)計(jì)量及其抽樣分布2_第2頁
統(tǒng)計(jì)量及其抽樣分布2_第3頁
統(tǒng)計(jì)量及其抽樣分布2_第4頁
統(tǒng)計(jì)量及其抽樣分布2_第5頁
已閱讀5頁,還剩54頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計(jì)量及其抽樣分布當(dāng)前1頁,總共59頁。第6章統(tǒng)計(jì)量及其抽樣分布6.1統(tǒng)計(jì)量6.2關(guān)于分布的幾個(gè)概念6.3由正態(tài)分布導(dǎo)出的幾個(gè)重要分布

6.4樣本均值的分布與中心極限定理6.5樣本比例的抽樣分布6.6兩個(gè)樣本平均值之差的分布6.7關(guān)于樣本方差的分布

當(dāng)前2頁,總共59頁。了解統(tǒng)計(jì)量及其分布的幾個(gè)概念了解由正態(tài)分布導(dǎo)出的幾個(gè)重要分布

理解樣本均值的分布與中心極限定理掌握單樣本比例和樣本方差的抽樣分布學(xué)習(xí)目標(biāo)當(dāng)前3頁,總共59頁。6.1

統(tǒng)計(jì)量6.1.1統(tǒng)計(jì)量的概念6.1.2常用統(tǒng)計(jì)量6.1.3次序統(tǒng)計(jì)量

6.1.4充分統(tǒng)計(jì)量

當(dāng)前4頁,總共59頁。設(shè)X1,X2,…,Xn是從總體X中抽取的容量為n的一個(gè)樣本,如果由此樣本構(gòu)造一個(gè)函數(shù)T(X1,X2,…,Xn),不依賴于任何未知參數(shù),則稱函數(shù)T(X1,X2,…,Xn)是一個(gè)統(tǒng)計(jì)量樣本均值、樣本比例、樣本方差等都是統(tǒng)計(jì)量統(tǒng)計(jì)量是樣本的一個(gè)函數(shù)統(tǒng)計(jì)量是統(tǒng)計(jì)推斷的基礎(chǔ)統(tǒng)計(jì)量

(statistic)當(dāng)前5頁,總共59頁。一組樣本觀測值X1,X2,…,Xn由小到大的排序

X(1)≤X(2)≤…≤X(i)≤…≤X(n)后,稱X(1),X(2),…,X(n)為次序統(tǒng)計(jì)量中位數(shù)、分位數(shù)、四分位數(shù)等都是次序統(tǒng)計(jì)量次序統(tǒng)計(jì)量當(dāng)前6頁,總共59頁。6.2

關(guān)于分布的幾個(gè)概念6.2.1抽樣分布6.2.2漸進(jìn)分布6.2.3隨機(jī)模擬獲得的近似分布

當(dāng)前7頁,總共59頁。樣本統(tǒng)計(jì)量的概率分布,是一種理論分布在重復(fù)選取容量為n的樣本時(shí),由該統(tǒng)計(jì)量的所有可能取值形成的相對頻數(shù)分布隨機(jī)變量是樣本統(tǒng)計(jì)量樣本均值,樣本比例,樣本方差等結(jié)果來自容量相同的所有可能樣本提供了樣本統(tǒng)計(jì)量長遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 抽樣分布

(samplingdistribution)當(dāng)前8頁,總共59頁。6.3由正態(tài)分布導(dǎo)出的幾個(gè)重要分布6.3.12分布6.3.2t

分布6.3.3F

分布當(dāng)前9頁,總共59頁。2分布當(dāng)前10頁,總共59頁。χ2

分布的使用如果一個(gè)變量的諸數(shù)值可視為幾個(gè)獨(dú)立變量值的平方和,則該變量服從χ2

分布方差就可視為若干隨機(jī)變量值的平方和樣本中各隨機(jī)數(shù)值與均值之離差的平方和(即樣本方差的n-1倍)與總體方差之比,服從自由度為n-1的χ2

分布當(dāng)前11頁,總共59頁。由阿貝(Abbe)

于1863年首先給出,后來由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)

分別于1875年和1900年推導(dǎo)出來設(shè),則令,則Y服從自由度為1的2分布,即

當(dāng)總體,從中抽取容量為n的樣本,則2分布

(2

distribution)當(dāng)前12頁,總共59頁。分布的變量值始終為正分布的形狀取決于其自由度n的大小,通常為不對稱的正偏分布,但隨著自由度的增大逐漸趨于對稱期望為:E(2)=n,方差為:D(2)=2n(n為自由度)可加性:若U和V為兩個(gè)獨(dú)立的2分布隨機(jī)變量,U~2(n1),V~2(n2),則U+V這一隨機(jī)變量服從自由度為n1+n2的2分布2分布

(性質(zhì)和特點(diǎn))當(dāng)前13頁,總共59頁。c2分布

(圖示)不同容量樣本的抽樣分布c2n=1n=4n=10n=20當(dāng)前14頁,總共59頁。t

分布當(dāng)前15頁,總共59頁。t分布高塞特(W.S.Gosset)于1908年在一篇以“Student”(學(xué)生)為筆名的論文中首次提出

t分布是類似正態(tài)分布的一種對稱分布,它通常要比正態(tài)分布平坦和分散一個(gè)特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布當(dāng)前16頁,總共59頁。t分布圖示xt

分布與標(biāo)準(zhǔn)正態(tài)分布的比較t分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)z當(dāng)前17頁,總共59頁。T

分布的圖形當(dāng)前18頁,總共59頁。T

分布的使用當(dāng)前19頁,總共59頁。F

分布當(dāng)前20頁,總共59頁。F分布兩個(gè)都服從χ2

分布的變量之比的分布規(guī)律??梢栽O(shè)想為兩個(gè)方差之比方差之比會(huì)接近1(因?yàn)榍懊嬉呀?jīng)假設(shè)各變量都服從標(biāo)準(zhǔn)正態(tài)分布),似乎存在一個(gè)“兩端少,中間多”的特征,但不對稱(除非其中存在一個(gè)無限總體,使樣本數(shù)量為無窮大,則樣本方差有無窮多個(gè))當(dāng)前21頁,總共59頁。由統(tǒng)計(jì)學(xué)家費(fèi)希爾()

提出的,以其姓氏的第一個(gè)字母來命名設(shè)若U為服從自由度為n1的2分布,即U~2(n1),V為服從自由度為n2的2分布,即V~2(n2),且U和V相互獨(dú)立,則稱F為服從自由度n1和n2的F分布,記為F分布

(F

distribution)當(dāng)前22頁,總共59頁。F分布兩個(gè)都服從χ2

分布的變量之比的分布規(guī)律??梢栽O(shè)想為兩個(gè)方差之比方差之比會(huì)接近1(因?yàn)榍懊嬉呀?jīng)假設(shè)各變量都服從標(biāo)準(zhǔn)正態(tài)分布),似乎存在一個(gè)“兩端少,中間多”的特征,但不對稱(除非其中存在一個(gè)無限總體,使樣本數(shù)量為無窮大,則樣本方差有無窮多個(gè))當(dāng)前23頁,總共59頁。F分布

(圖示)

不同自由度的F分布F(1,10)(5,10)(10,10)當(dāng)前24頁,總共59頁。F分布的圖形此處的n和m分別相當(dāng)于n1、n2當(dāng)前25頁,總共59頁。F分布的使用應(yīng)用很廣泛,可用來檢驗(yàn)兩狀態(tài)總體方差是否相等,檢驗(yàn)回歸方差是否有代表性,在方差分析和多元統(tǒng)計(jì)中都是重要的檢驗(yàn)手段。當(dāng)前26頁,總共59頁。三種抽樣分布的對比χ2分布可視為關(guān)于方差的分布規(guī)律。t分布中的兩個(gè)變量,一個(gè)服從正態(tài)分布,另一個(gè)服從χ2分布??梢暈榫蹬c方差之比的分布規(guī)律。F分布的變量都服從χ2分布,可以設(shè)想為兩個(gè)方差之比的分布規(guī)律。這些“分布”都說明變量的規(guī)律,某些具有相同特征的變量具有什么樣的共同規(guī)律?,F(xiàn)實(shí)中,按圖索驥,依樣畫葫蘆。當(dāng)前27頁,總共59頁。三種抽樣分布綜述為什么要使用統(tǒng)計(jì)方法?因?yàn)橐私馐挛锏臄?shù)量特征幾乎惟一的方法是抽樣,隨機(jī)抽樣抽樣可以有很多結(jié)果,眾結(jié)果的隨機(jī)性規(guī)律是正態(tài)分布為什么要導(dǎo)出三大抽樣分布?因?yàn)橐私獾臄?shù)量特征的性質(zhì)不同,比如,可能要了解樣本方差的規(guī)律若干個(gè)變量都服從正態(tài)分布,每變量有不同取值,計(jì)算每組取值中各值的平方,再加起來,該總和服從χ2

分布每次抽樣的誤差與平均誤差之比服從t分布兩個(gè)樣本的方差之比服從F分布什么是分布?骰子點(diǎn)數(shù)服從均勻分布,身高服從正態(tài)分布。分布就是各種情況發(fā)生概率的全體組合。當(dāng)前28頁,總共59頁。6.4樣本均值的分布與中心極限定理當(dāng)前29頁,總共59頁。抽樣分布抽樣分布從總體種抽出容量相同的樣本,計(jì)算統(tǒng)計(jì)量的值,然后按統(tǒng)計(jì)量的值所編制的頻數(shù)分布。抽樣分布的作用:根據(jù)抽樣分布研究統(tǒng)計(jì)量的性質(zhì)對統(tǒng)計(jì)推斷方法進(jìn)行評(píng)價(jià)當(dāng)前30頁,總共59頁。

抽樣分布:樣本統(tǒng)計(jì)量所有可能值的概率分布。樣本統(tǒng)計(jì)量總體未知參數(shù)樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量分布的形狀及接近總體參數(shù)的程度STAT當(dāng)前31頁,總共59頁。知道這些“分布”有什么用?從現(xiàn)象上看,事物非常復(fù)雜,但其中某些內(nèi)容具有某種意義上的相同性質(zhì)(比如7條魚與7天之間都有7這個(gè)數(shù)量)從邏輯上看,可以在某些限定條件下構(gòu)造許多模型,即數(shù)量關(guān)系(此處都用“等于”關(guān)系),這些關(guān)系的總和都符合邏輯,現(xiàn)實(shí)中事物如果符合那些限定條件,則其本角度的其他特征(可視為進(jìn)一步的發(fā)展結(jié)果)都會(huì)服從邏輯模型所表述的變化規(guī)律統(tǒng)計(jì)分布類型就是:在某些限定條件下,考察不同類型的個(gè)別數(shù)量現(xiàn)象在總體上具有什么樣的分布特征,熟知的如正態(tài)分布。這些模型的結(jié)果告訴我們各種情況出現(xiàn)的可能性。當(dāng)前32頁,總共59頁。抽樣分布分布的特征值:均值和標(biāo)準(zhǔn)差樣本主要統(tǒng)計(jì)量:平均數(shù)比率(成數(shù))方差STAT《統(tǒng)計(jì)學(xué)》第四章抽樣估計(jì)當(dāng)前33頁,總共59頁。在重復(fù)選取容量為n的樣本時(shí),由樣本均值的所有可能取值形成的相對頻數(shù)分布一種理論概率分布推斷總體均值的理論基礎(chǔ) 樣本均值的抽樣分布當(dāng)前34頁,總共59頁。樣本均值的抽樣分布

與中心極限定理=50

=10X總體分布n=4抽樣分布xn=16當(dāng)總體服從正態(tài)分布N(μ,σ2)時(shí),來自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x

的數(shù)學(xué)期望為μ,方差為σ2/n。即x~N(μ,σ2/n)當(dāng)前35頁,總共59頁。中心極限定理

(centrallimittheorem)當(dāng)樣本容量足夠大時(shí)(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布從均值為,方差為

2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個(gè)任意分布的總體x當(dāng)前36頁,總共59頁。學(xué)生ABCDEFG成績30405060708090按隨機(jī)原則抽選出4名學(xué)生,并計(jì)算平均分?jǐn)?shù)。平均數(shù)的抽樣分布樣本均值樣本均值樣本均值A(chǔ)BCDABCEABCFABCGABDEABDFABDGABEFABEGABFGACDEACDF4547.55052.55052.5555557.56052.555ACDGACEFACEGACFGADEFADEGADFGAEFGBCDEBCDFBCDGBCEF57.557.56062.56062.56567.55557.56060BCEGBCFGBDEFBDEGBDFGBEFGCDEFCDEGCDFGCEFGDEFG62.56562.56567.5706567.57072.575樣本均值4547.55052.55557.560出現(xiàn)次數(shù)1123445樣本均值62.56567.57072.575出現(xiàn)次數(shù)443211二者均值相等樣本均值的平均數(shù)總體的平均數(shù)當(dāng)前37頁,總共59頁。平均數(shù)的抽樣分布全部可能樣本平均數(shù)的均值等于總體均值,即:從非正態(tài)總體中抽取的樣本平均數(shù)當(dāng)n足夠大時(shí)其分布接近正態(tài)分布。從正態(tài)總體中抽取的樣本平均數(shù)不論容量大小其分布均為正態(tài)分布。樣本均值的標(biāo)準(zhǔn)差為總體標(biāo)準(zhǔn)差的。STAT當(dāng)前38頁,總共59頁。

AnexampleAdieisthrowninfinitelymanytimes.LetXrepresentthenumberofspotsshowingonanythrow.一個(gè)骰子被投擲了無數(shù)次,用X表示每一次出現(xiàn)的點(diǎn)數(shù).TheprobabilitydistributionofXisx123456p(x)1/61/61/61/61/61/6E(X)=1(1/6)+2(1/6)+3(1/6)+………=3.5V(X)=(1-3.5)2+(2-3.5)2+……………….=2.92當(dāng)前39頁,總共59頁。Supposewewanttoestimatemfromthemeanofasampleofsizen=2.Whatisthedistributionthatcanfollow樣本平均的分布是什么樣?當(dāng)前40頁,總共59頁。11.52.02.53.03.54.04.55.05.56.06/365/364/363/362/361/36E()=1.0(1/36)+1.5(2/36)+….=3.5V(X)=(1.0-3.5)2(1/36)+(1.5-3.5)2(2/36)...=1.46當(dāng)前41頁,總共59頁。111666Noticethatissmallerthansx.Thelargerthesamplesizethesmaller.Therefore,tendstofallclosertom,asthesamplesizeincreases.當(dāng)前42頁,總共59頁。Simulationofdicetossingn=2n=5n=10Mean=3.494 Stand.Dev.=0.544Mean=3.486 Stand.Dev.=1.215Mean=3.495 Stand.Dev.=0.749當(dāng)前43頁,總共59頁。Thevarianceofthesamplemeanissmallerthanthevarianceofthepopulation.樣本平均數(shù)方差小于總體方差123Also,Expectedvalueofthepopulation=(1+2+3)/3=2Mean=1.5Mean=2.5Mean=2.Population1.51.51.51.51.51.51.51.51.51.51.51.51.52.52.52.52.52.52.52.52.52.52.52.52.52.522222222222Expectedvalueofthesamplemean=(1.5+2+2.5)/3=2Comparethevariabilityofthepopulationtothevariabilityofthesamplemean.Letustakesamplesoftwoobservations當(dāng)前44頁,總共59頁。TheSamplingDistributionoftheSampleMean樣本平均數(shù)分布當(dāng)前45頁,總共59頁。抽樣推斷的理論基礎(chǔ)

大數(shù)定律大數(shù)定律是闡明大量隨機(jī)現(xiàn)象平均結(jié)果的穩(wěn)定性的一系列定理的總稱。其一般意義是:在隨機(jī)試驗(yàn)過程中,每次試驗(yàn)的結(jié)果不同,但大量重復(fù)試驗(yàn)后,所出現(xiàn)結(jié)果的平均值總是接近某一確定的值。

中心極限定理

第一,如果總體很大,而且服從正態(tài)分布,樣本平均數(shù)(或成數(shù))的分布也同樣服從正態(tài)分布。第二,如果總體很大,但不服從正態(tài)分布,只要樣本容量足夠大(n≥30),樣本平均數(shù)(或成數(shù))的分布趨近于正態(tài)分布。第三,樣本平均數(shù)(或成數(shù))的平均數(shù),等于總體平均數(shù)(或成數(shù))。

當(dāng)前46頁,總共59頁。當(dāng)前47頁,總共59頁。當(dāng)前48頁,總共59頁。STAT《統(tǒng)計(jì)學(xué)》第四章抽樣估計(jì)樣本均值4547.55052.55557.560出現(xiàn)次數(shù)1123445離差-15-12.5-10-7.5-5-2.50樣本均值62.56567.57072.575出現(xiàn)次數(shù)443211離差2.557.51012.515學(xué)生ABCDEFG成績30405060708090離差-30-20-10010203020=s當(dāng)前49頁,總共59頁。中心極限定理

(centrallimittheorem)x的分布趨于正態(tài)分布的過程當(dāng)前50頁,總共59頁。6.5樣本比例的抽樣分布當(dāng)前51頁,總共59頁。總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比不同性別的人與全部人數(shù)之比合格品(或不合格品)與全部產(chǎn)品總數(shù)之比總體比例可表示為樣本比例可表示為

比例

(proportion)當(dāng)前52頁,總共59頁。在重復(fù)選取容量為n的樣本時(shí),由樣本比例的所有可能取值形成的相對頻數(shù)分布一種理論概率分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論