第一基本概念與抽樣分布_第1頁
第一基本概念與抽樣分布_第2頁
第一基本概念與抽樣分布_第3頁
第一基本概念與抽樣分布_第4頁
第一基本概念與抽樣分布_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第一基本概念與抽樣分布第一頁,共五十三頁,2022年,8月28日然而在統(tǒng)計研究中,人們關(guān)心總體僅僅是關(guān)心其每個個體的一項(或幾項)數(shù)量指標(biāo)和該數(shù)量指標(biāo)在總體中的分布情況.這時,每個個體具有的數(shù)量指標(biāo)的全體就是總體.某批燈泡的壽命該批燈泡壽命的全體就是總體國產(chǎn)轎車每公里的耗油量國產(chǎn)轎車每公里耗油量的全體就是總體第二頁,共五十三頁,2022年,8月28日由于每個個體的出現(xiàn)是隨機(jī)的,所以相應(yīng)的數(shù)量指標(biāo)的出現(xiàn)也帶有隨機(jī)性.從而可以把這種數(shù)量指標(biāo)看作一個隨機(jī)變量,因此隨機(jī)變量的分布就是該數(shù)量指標(biāo)在總體中的分布.這樣總體就可以用一個隨機(jī)變量及其分布來描述.統(tǒng)計中,總體這個概念的要旨是:

總體就是一個隨機(jī)變(向)量或其概率分布.數(shù)理統(tǒng)計研究的內(nèi)容:總體相應(yīng)隨機(jī)變(向)量的概率分布及數(shù)字特征.第三頁,共五十三頁,2022年,8月28日為推斷總體分布及各種特征,按一定規(guī)則從總體中抽取若干個體進(jìn)行觀察試驗,以獲得有關(guān)總體的信息,這一抽取過程稱為“抽樣”,所抽取的部分個體稱為樣本.樣本中所包含的個體數(shù)目稱為樣本容量.2.樣本從國產(chǎn)轎車中抽5輛進(jìn)行耗油量試驗樣本容量為5(1).抽樣、樣本、樣本值第四頁,共五十三頁,2022年,8月28日

但是,一旦取定一組樣本,得到的是n個具體的數(shù)

(X1,X2,…,Xn),稱為樣本的一次觀察值,簡稱樣本值.樣本是隨機(jī)變量.抽到哪5輛是隨機(jī)的容量為n的樣本可以看作n維隨機(jī)向量.第五頁,共五十三頁,2022年,8月28日樣本具有兩重性:10.隨機(jī)性樣本(X1,X2,…,Xn)本身是隨機(jī)向量。20.相對確定性經(jīng)過一次抽樣否,樣本(X1,X2,…,Xn)又是一組確定的樣本值(x1,x2,…,xn)。第六頁,共五十三頁,2022年,8月28日由于抽樣的目的是為了對總體進(jìn)行統(tǒng)計推斷,為了使抽取的樣本能很好地反映總體的信息,必須考慮抽樣方法.最常用的一種抽樣方法叫作“簡單隨機(jī)抽樣”,它要求抽取的樣本滿足下面三點:10.隨機(jī)性:X1,X2,…,Xn每個結(jié)果等可能被抽取。20.代表性:X1,X2,…,Xn中每一個與所考察的總體有相同的分布;30.獨立性:X1,X2,…,Xn是相互獨立的隨機(jī)變量,每個樣本值互不干擾。(2).簡單隨機(jī)樣本第七頁,共五十三頁,2022年,8月28日

由簡單隨機(jī)抽樣得到的樣本稱為簡單隨機(jī)樣本,它可以用與總體獨立同分布的n個隨機(jī)變量X1,X2,…,Xn表示.簡單隨機(jī)樣本是應(yīng)用中最常見的情形,今后,當(dāng)說到“X1,X2,…,Xn是取自某總體的樣本”時,若不特別說明,就指簡單隨機(jī)樣本.數(shù)學(xué)定義:

n個隨機(jī)變量X1,X2,…,Xn獨立同分布(X與同分布),則稱(X1,X2,…,Xn)來自總體X的容量為n的簡單隨機(jī)樣本,簡稱為樣本.第八頁,共五十三頁,2022年,8月28日事實上我們抽樣后得到的資料都是具體的、確定的值.如我們從某班大學(xué)生中抽取10人測量身高,得到10個數(shù),它們是樣本取到的值而不是樣本.我們只能觀察到隨機(jī)變量取的值而見不到隨機(jī)變量.3.總體、樣本、樣本值的關(guān)系第九頁,共五十三頁,2022年,8月28日總體(理論分布)?樣本樣本值統(tǒng)計是從手中已有的資料--樣本值,去推斷總體的情況---總體分布F(x)的性質(zhì).總體分布決定了樣本取值的概率規(guī)律,也就是樣本取到樣本值的規(guī)律,因而可以由樣本值去推斷總體.樣本是聯(lián)系二者的橋梁第十頁,共五十三頁,2022年,8月28日實際上,樣本的分布與總體分布的關(guān)系如下定理1.若總體的分布函數(shù)為F(x),則其簡單隨機(jī)樣本的聯(lián)合分布函數(shù)為第十一頁,共五十三頁,2022年,8月28日由樣本值去推斷總體情況,需要對樣本值進(jìn)行“加工”,這就要構(gòu)造一些樣本的函數(shù),它把樣本中所含的(某一方面)的信息集中起來.二、統(tǒng)計量1.定義設(shè)(X1,X2,…,Xn)為總體X的一個樣本,f(X1,X2,…,Xn)是一個不含任何有關(guān)總體分布未知參數(shù)的函數(shù),稱為此總體的一個統(tǒng)計量,它是完全由樣本決定的量.統(tǒng)計量實際上也是一個隨機(jī)變量,它是一個隨機(jī)向量的函數(shù)。第十二頁,共五十三頁,2022年,8月28日是統(tǒng)計量.不是統(tǒng)計量.統(tǒng)計量的兩重性(1).統(tǒng)計量f(X1,X2,…,Xn)本身是隨機(jī)向量,他有確定的概率分布-抽樣分布。(2).經(jīng)過一次抽樣否,f(X1,X2,…,Xn)又是由樣本值(x1,x2,…,xn)確定的一個統(tǒng)計值。第十三頁,共五十三頁,2022年,8月28日樣本k-階原點矩樣本k-階中心矩

k=1,2,…它反映了總體k階矩的信息它反映了總體k階中心矩的信息2.常用的統(tǒng)計量(樣本矩)(1).定義它們均是隨機(jī)變量第十四頁,共五十三頁,2022年,8月28日樣本均值樣本方差它反映了總體均值的信息它反映了總體方差的信息k=1時,A1稱為樣本均值k=2時,B2稱為樣本方差更加常用簡稱為樣本方差第十五頁,共五十三頁,2022年,8月28日(2).矩的性質(zhì)性質(zhì)1.由大數(shù)定律可知大樣本條件下,一次抽樣后樣本均值、方差可作為總體的均值、方差的近似。一般地,抽樣分為大樣本和小樣本問題。第十六頁,共五十三頁,2022年,8月28日性質(zhì)2.證第十七頁,共五十三頁,2022年,8月28日推論證第十八頁,共五十三頁,2022年,8月28日第十九頁,共五十三頁,2022年,8月28日3.次序統(tǒng)計量(1).定義即:X(k)的取值x(k)為(x(1),…,x(n))按從小到大的次序重新排列后第k個位置的數(shù),第二十頁,共五十三頁,2022年,8月28日(2).中位數(shù)、樣本極差中位數(shù)樣本極差次序統(tǒng)計量、中位數(shù)、樣本極差都是統(tǒng)計量。極差可以反映樣本值變化的程度或離散程度。第二十一頁,共五十三頁,2022年,8月28日例1.計算下列樣本中位數(shù)、均值、方差、標(biāo)準(zhǔn)差、極差.解第二十二頁,共五十三頁,2022年,8月28日4.經(jīng)驗分布函數(shù)(1).定義當(dāng)給定次序統(tǒng)計量的一組值定義對稱Fn(x)為總體X的經(jīng)驗分布函數(shù)。為樣本值不超過x的頻率。第二十三頁,共五十三頁,2022年,8月28日經(jīng)驗分布函數(shù)Fn(x)從樣本直觀得到描述性分布.樣本直方圖可以描述.(2).經(jīng)驗分布函數(shù)的性質(zhì)10.具有通常分布函數(shù)的三個性質(zhì),圖形呈跳躍上升;20.Fn(x)是一個隨機(jī)變量;第二十四頁,共五十三頁,2022年,8月28日30.經(jīng)驗分布函數(shù)Fn(x)與總體分布函數(shù)F(x)的關(guān)系格列汶科(Glivenko)定理:第二十五頁,共五十三頁,2022年,8月28日三、抽樣分布統(tǒng)計量既然是依賴于樣本的,而后者又是隨機(jī)變量,故統(tǒng)計量也是隨機(jī)變量,因而就有一定的分布,這個分布叫做統(tǒng)計量的“抽樣分布”

.

抽樣分布精確抽樣分布漸近分布(小樣本問題中使用)(大樣本問題中使用)

抽樣分布是由一個統(tǒng)計量(隨機(jī)變量函數(shù))的分布.研究統(tǒng)計量的性質(zhì)和評價一個統(tǒng)計推斷的優(yōu)良性,完全取決于其抽樣分布的性質(zhì).第二十六頁,共五十三頁,2022年,8月28日由實際問題與中心極限定理可知,討論正態(tài)總體的樣本統(tǒng)計量的分布非常必要。1.正態(tài)總體X與樣本線性函數(shù)的分布(1)總體X~第二十七頁,共五十三頁,2022年,8月28日(2)(X1,…,Xn)來自總體X~第二十八頁,共五十三頁,2022年,8月28日設(shè)X1,…,Xn~N(0,1)且相互獨立,則稱隨機(jī)變量:是由正態(tài)分布派生出來的一種分布.(1).定義所服從的分布為自由度為n

的n為獨立隨機(jī)正態(tài)變量的個數(shù),也稱為第二十九頁,共五十三頁,2022年,8月28日其中Γ(x)為伽瑪(Gamma)函數(shù)具有如下性質(zhì):可由數(shù)歸法得到第三十頁,共五十三頁,2022年,8月28日10.

設(shè)X1,…,Xn~則E(X)=n,D(X)=2n由定義知E(Xi)=0,D(Xi)=1=n第三十一頁,共五十三頁,2022年,8月28日30.

2變量的可加性要用到獨立隨機(jī)變量和的卷積公式和Γ(x)的性質(zhì)。=2n第三十二頁,共五十三頁,2022年,8月28日應(yīng)用Lindeberg中心極限定理可得:40.極限分布第三十三頁,共五十三頁,2022年,8月28日記為T~t(n).設(shè)X~N(0,1),Y~

2(n),且相互獨立,則稱隨機(jī)變量所服從的分布為自由度為n的t分布,也稱為t變量.3.t-分布(1).定義:(2).T變量的密度函數(shù)為:第三十四頁,共五十三頁,2022年,8月28日10.T~t(n)為具有自由度為n的t分布的隨機(jī)變量,則T的數(shù)字特征具有如下性質(zhì):當(dāng)n=1時,T~t(n)實際上是柯西分布,任何階矩均不存在;(3).T變量的性質(zhì):當(dāng)n>2,E(T)=0;D(T)=n/(n-2)

.

第三十五頁,共五十三頁,2022年,8月28日事實上第三十六頁,共五十三頁,2022年,8月28日當(dāng)n充分大時,其圖形類似于標(biāo)準(zhǔn)正態(tài)分布密度函數(shù)的圖形.t分布的密度函數(shù)關(guān)于x=0對稱,是偶函數(shù),且應(yīng)用Γ函數(shù)的性質(zhì)及司特林(Stirling)公式得:30.極限分布當(dāng)n充分大時,t分布近似N

(0,1)分布.但對于較小的n,t分布與N(0,1)分布相差很大.第三十七頁,共五十三頁,2022年,8月28日由定義可見,服從自由度為n1及n2的F-分布,n1稱為第一自由度,n2稱為第二自由度,記作F~F(n1,n2).~F(n2,n1)4.F-分布(1).定義也稱為F變量第三十八頁,共五十三頁,2022年,8月28日EX不依賴于第一自由度n1.10.若X~F(n1,n2),X的數(shù)學(xué)特征:若n2>2(2).若X~F(n1,n2),X的概率密度為(3).F變量的性質(zhì)第三十九頁,共五十三頁,2022年,8月28日20.若n1=1時,F(xiàn)~F(1,n2)=t2(n2).30.極限分布若X~F(n1,n2),n2>4,則第四十頁,共五十三頁,2022年,8月28日四、抽樣分布定理當(dāng)總體為正態(tài)分布時,我們簡單地敘述幾個抽樣分布定理.1.一個正態(tài)總體X~設(shè)X1,X2,…,Xn是來自總體X~(1).定理1.(樣本均值的分布)第四十一頁,共五十三頁,2022年,8月28日n取不同值時樣本均值的分布第四十二頁,共五十三頁,2022年,8月28日n取不同值時的分布第四十三頁,共五十三頁,2022年,8月28日(2).定理2(樣本方差的分布)則有X1,X2,…,Xn是來自總體X~第四十四頁,共五十三頁,2022年,8

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論