概率統(tǒng)計基礎(chǔ) 3 隨機變量及抽樣分布final_第1頁
概率統(tǒng)計基礎(chǔ) 3 隨機變量及抽樣分布final_第2頁
概率統(tǒng)計基礎(chǔ) 3 隨機變量及抽樣分布final_第3頁
概率統(tǒng)計基礎(chǔ) 3 隨機變量及抽樣分布final_第4頁
概率統(tǒng)計基礎(chǔ) 3 隨機變量及抽樣分布final_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第3章隨機變量及抽樣分布李芳鳳

email:fangfly2003@163.com概率論與統(tǒng)計學(xué)都是從數(shù)量關(guān)系上研究隨機現(xiàn)象的統(tǒng)計規(guī)律性。在概率論中,所研究隨機變量的分布是已知的;在統(tǒng)計中,所研究的隨機變量的分布是未知或不完全知道,需要通過對所研究的隨機變量進行重復(fù)獨立的觀察,得到觀察值,分析并推斷整體分布。研究對象的全體稱為總體問題:這樣定義的總體和個體是具體的對象,不符合數(shù)學(xué)研究的特點---抽象例考察某班級學(xué)生的英語課程學(xué)習(xí)成績,則全體學(xué)生構(gòu)成了一個總體,每個同學(xué)就是一個個體.例考察某工廠生產(chǎn)的某批燈泡的壽命,則該廠生產(chǎn)的該批燈泡構(gòu)成了一個總體,每個燈泡就是一個個體.總體個體總體中的一個具體對象稱為個體如何改進?隨機變量這些數(shù)量指標(biāo)是服從某種分布的r.v研究對象的全體稱為總體

考察某班級學(xué)生的英語課程學(xué)習(xí)成績,則全體學(xué)生構(gòu)成了一個總體,每個同學(xué)就是一個個體.

考察某工廠生產(chǎn)的某批燈泡的壽命,則該廠生產(chǎn)的該批燈泡構(gòu)成了一個總體,每個燈泡就是一個個體.總體個體總體中的一個具體對象稱為個體例例不是研究它們而是研究數(shù)量指標(biāo)隨機變量研究對象的全體稱為總體例

考察某班級學(xué)生的英語課程學(xué)習(xí)成績,則全體學(xué)生構(gòu)成了一個總體,每個同學(xué)就是一個個體.例考察某工廠生產(chǎn)的某批燈泡的壽命,則該廠生產(chǎn)的該批燈泡構(gòu)成了一個總體,每個燈泡就是一個個體.總體個體總體中的一個具體對象稱為個體隨機樣本總體:研究對象的數(shù)量指標(biāo)

個體:隨機變量X的值以隨機變量X代表總體的特征總體 個體 特征一批產(chǎn)品 每件產(chǎn)品 等級一批燈泡 每個燈泡 壽命一年的日平均氣溫 每天日平均氣溫 度數(shù)數(shù)軸上某一線段 線段中每一點 坐標(biāo)一批彩票 每張彩票 號碼人們感興趣的是總體的某一個或幾個數(shù)量指標(biāo)的分布情況。每個個體所取的值不同,但它按一定規(guī)律分布。如何收集數(shù)據(jù)這一過程稱為抽樣問從研究對象中任取n個“個體”,觀察它們的數(shù)量指標(biāo)每次取出的樣品與總體有相同的分布?稱為容量為n的樣本.獨立性:要求各次取樣的結(jié)果互不影響代表性:在相同條件下對總體X進行n次重復(fù)、獨立觀察抽樣的特點是相互獨立,與總體同分布的隨機變量觀察前:觀察后:樣本值為n個具體的觀察數(shù)據(jù)樣本的二重性樣本觀察值樣本的特點例

某廠生產(chǎn)了一大批燈泡,現(xiàn)從中隨機抽取5只進行檢測,測得其壽命(小時)分別為總體為燈泡的壽命樣本容量為5,樣本為分析樣本觀察值為樣本二重性簡單隨機樣本若X1,X2,…,Xn是相互獨立的每一個Xi(i=1,2,…,n)的分布都與總體X的分布相同則稱X1,X2,…,Xn為容量為n的樣本為簡單隨機樣本。10

樣本是總體的代表和反映,但在我們抽取樣本之后,并不直接利用樣本進行推斷,而需要對樣本進行一番“加工”和“提煉”,把樣本所包含的關(guān)于我們所關(guān)心的事物的信息集中起來,這便是針對不同的問題構(gòu)造出樣本的某種函數(shù),這種函數(shù)在統(tǒng)計學(xué)中稱為統(tǒng)計量。統(tǒng)計量

引進統(tǒng)計量的目的是為了將雜亂無序的樣本值歸結(jié)為一個便于進行統(tǒng)計推斷和研究分析的形式,集中樣本所含信息,使之更易揭示問題實質(zhì),從而解決問題。統(tǒng)計量中應(yīng)該不含有未知參數(shù);如果統(tǒng)計量中仍含有未知參數(shù),就無法依靠樣本觀測值求出未知參數(shù)的估計值,因而失去利用統(tǒng)計量估計未知參數(shù)的意義,這是違背我們引進統(tǒng)計量的初衷的。常用的統(tǒng)計量

樣本矩樣本均值和樣本方差的更一般的推廣是樣本矩,這是一類常見的統(tǒng)計量。1.定義

mk=(xik)/n

稱為樣本k階原點矩,

特別,樣本一階原點矩就是樣本均值。

稱為樣本k階中心矩。特別,樣本二階中心矩就是樣本方差。

vk=

(xi

ˉx)k/n當(dāng)總體關(guān)于分布中心對稱時,我們用?x和s刻畫樣本特征很有代表性.而當(dāng)其不對稱時,只用ˉx和s就顯得很不夠。為此,需要一些刻畫分布形狀的統(tǒng)計量,如樣本偏度和樣本峰度,它們都是樣本中心矩的函數(shù)。樣本偏度a3反映了總體分布密度曲線的對稱性信息。樣本峰度a4反映了總體分布密度曲線在其峰值附近的陡峭程度。2定義:

a3=v3/v23/2稱為樣本偏度,

a4=v4/v22-3

稱為樣本峰度。樣本統(tǒng)計量的概率分布,是一種理論分布在重復(fù)選取容量為n的樣本時,由該統(tǒng)計量的所有可能取值形成的相對頻數(shù)分布隨機變量是樣本統(tǒng)計量樣本均值,樣本比例,樣本方差等結(jié)果來自容量相同的所有可能樣本提供了樣本統(tǒng)計量長遠而穩(wěn)定的信息,是進行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 抽樣分布(samplingdistribution)抽樣分布的形成過程

(samplingdistribution)總體樣本計算樣本統(tǒng)計量如:樣本均值、比例、方差由阿貝(Abbe)

于1863年首先給出,后來由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)

分別于1875年和1900年推導(dǎo)出來幾個重要分布

c2-分布(2-distribution)記為定義:設(shè)

相互獨立,都服從正態(tài)分布N(0,1),則稱隨機變量:

所服從的分布為自由度為

n

的分布.其中,的密度函數(shù)為自由度為

n的n=2n=3n=5n=10n=15則設(shè)分布的變量值始終為正分布的形狀取決于其自由度n的大小,通常為不對稱的右偏分布,但隨著自由度的增大逐漸趨于對稱.c2-分布(性質(zhì)和特點)c2n=1n=4n=10n=20期望為:E(2)=n,方差為:D(2)=2n(n為自由度)可加性:若U和V為兩個獨立的2分布隨機變量,U~2(n1),V~2(n2),則U+V這一隨機變量服從自由度為n1+n2的2分布c2-分布(性質(zhì)和特點)分布的性質(zhì)4.

設(shè)相互獨立,都服從正態(tài)分布則n=1020.05(10)?分布的分位點c2-分布(用Excel計算c2分布的概率)利用Excel提供的【CHIDIST】統(tǒng)計函數(shù),計算c2分布右單尾的概率值語法:CHIDIST(x,degrees_freedom)

,其中df為自由度,x是隨機變量的取值利用【CHIINV】函數(shù)則可以計算給定右尾概率和自由度時相應(yīng)的反函數(shù)值語法:CHIINV(probability,degrees_freedom)

計算c2

分布的概率Excelt-分布(t-distribution)提出者是WilliamGosset,也被稱為學(xué)生分布(student’st)

t分布是類似正態(tài)分布的一種對稱分布,通常要比正態(tài)分布平坦和分散。一個特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布xt

分布與標(biāo)準(zhǔn)正態(tài)分布的比較t分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)zt

分布(Student分布)定義則稱T服從自由度為n

的t分布.記為其概率密度函數(shù)為X,Y相互獨立,設(shè)t分布的性質(zhì)1°fn(t)是偶函數(shù),n=1n=20t分布的圖形(紅色的是標(biāo)準(zhǔn)正態(tài)分布)分布的分位點?n=10t-t?例如:t分布的分位點的性質(zhì)用Excel計算t分布的概率和臨界值利用Excel中的【TDIST】統(tǒng)計函數(shù),可以計算給定值和自由度時分布的概率值語法:TDIST(x,degrees_freedom,tails)

利用【TINV】函數(shù)則可以計算給定概率和自由度時的相應(yīng)

語法:TINV(probability,degrees_freedom)計算t分布的臨界值Excel與t分布有關(guān)的抽樣分布,樣本為(),與相互獨立設(shè)總體(1)(2)

定理

設(shè)X1,X2,…,Xn是取自正態(tài)總體的樣本,分別為樣本均值和樣本方差,則有

定理(兩總體樣本均值差的分布)

分別是這兩個樣本的且X與Y獨立,X1,X2,…,是取自X的樣本,取自Y的樣本,分別是這兩個樣本的樣本方差,均值,則有Y1,Y2,…,是樣本為紀(jì)念統(tǒng)計學(xué)家費希爾(R.A.Fisher)

以其姓氏的第一個字母來命名定義若X~X2(m),Y~X2(n),X,Y相互獨立,則稱隨機變量為服從第一自由度為n1,第二自由度為n2的F分布,記為F-分布(F

distribution)不同自由度的F分布F(1,10)(5,10)(10,10)m=n=10?分布的分位點F分布的性質(zhì)例如解求F(n,m)?(用Excel計算F分布的概率和臨界值)利用Excel提供的【FDIST】統(tǒng)計函數(shù),計算分布右單尾的概率值語法:FDIST(x,degrees_freedom1,degrees_freedom2)利用【FINV】函數(shù)則可以計算給定單尾概率和自由度時的相應(yīng)分位數(shù)語法:FINV(probability,degrees_freedom1,degrees_freedom2)計算F分布的概率Excel在重復(fù)選取容量為n的樣本時,由樣本均值的所有可能取值形成的相對頻數(shù)分布一種理論概率分布推斷總體均值的理論基礎(chǔ) §樣本均值的分布樣本均值的分布(例題分析)【例】設(shè)一個總體,含有4個元素(個體)

,即總體單位數(shù)N=4。4

個個體分別為x1=1,x2=2,x3=3,x4=4

??傮w的均值、方差及分布如下總體分布14均值和方差樣本均值的分布

現(xiàn)從總體中抽取n=2的簡單隨機樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)x樣本均值的抽樣分布1.00P

(x)1.53.04.03.52.02.5樣本均值的分布與總體分布的比較=2.5σ2=1.25總體分布樣本均值分布樣本均值的分布與中心極限定理=50

=10X總體分布n=4抽樣分布xn=16當(dāng)總體服從正態(tài)分布N(μ,σ2)時,來自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x

的期望值為μ,方差為σ2/n。即x~N(μ,σ2/n)中心極限定理(centrallimittheorem)當(dāng)樣本容量足夠大時(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布從均值為,方差為2的一個任意總體中抽取容量為n的樣本,當(dāng)n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個任意分布的總體x中心極限定理

(centrallimittheorem)x的分布趨于正態(tài)分布的過程樣本均值的分布樣本均值的期望值和方差樣本均值的分布

(數(shù)學(xué)期望與方差)抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本樣本均值正態(tài)分布樣本均值正態(tài)分布樣本均值非正態(tài)分布例某汽車電瓶商聲稱其生產(chǎn)的電瓶具有均值為60個月、標(biāo)準(zhǔn)差為6個月的壽命分布。假設(shè)質(zhì)檢部門決定檢驗該廠的說法是否準(zhǔn)確,隨機抽取了50個電瓶進行壽命試驗。

1)假定廠商聲稱是正確的,描述50個電瓶的平均壽命的抽樣分布。

2)假定廠商聲稱是正確的,則50個樣品組成的樣本平均壽命不超過57個月的概率為多少?解(1)根據(jù)中心極限定理,推出50個電瓶的平均壽命的分布近似服從正態(tài)分布μ=60,σ2=36/50=0.72,則σ=0.85即ˉx~N(60,0.852)2)50個電瓶平均壽命不超

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論