數(shù)理統(tǒng)計與隨機(jī)過程ch6

上傳人：m*** IP屬地：江西上傳時間：2022-08-08 格式：PPT 頁數(shù)：55 大?。?.68MB 積分：30 舉報 版權(quán)申訴

已閱讀5頁，還剩50頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)理統(tǒng)計與隨機(jī)過程第六章主講教師：陳立萍北京工業(yè)大學(xué)應(yīng)用數(shù)理學(xué)院數(shù)理統(tǒng)計學(xué)是一門應(yīng)用性很強(qiáng)的學(xué)科。它研究如何以有效的方式收集、整理和分析帶有隨機(jī)性的數(shù)據(jù)，以便對所考察的問題作出正確的推斷和預(yù)測，為采取正確的決策和行動提供依據(jù)和建議。數(shù)理統(tǒng)計不同于一般的資料統(tǒng)計，它更側(cè)重于應(yīng)用隨機(jī)現(xiàn)象本身的規(guī)律性進(jìn)行資料的收集、整理和分析。第六章樣本及抽樣分布6.1 引言由于大量隨機(jī)現(xiàn)象必然呈現(xiàn)出其規(guī)律性，因而從理論上講，只要對隨機(jī)現(xiàn)象進(jìn)行足夠多次的觀察，隨機(jī)現(xiàn)象的規(guī)律性就一定能夠清楚地呈現(xiàn)出來。但是，客觀上只允許我們對隨機(jī)現(xiàn)象進(jìn)行次數(shù)不多的觀察或試驗，也就是說：我們獲得的只能是局部的或有限的觀察資料

2、。數(shù)理統(tǒng)計的任務(wù)就是研究 “如何有效地收集、整理和分析所獲得的有限資料，并對所研究的問題盡可能地給出精確而可靠的推斷”。現(xiàn)實世界中存在著形形色色的數(shù)據(jù)，分析這些數(shù)據(jù)需要多種多樣的方法。因此，數(shù)理統(tǒng)計中的方法和支持這些方法的相應(yīng)理論是相當(dāng)豐富的。概括起來可以歸納成兩大類。參數(shù)估計: 根據(jù)數(shù)據(jù)，對分布中的未知參數(shù) 進(jìn)行估計；假設(shè)檢驗: 根據(jù)數(shù)據(jù)，對分布的未知參數(shù)的某種假設(shè)進(jìn)行檢驗。參數(shù)估計與假設(shè)檢驗構(gòu)成了統(tǒng)計推斷的兩種基本形式，這兩種推斷滲透到了數(shù)理統(tǒng)計的每個分支。6.2 總體與樣本在數(shù)理統(tǒng)計中，稱研究問題所涉及對象的全體為總體，總體中的每個成員為個體。例如: 研究某工廠生產(chǎn)的某

3、種產(chǎn)品的廢品率，則這種產(chǎn)品的全體就是總體，而每件產(chǎn)品都是一個個體。6.2.1 總體、個體與樣本實際上，我們真正關(guān)心的并不一定是總體或個體本身，而真正關(guān)心的是總體或個體的某項數(shù)量指標(biāo)。如：某電子產(chǎn)品的使用壽命，某天的最高氣溫，加工出來的某零件的長度等數(shù)量指標(biāo)。因此，有時也將總體理解為那些研究對象的某項數(shù)量指標(biāo)的全體。為評價某種產(chǎn)品質(zhì)量的好壞，通常的做法是：從全部產(chǎn)品中隨機(jī)(任意)地抽取一些樣品進(jìn)行觀測(檢測)，統(tǒng)計學(xué)上稱這些樣品為一個樣本。同樣,我們也將樣本的數(shù)量指標(biāo)稱為樣本。因此，今后當(dāng)我們說到總體及樣本時，既指研究對象又指它們的某項數(shù)量指標(biāo)。例1：研究某地區(qū) N 個農(nóng)戶的年收人。在

4、這里，總體既指這 N 個農(nóng)戶，又指我們所關(guān)心的 N個農(nóng)戶的數(shù)量指標(biāo)他們的年收入( N 個數(shù)字)。如果從這 N 個農(nóng)戶中隨機(jī)地抽出 n 個農(nóng)戶作為調(diào)查對象，那么，這 n 個農(nóng)戶以及他們的數(shù)量指標(biāo)年收入( n個數(shù)字)就是樣本。注意：上例中的總體是直觀的，看得見、摸得著的。但是，客觀情況并非總是這樣。例2：用一把尺子測量一件物體的長度。假定 n 次測量值分別為X1,X2 ,Xn。顯然，在該問題中，我們把測量值X1,X2 ,Xn看成樣本。但總體是什么呢? 事實上，這里沒有一個現(xiàn)實存在的個體的集合可以作為上述問題的總體?？墒牵覀兛梢赃@樣考慮，既然 n 個測量值 X1,X2,Xn 是樣本，那么，總

5、體就應(yīng)該理解為一切所有可能的測量值的全體。又如：為研究某種安眠藥的藥效，讓 n 個病人同時服用這種藥，記錄服藥者各自服藥后的睡眠時間比未服藥時增加睡眠的小時數(shù) X1,X2,Xn，則這些數(shù)字就是樣本。那么，什么是總體呢? 設(shè)想讓某個地區(qū)(或某國家，甚至全世界)所有患失眠癥的病人都服用此藥，則他們所增加睡眠的小時數(shù)之全體就是研究問題的總體。對一個總體，如果用X表示其數(shù)量指標(biāo)，那么，X的值對不同的個體就取不同的值。因此，如果我們隨機(jī)地抽取個體，則X的值也就隨著抽取個體的不同而不同。所以，X是一個隨機(jī)變量! 既然總體是隨機(jī)變量X，自然就有其概率分布。我們把X的分布稱為總體分布。總體的特性是由總

6、體分布來刻畫的。因此，常把總體和總體分布視為同義語。.6.2.2 總體分布例 3 (例 l 續(xù))：在例 l中，若農(nóng)戶年收入以萬元計，假定 N戶的收入X只取以下各值: 0.5, 0.8, l.0, 1.2和1.5。取上述值的戶數(shù)分別n1, n2, n3, n4和n5 (n1+n2+n3+n4+n5=N)。則X為離散型分布，分布律為:例4 ( 例2續(xù) )：在例2中，假定物體真實長度為(未知)。一般說來，測量值X就是總體，取附近值的概率要大一些，而離越遠(yuǎn)的值被取到的概率就越小。如果測量過程沒有系統(tǒng)性誤差，則X取大于和小于的概率也會相等。在這種情況下，人們往往認(rèn)為X 服從均值為，方差為2

7、的正態(tài)分布。2反映了測量的精度。于是，總體X的分布為 N(,2)。說明：這里有一個問題，即物體長度的測量值總是在其真值的附近，它不可能取負(fù)值。而正態(tài)分布取值在(-,)上。那么，怎么可以認(rèn)為測量值X服從正態(tài)分布呢? 回答這個問題，有如下兩方面的理由。(1).在前面講過，對于XN(,2)， P-3X0，當(dāng)樣本大小 n 增大時，上面的概率也隨之增大；n 趨于無窮時，上式趨近于 1。任給c 0，總有例1：用機(jī)器向瓶子里灌裝液體洗滌劑，規(guī)定每瓶裝毫升。但實際灌裝量總有一定波動。假定灌裝量的方差 2=1，如果每箱裝這樣的洗滌劑 25 瓶。求這 25 瓶洗凈劑的平均灌裝量與標(biāo)定值相差不超過0.3毫

8、升的概率；又如果每箱裝50瓶時呢?解：記一箱中 25 瓶洗凈劑灌裝量為 X1,X2, X25 是來自均值為 , 方差為1的總體的隨機(jī)樣本。根據(jù)抽樣分布定理1，近似地有當(dāng) n=50時，同樣可算出：6.4 正態(tài)總體6.4.1 2 分布它是由正態(tài)分布派生出來的一種分布。定義1: 設(shè) X1, X2, , Xn 相互獨(dú)立，且均服從正態(tài)分布 N(0, 1), 則稱隨機(jī)變量服從自由度為 n 的卡方分布，記成。分布的密度函數(shù)為由分布的定義，不難得到其如下性質(zhì)：進(jìn)一步，由中心極限定理可以推出, n 充分大時,近似于標(biāo)準(zhǔn)正態(tài)分布 N(0,1)。分布密度函數(shù)圖形n2 分布上分位點(diǎn)有表可查，見附表4。對

9、于給定的 (0,1), 稱滿足條件的點(diǎn) n2()為 n2分布的上(右) 分位點(diǎn)。分布分位點(diǎn)t 分布的概率密度為為服從自由度 n 的 t 分布，記為 T tn。6.4.2 t 分布定義2: 設(shè) X N(0, 1) , Y n2 , 且 X與Y 相互獨(dú)立，則稱隨機(jī)變量t 分布的概率密度圖形當(dāng) n 充分大時，f (x; n) 趨近于標(biāo)準(zhǔn)正態(tài)分布的概率密度。數(shù)學(xué)期望與方差若 T tn , 對給定的 (0,1)，稱滿足條件t 分布的分位點(diǎn)的點(diǎn) tn()為 tn 分布上分位點(diǎn)。t 分布的上分位點(diǎn)有表可查，見附表3。 tn 分布上分位點(diǎn)示意圖6.4.3 F 分布則稱 F =(X/m)/(Y/n)

10、服從第一自由度為m，第二自由度為n 的 F 分布。記成 F Fm ,n 。定義3：F 分布的概率密度為若 FFm, n，對給定的 (0,1), 稱滿足條件F 分布的分位點(diǎn)的點(diǎn) Fm,n()為F分布的上分位點(diǎn)。.F 分布上分位點(diǎn)有表可查，見附表5。 F 分布上分位點(diǎn)示意圖一個需要注意的問題:這個關(guān)系式的證明如下：證明：若 X Fm,n，則 Y = X -1 Fn,m。依分位點(diǎn)定義，上式等價于再根據(jù) Y ( Fn,m ) 的上分位點(diǎn)定義，有這就證明了(1)式。在通常 F 分布表中，只對比較小的值,如 = 0.01, 0.05, 0.025及0.1等列出了分位點(diǎn)。但有時我們也需要知道

11、比較大的分位點(diǎn)，它們在 F 分布表中查不到。這時我們就可利用分位點(diǎn)的關(guān)系式(1)把它們計算出來。例如：對m=12, n=9, =0.95, 我們在 F 分布表中查不到 F12,9(0.95)，但由(1)式，知可從F 分布表中查到還有一個重要結(jié)果: 若X tn , 則X2 F1,n。請同學(xué)們自己證明。定理 1：6.4.4 正態(tài)總體樣本均值與樣本方差的分布定理的證明超出了教學(xué)范圍，在此，我們不作證明。定理的內(nèi)容在后面幾章的討論中將多次用到，希望大家牢記。例1：設(shè)某物體的實際重量為(未知),現(xiàn)在用一臺天平稱量它,共稱 n 次,得到X1,X2,Xn。假設(shè)每次稱量過程彼此獨(dú)立,且無系統(tǒng)誤差, 則可認(rèn)為這些測量值獨(dú)立同分布, 均服從正態(tài)分布N(,2),方差2反映了天平及測量過程的總精度。我們通常用樣本均值根據(jù)定理1(基本定理),有再根據(jù)正態(tài)分布的性質(zhì)(見p110,例4.2.6),知例如：當(dāng) = 0.1 時，也就是說：我們的估計值與真值的偏差不超過的概率約為 99.74%, 并且隨稱量次數(shù) n 的增加，偏差界限將越來越小。若取 n

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

數(shù)理統(tǒng)計與隨機(jī)過程ch6

文檔簡介

溫馨提示

最新文檔

評論

數(shù)理統(tǒng)計與隨機(jī)過程ch6

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔