簡單隨機抽樣_第1頁
簡單隨機抽樣_第2頁
簡單隨機抽樣_第3頁
簡單隨機抽樣_第4頁
簡單隨機抽樣_第5頁
已閱讀5頁,還剩142頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、簡單隨機抽樣簡單隨機抽樣:1.1.代表性代表性: 中每一個與所考察的總中每一個與所考察的總 體有體有相同的分布相同的分布。2.2.獨立性獨立性: 是是相互獨立相互獨立的隨機變量。的隨機變量。 nXXX,21nXXX,21第六章第六章 樣本及抽樣分布樣本及抽樣分布 假如總體的分布函數為假如總體的分布函數為)(xF簡單隨機樣本的簡單隨機樣本的聯(lián)合分布函數聯(lián)合分布函數為為)()()(21nxFxFxF. )(),(*121niinxFxxxF概率密度概率密度為:為:. )(),(*121niinxfxxxf 樣本平均值樣本平均值:niiXnX1;1樣本方差樣本方差:;11)(11122122niin

2、iiXnXnXXnS 統(tǒng)計量:統(tǒng)計量:由樣本由樣本構造構造的一些函數,的一些函數,不含任何不含任何未知參數。未知參數。完全由樣本決定的量。完全由樣本決定的量。 樣本標準差樣本標準差:niiXXnSS122;11樣本樣本k k階階(原點)(原點)矩矩:nikikkXnA1;, 2 , 1,1樣本樣本k k階中心矩階中心矩:., 3 , 2,11kXXnBnikik經驗分布函數經驗分布函數定義:設定義:設nXXX,21是取自總體是取自總體X XF F(x x)的一個樣本,把)的一個樣本,把樣本觀樣本觀察值察值從小到大排列從小到大排列為為 nxxx21稱函數稱函數 nkknxxxxxnkxxxF若若

3、若, 1,011為總體為總體X X的的經驗分布函數經驗分布函數。 格里汶科(格里汶科(GlivenkoGlivenko)在)在19331933年證明了以年證明了以下的結果:下的結果:對于任一實數對于任一實數x,當,當n時時)(xFn以概率以概率1 1一致收斂于一致收斂于分布函數分布函數)(xF 10| )(|suplimxFxFPnxn 例:從一批標準重量為例:從一批標準重量為500g500g的罐頭中,的罐頭中,隨機抽取隨機抽取8 8聽,測得誤差如下(單位:聽,測得誤差如下(單位:g g): : 8 8,4 4,6 6,7 7,2 2,1 1,0 0,1 1求求經驗分布函數經驗分布函數,并作出

4、,并作出圖形圖形。 解:將樣本值按大小順序排列為解:將樣本值按大小順序排列為 7 74 42 20 01 11 16 68 8則樣本經驗分布函數為則樣本經驗分布函數為 8186,8761,8610,8402,8324,8247,817, 0)(8xxxxxxxxxF 抽樣分布抽樣分布:統(tǒng)計量的分布稱為:統(tǒng)計量的分布稱為“抽樣分布抽樣分布”。 精確抽樣分布:精確抽樣分布: 總體總體X X的分布已知,如對于任一的分布已知,如對于任一n,n,都能導出統(tǒng)都能導出統(tǒng)計量的明顯表達式,這種分布稱為精確抽樣分布。計量的明顯表達式,這種分布稱為精確抽樣分布。它常用于它常用于小樣本小樣本的統(tǒng)計推斷問題。的統(tǒng)計推

5、斷問題。 漸近分布漸近分布: 在樣本容量在樣本容量n n無限大時,能獲得統(tǒng)計量的極限無限大時,能獲得統(tǒng)計量的極限分布,這種分布稱為漸近分布。它常用于分布,這種分布稱為漸近分布。它常用于大樣本大樣本的統(tǒng)計推斷問題。的統(tǒng)計推斷問題。幾個常用統(tǒng)計量的分布幾個常用統(tǒng)計量的分布(1 1)2分分布布nXXX,21N N(0 0,1 1),則稱統(tǒng)計量),則稱統(tǒng)計量222212nXXX服從服從自由度自由度為為n n的的2分布,記為分布,記為)(22n自由度自由度為上式右端包含的為上式右端包含的獨立變量的個數獨立變量的個數。設設概率密度概率密度圖形圖形。 2分布的分布的可加性可加性:設:設 ,22221221n

6、n并且并且2221,獨立,則有:獨立,則有: .2122221nn 分布的分布的數學期望數學期望和和方差方差:若若)(22n.2)(,22nDnE22分布的分布的分位點分位點: 222axadyyfnP表只詳列到表只詳列到n n=45=45為止。為止。費歇費歇曾證明,當曾證明,當n n充分大時,近似地有:充分大時,近似地有: ,122122nZna(2 2)t t 分布分布 設設),(),1 , 0(2nYNX且且X,YX,Y獨立,則稱隨機變量:獨立,則稱隨機變量: nYXt/服從服從自由度為自由度為n n的的t t分布分布,記為,記為t tt(nt(n) )。 圖形圖形關于關于t=0t=0對

7、稱,當對稱,當n n充分大時充分大時其圖形類其圖形類似于似于標準正態(tài)標準正態(tài)概率密度的圖形。概率密度的圖形。 t t分布的分布的分位點:分位點: )()()(ntadtthnttP由圖形的由圖形的對稱性對稱性知知)()(1ntntaa45naaznt)((3 3)F F分布分布 設設,2212nVnU且且VU ,獨立,則稱隨機變量獨立,則稱隨機變量21/nVnUF 服從自由度為服從自由度為21,nn的的F F分布分布,記為,記為),(21nnFF),(21nnF 的的圖形圖形。由定義可知。由定義可知1212,/1nnFnUnVFF F分布的分布的分位點分位點 dyynnFFPaFnnn21,2

8、1),(.),(1),(12211nnFnnFaa定理定理一:設一:設nXXX,21是來自正態(tài)總體是來自正態(tài)總體2,N的樣本,的樣本,X是樣本均值,則有:是樣本均值,則有:nNX/,2(4 4)正態(tài)總體正態(tài)總體的樣本均值與樣本方差的的樣本均值與樣本方差的抽樣分布抽樣分布 定理定理二:設二:設nXXX,21是總體是總體2,N的樣本,的樣本,X, ,2S分別是樣本均值和樣本方差,分別是樣本均值和樣本方差,;11222nSn2 2X與與2S獨立。獨立。 則有:則有:1 定理定理三:設三:設nXXX,21是總體是總體2,N的樣本,的樣本,X, ,2S分別是樣本均值和樣本方差,分別是樣本均值和樣本方差,

9、.1/ntnSX則有:則有:定理定理四:設四:設21,2121nnYYYXXX與分別是來自正態(tài)總體分別是來自正態(tài)總體222211,NN和的樣本,且這兩個樣本相互獨立。設的樣本,且這兩個樣本相互獨立。設2112111,1niiniiYnYXnX分別是這兩個樣本的樣本均值,分別是這兩個樣本的樣本均值,21122222112111,11niiniiYYnSXXnS分別是這兩個樣本的樣本方差,則有分別是這兩個樣本的樣本方差,則有 1 1;1, 1/2122212221nnFSS 2 2,22121當,211212121nntnnSYXw其中其中 .,2112212222112wwwSSnnSnSnS例

10、例 設總體設總體X X服從正態(tài)分布服從正態(tài)分布),2 , 0(2N1521,XXX是來自總體是來自總體X X的簡單隨機樣本,則隨機變量的簡單隨機樣本,則隨機變量)(221521121021XXXXY服從服從什么什么分布,自由度是多少。分布,自由度是多少。 分析分析 根據簡單隨機樣本的性質根據簡單隨機樣本的性質,151,XX相互獨立,服從同分布相互獨立,服從同分布),2 , 0(2N易見易見21521121021XXXX與也相互獨立,并且由于也相互獨立,并且由于),2 , 0(2NXi故故2152112210212102)2()2(),10()(41)2()2(XXXXXXi)5()(41221

11、5211XX從而有從而有)5 ,10(25/ )(4110/ )(412152112102121521121021FXXXXXXXX即即)5 ,10( FY 估計量優(yōu)良性常用的幾條估計量優(yōu)良性常用的幾條標準標準: 無偏心無偏心、有效性有效性、相合性相合性。 (1 1)無偏性無偏性 ,E 21DD(2)有效性有效性(3)相合性相合性1limnP第七章第七章 參數估計參數估計兩種基本方法兩種基本方法:點估計點估計、區(qū)間估計區(qū)間估計。 X是總體均值是總體均值樣本樣本方差方差 21211niiXXnS是總體方差是總體方差 2 2的無偏估計。的無偏估計。 樣本樣本均值均值的無偏估計;的無偏估計;樣本二階

12、中心矩樣本二階中心矩niiXXn121不是不是 2 2的無偏估計,的無偏估計,S S也不是也不是 的無偏估計。的無偏估計。 最小方差無偏估計最小方差無偏估計: ,E為為),()(DD的任一無偏估計。的任一無偏估計。 尋求尋求估計量的方法估計量的方法: : 矩估計法矩估計法 最大似然估計法最大似然估計法 (1 1)矩估計法矩估計法: : 用用樣本各階矩去估計總體各階矩樣本各階矩去估計總體各階矩。概率密度為概率密度為),;(21kxfpxXP),;(21kx分布律為分布律為它的前它的前k k階矩階矩k,21.,2121222111kkkkk可以解出可以解出k,21.,2121222111kkkkk

13、以以樣本矩樣本矩iA分別代替上式中的分別代替上式中的kii, 2 , 1,就有就有kiAAAkii, 2 , 1,21分別作為分別作為kii, 2 , 1, 的估計量。的估計量。例例5 5:設總體:設總體X X的均值的均值2及方差都存在,且有都存在,且有02。但。但2,均為未知,又設均為未知,又設nXXX,21是來自總體是來自總體X X的一個樣本,求的一個樣本,求2,的的矩估計量矩估計量。 解:總體一階矩:解:總體一階矩: XE1總體二階矩:總體二階矩: 22222XEXDXE由矩法,由矩法,用樣本矩去估計總體矩用樣本矩去估計總體矩,令,令: : A A1 1 222A解得:解得:niniii

14、XXnXXnAAXA1122221221.11, 所得結果表明,所得結果表明,總體均值總體均值與與方差方差的的矩估矩估計量計量的表達式的表達式不因總體分布不同而異不因總體分布不同而異。 總結總結:l 矩估計法的矩估計法的優(yōu)點優(yōu)點是簡便易行,并是簡便易行,并不需要事先知道不需要事先知道 總體的分布總體的分布;l 缺點缺點是:在總體分布類型已知的場合,沒有充分是:在總體分布類型已知的場合,沒有充分 利用分布提供的信息。利用分布提供的信息。l 一般場合下,矩估計量一般場合下,矩估計量不具有唯一性不具有唯一性。 由費希爾(由費希爾(R.A.FisherR.A.Fisher)引進的最大似然估計法,就是固

15、)引進的最大似然估計法,就是固定樣本觀察值定樣本觀察值nxxx,21,在,在取值的可能范圍取值的可能范圍內挑選內挑選使似然函數使似然函數;,21nxxxL達到最大達到最大的參數值的參數值,作為參數,作為參數的估計值,即取的估計值,即取使使.;,max;,2121nnxxxLxxxLnxxx,21稱為參數稱為參數的的最大似然估計值最大似然估計值,而相應的統(tǒng)計量,而相應的統(tǒng)計量nXXX,21稱為參數稱為參數的的最大似然估計量最大似然估計量。 (2)最大似然估計法最大似然估計法 設設nXXX,21是來自總體是來自總體X X的一個樣本,則的一個樣本,則nXXX,21的的聯(lián)合密度聯(lián)合密度為:為:niix

16、f1,設設nxxx,21是相應于樣本是相應于樣本nXXX,21的一個樣本值,則隨機點的一個樣本值,則隨機點),(21nXXX落在點落在點),(21nxxx的鄰域(邊長分別為的鄰域(邊長分別為ndxdxdx,21的的n n維立方體)內的概率近似地為維立方體)內的概率近似地為.;1iniidxxf其值隨其值隨的取值而變化。與離散型的情況一樣,取的取值而變化。與離散型的情況一樣,取的估計值的估計值使使概率取到最大值概率取到最大值。 niinxfxxxLL121;,的最大值。這里的最大值。這里 L稱為樣本的稱為樣本的似然函數似然函數。若:。若:,;,max;,2121nnxxxLxxxL則稱則稱nxx

17、x,21為為的的最大似然估計值最大似然估計值,稱,稱nXXX,21為為的的最大似然估計量最大似然估計量??紤]函數:考慮函數:可從方程:可從方程: 0Ldd解得。解得。也可以從方程:也可以從方程: 0lnLdd求得。求得。從后一方程求解往往比較方便從后一方程求解往往比較方便,稱為,稱為對數似對數似然方程然方程。 例:設例:設nXXXpbX,., 121試求參數試求參數P P的最大似然估計量。的最大似然估計量。nxxx,21是樣本是樣本nXXX,21的一個樣本值。的一個樣本值。X X的分布律為:的分布律為:. 1 , 0,11xppxXPxx似然函數似然函數為:為: niiniiiixnxxnix

18、pppppL11)1 (111取對數取對數 ,1lnlnln11pxnpxpLniinii是來自總體是來自總體X的一個樣本,的一個樣本,解:設解:設令令 , 01ln11pxnpxpLdpdniinii解得解得p p的最大似然估計值:的最大似然估計值:.11xxnpniip p的最大似然估計量為:的最大似然估計量為:.11XXnpnii這一估計量與矩估計量是相同的。這一估計量與矩估計量是相同的。例:設例:設22,NX為未知參數為未知參數nxxx,21是來自總體是來自總體X X的一個樣本值。求的一個樣本值。求2,的最大似然估計量。的最大似然估計量。解:解:X X的概率密度為:的概率密度為:,21

19、exp21,;222xxf似然函數為:似然函數為:.21exp221exp21,1222/22/2212niinninixxL取對數取對數 niixnnL1222.21ln22ln2ln令令 niiniixnLnxL12222212. 0212ln, 01ln解得解得niixxn1/1212/1niixxn得得2,的最大似然估計量為:的最大似然估計量為:niiXXnAX1222.1,它們與相應的矩估計量相同。它們與相應的矩估計量相同。 求最大似然估計值的求最大似然估計值的一般步驟一般步驟是:是:1.1.由總體分布導出樣本的由總體分布導出樣本的聯(lián)合分布律函數聯(lián)合分布律函數(或聯(lián)合概率密(或聯(lián)合概

20、率密 度);度);2.2.把樣本聯(lián)合分布律函數(或聯(lián)合概率密度)中自變量看把樣本聯(lián)合分布律函數(或聯(lián)合概率密度)中自變量看 成已知常數,而把參數成已知常數,而把參數看作自變量,得到似然函數看作自變量,得到似然函數 L3.3.求似然函數求似然函數 L的的最大值點最大值點(常常轉化為求(常常轉化為求 Lln 的最大值點);的最大值點);4.在最大值點的表達式中,用樣本值代入就得參數的最在最大值點的表達式中,用樣本值代入就得參數的最 大似然估計值。大似然估計值。 一般,用一般,用最大似然法最大似然法所得的估計的性質所得的估計的性質比比用用矩法矩法所得的要好,故通常多用最大似然法。所得的要好,故通常多

21、用最大似然法。 由所有產品的失效時間由所有產品的失效時間nttt210所組成的樣本。所組成的樣本。完全樣本完全樣本:2 基于基于截尾樣本截尾樣本的最大似然估計的最大似然估計 常用的常用的兩種兩種截尾壽命試驗:截尾壽命試驗:1.1.一種是一種是定時定時截尾壽命試驗截尾壽命試驗,0021ttttm此時此時mm是一個是一個隨機變量隨機變量,所得的樣本,所得的樣本mttt,21稱為稱為定時截尾樣本定時截尾樣本。 2. 2. 另一種是另一種是定數定數截尾壽命試驗截尾壽命試驗,21mttto所得的樣本所得的樣本mttt,21稱為稱為定數截尾樣本定數截尾樣本。 有二個要求有二個要求:1.1.要求要求以以很大

22、的可能很大的可能被包含在區(qū)間被包含在區(qū)間,P2.2.估計的估計的精度精度要要盡可能高盡可能高,即要求,即要求區(qū)間的長度區(qū)間的長度內,即:概率內,即:概率要要盡可能大盡可能大。盡可能小盡可能小。3 3 區(qū)間估計區(qū)間估計 置信區(qū)間置信區(qū)間: ,1,2121nnXXXXXXP稱稱隨機隨機區(qū)間區(qū)間,是是的的置信水平置信水平為為1的的置信區(qū)間置信區(qū)間。 和和置信和置信上限上限,1稱為稱為置信水平置信水平。 分別稱為分別稱為雙側置信區(qū)間雙側置信區(qū)間的置信的置信下限下限l 可以得到未知參數的可以得到未知參數的任何任何置信水平置信水平小于小于1 1的置信區(qū)的置信區(qū) 間間l 置信水平置信水平愈高愈高,相應的區(qū)間

23、平均長度,相應的區(qū)間平均長度愈長愈長(在(在 同樣的樣本容量下)。同樣的樣本容量下)。l 在在同樣同樣的置信水平下,樣本容量的置信水平下,樣本容量愈大愈大,區(qū)間平均長,區(qū)間平均長 度度愈短愈短。 求置信區(qū)間的求置信區(qū)間的步驟步驟如下:如下:1.1.明確問題,求明確問題,求什么參數什么參數的置信區(qū)間?的置信區(qū)間?置信水平置信水平1 是多少?是多少?2.2.尋找尋找參數的一個良好的參數的一個良好的點估計點估計WW。3.3.尋找(或尋找(或構造構造)一個)一個待估待估參數參數 和和估計量估計量WW的的函數函數 S(W, ),S(W, ),其其分布為已知分布為已知,并且,并且不依賴于任何未知數。不依賴

24、于任何未知數。 稱稱S(W, )S(W, )為為樞軸量樞軸量。如。如 .1 , 0/NnX4. 4. 對于給定的置信水平對于給定的置信水平1分布,確定常數分布,確定常數a,ba,b使得使得1),(bWSaP5.5.對對“bWSa),(”作作等價變形等價變形,得到如下形式:,得到如下形式:1),(),(2121nnXXXXXXP則則,就是參數就是參數的置信水平為的置信水平為1,根據,根據S(W, )S(W, )的的的的置信區(qū)間置信區(qū)間。4 4 正態(tài)總體正態(tài)總體均值與方差的區(qū)間估計均值與方差的區(qū)間估計(一)(一)單個單個總體總體2,N1 1均值均值(1 1)22/aznX的情況的情況的置信區(qū)間的置

25、信區(qū)間為已知為已知.1 , 0/NnX,1/2/aznXPa(2 2)2考慮到考慮到2S是是2的的無偏估計無偏估計,將上式中的,將上式中的換成換成2SS ,取,取樞軸量樞軸量1/ntnSX對給定的置信水平對給定的置信水平1,查,查t t分布分位數表的分布分位數表的2/t使使antnSXPa11/2/為未知為未知即即antnSXntnSXPaa1) 1() 1(2/2/于是,得到了于是,得到了的一個置信水平為的一個置信水平為a1的的置信區(qū)間置信區(qū)間.) 1(),1(2/2/ntnSXntnSXaa或或).1(2/ntnSXa在實際問題中,總體方差在實際問題中,總體方差2未知的情況居多。未知的情況

26、居多。(3 3)總體分布未知,但)總體分布未知,但樣本容量樣本容量n n很大很大此時由中心極限定理,知此時由中心極限定理,知nX/因此若總體方差因此若總體方差2已知時,得到已知時,得到的一個置信水平為的一個置信水平為a1的近似置信區(qū)間的近似置信區(qū)間.,2/2/aaznXznX但但一般未知,用一般未知,用S S近似代替,這樣得到近似代替,這樣得到的一個置信水平為的一個置信水平為a1的近似置信區(qū)間的近似置信區(qū)間.,2/2/aaznSXznSX近似服從近似服從N(0,1)2 2方差方差2例:設例:設nXXX,21為總體為總體2,N的樣本,的樣本,未知,求參數未知,求參數2的置信水平為的置信水平為1

27、解:解:2的無偏點估計為樣本方差的無偏點估計為樣本方差S S2 2。已知。已知) 1(1222nSn的置信區(qū)間的置信區(qū)間的置信區(qū)間。的置信區(qū)間。對給定的置信水平對給定的置信水平1,查,查2分布上分布上分位點分位點表可得表可得) 1(2/21na) 1(22/naanSnnPaa1) 1(1) 1(22/222/21即即anSnnSnPaa1) 1(1) 1(122/222/212得到方差得到方差2的一個置信水平為的一個置信水平為a1的的置信區(qū)間置信區(qū)間) 1(1,) 1(12/21222/2nSnnSnaa標準差標準差的一個置信水平為的一個置信水平為a1的置信區(qū)間的置信區(qū)間) 1(1,) 1(

28、122/122/nSnnSnaa(二)(二)兩個總體兩個總體222211,NN1 1兩個兩個總體均值差總體均值差21的情況的情況 的置信區(qū)間的置信區(qū)間具體步驟為:具體步驟為: (1) (1) 兩總體均為正態(tài),兩總體均為正態(tài),2221,設設222211,NYNX,YX,分別為分別為21,的無偏估計,故的無偏估計,故21的的無偏估計量無偏估計量是是YX 由由YX,的獨立性以及的獨立性以及22221211/,/,nNYnNX得:得:22212121,nnNYX或或 ),1 ,0(22212121NnnYX已知已知。對給定的置信水平對給定的置信水平1 1,查標準正態(tài)分布函數表得,查標準正態(tài)分布函數表得

29、2/Z使使12/22212121ZnnYXP即得即得21的一個置信水平為的一個置信水平為1 1的的置信區(qū)間置信區(qū)間:.2221212/nnZYXa(2) (2) 兩總體均為正態(tài),兩總體均為正態(tài),,22221但但2為為未知未知。 ).2(11212121nntnnSYXw其中,其中,.,2112212222112wwwSSnnSnSnS從而可得從而可得21的一個置信水平為的一個置信水平為1 1的的置信區(qū)間置信區(qū)間為:為: .11221212/nnSnntYXwa (3) (3) 兩兩總體分布未知總體分布未知,但,但21,nn用用222121/nSnS去估計去估計222121nn根據中心極限定理,

30、近似有根據中心極限定理,近似有),1 , 0(22212121NnSnSYX類似可得類似可得21的一個置信水平為的一個置信水平為1 1的的近似置信區(qū)間近似置信區(qū)間為:為:.2221212/nSnSZYXa很大。很大。2 2兩個總體兩個總體方差比方差比2221/由第六章定理四:由第六章定理四:,1, 1/2122212221nnFSS不依賴任何未知參數。由此得:不依賴任何未知參數。由此得:,11, 1/) 1, 1(212/22212221212/1annFSSnnFPaa即:即:1.1, 111, 11212/122212221212/2221nnFSSnnFSSPaa的置信區(qū)間的置信區(qū)間對于

31、任意對于任意滿足滿足1P隨機區(qū)間隨機區(qū)間,是是的置信水平為的置信水平為a1的單側置信區(qū)間,的單側置信區(qū)間,稱為稱為的置信水平為的置信水平為a1的的單側置信下限單側置信下限。 6 單側置信區(qū)間單側置信區(qū)間又若統(tǒng)計量又若統(tǒng)計量nXXX,21,對于任意,對于任意滿足滿足1P稱隨機區(qū)間稱隨機區(qū)間,是是的置信水平為的置信水平為a1的單側置信區(qū)間,的單側置信區(qū)間,稱為稱為的置信水平為的置信水平為a1的的單側置信上限單側置信上限。 概率反證法的概率反證法的邏輯邏輯是:假設原假設成立,如果小概率是:假設原假設成立,如果小概率事件在一次試驗中發(fā)生,就可以有很大的把握否定原假設。事件在一次試驗中發(fā)生,就可以有很大

32、的把握否定原假設。 在假設檢驗中,稱這個在假設檢驗中,稱這個小概率小概率為為顯著性水平顯著性水平。第八章第八章 假設檢驗假設檢驗 具體有具體有兩類假設檢驗兩類假設檢驗問題:問題:(1 1)對參數的假設檢驗對參數的假設檢驗。(2 2)對總體分布的假設檢驗對總體分布的假設檢驗。假設檢驗的假設檢驗的一般步驟一般步驟:(1 1)提出提出原假設原假設0H及備擇假設(對立假設)及備擇假設(對立假設)1H(2 2)選取選取一個適當的一個適當的統(tǒng)計量統(tǒng)計量T T,在,在0H(3 3)根據給定)根據給定顯著性水平顯著性水平(4 4)算出統(tǒng)計量)算出統(tǒng)計量T T的的實測值實測值,將實測值與拒絕域,將實測值與拒絕域

33、對照對照 ,若實測值落入拒絕域,則否定原假設,若實測值落入拒絕域,則否定原假設0H否則,就認為差異不顯著而不能否定原假設。否則,就認為差異不顯著而不能否定原假設。 成立的條件下成立的條件下求出它的分布(或近似分布);求出它的分布(或近似分布);,求出,求出拒絕域拒絕域C C;兩類錯誤兩類錯誤及其概率及其概率 第一類錯誤第一類錯誤:為真否定00HHP第二類錯誤第二類錯誤:第二類錯誤為假不否定PHHP00 顯著性檢驗顯著性檢驗 控制犯第控制犯第1 1類錯誤的概率加以,類錯誤的概率加以,使它不大于使它不大于 ,而而不考慮犯第不考慮犯第II II類錯誤的概率的檢驗,稱為類錯誤的概率的檢驗,稱為顯著性檢

34、驗顯著性檢驗。 不管在什么情況下,為了保證不管在什么情況下,為了保證都都不應太小不應太小。 不致太大,不致太大,樣本容量樣本容量 雙側雙側檢驗與檢驗與單側單側檢驗檢驗 假設檢驗假設檢驗 0100:,:HH其中,其中,1H表示表示可能大于可能大于0,也可能小于,也可能小于0的的拒絕域分別在兩側拒絕域分別在兩側。在上述例。在上述例1 1中,拒絕域為中,拒絕域為,2/Z),),(2/Z,在很多情況下,會提出如下形式的原假設:在很多情況下,會提出如下形式的原假設:0000:,:HH或對應的備擇假設是對應的備擇假設是0101:,:HH或稱這類假設檢驗為稱這類假設檢驗為單側單側假設檢驗或假設檢驗或單邊單邊

35、假設檢驗。假設檢驗。 ,這類檢驗,這類檢驗(),),稱這類假設檢驗為稱這類假設檢驗為雙側雙側假設檢驗。假設檢驗。正態(tài)總體均值、方差的檢驗法(顯著性水平為正態(tài)總體均值、方差的檢驗法(顯著性水平為)已知2000nXZ/00002/aaazzzzzz未知2000nSXt/0000) 1(112/nttnttnttaaa已知2221212121,222121nnYXZ2121212/aaazzzzzz原假設原假設H H0 0檢驗統(tǒng)計量檢驗統(tǒng)計量備擇假設備擇假設H H1 1拒絕域拒絕域原假設原假設H H0 0檢驗統(tǒng)計量檢驗統(tǒng)計量備擇假設備擇假設H H1 1拒絕域拒絕域未知2222121212121111

36、21222211221nnSnSnSnnSYXtww212121)2(22212/2121nnttnnttnnttaaa未知2022022022022) 1(Sn 202202202111122/1222/221222nnnnaaaa或未知21222122212221,2221SSF 2222222221111, 11, 11, 11, 1212/1212/21121nnFFnnFFnnFFnnFFaaaa或)(000成對數據DDDnSDtD/0000DDD) 1() 1() 1(2/nttnttnttaaa例題例題:例例1 1:某種元件的壽命:某種元件的壽命X X(以小時計)服從正態(tài)分布(以

37、小時計)服從正態(tài)分布22,),(N159 280 101 212 224 379 179 264159 280 101 212 224 379 179 264222 362 168 250 149 260 485 170222 362 168 250 149 260 485 170問是否有理由認為元件的平均壽命大于問是否有理由認為元件的平均壽命大于225225(小時)?(小時)?(05. 0解:檢驗假設(原假設取與題意相反的假設)解:檢驗假設(原假設取與題意相反的假設).225:,225:100HH因為因為2,均未知均未知,用,用t t檢驗法檢驗法,其拒絕域為:,其拒絕域為:.1/0ntnsx

38、ta均未知?,F測得均未知?,F測得16只元件的壽命如下:只元件的壽命如下:).7531. 1)15(,1605. 0tn算得算得,7259.98, 5 .241sx即有:即有:.7531. 16685. 0/0nsxt t t沒有落在拒絕域中,故接受沒有落在拒絕域中,故接受HH0 0,即認為元件的平,即認為元件的平均壽命不大于均壽命不大于225225小時。小時。 3 3 分布擬合檢驗分布擬合檢驗l 皮爾遜皮爾遜的的2l 專用于專用于檢驗分布是否檢驗分布是否為為正態(tài)正態(tài)的的“偏度、峰度檢驗法偏度、峰度檢驗法”。 檢驗法檢驗法(一)(一)2檢驗法檢驗法2檢驗法是在總體的檢驗法是在總體的分布未知分布未

39、知時,根據它的時,根據它的n n個樣本個樣本nXXX,21:0H xF:1H總體總體X X的分布函數不是的分布函數不是 xF若總體若總體X X為為離散型離散型,則,則0H: :總體總體X X的的分布律分布律為為., 2 , 1,iptXPii若總體若總體X X為為連續(xù)型連續(xù)型,則,則:0H總體總體X X的的概率密度概率密度為為 xf來檢驗總體分布假設的一種方法。來檢驗總體分布假設的一種方法。原假設為:原假設為:總體總體X的的分布函數分布函數為為(可以不寫出)(可以不寫出)分布擬合的分布擬合的2(1 1)將總體)將總體X X的可能取值范圍或全體的可能取值范圍或全體的小區(qū)間或子集,記作的小區(qū)間或子

40、集,記作.,21kAAA(2 2)把)把落入落入第第i i個小區(qū)間個小區(qū)間iA的樣本值的的樣本值的個數個數記作記作), 2 , 1(kifi稱為稱為實測頻數實測頻數。所有。所有實測頻數實測頻數之之和和kfff21(3 3)當)當0H為真時,可以根據為真時,可以根據0H計算事件計算事件iA的的概率概率,得到,得到kiAPpii, 2 , 1),(,于是,于是inp就是落入就是落入iA的樣本值的的樣本值的理論頻數理論頻數。 檢驗法檢驗法基本思想基本思想和和步驟步驟如下:如下:分成分成k個個互不重迭互不重迭等于樣本等于樣本容量容量n。所假設的所假設的X的分布函數來的分布函數來顯然,顯然,實測頻數實測

41、頻數if與與理論頻數理論頻數inp 皮爾遜皮爾遜引進了如下引進了如下統(tǒng)計量統(tǒng)計量表示經驗分布與理論分布表示經驗分布與理論分布之間的差異:之間的差異:kiiiinpnpf122)(其中其中if是是隨機變量隨機變量,在理論分布已給定的情況下,在理論分布已給定的情況下,inp之間的之間的差差標志著標志著經驗分布經驗分布與與理論分布理論分布之間的之間的差異差異的大小。的大小。是是常量常量。皮爾遜證明了如下皮爾遜證明了如下定理定理: 如原假設中的理論分布如原假設中的理論分布)(xF已經完全給定,那么當已經完全給定,那么當n時,統(tǒng)計量時,統(tǒng)計量kiiiiikiiiiiikiiiinpfnpfnpnpnpf

42、fnpnpf121221222)(2)( kiikikikiiiiiiiiiifnpffnpfnfnfnpf11112222nnpfkiii12的分布的分布近似服從近似服從) 1( k個個自由度自由度的的2分布。分布。 如果理論分布如果理論分布)(xF估計量來代替(一般估計量來代替(一般用最大似然估計值用最大似然估計值來代替)。那么當來代替)。那么當n時,統(tǒng)計量時,統(tǒng)計量2的分布近似服從的分布近似服從) 1(rk由度的由度的2根據這個定理,對于給定的根據這個定理,對于給定的顯著性水平顯著性水平a,查,查2分布分位數表可得臨界值分布分位數表可得臨界值2,使得,使得22aP即即22a122rka中

43、有中有r個未知參數個未知參數,則需用相應的,則需用相應的個自個自分布。分布。為小概率事件。為小概率事件。得得拒絕域拒絕域為為根據所給樣本值根據所給樣本值nXXX,21計算計算2,如果,如果2的值大于的值大于2,則否定假設,則否定假設0H;否則認為差異不夠顯著而接受;否則認為差異不夠顯著而接受0H。這就是。這就是2注意注意,皮爾遜定理是在,皮爾遜定理是在n n無限大時無限大時推導出來的,因而在使用推導出來的,因而在使用時要注意時要注意n n要足夠大要足夠大以及以及iipnnp或根據計算根據計算實踐經驗實踐經驗,要求,要求50n,以及每一個,以及每一個iipnnp或都都不小于不小于5 5。iipn

44、np或滿足這個條件。滿足這個條件。 擬合檢驗法擬合檢驗法。不太小不太小這兩個條件。這兩個條件。否則應適當否則應適當合并合并區(qū)間,使區(qū)間,使 一元回歸分析:一元回歸分析:在回歸分析中,在回歸分析中,變量只有兩個變量只有兩個; 多元回歸分析:多元回歸分析:變量在二個以上;變量在二個以上; 線性回歸:線性回歸:變量間呈線性關系;變量間呈線性關系; 非線性回歸:非線性回歸:變量間不具有線性關系。變量間不具有線性關系。 回歸分析回歸分析就是研究相關關系的一種重要的數理統(tǒng)計就是研究相關關系的一種重要的數理統(tǒng)計方法。即方法。即從數量的角度去研究這種關系從數量的角度去研究這種關系。第九章第九章 回歸分析與方差

45、分析回歸分析與方差分析1 1一元線性回歸分析一元線性回歸分析 對一組對一組X X的值的值nxxx,21Y Y相應的觀察值相應的觀察值nyyy,21 這這n n對數據可作出一個對數據可作出一個散點圖散點圖,可,可直觀地描述直觀地描述兩變量兩變量之間的關系。根據散點圖,有以下幾個問題:之間的關系。根據散點圖,有以下幾個問題:(1 1)兩變量之間的關系)兩變量之間的關系是否密切是否密切,或者說能否由,或者說能否由X X來估來估 計計Y Y;(2 2)兩變量之間的關系是呈一條)兩變量之間的關系是呈一條直線直線還是某種還是某種曲線曲線;(3 3)是否存在)是否存在其他規(guī)律其他規(guī)律。 作獨立觀察,得到隨機

46、變量作獨立觀察,得到隨機變量,構成構成n對數據對數據。(一)(一)一元線性回歸一元線性回歸為了研究為了研究x和和y之間的關系,之間的關系,假定假定有以下結構:有以下結構:bxay其中其中a a和和b b是未知常數,稱為是未知常數,稱為回歸系數回歸系數,得率的影響。得率的影響。 表示表示隨機因素隨機因素對對實際中常假定實際中常假定服從正態(tài)分布服從正態(tài)分布), 0(2N,即,即未知220)(0)(DE通常稱通常稱), 0(,2NbxaY上式表明,上式表明,Y Y由兩部分組成:由兩部分組成:l 一部分是一部分是x x的的線性函數線性函數bxal 另一部分另一部分2, 0N是是隨機誤差隨機誤差,是人們

47、不可控制的。,是人們不可控制的。 (1.1)為為一元線性回歸模型一元線性回歸模型。bxay回歸方程:回歸方程:),( ,),(),(2211nnYxYxYx),( ,),(),(2211nnyxyxyx該樣本的構造可由方程該樣本的構造可由方程), 2 , 1(nibxayiii來描述,這里,來描述,這里,i它是不能觀察的。它是不能觀察的。 n次獨立次獨立觀察,得一樣本:觀察,得一樣本:對應的對應的樣本值樣本值記為:記為:是是第第i次次觀察時觀察時隨機誤差隨機誤差所取的值,所取的值, 回歸分析的回歸分析的任務任務是利用是利用n n組獨立觀察數據組獨立觀察數據),( ,),(),(2211nnyx

48、yxyx來來估計估計a a和和b b, ,以估計值的以估計值的b和a代替代替a a,b b,xbay稱其為稱其為經驗回歸方程經驗回歸方程。 得回歸方程得回歸方程1 1用用最小二乘法最小二乘法估計估計ba,偏差的平方和偏差的平方和niixx12) (最小二乘法認為最小二乘法認為:尋找尋找x 這就是最小二乘法的基本思想。這就是最小二乘法的基本思想。 ,使上述平方和達到最小。,使上述平方和達到最小。對對),(yx作了作了n n次觀察或試驗,得到次觀察或試驗,得到n n對數據對數據),( ,),(),(2211nnyxyxyx找一條直線找一條直線xbay當當x取值取值ix時,時,y 應取值應取值ibx

49、a 而而實際觀察到的實際觀察到的為為iy,這樣,形成了,這樣,形成了偏差偏差(圖圖))(iiibxay盡可能地擬合這些數據。盡可能地擬合這些數據。 根據最小二乘法思想,類似地提出了如下的根據最小二乘法思想,類似地提出了如下的目標量目標量niiibxayQ12)(它是所有它是所有實測值實測值iy與與回歸值回歸值iy 設法求出設法求出ba,的估計值的估計值ba, ,使,使Q得到的回歸直線得到的回歸直線xbay是在所有直線中是在所有直線中Q最小的一條。最小的一條。 的偏差平方和。的偏差平方和。達到達到最小最小,由此,由此用求極值法,求出使用求極值法,求出使Q達到最小的達到最小的ba, 。即解方程。即

50、解方程niiiiniiixbxaybQbxayaQ11. 02, 02得得,1,111212112111niniiiniiniiiniiniiniiniiniiixbyxnbynaxxyyxxxxnyxyxnb其中:其中:.1,111niiniiynyxnx得到回歸方程得到回歸方程xbay(1.8)為了計算上的方便,引入下述記號:為了計算上的方便,引入下述記號:niniiniiiiniiixyniniiniiiyyniniiniiixxyxnyxyyxxSynyyySxnxxxS1111121122121122.1,11這樣,這樣,ba,的估計值可寫成的估計值可寫成.11,11bxnynaSS

51、bniiniixxxy(1.10) (1.9)求出回歸方程,求出回歸方程,問題尚未結束問題尚未結束。由于。由于xbay是從是從觀察觀察得到的回歸方程,它會隨觀察結果的不同而改得到的回歸方程,它會隨觀察結果的不同而改變,并且它變,并且它只反映了由只反映了由x的變化引起的的變化引起的y(1 1)回歸方程是否)回歸方程是否有意義有意義?即?即x的變化是否真的對的變化是否真的對y(2 2)如果方程真有意義,用它預測)如果方程真有意義,用它預測y的偏差能否估計?的偏差能否估計? 的變化,的變化,沒有包含誤差項沒有包含誤差項。因此會問這樣的問題:。因此會問這樣的問題:有影響?因此,要對有影響?因此,要對回

52、歸效果回歸效果作出檢驗。作出檢驗。時,預測值與真值時,預測值與真值2 2回歸方程的回歸方程的顯著性檢驗顯著性檢驗l 對任意的一組觀察值對任意的一組觀察值), 2 , 1)(,(niyxii最小二乘法,最小二乘法,形式上形式上求得求得y對對xl 如果如果y與與xl 因此,需要考察因此,需要考察y與與x是否確有線性關系是否確有線性關系,這就是,這就是,都可以用,都可以用的回歸方程。的回歸方程。沒有線性關系,這種形式的回歸沒有線性關系,這種形式的回歸方程就沒有意義。方程就沒有意義?;貧w效果的檢驗問題回歸效果的檢驗問題。 2回S與與殘差平方和殘差平方和2S殘niniiiyySyyS112222) (,

53、)(殘回2回Sl 反映了由于反映了由于x的變化引起的的變化引起的y的差異,體現了的差異,體現了x對對y的影響;的影響;2S殘l 反映了自變量以外的隨機因素對反映了自變量以外的隨機因素對y的影響。的影響。22/殘回SS為為xl 若它若它不是顯著地大不是顯著地大,表明所選的,表明所選的x并不是一個重要的并不是一個重要的 回歸平方和回歸平方和的影響部分與隨機因素影響部分的比值的影響部分與隨機因素影響部分的比值;因素,因素,它的作用與隨機因素的作用相當它的作用與隨機因素的作用相當,于是得到的回,于是得到的回歸方程就歸方程就沒有意義沒有意義。 l 如果它如果它顯著地大顯著地大,表明,表明x關于關于回歸方

54、程回歸方程的的顯著性檢驗問題顯著性檢驗問題 可以證明,當可以證明,當bxaY的關系中的關系中b=0b=0時,有時,有2222)2()(,)(nSESE殘回 2)-nF(1,2)-/(nSSF22殘回的作用是顯著地比隨機因素大,的作用是顯著地比隨機因素大,這樣方程才這樣方程才有意義有意義。b是否等于是否等于0的檢驗問題的檢驗問題用用2222SS2)-(n2)-/(nSSF殘回殘回來檢驗來檢驗b b的絕對值是否大于的絕對值是否大于0 0; ;或者說檢驗回歸方程或者說檢驗回歸方程xbay給定顯著性水平給定顯著性水平便可判斷回歸方程是否有意義。即要檢驗假設便可判斷回歸方程是否有意義。即要檢驗假設. 0

55、:, 0:10bHbH檢驗統(tǒng)計量檢驗統(tǒng)計量為為)2, 1 (SS2)-(n2)-/(nSSF2222nF殘回殘回是否有意義。是否有意義。,查,查F分布分位數表,求出分布分位數表,求出否定域否定域,拒絕域為拒絕域為)2, 1 (nFF xyniniiiSbxxbyyS2112222) ()(回 xyyyniiSbSSSyyS) (22122回總殘也也可用可用t t檢驗法檢驗法來檢驗回歸方程是否有意義,假設來檢驗回歸方程是否有意義,假設. 0:, 0:10bHbH./,2xxSbNb),2(222222nSn殘且且b與與2殘S獨立(見附錄獨立(見附錄5 5),故有),故有),()2(2/222sn

56、tnnSbbxx即即).2(ntSbbxx這里這里.2又又使用使用t檢驗法檢驗法來進行檢驗。有(見附錄來進行檢驗。有(見附錄2):):當當H H0 0為真時為真時b=0b=0,此時,此時),2(ntSbtxx即得即得H H0 0的拒絕域為的拒絕域為,22/ntSbtaxx當假設當假設0:0bH就認為回歸效果不顯著。就認為回歸效果不顯著。 被拒絕時,認為回歸效果是顯著的,反之,被拒絕時,認為回歸效果是顯著的,反之,3. 3. 預測預測(2我們無法確切知道我們無法確切知道yy的值。因此,只能估計的值。因此,只能估計yy的范圍。通常的范圍。通常假定假定), 0(2Nyy 這樣通過對這樣通過對2的估計

57、,就可知道的估計,就可知道yy 的估計)的估計)當檢驗認為回歸方程確有意義,則可用來預測或控制。當檢驗認為回歸方程確有意義,則可用來預測或控制。的取值范圍。的取值范圍。假定假定),(00yx), 0(,(2NbxaY00 yy 是在模型是在模型的條件下進行的一次試驗結果,可以證明的條件下進行的一次試驗結果,可以證明有:有:2200011, 0SxxxxnNyy.1 , 0112000NSxxnyyxx )2(2222nn因此,因此,.2, 1)11 ()(202200nFSxxnyyxx 給定的給定的置信水平置信水平a1,有,有anFSxxnyyPxx12, 1)11 ()(2022000y的

58、的置信區(qū)間置信區(qū)間為為),(00yy其中其中xxSxxnnFx202011)2, 1 ()(于是于是根據根據書上書上(用相關系數檢驗法),也有(用相關系數檢驗法),也有.22/211222000ntnnSxxnyyxx即即.2112000ntSxxnyyxx給定給定置信水平置信水平a1antSxxnyyPaxx12112/2000,有,有aSxxnntYYSxxnntYPxxaxxa1112112202/00202/0,0yxxaSxxnntx202/0112)( 讓讓x(x換為換為0 x)變動,有:)變動,有:xxSxxnnFx2211)2, 1 ()(或或xxaSxxnntx22/112)

59、(置信區(qū)間置信區(qū)間其中其中事實上,當事實上,當n n很大且很大且0 x靠近靠近x時,有時,有2)(, 111122220nyySxxnniixx即即0yy 服從服從), 0(2N,用正態(tài)分布的性質有,用正態(tài)分布的性質有99. 033000yyyP或或95. 022000yyyP作為實際應用時的作為實際應用時的近似預報近似預報。 總結:總結:1.1.回歸方程計算回歸方程計算,.11niixnx niiyny11 niiiniiixyniniiiyyniniiixxyxnyxyyxxSynyyySxnxxxS111212212122., .,xbyaSSbxxxyxyniniiiSbxxbyyS2

60、112222) ()(回 xyyyniiSbSSSyyS) (22122回總殘 2222SS2)-(n2)-/(nSSF殘回殘回(2 2)進行統(tǒng)計)進行統(tǒng)計檢驗檢驗: 對給定對給定的臨界值的臨界值F,如果,如果FF 則拒絕假設則拒絕假設0H,說明一元線性回歸成立。如果,說明一元線性回歸成立。如果FF 則接受假設則接受假設0H,說明一元線性回歸不成立。,說明一元線性回歸不成立。,由,由F分布表查出自由度為(分布表查出自由度為(1,n-2)(3 3)對回歸直線進行)對回歸直線進行預測預測。xxSxxnnFx2211)2, 1 ()( )(xyy其中:其中:xbay4可線性化可線性化的一元的一元非線

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論