數(shù)理統(tǒng)計(jì)與隨機(jī)過程_第1頁
數(shù)理統(tǒng)計(jì)與隨機(jī)過程_第2頁
數(shù)理統(tǒng)計(jì)與隨機(jī)過程_第3頁
數(shù)理統(tǒng)計(jì)與隨機(jī)過程_第4頁
數(shù)理統(tǒng)計(jì)與隨機(jī)過程_第5頁
已閱讀5頁,還剩91頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1數(shù)理統(tǒng)計(jì)與隨機(jī)過程數(shù)理統(tǒng)計(jì)與隨機(jī)過程第八章第八章2第八章第八章: 假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)8.1 基本概念基本概念 下面,我們討論不同于參數(shù)估計(jì)問題的下面,我們討論不同于參數(shù)估計(jì)問題的另一類統(tǒng)計(jì)推斷問題另一類統(tǒng)計(jì)推斷問題根據(jù)樣本提供的信根據(jù)樣本提供的信息,檢驗(yàn)總體的某個(gè)假設(shè)是否成立的問題。息,檢驗(yàn)總體的某個(gè)假設(shè)是否成立的問題。這類問題稱為假設(shè)檢驗(yàn)。這類問題稱為假設(shè)檢驗(yàn)。3假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)參數(shù)檢驗(yàn)參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)總體分布已知情總體分布已知情形下,檢驗(yàn)未知形下,檢驗(yàn)未知參數(shù)的某個(gè)假設(shè)參數(shù)的某個(gè)假設(shè)總體分布未知情形總體分布未知情形下的假設(shè)檢驗(yàn)問題下的假設(shè)檢驗(yàn)問題先看一個(gè)例子。先看一個(gè)例子。4例

2、例1:某車間用一臺(tái)包裝機(jī)包裝葡萄糖某車間用一臺(tái)包裝機(jī)包裝葡萄糖, 包得的包得的袋裝糖重是一個(gè)隨機(jī)變量袋裝糖重是一個(gè)隨機(jī)變量, 它服從正態(tài)分布。它服從正態(tài)分布。當(dāng)機(jī)器正常時(shí)當(dāng)機(jī)器正常時(shí), 其均值為其均值為0.5kg, 標(biāo)準(zhǔn)差為標(biāo)準(zhǔn)差為0.015 kg。某日開工后為檢驗(yàn)包裝機(jī)是否正常。某日開工后為檢驗(yàn)包裝機(jī)是否正常, 隨機(jī)隨機(jī)地抽取它所包裝的糖地抽取它所包裝的糖9袋袋, 稱得凈重量稱得凈重量 (kg)為:為:0.497, 0.506, 0.518, 0.524, 0.498, 0.511, 0.520, 0.515, 0.512。問。問: 從樣本看機(jī)器是否正常從樣本看機(jī)器是否正常? 以以和和分別表

3、示這一天袋裝葡萄糖重量總分別表示這一天袋裝葡萄糖重量總體的均值和標(biāo)準(zhǔn)差。由于長(zhǎng)期實(shí)踐表明標(biāo)準(zhǔn)差體的均值和標(biāo)準(zhǔn)差。由于長(zhǎng)期實(shí)踐表明標(biāo)準(zhǔn)差比較穩(wěn)定,我們就設(shè)比較穩(wěn)定,我們就設(shè) =0.015。 檢驗(yàn)檢驗(yàn)“機(jī)器是否正常機(jī)器是否正?!钡葍r(jià)于檢驗(yàn)等價(jià)于檢驗(yàn)“X是否服從正態(tài)分布是否服從正態(tài)分布N(, 0.0152)”。5 確定總體:確定總體:記記 X 為該為該車間包裝機(jī)包裝的袋裝車間包裝機(jī)包裝的袋裝 葡萄糖的重量葡萄糖的重量,則,則 X N( , 0.0152); 明確任務(wù):明確任務(wù):通過樣本推斷通過樣本推斷“ 是否等于是否等于0.5”; 建立建立假設(shè):假設(shè):上面的任務(wù)是要通過樣本檢驗(yàn)上面的任務(wù)是要通過樣本

4、檢驗(yàn) “ “ =0.5”的假設(shè)是否成立。的假設(shè)是否成立。I. 如何建立檢驗(yàn)?zāi)P腿绾谓z驗(yàn)?zāi)P? 原假設(shè)的對(duì)立面原假設(shè)的對(duì)立面是是 “ 0.5”,稱為稱為 “對(duì)立假設(shè)對(duì)立假設(shè)” 或或 “備擇假設(shè)備擇假設(shè)”,記成記成 “ H1 1: 0.5”。把原假設(shè)和對(duì)立假設(shè)合寫在一起,。把原假設(shè)和對(duì)立假設(shè)合寫在一起,就是就是: :H0: =0.5; H1: 0.5. 在數(shù)理統(tǒng)計(jì)中,把在數(shù)理統(tǒng)計(jì)中,把 “ =0.5” 這樣一個(gè)待這樣一個(gè)待檢驗(yàn)的假設(shè)記為檢驗(yàn)的假設(shè)記為 “原假設(shè)原假設(shè)” 或或 “零假設(shè)零假設(shè)”, 記成記成 “ H0: =0.5”。7II. 解決問題的思路解決問題的思路 因樣本均值是因樣本均值是

5、的一個(gè)很好的估計(jì)。所以,的一個(gè)很好的估計(jì)。所以,當(dāng)當(dāng) = =0.5,即原假設(shè),即原假設(shè) H0 成立時(shí)成立時(shí), ,應(yīng)比較?。粦?yīng)比較??; 如果該值過大如果該值過大, , 想必想必 H0 0 不成立。不成立。于是,我們就用于是,我們就用 的大小來判定的大小來判定 H0 0 是否是否成立。成立。 |5 . 0|X |5 . 0|X 合理的做法應(yīng)該是:找出一個(gè)界限合理的做法應(yīng)該是:找出一個(gè)界限 c,. |5 . 0| |5 . 0| 00HcXHcX拒拒絕絕原原假假設(shè)設(shè)時(shí)時(shí),當(dāng)當(dāng);接接受受原原假假設(shè)設(shè)時(shí)時(shí),當(dāng)當(dāng)8 這里的問題是:如何確定常數(shù)這里的問題是:如何確定常數(shù) c 呢?呢?細(xì)致地分析細(xì)致地分析:

6、: 根據(jù)定理根據(jù)定理 6.4.1,有,有. 1 0(9/0.015 ) 9/015. 0 ,(2),或或NXNX于是,當(dāng)原假設(shè)于是,當(dāng)原假設(shè) H0 0: :=0.5 成立時(shí),有成立時(shí),有. ) 1 , 0(9/015. 05 . 0NX 9為確定常數(shù)為確定常數(shù) c,我們考慮一個(gè)很小的正數(shù),我們考慮一個(gè)很小的正數(shù) , 如如 = 0.05。當(dāng)原假設(shè)當(dāng)原假設(shè) H0 0: :=0.5成立時(shí),有成立時(shí),有, 9/015. 0|5 . 0|2/zXP. )9/015.0(|5 .0| 2/zXP即即. )9/015. 0( 2/z c 取取故故,10于是,我們就得到如下于是,我們就得到如下檢驗(yàn)準(zhǔn)則檢驗(yàn)準(zhǔn)則

7、: :. |5 . 0| |5 . 0| 00HcXHcX拒拒絕絕原原假假設(shè)設(shè)時(shí)時(shí),當(dāng)當(dāng);接接受受原原假假設(shè)設(shè)時(shí)時(shí),當(dāng)當(dāng). )9/015.0( 2/zc 其其中中 9/015. 05 . 0 | 5 . 0| 為為檢檢驗(yàn)驗(yàn)統(tǒng)統(tǒng)計(jì)計(jì)量量;或或稱稱XUX或或,稱稱 )9/015.0( |5 .0| 2/zX2/9/015. 0|5 . 0|zXU為為H0 0 的拒絕域的拒絕域。11用以上檢驗(yàn)準(zhǔn)則處理我們的問題,用以上檢驗(yàn)準(zhǔn)則處理我們的問題,所以,所以,拒拒絕絕 H0:=0.5,認(rèn)為機(jī)器異常,認(rèn)為機(jī)器異常。 , 511.0 X得得經(jīng)經(jīng)計(jì)計(jì)算算,.0098. 0 1.96 )9/015. 0( )9/

8、015. 0(2/zc.011.0|5 .0| cX故故,12 因?yàn)?,?dāng)因?yàn)椋?dāng) H0: =0.5 成立時(shí),成立時(shí),所以,當(dāng)所以,當(dāng) 很小時(shí),若很小時(shí),若 H0 0 為真為真( (正確正確), ), 則檢則檢驗(yàn)統(tǒng)計(jì)量落入拒絕域是一小概率事件驗(yàn)統(tǒng)計(jì)量落入拒絕域是一小概率事件 ( (概率很概率很小小, ,為為 ) )。前面曾提到過。前面曾提到過:“通常認(rèn)為小概率通常認(rèn)為小概率事件在一次試驗(yàn)中基本上不會(huì)發(fā)生事件在一次試驗(yàn)中基本上不會(huì)發(fā)生”。III. 方方法原理法原理 . )9/015.0(|5 .0| 2/zXP那么,一旦小概率事件發(fā)生,即那么,一旦小概率事件發(fā)生,即: : 發(fā)生發(fā)生, , 就認(rèn)為就

9、認(rèn)為 H0 0不正確。不正確。2/)9/015.0(|5 .0| zX13IV. IV. 兩類錯(cuò)誤與顯著性水平兩類錯(cuò)誤與顯著性水平 當(dāng)我們檢驗(yàn)一個(gè)假設(shè)當(dāng)我們檢驗(yàn)一個(gè)假設(shè) H0 時(shí),有可能犯以時(shí),有可能犯以下兩類錯(cuò)誤之一:下兩類錯(cuò)誤之一:H0 正確,但我們認(rèn)為其不正確,但我們認(rèn)為其不正確,這就犯了正確,這就犯了“棄真棄真”的錯(cuò)誤,即拋棄了的錯(cuò)誤,即拋棄了正確的假設(shè);正確的假設(shè);H0 不正確,但被卻誤認(rèn)為正確,不正確,但被卻誤認(rèn)為正確,這就犯了這就犯了“取偽取偽”的錯(cuò)誤,即采用了偽假設(shè)。的錯(cuò)誤,即采用了偽假設(shè)。 因?yàn)闄z驗(yàn)統(tǒng)計(jì)量總是隨機(jī)的,所以,我因?yàn)闄z驗(yàn)統(tǒng)計(jì)量總是隨機(jī)的,所以,我們總是以一定的概率

10、犯以上兩類錯(cuò)誤。們總是以一定的概率犯以上兩類錯(cuò)誤。14 通常分別用通常分別用 和和 記犯第一、第二類錯(cuò)誤記犯第一、第二類錯(cuò)誤的概率,即的概率,即. | | 0000為為假假接接受受,為為真真拒拒絕絕HHPHHP 在檢驗(yàn)問題中,犯在檢驗(yàn)問題中,犯“棄真棄真”和和“取偽取偽”兩類錯(cuò)誤都總是不可避免的,并且減少犯第兩類錯(cuò)誤都總是不可避免的,并且減少犯第一類錯(cuò)誤的概率,就會(huì)增大犯第二類錯(cuò)誤的一類錯(cuò)誤的概率,就會(huì)增大犯第二類錯(cuò)誤的概率概率;反之亦然。反之亦然。 所以,所以,犯兩類錯(cuò)誤的概率不能同犯兩類錯(cuò)誤的概率不能同時(shí)得到控制。時(shí)得到控制。15 在統(tǒng)計(jì)學(xué)中,通常控制犯第一類錯(cuò)誤的在統(tǒng)計(jì)學(xué)中,通??刂品傅?/p>

11、一類錯(cuò)誤的概概率。一般事先選定一個(gè)數(shù)概概率。一般事先選定一個(gè)數(shù) ( (0 0 而現(xiàn)在要處理的對(duì)立假設(shè)為而現(xiàn)在要處理的對(duì)立假設(shè)為H1: 0, 稱為稱為右邊右邊對(duì)立假設(shè)對(duì)立假設(shè)。 類似地類似地, H0: =0; H1: 0 中的對(duì)立假中的對(duì)立假設(shè)設(shè)H1: 0 . 0znXP由由此此,可可推推出出. 00znXH的的拒拒絕絕域域?yàn)闉樗砸裕?6在在 2 2未知情況下,未知情況下,當(dāng)原假設(shè)當(dāng)原假設(shè) 成立時(shí),成立時(shí),. )( 100n-tnSXH的拒絕域?yàn)榈木芙^域?yàn)樗?,所以?. / 10ntnSX. )( 10n tnSXP由由此此,可可推推出出27例例 2:某廠生產(chǎn)一種工業(yè)用繩某廠生產(chǎn)一種工業(yè)用

12、繩, ,其質(zhì)量指標(biāo)是其質(zhì)量指標(biāo)是繩子所承受的最大拉力,假定該指標(biāo)服從正繩子所承受的最大拉力,假定該指標(biāo)服從正態(tài)分布,且該廠原來生產(chǎn)的繩子指標(biāo)均值態(tài)分布,且該廠原來生產(chǎn)的繩子指標(biāo)均值 0 0 =15公斤,采用一種新原材料后公斤,采用一種新原材料后, ,廠方稱這種廠方稱這種原材料提高了繩子的質(zhì)量,也就是說繩子所原材料提高了繩子的質(zhì)量,也就是說繩子所承受的最大拉力承受的最大拉力 比比15公斤增大了。公斤增大了。 為檢驗(yàn)該廠的結(jié)論是否真實(shí),從其新產(chǎn)為檢驗(yàn)該廠的結(jié)論是否真實(shí),從其新產(chǎn)品中隨機(jī)抽取品中隨機(jī)抽取5050件,測(cè)得它們所承受的最大件,測(cè)得它們所承受的最大拉力的平均值為拉力的平均值為15.8公斤,

13、樣本標(biāo)準(zhǔn)差公斤,樣本標(biāo)準(zhǔn)差S= =0.5公斤。取顯著性水平公斤。取顯著性水平 = =0.01。問從這些樣本問從這些樣本看:能否接受廠方的結(jié)論??矗耗芊窠邮軓S方的結(jié)論。28解:解:?jiǎn)栴}歸結(jié)為檢驗(yàn)如下假設(shè)問題歸結(jié)為檢驗(yàn)如下假設(shè) H0: =15; H1: 15 ( 2未知未知),17. 04049. 2505 . 0)01. 0(505 . 0 )( , 8 . 0158 .15 491 -n0ttnSX. 0.01 0.5 8 .15 15 50 0,此此處處,SXn于是于是,. )( 1 -n0tnSX所所以以,從而,拒絕原假設(shè),即認(rèn)為新的原材料確實(shí)從而,拒絕原假設(shè),即認(rèn)為新的原材料確實(shí)提高了繩

14、子所能承受的最大拉力。提高了繩子所能承受的最大拉力。298.2.2 兩個(gè)正態(tài)總體兩個(gè)正態(tài)總體 N( 1, 12) 和和 N( 2, 22) 均值的比較均值的比較 在應(yīng)用上,經(jīng)常會(huì)遇到兩個(gè)正態(tài)總體均在應(yīng)用上,經(jīng)常會(huì)遇到兩個(gè)正態(tài)總體均值的比較問題。值的比較問題。 例如:例如:比較甲、乙兩廠生產(chǎn)的某種產(chǎn)品比較甲、乙兩廠生產(chǎn)的某種產(chǎn)品的質(zhì)量。將兩廠生產(chǎn)的產(chǎn)品的質(zhì)量指標(biāo)分別的質(zhì)量。將兩廠生產(chǎn)的產(chǎn)品的質(zhì)量指標(biāo)分別看成正態(tài)總體看成正態(tài)總體 N( 1, 12) 和和 N( 2, 22)。比較它。比較它們的產(chǎn)品質(zhì)量指標(biāo)的問題,就變?yōu)楸容^這兩們的產(chǎn)品質(zhì)量指標(biāo)的問題,就變?yōu)楸容^這兩個(gè)正態(tài)總體的均值個(gè)正態(tài)總體的均值

15、1 1和和 2 2的的問題。的的問題。30 又如:又如:考察一項(xiàng)新技術(shù)對(duì)提高產(chǎn)品質(zhì)量是考察一項(xiàng)新技術(shù)對(duì)提高產(chǎn)品質(zhì)量是否有效。將新技術(shù)實(shí)施前后生產(chǎn)的產(chǎn)品質(zhì)量指否有效。將新技術(shù)實(shí)施前后生產(chǎn)的產(chǎn)品質(zhì)量指標(biāo)分別看成正態(tài)總體標(biāo)分別看成正態(tài)總體 N( 1, 12)和和 N( 2, 22)。這。這時(shí),所考察的問題就歸結(jié)為檢驗(yàn)這兩個(gè)正態(tài)總時(shí),所考察的問題就歸結(jié)為檢驗(yàn)這兩個(gè)正態(tài)總體的均值體的均值 1 1和和 2 2是否相等的問題。是否相等的問題。 設(shè)設(shè)X1, X2, , Xm與與Y1, Y2, , Yn 分別為抽分別為抽自正態(tài)總體自正態(tài)總體 N( 1, 12)和和 N( 2, 22)的樣本,記的樣本,記的的均均

16、值值和和方方差差。分分別別為為和和的的均均值值和和方方差差;分分別別為為和和 , , 21222121nmYYYSYXXXSX考查如下檢驗(yàn)假設(shè)考查如下檢驗(yàn)假設(shè): :311. H0: 1= 2 ; H1: 1 2 當(dāng)當(dāng) 1 12 2 和和 2 22 2 已知時(shí),已知時(shí),根據(jù)定理根據(jù)定理7.5.1,有,有. 1 , 0 )(222121NnmYX當(dāng)當(dāng) H0: 1 = 2為真時(shí),為真時(shí), , 1 , 0 2221NnmYX32故,拒絕域故,拒絕域?yàn)闉?. |2/2221znmYXP. | | 22212/2/2221nmzYXznmYX或或33 在在 12= 22 = 2, 2未知情況下,根據(jù)定未知

17、情況下,根據(jù)定理理7.5.1,有,有當(dāng)當(dāng) H0: 1= 2 為真時(shí),有為真時(shí),有, )()(21121nmtnmSYX. 2) 1() 1( 2221nmSnSmS其其中中. )(211nmtnmSYX34拒絕域拒絕域?yàn)闉?. /2)(|211nmtnmSYXP從而從而 . /2)( | /2)(| 112211nmStYXtnmSYXnmnm或或35 上面,我們假定上面,我們假定 12= 22。當(dāng)然,這是個(gè)。當(dāng)然,這是個(gè)不得已而強(qiáng)加上去的條件,因?yàn)槿绻患哟瞬坏靡讯鴱?qiáng)加上去的條件,因?yàn)槿绻患哟藯l件,就無法使用簡(jiǎn)單易行的條件,就無法使用簡(jiǎn)單易行的 t 檢驗(yàn)。檢驗(yàn)。 在實(shí)用中,只要我們有理由認(rèn)

18、為在實(shí)用中,只要我們有理由認(rèn)為 12和和 22相差不是太大,往往就可使用上述方法。通相差不是太大,往往就可使用上述方法。通常是:如果方差比檢驗(yàn)未被拒絕常是:如果方差比檢驗(yàn)未被拒絕(見下節(jié)見下節(jié)), 就就認(rèn)為認(rèn)為 12和和 22相差不是太大。相差不是太大。說明:說明:36例例3:假設(shè)有假設(shè)有A和和B兩種藥,欲比較它們?cè)诜脙煞N藥,欲比較它們?cè)诜?小時(shí)后在血液中的含量是否一樣。對(duì)藥品小時(shí)后在血液中的含量是否一樣。對(duì)藥品A,隨機(jī)抽取隨機(jī)抽取8個(gè)病人服藥,服藥個(gè)病人服藥,服藥2小時(shí)后,測(cè)得小時(shí)后,測(cè)得8個(gè)病人血液中藥物濃度個(gè)病人血液中藥物濃度(用適當(dāng)?shù)膯挝挥眠m當(dāng)?shù)膯挝?分別為分別為: 1.23, 1

19、.42, 1.41, 1.62, 1.55, 1.51, 1.60, 1.76.對(duì)藥品對(duì)藥品B,隨機(jī)抽取,隨機(jī)抽取6個(gè)病人服藥,服藥個(gè)病人服藥,服藥2小時(shí)小時(shí)后,測(cè)得血液中藥的濃度分別為后,測(cè)得血液中藥的濃度分別為: 1.76, 1.41, 1.87, 1.49, 1.67, 1.81.假定這兩組觀測(cè)值抽自具有共同方差的兩個(gè)正假定這兩組觀測(cè)值抽自具有共同方差的兩個(gè)正態(tài)總體,在顯著性水態(tài)總體,在顯著性水 =0.10下,檢驗(yàn)病人血液下,檢驗(yàn)病人血液中這兩種藥的濃度是否有顯著不同中這兩種藥的濃度是否有顯著不同?37故,接受原假設(shè)。即接受原假設(shè)。即, , 認(rèn)為病人血液中這兩認(rèn)為病人血液中這兩種藥濃度無

20、顯著差異。種藥濃度無顯著差異。解:解:?jiǎn)栴}就是從總體問題就是從總體 N( 1, 2)和和N( 2, 2)中分中分別抽取樣本別抽取樣本X1, X2, X8 和和Y1, Y2, Y6,樣本,樣本均值和樣本方差分別為均值和樣本方差分別為:.33. 02) 1() 1( 6 81 . 0,210 ,661 ,030 ,51122212221nmSnSmSnm.S.Y.S.X,. 0.31 /2)( | 15. 0112nmStYXnm38與與1.1.的分析完全類似,可以得到的分析完全類似,可以得到: :2. 單邊檢驗(yàn)單邊檢驗(yàn) H0: 1 2; H1: 1 2 1 12 2和和 2 22 2已知情況下,

21、已知情況下,H0 0的的拒絕域拒絕域?yàn)闉? 2221nmzYX 1 12 2與與 2 22 2未知,未知,但二者相等情況下,但二者相等情況下,H0 0的的 拒絕域拒絕域?yàn)闉? )(112nmStYXnm39與與1.1.的分析完全類似,可以得到的分析完全類似,可以得到: :3. 單邊檢驗(yàn)單邊檢驗(yàn) H0: 1 2; H1: 1 2 1 12 2和和 2 22 2已知情況下,已知情況下,H0 0的的拒絕域拒絕域?yàn)闉? nmzYX2221 1 12 2與與 2 22 2未知,但二者相等情況下,未知,但二者相等情況下,H0 0的的 拒絕域拒絕域?yàn)闉? )(112nmStYXnm40 兩個(gè)正態(tài)總體與成對(duì)數(shù)

22、據(jù)的區(qū)別兩個(gè)正態(tài)總體與成對(duì)數(shù)據(jù)的區(qū)別u兩個(gè)正態(tài)總體兩個(gè)正態(tài)總體假定來自這兩個(gè)正態(tài)總體假定來自這兩個(gè)正態(tài)總體 的兩組樣本,是相互獨(dú)立的。的兩組樣本,是相互獨(dú)立的。u成對(duì)數(shù)據(jù)成對(duì)數(shù)據(jù)兩組樣本可以是來自對(duì)同一個(gè)兩組樣本可以是來自對(duì)同一個(gè) 總體上的重復(fù)測(cè)量,它們是成對(duì)出現(xiàn)的,可總體上的重復(fù)測(cè)量,它們是成對(duì)出現(xiàn)的,可 以是相關(guān)的。以是相關(guān)的。8.2.3 成對(duì)數(shù)據(jù)的成對(duì)數(shù)據(jù)的 t 檢驗(yàn)檢驗(yàn)41例如例如: 為了考察一種降血壓藥的效果,測(cè)試了為了考察一種降血壓藥的效果,測(cè)試了n 個(gè)高血壓病人服藥前、后的血壓分別為個(gè)高血壓病人服藥前、后的血壓分別為X1, X2, Xn 和和Y1,Y2,Yn。這里。這里(Xi ,

23、Yi)是第是第 i個(gè)病個(gè)病人服藥前和服藥后的血壓,它們是相關(guān)的。人服藥前和服藥后的血壓,它們是相關(guān)的。 處理處理成對(duì)數(shù)據(jù)的思路成對(duì)數(shù)據(jù)的思路 因因(Xi , Yi)是在同一人身上觀測(cè)到的血壓。是在同一人身上觀測(cè)到的血壓。所以,所以,Xi- -Yi 就消除了人的體質(zhì)等諸方面的條就消除了人的體質(zhì)等諸方面的條件差異,僅剩下降血壓藥的效果。件差異,僅剩下降血壓藥的效果。 所以,所以,我們可以把我們可以把 di=Xi- -Yi,i=1, 2, n.看成抽自正態(tài)總體看成抽自正態(tài)總體 N( , 2)的樣本。其中的樣本。其中 就就是降血壓藥的平均效果。是降血壓藥的平均效果。42 一般的成對(duì)數(shù)據(jù)同樣也是這樣轉(zhuǎn)變

24、的。從一般的成對(duì)數(shù)據(jù)同樣也是這樣轉(zhuǎn)變的。從前面所學(xué)內(nèi)容可以看出:其實(shí)就是作前面所學(xué)內(nèi)容可以看出:其實(shí)就是作 H0: = 0; H1: 0; H0: 0; H1: 0 方差方差 2 2未知情況下的檢驗(yàn)。未知情況下的檢驗(yàn)。niidniiddnSYXdnd1221.)(11 1 ,記記上述三種檢驗(yàn)的拒絕域分別為:上述三種檢驗(yàn)的拒絕域分別為:).()/( )()/( )2/()/(|111ndndndtnSdtnSdtnSd和和,43例例4:為了檢驗(yàn)為了檢驗(yàn)A, B兩種測(cè)定鐵礦石含鐵量的兩種測(cè)定鐵礦石含鐵量的方法是否有明顯差異方法是否有明顯差異, 現(xiàn)用這兩種方法測(cè)定了現(xiàn)用這兩種方法測(cè)定了取自取自12個(gè)

25、不同鐵礦的礦石標(biāo)本的含鐵量個(gè)不同鐵礦的礦石標(biāo)本的含鐵量(%),結(jié)果列于表結(jié)果列于表 8.2.1中。取中。取 =0.05, 問這兩種測(cè)定問這兩種測(cè)定方法是否有顯著差異方法是否有顯著差異? 44解解: 將方法將方法A和方法和方法B的測(cè)定值分別記為的測(cè)定值分別記為X1, X2, X12 和和 Y1, Y2, Y12 .45因這因這12個(gè)標(biāo)本來自不同鐵礦,個(gè)標(biāo)本來自不同鐵礦,所以所以, X1, X2, X12 不能看成來自同一個(gè)總體的樣本。同理不能看成來自同一個(gè)總體的樣本。同理, Y1, Y2, Y12也不能看成來自同一個(gè)總體的樣也不能看成來自同一個(gè)總體的樣本。故本。故, 用成對(duì)用成對(duì) t 檢驗(yàn)。記檢

26、驗(yàn)。記 di=Xi- -Yi, i=1, 2, , 12.所以,接受原假設(shè),即認(rèn)為兩種測(cè)定方法無所以,接受原假設(shè),即認(rèn)為兩種測(cè)定方法無顯著性差異。顯著性差異。.0007. 0 0.0167 2dSd,容容易易算算出出.0168. 0)2/()(0.0167 201. 2)2/( 0.05 12 11ndntn/S|d|tn得得,再再由由46 利用樣本方差利用樣本方差 S S 2 2是是 2的一個(gè)無偏估計(jì),的一個(gè)無偏估計(jì),且且 (n- -1)S2/ 2 2n- -1 的結(jié)論。的結(jié)論。8.3.1 單個(gè)正態(tài)總體方差的單個(gè)正態(tài)總體方差的2 檢驗(yàn)檢驗(yàn) 設(shè)設(shè) X1, X2, , Xn 為來自總體為來自總體

27、 N( , 2) 的樣的樣本,本, 和和 2 2未知,求下列假設(shè)的顯著性水平為未知,求下列假設(shè)的顯著性水平為 的檢驗(yàn)。的檢驗(yàn)。思路分析思路分析: 1. H0: 2 = 02;H1: 2 02 8.3 正態(tài)總體方差的檢驗(yàn)正態(tài)總體方差的檢驗(yàn)47 當(dāng)原假設(shè)當(dāng)原假設(shè) H0: 2 = 02成立時(shí),成立時(shí),S2 2和和 0 02 2應(yīng)應(yīng)該比較接近,即比值該比較接近,即比值 S S 2 2/ / 0 02 2應(yīng)接近于應(yīng)接近于1 1。所以。所以, ,這個(gè)比值過大或過小這個(gè)比值過大或過小 時(shí),應(yīng)拒絕原假設(shè)。時(shí),應(yīng)拒絕原假設(shè)。 合理的做法是合理的做法是: 找兩個(gè)合適的界限找兩個(gè)合適的界限 c1 和和 c2 , 當(dāng)

28、當(dāng) c1(n- -1)S2/ 02 02 同理,當(dāng)同理,當(dāng) H0: 2 = 02成立時(shí),有,成立時(shí),有, . )1( 212020nSnH 的的拒拒絕絕域域?yàn)闉樗砸裕? )() 1(21202nSnP此檢驗(yàn)法也稱此檢驗(yàn)法也稱 2 2 檢驗(yàn)法檢驗(yàn)法。3*. H0: 2 02;H1: 2 02 (同同2.)50例例1:某公司生產(chǎn)的發(fā)動(dòng)機(jī)部件的直徑某公司生產(chǎn)的發(fā)動(dòng)機(jī)部件的直徑 (單位單位: cm) 服從正態(tài)分布,并稱其標(biāo)準(zhǔn)差服從正態(tài)分布,并稱其標(biāo)準(zhǔn)差 0=0.048 。現(xiàn)隨機(jī)抽取現(xiàn)隨機(jī)抽取5個(gè)部件,測(cè)得它們的直徑為個(gè)部件,測(cè)得它們的直徑為 1.32, 1.55, 1.36, 1.40, 1.44

29、.取取 =0.05,問,問:(1). 能否認(rèn)為該公司生產(chǎn)的發(fā)動(dòng)機(jī)部件的直徑能否認(rèn)為該公司生產(chǎn)的發(fā)動(dòng)機(jī)部件的直徑 的標(biāo)準(zhǔn)差確實(shí)為的標(biāo)準(zhǔn)差確實(shí)為 = 0?(2). 能否認(rèn)為能否認(rèn)為 0?解解: (1). 的問題就是檢驗(yàn)的問題就是檢驗(yàn) H0: 2 = 02; H1: 2 02.其中,其中,n=5, =0.05, 0=0.048.51故,拒絕原假設(shè)故,拒絕原假設(shè) H0 ,即認(rèn)為部件直徑標(biāo)準(zhǔn),即認(rèn)為部件直徑標(biāo)準(zhǔn)差不是差不是 0.048 cm。 經(jīng)計(jì)算,得經(jīng)計(jì)算,得 S2=0.00778,. 0.484)0.975()2/1 ( 11.143)0.025()2/( 242124212nn,分分布布表表,得

30、得查查. 11.14351.13048. 000778. 0) 1(51)( 2202Sn算算得得52故,拒絕原假設(shè)故,拒絕原假設(shè) H0,即認(rèn)為部件的直徑標(biāo)準(zhǔn),即認(rèn)為部件的直徑標(biāo)準(zhǔn)差超過了差超過了 0.048 cm。 (2). 的問題是檢驗(yàn)的問題是檢驗(yàn) H0: 2 02 ; H1: 2 02.,分布表,得分布表,得查查 488. 9)0.05()( 24212n. 9.48851.131)( 202Sn而而53 該檢驗(yàn)主要用于上節(jié)中實(shí)施兩該檢驗(yàn)主要用于上節(jié)中實(shí)施兩樣本樣本 t 檢檢驗(yàn)之前,討論驗(yàn)之前,討論 1 12 2 = = 2 22 2 的的假設(shè)是否合理。假設(shè)是否合理。8.3.2 兩正態(tài)總

31、體方差比的兩正態(tài)總體方差比的 F 檢驗(yàn)檢驗(yàn)1. H0: 12 = 22;H1: 12 22. 設(shè)設(shè)X1, X2, , Xm和和Y1, Y2, , Yn 分別為抽自分別為抽自正態(tài)總體正態(tài)總體 N( 1, 12)和和 N( 2, 22)的樣本的樣本, 欲檢驗(yàn)欲檢驗(yàn)54 當(dāng)當(dāng) H0: 12= 22 成立時(shí)成立時(shí), 12/ 22=1, 作為其作為其估計(jì),估計(jì),S12/S22也應(yīng)與也應(yīng)與 1 相差不大。相差不大。當(dāng)當(dāng)該值過分該值過分地大或過分地小時(shí),都應(yīng)拒絕原假設(shè)成立。地大或過分地小時(shí),都應(yīng)拒絕原假設(shè)成立。 合理的思路是:找兩個(gè)界限合理的思路是:找兩個(gè)界限c1和和c2, 當(dāng)當(dāng) c1 S12/S22 22

32、 同理,當(dāng)同理,當(dāng) H0: 12 = 22成立時(shí),有成立時(shí),有 S12/S22 Fm- -1, n- -1, . )(1 1,2221nmFSSP . 1, 122210nmFSSH 的的拒拒絕絕域域?yàn)闉樗砸裕?8例例2:甲乙兩廠生產(chǎn)同一種電阻,現(xiàn)從甲乙兩甲乙兩廠生產(chǎn)同一種電阻,現(xiàn)從甲乙兩廠的產(chǎn)品中分別隨機(jī)地抽取廠的產(chǎn)品中分別隨機(jī)地抽取1212個(gè)和個(gè)和1010個(gè)樣品個(gè)樣品, ,測(cè)得它們的電阻值后,測(cè)得它們的電阻值后,計(jì)算出樣本方差分別計(jì)算出樣本方差分別為為S12=1.40,S22=4.38。3. H0: 12 22;H1: 12 22結(jié)論同結(jié)論同 2 2。 以上檢驗(yàn)都用到了以上檢驗(yàn)都用到了

33、F分布,因此稱上述檢分布,因此稱上述檢驗(yàn)為驗(yàn)為 F 檢驗(yàn)。檢驗(yàn)。 假設(shè)兩廠生產(chǎn)的電阻假設(shè)兩廠生產(chǎn)的電阻的電阻的阻值分別服從正態(tài)分布的電阻的阻值分別服從正態(tài)分布 N( 1, 12)和和 N( 2, 22)。59在顯著性水平在顯著性水平 = 0.10下下, , 是否可接受:是否可接受: (l).(l). 1 12 2 = = 2 22 2;(2).(2). 1 12 2 2 22 2. . 解:解:(1). 的問題是檢驗(yàn)的問題是檢驗(yàn) H0: 12 = 22;H1: 12 22.其中,其中,m=12, n=10, =0.10, S12=1.40, S22=4.38, S12/S22 =0.32。利用

34、第六章學(xué)過的利用第六章學(xué)過的 )2/(1)2/1 (1 1,1 1,mnnmFF60及及P237的附表的附表5,有,有 Fm- -1, n- -1(1- - /2) = F11, 9(0.95) = 1/F9, 11(0.05) = 1/(2.90) = 0.34.因因 S12/S22 = 0.32 0.34,所以,所以,無須再考慮無須再考慮Fm- -1, n- -1( /2)的值,就可得到拒絕的值,就可得到拒絕 12 = 22的的結(jié)論。結(jié)論。61 查查P237 附表附表5,因,因查不到查不到 F11, 9(0.10),改,改用用F10, 9(0.10)和和F12, 9(0.10)的平均值近似

35、之,得的平均值近似之,得 F11, 9(0.10)=F10, 9(0.10)+F12, 9(0.10)/2 2.42+2.38/2 = 2.40.因因 S12/S22 = 0.32 22. . 110 1122221,檢檢驗(yàn)驗(yàn)的的拒拒絕絕域域?yàn)闉镕SS62 在前面的討論中,我們總假定總體的分在前面的討論中,我們總假定總體的分布形式是已知的。例如,假設(shè)總體分布為正布形式是已知的。例如,假設(shè)總體分布為正態(tài)分布態(tài)分布 N( , 2), 總體分布為區(qū)間總體分布為區(qū)間 (a, b) 上的上的均勻分布,等等。均勻分布,等等。 然而,在實(shí)際問題中,我們所遇到的總?cè)欢?,在?shí)際問題中,我們所遇到的總體服從何種分

36、布往往并不知道。需要我們先體服從何種分布往往并不知道。需要我們先對(duì)總體的分布形式提出假設(shè),如:總體分布對(duì)總體的分布形式提出假設(shè),如:總體分布是正態(tài)分布是正態(tài)分布N( , 2),總體分布是區(qū)間總體分布是區(qū)間(a, b)上均勻分布等,然后利用數(shù)據(jù)上均勻分布等,然后利用數(shù)據(jù) (樣本樣本) 對(duì)這一對(duì)這一假設(shè)進(jìn)行檢驗(yàn),看能否獲得通過。假設(shè)進(jìn)行檢驗(yàn),看能否獲得通過。8.4 分布擬合檢驗(yàn)分布擬合檢驗(yàn)63 這是一項(xiàng)非常重要的工作這是一項(xiàng)非常重要的工作,許多學(xué)者視它為近代統(tǒng)計(jì)學(xué)的許多學(xué)者視它為近代統(tǒng)計(jì)學(xué)的開端。開端。 解決這類問題的方法最早由英國(guó)統(tǒng)計(jì)學(xué)解決這類問題的方法最早由英國(guó)統(tǒng)計(jì)學(xué)家家 K. Pearson

37、 (皮爾遜皮爾遜) 于于1900年在他發(fā)表的年在他發(fā)表的一篇文章中給出一篇文章中給出, 該方法后被稱為該方法后被稱為 Pearson 2檢驗(yàn)法,簡(jiǎn)稱檢驗(yàn)法,簡(jiǎn)稱 2檢驗(yàn)檢驗(yàn)。64 設(shè)設(shè)F(x)為一已知的分布函數(shù),現(xiàn)有樣本為一已知的分布函數(shù),現(xiàn)有樣本X1, X2, , Xn,但我們并不知道樣本的總體,但我們并不知道樣本的總體 分分布是什么?,F(xiàn)在試圖檢驗(yàn)布是什么?,F(xiàn)在試圖檢驗(yàn) H0:總體:總體 X 的分布函數(shù)為的分布函數(shù)為F(x) ; (1) 對(duì)立假設(shè)為對(duì)立假設(shè)為 H1:總體:總體 X 的分布函數(shù)非的分布函數(shù)非F(x)。如果如果 F(x) 形式已知,但含有未知參數(shù)形式已知,但含有未知參數(shù) 或參或參

38、數(shù)向量數(shù)向量 =(1, 2, r) ,記為,記為F(x, )。這種。這種檢驗(yàn)通常稱為分布的擬合優(yōu)度檢驗(yàn)。檢驗(yàn)通常稱為分布的擬合優(yōu)度檢驗(yàn)。8.4.1 2檢驗(yàn)檢驗(yàn)65 不妨設(shè)總體不妨設(shè)總體 X 是連續(xù)型分布。檢驗(yàn)思想是連續(xù)型分布。檢驗(yàn)思想與步驟如下與步驟如下:(1). 將總體將總體 X 的取值范圍分成的取值范圍分成 k 個(gè)互不重疊的個(gè)互不重疊的 小區(qū)間小區(qū)間 I1, I2, , Ik,. ( ( (12101212101kkkkkaaaaaaaIaaIaaI,(2). 計(jì)算各子區(qū)間計(jì)算各子區(qū)間 Ii 上的理論頻數(shù)。上的理論頻數(shù)。如果總體的分布函數(shù)為如果總體的分布函數(shù)為F(x, ),那么,各,那么,

39、各點(diǎn)落在區(qū)間點(diǎn)落在區(qū)間 Ii 上的概率均為上的概率均為,k.,iaFaFpiii21 ),(),()(166)(inpn 個(gè)點(diǎn)中,理論上有個(gè)點(diǎn)中,理論上有n pi ( )個(gè)點(diǎn)落在個(gè)點(diǎn)落在 Ii 上上, (稱為理論頻數(shù)稱為理論頻數(shù))。當(dāng)分布函數(shù)中含有未知。當(dāng)分布函數(shù)中含有未知參數(shù)參數(shù) 時(shí),理論頻數(shù)也未知,要用時(shí),理論頻數(shù)也未知,要用來估計(jì)來估計(jì) n pi (), 為為 的極大似然估計(jì)。的極大似然估計(jì)。(3). 計(jì)算各子區(qū)間計(jì)算各子區(qū)間 Ii 上的實(shí)際頻數(shù)上的實(shí)際頻數(shù) fi 。 fi = X1, X2, , Xn Ii , i=1, 2, , k . 計(jì)數(shù)符號(hào),取集計(jì)數(shù)符號(hào),取集合中元素的個(gè)數(shù)合中

40、元素的個(gè)數(shù)6722211( )= (2)( )( )kkiiiiiiifnpfnnpnp,(4). 計(jì)算理論頻數(shù)與實(shí)際頻數(shù)的偏差平方和。計(jì)算理論頻數(shù)與實(shí)際頻數(shù)的偏差平方和??梢宰C明:在可以證明:在 H0 成立,且成立,且 n時(shí)時(shí), 和和式式中中的的影影響響力力。頻頻數(shù)數(shù)比比較較大大的的那那些些項(xiàng)項(xiàng)在在理理論論去去除除的的其其目目的的是是:縮縮小小每每一一項(xiàng)項(xiàng)用用 )( inp)3( 212,k-r- 1 22是參數(shù)個(gè)數(shù)。是參數(shù)個(gè)數(shù)。是子區(qū)間數(shù),是子區(qū)間數(shù),分布,分布,的的由度為由度為統(tǒng)計(jì)量的分布收斂到自統(tǒng)計(jì)量的分布收斂到自即即rkrk68(5). H0 的顯著性水平為的顯著性水平為 的檢驗(yàn)的拒

41、絕域?yàn)榈臋z驗(yàn)的拒絕域?yàn)?21 () (4)kr , 注意:注意:該檢驗(yàn)方法是在該檢驗(yàn)方法是在 n 充分大時(shí)使用充分大時(shí)使用的,因而,使用時(shí)要注意的,因而,使用時(shí)要注意 n 必須足夠地大必須足夠地大, 以及以及 npi 不能太小這兩個(gè)條件。不能太小這兩個(gè)條件。 在實(shí)用上,一般要求在實(shí)用上,一般要求 n 50,以及所有,以及所有npi 5。如果初始子區(qū)間劃分不滿足后一個(gè)。如果初始子區(qū)間劃分不滿足后一個(gè)條件條件, 則適當(dāng)?shù)貙⒛承┳訁^(qū)間合并,可使則適當(dāng)?shù)貙⒛承┳訁^(qū)間合并,可使 npi 滿足上述要求。滿足上述要求。69例例1: 在一實(shí)驗(yàn)中在一實(shí)驗(yàn)中, 每隔一定時(shí)間觀察一次由某每隔一定時(shí)間觀察一次由某種鈾

42、所放射到計(jì)數(shù)器上的種鈾所放射到計(jì)數(shù)器上的 粒子數(shù)粒子數(shù)X, 共觀察了共觀察了100次次, 得到結(jié)果如下表得到結(jié)果如下表8.1所示。給定所示。給定 = 0.05, 檢驗(yàn)假設(shè)檢驗(yàn)假設(shè) H0:X 服從泊松分布服從泊松分布 P() .其中其中 fi 是觀測(cè)到有是觀測(cè)到有 i 個(gè)個(gè) 粒子的次數(shù)。粒子的次數(shù)。注:注:XP()表示表示, 0,1,2,.!ieP Xiii70解解: 因因H0中含有未知參數(shù)中含有未知參數(shù) , ,所以應(yīng)先估計(jì)該所以應(yīng)先估計(jì)該參數(shù)。由極大似然估計(jì)法,得參數(shù)。由極大似然估計(jì)法,得 在在H0成立前提下,成立前提下,X 可能的取值為可能的取值為0,1,2, ,將該集合分成將該集合分成A0

43、=0,A1=1,, , A11=11,A A1212=12,13,=12,13,,則,則 PX=i=pi 的估計(jì)為的估計(jì)為4.2.x4.2111214.2,0,1,2,11;!1210.002.iiiiepP XiiipP Xp 將檢驗(yàn)統(tǒng)計(jì)量計(jì)算用數(shù)據(jù)填入下表,得將檢驗(yàn)統(tǒng)計(jì)量計(jì)算用數(shù)據(jù)填入下表,得 71 55iinpnp其其中中一一些些,將將這這些些組組進(jìn)進(jìn)行行適適當(dāng)當(dāng)合合并并,使使得得每每組組的的,如如上上表表的的第第4 4列列的的花花括括號(hào)號(hào)所所示示。722226=1, 1 6 106.281 100=(0.05)12.529, krkr 并并組組后后 8 8。而而此此處處 故故分分布布自

44、自由由度度為為= = 。而而所以,在所以,在 = 0.05下下, 接受原假設(shè),可以認(rèn)為接受原假設(shè),可以認(rèn)為數(shù)據(jù)服從泊松分布數(shù)據(jù)服從泊松分布。73例例2: 自自1965年年1月月1日至日至1971年年2月月9日共日共2231天中天中, 全世界記錄到里氏全世界記錄到里氏4級(jí)或級(jí)或4級(jí)以上地震共級(jí)以上地震共計(jì)計(jì)162次,相繼兩次地震間隔天數(shù)次,相繼兩次地震間隔天數(shù)X統(tǒng)計(jì)如下統(tǒng)計(jì)如下:給定給定 = 0.05, 檢驗(yàn)假設(shè)檢驗(yàn)假設(shè)X服從指數(shù)分布。服從指數(shù)分布。解解: 根據(jù)題意,檢驗(yàn)假設(shè):根據(jù)題意,檢驗(yàn)假設(shè):H0 :X服從指數(shù)服從指數(shù)分布,即分布,即X有概率密度函數(shù)有概率密度函數(shù) 1/,0,( ) 0,0.

45、xexf xx74 在這里,在這里,H0中含有未知參數(shù)中含有未知參數(shù), ,應(yīng)先估計(jì)。應(yīng)先估計(jì)。由極大似然估計(jì)法,得由極大似然估計(jì)法,得 在在H0成立前提下,成立前提下,X 可能的取值為可能的取值為0, ), 將將其分成其分成 A1=0, 4.5),A2=4.5, 9.5), , , A9=39.5, ),則則 P(Ai)=pi 的估計(jì)為的估計(jì)為223113.77.162x11/(), 1,2,9.iiaxiiapP Aedxi其中其中Ai=ai, ai+1),i=1,2 ,9,9。75 55iinpnp將將的的第第8 8組組合合并并到到第第9 9組組中中,使使得得每每組組的的,如如上上表表的的

46、第第4 4列列的的花花括括號(hào)號(hào)所所示示。得得226 163.5536 162=(0.05)12.529, 故,在故,在 = 0.05下下, 接受原假設(shè),即認(rèn)為接受原假設(shè),即認(rèn)為數(shù)據(jù)服從指數(shù)據(jù)服從指數(shù)分布數(shù)分布。76例例3: 為檢驗(yàn)棉紗的拉力強(qiáng)度為檢驗(yàn)棉紗的拉力強(qiáng)度 X (單位單位: kg) 服從服從正態(tài)分布,從一批棉紗中隨機(jī)抽取正態(tài)分布,從一批棉紗中隨機(jī)抽取300條進(jìn)行條進(jìn)行拉力試驗(yàn),結(jié)果列在表拉力試驗(yàn),結(jié)果列在表8.2中。給定中。給定 = 0.01,檢檢驗(yàn)假設(shè)驗(yàn)假設(shè) H0:拉力強(qiáng)度:拉力強(qiáng)度 X N(, 2) .77解:解:本例中,并未給出各觀測(cè)值本例中,并未給出各觀測(cè)值 Xi 的具體值的具

47、體值,只給出了各觀測(cè)值的取值范圍,這樣的數(shù)據(jù)只給出了各觀測(cè)值的取值范圍,這樣的數(shù)據(jù)稱為區(qū)間數(shù)據(jù)。樣本均值與樣本方差可通過稱為區(qū)間數(shù)據(jù)。樣本均值與樣本方差可通過下列式計(jì)算:下列式計(jì)算:. 211 21 1221211kiiiikiiiiXnaannSaannX,.26. 01 41. 1 ),( 22222SnnXN,為為極極大大似似然然估估計(jì)計(jì)的的和和,對(duì)對(duì)正正態(tài)態(tài)總總體體78 (1). 先將數(shù)據(jù)先將數(shù)據(jù) Xi 分成分成13組,每組落入一個(gè)區(qū)組,每組落入一個(gè)區(qū) 間,區(qū)間的端點(diǎn)為:間,區(qū)間的端點(diǎn)為: . 18. 2 78. 0 64. 0 1312210aaaaa,(2). 計(jì)算數(shù)據(jù)落入各子區(qū)間

48、的理論頻數(shù)。計(jì)算數(shù)據(jù)落入各子區(qū)間的理論頻數(shù)。因分布中含有兩個(gè)未知參數(shù),所以,理論因分布中含有兩個(gè)未知參數(shù),所以,理論頻數(shù)只能近似地估計(jì)。落入第頻數(shù)只能近似地估計(jì)。落入第 i 個(gè)子區(qū)間個(gè)子區(qū)間Ii 的理論頻數(shù)的估計(jì)為的理論頻數(shù)的估計(jì)為 , 其中其中 .13 2 1 26. 041. 126. 041. 1) ( 12 ,iaappiiiiipn79,因因0.46 1.85 1.85 0.46 131221pnpnpnpn。見見表表最最后后兩兩組組合合并并成成一一組組我我們們將將前前兩兩組組和和所所以以,均均大大于于,而而8.3)( 5 113pnpn80(3). 計(jì)算數(shù)據(jù)落入各子區(qū)間上的實(shí)際頻數(shù)

49、計(jì)算數(shù)據(jù)落入各子區(qū)間上的實(shí)際頻數(shù) fi 。 fi = X1, X2, , Xn Ii , i=1, 2, , 10 . .15.22 122kiiiipnpnf(4). 計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值因?yàn)橐驗(yàn)?k =10,r =2,所以上述,所以上述 2分布的自分布的自由度為由度為 k- -r- -1=7。由由.48.18)(15.2221rk2(5). H0 的顯著性水平為的顯著性水平為 的檢驗(yàn)的檢驗(yàn) 于是,拒絕原假設(shè),即認(rèn)為棉紗拉力強(qiáng)于是,拒絕原假設(shè),即認(rèn)為棉紗拉力強(qiáng)度不服從正態(tài)分布。度不服從正態(tài)分布。81 孟德爾在關(guān)于遺傳問題的研孟德爾在關(guān)于遺傳問題的研究中,用豌豆做實(shí)驗(yàn)。豌豆有黃

50、究中,用豌豆做實(shí)驗(yàn)。豌豆有黃和綠兩種顏色,在對(duì)它們進(jìn)行兩和綠兩種顏色,在對(duì)它們進(jìn)行兩代雜交之后,發(fā)現(xiàn)一部分雜交豌代雜交之后,發(fā)現(xiàn)一部分雜交豌豆呈黃色,另一部分呈綠色。其豆呈黃色,另一部分呈綠色。其數(shù)目的比例大致是數(shù)目的比例大致是 3:1。 2檢驗(yàn)的一個(gè)著名應(yīng)用例子是孟德爾豌豆檢驗(yàn)的一個(gè)著名應(yīng)用例子是孟德爾豌豆實(shí)驗(yàn)。奧地利生物學(xué)家孟德爾在實(shí)驗(yàn)。奧地利生物學(xué)家孟德爾在1865年發(fā)表的年發(fā)表的論文,事實(shí)上提出了基因?qū)W說,奠定了現(xiàn)代遺論文,事實(shí)上提出了基因?qū)W說,奠定了現(xiàn)代遺傳學(xué)的基礎(chǔ)。他的這項(xiàng)偉大發(fā)現(xiàn)的過程有力地傳學(xué)的基礎(chǔ)。他的這項(xiàng)偉大發(fā)現(xiàn)的過程有力地證明了統(tǒng)計(jì)方法在科學(xué)研究中的作用。因此,證明了統(tǒng)計(jì)

51、方法在科學(xué)研究中的作用。因此,我們有必要在這里將這一情況介紹給大家。我們有必要在這里將這一情況介紹給大家。 82 這只是一個(gè)表面上的統(tǒng)計(jì)規(guī)律。但它啟這只是一個(gè)表面上的統(tǒng)計(jì)規(guī)律。但它啟發(fā)孟德爾去發(fā)展一種理論,以解釋這種現(xiàn)象。發(fā)孟德爾去發(fā)展一種理論,以解釋這種現(xiàn)象。他大膽地假定存在一種實(shí)體,即現(xiàn)在我們稱他大膽地假定存在一種實(shí)體,即現(xiàn)在我們稱為為“基因基因”的東西,決定了豌豆的顏色。這的東西,決定了豌豆的顏色。這基因有黃綠兩個(gè)狀態(tài),一共有四種組合:基因有黃綠兩個(gè)狀態(tài),一共有四種組合: 孟德爾把他的實(shí)驗(yàn)重復(fù)了多次,每次都孟德爾把他的實(shí)驗(yàn)重復(fù)了多次,每次都得到類似結(jié)果。得到類似結(jié)果。(黃黃, 黃黃),(

52、黃黃, 綠綠),(綠綠, 黃黃),(綠綠, 綠綠). 83(黃黃, 黃黃),(黃黃, 綠綠),(綠綠, 黃黃),(綠綠, 綠綠). 孟德爾認(rèn)為孟德爾認(rèn)為, 前三種配合使豆子呈黃色前三種配合使豆子呈黃色,而第四種配合使豆子呈綠色。從古典概率的而第四種配合使豆子呈綠色。從古典概率的觀點(diǎn)看,黃色豆子出現(xiàn)的概率為觀點(diǎn)看,黃色豆子出現(xiàn)的概率為3/4,綠色豆,綠色豆子出現(xiàn)的概率為子出現(xiàn)的概率為1/4。這就解釋了黃綠顏色豆。這就解釋了黃綠顏色豆子之比為什么總是接近子之比為什么總是接近 3:1 這個(gè)觀察結(jié)果。這個(gè)觀察結(jié)果。 孟德爾這個(gè)發(fā)現(xiàn)的深遠(yuǎn)意義是他開辟了孟德爾這個(gè)發(fā)現(xiàn)的深遠(yuǎn)意義是他開辟了遺傳學(xué)研究的新紀(jì)元

53、。下面的例子就是用遺傳學(xué)研究的新紀(jì)元。下面的例子就是用 2檢驗(yàn)來檢驗(yàn)孟德爾提出黃綠顏色豌豆數(shù)目之檢驗(yàn)來檢驗(yàn)孟德爾提出黃綠顏色豌豆數(shù)目之比為比為 3:1的論斷。的論斷。84例例4:孟德爾豌豆試驗(yàn)中,發(fā)現(xiàn)黃色豌豆為孟德爾豌豆試驗(yàn)中,發(fā)現(xiàn)黃色豌豆為25粒粒, 綠色豌豆綠色豌豆11粒,試在粒,試在 =0.05下下, 檢驗(yàn)豌豆檢驗(yàn)豌豆黃綠之比為黃綠之比為3:1。解:解:定義隨機(jī)變量定義隨機(jī)變量 X豌豌豆豆為為綠綠色色. .豌豌豆豆為為黃黃色色,0,1,X我我們們要要檢檢驗(yàn)驗(yàn),記記 . 01 21XPpXPp . 4/14/3 210ppH,:(1). 將將 (- -, ) 分成兩個(gè)區(qū)間分成兩個(gè)區(qū)間 .

54、0.5 ( ) 0.5(21,II85(2). 計(jì)算每個(gè)區(qū)間上的理論頻數(shù),這里計(jì)算每個(gè)區(qū)間上的理論頻數(shù),這里 n = 25+11=36, 不存在要估計(jì)的未知參數(shù)不存在要估計(jì)的未知參數(shù), 故故 . 94)/1 (36 274)/3(3621npnp,(3). 實(shí)際頻數(shù)為,實(shí)際頻數(shù)為,f1=25, f2=11 .(4). 計(jì)算統(tǒng)計(jì)量的值計(jì)算統(tǒng)計(jì)量的值.592. 0 9)911(27)2725( 222122iiiinpnpf86.841. 3)05. 0()( 0.592 0.05 2 21212k-k,因因?yàn)闉?5). H0 的顯著性水平為的顯著性水平為 的檢驗(yàn)的檢驗(yàn) 所以,接受原假設(shè),即認(rèn)為豌

55、豆的黃綠所以,接受原假設(shè),即認(rèn)為豌豆的黃綠之比為之比為 3:1 。87例例5:某醫(yī)院一年中出生的嬰兒共計(jì)某醫(yī)院一年中出生的嬰兒共計(jì)1521人人,其其中男嬰中男嬰802人,女嬰人,女嬰719人。給定人。給定 =0.05,試,試問:能否認(rèn)為男嬰、女嬰出生概率相同?問:能否認(rèn)為男嬰、女嬰出生概率相同?解:解:用用 X 表示服從兩點(diǎn)分布的隨機(jī)變量表示服從兩點(diǎn)分布的隨機(jī)變量, X 取取0, 1兩個(gè)值,兩個(gè)值,X=1表示男嬰,表示男嬰, X=0表是女嬰。表是女嬰。則問題就是檢驗(yàn)假設(shè)則問題就是檢驗(yàn)假設(shè) H0:p1 = PX=0=0.5.(1). 將將 (- -, ) 分成兩個(gè)區(qū)間分成兩個(gè)區(qū)間 . ) 0.5

56、( 0.5 (21,II88(2). 計(jì)算每個(gè)區(qū)間上的理論頻數(shù)。因?yàn)閮蓚€(gè)計(jì)算每個(gè)區(qū)間上的理論頻數(shù)。因?yàn)閮蓚€(gè)區(qū)區(qū) 間上的理論概率間上的理論概率 p1= p2=0.5, 而而 n=1521, 故故 . 5 .6075 . 0152121 npnp(3). 各區(qū)間上實(shí)際頻數(shù):各區(qū)間上實(shí)際頻數(shù):f1=802, f2=719 .(4). 計(jì)算統(tǒng)計(jì)量的值計(jì)算統(tǒng)計(jì)量的值.529. 4 5 .760)5 .760719(5 .760)5 .760802(22289.).()(.kk-8413050 0.05 2 212125294,因?yàn)?5). H0 的顯著性水平為的顯著性水平為 的檢驗(yàn)的檢驗(yàn) 所以,拒絕原假設(shè),即認(rèn)為男嬰女嬰出所以,拒絕原假設(shè),即認(rèn)為男嬰女嬰出生概率有顯著差異。生概率有顯著差異。. 473. 01 527. 01521802 12211ppppp的的估估計(jì)計(jì)為為女女嬰嬰出出生生概概率率;的的估估計(jì)計(jì)為為男男嬰嬰出出生生概概率率908.4.2 偏度、峰度檢驗(yàn)偏度、峰度檢驗(yàn) 2檢驗(yàn)雖

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論