第4章 統(tǒng)計(jì)推斷.ppt_第1頁
第4章 統(tǒng)計(jì)推斷.ppt_第2頁
第4章 統(tǒng)計(jì)推斷.ppt_第3頁
第4章 統(tǒng)計(jì)推斷.ppt_第4頁
第4章 統(tǒng)計(jì)推斷.ppt_第5頁
已閱讀5頁,還剩50頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第四章 統(tǒng)計(jì)推斷,第一節(jié) 假設(shè)檢驗(yàn)的方法 第二節(jié) 單個(gè)樣本平均數(shù)假設(shè)測(cè)驗(yàn) 第三節(jié) 兩個(gè)樣本平均數(shù)假設(shè)測(cè)驗(yàn) 第四節(jié) 參數(shù)的區(qū)間估計(jì),學(xué)習(xí)目的,理解假設(shè)檢驗(yàn)與區(qū)間估計(jì)的原理 掌握假設(shè)檢驗(yàn)的步驟 對(duì)實(shí)際問題進(jìn)行統(tǒng)計(jì)測(cè)驗(yàn)及總體參數(shù)估計(jì),第一節(jié) 假設(shè)檢驗(yàn)的方法,統(tǒng) 計(jì) 推 斷 的 概 念,統(tǒng)計(jì)數(shù),抽樣分布,統(tǒng)計(jì)推斷,一. 統(tǒng)計(jì)推斷的概念,統(tǒng)計(jì)推斷:是指根據(jù)已知樣本的特征特性,推斷總體的特征特性。 統(tǒng)計(jì)推斷能排除試驗(yàn)誤差影響,揭示出事物的內(nèi)在規(guī)律。 假設(shè)檢驗(yàn) 參數(shù)估計(jì),2.統(tǒng)計(jì)推斷在統(tǒng)計(jì)方法中的地位,統(tǒng)計(jì)方法,統(tǒng)計(jì)描述,統(tǒng)計(jì)推斷,假設(shè)檢驗(yàn),參數(shù)估計(jì),例 某地區(qū)的當(dāng)?shù)匦←溒贩N一般畝產(chǎn)300kg,其標(biāo)準(zhǔn)差為7

2、5kg,現(xiàn)有某新品種通過25個(gè)小區(qū)的試驗(yàn),計(jì)得其樣本平均產(chǎn)量為每畝330kg, 問新品種產(chǎn)量與當(dāng)?shù)仄贩N產(chǎn)量是否有顯著差異?,實(shí)例,提出假設(shè) 假設(shè)新品種產(chǎn)量與當(dāng)?shù)仄贩N產(chǎn)量無差異,=300,x=330,=300,抽樣分布,+1.96,樣本均值,330,我們是拒絕還是接受=300?,假設(shè)宣稱的敘述為真(假設(shè)新品種產(chǎn)量與當(dāng)?shù)仄贩N產(chǎn)量無差異,即x=330屬于N(300,75)總體),如果推得實(shí)驗(yàn)結(jié)果發(fā)生的可能性很低,則敘述不真。 “小概率原則”是指小概率事件在一次觀測(cè)或試驗(yàn)中一般是不會(huì)發(fā)生的。如果在一次觀測(cè)中,小概率事件居然發(fā)生了,我們就有理由認(rèn)為這個(gè)現(xiàn)象是不合適的。,3.假設(shè)測(cè)驗(yàn)的理論基礎(chǔ),1.假設(shè):

3、對(duì)總體參數(shù)的一種看法 無效假設(shè)(或零假設(shè) null hypothesis 備擇假設(shè)(或?qū)α⒓僭O(shè)alternative hypothesis),二、假設(shè)測(cè)驗(yàn)的步驟,如,假設(shè)我們所研究的樣本是來自指定的總體,這稱為無效假設(shè)。 常表示的形式有:H0:=0 H0:=C H0:1- 2=0 H0:1,什么是無效假設(shè),與無效假設(shè)對(duì)立的假設(shè)。 常表示的形式有:HA:0 HA:C HA:1- 20 HA:1,什么是備擇假設(shè),2.確定顯著水平Significance Level,用來推斷無效假設(shè)否定與否的概率標(biāo)準(zhǔn)叫做顯著水平 研究者根據(jù)試驗(yàn)的要求和試驗(yàn)的結(jié)論的重要性而定 試驗(yàn)中難以控制的因素較多,試驗(yàn)誤差可能較

4、大,則取大值。如果試驗(yàn)耗費(fèi)較大,對(duì)精確度要求較高,不容許反復(fù),則取小值。,=0.05時(shí)否定原假設(shè),稱差異性是顯著的,顯著性檢驗(yàn),=0.01時(shí)否定原假設(shè),稱差異性是極顯著的,3.測(cè)驗(yàn)計(jì)算,1、在無效假設(shè)正確的假定下,依據(jù)統(tǒng)計(jì)數(shù)的抽樣分布,計(jì)算樣本平均數(shù)的出現(xiàn)概率。 2、確定適當(dāng)?shù)臏y(cè)驗(yàn)統(tǒng)計(jì)量 是大樣本還是小樣本 總體方差已知還是未知,(1)已知時(shí)的假設(shè)檢驗(yàn) 在H0:=0成立時(shí)有 (2)未知時(shí)的假設(shè)檢驗(yàn) 當(dāng)n30時(shí)近似服從正態(tài)分布 當(dāng)n30時(shí)服從t分布,4、作出統(tǒng)計(jì)決策,根據(jù)給定的顯著水平,查表得出相應(yīng)的臨界值u ()或u(/2) 將測(cè)驗(yàn)統(tǒng)計(jì)量的值與水平的臨界值進(jìn)行比較 得出接受或拒絕無效假設(shè)的結(jié)論

5、,(1) 提出假設(shè),包括無效假設(shè)和備擇假設(shè)。 (2) 規(guī)定測(cè)驗(yàn)的顯著水平 值。 (3) 在無效假設(shè)確定的情況下,計(jì)算概率。 (4) 統(tǒng)計(jì)推斷。 (5) 生物學(xué)意義說明。,綜合上述,統(tǒng)計(jì)假設(shè)測(cè)驗(yàn)的步驟可總結(jié)如下:,第二節(jié) 單個(gè)樣本平均數(shù)假設(shè)測(cè)驗(yàn),例1, 某地區(qū)的當(dāng)?shù)匦←溒贩N一般畝產(chǎn)300kg,其標(biāo)準(zhǔn)差為75kg,現(xiàn)有某新品種通過25個(gè)小區(qū)的試驗(yàn),計(jì)得其樣本平均產(chǎn)量為每畝330kg, 問新品種產(chǎn)量與當(dāng)?shù)仄贩N產(chǎn)量是否有顯著差異?,1. 假設(shè),先假設(shè)新品種產(chǎn)量與當(dāng)?shù)仄贩N產(chǎn)量無差異,記作 H0:新=原=300kg HA:新原,2. 確定顯著水平,取=0.05,在假定H0成立的前提下進(jìn)行計(jì)算,3. 統(tǒng)計(jì)計(jì)

6、算,查附表2,當(dāng)u=2時(shí),P(概率)界于0.04和0.05之間,即330kg在原抽樣總體中出現(xiàn)的概率小于5%,根據(jù)小概率不可能原理,拒絕H0,接受HA,4. 統(tǒng)計(jì)推斷,5. 生物學(xué)意義說明,新品種產(chǎn)量與當(dāng)?shù)仄贩N產(chǎn)量有顯著差異, 例2 某春小麥良種的千粒重0=34g,現(xiàn)自外地引入一高產(chǎn)品種,在8個(gè)小區(qū)種植,得其千粒重(g)為:35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6,問新引入品種的千粒重是否與當(dāng)?shù)亓挤N有顯著差異?,這里總體 為未知,又是小樣本,故需用t 測(cè)驗(yàn);,1.假設(shè) H0:34g;對(duì)HA: 34g。,2.取顯著水平 =0.05。,3. 概率計(jì)算:,4.

7、統(tǒng)計(jì)推斷:,查附表 ,df=7時(shí),t=2.069t0.05=1.895。故P0.05。,5. 推斷:拒絕H0: 34g ,即新引入品種千粒重顯著高于當(dāng)?shù)亓挤N。,假設(shè)測(cè)驗(yàn)的理論基礎(chǔ)為,“小概率事件實(shí)際不可能原理” 樣本平均數(shù)的抽樣分布,樣本平均數(shù)的抽樣分布,a、從正態(tài)總體抽取的樣本,無論樣本容量多大,其樣本平均數(shù)x的抽樣分布必成正態(tài)分布。 b、不是正態(tài)分布,當(dāng)樣本容量n足夠大時(shí),從這一總體抽出樣本平均數(shù)x的分布趨于正態(tài)分布。 c、不是正態(tài)分布,當(dāng)樣本容量n較小時(shí),樣本平均數(shù)x的分布趨于t分布。,(1)已知時(shí)的假設(shè)檢驗(yàn) 在H0:=0成立時(shí)有 (2)未知時(shí)的假設(shè)檢驗(yàn) 當(dāng)n30時(shí)近似服從正態(tài)分布 當(dāng)n

8、30時(shí)服從t分布,已知普通水稻單株產(chǎn)量符合正態(tài)分布N(250, 2.782)?,F(xiàn)測(cè)得10株雜交水稻單株產(chǎn)量分別為272、200、268、247、267、246、363、216、206、256。問雜交稻單株產(chǎn)量與普通水稻單株產(chǎn)量是否有差異?,兩尾測(cè)驗(yàn)與一尾測(cè)驗(yàn),H0,抽樣分布,接收區(qū),樣本均值,1-,拒絕區(qū),拒絕區(qū),H0,抽樣分布,接收區(qū),樣本均值,1-,拒絕區(qū),臨界值,假設(shè)測(cè)驗(yàn)的兩類錯(cuò)誤,(1)選取適當(dāng)?shù)闹担哼x取數(shù)值小的值,如從5%變?yōu)?%,可以降低犯I型錯(cuò)誤的概率,但是將增大第二類錯(cuò)誤的概率。 (2)增加試驗(yàn)重復(fù)次數(shù):如果顯著水平已固定下來,則改進(jìn)試驗(yàn)技術(shù)和增加樣本容量,提高試驗(yàn)的精確度,可

9、以有效地降低犯第二類錯(cuò)誤的概率。 (3)對(duì)于田間試驗(yàn),由于試驗(yàn)條件不容易控制,試驗(yàn)誤差較大,應(yīng)選取較高值,以降低犯II型錯(cuò)誤的概率。,關(guān)于兩類錯(cuò)誤的討論可總結(jié)如下:,由兩個(gè)樣本平均數(shù)的相差,以測(cè)驗(yàn)這兩個(gè)樣本所屬的總體平均數(shù)有無顯著差異。,測(cè)驗(yàn)方法,成組數(shù)據(jù)的平均數(shù)比較,成對(duì)數(shù)據(jù)的比較,第三節(jié) 兩個(gè)樣本平均數(shù)的假設(shè)測(cè)驗(yàn),(一) 成組數(shù)據(jù)的平均數(shù)比較,1. u檢驗(yàn) 兩個(gè)樣本總體方差已知,或總體方差未知,但為大樣本時(shí)采用,例1 已知早稻佳輻品種2=1.35,用A、B兩種方法取樣,A取15個(gè)樣點(diǎn),平均產(chǎn)量x1=7.69;B法取9個(gè)樣點(diǎn),平均產(chǎn)量x2=8.77。檢驗(yàn)兩種取樣法測(cè)得的小區(qū)產(chǎn)量是否有差異?,

10、2. t檢驗(yàn),在兩個(gè)樣本的總體方差未知(12= 22= 2 ),且為小樣本時(shí),用t檢驗(yàn) 在兩個(gè)樣本的總體方差未知(1222 2 ),且為小樣本時(shí),用近似t檢驗(yàn),兩個(gè)總體方差的檢驗(yàn)F檢驗(yàn),對(duì)于來自于兩個(gè)總體的樣本,其總體方差分別為12和22,從兩個(gè)總體中獨(dú)立抽取容量為n1和n2的樣本,對(duì)應(yīng)樣本的方差分別為S12與S22。 該統(tǒng)計(jì)量服從分子自由度為n1-1,分母自由度n2-1的F分布。,1、它是一種非對(duì)稱分布,取值范圍是(0,+); 2、它有兩個(gè)自由度,求F時(shí),將數(shù)值大的均方放在分子,數(shù)值小的均方放在分母; 3、F分布是隨自由度變化的一簇偏態(tài),不同的自由度決定了F 分布的形狀。,例,某廠家從兩個(gè)供

11、貨商進(jìn)貨,分別是貨物A和貨物B。已經(jīng)列出兩種貨物的樣本數(shù)據(jù),如表所示。問貨物A的重量波動(dòng)是否明顯高于貨物B。,在兩個(gè)樣本的總體方差未知(12= 22= 2 ),且為小樣本時(shí),用t檢驗(yàn),例2 測(cè)得馬鈴薯兩個(gè)品種魯引1號(hào)和大西洋的塊莖干物質(zhì)含量結(jié)果如表,檢驗(yàn)兩個(gè)品種馬鈴薯的塊莖干物質(zhì)含量有無差異? 兩個(gè)品種馬鈴薯干物質(zhì)含量(%),差數(shù)平均數(shù)的標(biāo)準(zhǔn)誤為:,它具有 v =n1。若假設(shè) ,則上式改為:,(二) 成對(duì)數(shù)據(jù)的比較,例4-7 選生長期、發(fā)育進(jìn)度、植株大小和其他方面皆比較一致的兩塊地的紅心地瓜苗配成一對(duì),共有6對(duì)。每對(duì)中一塊地按標(biāo)準(zhǔn)化栽培,另一塊地進(jìn)行綠色有機(jī)栽培,用來研究不同栽培措施對(duì)產(chǎn)量的影

12、響,每塊地瓜產(chǎn)量見表。檢驗(yàn)兩種栽培方式的地瓜產(chǎn)量是否有差異。,表 兩種栽培方法的地瓜產(chǎn)量 單位(kg/畝),第四節(jié) 參數(shù)估計(jì)parameter estimation,參數(shù)估計(jì):所謂參數(shù)估計(jì)根據(jù)樣本統(tǒng)計(jì)量對(duì)總體參數(shù)進(jìn)行估計(jì)。 點(diǎn)估計(jì):將樣本數(shù)據(jù)計(jì)算的統(tǒng)計(jì)量的觀測(cè)值作為總體的參數(shù)估計(jì)值。 區(qū)間估計(jì):是指在一定的概率保證之下,用特征數(shù)估計(jì)總體參數(shù)的可能取值范圍。,一、什么是參數(shù)估計(jì),在點(diǎn)估計(jì)中,用某個(gè)統(tǒng)計(jì)量作為總體參數(shù)的估計(jì)值,如x作為的估計(jì)值。 而區(qū)間估計(jì)中,要求出兩個(gè)統(tǒng)計(jì)量來分別估計(jì)總體參數(shù)的上限和下限,使在區(qū)間L1,L2的概率為1-。 1-稱為置信水平 L1,L2稱為置信區(qū)間,在總體方差 為未知時(shí) 因?yàn)?服從自由度為n-1的t分布,兩尾概率為時(shí),有,置信區(qū)間為:,例1 已算得某春小麥良種在8個(gè)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論