田間試驗(yàn)與統(tǒng)計(jì)分析_第1頁(yè)
田間試驗(yàn)與統(tǒng)計(jì)分析_第2頁(yè)
田間試驗(yàn)與統(tǒng)計(jì)分析_第3頁(yè)
田間試驗(yàn)與統(tǒng)計(jì)分析_第4頁(yè)
田間試驗(yàn)與統(tǒng)計(jì)分析_第5頁(yè)
已閱讀5頁(yè),還剩396頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

田間試驗(yàn)及生物統(tǒng)計(jì)

統(tǒng)計(jì)學(xué)的含義及適用范圍生物統(tǒng)計(jì)學(xué)產(chǎn)生于19世紀(jì),它的產(chǎn)生標(biāo)志著生物科學(xué)研究從經(jīng)驗(yàn)的、定性的描述走向了精確的、定量的刻畫(huà),從經(jīng)驗(yàn)科學(xué)走向了精確科學(xué)?!敖y(tǒng)計(jì)學(xué)是有關(guān)如何搜集、分析客觀現(xiàn)象數(shù)據(jù),以便給出正確認(rèn)識(shí)結(jié)構(gòu)的方法論科學(xué)?!奔矗?jīng)過(guò)對(duì)資料的收集、整理、分析、推論等過(guò)程,將雜亂無(wú)章的各種現(xiàn)象轉(zhuǎn)化為簡(jiǎn)潔有序、可加以解釋的信息。統(tǒng)計(jì)更重要的是工具、方法論,而各學(xué)科和實(shí)際領(lǐng)域都需要了解和運(yùn)用這一工具、方法。“理論統(tǒng)計(jì)學(xué)”(“數(shù)理統(tǒng)計(jì)學(xué)”)和“應(yīng)用統(tǒng)計(jì)學(xué)”,或稱“一般統(tǒng)計(jì)學(xué)”和“專門(mén)統(tǒng)計(jì)學(xué)”。前者是學(xué)科體系的理論基礎(chǔ),后者是數(shù)理統(tǒng)計(jì)方法與其他學(xué)科相結(jié)合形成的應(yīng)用體系,即數(shù)理統(tǒng)計(jì)為各應(yīng)用學(xué)科的發(fā)展提供必要的方法,而各應(yīng)用學(xué)科為數(shù)理統(tǒng)計(jì)學(xué)的發(fā)展提供背景及歸宿。統(tǒng)計(jì)學(xué)的含義及適用范圍應(yīng)用范圍包括,政治、經(jīng)濟(jì)學(xué)、社會(huì)學(xué)、行政管理、企業(yè)管理、工業(yè)管理、農(nóng)業(yè)生產(chǎn)、商業(yè)、財(cái)務(wù)管理、會(huì)計(jì)、投資學(xué)、教育學(xué)、生物學(xué)(宏觀與微觀)、心理學(xué)、醫(yī)學(xué)、物理學(xué)、天文學(xué)、氣象學(xué)、地質(zhì)勘探、戰(zhàn)爭(zhēng)....等等學(xué)科領(lǐng)域的應(yīng)用。統(tǒng)計(jì)學(xué)的含義及適用范圍本門(mén)課程的教學(xué)內(nèi)容第一章試驗(yàn)設(shè)計(jì)第二章簡(jiǎn)單試驗(yàn)的統(tǒng)計(jì)分析第三章方差分析第四章相關(guān)與回歸第五章多元線性回歸分析田間試驗(yàn)與統(tǒng)計(jì)方法課程教學(xué)時(shí)數(shù)分配課程內(nèi)容講課實(shí)驗(yàn)習(xí)題小計(jì)田間試驗(yàn)設(shè)計(jì)6學(xué)時(shí)6學(xué)時(shí)描述性統(tǒng)計(jì)4學(xué)時(shí)2學(xué)時(shí)6學(xué)時(shí)分布型的確定4學(xué)時(shí)4學(xué)時(shí)統(tǒng)計(jì)假設(shè)測(cè)驗(yàn)及T測(cè)驗(yàn)4學(xué)時(shí)2學(xué)時(shí)6學(xué)時(shí)方差分析8學(xué)時(shí)4學(xué)時(shí)2學(xué)時(shí)14學(xué)時(shí)相關(guān)分析2學(xué)時(shí)2學(xué)時(shí)4學(xué)時(shí)回歸分析4學(xué)時(shí)2學(xué)時(shí)6學(xué)時(shí)協(xié)方差分析2學(xué)時(shí)2學(xué)時(shí)4學(xué)時(shí)總計(jì)34學(xué)時(shí)12學(xué)時(shí)4學(xué)時(shí)50學(xué)時(shí)本門(mén)課程的教學(xué)內(nèi)容學(xué)習(xí)本課程的要求勤學(xué)、多動(dòng)手;勤問(wèn)、多討論;以專業(yè)為基礎(chǔ),牢記統(tǒng)計(jì)學(xué)是我們的工具學(xué)科,是為專業(yè)服務(wù)的,絕對(duì)不能主賓錯(cuò)位。教科書(shū)及參考書(shū)《田間試驗(yàn)和統(tǒng)計(jì)方法》

南京農(nóng)業(yè)大學(xué)主編

農(nóng)業(yè)出版社《試驗(yàn)設(shè)計(jì)與分析》袁志發(fā)、周靜芋主編

高等教育出版社《SAS基礎(chǔ)及統(tǒng)計(jì)實(shí)例教程》胡小平、王長(zhǎng)發(fā)編著

西安地圖出版社《實(shí)用生物統(tǒng)計(jì)》李松崗編著北京大學(xué)出版社田間試驗(yàn)

是在田間自然的土壤氣候條件下進(jìn)行的生物試驗(yàn)。培養(yǎng)試驗(yàn)

是在人工控制水分、光照、溫度等條件下,采用特殊容器,給予特定環(huán)境下進(jìn)行的研究。統(tǒng)計(jì)分析統(tǒng)計(jì)分析是用數(shù)學(xué)邏輯研究總體變量的方法。它從誤差理論出發(fā),一方面提出控制誤差的具體途徑,幫助確定正確的試驗(yàn)設(shè)計(jì),以減少試驗(yàn)誤差,提高試驗(yàn)工作的精確度;另一方面,它研究誤差出現(xiàn)的規(guī)律性,確定對(duì)各類試驗(yàn)數(shù)據(jù)中誤差的估計(jì)方法,幫助評(píng)定試驗(yàn)結(jié)果的可靠新,使試驗(yàn)者能客觀地認(rèn)識(shí)試驗(yàn)資料,進(jìn)而合理地判斷試驗(yàn)結(jié)果,做出正確的科學(xué)結(jié)論。統(tǒng)計(jì)分析軟件一.試驗(yàn)設(shè)計(jì)與統(tǒng)計(jì)分析課程的內(nèi)容與任務(wù)任務(wù):

講述與試驗(yàn)設(shè)計(jì)和統(tǒng)計(jì)分析相關(guān)的統(tǒng)計(jì)學(xué)基本理論。如總體、樣本、誤差的基本概念,總體與樣本特征數(shù),理論分布與抽樣分布。介紹試驗(yàn)設(shè)計(jì)的基本原理、原則、方法;培養(yǎng)和田間試驗(yàn)設(shè)計(jì)、實(shí)施和管理技術(shù)方法。講解試驗(yàn)結(jié)果的主要統(tǒng)計(jì)分析方法,如統(tǒng)計(jì)假設(shè)檢驗(yàn)、方差分析、回歸與相關(guān)分析等。第一章田間試驗(yàn)法概述

1、田間試驗(yàn)設(shè)計(jì)2、田間調(diào)查及取樣3、數(shù)據(jù)特征1、田間試驗(yàn)設(shè)計(jì)1.1田間試驗(yàn)的要求1.2確定試驗(yàn)類型1.3試驗(yàn)誤差

1、田間試驗(yàn)設(shè)計(jì)1.1田間試驗(yàn)的要求明確目的:試驗(yàn)的預(yù)期結(jié)果。

例如,品種抗病性試驗(yàn)、藥劑效果試驗(yàn)等。試驗(yàn)設(shè)計(jì)要求:試驗(yàn)條件的均一性(代表性)、試驗(yàn)的可重復(fù)性、試驗(yàn)結(jié)果的可靠性。1、田間試驗(yàn)設(shè)計(jì)1.2確定試驗(yàn)類型概念:

因素:試驗(yàn)研究的對(duì)象。

水平(處理):在一個(gè)試驗(yàn)因素內(nèi)所設(shè)立的級(jí)別。

重復(fù):每個(gè)處理(水平)的操作次數(shù)。試驗(yàn)類型:

單因素、多因素、綜合試驗(yàn)。說(shuō)明單因素試驗(yàn)僅研究某一個(gè)問(wèn)題,如施肥對(duì)產(chǎn)量的影響,可以包含肥料的不同等級(jí)。優(yōu)點(diǎn):試驗(yàn)簡(jiǎn)單,容易分析、但是不能了解各因素之間的關(guān)系。多因素試驗(yàn)中包含了不同因素及不同水平的組合。優(yōu)點(diǎn):便于了解各因素之間的相互關(guān)系,試驗(yàn)復(fù)雜,設(shè)計(jì)不妥時(shí)不便于分析。綜合試驗(yàn)是在進(jìn)行多因素研究之后,將重要因素重新組合,進(jìn)行試驗(yàn)分析,各因素的水平不需要構(gòu)成平衡處理。1、田間試驗(yàn)設(shè)計(jì)1.3試驗(yàn)誤差概念:觀察值與真值的差異。類型:隨機(jī)誤差和系統(tǒng)誤差。隨機(jī)誤差:不確定因素造成的誤差;系統(tǒng)誤差:由于設(shè)備或人為偏好造成引起。韋伯-費(fèi)赫納定律(Weber,F.H.&Fechner,G.T)。減少誤差的方法:

隨機(jī)化排列、設(shè)置重復(fù)、局部控制。

1、田間試驗(yàn)設(shè)計(jì)絕不允許發(fā)生錯(cuò)誤,盡量減少試驗(yàn)誤差隨機(jī)化排列重復(fù)

I重復(fù)

IIbcdefgck2ckckheabcfgdaabcdefghck1、田間試驗(yàn)設(shè)計(jì)ckabcgedf利用查表或產(chǎn)生隨機(jī)數(shù)的方法進(jìn)行設(shè)計(jì)ck2局部控制1、田間試驗(yàn)設(shè)計(jì)abcdefck設(shè)置重復(fù)隨機(jī)化排列局部控制消除系統(tǒng)誤差,無(wú)偏試驗(yàn)誤差估計(jì)估計(jì)和降低隨機(jī)誤差與隨機(jī)化結(jié)合分離系統(tǒng)誤差降低隨機(jī)誤差提高準(zhǔn)確度和精確度保證統(tǒng)計(jì)推斷的可靠性試驗(yàn)設(shè)計(jì)的原則1、田間試驗(yàn)設(shè)計(jì)End韋伯-費(fèi)赫納定律實(shí)驗(yàn)證明在刺激強(qiáng)度按幾何級(jí)數(shù)增加時(shí),感覺(jué)強(qiáng)度僅只按算術(shù)級(jí)數(shù)增加。HorsfallandBarrat(1945)注意到在病組織尚未發(fā)展到全體的50%以前,人們注意的是病組織;一旦病組織超過(guò)50%以后,注意的往往是剩余的健康部分。HindIII

介導(dǎo)轉(zhuǎn)化體因素與水平因素等級(jí)10N15N20N25N重復(fù)I重復(fù)II重復(fù)III因素肥料N肥料P肥料K水平5810369135重復(fù)I重復(fù)II重復(fù)III參考書(shū)第一章試驗(yàn)設(shè)計(jì)與描述性統(tǒng)計(jì)

fieldexperimentdesignanddiscriptiveStat.

基本概念(BasicConcepts)第一節(jié)試驗(yàn)設(shè)計(jì)(experimentdesign)第二節(jié)描述性統(tǒng)計(jì)(discriptiveStat.)基本概念(Basic

Concepts)總體(population):具有共同性質(zhì)的個(gè)體所組成的集團(tuán)。分為有限總體和無(wú)限總體。樣本(Sample):從總體中抽出的若干個(gè)個(gè)體組成樣本。觀察值(ObservedValue):每一個(gè)體的某一性狀、特性的測(cè)定數(shù)值。變數(shù)(Variable):凡表現(xiàn)出變異的觀察值稱為變數(shù)。參數(shù)(Parameter):由總體的全部觀察值而計(jì)算得到的總體特征數(shù),如總體平均數(shù)等。統(tǒng)計(jì)數(shù)(Statistic):測(cè)定樣本中的各個(gè)體而得到的特征數(shù),如樣本平均數(shù)等。

7.隨機(jī)樣本(RandomSample):從總體中隨機(jī)抽取的樣本。水平(Level):因素內(nèi)設(shè)置的不同處理級(jí)別。處理(Treatment):幾個(gè)因素不同水平的組合。準(zhǔn)確度(Accuracy):同一處理的觀察值與其真實(shí)值的接近程度。精確度(Precision):同一處理的重復(fù)觀察值間彼此接近程度。試驗(yàn)單元(ExperimentalUnit):是指接受某種處理的最小的一個(gè)獨(dú)立的試驗(yàn)材料單位。如一張葉片、一個(gè)果實(shí)、一個(gè)枝條、一個(gè)植株等。13.誤差(Error):觀察值與處理真實(shí)值間的偏離程度。14.系統(tǒng)誤差(SystematicError):觀察值與處理真實(shí)值間出現(xiàn)有一定方向的系統(tǒng)偏離,如供試材料的遺傳背景、儀器等方面存在的可辨識(shí)的差別所造成的誤差。隨機(jī)誤差(RandomError):觀察值與處理真實(shí)值間出現(xiàn)的大小、方向不同的微小差異。如在試驗(yàn)單元、管理方法、操作方法等方面存在的不可辨識(shí)的差別所造成的誤差。樣本含量(SampleSize/Capacity):樣本中所包含的個(gè)體數(shù)目。第一節(jié)試驗(yàn)設(shè)計(jì)experimentdesign試驗(yàn)和實(shí)驗(yàn)試驗(yàn)是在人為控制條件下有目的地進(jìn)行的一種實(shí)踐活動(dòng)。一、試驗(yàn)類型(一)田間試驗(yàn)溫室試驗(yàn)實(shí)驗(yàn)室試驗(yàn)皿內(nèi)試驗(yàn)人工氣候室內(nèi)試驗(yàn)等等二、試驗(yàn)的基本要求:目的明確結(jié)果可靠試驗(yàn)條件有代表性試驗(yàn)結(jié)果能夠重復(fù)精確度準(zhǔn)確度●●●●●即準(zhǔn)確又精確●●●●●準(zhǔn)確而不精確●●●●●即不準(zhǔn)確又不精確●●●●●精確而不準(zhǔn)確試驗(yàn)?zāi)P凸┰圀w輸入處理輸出試驗(yàn)指標(biāo)隨機(jī)干擾Fig.1GeneralmodelofexperimentUxFig.1Mathematicalmodelofexperiment

離散的測(cè)定幾個(gè)點(diǎn),采用統(tǒng)計(jì)學(xué)的方法經(jīng)驗(yàn)的估計(jì)x=f(U)(如上圖所示),顯然觀測(cè)點(diǎn)未必都在曲線上。如果估計(jì)出了x=f(U),我們就掌握了x隨U而變化的規(guī)律,就可以進(jìn)行預(yù)測(cè)和控制。三、處理設(shè)計(jì)田間試驗(yàn)按試驗(yàn)小區(qū)大小、試驗(yàn)?zāi)攴?、試?yàn)地點(diǎn)等可分為若干類,但最基本的是根據(jù)試驗(yàn)因素可將田間試驗(yàn)分為:?jiǎn)我蛩卦囼?yàn)(Single-factorexperiment)僅研究某一個(gè)問(wèn)題,如施肥對(duì)產(chǎn)量的影響,可以包含肥料的不同等級(jí)。優(yōu)點(diǎn):試驗(yàn)簡(jiǎn)單,容易分析、但是不能了解各因素之間的關(guān)系。多因素試驗(yàn)(Multiple-factorexperiment)中包含了不同因素及不同水平的組合。優(yōu)點(diǎn):便于了解各因素之間的相互關(guān)系,試驗(yàn)復(fù)雜,設(shè)計(jì)不妥時(shí)不便于分析。綜合試驗(yàn)(Comprehensiveexperiment)是在進(jìn)行多因素研究之后,將重要因素重新組合,進(jìn)行試驗(yàn)分析,各因素的水平不需要構(gòu)成平衡處理。四、試驗(yàn)單元的排列方式

試驗(yàn)設(shè)計(jì)的目的是避免系統(tǒng)誤差,縮小隨機(jī)誤差,以保證試驗(yàn)的準(zhǔn)確度和精確度。試驗(yàn)設(shè)計(jì)的三個(gè)基本原理:重復(fù)(Replication):重復(fù)的作用(1)若試驗(yàn)中沒(méi)有系統(tǒng)誤差存在,只有隨機(jī)誤差,則可用處理多次重復(fù)觀察值間的參差不棄程度來(lái)估計(jì)隨機(jī)誤差。只有1次重復(fù)就無(wú)法估計(jì)隨機(jī)誤差(2)同一處理多次觀察值的平均值是處理真值的最好估計(jì)。隨機(jī)化(Randomization):通過(guò)試驗(yàn)單元的隨機(jī)化排列來(lái)消除試驗(yàn)單元間的系統(tǒng)誤差。局部控制(Localcontrol):將整個(gè)試驗(yàn)空間分成若干個(gè)各自相對(duì)均勻的局部(區(qū)組),所以的區(qū)組構(gòu)成區(qū)組因素。作用(1)可將系統(tǒng)誤差分離出來(lái)增加準(zhǔn)確度;(2)區(qū)組內(nèi)保證試驗(yàn)單元的一致性,增加精確度。隨機(jī)化排列重復(fù)

I重復(fù)

IIbcdefgck2ckckheabcfgdaabcdefghck1、田間試驗(yàn)設(shè)計(jì)ckabcgedf利用查表或產(chǎn)生隨機(jī)數(shù)的方法進(jìn)行設(shè)計(jì)ck2五、局部控制1、田間試驗(yàn)設(shè)計(jì)abcdefck設(shè)置重復(fù)隨機(jī)化排列局部控制消除系統(tǒng)誤差,無(wú)偏試驗(yàn)誤差估計(jì)估計(jì)和降低隨機(jī)誤差與隨機(jī)化結(jié)合分離系統(tǒng)誤差降低隨機(jī)誤差提高準(zhǔn)確度和精確度保證統(tǒng)計(jì)推斷的可靠性試驗(yàn)類型(二)

試驗(yàn)設(shè)計(jì)可以歸納為全面實(shí)施試驗(yàn)和部分實(shí)施試驗(yàn)兩種類型。全面實(shí)施試驗(yàn)分為順序排列的試驗(yàn)設(shè)計(jì)和隨機(jī)排列的試驗(yàn)設(shè)計(jì)兩大類。前者常用在處理數(shù)量大、精確度要求不高、不須作統(tǒng)計(jì)推斷的預(yù)備試驗(yàn),容易發(fā)生系統(tǒng)誤差;后者強(qiáng)調(diào)有合理的試驗(yàn)誤差估計(jì),常用于對(duì)精確度要求較高的試驗(yàn)。全面實(shí)施試驗(yàn)(全因子試驗(yàn))一、順序排列的試驗(yàn)設(shè)計(jì)對(duì)比法設(shè)計(jì)(contrastdesign)常用于少數(shù)處理試驗(yàn)及示范性試驗(yàn),其試驗(yàn)單元排列特點(diǎn)是處理單元直接排列在對(duì)照區(qū)旁邊,使每一小區(qū)可與其鄰旁的對(duì)照區(qū)直接比較。IIIIII1CK23CK45678CKCK7CK81CK23456CKCK5CK67CK81234CKCK2.間比法設(shè)計(jì)(intervalcontrastdesign)常用處理試驗(yàn)單元較多的試驗(yàn),要求不高,但用隨機(jī)區(qū)組排列有困難的試驗(yàn)。其試驗(yàn)單元排列特點(diǎn)是第一個(gè)小區(qū)和末尾小區(qū)一定是對(duì)照,每二個(gè)對(duì)照之間排列相同數(shù)目的處理小區(qū),通常是4或9個(gè),重復(fù)2-4次。CKCKCKCK12345678910111212個(gè)小麥品種的間比法排列二、隨機(jī)排列的試驗(yàn)設(shè)計(jì)完全隨機(jī)設(shè)計(jì)(completelyrandomdesign)將各個(gè)處理隨機(jī)分配到各個(gè)試驗(yàn)單元(或小區(qū))中,每一個(gè)處理的重復(fù)數(shù)可以相等或不相等。這種設(shè)計(jì)靈活機(jī)動(dòng),單因素和多因素均可使用。2.隨機(jī)區(qū)組設(shè)計(jì)(randomizedblocksdesign)亦稱完全隨機(jī)區(qū)組設(shè)計(jì)(randomcompleteblockdesign)根據(jù)局部控制的原則將試驗(yàn)地劃分為等于重復(fù)次數(shù)的區(qū)組,一個(gè)區(qū)組安排一個(gè)重復(fù),區(qū)組內(nèi)各處理都獨(dú)立隨機(jī)排列。主要特點(diǎn)(1)簡(jiǎn)單;(2)適應(yīng)性廣;(3)能提供無(wú)偏的誤差估計(jì),降低誤差;(4)對(duì)試驗(yàn)地形要求不嚴(yán)格;(5)試驗(yàn)的處理數(shù)目一般不要超過(guò)20。74211317368548732164524887566532IIIIIIIV肥力梯度:8個(gè)品種4次重復(fù)的隨機(jī)區(qū)組排列3.拉丁方設(shè)計(jì)(latinsquaredesign)將各個(gè)處理從縱橫兩個(gè)方向排列為區(qū)組(或重復(fù)),使每一個(gè)處理在每一列和每一行中出現(xiàn)的次數(shù)相等(通常一次)。所以它比隨機(jī)區(qū)組多一個(gè)方向進(jìn)行局部控制的隨機(jī)排列設(shè)計(jì)。拉丁方設(shè)計(jì)具有雙向控制土壤差異的作用,有較高的精確度,但缺乏伸縮性,適應(yīng)于4-8個(gè)處理的試驗(yàn)設(shè)計(jì)。ABCDEBCDEACDEABDEABCEABCD4.裂區(qū)設(shè)計(jì)(split-plotdesign)是多因素試驗(yàn)的一種設(shè)計(jì)形式。先按一個(gè)因素設(shè)計(jì)主處理小區(qū)(mainplot),然后在這個(gè)主處理小區(qū)內(nèi)引進(jìn)第二個(gè)因素的各個(gè)處理的小區(qū)(副區(qū)或裂區(qū),split-plot)。152541243634362651高低中653231163142465254低中高246532142135461653高中低IIIIII再裂區(qū)設(shè)計(jì)(split-splitplotdesign)若在裂區(qū)試驗(yàn)中需要引進(jìn)第三個(gè)因素時(shí),可以進(jìn)一步裂區(qū),將第三個(gè)因素的各個(gè)處理隨機(jī)排列在裂區(qū)內(nèi)。條區(qū)設(shè)計(jì)(stripblocksdesign)條區(qū)設(shè)計(jì)是裂區(qū)設(shè)計(jì)的一種衍生設(shè)計(jì),當(dāng)要研究的兩個(gè)因素都需要較大的小區(qū)面積,且為了便于觀察和管理,將每個(gè)區(qū)組劃分為縱向長(zhǎng)條形小區(qū),安排第一個(gè)因素的各個(gè)處理,再將各個(gè)區(qū)組劃分為若干個(gè)橫向長(zhǎng)條形小區(qū),安排第二個(gè)因素的各個(gè)處理。部分實(shí)施試驗(yàn)(部分因子試驗(yàn))正交設(shè)計(jì)(orthogonaldesign):兩個(gè)重要的特點(diǎn):(1)每列中因素各水平數(shù)字出現(xiàn)的次數(shù)相等,即整齊可比性;(2)任兩列放在一起,他們的行構(gòu)成一個(gè)有序數(shù)對(duì),這樣的數(shù)對(duì)出現(xiàn)的次數(shù)也相等?;蛘哒f(shuō)任兩列之間的所有可能的水平組合都出現(xiàn),且出現(xiàn)的次數(shù)均等。即均衡分散性。具有這樣特點(diǎn)的數(shù)表稱為正交表。正交表是正交拉丁方的推廣。一般用LN(mk)表示正交表,N為試驗(yàn)次數(shù);k為所能容納的最多因素?cái)?shù);m為每個(gè)因素的水平數(shù)。如L8(27)。

假設(shè)我們要做一個(gè)三因素二水平的試驗(yàn),若已知不需要考慮任何交互作用,可以用L4(23)表,但在這種情況下,誤差項(xiàng)Sse分離不出來(lái),無(wú)法作統(tǒng)計(jì)檢驗(yàn),只能直觀比較哪個(gè)水平好。若存在交互作用,就會(huì)迭加在其它列上,從而得到錯(cuò)誤的結(jié)果。因此,若不能排除存在交互作用的可能,則應(yīng)利用L8(27)表。12345671111111121112222312211224122221152121212621221217221122182212112ColRow表頭設(shè)計(jì):首先將A、B放在第1,2列上,查交互作用表,他們的交互作用AB在第3列,因此,C因素不能放在第3列上,應(yīng)放在第4列上,AC放在第5列上,BC放在第6列上,ABC放在第7列上,真正安排時(shí)只用1,2,4列。若ABC不存在,則第7列可作為誤差e,這樣就得到了表頭設(shè)計(jì)如下:因素ABABCACBCe列號(hào)1234567第二節(jié)描述性統(tǒng)計(jì)一、試驗(yàn)資料的性質(zhì)與分類1.數(shù)量性狀資料(quantitativetrait)采用計(jì)數(shù)和量測(cè)兩種方式所得到的數(shù)據(jù)。間斷性變數(shù)Discontinuousordiscretevariable連續(xù)性變數(shù)continuousvariable小麥基本苗數(shù)、菌落數(shù)、穗數(shù)、分孽數(shù)等等病斑長(zhǎng)度、作物產(chǎn)量、株高、土壤水分含量等等2.質(zhì)量性狀資料(qualitativetrait)觀察而不能量測(cè)性狀,如菌落的顏色、麥穗有無(wú)芒等等。統(tǒng)計(jì)次數(shù)法給分法統(tǒng)計(jì)具有某個(gè)性狀的個(gè)體數(shù)目及具有不同性狀的個(gè)體數(shù)目,按類別計(jì)其次數(shù)或相對(duì)次數(shù)給予每類性狀以相對(duì)數(shù)量的方法,如小麥籽粒有紅白兩種顏色,可用0表示白色,用1表示紅色二、次數(shù)分布表

將試驗(yàn)所得到的大量未加整理的數(shù)據(jù),按觀察值大小或數(shù)據(jù)類別進(jìn)行分組,制成關(guān)于觀察值不同組別或不同分類單位的次數(shù)分布表,就可以看出資料中不同表現(xiàn)的觀察值與其頻率間的規(guī)律性,從而對(duì)資料有一個(gè)初步概念。間斷性資料的整理參見(jiàn)P13例2。2.連續(xù)性資料的整理參加P14例3。3.屬性變數(shù)資料的整理在整理前,將資料按各種質(zhì)量性狀進(jìn)行分類,分類數(shù)等于組數(shù),然后根據(jù)各個(gè)體在質(zhì)量屬性上的具體表現(xiàn),分別歸入相應(yīng)的組中,即可以得到屬性分布的規(guī)律性認(rèn)識(shí)。三、次數(shù)分圖條形圖(bardiagram)適合于間斷性變數(shù)和屬性資料條形圖(bardiagram)適合于間斷性變數(shù)和屬性資料多邊形圖(polygon)適合于連續(xù)性變數(shù)資料方柱形圖(histogram)適合于連續(xù)性變數(shù)資料餅圖(piediagram)適合于間斷性變數(shù)和屬性資料餅圖(piediagram)適合于間斷性變數(shù)和屬性資料四、平均數(shù)算術(shù)平均數(shù)(arithmeticmean),Mean中數(shù)(median)Md眾數(shù)(mode),Mo幾何平均數(shù)(geometricmean),G算術(shù)平均數(shù)的兩個(gè)重要特性:(1)離均差之和等于零。(2)離均差平方和最小。設(shè)a為任意數(shù),但a不等于x的平均數(shù),則(為一定量,但)樣本平均數(shù)一般用表示。n為觀察值的個(gè)數(shù)。總體平均數(shù)一般用表示。N為有限總體中觀察值的個(gè)數(shù)。五、變異數(shù)極差(Range)R=Xmax-Xmin,當(dāng)n≤10時(shí),常采用R來(lái)表示資料的變異度。例如兩個(gè)小麥品種的每穗小穗數(shù)見(jiàn)下表。品種每穗小穗數(shù)總和平均R甲131415171818192122231801810乙16161718181818192020180184

說(shuō)明甲品種級(jí)差較乙品種的大,其變異范圍較大,平均數(shù)的代表較差;乙品種的極差較小,其變異幅度較小,平均數(shù)的代表性較好。極差只是兩個(gè)極端數(shù)據(jù)所決定的,沒(méi)有充分利用資料的全部信息,所以用它代表整個(gè)樣本的變異度是有缺陷的。方差或均方(Variance)用觀察值數(shù)目除離均差平方和(簡(jiǎn)稱平方和)。樣本均方(S2)

總體方差(σ2)

方差是根據(jù)全部觀察值來(lái)度量資料的變異度的,是能夠正確反映資料的變異度的度量方法。標(biāo)準(zhǔn)差(StandardDeviation)是方差的正根值,可以很好的表示資料的變異度,其單位與觀察值的度量單位相同。樣本標(biāo)準(zhǔn)差(S)總體標(biāo)準(zhǔn)差(σ)自由度(degreeoffreedom,所寫(xiě)為DF)解釋之一:對(duì)于一個(gè)具有n個(gè)觀察值的樣本,每個(gè)x與其平均數(shù)比較時(shí),雖然具有n個(gè)離均差,但因受到離均差之和等于0的限制,所以只能有n-1個(gè)是自由的。例如:有5個(gè)觀察值,其4個(gè)的離均差為3,2,-3,6,則第5個(gè)離均差必定為-8,才能保證離均差之和等于0。所以,在估計(jì)其他統(tǒng)計(jì)數(shù)時(shí),如果該統(tǒng)計(jì)數(shù)受K個(gè)條件限制,則其自由度應(yīng)該為n-K。在應(yīng)用上,小樣本一定要用自由度來(lái)估算標(biāo)準(zhǔn)差;若為大樣本,因n和n-1相差較小,可直接用n作除數(shù),但大樣本的界限沒(méi)有統(tǒng)一規(guī)定,一般以30以上為大樣本。

比較以上兩式可以發(fā)現(xiàn),樣本標(biāo)準(zhǔn)差不以樣本容量n而以n-1作為除數(shù)。這是因?yàn)橥ǔN覀冎荒苷莆諛颖举Y料,不知道總體平均數(shù)的數(shù)值,不得不用樣本平均數(shù)代替總體平均數(shù)。但由于離均差平方和最小,即解釋之二:因此,采用

計(jì)算出的標(biāo)準(zhǔn)差將失之過(guò)小。將分母用n-1代替,可以避免偏小的弊病,可以做到對(duì)總體標(biāo)準(zhǔn)差的較好的估計(jì)。4.變異系數(shù)(CoefficientofVariation,縮寫(xiě)為CV)樣本標(biāo)準(zhǔn)差對(duì)平均數(shù)的百分?jǐn)?shù)。它是一個(gè)不帶單位的純數(shù),表示單位量的變異。例如:兩個(gè)小麥品種主莖高度的測(cè)量結(jié)果分析如下表。品種平均數(shù)標(biāo)準(zhǔn)差變異系數(shù)甲95.09.029.5乙75.08.5011.3若兩個(gè)樣本的單位不同或均數(shù)不同,不能用標(biāo)準(zhǔn)差直接比較。在采用變異系數(shù)表示樣本的變異程度是,宜同時(shí)列舉平均數(shù)和標(biāo)準(zhǔn)差,否則可能引起誤解。例:下面是金槍魚(yú)兩個(gè)樣本的體重,請(qǐng)比較兩個(gè)樣本的差異。表1金槍魚(yú)體重樣本1樣本28.93.19.617.011.29.99.45.19.918.010.93.810.410.011.02.99.721.2n1=9n2=9平均數(shù)為10.11平均數(shù)為10.11

可以看出,兩個(gè)樣本的樣本容量相同,平均數(shù)相同。對(duì)每一個(gè)樣本的觀察值進(jìn)行排序,結(jié)果發(fā)現(xiàn)它們的中數(shù)都為9.9(詳見(jiàn)下表)。表各個(gè)樣本觀察值排序結(jié)果樣本1樣本28.93.19.617.011.29.99.45.19.918.010.93.810.410.011.02.99.721.2n1=9n2=9平均數(shù)為10.11平均數(shù)為10.11Md1=9.9Md2=9.9Range=2.3Range=18.3Variance=0.641Variance=49.851S1=0.80S2=7.06表1金槍魚(yú)體重第二章統(tǒng)計(jì)假設(shè)測(cè)驗(yàn)及T測(cè)驗(yàn)第一節(jié)理論分布與抽樣分布

Samplingdistributions第二節(jié)統(tǒng)計(jì)假設(shè)測(cè)驗(yàn)

Testofstatisticalhypothesis第三節(jié)平均數(shù)的假設(shè)檢驗(yàn)

Testofmeanhypothesis第四節(jié)二項(xiàng)資料的百分?jǐn)?shù)假設(shè)檢驗(yàn)

Testofpercent

hypothesis第五節(jié)參數(shù)的區(qū)間估計(jì)

Estimateofconfidenceinterval第一節(jié)理論分布與抽樣分布

SamplingDistributions1.二項(xiàng)式分布Binomialdistribution2.泊松分布Poissondistribution3.正態(tài)分布NormalDistribution4.抽樣分布Samplingdistribution連續(xù)性資料的數(shù)據(jù)分布1772151979712315924511911913114915216710416121412517521911819217617595136199116165214951588313780138151187126196134206137989712914317917415916513610810114114816816317610219414517375130149150161155111158131189911421491541521631232051491551312091839711981149187131215111186118150155197116254239160172179151198124179135164168169173181188211197175122151171166175143190213192231163159158159177147194227141169124159

水稻產(chǎn)量g/120cm整理結(jié)果

分組數(shù)列組中點(diǎn)值次數(shù)(f)67.5~82.575..282.5~97.590…….797.5~112.5105…….7112.5~127.5120.............13127.5~142.5135...............15142.5~157.5150………………..20157.5~172.5165…….25172.5~187.5180…21187.5~202.5195.............13202.5~217.5210………9217.5~232.5225…3232.5~247.5240..2247.5~262.5255.1總次數(shù)(n)140

1772151979712315924511911913114915216710416121412517521911819217617595136199116165214951588313780138151187126196134206137989712914317917415916513610810114114816816317610219414517375130149150161155111158131189911421491541521631232051491551312091839711981149187131215111186118150155197116254239160172179151198124179135164168169173181188211197175122151171166175143190213192231163159158159177147194227141169124159概率

一般而論,當(dāng)計(jì)算或計(jì)量一系列觀察個(gè)體時(shí),不論周?chē)鷹l件控制得如何嚴(yán)格,這些觀察值總是表現(xiàn)出一定的變異類型,服從一些有規(guī)律的法則。從科學(xué)試驗(yàn)可以看到,這些變異類型多數(shù)表現(xiàn)以平均數(shù)為中心,次數(shù)最多,離平均數(shù)愈遠(yuǎn),次數(shù)愈少,向兩極端值作對(duì)稱的分布;但也有各種不同程度的非對(duì)稱分布稱或偏斜分布。由于變數(shù)的次數(shù)分布有各種類型,因之相應(yīng)地有其各種理論分布或法則。這些理論法則乃科學(xué)試驗(yàn)的實(shí)際變異類型的數(shù)學(xué)模型,是統(tǒng)計(jì)理論的基礎(chǔ)。1、二項(xiàng)式分布binomialdistribution1、二項(xiàng)式分布binomialdistribution計(jì)算二項(xiàng)式的組合公式:n相當(dāng)于樣本數(shù),x相當(dāng)于具有某個(gè)特性的個(gè)體數(shù)。這一分布也稱貝努里分布,并有二項(xiàng)分布

調(diào)查2000株棉花,盲椿象的受害率為35%(p=0.35),則未受害的概率為q=1-0.35=0.65。若每次調(diào)查5株(n=5),則受害1、2、3、4、5株的概率各是多少?其累計(jì)函數(shù)為:受害i次的概率為:二項(xiàng)分布2000株棉花,盲椿象受害概率的計(jì)算結(jié)果受害株數(shù)概率函數(shù)P(y)P(x)F(x)NP(x)P(0)C05×0.350×0.6550.11600.116046.4P(1)C15×0.351×0.6540.31240.4284124.96P(2)C25×0.352×0.6530.33640.7648134.56P(3)C35×0.353×0.6520.18110.945972.44P(4)C45×0.354×0.6510.04880.994719.52P(5)C55×0.355×0.6500.00531.00002.12二項(xiàng)分布每次抽5株,抽N=400次。NP(x)=P(x)×400盲椿象受害的概率函數(shù)圖和累計(jì)概率函數(shù)圖二項(xiàng)分布概率P(y)P(0)P(1)P(2)P(3)P(4)P(5)P(x)F(x)0.11600.11600.31240.42840.33640.76480.18110.94590.04880.99470.00531.0000

若盲椿象的受害率為p=1/2,則未受害的概率q=1-p=1/2,此時(shí)受害概率的分布為p=q的形式。P=q=0.5p=0.35,q=0.65當(dāng)n很大時(shí),既是p≠q,概率函數(shù)也會(huì)呈對(duì)稱分布。二項(xiàng)分布2、泊松分布—二項(xiàng)分布的一種極限分布

Poissondistribution2、泊松分布—二項(xiàng)分布的一種極限分布

Poissondistribution而n又相當(dāng)大(50),足以使np或nq為一個(gè)適當(dāng)大的值,例如界乎0與10之間,這樣二項(xiàng)分布即為一種極限事例,稱泊松概率分布,或簡(jiǎn)稱泊松分布。Poissondistribution

應(yīng)用二項(xiàng)分布時(shí),當(dāng)概率p或q很小,例如小于0.1,泊松分布如果將np=m,接近分布為:

式中,x=1,2,…,∞,為任意項(xiàng)的項(xiàng)數(shù)。m以平均數(shù)估計(jì)。凡觀察次數(shù)n(相當(dāng)大),某事件出現(xiàn)的平均次數(shù)卻很少,則該事件符合泊松分布。泊松分布的平均數(shù)、方差、標(biāo)準(zhǔn)差為:泊松分布

在棉鈴蟲(chóng)產(chǎn)卵盛期調(diào)查2000株棉花,數(shù)據(jù)如表,按照泊松分布計(jì)算各分布概率。x01234nmF18521092810120000.0995Px0.90530.090080.004480.0001480.0000036FN1810.6180.168.960.2960.0072泊松分布3、正態(tài)分布NormalDistribution(二項(xiàng)分布的極限)研究正態(tài)分布的意義:客觀世界的許多現(xiàn)象的數(shù)據(jù)是服從正態(tài)分布規(guī)律的。在適當(dāng)條件下,正態(tài)分布可以用來(lái)作二項(xiàng)分布及其它間斷性變數(shù)或連續(xù)性變數(shù)分布的近似分布。雖然某些總體不作正態(tài)分布,但從總體中隨機(jī)抽出的樣本平均數(shù)及其它一些統(tǒng)計(jì)數(shù)的分布,在樣本容量適當(dāng)大時(shí)仍然趨于正態(tài)分布。正態(tài)分布正態(tài)分布圖正態(tài)分布正態(tài)分布曲線的特點(diǎn):曲線以平均數(shù)為對(duì)稱軸,左右對(duì)稱;算術(shù)平均數(shù)、中數(shù)、眾數(shù)三位合一;正態(tài)分布曲線是以平均數(shù)和標(biāo)準(zhǔn)差的不同而表現(xiàn)為一系列曲線;正態(tài)分布資料的次數(shù)分布表現(xiàn)為多數(shù)次數(shù)集中在算是平均數(shù)附近,距之俞遠(yuǎn),次數(shù)俞少;正態(tài)分布曲線在離開(kāi)平均數(shù)一個(gè)標(biāo)準(zhǔn)差處有拐點(diǎn),且曲線是以x軸為漸進(jìn)線;正態(tài)分布曲線與x軸間的面積為1,任何兩個(gè)x定值間的面積或概率由平均數(shù)和標(biāo)準(zhǔn)差確定。正態(tài)分布以平均數(shù)和標(biāo)準(zhǔn)差不同的正態(tài)分布系列曲線區(qū)間面積或概率μ±1δ0.6827μ±2δ0.9545μ±3δ0.9973μ±1.960δ0.9500μ±2.576δ0.9900正態(tài)分布正態(tài)分布曲線區(qū)間面積或概率的計(jì)算方法:正態(tài)分布曲線區(qū)間(x<a)面積或概率的計(jì)算方法:正態(tài)分布

為了簡(jiǎn)化,一般以一個(gè)新數(shù)U代替x,即將x離開(kāi)其平均數(shù)的差數(shù)以標(biāo)準(zhǔn)差為單位進(jìn)行轉(zhuǎn)換,U稱為正態(tài)離差,經(jīng)轉(zhuǎn)換后的分布為具有平均數(shù)μ=0,標(biāo)準(zhǔn)差δ=1的標(biāo)準(zhǔn)化正態(tài)分布。轉(zhuǎn)換后的正態(tài)分布曲線為:正態(tài)分布例:假定x為一隨機(jī)數(shù)且具有正態(tài)分布特性,平均數(shù)μ為

30,標(biāo)準(zhǔn)差δ為5,請(qǐng)計(jì)算x<26,x<40,26<x<40,x>40時(shí)的概率值。解:查附表2可得:當(dāng)U=-0.8時(shí),F(xiàn)N(x)=0.2119即x≤26的概率為0.2119。計(jì)算x≤40時(shí)得概率值。同理:x≤40時(shí),當(dāng)U=2時(shí),查表得FN(x)==0.9773即x≤40時(shí)的概率為0.9773。正態(tài)分布正態(tài)分布計(jì)算:26<x≤40時(shí)的概率值。

P(x)=P(26<x≤40)=FN(40)-FN(26)=0.9773-0.2119=0.7654計(jì)算:P(x>40)時(shí)的概率值。P(x>40)=1-P(x≤40)

=1-0.9773=0.0227正態(tài)分布4.抽樣分布

Samplingdistribution

統(tǒng)計(jì)數(shù)或統(tǒng)計(jì)量的分布稱為抽樣分布。目的:從樣本推斷總體。(1)從總體到樣本的方向:其目的是研究從總體中抽出所有可能樣本統(tǒng)計(jì)量的分布及其與原總體的關(guān)系。(2)從樣本到總體的方向:用樣本對(duì)總體作出推斷。研究總體和樣本之間的關(guān)系可從兩個(gè)方向進(jìn)行:抽樣方式:(1)復(fù)置抽樣(2)不復(fù)置抽樣抽樣試驗(yàn)方法:(1)直接研究法:從一個(gè)總體抽取樣本而計(jì)算其統(tǒng)計(jì)數(shù)。(2)Monte-Carlo研究法:當(dāng)N或n很大時(shí),直接法研究有困難,可采用從已知概率分布的總體中按擬定樣本容量,用隨機(jī)方法抽出相當(dāng)多的樣本,從這些樣本計(jì)算統(tǒng)計(jì)數(shù),列出其次數(shù)分布表。這些抽樣分布結(jié)果也可以大概證實(shí)總體的參數(shù)和分布律。抽樣分布樣本總體與母體的關(guān)系1.樣本平均數(shù)的抽樣分布平均數(shù)和方差的推導(dǎo)不同樣本容量的樣本平均數(shù)的

抽樣分布n=1n=2n=4n=8

ffff2122122.0122.00122.258182.54102.5036902.751123083263.010303.002667983.2550416383.516563.5078427443.751016381041443124.019764.00110744284.25101643184.516724.5078435284.75504239452105.010505.0026613305.251125885.54225.50361985.758466166166.0166.00166總和31293681324656126244均數(shù)12/3=(4)36/9=(4)324/81=(4)26244/6561=(4)方差8/34/32/31/3總體N=3(2、4、6)樣本容量n=1、2、4、8證明2.樣本總和數(shù)的抽樣分布抽樣分布的平均數(shù)與母總體平均數(shù)的關(guān)系正態(tài)總體抽樣的分布抽樣分布的方差與母總體方差的關(guān)系正態(tài)總體抽樣的分布3.兩個(gè)獨(dú)立隨機(jī)樣本平均數(shù)差數(shù)的抽樣分布該抽樣分布的平均數(shù)與母體的平均數(shù)相等。若兩個(gè)總體各作正態(tài)分布,則其樣本平均數(shù)差數(shù)準(zhǔn)確地遵循正態(tài)分布,無(wú)論樣本容量大或小。該抽樣分布的方差與母體方差的關(guān)系為:兩個(gè)獨(dú)立的樣本平均數(shù)的差數(shù)分布的方差等于兩個(gè)總體的樣本平均數(shù)的方差總和:兩個(gè)獨(dú)立隨機(jī)樣本平均數(shù)差數(shù)的抽樣分布例題:第一個(gè)總體有三個(gè)觀察值2、4、6(N1=3),樣本容量為(n1=2),全部樣本數(shù)為Nn=32=9,總體平均數(shù)μ1=4,總體方差=8/3第二個(gè)總體有兩個(gè)觀察值3、6(N2=2),樣本容量為(n2=3),全部樣本數(shù)為Nn=23=8,總體平均數(shù)μ2=4.5,總體方差兩個(gè)獨(dú)立隨機(jī)樣本平均數(shù)差數(shù)的抽樣分布

(樣本觀察值)f

(樣本觀察值)f2(2,2)123(3、3、3;)133(2,4、4,2;)264(3,6,3、3,3,6、6,3,3)3124(2,6、6,2、4,4)3125(3,6,6、6,3,6、6,6,3)3155(4,6、6,4)2106(6、6、6)166(6,6)16總和936836N1=3,n1=2N2=2,n2=3μ1=4μ1=4.5從兩個(gè)總體抽出樣本平均數(shù)的次數(shù)分布

2、4、6(N1=3)(n1=2),3、6(N2=2)(n2=3)兩個(gè)獨(dú)立隨機(jī)樣本平均數(shù)差數(shù)的抽樣分布樣本平均數(shù)差數(shù)的次數(shù)分布x122223333444455556666總和x234563456345634563456x1-x2-1-2-3-40-1-2-310-1-2210-13210f1331266239932662133172樣本平均數(shù)差數(shù)分布的平均數(shù)和方差x1-x2ff(x1-x2)(x1-x2+0.5)(x1-x2+0.5)2f(x1-x2+0.5)2-41-4-3.512.2512.25-35-15-2.56.2531.25-212-24-1.52.2527.00-118-18-0.50.254.501800.50.254.5112121.52.2527.0025102.56.2531.253133.512.2512.25總72-36150.0兩個(gè)獨(dú)立隨機(jī)樣本平均數(shù)差數(shù)的抽樣分布兩種方法計(jì)算結(jié)果相同兩個(gè)獨(dú)立隨機(jī)樣本平均數(shù)差數(shù)的抽樣分布平均數(shù)差數(shù)的方差算法1平均數(shù)差數(shù)的方差算法2平均數(shù)差數(shù)中心極限定理(CentralLimitTheorem)

從正態(tài)總體抽取樣本,無(wú)論樣本容量大與小,其樣本平均數(shù)的抽樣分布必呈正態(tài)分布,具有平均數(shù)和方差分別為:平均數(shù)的分布一般記為:

當(dāng)總體不是正態(tài)分布的,但它具有δ2和μ,那么,當(dāng)樣本容量n增大時(shí),從該總體抽出的樣本平均數(shù)的抽樣分布亦必趨近正態(tài)分布,具有平均數(shù)μ和方差δ2/n,在實(shí)際應(yīng)用時(shí),當(dāng)n>30時(shí),就可以應(yīng)用這一定理。二項(xiàng)總體抽樣的分布(1).二項(xiàng)總體的分布參數(shù)(2).樣本平均數(shù)抽樣分布(3).樣本綜合數(shù)的抽樣分布(1).二項(xiàng)總體的分布參數(shù)例:一個(gè)總體內(nèi)有5個(gè)個(gè)體,分別為0、1、0、1、1。則:μ=(0+1+0+1+1)÷5=0.6所以μ=pσ2=[(0-0.6)2+(1-0.6)2+……+(0-0.6)2]÷5=0.24(2).樣本平均數(shù)抽樣分布平均數(shù),方差,標(biāo)準(zhǔn)誤,(每次取一個(gè)樣,即:n=1)(3).樣本綜合數(shù)的抽樣分布二項(xiàng)總體抽樣的分布二項(xiàng)總體的平均數(shù)μ=p,方差σ2=p(1-p)=pq標(biāo)準(zhǔn)差為樣本平均數(shù)抽樣分布平均數(shù),方差,標(biāo)準(zhǔn)誤,部分希臘字母的讀音英語(yǔ)讀音英語(yǔ)讀音英語(yǔ)讀音αAlphaκkappaρRhoβBetaλlambdaσSigmaγGammaμMuτTauδDeltaνNuυUpsilouεepsilonξXiφPhiζZetaοOmicronχKaiηetaπpiωomega第二節(jié)統(tǒng)計(jì)假設(shè)測(cè)驗(yàn)Testofstatisticalhypothesis1、統(tǒng)計(jì)假設(shè)測(cè)驗(yàn)的基本步驟2、兩尾測(cè)驗(yàn)與一尾測(cè)驗(yàn)3、假設(shè)測(cè)驗(yàn)的兩類錯(cuò)誤問(wèn)題的提出:試驗(yàn)結(jié)果能否反映實(shí)際情況?概念:

樣本:試驗(yàn)研究的一組數(shù)據(jù)。

表面效應(yīng):觀察到的現(xiàn)象(試驗(yàn)結(jié)果),統(tǒng)計(jì)假設(shè)(statisticalhypothesis):假設(shè)某一試驗(yàn)結(jié)果與原來(lái)設(shè)想的“不一樣”或“一樣”,稱為統(tǒng)計(jì)假設(shè)。統(tǒng)計(jì)假設(shè)測(cè)驗(yàn)(Testofstatisticalhypothesis):先設(shè)置處理(Treatment)(水平Level)無(wú)效(無(wú)效假設(shè)),再依據(jù)假設(shè)的概率大小來(lái)判斷接受或否定該假設(shè)的過(guò)程。統(tǒng)計(jì)推斷是:將試驗(yàn)的表面效應(yīng)與誤差大小相比較,由表面效應(yīng)可能屬于誤差的概率作出推斷的方法。1、統(tǒng)計(jì)假設(shè)測(cè)驗(yàn)的基本步驟1.1提出無(wú)效假設(shè)

無(wú)效假設(shè)(H0Nullhypothesis),H0:μ=μ0

或μ1=μ2,總體平均數(shù)(μ0)

備擇假設(shè)(HAAlternativehypothesis),HA:μ≠μ0

或μ1≠μ2

。1.2確定顯著水平α值

(significancelevel)確定接受區(qū)或否定區(qū)的范圍。記做α=0.05或α=0.01。顯著水平(Significantlevel):用來(lái)測(cè)驗(yàn)假設(shè)的概率標(biāo)準(zhǔn),常用α來(lái)表示,如α=0.01,α=0.05。其取值的大小由我們的試驗(yàn)材料、試驗(yàn)結(jié)果的要求、我們希望最大可容忍的下錯(cuò)誤結(jié)論的危險(xiǎn)性等所決定的。區(qū)間面積或概率μ±1δ0.6827μ±2δ0.9545μ±3δ0.9973μ±1.960δ0.9500μ±2.576δ0.9900α=0.05α=0.011.3區(qū)間估計(jì)(Confidenceintervaltimation)區(qū)間估計(jì)是在一定概率保證下,某一參數(shù)的取值范圍獲得平均數(shù)的抽樣分布,計(jì)算假設(shè)正確的概率一個(gè)樣本與總體的比較用u

測(cè)驗(yàn)。查u

測(cè)驗(yàn)表,要求或1.4依據(jù)“小概率事件實(shí)際不可能發(fā)生”原理接受或否定無(wú)效假設(shè)統(tǒng)計(jì)假設(shè)測(cè)驗(yàn)的幾何學(xué)意義:從方法本質(zhì)來(lái)講,是將統(tǒng)計(jì)數(shù)的分布劃分為接受區(qū)(regionofacceptance)和否定區(qū)(regionofrejection)。前者為接受H0的區(qū)間,后者為否定H0而接受HA的區(qū)間。若實(shí)得結(jié)果落在接受區(qū),就接受H0;反之,則否定H0,而接受HA。μμ+1.96δμ-1.96δ0.950.0250.025接受區(qū)域否定區(qū)域否定區(qū)域在0.05水平上接受或否定H0的幾何意義例題:

某地小麥品種的一般產(chǎn)量為300kg/667m2,標(biāo)準(zhǔn)差為75kg?,F(xiàn)有一新品種試種后產(chǎn)量為330kg/667m2(樣本),試問(wèn)這個(gè)新品種是否較當(dāng)?shù)匾话闫贩N的產(chǎn)量高或不高?分析:μ0=300kg,S=75kg,μ=330kg

。要求判斷μ>μ0或μ≯μ0。分析1:①、觀察從這樣一個(gè)總體中抽出一個(gè)=330kg的樣本所代表的群體(μ)與原群體(μ0)是否一致?②、設(shè)立無(wú)效假設(shè)μ=μ0=300kg。備擇假設(shè)μ≠μ0。

③、如果抽取(μ1)這種可能性很小,我們只能認(rèn)為μ與μ1差別不大,即μ=μ1很可能成立。說(shuō)明在假設(shè)μ=μ1成立的條件下,抽出這樣一個(gè)樣本的事件是一個(gè)小概率事件。④、小概率事件在一次觀察中是不應(yīng)發(fā)生的,但它現(xiàn)在發(fā)生了,一個(gè)合理的解釋是我們的調(diào)查工作有問(wèn)題,出現(xiàn)這個(gè)現(xiàn)象的原因是取樣誤差,即應(yīng)該接受μ=μ0。換句話說(shuō),該新品種的產(chǎn)量與當(dāng)?shù)卦贩N沒(méi)有明顯差異。分析2:①、觀察從這樣一個(gè)總體中抽出一個(gè)=330kg的樣本所代表的群體(μ)與原群體(μ0)是否一致?②、設(shè)立無(wú)效假設(shè)μ=μ0=300kg。備擇假設(shè)μ≠μ0。

③、如果抽取(μ1)這種可能性很大,我們只能認(rèn)為μ與μ1差別不大,即μ=μ1不可能成立。說(shuō)明在假設(shè)μ=μ1成立的條件下,抽出這樣一個(gè)樣本的事件是一個(gè)小概率事件。④、小概率事件在一次觀察中是不應(yīng)發(fā)生的,但它現(xiàn)在發(fā)生了,一個(gè)合理的解釋是我們的調(diào)查工作有問(wèn)題,出現(xiàn)這個(gè)現(xiàn)象的原因是取樣誤差,即應(yīng)該接受μ=μ0。換句話說(shuō),該新品種的產(chǎn)量確實(shí)比當(dāng)?shù)卦贩N的產(chǎn)量高。設(shè)立無(wú)效假設(shè):H0:針對(duì)要考察的內(nèi)容設(shè)立無(wú)效假設(shè)H0:μ=μ0=300kg。設(shè)定的原則為:(1)通過(guò)統(tǒng)計(jì)檢驗(yàn)決定接受或拒絕H0后,可對(duì)問(wèn)題作出明確的回答。(2)要能根據(jù)H0建立統(tǒng)計(jì)量的理論分布。備擇假設(shè):HA:是除H0外的一切可能值的集合。設(shè)定的原則為:(1)應(yīng)包括H0外的一切可能值;(2)如有可能,應(yīng)縮小備擇假設(shè)的范圍以提高檢驗(yàn)精度。確定顯著水平:一般定為α=0.05

計(jì)算:平均數(shù)的標(biāo)準(zhǔn)誤=根據(jù)u測(cè)驗(yàn)公式計(jì)算:因?yàn)閱?wèn)題是調(diào)查樣本是否高于或低于原群體?查表3:當(dāng)u=2時(shí),p概率介于0.04~0.05之間,即p<0.05。結(jié)果分析1、這一試驗(yàn)結(jié)果(kg)屬于抽樣誤差的概率小于5%:或者說(shuō)這一差數(shù)(30kg)不是隨機(jī)誤差,這一樣本(=330)不是假設(shè)總體(μ0=300kg

)中的一個(gè)隨機(jī)樣本,其概率大于95%。2、計(jì)算接受區(qū)和否定區(qū)依據(jù)可知:以上計(jì)算可知:落在()區(qū)間的有95%。如果以5%概率作為接受或否定的H0界限,則以上結(jié)果稱為接受區(qū)(acceptanceregion),否則為否定區(qū)(rejectionregion)。一般將否定或接受的臨界值寫(xiě)作即當(dāng)在區(qū)間為接受H0區(qū)域(95%),否則為否定區(qū)域。同理,在區(qū)間為接受H0區(qū)域(99%),否則為否定區(qū)域。例題中μ0=300kg,S=75kg,μ=330kg

。因之,它的兩個(gè)2.5%概率的否定區(qū)為和即大于329.4和小于270.6的概率只有5%。2、兩尾測(cè)驗(yàn)與一尾測(cè)驗(yàn)試驗(yàn)中考察對(duì)象可能大于或小于原群體的比較稱作兩尾測(cè)驗(yàn)(one-tailedtest),僅考慮大于或小于一種可能的比較稱作一尾測(cè)驗(yàn)(two-tailedtest)。做一尾測(cè)驗(yàn)時(shí),需要將一尾概率乘以2,再查附表3獲得其μ值。例如一尾測(cè)驗(yàn)當(dāng)α=0.5時(shí),查附表p=0.1,μ=1.64

。當(dāng)H0:μ≤μ0時(shí)其否定區(qū)域?yàn)椤荭蹋?.64。當(dāng)H0:μ≥μ0時(shí)其否定區(qū)域?yàn)椤堞蹋?.64。一尾測(cè)驗(yàn)當(dāng)α=0.5時(shí),查附表p=0.1,μα=+1.64或=-1.64。兩尾測(cè)驗(yàn)當(dāng)α=0.5時(shí),查附表p=0.5,μα=1.96。所以,一尾測(cè)驗(yàn)容易否定假設(shè)。例某地區(qū)10年前普查時(shí),13歲男孩子的平均身高為1.51m?,F(xiàn)抽查200個(gè)12.5~13.5歲男孩,身高平均值為1.53,標(biāo)準(zhǔn)差為0.073m。問(wèn)10年來(lái)該地區(qū)男孩子身高是否有明顯增長(zhǎng)?分析:μ=1.51m,=1.53m,S=0.073m。題目要求判斷μ>μ1。分析1:①、觀察從這樣一個(gè)總體中抽出一個(gè)n=200,=1.53,S=0.073的樣本所代表的群體(μ1)與原群體(μ)是否一致?②、設(shè)立無(wú)效假設(shè)μ=μ1=1.51m。備擇假設(shè)μ≠μ1。

③、如果抽取(μ1)這種可能性很小,我們只能認(rèn)為μ與μ1差別不大,即μ=μ1很可能成立。說(shuō)明在假設(shè)μ=μ1成立的條件下,抽出這樣一個(gè)樣本的事件是一個(gè)小概率事件。④、小概率事件在一次觀察中是不應(yīng)發(fā)生的,但他現(xiàn)在發(fā)生了,一個(gè)合理的解釋是我們的調(diào)查工作有問(wèn)題,出現(xiàn)這個(gè)現(xiàn)象的原因是取樣誤差,即應(yīng)該接受μ=μ1。換句話說(shuō),10年來(lái)該地區(qū)男孩子身高是沒(méi)有明顯增長(zhǎng)。分析2:①、觀察從這樣一個(gè)總體中抽出一個(gè)n=200,=1.53,S=0.073的樣本所代表的群體(μ1)與原群體(μ)是否一致?

②、設(shè)立無(wú)效假設(shè)μ=μ1=1.51m。備擇假設(shè)μ≠μ1。

③、如果抽取(μ1)這種可能性很大,我們只能認(rèn)為μ與μ1有差別,即μ=μ1不可能成立。說(shuō)明在假設(shè)μ=μ1成立的條件下,抽出這樣一個(gè)樣本的事件不是一個(gè)小概率事件。

④、小概率事件在一次觀察中是不應(yīng)發(fā)生的,但他現(xiàn)在發(fā)生了,一個(gè)合理的解釋是它本不是小概率事件,是我們把概率弄錯(cuò)了,而算錯(cuò)的原因是我們?cè)谝婚_(kāi)始就做了一個(gè)錯(cuò)誤的假設(shè)μ=μ1。換句話說(shuō),此時(shí)我們應(yīng)該接受備擇假設(shè),認(rèn)為μ>μ1。設(shè)立無(wú)效假設(shè):H0:針對(duì)要考察的內(nèi)容設(shè)立無(wú)效假設(shè)H0:μ=μ1=1.51,或H0:μ≤1.51。設(shè)定的原則為:(1)通過(guò)統(tǒng)計(jì)檢驗(yàn)決定接受或拒絕H0后,可對(duì)問(wèn)題作出明確的回答。(2)要能根據(jù)H0建立統(tǒng)計(jì)量的理論分布。備擇假設(shè):HA:是除H0外的一切可能值的集合。設(shè)定的原則為:(1)應(yīng)包括H0外的一切可能值;(2)如有可能,應(yīng)縮小備擇假設(shè)的范圍以提高檢驗(yàn)精度。確定顯著水平:一般定為α=0.05

因?yàn)閱?wèn)題是調(diào)查樣本是否較原值有明顯增長(zhǎng)?沒(méi)有降低的含義,所以是一尾測(cè)驗(yàn)。

α取0.05

,查附表p=0.1,μ=1.64

因?yàn)镾=0.073,1.64S=0.120,1.51+0.12=1.63,顯然1.53<1.63。計(jì)算:查表3:0.274的范圍在0.08~0.09之間。(1)如果H0是正確的,我們通過(guò)測(cè)驗(yàn)卻否定了它,這就犯了一個(gè)否定正確假設(shè)的錯(cuò)誤,這類錯(cuò)誤稱為第一類錯(cuò)誤(firstkinderrorortypeIerror)或I型錯(cuò)誤。這類錯(cuò)誤只有在否定H

0時(shí)才會(huì)發(fā)生。由于規(guī)定顯著水平為α,故H0為真而被否定的概率僅為α,因此這類錯(cuò)誤又叫α錯(cuò)誤。(棄真)(2)如果H0本身是錯(cuò)誤的,我們通過(guò)測(cè)驗(yàn)卻不能發(fā)現(xiàn)其不真實(shí)性而接受了它,即犯了一個(gè)接受不真實(shí)的H0的錯(cuò)誤,這類錯(cuò)誤稱為第二類錯(cuò)誤(secondkinderrorortypeIIerror)或II型錯(cuò)誤,亦稱為β錯(cuò)誤。β錯(cuò)誤只有在接受H

0時(shí)才會(huì)發(fā)生。(納偽)3、假設(shè)測(cè)驗(yàn)的兩類錯(cuò)誤例:計(jì)算犯二類錯(cuò)誤的概率值β。原玉米地方品種μ0總體,當(dāng)以n=4抽樣時(shí),其y的平均數(shù)是μ0=300,的正態(tài)分布。當(dāng)α=0.05時(shí),其接受區(qū)間的低限為300-1.96×15=270.6,高限為300+1.96×15=329.4?,F(xiàn)一新品系是μ=315,新品系方差與μ0的方差相同的正態(tài)分布,則H0:μ=μ0顯然是錯(cuò)誤的。但μ總體的y的平均數(shù)有相當(dāng)一部分落在μ0分布的接受區(qū)間內(nèi),如下圖所示:犯β錯(cuò)誤的概率示意圖犯β錯(cuò)誤的概率示意圖該區(qū)間的概率為:P1(U1<-2.96)=0.00154P2(U2<0.96)=0.83150故有β=P(μ<0.96)-P(μ<2.96)=0.83150-0.00154=0.83%

說(shuō)明在μ=315時(shí),α=0.05條件下,將有83%的概率接受H0的錯(cuò)誤結(jié)論。

如果將顯著水平提高到0.01,則由于μ0分布接受區(qū)的擴(kuò)大,y的平均數(shù)落入該接受區(qū)的將更多。因而更易接受H0,犯β錯(cuò)誤的概率更大。所以,顯著水平定的過(guò)高,雖然在否定H0時(shí)減少了α錯(cuò)誤,但在接受H0時(shí)卻可能增大β錯(cuò)誤。兩類錯(cuò)誤小結(jié)提高顯著水平,將增加第二類錯(cuò)誤。總體平均數(shù)與假設(shè)平均數(shù)相差愈大,犯第二類錯(cuò)誤的概率小。防止犯錯(cuò)誤的方法是:適當(dāng)增加樣本容量,或減少總體方差。改進(jìn)試驗(yàn)技術(shù)的結(jié)果實(shí)際可以降低總體方差。小結(jié):概念:

樣本、表面效應(yīng)、統(tǒng)計(jì)假設(shè)、統(tǒng)計(jì)假設(shè)測(cè)驗(yàn)、統(tǒng)計(jì)推斷。顯著水平(Significantlevel)統(tǒng)計(jì)假設(shè)測(cè)驗(yàn)的基本步驟

1.無(wú)效假設(shè)(H0Nullhypothesis),H0:μ=μ0

或μ1≠μ2,備擇假設(shè)(HAAlternativehypothesis)。

2.確定顯著水平α值

3.獲得平均數(shù)的抽樣分布,計(jì)算假設(shè)正確的概率

4.依據(jù)“小概率事件實(shí)際不可能發(fā)生”原理接受或否定無(wú)效假設(shè)兩尾測(cè)驗(yàn)與一尾測(cè)驗(yàn)假設(shè)測(cè)驗(yàn)的兩類錯(cuò)誤第三節(jié)平均數(shù)的假設(shè)檢驗(yàn)HypothesisTestingforMean1、tDistribution2、單個(gè)樣本平均數(shù)的假設(shè)測(cè)驗(yàn)3、兩個(gè)樣本平均數(shù)相比較的假設(shè)測(cè)驗(yàn)1、tDistribution

t分布是W.S.Gosset于1908年首先提出的,又稱為學(xué)生氏分布(Student`stdistribution)。它是一組對(duì)稱的密度函數(shù),具有一個(gè)單獨(dú)參數(shù)ν(自由度)的特定分布。t

分布條件:樣本容量不太大(n<30),且σ2為未知。條件:當(dāng)樣本容量不太大(n<30),且σ2為未知。如果以樣本均方S2估計(jì)σ2

,則其標(biāo)準(zhǔn)化離差為:該標(biāo)準(zhǔn)化離差的分布不呈正態(tài),而作t

分布,且具有自由度為ν=n-1。理論上講,當(dāng)v增大時(shí)(v>30),t分布趨向于正態(tài)分布。當(dāng)v→∞時(shí),與正態(tài)分布重合。

式中,S為樣本標(biāo)準(zhǔn)差,n為樣本容量。正態(tài)分布。。正態(tài)分布t分布ν=40。。正態(tài)分布t分布ν=4000.10.20.30.4123-3-2-1正態(tài)分布曲線與t分布曲線的比較2、單個(gè)樣本平均數(shù)的假設(shè)測(cè)驗(yàn)

例:某春小麥良種的千粒重μ0=34g,現(xiàn)自外地引入一高產(chǎn)品種,在8個(gè)小區(qū)種植,得其千粒重為:35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6,問(wèn)新引入品種的千粒重與當(dāng)?shù)亓挤N有無(wú)顯著差異?分析:因總體方差未知,又是小樣本,故需用t

測(cè)驗(yàn)。假設(shè)H0:μ=μ0=34g,HA:μ≠34g。顯著水平α=0.05。依據(jù):μ0=34g查附表4,得t0.05,7=2.365。推斷:接受H0:μ=μ0=34g,即新引進(jìn)品種千粒重與當(dāng)?shù)亓挤N千粒重沒(méi)有顯著差異。|t|=2.069<t0.05,7

,說(shuō)明兩個(gè)平均數(shù)差數(shù)小于P0.05值。計(jì)算結(jié)果t=2.0693、兩個(gè)樣本平均數(shù)相比較的假設(shè)測(cè)驗(yàn)

如果兩個(gè)處理完全隨機(jī)設(shè)計(jì),而處理間的各供試單位彼此獨(dú)立,則不論兩個(gè)處理的樣本容量是否相同,所得數(shù)據(jù)皆為成組數(shù)據(jù)。成組數(shù)據(jù)的平均數(shù)的比較又依兩個(gè)樣本所屬總體方差是否已知和樣本大小而采用不同的測(cè)驗(yàn)方法。(1)成組數(shù)據(jù)的平均數(shù)比較A:σ1,σ2已知,用U測(cè)驗(yàn)。B:σ1,σ2未知,但可假設(shè)δ1=δ2=δ,且兩個(gè)樣本為小樣本時(shí),用t測(cè)驗(yàn)。C:

σ1,σ2未知,但不能假設(shè)δ1=δ2,用t測(cè)驗(yàn)。A:δ1,δ2已知時(shí),用U測(cè)驗(yàn)。例1:已知某小麥品種每平方米產(chǎn)量的方差為0.4斤。今在該品種的一塊地上用A、B兩法取樣,A法取12個(gè)樣點(diǎn),產(chǎn)量為1.2斤/m2;B法取8個(gè)樣點(diǎn),產(chǎn)量為1.4斤/m2。試比較兩法每平方米的產(chǎn)量是否有顯著差異?分析:總體方差已知,故采用U測(cè)驗(yàn)。假設(shè):H0:μ1=μ2;HA:μ1≠μ2。顯著水平:α=0.05。|U|=0.69<1.96,故P>0.05推斷:接受H0,即A、B兩種方法所得的每平方米產(chǎn)量無(wú)顯著差異。B:δ1,δ2未知,但可假設(shè)δ1=δ2=δ,且兩個(gè)樣本為小樣本時(shí),用t測(cè)驗(yàn)。MergedS2例2:調(diào)查某生產(chǎn)隊(duì)每畝30萬(wàn)苗和35萬(wàn)苗的稻田各5塊,得畝產(chǎn)量(斤)X1(30):800840870920850X2(35):900880890890840試測(cè)驗(yàn)兩種密度畝產(chǎn)量的差異顯著性。分析:總體方差未知且為小樣本,故用t

測(cè)驗(yàn)。假設(shè):H0:μ1=μ2;HA:μ1≠μ2顯著水平:α=0.05查表,t0.05,8=2.306因?yàn)閨t|=1.08<t0.05,8,故P>0.05推斷:接受H0,即兩種密度的畝產(chǎn)量沒(méi)有顯著差異。C、δ1,δ2未知,但不能假設(shè)δ1=δ2

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論