第三章理論分布和抽樣分布_第1頁
第三章理論分布和抽樣分布_第2頁
第三章理論分布和抽樣分布_第3頁
第三章理論分布和抽樣分布_第4頁
第三章理論分布和抽樣分布_第5頁
已閱讀5頁,還剩106頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第三章第三章 理論分布和抽樣分布理論分布和抽樣分布 第一節(jié):概率及其計算第一節(jié):概率及其計算 概率論:研究隨機現(xiàn)象規(guī)律性的科概率論:研究隨機現(xiàn)象規(guī)律性的科學(xué)。學(xué)。 統(tǒng)計學(xué):基于實際觀測結(jié)果,利用統(tǒng)計學(xué):基于實際觀測結(jié)果,利用概率論得出的規(guī)律,解釋偶然性概率論得出的規(guī)律,解釋偶然性中所寄寓的必然性。中所寄寓的必然性。兩者都是研究隨機現(xiàn)象,概率論是兩者都是研究隨機現(xiàn)象,概率論是統(tǒng)計學(xué)的基礎(chǔ),統(tǒng)計學(xué)是概率論得統(tǒng)計學(xué)的基礎(chǔ),統(tǒng)計學(xué)是概率論得出規(guī)律在各領(lǐng)域中的實際應(yīng)用。出規(guī)律在各領(lǐng)域中的實際應(yīng)用。一、事件與概率一、事件與概率 事件是指某一事物的每一個現(xiàn)象,或事件是指某一事物的每一個現(xiàn)象,或某項試驗的每一

2、結(jié)果。(試驗中所發(fā)生某項試驗的每一結(jié)果。(試驗中所發(fā)生的現(xiàn)象)。的現(xiàn)象)。分類:分類: 、必然事件:在一定條件組下,必、必然事件:在一定條件組下,必然要發(fā)生的事件。然要發(fā)生的事件。 例:在標準大氣壓下,水加熱到例:在標準大氣壓下,水加熱到100這一組條件實現(xiàn),這一組條件實現(xiàn), 則水沸騰是必則水沸騰是必然事件。然事件。 、不可能事件:在一定條件組下,一、不可能事件:在一定條件組下,一定不能發(fā)生的事件。定不能發(fā)生的事件。 例:在以上條件實現(xiàn),水結(jié)冰這一事例:在以上條件實現(xiàn),水結(jié)冰這一事件,就是不可能事件。件,就是不可能事件。、隨機事件:在一定條件組實現(xiàn)下,、隨機事件:在一定條件組實現(xiàn)下,可能發(fā)生也

3、可能不發(fā)生的事件??赡馨l(fā)生也可能不發(fā)生的事件。例:一粒種子播種后發(fā)芽與否。例:一粒種子播種后發(fā)芽與否。紅花豌豆與白花豌豆雜交,紅花豌豆與白花豌豆雜交,2是紅是紅花?;?。概率的統(tǒng)計定義:概率的統(tǒng)計定義: 假定在相似條件下,重復(fù)進行同一類假定在相似條件下,重復(fù)進行同一類試驗,事件發(fā)生的次數(shù)試驗,事件發(fā)生的次數(shù)a 與總試驗次與總試驗次數(shù)數(shù)n的比數(shù)稱為頻率的比數(shù)稱為頻率a/n,在試驗總次數(shù),在試驗總次數(shù)n逐漸增大時,逐漸增大時, 事件的頻率愈來愈穩(wěn)事件的頻率愈來愈穩(wěn)定地接近定值定地接近定值p,于是定義事件的概,于是定義事件的概率為率為p,并記為,并記為 p(a)=p一個總體的概率值在理論上是存在一個總

4、體的概率值在理論上是存在的,但在一般情況下,無法得到這的,但在一般情況下,無法得到這個數(shù)值,只有通過樣本的頻率來推個數(shù)值,只有通過樣本的頻率來推斷總體概率。因此便以斷總體概率。因此便以n在充分大時在充分大時事件的頻率作為該事件概率事件的頻率作為該事件概率p的近的近似值,即似值,即 (a)=p(a/n)概率的表示:概率的表示: 小數(shù)小數(shù)分數(shù)分數(shù)0p(a)1 p(a)=1 時為必然事件時為必然事件 p(a)=0 時為不可能事件時為不可能事件二、事件間的關(guān)系二、事件間的關(guān)系基本事件基本事件:就是不可能再分的事就是不可能再分的事件。件。復(fù)合事件復(fù)合事件:由若干個基本事件組由若干個基本事件組合而成的事件

5、。合而成的事件。 以以“事件事件”一詞代表隨機事件,并一詞代表隨機事件,并以字母以字母a, b, c. 等表示,以等表示,以u表示表示必然事件,以必然事件,以v代表不可能事件。代表不可能事件。 1.事件事件a與事件與事件b至少有一件發(fā)生至少有一件發(fā)生而構(gòu)成的新事件稱為事件而構(gòu)成的新事件稱為事件a與事件與事件b的的和事件和事件。記作:記作:a+b讀作讀作“或或a發(fā)生,或發(fā)生,或b發(fā)生發(fā)生” 和事件可以推廣到個事件:和事件可以推廣到個事件:a+b+c+.+n表示表示n個事件至少有一個事件至少有一個發(fā)生。個發(fā)生。 2.兩個事件兩個事件a與與b同時發(fā)生而構(gòu)成的同時發(fā)生而構(gòu)成的新事件稱為事件新事件稱為事

6、件a與事件與事件b的的積事件積事件。記作:記作: a.b,讀作,讀作“ab同時發(fā)生同時發(fā)生”積事件可以推廣到多個事件的情形:積事件可以推廣到多個事件的情形:a.b.c.n表示表示n個事件同時發(fā)生個事件同時發(fā)生。 3.兩個事件兩個事件a與與b如果不能同時發(fā)生,即如果不能同時發(fā)生,即a.b=v,那么稱,那么稱a和和b是是互斥事件互斥事件。例:任一玉米株高例:任一玉米株高2.5m以上以上(a) 任一玉米株高任一玉米株高2.0-2.5m(b) a.b:任一玉米株高既高于任一玉米株高既高于2.5m又在又在2.0-2.5m之間。之間。拋硬幣:拋硬幣:a:正面朝上:正面朝上b:反面朝上反面朝上 4.如果事件

7、如果事件a與事件必發(fā)生其一,與事件必發(fā)生其一,但又不可能同時發(fā)生,即:但又不可能同時發(fā)生,即:a+b=u,a.b=v, 那么那么b是是a的的對立事件對立事件,可,可用表示。用表示。 a 5.如果事件如果事件a1、a2.an兩兩互斥,兩兩互斥,且每次試驗必發(fā)生其一,則稱且每次試驗必發(fā)生其一,則稱a1、a2.an為為完全事件系完全事件系。例:袋中有紅、黃、黑、白四種顏色的例:袋中有紅、黃、黑、白四種顏色的球,每次取一個,球,每次取一個,“取到紅球取到紅球”、“取取到黃球到黃球”、“取到黑球取到黑球”、“取到白球取到白球”構(gòu)成完全事件系。構(gòu)成完全事件系。 、如果事件的發(fā)生與否不影響事、如果事件的發(fā)生

8、與否不影響事件的發(fā)生,則稱其件的發(fā)生,則稱其相互獨立相互獨立。例:例:a:第一粒種子發(fā)芽第一粒種子發(fā)芽b:第二粒種子發(fā)芽第二粒種子發(fā)芽三、計算概率的法則三、計算概率的法則法則一法則一: 對立事件的概率:對立事件的概率:若事件若事件a的概率為的概率為p( a),那么其對立事,那么其對立事件的概率為件的概率為 p()=1-p(a) 例:小麥播種后發(fā)芽的概率為例:小麥播種后發(fā)芽的概率為0.9,那么,不發(fā)芽的概率為那么,不發(fā)芽的概率為(1-0.9)=0.1a法則二:法則二: 互斥事件概率的加法:互斥事件概率的加法: 若事件若事件a與事件與事件b是互斥的,概率是互斥的,概率各為各為p(a)和和p(b),

9、那么,那么“a+b ”事件事件的概率為的概率為 p(a+b)=p(a)+p(b)法則三:獨立事件概率的乘法:法則三:獨立事件概率的乘法: 若確定事件若確定事件a的概率時不受到事件的概率時不受到事件b的影響,反之亦然,那么,這兩個的影響,反之亦然,那么,這兩個事件是互相獨立,稱獨立事件。對事件是互相獨立,稱獨立事件。對于這類事件,同時出現(xiàn)這一新事件于這類事件,同時出現(xiàn)這一新事件的概率必為每個事件概率的積。的概率必為每個事件概率的積。 p(a.b)=p(a).p(b)法則四:完全事件系的概率法則四:完全事件系的概率 若若a1,a2.an是完全事件系,是完全事件系,則這則這n個事件的概率之和為個事件

10、的概率之和為1,即,即p(a1+a2+a3+.+an)=p(a1)+p(a2)+.+p(an)=1如果如果n個事件出現(xiàn)的概率是相等的,個事件出現(xiàn)的概率是相等的,那么那么 p(ai)=1/n第二節(jié)總體分布第二節(jié)總體分布一、二項分布一、二項分布(binomial distribution)(一)二項分布的概率函數(shù)(一)二項分布的概率函數(shù)二項總體:有非此即彼事件組成的總二項總體:有非此即彼事件組成的總體。體。二項分布:以容量二項分布:以容量n從二項總體中抽從二項總體中抽樣樣,共有共有n+1種可能的結(jié)果種可能的結(jié)果,每種結(jié)果都每種結(jié)果都有一個固定的概率有一個固定的概率,這種變量取值及其這種變量取值及其

11、概率構(gòu)成的分布稱為二項分布概率構(gòu)成的分布稱為二項分布.種子發(fā)芽試驗:種子發(fā)芽試驗:一粒種子:發(fā)芽概率一粒種子:發(fā)芽概率p、不發(fā)芽概率、不發(fā)芽概率q概率相加得概率相加得(p+q)兩粒種子:兩粒種子: 甲乙均發(fā)芽:概率為甲乙均發(fā)芽:概率為p2 甲發(fā)乙不發(fā):概率為甲發(fā)乙不發(fā):概率為p(1-p)pq 乙發(fā)甲不發(fā):乙發(fā)甲不發(fā):qp 甲乙均不發(fā):甲乙均不發(fā):q2概率相加得概率相加得p2+pq+qp+q2=(p+q)2依此類推,獨立地對依此類推,獨立地對n粒種子進行實粒種子進行實驗,一種結(jié)果出現(xiàn)驗,一種結(jié)果出現(xiàn)x次的概率是:次的概率是:稱為二項分布律或二項概率函數(shù),稱為二項分布律或二項概率函數(shù),是是(p+q

12、)n展開后含有展開后含有p(x)的一的一項這一分布律也稱為貝努里分項這一分布律也稱為貝努里分布布其中,其中,x=0,1,2,n, 為某為某事件出現(xiàn)次數(shù)。事件出現(xiàn)次數(shù)。n為樣本含量為樣本含量,即事件發(fā)生總數(shù)即事件發(fā)生總數(shù).二項分布是說明結(jié)果只有兩種二項分布是說明結(jié)果只有兩種情況的情況的n次獨立實驗中發(fā)生某種次獨立實驗中發(fā)生某種結(jié)果為結(jié)果為x次的概率分布。次的概率分布。 因為(因為(p+q),所以),所以二項分布的累積函數(shù):二項分布的累積函數(shù): 二項分布中某結(jié)果最多發(fā)生二項分布中某結(jié)果最多發(fā)生k次的概率次的概率為發(fā)生為發(fā)生0次、次、1次、次、.、直至、直至k次的概率之和:次的概率之和:(二二)二項

13、分布的應(yīng)用條件二項分布的應(yīng)用條件:(1) 每次實驗只有兩類對立的結(jié)果每次實驗只有兩類對立的結(jié)果;(2) n次事件相互獨立;次事件相互獨立;(3) 每次實驗?zāi)愁惤Y(jié)果的發(fā)生的概每次實驗?zāi)愁惤Y(jié)果的發(fā)生的概率是一個常數(shù)。率是一個常數(shù)。 (三)(三) 二項分布的參數(shù)二項分布的參數(shù)二項分布總體的平均數(shù)和標準差為:二項分布總體的平均數(shù)和標準差為:二項分布常表示為:二項分布常表示為:b(n,p)即:二項分布是由即:二項分布是由n和和p兩個參數(shù)據(jù)兩個參數(shù)據(jù)定的。定的。 (四四)二項分布的形狀二項分布的形狀二項分布的二項分布的形狀形狀有如下特征:有如下特征:(1)二項分布圖形的形狀取決于二項分布圖形的形狀取決于p

14、 和和n 的大??;的大小;(2) 當(dāng)當(dāng)p=0.5時,無論時,無論n的大小,均為的大小,均為對稱分布;對稱分布;(3)當(dāng)當(dāng)p0.5 ,n較小時為偏態(tài)分布較小時為偏態(tài)分布,n較大時較大時逼近正態(tài)分布逼近正態(tài)分布。 一般來說,當(dāng)一般來說,當(dāng)n大于,而大于,而p或或q又不過小(例如不接近于),又不過?。ɡ绮唤咏冢?,且且np及及nq不小于時,可將其不小于時,可將其看作正態(tài)分布看作正態(tài)分布,可用正態(tài)公式求其可用正態(tài)公式求其概率。概率。(五)二項分布的應(yīng)用實例(五)二項分布的應(yīng)用實例 、一批種子的發(fā)芽率為、一批種子的發(fā)芽率為0.8,現(xiàn)每,現(xiàn)每穴播粒,問每穴出三棵苗的概率?穴播粒,問每穴出三棵苗的概率?平

15、均每穴出苗幾棵?平均每穴出苗幾棵?本例中,每穴出苗數(shù)為隨機變本例中,每穴出苗數(shù)為隨機變量量x,它服從,它服從b(5,0.8),故:,故:若計算每穴出苗數(shù)低于若計算每穴出苗數(shù)低于4棵的概率,棵的概率,則計算累積概率:則計算累積概率:p(x3)=p(x=0)+p(x=1)+p(x=2)+p(x=3)平均每穴出苗數(shù):平均每穴出苗數(shù):=np=50.8=4、兩個純合親本雜交、兩個純合親本雜交(rrrr),f1自交,自交,f2的基因型分離比。的基因型分離比。f2中,中,r基因出現(xiàn)的概率基因出現(xiàn)的概率p=0.5,r基因出現(xiàn)的概率基因出現(xiàn)的概率q=0.5一對因子:一對因子:兩對因子:兩對因子:yyrryyrr

16、f2中顯中顯:顯顯:顯顯:顯顯:顯顯3、兩對基因分離:、兩對基因分離:bbrrbbrrf1 bbrrf2 9b-r-:3b-rr:3bbr-:1bbrr問:樣本容量多大時,才能以問:樣本容量多大時,才能以99的概率至少得到一個的概率至少得到一個bbrr個體?個體?解:解:bbrr的概率的概率q=1/16,非非bbrr出現(xiàn)出現(xiàn)概率概率p=15/16。得到。得到bbrr的概率的概率99%,則非則非bbrr為,所以:為,所以: pn=(15/16)n=0.01n(lg15-lg16)=lg0.01n=71.4因此:要以的可能獲得一個因此:要以的可能獲得一個bbrr個體,樣本容量只少為。個體,樣本容量

17、只少為。二、二、poisson分布分布1. poisson分布的概念分布的概念: 二項分布二項分布n很大而很大而p很小時的特殊形很小時的特殊形式。其概率函數(shù)式。其概率函數(shù) x=0,1,2.n,其中,其中e為自然對數(shù)的底,為自然對數(shù)的底,為總體均數(shù),為總體均數(shù),x為事件發(fā)生的次數(shù)。為事件發(fā)生的次數(shù)。 主要描述大量實驗中隨機稀疏主要描述大量實驗中隨機稀疏現(xiàn)象,如:單位面積內(nèi)的昆蟲現(xiàn)象,如:單位面積內(nèi)的昆蟲數(shù)、病斑數(shù)、植物種類、細胞數(shù)、病斑數(shù)、植物種類、細胞計數(shù)、田間雜草分布等。計數(shù)、田間雜草分布等。2. poisson分布的應(yīng)用條件分布的應(yīng)用條件:(1) 兩類結(jié)果要相互對立;兩類結(jié)果要相互對立;(

18、2) n次試驗相互獨立;次試驗相互獨立;(3) n應(yīng)很大應(yīng)很大, p應(yīng)很小。應(yīng)很小。3. poisson分布的參數(shù)分布的參數(shù)方差與平均數(shù)相等,只有一個參方差與平均數(shù)相等,只有一個參數(shù)。數(shù)。 4. poisson分布的性質(zhì)分布的性質(zhì):(1) 均數(shù)與方差相等;均數(shù)與方差相等;(2) 均數(shù)均數(shù)較小時呈偏態(tài)較小時呈偏態(tài),20時近似時近似正態(tài);正態(tài);(3) n很大很大, p很小,很小,np=為常數(shù)時為常數(shù)時二項分布趨近于二項分布趨近于poisson分布;分布;(4) n個獨立的個獨立的poisson分布相加仍分布相加仍符合符合poisson分布分布5、形狀、形狀由由決定:決定:很小時分布很偏,很小時分布

19、很偏,增大后逐漸對稱,趨近于正態(tài)分增大后逐漸對稱,趨近于正態(tài)分布布 三、正態(tài)分布三、正態(tài)分布(normal distribution)(一)正態(tài)分布的密度函數(shù)和分布函(一)正態(tài)分布的密度函數(shù)和分布函數(shù)數(shù)是連續(xù)性變數(shù)的一種理論分布。是連續(xù)性變數(shù)的一種理論分布。許多生物學(xué)產(chǎn)生的數(shù)據(jù)都服從正態(tài)分許多生物學(xué)產(chǎn)生的數(shù)據(jù)都服從正態(tài)分布。布。正態(tài)分布是生物統(tǒng)計學(xué)的重要基礎(chǔ)正態(tài)分布是生物統(tǒng)計學(xué)的重要基礎(chǔ) 對于平均數(shù)為對于平均數(shù)為,標準差為,標準差為的正態(tài)分的正態(tài)分布,其概率密度函數(shù)為:布,其概率密度函數(shù)為:-x 其中:其中:平均數(shù),是曲線最高值的橫坐標,平均數(shù),是曲線最高值的橫坐標,曲線以其為對稱;曲線以其為

20、對稱;標準差,表示曲線展開程度,標準差,表示曲線展開程度,越越大,曲線展開度越大,數(shù)據(jù)越分散;大,曲線展開度越大,數(shù)據(jù)越分散;越小,曲線展開度越小,數(shù)據(jù)越集中;越小,曲線展開度越小,數(shù)據(jù)越集中;有了有了和和,曲線形狀就可以確定下來。,曲線形狀就可以確定下來。,標準差為,標準差為的正態(tài)分布稱的正態(tài)分布稱為標準正態(tài)分布為標準正態(tài)分布(standard normal distribution)。以。以n(,2)表示平均表示平均數(shù)為數(shù)為,標準差為,標準差為的正態(tài)分布;以的正態(tài)分布;以n(,)表示標準正態(tài)分布。表示標準正態(tài)分布。累積分布函數(shù):累積分布函數(shù):(二)正態(tài)分布曲線的特性(二)正態(tài)分布曲線的特性

21、、以、以為原點左右對稱;為原點左右對稱;、x=處處f(x)具有最大值,且具有最大值,且算術(shù)平均數(shù)、中數(shù)、眾數(shù)合于算術(shù)平均數(shù)、中數(shù)、眾數(shù)合于這一點;這一點;、是一個曲線簇,由、是一個曲線簇,由和和確確定:定:確定在確定在x軸上的位置,軸上的位置,確定其變異度;確定其變異度;以平均數(shù)和標準差不同的正態(tài)分布系列曲線、在、在x=1有拐點;有拐點;、x取值范圍是取值范圍是,,但多數(shù)集,但多數(shù)集中在中在附近,離其越遠,次數(shù)越少;附近,離其越遠,次數(shù)越少;且在且在 x- 相等處具有相等次數(shù)。相等處具有相等次數(shù)。、曲線的總面積等于。曲線下任何、曲線的總面積等于。曲線下任何定值之間的面積等于這兩個定值間面定值之

22、間的面積等于這兩個定值間面積占總面積的成數(shù),或者說變量落入積占總面積的成數(shù),或者說變量落入這個區(qū)間內(nèi)的概率。這個區(qū)間內(nèi)的概率。幾個常用區(qū)間與其相應(yīng)的面積或概率幾個常用區(qū)間與其相應(yīng)的面積或概率區(qū)間面積或概率區(qū)間面積或概率 0.68272 0.95453 0.99731.960 0.95002.576 0.9900區(qū)間區(qū)間面積或概率面積或概率10.682720.954530.99731.9600.95002.5760.9900正態(tài)分正態(tài)分布布(三)標準正態(tài)分布(三)標準正態(tài)分布將將x離其平均數(shù)的差數(shù)以離其平均數(shù)的差數(shù)以為單位進為單位進行轉(zhuǎn)換,于是行轉(zhuǎn)換,于是: u為正態(tài)離差??蓪⒁话惴匠剔D(zhuǎn)為為正態(tài)

23、離差。可將一般方程轉(zhuǎn)為標準正態(tài)分布方程。標準正態(tài)分布方程。概率密度函數(shù):概率密度函數(shù):-u (四四)正態(tài)分布區(qū)間概率的計算方法正態(tài)分布區(qū)間概率的計算方法隨機變量落在某區(qū)間隨機變量落在某區(qū)間(a,b)內(nèi)的概率,內(nèi)的概率,可以從標準正態(tài)分布可以從標準正態(tài)分布累積分布累積分布函數(shù)函數(shù)表中查出。對于一般的正態(tài)分布,表中查出。對于一般的正態(tài)分布,先將其化為標準正態(tài)分布再查表先將其化為標準正態(tài)分布再查表 .例:例:u=-0.82, (0.82)0.2061 u=1.15 (u)=0.8749例:隨機變量例:隨機變量u服從服從n (0,1),求其落在,求其落在0,1.21間的概率:間的概率:p(0u1.21

24、)= (1.21)(0)=0.88690.5000=0.3869落在落在-1.96和和1.96之間的概率:之間的概率:p(|u|u)=1-2(-u)=1-2(-1.96) 1-0.0500=0.9500正態(tài)分正態(tài)分布布例:變量例:變量x服從服從n (156.2,4.822),求:求:(1)x164; (3)152x162的概率的概率(1) (161-156.2)/4.82=1 p(x164)=1-p(x164)= p(x-164)=(-u)=(-1.62)=0.0526 (3) u1=(152-156.2)/4.82= -0.87 u2=(162-156.2)/4.82=1.2p(152p16

25、2)= (u2)-(u1) =(1.2)-(-0.87)=0.8849-0.1921=0.6928(五五)正態(tài)分布的單側(cè)分位數(shù)正態(tài)分布的單側(cè)分位數(shù)/臨界值臨界值上面介紹了正態(tài)分布區(qū)間概率的計上面介紹了正態(tài)分布區(qū)間概率的計算方法。即對于給定的算方法。即對于給定的u,通過正,通過正態(tài)分布累積函數(shù)表查態(tài)分布累積函數(shù)表查uu)= 時的時的u值。值。u稱稱為為的上側(cè)分位數(shù)。的上側(cè)分位數(shù)。對于左側(cè)尾區(qū),滿足:對于左側(cè)尾區(qū),滿足:p(uu/2)= 時的時的u/2稱為稱為的雙側(cè)分位數(shù)。的雙側(cè)分位數(shù)。對于單尾表(上側(cè)分位對于單尾表(上側(cè)分位):對于雙尾表對于雙尾表: 第三節(jié)第三節(jié) 抽樣分布抽樣分布(sampli

26、ng distribution) 可從兩個方向研究總體與樣本的關(guān)可從兩個方向研究總體與樣本的關(guān)系:一是總體到樣本,即由已知的總系:一是總體到樣本,即由已知的總體研究樣本的分布規(guī)律;二是從樣本體研究樣本的分布規(guī)律;二是從樣本到總體的方向,即由樣本推斷未知的到總體的方向,即由樣本推斷未知的總體。抽樣分布是研究第一個方向的總體。抽樣分布是研究第一個方向的問題問題,是統(tǒng)計推斷的基礎(chǔ)。是統(tǒng)計推斷的基礎(chǔ)。從一個總體進行隨機抽樣從一個總體進行隨機抽樣:從無限總體中可抽取無限多個隨機樣本。從無限總體中可抽取無限多個隨機樣本。從容量為從容量為n的有限總體的有限總體:樣本容量為樣本容量為n,有,有nn個所有可能樣

27、本。個所有可能樣本。每個樣本可得一平均數(shù):每個樣本可得一平均數(shù): ,構(gòu)成,構(gòu)成一新的總體,平均數(shù)為新總體的變量。每一新的總體,平均數(shù)為新總體的變量。每一平均數(shù)會有差異,所以平均數(shù)新總體也一平均數(shù)會有差異,所以平均數(shù)新總體也有其分布,稱為平均數(shù)的抽樣分布。有其分布,稱為平均數(shù)的抽樣分布。 (一)從一個正態(tài)總體抽出的隨機樣(一)從一個正態(tài)總體抽出的隨機樣本的平均數(shù)分布本的平均數(shù)分布、總體標準差已知時的平均數(shù)分布、總體標準差已知時的平均數(shù)分布u分布分布從一個正態(tài)總體抽出的隨機樣本從一個正態(tài)總體抽出的隨機樣本,無論無論樣本容量大小,其樣本平均數(shù)的抽樣樣本容量大小,其樣本平均數(shù)的抽樣分布必呈正態(tài)分布分布

28、必呈正態(tài)分布若總體不是正態(tài)分布,但具有一定若總體不是正態(tài)分布,但具有一定量的量的和和2,只要樣本容量,只要樣本容量n足夠大足夠大(一般(一般n30),從總體抽出的樣),從總體抽出的樣本平均數(shù)也近似地服從正態(tài)分布本平均數(shù)也近似地服從正態(tài)分布n(,2/n ),稱為中心極限定理。,稱為中心極限定理。 (1)該抽樣分布的平均數(shù)與母總體的平均數(shù)該抽樣分布的平均數(shù)與母總體的平均數(shù)相等相等(2)該抽樣分布的方差與母總體方差間存在該抽樣分布的方差與母總體方差間存在如下關(guān)系:如下關(guān)系: 即:即:標準化:標準化:其中,其中,n為樣本容量,為樣本容量, 是樣本平均數(shù)是樣本平均數(shù)分布的標準差,稱為分布的標準差,稱為標

29、準誤標準誤(差),(差),可以度量抽樣分布的變異可以度量抽樣分布的變異 例:從例:從n3(2,4,6),以以n=1,2,4,8復(fù)置抽復(fù)置抽樣樣n=1n=2n=4n=8 ffff2122122.0122.00122.258182.54102.5036902.751123083263.010303.002667983.2550416383.516563.5078427443.751 016381041443124.019764.001 10744284.251 01643184.516724.5078435284.75504239452105.010505.0026613305.251125885

30、.54225.50361985.758466166166.0166.00166總和31293681324656126244均數(shù)12/3= (4)36/9= (4)324/ 81 =(4)26244 / 6561= (4)方差8/34/32/31/3、總體標準差未知、總體標準差未知(或雖然總體標準或雖然總體標準差已知,但總體不呈正態(tài),且差已知,但總體不呈正態(tài),且n較小較小)時的平均數(shù)分布時的平均數(shù)分布t分布分布總體總體2未知,可以用樣本標準差代替未知,可以用樣本標準差代替總體標準差,標準化變量總體標準差,標準化變量 不服從正態(tài)分布,而是服從自由度為不服從正態(tài)分布,而是服從自由度為n-1的的t分布

31、分布 其中其中 , 為標準誤。為標準誤。 t分布也是一組對稱密度函數(shù)曲線分布也是一組對稱密度函數(shù)曲線分布,它只有一個參數(shù)自由度分布,它只有一個參數(shù)自由度確定其分布。與正態(tài)曲線相比,確定其分布。與正態(tài)曲線相比,t分布曲線稍微扁平,峰頂略低,分布曲線稍微扁平,峰頂略低,尾部稍高。尾部稍高。 理論上,隨著自由度的增大,理論上,隨著自由度的增大,t 分分布趨于正態(tài)分布:布趨于正態(tài)分布:30時接近正時接近正態(tài)曲線,態(tài)曲線,時,與正態(tài)曲線合時,與正態(tài)曲線合一。一。正態(tài)分布正態(tài)分布t分布分布40。正態(tài)分布正態(tài)分布t分布分布4000.10.20.30.4123-3-2-1正態(tài)分布曲線與t分布曲線的比較 概率密

32、度函數(shù):概率密度函數(shù): t分布的平均數(shù)和標準差分布的平均數(shù)和標準差: t 分布的累積函數(shù):分布的累積函數(shù): t分布的概率累積函數(shù)也分為一尾分布的概率累積函數(shù)也分為一尾表和兩尾表,一尾表是表和兩尾表,一尾表是t到到的面的面積,兩尾表是積,兩尾表是-t到到-的面積和的面積和t到到的面積之和。的面積之和。 單尾表表頭上的各概率(單尾表表頭上的各概率()是)是t大于表中所列大于表中所列t值時的概率。例如值時的概率。例如從表中查出從表中查出df=9, =0.05的的t單側(cè)單側(cè)分位數(shù)分位數(shù)t0.05=1.8331,表示表示t1.8331 時,曲線下面積(或概率)為時,曲線下面積(或概率)為0.05 由于曲

33、線的對稱性,對于單側(cè)分由于曲線的對稱性,對于單側(cè)分位數(shù)可以表示為:位數(shù)可以表示為: p(tt)=p(t-t)= 兩尾時,每一尾的面積只有給出兩尾時,每一尾的面積只有給出概率的概率的1/2 。例如。例如df=9, =0.05的的t雙側(cè)分位數(shù),就要查雙側(cè)分位數(shù),就要查/2=0.025時的單側(cè)分位數(shù):時的單側(cè)分位數(shù):t0.025,9=2.2622,由于對稱性,另一側(cè)由于對稱性,另一側(cè)-t0.025,9=-2.2622即:即:t2.2622和和t2.2622(相當(dāng)于(相當(dāng)于|t|2.2622)兩尾)兩尾面積之和為面積之和為0.05。(二)樣本總和數(shù)的抽樣分布(二)樣本總和數(shù)的抽樣分布樣本總和數(shù)(以樣本

34、總和數(shù)(以x表示)的抽樣分布表示)的抽樣分布參數(shù)與母總體間存在如下關(guān)系:參數(shù)與母總體間存在如下關(guān)系:()抽樣分布的平均數(shù)是母總體平()抽樣分布的平均數(shù)是母總體平均數(shù)的均數(shù)的n倍倍xn(2) 抽樣分布的方差是母總體方差的抽樣分布的方差是母總體方差的n倍倍x2n2(三)從兩個正態(tài)總體抽出的隨機(三)從兩個正態(tài)總體抽出的隨機樣本的平均數(shù)差數(shù)的分布樣本的平均數(shù)差數(shù)的分布總體總體n(,12),以以n1抽樣抽樣: ,s1;總體總體2n(,22),以以n2抽樣抽樣: , s2;、標準差、標準差1、已知:已知: 兩者抽樣相互獨立,則兩個獨立隨兩者抽樣相互獨立,則兩個獨立隨機抽取的樣本平均數(shù)間差數(shù)機抽取的樣本平

35、均數(shù)間差數(shù)( )的抽樣分布參數(shù)與兩個母總體間存在的抽樣分布參數(shù)與兩個母總體間存在如下關(guān)系:如下關(guān)系:xx21),()(2221212121nnnxx 標準化: 、標準差、標準差1、未知:未知:若若1、未知,但兩個總體相互獨未知,但兩個總體相互獨立而且都是正態(tài)分布,同時立而且都是正態(tài)分布,同時1= =,則差數(shù)分布服從,則差數(shù)分布服從df1+df2的的t分分布布,其中其中df1=n1-1,df2=n2-1;3 3 近似近似t t分布:分布: 當(dāng)兩個總體標準差當(dāng)兩個總體標準差11和和22未知,且未知,且1212,符合近似,符合近似t t檢驗檢驗因為因為1212,差數(shù)標準誤需用兩個樣本的,差數(shù)標準誤需用兩個樣本的s1s1、s2s2均方分別估計均方分別估計11、2222121212xxsssnn121212()()xxxxts 21221222121(1)xxxsksskk 具有自由度二、二項總體的抽樣分布二、二項總體的抽樣分布(一)樣本平均

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論