第三章 復(fù)習(xí)用-概率與概率分布_第1頁
第三章 復(fù)習(xí)用-概率與概率分布_第2頁
第三章 復(fù)習(xí)用-概率與概率分布_第3頁
第三章 復(fù)習(xí)用-概率與概率分布_第4頁
第三章 復(fù)習(xí)用-概率與概率分布_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、隨機(jī)變量的概率分布 (probability distribution) 離散型變量(discrete random variable) 連續(xù)型變量(continuous random variable)二項分布泊松分布正態(tài)分布變量幾種常見的理論分布一、正態(tài)分布一、正態(tài)分布(一)正態(tài)分布的概率函數(shù)(一)正態(tài)分布的概率函數(shù)一個正態(tài)分布常用它的概率密度函數(shù)作定義,其公式為:一個正態(tài)分布常用它的概率密度函數(shù)作定義,其公式為:)()(21)(222xxxfef(x) 為正態(tài)分布的概率密度函數(shù),表示某一定為正態(tài)分布的概率密度函數(shù),表示某一定x值出現(xiàn)的概率值出現(xiàn)的概率密度函數(shù)值。密度函數(shù)值。總體平均數(shù)總體

2、平均數(shù) 總體標(biāo)準(zhǔn)差總體標(biāo)準(zhǔn)差 圓周率圓周率3.14159e為自然對數(shù)底為自然對數(shù)底2.71828 正態(tài)分布概率密度函數(shù)的圖像,稱為正態(tài)分布概率密度函數(shù)的圖像,稱為正態(tài)分布正態(tài)分布曲線曲線,簡稱,簡稱正態(tài)曲線正態(tài)曲線。 若一個連續(xù)型隨機(jī)變量若一個連續(xù)型隨機(jī)變量x取取值于區(qū)間值于區(qū)間a,b,其概率為,其概率為badxxfbxaP)()(ab(二)正態(tài)分布的特征(二)正態(tài)分布的特征12確定正態(tài)分布曲線在確定正態(tài)分布曲線在x軸上的中心位置。軸上的中心位置。決定正態(tài)曲線的展開度。決定正態(tài)曲線的展開度。 越大,曲線展開度越大越大,曲線展開度越大,數(shù)數(shù)據(jù)越分散;據(jù)越分散; 越小,曲線展開度越小,數(shù)據(jù)分布越集

3、越小,曲線展開度越小,數(shù)據(jù)分布越集中。中。 正態(tài)分布是依賴于參數(shù)正態(tài)分布是依賴于參數(shù)(,2 2) )的一個曲線系,正態(tài)曲線的的一個曲線系,正態(tài)曲線的位置及形態(tài)隨位置及形態(tài)隨(,2 2) )的不同而不同的不同而不同。(三)標(biāo)準(zhǔn)正態(tài)分布(三)標(biāo)準(zhǔn)正態(tài)分布X N (,2)uN(0,1)()(21)(222xxxfexuu u表示標(biāo)準(zhǔn)正態(tài)離差(表示標(biāo)準(zhǔn)正態(tài)離差(standard normal deviate)standard normal deviate),它表示離開平均數(shù)它表示離開平均數(shù)有幾個標(biāo)準(zhǔn)差有幾個標(biāo)準(zhǔn)差。euuf22121)(f(u)稱為標(biāo)準(zhǔn)正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布(standard nor

4、mal distribution)或或u分布方程。分布方程。 標(biāo)準(zhǔn)正態(tài)分布的概率累積函數(shù)記作標(biāo)準(zhǔn)正態(tài)分布的概率累積函數(shù)記作F(u),它是,它是變量變量u小于某一定值的概率。小于某一定值的概率。iuiiduufuuPuF)()()(ui 為了計算方便,對于不同的為了計算方便,對于不同的u值,計算出不同的值,計算出不同的F(u),編成函數(shù)表,稱為正態(tài)分布表,從中可以查到編成函數(shù)表,稱為正態(tài)分布表,從中可以查到u任意一個任意一個區(qū)間內(nèi)取值的概率。區(qū)間內(nèi)取值的概率。uiP(-1u1)=u1)=P(-2u2)=u2)=P(-3u3)=u3)=P(-1.96u1.96)=u1.96)=P(-2.58u2.

5、58)=u2.58)=1 標(biāo)準(zhǔn)正態(tài)分布的概率計算標(biāo)準(zhǔn)正態(tài)分布的概率計算F(1) F(-1)=0.8413-0.1587F(-1)=0.8413-0.1587=0.68260.95450.99730.990.952 標(biāo)準(zhǔn)正態(tài)分布的臨界值標(biāo)準(zhǔn)正態(tài)分布的臨界值(1)上側(cè)臨界值)上側(cè)臨界值 曲線右側(cè)尾區(qū)一定面積曲線右側(cè)尾區(qū)一定面積a下,所對應(yīng)的下,所對應(yīng)的u值記為值記為ua,稱之為稱之為a的上側(cè)的上側(cè)臨界值,滿足臨界值,滿足P(u ua)=a。ua值可從附表值可從附表3查出。查出。 (2)下側(cè)臨界值)下側(cè)臨界值 曲線左側(cè)尾區(qū)一定面積曲線左側(cè)尾區(qū)一定面積 a 下,所對應(yīng)的下,所對應(yīng)的u值記為值記為-ua

6、 ,稱之為,稱之為a的下側(cè)的下側(cè)臨界值,滿足臨界值,滿足P(u- ua)= a 。(3)雙側(cè)臨界值)雙側(cè)臨界值 若將一定的曲線下面積若將一定的曲線下面積a平分到兩側(cè)尾區(qū),則每一尾區(qū)的平分到兩側(cè)尾區(qū),則每一尾區(qū)的曲線下面積只有曲線下面積只有a/2 ,滿足,滿足222uuPuuPuuP這時的這時的ua /2稱為稱為a的雙側(cè)臨界值。的雙側(cè)臨界值。提示:今后,一律用提示:今后,一律用“ua”表示表示a的的上側(cè)臨界值;上側(cè)臨界值;“-ua”表示的表示的a下側(cè)臨下側(cè)臨界值;界值;“ua/2”或或“ua(雙側(cè)雙側(cè))”表示表示a的雙的雙側(cè)臨界值。側(cè)臨界值。(四)一般正態(tài)分布的概率計算(四)一般正態(tài)分布的概率計

7、算若隨機(jī)變量服從正態(tài)分布若隨機(jī)變量服從正態(tài)分布N(,2 2) ),則,則x x的取值落的取值落在區(qū)間在區(qū)間xx1 1,x,x2 2 的概率,記作的概率,記作P(xP(x1 1xxxx2 2) )。 21222)(2121)(xxxdxexxxP三、正態(tài)分布三、正態(tài)分布 一般情況下,隨機(jī)變量一般情況下,隨機(jī)變量X服從平均數(shù)為服從平均數(shù)為,標(biāo)準(zhǔn)差為,標(biāo)準(zhǔn)差為的正的正態(tài)分布,即態(tài)分布,即X N ( , 2 )。若要計算。若要計算X在某一區(qū)間取值的概率,在某一區(qū)間取值的概率,首先對首先對X進(jìn)行標(biāo)準(zhǔn)化處理,使其變?yōu)闃?biāo)準(zhǔn)正態(tài)變量進(jìn)行標(biāo)準(zhǔn)化處理,使其變?yōu)闃?biāo)準(zhǔn)正態(tài)變量u,然后再,然后再借助附表計算。借助附表計

8、算。)()()(212121uuuPxxxPxxxP)()(211221212uFuFdueuuu三、正態(tài)分布三、正態(tài)分布P(-P(- x+x+) )P(-2x+2)P(-2x+2)P(-3x+3)P(-3x+3)= =P(-1u1)u1)=0.6826=0.6826= = P(-2u2)u2)=0.9545=0.9545= = P(-3u3)u3)=0.9973=0.9973離散型隨機(jī)變量的分布哺乳動物種子穗子生物個體雄性雌性發(fā)芽不發(fā)芽有芒無芒成活死亡對立事件二、二項分布的概率函數(shù)二、二項分布的概率函數(shù) 在在n次實驗中有次實驗中有x (0 xn)次發(fā)生事件次發(fā)生事件A的概率是多少?的概率是多

9、少?xnxxnqpCxP)(x=0,1,2,n 把把P(x)稱為隨機(jī)變量稱為隨機(jī)變量x服從參數(shù)為服從參數(shù)為n和和p的的二項分布二項分布(binomial distribution),也稱為貝努里分布,記作,也稱為貝努里分布,記作B(n,p)。這種。這種“非此即彼非此即彼”的事件所構(gòu)成的總體稱為的事件所構(gòu)成的總體稱為二項總體二項總體。二項分布概率函數(shù)二項分布概率函數(shù)(二)二項分布的形狀和參數(shù)(二)二項分布的形狀和參數(shù)(1)(1)當(dāng)當(dāng)p p值較小且值較小且n n不大時,分布是不大時,分布是偏倚的。隨偏倚的。隨n n的增大,分布趨于對的增大,分布趨于對稱;稱;二項分布的二項分布的形狀形狀由由n n和

10、和p p兩個參數(shù)決定。兩個參數(shù)決定。(2 2)當(dāng))當(dāng)p p值趨于值趨于0.50.5時,分布趨于時,分布趨于對稱。對稱。三、泊松分布三、泊松分布 在二項分布中,若某事件出現(xiàn)的概率很小在二項分布中,若某事件出現(xiàn)的概率很小(P0) ,而樣本,而樣本含量含量n又很大又很大( n),這時的二項分布稱為泊松分布,這時的二項分布稱為泊松分布(Poisson distribution) ??梢姡此煞植际嵌椃植嫉囊环N極限分布。可見,泊松分布是二項分布的一種極限分布。泊松分布的概率函數(shù)泊松分布的概率函數(shù) 可由二項分布概率函數(shù)推導(dǎo)出來可由二項分布概率函數(shù)推導(dǎo)出來!)(xexPl l - x1)(xp為參數(shù),為參

11、數(shù),= =npnp x = ,1,2,p(x) Cnxpx(1-p)n-x!)(xexPl l - x=2 2 = =lP( )p(x) Cnxpx(1-p)n-x n p )1 (pnp 2 2=np(1-p)=np(1-p)= np =np =P( )的形狀由的形狀由確定確定 較小時,泊松分布偏倚。較小時,泊松分布偏倚。 增大時,泊松分布趨于對稱。增大時,泊松分布趨于對稱。 無限增大時,泊松分布接近正態(tài)分布。無限增大時,泊松分布接近正態(tài)分布。形狀形狀形狀形狀形狀形狀二、泊松分布二、泊松分布對于小概率事件,可用泊松分布描述其概率分布。對于小概率事件,可用泊松分布描述其概率分布。二項分布當(dāng)二項

12、分布當(dāng)p0.1和和np30n30 xsxu),(/2Nnsx當(dāng)當(dāng)2 2未知,未知,且且n30n30時,其曲線接近正態(tài)分布曲線,時,其曲線接近正態(tài)分布曲線,df 時則和正態(tài)分布曲時則和正態(tài)分布曲線重合。線重合。xSxxS(4)t 分布曲線與橫軸所圍成的面積為分布曲線與橫軸所圍成的面積為1。同標(biāo)準(zhǔn)正態(tài)分布曲線一樣,統(tǒng)計應(yīng)用中最為關(guān)心的是同標(biāo)準(zhǔn)正態(tài)分布曲線一樣,統(tǒng)計應(yīng)用中最為關(guān)心的是 t 分布曲線下的面積(即概率分布曲線下的面積(即概率)與橫軸)與橫軸 t 值間關(guān)系。值間關(guān)系。為使用方便,統(tǒng)計學(xué)家編制不同自由度為使用方便,統(tǒng)計學(xué)家編制不同自由度 df 下的下的 t 值表值表。t df,表示什么表示什

13、么?雙尾概率雙尾概率 t 10, 0.05= 2.228表示具有自由度表示具有自由度df 的的t分布上的第分布上的第100的的百分位點(統(tǒng)計學(xué)稱為臨界值)。百分位點(統(tǒng)計學(xué)稱為臨界值)。單尾概率單尾概率 t 10, 0.05= 1.812在相同的自由度在相同的自由度 df 時,時,t 值越大,概率值越大,概率 P 越小。越小。在相同在相同 t 值時,雙尾概率值時,雙尾概率 P 為單尾概率為單尾概率 P 的兩倍。的兩倍。12df 增大,增大,t 分布接近正態(tài)分布,即分布接近正態(tài)分布,即 t 值接近值接近u值。值。3四、四、x2 分布分布 從方差為從方差為2 2的的正態(tài)總體中,隨機(jī)抽取正態(tài)總體中,

14、隨機(jī)抽取k個獨立樣本,個獨立樣本,計算出樣本方差計算出樣本方差S2 2,研究其樣本方差的分布。,研究其樣本方差的分布。則則 服從自由度為服從自由度為df=k -1的卡方分布。這個分布常被記為的卡方分布。這個分布常被記為 。2 如果從如果從uN(0,1)總體中隨機(jī)抽取總體中隨機(jī)抽取k個獨立樣本,就可個獨立樣本,就可以得到以得到u1、 u2、 u3、 uk,則定義它們的和為則定義它們的和為 ,即,即22n2222211222322212)()(.dfsxxuuuuukkiikdf = k-122121222)2(2)()(edffdfdf)()()(20222dfF概率密度函數(shù)概率密度函數(shù)概率累積

15、函數(shù)概率累積函數(shù) 分布的平均數(shù)分布的平均數(shù)t t和方差和方差t t2 2nnx2nnx2222n 分布與分布與 t 分布一樣,是具有參數(shù)(自由度)的一類分分布一樣,是具有參數(shù)(自由度)的一類分布。不同于布。不同于 t 分布的是,它不是對稱分布,區(qū)間分布的是,它不是對稱分布,區(qū)間0,+ )即只有正值,并且呈反即只有正值,并且呈反J型的偏斜分布。型的偏斜分布。1 分布的偏斜度隨自由度降低而增大,當(dāng)自由度分布的偏斜度隨自由度降低而增大,當(dāng)自由度df=1時,時,曲線以縱軸為漸近線。曲線以縱軸為漸近線。2隨自由度隨自由度df的增大,的增大, 2 2分布曲線漸趨左右對稱,當(dāng)分布曲線漸趨左右對稱,當(dāng)df30

16、時,卡方分布已接近正態(tài)分布。時,卡方分布已接近正態(tài)分布。32n2n表示具有自由度表示具有自由度n 的卡分布上的第的卡分布上的第100的百分位點(統(tǒng)計學(xué)稱為臨界的百分位點(統(tǒng)計學(xué)稱為臨界值)。值)。2,nP P(2 2 5.995.99)0.050.05P P(2 2 0.100.10)0.950.9599.5205.0,210.0295.0,2五、五、F 分布分布 設(shè)從一正態(tài)總體設(shè)從一正態(tài)總體N(,N(,2 2) ) 中隨機(jī)抽取樣本容量為中隨機(jī)抽取樣本容量為n1、n2的的兩個獨立樣本,其樣本方差為兩個獨立樣本,其樣本方差為s12、 s22,則定義其比值:,則定義其比值:此值具有此值具有s12的

17、自由度的自由度df1=n1-1和和s22的自由度的自由度df2=n2-1。2221ssF 如果對一正態(tài)總體在特定的如果對一正態(tài)總體在特定的dfdf1 1和和dfdf2 2進(jìn)行一系列隨機(jī)獨立抽進(jìn)行一系列隨機(jī)獨立抽樣,則所有可能的樣,則所有可能的值就構(gòu)成一個值就構(gòu)成一個分布。分布。分布的概率密度函數(shù)是兩個獨立分布的概率密度函數(shù)是兩個獨立2 2變量的概率密度所構(gòu)成的變量的概率密度所構(gòu)成的聯(lián)合概率密度。聯(lián)合概率密度。221122221212121121)()2()2()2()(dfdfdfdfdfdfFdfFdfdfdfdfdfdfFf分布是隨自由度分布是隨自由度dfdf1 1和和dfdf2 2進(jìn)行變化的一組曲線。進(jìn)行變化的一組曲線。分布的平均數(shù)分布的平均數(shù)F F=1 =1 ,的取值區(qū)間為,的取值區(qū)間為0,+0,+)分布曲線的形狀僅決定于分布曲線的形狀僅決定于dfdf1 1和和dfdf2 2。在。在dfdf1 11 1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論