《正態(tài)分布》PPT課件.ppt_第1頁(yè)
《正態(tài)分布》PPT課件.ppt_第2頁(yè)
《正態(tài)分布》PPT課件.ppt_第3頁(yè)
《正態(tài)分布》PPT課件.ppt_第4頁(yè)
《正態(tài)分布》PPT課件.ppt_第5頁(yè)
已閱讀5頁(yè),還剩52頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1,第五章:正態(tài)分布,1、標(biāo)準(zhǔn)正態(tài)分布 2、常用統(tǒng)計(jì)分布 3、大數(shù)定理與中心極限定理,2,學(xué)習(xí)目標(biāo),掌握正態(tài)分布的特性; 正態(tài)分布曲線下面積的含義; 標(biāo)準(zhǔn)分的計(jì)算和應(yīng)用; 利用標(biāo)準(zhǔn)正態(tài)分布表計(jì)算概率。 理解大數(shù)定理和中心極限定理,3,從 “分布” 說(shuō)起,一、什么是正態(tài)分布?,4,直方圖用長(zhǎng)條的面積來(lái)表示頻次或相對(duì)頻次; 折線圖用直線連接直方圖中條形頂端的中點(diǎn); 當(dāng)組距逐漸減小時(shí),折線將逐漸平滑為曲線。,5,峰點(diǎn)(Peak)研究(P40),單峰,多峰,6,幾種常見(jiàn)的頻數(shù)分布曲線,7,一、 正態(tài)分布曲線,8,1.1 什么是正態(tài)分布?,1、由德國(guó)數(shù)學(xué)家高斯提出,也叫高斯分布; 2、自然界、社會(huì)經(jīng)濟(jì)生活中大量存在的分布規(guī)律; 3、經(jīng)典統(tǒng)計(jì)推斷的基礎(chǔ); 4、在所有的分布中,正態(tài)分布居于首要位置;,9,1.2 正態(tài)分布的基本特征,特征一:一個(gè)高峰 特征二:一條對(duì)稱軸 特征三:一條漸近線,M0Md=,眾值=中位值均值,10,1.3 正態(tài)分布的數(shù)學(xué)表達(dá)式,(x) = 隨機(jī)變量 X 的頻次(概率密度) 總體標(biāo)準(zhǔn)差; = 總體方差 = 總體均值 =3.14159; e = 2.71828 x = 隨機(jī)變量的取值 (- x ),11,1.4 兩個(gè)參數(shù)的影響( , ),均 值,標(biāo)準(zhǔn)差,12,1.4.1 對(duì)正態(tài)曲線的影響,1 2 3,13,1.4.2 對(duì)正態(tài)曲線的影響,曲線A和B的比較,14,正態(tài)曲線的位置由均值 決定; 正態(tài)曲線的形狀“高,矮,胖,瘦”的特點(diǎn)由標(biāo)準(zhǔn)差 決定;,15,二、正態(tài)曲線下的面積,2.1 正態(tài)曲線下面積的涵義 隨機(jī)變量的頻次總和; 一般把正態(tài)曲線下的總面積約等于1, 這時(shí)一定區(qū)間內(nèi)的頻次分布表現(xiàn)為概率分布。,16,2.2 正態(tài)曲線的一個(gè)重要性質(zhì),無(wú)論正態(tài)曲線具有哪種均值和標(biāo)準(zhǔn)差,在均值和橫坐標(biāo)某一點(diǎn)的距離內(nèi)(用標(biāo)準(zhǔn)差來(lái)表示)曲線下的面積是常數(shù)。 下圖說(shuō)明此意。,17,正態(tài)曲線下的面積(圖), -, + ,95.46%,68.26%,18,2.3 幾個(gè)典型取值區(qū)間的概率值,P( - + ) =0.6827; P( -2 +2 )=0.9545; P( -3 +3 )=0.9973;,19,三、標(biāo)準(zhǔn)正態(tài)分布,3.1 什么是標(biāo)準(zhǔn)正態(tài)分布 以標(biāo)準(zhǔn)差為單位的正態(tài)分布一般稱為標(biāo)準(zhǔn)正態(tài)分布(standardized normal distribution),20,3.2 標(biāo)準(zhǔn)正態(tài)分布的重要性,簡(jiǎn)化統(tǒng)計(jì)分析 一般的正態(tài)分布取決于均值和標(biāo)準(zhǔn)差 ; 計(jì)算概率時(shí),每一個(gè)正態(tài)分布都需要有自己的正態(tài)概率分布表,這種表格是無(wú)窮多的 若能將一般的正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布,計(jì)算概率時(shí)只需要查一張表,21,3.3 標(biāo)準(zhǔn)分(Standard scores),公式:,Z值代表每個(gè)X值在標(biāo)準(zhǔn)正態(tài)分布上的數(shù)值。,22,3.4 標(biāo)準(zhǔn)正態(tài)分布的表達(dá)式,正態(tài)分布的表達(dá)式為: N( , ) 標(biāo)準(zhǔn)正態(tài)分布的表達(dá)式為: N(0,1) 標(biāo)準(zhǔn)正態(tài)分布是一般正態(tài)分布的特例,即0, 1的正態(tài)分布。,23,3.5 標(biāo)準(zhǔn)分的實(shí)際意義,各總體之間可以通過(guò)標(biāo)準(zhǔn)分進(jìn)行合理的比較 不同總體間綜合指標(biāo)的比較,24,3.7 標(biāo)準(zhǔn)正態(tài)分布的面積,P(-1 Z 1 ) =0.6827; P(-2 Z 2 ) =0.9545; P(-3 Z 3 ) =0.9973; 由于標(biāo)準(zhǔn)正態(tài)分布N(0,1)的圖形是唯一的,因此使用標(biāo)準(zhǔn)正態(tài)分布無(wú)須自己計(jì)算,只需要學(xué)會(huì)查表就行了。,25,四、標(biāo)準(zhǔn)正態(tài)分布表的使用,4.1 標(biāo)準(zhǔn)正態(tài)分布表的介紹,26,4.2標(biāo)準(zhǔn)正態(tài)分布的計(jì)算,【例5】已知服從標(biāo)準(zhǔn)正態(tài)分布N(0,1),求P( 1.3)=? 解:因?yàn)?服從標(biāo)準(zhǔn)正態(tài)分布N(0,1),可直接查附表4,根據(jù)z=1.3,有 P( 1.3)= 1.3=0.9032,Xi:大寫(xiě),小寫(xiě) 讀作:克西,27,【例6】:,已知服從標(biāo)準(zhǔn)正態(tài)分布N(0,1),求P( 1.3)=? 解:因?yàn)?1, 而 P( 1.3) P( 1.3)1 因此有P( 1.3)1 P( 1.3)1 1.30.0968,28,【例7】,已知服從標(biāo)準(zhǔn)正態(tài)分布N(0,1),求P( 1.3)=? 解:附表四中沒(méi)有給出Z0的 Z值。根據(jù)標(biāo)準(zhǔn)正態(tài)分布圖形是以Z0為對(duì)稱的原理, P( 1.3)=1 1.30.0968,29,【例8】,已知服從標(biāo)準(zhǔn)正態(tài)分布N(0,1),求P(1.3 2.3)? 解: P(1.3 2.3) 2.3 1.3 =0.98930.9032=0.0861,30,【例9】,已知服從標(biāo)準(zhǔn)正態(tài)分布N(0,1),求滿足P( )0.05 中的值 解: P()P()+ (- )2 P ( ) =2(1- )=0.05 =1-0.025=0.975 查表得, =1.96,31,【例10】,根據(jù)統(tǒng)計(jì),北京市初婚年齡服從正態(tài)分布。其均值為25歲,標(biāo)準(zhǔn)差為5歲,問(wèn)25歲到30歲之間結(jié)婚的人,其百分比為多少? 解:1. 年齡換為標(biāo)準(zhǔn)分: Z1 ,Z2 2. 查表得 Z1 0.50, Z2 0.8413 Z2 - Z1 =0.3413, 所以25歲到30歲之間結(jié)婚的人,百分?jǐn)?shù)為34.13%.,32,4.3 標(biāo)準(zhǔn)正態(tài)分布表的使用,1. 通過(guò)標(biāo)準(zhǔn)分公式,將一般為正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布; 2. 計(jì)算概率時(shí) ,查標(biāo)準(zhǔn)正態(tài)分布表; 3. 對(duì)于負(fù)的 x ,可由 (-x) x得到; 4. 對(duì)于標(biāo)準(zhǔn)正態(tài)分布,即XN(0,1),有 P (a X b) b a P (|X| a) 2 a 1,33,常用的標(biāo)準(zhǔn)值,Z 1.65,概率P為0.05; Z 1.96,概率P為0.025; Z 2.58,概率P為0.005;,34,二項(xiàng)分布的正態(tài)近似法 通過(guò)前面的討論,我們已經(jīng)知道二項(xiàng)分布受成功事件概率p和重復(fù)次數(shù)n兩個(gè)參數(shù)的影響,只要確定了p和n,二項(xiàng)分布也隨之確定了。 但是,二項(xiàng)分布的應(yīng)用價(jià)值實(shí)際上受到了n的很大限制。也就是說(shuō),只有當(dāng)n較小時(shí),我們才能比較方便地計(jì)算二項(xiàng)分布。所幸的是,二項(xiàng)分布是以正態(tài)分布為極限的。所以當(dāng)n很大時(shí),只要p或q不近于零,我們就可以用正態(tài)近似來(lái)解決二項(xiàng)分布的計(jì)算問(wèn)題。即以n p、n p q2,將B(x;n,p)視為N(n p,n p q)進(jìn)行計(jì)算。在社會(huì)統(tǒng)計(jì) 中,當(dāng)n 30,n p、n q均不小于5時(shí),對(duì)二項(xiàng)分布作正態(tài)近似是可靠的。,35,常見(jiàn)的抽樣分布,(一) 分布 設(shè) 是獨(dú)立同分布的隨機(jī)變量,且每個(gè)隨機(jī)變量都服從標(biāo)準(zhǔn)正態(tài)分布,即 (0,1),則隨機(jī)變量 = 的分布稱為自由度為 的 分布,記作 ( )。 當(dāng) 時(shí), 分布趨近于正態(tài)分布,即 ( )( ,2 )。,36,卡方分布,卡方分布是一種連續(xù)型隨機(jī)變量的概率分布,主要用于列聯(lián)表 檢驗(yàn)。 1.數(shù)學(xué)形式 設(shè)隨機(jī)變量X1,X2,Xk,相互獨(dú)立,且都服從同一的正態(tài) 分布N (,2)。那么,我們可以先把它們變?yōu)闃?biāo)準(zhǔn)正態(tài)變量 Z1,Z2,Zk,k個(gè)獨(dú)立標(biāo)準(zhǔn)正態(tài)變量的平方和被定義為卡方分布 ( 分布)的隨機(jī)變量 ( 讀作卡方),且,我們把隨機(jī)變量 的概率分布稱為 分布,其概率密度記 作 。其中k為卡方分布的自由度,它表示定義式中獨(dú)立變量 的個(gè)數(shù)。,37,關(guān)于卡方分布的分布函數(shù),附表7對(duì)不同的自由度k及不同的臨 界概率(01),給出了滿足下面概率式的 的值(參見(jiàn) 圖)。,注意 寫(xiě)法的含義:它 表示自由度為k的卡方分布,當(dāng) 其分布函數(shù) 時(shí),其隨機(jī)變量 的臨界值(參 見(jiàn)圖)。具體來(lái)說(shuō),在假設(shè)檢驗(yàn) 中,它表示在顯著性水平上卡 方分布隨機(jī)變量 的臨界值。,38,解 查卡方分布表(附表7)得,例 試求下列各值:,例 已知k5, 15,求臨界概率。 解 查卡方分布表,在表中自由度為5的橫行中找到 與15最接近的數(shù)值是15086,得到的近似值為001。 由此可知 001,39,式中:2代表總體方差,自由度為nl。,2.卡方分布的性質(zhì) (1) 恒為正值 。 (2)卡方分布的期望值 是自由度k,方差 為2k。 卡方分布取決于自由度k,每一個(gè)可能的自由度對(duì)應(yīng)一個(gè)具體 的卡方分布。卡方分布只與自由度有關(guān),這就給卡方分布的實(shí)際應(yīng) 用帶來(lái)很大方便。分布由正態(tài)分布導(dǎo)出,但它之所以與正態(tài)分布的 參數(shù)和無(wú)關(guān),是因?yàn)闃?biāo)準(zhǔn)正態(tài)變量Z與原來(lái)的參數(shù)無(wú)關(guān)。 (3)卡方分布具有可加性 (4)利用卡方分布可以推出樣本方差 S2 的分布,40,所以,樣本方差S 2落在33和87之間的概率約為90。,3. 樣本方差的抽樣分布 例 由一正態(tài)總體抽出容量為25的一隨機(jī)樣本,已知26,求 樣本方差S 2在33到87之間的概率。 解 已知n25,26,由 得,41,常見(jiàn)的抽樣分布,(二) 分布 設(shè)隨機(jī)變量 與 相互獨(dú)立, (0,1), ( ),則稱隨機(jī)變量 服從自由度為 的 分布,記作 ( )。 當(dāng) 時(shí), 分布趨近于標(biāo)準(zhǔn)正態(tài)分布。實(shí)際應(yīng)用中,當(dāng) 30時(shí), 分布可用標(biāo)準(zhǔn)正態(tài)分布近似。,42,常見(jiàn)的抽樣分布,(三) 分布 1.設(shè)隨機(jī)變量 與 相互獨(dú)立,且分別服從自由度為 、 的 分布,則稱隨機(jī)變量 服從第一自由度為 、第二自由度 為 的 分布,記作 ( , )。 2. 分布對(duì)于兩個(gè)總體的方差比的統(tǒng)計(jì)推斷問(wèn)題十分重要,是方差分析等統(tǒng)計(jì)推斷方法的基礎(chǔ)。與前兩種分布不同的是 分布不以正態(tài)分布為其極限分布,它總是一個(gè)正偏分布。,43,F 分布,F 分布是連續(xù)性隨機(jī)變量的另一種重要的小樣本分布, 可用來(lái)檢驗(yàn)兩個(gè)總體的方差是否相等,多個(gè)總體的均值是 否相等。還是方差分析和正交設(shè)計(jì)的理論基礎(chǔ)。 1.數(shù)學(xué)形式 設(shè) 和 相互獨(dú)立,那么隨機(jī)變量,服從自由度為(k1,k2)的F分布。其中,分子上的自由 度k1叫做第一自由度,分母上的自由度k2叫做第二自由度。,44,我們把隨機(jī)變量F的概率分 布稱為F分布,其概率密度記 作 。本書(shū)附 表8,對(duì)不同自由度(k1,k2)及 不同的臨界概率(01), 給出滿足下列概率式的F(k1, k2)的值(參見(jiàn)圖)。,注意 寫(xiě)法的含義:它表示自由度為 (k1,k2)的F 分布,當(dāng)其分布函數(shù) 時(shí),其隨機(jī)變量 F 的臨界值(參 見(jiàn)圖)。具體來(lái)說(shuō),在假設(shè)檢驗(yàn)中,它表示在顯著性水平上F分布 隨機(jī)變量 F 的臨界值。,45,例 試求下列各值:,如果 和 是兩個(gè)獨(dú)立隨 機(jī)樣本的方差,樣本來(lái)源于具有相同 方差2的兩個(gè)正態(tài)總體,樣本容量 分別為n1和n2,那么根據(jù)(822)式, 隨機(jī)變量F 服從于自由度為(n11和 n21)的F分布。,解查F分布表(附表8)得,46,2. F分布性質(zhì),(1)隨機(jī)變量F恒為正值, F分布也是一個(gè)連續(xù)的非對(duì) 稱分布。 (2)分布具有一定程度的 反對(duì)稱性。 (3) F分布的期望值與變異數(shù)(方差),47,五、大數(shù)定理和中心極限定理,5.1 極限定理 簡(jiǎn)單講,凡是采用極限的方法(例如,觀察次數(shù)n趨于無(wú)限)所得出的一系列定理統(tǒng)稱極限定理。 極限定理分為兩類(lèi): 大數(shù)定理(Law of large numbers) 中心極限定理 (Central limit theorem),48,一旦統(tǒng)計(jì)的學(xué)習(xí)進(jìn)入到推論統(tǒng)計(jì),我們就必須同時(shí)與三 種不同的分布概念打交道,即總體分布、樣本分布、抽樣分 布。為了不產(chǎn)生混淆,視分布不同,將統(tǒng)計(jì)指標(biāo)的符號(hào)加以區(qū) 別是完全必要的。對(duì)那些反映標(biāo)志值集中趨勢(shì)和離中趨勢(shì)的綜 合指標(biāo),尤其對(duì)均值和標(biāo)準(zhǔn)差(或方差)。,抽樣分布特指樣本統(tǒng)計(jì)量作為隨機(jī)變量的概率分布。用數(shù)學(xué)語(yǔ)言來(lái)說(shuō),抽樣分布是運(yùn)用數(shù)理統(tǒng)計(jì)的方法,把具體概率賦予樣本的所有可能結(jié)果的一種理論分布。,在一個(gè)總體中可以產(chǎn)生無(wú)數(shù)個(gè)樣本,所以樣本統(tǒng)計(jì)量(比如均值 )必定是隨機(jī)變量。 這樣就提出一個(gè)問(wèn)題:如果樣本統(tǒng)計(jì)量作為隨機(jī)變量,它的概率分布是什么樣呢?,49,1中心極限定理 我們知道,概率論中用來(lái)闡明大量隨機(jī)現(xiàn)象平均 結(jié)果的穩(wěn)定性的定理,是著名的大數(shù)定理。其具體內(nèi) 容是:頻率穩(wěn)定于概率,平均值穩(wěn)定于期望值。但 是,大量隨機(jī)現(xiàn)象的穩(wěn)定性不僅表現(xiàn)在平均結(jié)果上, 同時(shí)也表現(xiàn)在分布上,這就是中心極限定理所要闡明 的內(nèi)容。顯然,推論統(tǒng)計(jì)需要有一座能夠架通抽樣調(diào) 查和抽樣分布的橋梁。中心極限定理告訴我們:如果 從任何一個(gè)具有均值和方差2的總體(可以具有任 何分布形式)中重復(fù)抽取容量為n的隨機(jī)樣本,那么當(dāng) n變得很大時(shí),樣本均值的抽樣分布接近正態(tài),并具 有均值和方差 。,50,(2)由于抽樣分布的標(biāo)準(zhǔn) 差要比總體標(biāo)準(zhǔn)差小,并且 ,所以如右圖所 示,樣本容量越大,抽樣分 布的峰態(tài)愈陡峭,由樣本結(jié) 果來(lái)推斷總體參數(shù)的可靠性 也隨之提高。,無(wú)疑,中心極限定理大大拓展了正態(tài)分布的適用面,同時(shí)我們得到了以下重要信息: (1)雖然樣本的均值可能和總體均值有差別,但我們可期望這些將聚集在的周?chē)?。因此均值抽樣分布的算術(shù)平均數(shù)能和總體的均值很好地重合,這就是為什么總體均值和抽樣分布的均值用同一個(gè)來(lái)表示的緣故。,51,5.2 大數(shù)定理,【例子】 擲一顆均勻的正六面體的骰子,出現(xiàn)幺點(diǎn)的概率是16,在擲的次數(shù)比較少時(shí),出現(xiàn)幺點(diǎn)的頻率可能與16相差得很大,但是在擲的次數(shù)很多時(shí),出現(xiàn)幺點(diǎn)的頻率接近16幾乎是必然的。,52,5.2 大數(shù)定理,【例子】 從撲克牌盒中取出一張牌,出現(xiàn)牌“K”的概率是1/13,在取的次數(shù)比較少時(shí),出現(xiàn)“K”的頻率可能與1/13相差得很大,但是在取的次數(shù)很多時(shí),出現(xiàn)“K”的頻率接近1/13幾乎是必然的。,53,5.2 大數(shù)定理,這些例子說(shuō)明,在大量隨機(jī)現(xiàn)象中,不僅看到了隨機(jī)事件頻率的穩(wěn)定性,而且還看到平均結(jié)果的穩(wěn)定性。這就是概率論中大數(shù)定理的概念。闡明大量隨機(jī)現(xiàn)象平均結(jié)果的穩(wěn)定性的一系列定理。 著名的大數(shù)定理:貝努里大數(shù)定理和切貝謝夫大數(shù)定理,54,5.2.1 貝努里大數(shù)定理,多次重復(fù)試驗(yàn),隨機(jī)事件的頻率日趨穩(wěn)定,具有接近概率的趨勢(shì)。,55,5.2.2 切貝謝夫大數(shù)定

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論