




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第四章理論分布與抽樣分布
為了便于理解統(tǒng)計分析的基本原理,正確掌握和應用統(tǒng)計分析方法,本章在介紹概率論中最基本的兩個概念-事件、概率的基礎上,重點介紹科學研究中常用的幾種隨機變量的概率分布-——正態(tài)分布、二項分布、波松分布以及樣本平均數(shù)的抽樣分布和t分布。1.1事件件1.1..1必然現(xiàn)象象與隨機機現(xiàn)象在自然界界與生產產實踐和和科學試試驗中,,人們會會觀察到到各種各各樣的現(xiàn)現(xiàn)象,把把它們歸歸納起來來,大體體上分為為兩大類類:1事件與概概率必然現(xiàn)象象:事前可預言其結結果的,,即在保保持條件件不變的的情況下下,重復復進行試試驗,其其結果總總是確定定的,必必然發(fā)生生的(或或必然不不發(fā)生))。隨機現(xiàn)象象:事前不可可預言其其結果的的,即在在保持條條件不變變的情況況下,重重復進行行試驗,,其結果果未必相相同(帶帶有偶然然性和不不確定性性)。有如下特特點:在一定的的條件實實現(xiàn)時,,有多種種可能的的結果發(fā)發(fā)生,事事前人們們不能預預言將出出現(xiàn)哪種種結果;;對一次或或少數(shù)幾幾次觀察察或試驗驗而言,,其結果果呈現(xiàn)偶偶然性、、不確定定性;但在相同同條件下下進行大大量重復復試驗時時,其試試驗結果果卻呈現(xiàn)現(xiàn)出某種種固有的的、特定定的規(guī)律律性——頻率的穩(wěn)穩(wěn)定性,通常稱稱之為隨隨機現(xiàn)象象的統(tǒng)計計規(guī)律性性。1.1..2隨機試驗驗與隨機機事件(1)隨機試驗驗通常我們們把根據(jù)據(jù)某一研究目目的,在在一定條條件下對對自然現(xiàn)現(xiàn)象所進進行的觀觀察或試試驗統(tǒng)稱為試試驗(trial)。當一一個試驗驗如果滿滿足下述述三個特特性,則則稱其為為一個隨隨機試驗驗(randomtrial),簡稱稱試驗。。試驗可以以在相同同條件下下多次重重復進行行;每次試驗驗的可能能結果不不止一個個,并并且事先先知道會會有哪些些可能的的結果;;每次試驗驗總是恰恰好出現(xiàn)現(xiàn)這些可可能結果果中的一一個,,但在一一次試驗驗之前卻卻不能肯肯定這次次試驗會會出現(xiàn)哪哪一個結結果。(2)隨機事件件隨機試驗驗的每一一種可能能結果,在一定定條件下下可能發(fā)發(fā)生,也也可能不不發(fā)生,,稱為隨隨機事件件(randomevent),簡稱稱事件(event),通常常用A、B、C等來表示示。a基本事件件不能再分分的事件件(elementaryevent),也也稱為為樣本點點(samplepoint)。例如,從從編號為為1、2、3、…、10的十個籃籃球中隨隨機抽取取1個籃球,,有10種不同的的可能結結果:“取得得一一個編編號號是1”、““取得得一個編編號是2”、…、“取得得一個編編號是10”,這10個事件都都是不可可能再分分的事件件,它們們都是基基本事件件。由若干個個基本事事件組合合而成的的事件稱為復合事件件(compoundevent)。如““取得得一個編編號是2的倍數(shù)””是一個個復合事事件,它它由““取取得一個個編號是是2”、“是是4”、“是6、“是8”、“是10”5個基本事事件組合合而成。。b必然事件件在一定條條件下必必然會發(fā)發(fā)生的事事件(certainevent),用Ω表示。例例如,,一個大大氣壓下下,水加加熱到100C,水會沸沸騰;種種瓜得瓜瓜、種豆豆得豆。。c不可能事事件在一定條條件下不不可能發(fā)發(fā)生的事事件(impossibleevent),用ф表示。例例如,在在滿足一一定孵化化條件下下,從石石頭孵化化出小雞雞,就是是一個不不可能事事件。必然事件件與不可可能事件件實際上上是確定定性現(xiàn)象象,它們們不是隨隨機事件件,但但是為為了方便便起見,,我們把把它們看看作為兩兩個特殊殊的隨機機事件。。1.2..1概率統(tǒng)計計定義研究隨機機試驗,,僅知道道可能發(fā)發(fā)生哪些些隨機事事件是不不夠的,,還需了了解各種種隨機事事件發(fā)生生的可能能性大小小,以揭揭示這些些事件的的內在的的統(tǒng)計規(guī)規(guī)律性,,從而指指導實踐踐。這就要求求有一個個能夠刻劃事件件發(fā)生可可能性大大小的數(shù)數(shù)量指標標,這個指指標應該該是事件件本身所所固有的的,且不不隨人的的主觀意意志而改改變,稱稱之為概概率(probability)。事件件A的概率記記為P(A)。概率:刻刻劃事件件發(fā)生可可能性大大小的數(shù)數(shù)量指標標1.2概率率統(tǒng)計概率率定義::在相同條條件下進進行n次重復試試驗,如如果隨機機事件A發(fā)生的次次數(shù)為m,那么m/n稱為隨機機事件A的頻率(frequency);當試試驗重復復數(shù)n逐漸增大大時,隨隨機事件件A的頻率越越來越穩(wěn)穩(wěn)定地接接近某一一數(shù)值p,那么么就把p稱為隨機機事件A的概率。。如此定義義的概率率稱為統(tǒng)統(tǒng)計概率率(statisticsprobability),或者者稱后驗驗概率((posteriorprobability)。例:為了了確定拋拋擲一枚枚硬幣出出現(xiàn)正面面朝上這這個事件件的概率率,歷歷史上有有人作過過成千上上萬次拋拋擲硬幣幣的試驗驗。下表表列出了了他們的的試驗記記錄。可看出,,隨著實實驗次數(shù)數(shù)的增多多,正面面朝上這這個事件件發(fā)生的的頻率越越來越穩(wěn)穩(wěn)定地接接近0.5,我們就就把0.5作為這個個事件的的概率。。在一般情情況下,,隨機事事件的概概率p是不可能能準確得得到的。。通常以以試驗次次數(shù)n充分大時時隨機事事件A的頻率作作為該隨隨機事件件概率的的近似值值。即P(A)=p≈m//n(n充分大))1.2..2概率的性性質(1)對于任任何事件件A,有0≤P(A)≤1;(2)必然事事件的概概率為1,即P(Ω)=1;(3)不可能能事件的的概率為為0,即P(ф)=0。2.1隨機變量量描述隨機機事件的的變量稱稱為隨機機變量。。隨機變量量的取值值在一次次試驗前前不能確確定,具具有隨機機性。做一次試試驗,其其結果有有多種可可能。每每一種可可能結果果都可用用一個數(shù)數(shù)來表示示,把這這些數(shù)作作為變量x的取值,則試驗驗結果可可用變量量x來表示。?!纠繉?0種品牌袋袋裝奶粉粉進行質質量檢測測,其可可能結果果是“0種合格””、““1種合格””、“2種合格””、“…”、“10種袋裝奶奶粉都合合格”。。若用x表示袋裝裝奶粉合合格品牌牌數(shù),則則x的取值為為0、1、2、…、10。2、概率分分布事件的概概率表示示一次試試驗某一一個結果果發(fā)生的的可能性性大小。。必須知知道隨機機試驗的的概率分分布?!纠渴称芳庸すぶ懈邷販貧⒕煽赡芙Y果果只有兩兩種,即即“全部殺死死細菌”與“未能全部部殺死細細菌”。若用用變量x表示試驗驗的兩種種結果,,則可令令x=0表示“未能全部部殺死細細菌”,x=1表示“全部殺死死細菌”。【例】測定關中中地區(qū)不不同小麥麥品種的的蛋白質質含量,,其蛋白白質含量量在9.3--13..5%之間,,如用x表示測定定結果,,那么x值可以是是這個范范圍內的的任何實實數(shù)。離散型隨隨機變量量:如果表表示試驗驗結果的的變量x,其可能能取值為為可列個個,且且以各種種確定的的概率取取這些不不同的值值(discreterandomvariable);連續(xù)型隨隨機變量量:如果表示示試驗結結果的變變量x,其可能能取值為為某范圍圍內的任任何數(shù)值值,且且x在其取值值范圍內內的任一一區(qū)間中中取值時時,其概概率是確確定的(continuousrandomvariable))。試驗結果果和取此此結果的的概率可可以一一一列出。。不能列出出試驗結結果和取取此結果果的概率率,只能能給出一一定范圍圍和在此此范圍內內取值的的概率。。要了解離離散型隨隨機變量量x的統(tǒng)計規(guī)規(guī)律,就就必須知知道它的的一切可可能值xi及取每種種可能值值的概率率pi。離散型隨隨機變量量x的概率分分布或分分布,常常用分布布列(distributionseries)來表示::如果我們們將離散散型隨機機變量x的一切可可能取值值xi(i=1,2,,…)),及及其對對應的概概率pi,記作P(x=xi)=pii=1,2,…((3—3)2.2離散型隨隨機變量量的概率分布布從分布列列可以一一目了然然看出隨隨機變量量X的可能取取值及取取這些值值的概率率。離散型隨隨機變量量的概率率分布具具有pi≥0和Σpi=1這兩個基基本性質質。100聽罐頭凈凈重的次次數(shù)分布布組限組中值(x)頻率(f)頻率/組距329.5-33110.003333332.5-33410.003333335.5-33760.02338.5-340210.07341.5-343320.106667344.5-346230.076667347.5-349120.04350.5-35220.006667353.5-35510.003333356.5-35810.003333圖為數(shù)據(jù)據(jù)資料的的頻率分分布直方方圖,,圖中縱縱座標取取頻率與與組距的的比值。如果樣本取得得越來越越大(n→+∞)),組分得得越來越越細(i→0),某一范范圍內的的頻率將將趨近于于一個穩(wěn)穩(wěn)定值--概率。這時,,頻頻率分布布直方圖圖各個直直方上端端中點的的連線--頻率分布布折線將逐漸趨趨向于一一條曲線線。頻率分布布密度曲曲線連續(xù)型隨隨機變量量(如身高、、體重等等)的概率分分布不能能用分布列來表示,,因為為其可能能取值是是不可數(shù)數(shù)的,不不能一一一列出。。改用隨機變量量x在某個區(qū)區(qū)間內取取值的概概率P(a≤x<<b)來表示。。2.3連續(xù)型隨隨機變量量的概率率分布當n→+∞、組距i→0時,頻率率分布折折線的極極限是一一條穩(wěn)定定的函數(shù)數(shù)曲線。。對于于樣本是是取自連連續(xù)型隨隨機變量量的情況況,這這條函數(shù)數(shù)曲線將將是光滑滑的。這這條曲曲線排除除了抽樣樣和測量量的誤差差,完完全反反映了數(shù)數(shù)據(jù)資料料的變動動規(guī)律。。這條條曲線叫叫概率分布布密度曲曲線,相應的的函數(shù)叫叫概率分布布密度函函數(shù),簡稱分分布密度度。上式為為連續(xù)型型隨機變變量x在區(qū)間[a,b]上取值概概率的表表達式。。連續(xù)型型隨機變變量的概概率由概率分布布密度函函數(shù)確定。若變量X概率分布布密度函函數(shù)記為f(x)),則x取值于區(qū)區(qū)間[a,b)的概率率為圖中中陰影部部分的面面積,即即P(a≤≤x<b)=連續(xù)型隨隨機變量量概率分分布的性性質:分布密度度函數(shù)總總是大于于或等于于0,即f(x))≥0;當隨機變變量x取某一特特定值時時,其概概率等于于0;即(c為任意實實數(shù))所以,對對于連續(xù)續(xù)型隨機機變量,,僅研究究其在某某一個區(qū)區(qū)間內取取值的概概率,而而不去討討論取某某一個值值(點))的概率率。連續(xù)型隨隨機變量量某一點點的概率率為0。③隨機變量量x取值在在-∞<x<+∞范圍內,,所以上式表示示分布密密度曲線線與橫軸軸所圍成成的區(qū)間間全部部面積為為1。P(a≤x<b)=④隨機變量量X取〔a,b)區(qū)間值值的概率率為:3理論分布布3.1二項分布布3.1..1貝努利試試驗及其其概率公公式貝努利試試驗:對對于n次獨立的的試驗,,如如果每次次試驗結結果出現(xiàn)現(xiàn)且只出出現(xiàn)對立立事件A與之之一一,在在每次試試驗中出出現(xiàn)A的概率是是常數(shù)p(0<p<1),因而而出現(xiàn)對對立事件件的的概概率是1-p==q,則稱稱這一串串重復的的獨立試試驗為n重貝努利利試驗,,簡稱貝貝努利試試驗(Bernoullitrials))。重要的離離散型分分布只有兩種種可能結結果的隨隨機試驗驗稱為貝貝努利試試驗食品抽樣樣中,產產品合格格或不合合格,種種子發(fā)芽芽或不發(fā)發(fā)芽,施施藥后害害蟲死或或活等等等。貝努利試試驗的概概率公式式在貝努利利試驗中中,事件件A可能發(fā)生生,也可可能不發(fā)發(fā)生,用用隨機變變量x表示貝努努利試驗驗的兩種種結果,,記A發(fā)生時取取1,A不發(fā)生時時取0。那么,,貝努利利試驗的的概率公公式可以以表示為為:P(x=1)=pP(x=0)=q其中x=1,A事件發(fā)生,成功0,A事件未發(fā)生,失敗也稱為兩兩點分布布在n重貝努利利試驗中中,事件件A可能發(fā)生生0,1,2,…,n次,現(xiàn)在在我們來來求事件件A恰好發(fā)生生k(0≤k≤n)次的概率率Pn(k)。事件A在n次試驗中中正好發(fā)發(fā)生k次共有種種情情況。由由貝努利利試驗的的獨立性性可知,,A在k次實驗中中發(fā)生,,而在其其余n-k次試驗中中不發(fā)生生的概率率為3.1..2二項分布布的定義義及其特特點一般,在在n重貝努利利試驗中中,事件件A恰好發(fā)生生k(0≤k≤n)次的概率率為k=0,1,2…,n把(3-1)式稱作二項概率率公式。(3-1)設隨機變變量x所有可能能取的值值為零和和正整數(shù)數(shù):0,1,,2,……,n,且有=k=0,1,2……,n其中p>0,q>0,p+q==1,則稱隨機機變量x服從參數(shù)數(shù)為n和p的二項分分布(binomialdistribution),記為x~B(n,p)。二項分布布是一種種離散型隨隨機變量量的概率率分布。參數(shù)n稱為離散散參數(shù),,只只能取正正整數(shù);;p是連續(xù)參參數(shù),它它能取0與1之間的任任何數(shù)值值(q由p確定,故故不是另另一個獨獨立參數(shù)數(shù))。(1)二項分布布定義(5)(3)(4)(m1<m2)(2)二項分布布的特點點具有概率率分布的的一切性性質,即即:(1)P(x==k)=Pn(k)≥0(k=0,,1,…,n)(2)二項分分布的概概率之和和等于1,即二項分布布由n和p兩個參數(shù)數(shù)決定,,其特點點是:(1)當p值較小且且n不大時,,分布布是偏倚倚的。但但隨著n的增大,,分布布逐漸趨趨于對稱稱,如圖所示;圖n值不同的的二項分分布比較較圖p值不同的的二項分分布比較較(2)當p值趨于于0.5時,分分布趨趨于對對稱,如如圖所所示;(3)對于固固定的n及p,當k增加時,,Pn(k)先隨之增增加并達達到其極極大值,,以后又又下降。。(4)在n較大,np、nq較接近時時,二二項分布布接近于于正態(tài)分分布;當當n→∞時,二項項分布的的極限分分布是正正態(tài)分布布。(1)已知隨隨機變量量x~B(n,p),求x正好有k次發(fā)生的的概率。?!纠坑幸慌呈称罚淦浜细衤事蕿?.85,今在該該批食品品中隨機機抽取6份該食品品,求正正好有5份食品合合格的概概率?由題意可可知,食食品抽檢檢結果有有兩種可可能,合合格與不不合格,,合格率率為0.85,即P(A))=0..85,相應不不合格率率為P())=1-0..85=0.15,由概率率公式得得,正好好有5個合格產產品的概概率為::3.1..3二項分布布的概率率計算及及應用條條件(2)已知隨隨機變量量x~B(n,p),求x最多發(fā)生生k次的概率率。例:有一一批食品品,其合合格率為為0.85,今在該該批食品品中隨機機抽取6份該食品品,最多多有4個合格的的概率是是多少??當產品最最多有k個合格時時,即可可能的合合格數(shù)為為0,1,2,…,k,那么為最多有有k個合格產產品的概概率。在本例中中,二項分布布的應用用條件::(1)各觀察察單位只只具有相相互對立立的一種種結果,,如合格格或不合合格,生生存或或死亡等等等,非非此即彼彼;(2)已知發(fā)發(fā)生某一一結果(如死亡)的概率為為p,其對立立結果的的概率則則為1-P==q,實際中中要求p是從大量量觀察中中獲得的的比較穩(wěn)穩(wěn)定的數(shù)數(shù)值;(3)n次觀察結結果互相相獨立,,即每個個觀察單單位的觀觀察結果果不會影影響到其其它觀察察單位的的觀察結結果。統(tǒng)計學證證明,服服從二項項分布B(n,p)的隨機變變量x的平均數(shù)數(shù)μ、標準差差σ與參數(shù)n、p有如下關關系。設x~B(n,p),那么么,二項項分布的的總體特特征數(shù)為為:均值μ=標準差σ=方差σ2=3.1..4二項分布布的平均均數(shù)與標標準差地信16,9..283.2波松分布布(Poissondistribution)波松分布布是一種種可以用用來描述述和分析析隨機地地發(fā)生在在單位空空間或時時間里的的稀有事件件的概率分分布。要要觀察到到這類事事件,樣樣本含量量n必須很大大。稀有事件件即是小小概率事事件,在生物、醫(yī)醫(yī)學等研研究中,,服從波波松分布布的隨機機變量也也是常見見的。例如,正正常生產產線中單單位事件件生產出出不合格格產品個個數(shù),單單位事件件內機器器出現(xiàn)故故障的次次數(shù),每每升飲水水中大腸腸桿菌數(shù)數(shù),計數(shù)數(shù)器小方方格中血血球數(shù),,一批批香腸中中含有毛毛發(fā)的香香腸數(shù),,1000袋面粉中中含有金金屬物的的袋數(shù)等等等,都都是服從從或近似似服從波波松分布布的。若隨機變變量x(x==k)所有可能能取值是是非負整整數(shù),且且其概率率分布為為其中λ>0;e=2..7182…,則稱x服從參數(shù)數(shù)為λ的波松分分布(Poisson‘sdistribution)),記為為x~P(λ)。k=0,1,……3.2..1波松分布布的定義義λ是波松分分布所依依賴的唯唯一參數(shù)數(shù)。λ值愈小分分布愈偏偏倚,隨隨著λ的增大,,分布布趨于對對稱。當λ=20時分布接接近于正正態(tài)分布布;當λ=50時可以認認為波松松分布呈呈正態(tài)分分布。在實際工工作中,,當λ≥20時就可以以用正態(tài)態(tài)分布來來近似地地處理波波松分布布的問題題。波松分布布為離散型隨隨機變量量的概率分分布,其其平均數(shù)數(shù)和方差差相等,,都等于于常數(shù)λ,即3.2..2波松分布布重要的的特征μ=σ2=λ圖不同λ的泊松分分布由波松分分布的概概率計算算公式可可以看出出,依賴賴于參數(shù)數(shù)λ的確定,,只要參參數(shù)λ確定了,,把k=0,1,2,…代入即可可求得各各項的概概率。在大多數(shù)數(shù)服從波波松分布布的實例例中,分分布參數(shù)數(shù)λ往往是未未知的,,只能從從所觀察察的隨機機樣本中中計算出出相應的的樣本平平均數(shù)作作為λ的估計值值,將其其代替計計算公式式中的λ,計算出出k=0,1,2,…時的各項項概率。。3.2..3波松分布布的概率率計算【例】為監(jiān)測飲飲用水的的污染情情況,現(xiàn)現(xiàn)檢驗驗某社區(qū)區(qū)每毫升升飲用水水中細菌菌數(shù),,共得得400個記錄如如下表。。試分分析飲用用水中細細菌數(shù)的的分布是是否服從從波松分分布?若若服從,,按波松松分布計計算每毫毫升水中中細菌數(shù)數(shù)的概率率及理論論次數(shù)并并將頻率率分布與與波松分分布作直直觀比較較。經(jīng)計算得得每毫升升水中平平均細菌菌數(shù)=0.500,,方差S2=0.496。兩者很接接近,故故可認認為每毫毫升水中中細菌數(shù)數(shù)服從波波松分布布。以=0.500代替λ,得(k=0,1,2……)計算結果果如表所所示。μ=σ2=λ平均數(shù)采采用加權權法計算算如何計算算可見細菌菌數(shù)的頻頻率分布布與λ=0..5的波松分分布是相相當吻合合的,,進一一步說明明用波松松分布描描述單位位容積(或面積)中細菌數(shù)數(shù)的分布布是適宜宜的。細菌數(shù)的的波松分分布注意,二二項分布布的應用用條件也也是波松松分布的的應用條條件。比比如二項項分布要要求n次試驗是是相互獨獨立的,,這也是是波松分分布的要要求。然而一些些具有傳傳染性的的罕見疾疾病的發(fā)發(fā)病數(shù),,因為首首例發(fā)生生之后可可成為傳傳染源,,會影響響到后續(xù)續(xù)病例的的發(fā)生,,所以不不符合波波松分布布的應用用條件。。對于在單單位時間間、單位位面積或或單位容容積內,,所觀察察的稀有有事件由由于某些些原因分分布不隨隨機時,,如細菌菌在牛奶奶中成集集落存在在時,不不呈波松松分布,,不能用用波松分分布來描描述其發(fā)發(fā)生規(guī)律律。3.2..4波松分布布應用條條件3.3正態(tài)分布布(normaldistribution)正態(tài)分布布是一種種很重要要的連續(xù)續(xù)型隨機機變量的的概率分分布。自然現(xiàn)象象中有許許多變量量是服從從或近似似服從正正態(tài)分布布的。如如食品中中各種成成分的含含量、有有害物質質殘留量量、瓶裝裝食品的的重量、、分析測測定過程程中的隨隨機誤差差等等。。許多統(tǒng)計計分析方方法都是是以正態(tài)態(tài)分布為為基礎的的。此外外,還有有不少隨隨機變量量的概率率分布在在一定條條件下以以正態(tài)分分布為其其極限分分布。因此在統(tǒng)統(tǒng)計學中中,正態(tài)態(tài)分布無無論在理理論研究究上還是是實際應應用中,,均占有有十分重重要的地地位。(地科16,9-28)(1)正態(tài)分布布的定義義若連續(xù)型型隨機變變量x的概率分布布密度函函數(shù)為其中μ為平均數(shù)數(shù),σ2為方差,,則稱隨隨機變量量x服從正態(tài)態(tài)分布,,記為x~N(μ,σσ2)。相應的的概率分布布函數(shù)為(3-3)3.3..1正態(tài)分布布的定義義及其特特征圖正態(tài)分布布密度((函數(shù)))曲線正態(tài)分布布密度曲曲線是單單峰、對對稱的懸懸鐘形曲曲線,對對稱軸為為x=μ;f(x))在x=μ處達到極極大,,極大值值f(x))是非負函函數(shù),以以x軸為漸近近線,分分布從-∞至+∞;曲線在x=μ±σσ處各有一一個拐點點,即曲曲線在(-∞,,μ-σσ)和(μ+σσ,+∞∞)區(qū)間上是是下凸的的,在[μ-σσ,μ++σ]區(qū)間內是是上凸的的;正態(tài)分布布有兩個個參數(shù),,即平均均數(shù)μ和標準差差σ。(2)正態(tài)分布布的特征征圖σ相同而μ不同的3個正態(tài)分分布比較較μ是位置參參數(shù),如如圖所示示。當當σ恒定時,,μ愈大,則則曲線沿沿x軸愈向右右移動;;反之,,μ愈小,曲曲線沿x軸愈向左左移動。。圖3-6μ相同而σ不同的3個正態(tài)分分布比較較大σ是形狀參參數(shù),如如圖示示。當當μ恒定時,,σ愈大,表表示x的取值愈愈分散,,曲線線愈“胖胖”;σ愈小,x的取值愈愈集中在在μ附近,曲曲線愈““瘦”。。分布密度度曲線與與橫軸所所圍成的的區(qū)間面面積為1,即:正態(tài)分布布的次數(shù)數(shù)多數(shù)集集中在平平均數(shù)μ的附近,,離均數(shù)數(shù)越遠,,其相應應次數(shù)越越少,在在3σ以外的極極少,這這就是食食品工業(yè)業(yè)控制中中的3σ原理的基基礎。正態(tài)分布布是依賴賴于參數(shù)數(shù)μ和σ2(或σ)的一簇分分布,正正態(tài)曲線線的位置置及形態(tài)態(tài)隨μ和σ2的不同而而不同。。這就就給研究究具體的的正態(tài)總總體帶來來困難,,通常常將一般般的N(μ,σ2)轉換為為μ=0,σ2=1的正態(tài)分分布。3.3..2標準正態(tài)態(tài)分布μ=0,,σ2=1的正態(tài)分分布為標標準正態(tài)態(tài)分布(standardnormaldistribution)。對于任何何一個服服從正態(tài)態(tài)分布N(μ,σσ2)的隨機變變量x,都可以以通過標標準化變變換,u=(x-μ)/σ將其變換換為服從從標準正正態(tài)分布布的隨機機變量u。u稱為標準準正態(tài)變變量或標標準正態(tài)態(tài)離差。。x~N(μ,σ2)x~N(0,1)u=(x-μ)/σ標準正態(tài)態(tài)分布的的概率密密度函數(shù)數(shù)及分布布函數(shù)分分別記作作ψ(u))和Φ(u))μ=0σ=1隨機變量量u服從標準準正態(tài)分分布,記記作u~N(0,1),分布密密度曲線線如圖所所示。(1)標準正態(tài)態(tài)分布的的概率計計算設u服從標準準正態(tài)分分布,則則u在[u1,u2)內取值值的概率率為:=Φ(u2)-Φ(u1)Φ(u1)與Φ(u2)可由附表表2查得。3.3..3正態(tài)分布布的概率率計算例如,u=1.75時,由標準正態(tài)態(tài)分布概概率表可以查出出Φ(1..75))=0..9599有時會遇遇到給定定Φ(u)值,例例如Φ(u)=0..284,反過來來查u值。這時時只需在在附表中中找到與與0.284最接近的的值0.2843,對應查查出相應應的u值為u=-0.57,即Φ(-0.57)=0.284【例3.7】】已知u~N(0,1),試求::(1)P(u<-1.64)=?(2)P(u≥2.58)==?(3)P(|u|≥2.56)=??(4)P(0.34≤u<1.53)==?(1)P(u<-1.64)==1--Φ(1.64)=0.0505(2)P(u≥2.58)==1-ΦΦ(2..58))=0..0049(3)P(|u|≥2.56)=2×(1-Φ((2.56))=2×0.0052=0.0104(4)P(0.34≤u<1.53)=Φ(1.53)-ΦΦ(0..34))=0.93670-0.6331==0.3039對于標準準正態(tài)分分布,特特殊區(qū)間間的概率率為:P(-1≤u<1)=0.6826P(-2≤u<2)=0.9545P(-3≤u<3)=0.9973P(-1.96≤u<1.96)=0.95P(-2..58≤≤u<2.58)=0.99U=(x-μ)/σ標準正態(tài)態(tài)分布的的三個常常用概率率如圖示示u變量在上上述區(qū)間間以外取取值的概概率分別別為:P(|u|≥1)=2Φ(--1)==1-P(-1≤≤u<1)=1-0.6826==0.3174P(|u|≥2)=2Φ(--2)=1-P(-2≤u<2)=1-0.9545==0.0455P(|u|≥3)=1-0..9973=0.0027P(|u|≥1.96)=1--0.95=0.05P(|u|≥2.58)=1--0.99=0.01統(tǒng)計檢驗中常用2.一般正態(tài)態(tài)分布的的概率計計算若隨機變變量x服從正態(tài)態(tài)分布N(μ,σσ2),則x的取值落落在任意意區(qū)間[x1,x2)的概概率,,記作P(x1≤x<x2),等于圖圖中陰影影部分的的面積。。即:圖正態(tài)分布布的概率
對(3-18)式作變換換u=(x-μ)/σ,得dx=σdu,故有(3-18)其中,表明服從從正態(tài)分分布N(μ,σσ2)的隨機變變量x在[x1,x2)內取值值的概率率,等等于服從從標準正正態(tài)分分布的隨隨機變量量u在[(x1-μ)//σ,((x2-μ)//σ)]內取值的的概率。。因此,計計算一般般正態(tài)分分布的概概率時,,只要要將原區(qū)區(qū)間的上上下限作作適當變變換(標準化),就可可用查標標準正態(tài)態(tài)分布的的概率表表的方法法求取某某一區(qū)間間的概率率。【例】已知x~N(100,22),試求求P(100≤x<102))=?。=P(0≤u<1)=Φ(1)-ΦΦ(0))=0..8413-0.5000=0.3413地信16,1013【例】設x服從μ=30.26,σ2=5.102的正態(tài)分分布,試試求P(21..64≤≤x<32.98)。令則u服從標準準正態(tài)分分布,故故=P(-1..69≤≤u<0.53)=Φ(0.53)-ΦΦ(-1.69)=0.7019-0..04551=0.6564關于一般般正態(tài)分分布,以以下幾個個概率(即隨機變變量x落在μ加減不同同倍數(shù)σ區(qū)間的概概率)是經(jīng)常用用到的。。P(μ-σσ≤x<μ+σ))=P(μ-2σ≤x<μ+2σσ)==P(μ-3σ≤x<μ+3σσ)==P(μ-1.96σ≤x<μ+1..96σσ)==P(μ-2.58σ≤x<μ+2..58σσ)=0.68260.95450.99730.950.99在數(shù)理統(tǒng)統(tǒng)計分析析中,不不僅注意意隨機變變量x落在平均均數(shù)加減減不同倍倍數(shù)標準準差區(qū)間間(μ-kσ,μ++kσ)之內的的概率,,更關心的的是x落在此區(qū)區(qū)間之外外的概率率。。把隨機變變量x落在平均均數(shù)μ加減不同同倍數(shù)標標準差σ區(qū)間之外外的概率率稱為雙側概率率(兩尾尾概率)),記作α。對應于雙雙側概率率,也可可以求得得隨機變變量x小于μ-kσ或大于μ+kσ的概率,,稱為單側概率率(一尾尾概率)),記作α/2。圖兩兩尾概率研究總體體與所抽抽取的樣樣本之間間的關系系是統(tǒng)計計學的中中心內容容。對對這種關關系的研研究從兩兩方面著著手:一是從總體到到樣本,這就是是研究抽抽樣分布布(samplingdistribution)的問題;;二是從樣本到到總體,這就是是統(tǒng)計推推斷(statisticalinference)問題。4抽樣分布布(地科15,9-29)統(tǒng)計推斷斷是以總體體分布和和樣本抽抽樣分布布的理論論關系為為基礎的的。為了能正確地地利用樣樣本去推推斷總體體,并能能正確地地理解統(tǒng)統(tǒng)計推斷斷的結論論,必須須對樣本本的抽樣樣分布有有所了解解。由總體中隨隨機地抽抽取若干干個體組組成樣本本,即使使每次抽抽取的樣樣本含量量相等,,其統(tǒng)計計量(如,,S)也將隨著樣本本的不同同而有所不不同,因因而樣本本統(tǒng)計量量也是隨隨機變量量,也有有其概率率分布。我們把樣本統(tǒng)計計量的概率分分布稱為為抽樣分分布。由總體隨機機抽樣(randomsampling)的方法可兩種::返置抽樣樣:每次抽出一個個個體后后,這個個個體返置回原總總體;不返置抽抽樣:每次抽出的個個體不返返置回原原總體。對于無限總體體,返置置與否都都可保證證各個體體被抽到到的機會會相等。對于有限總體體,就應應該采取取返置抽抽樣,否否則各個個體被抽抽到的機機會就不不相等。。4.1樣本平均均數(shù)的抽抽樣分布布設有一個個總體,,總體體平均數(shù)數(shù)為μ,方差為σ2,總體中中各變數(shù)數(shù)為x,將此總體稱為為原總體體。現(xiàn)從從這個總總體中隨隨機抽取樣本本數(shù)為n的樣本,樣樣本平均均數(shù)記為為??梢栽O想想,從原原總體中中可抽出出很多甚甚至無窮窮多個含含量為n的樣本。由由這些樣樣本算得得的平均均數(shù)有大大有小,,不盡相相同,與與原總體體平均數(shù)數(shù)μ相比往往往表現(xiàn)出出不同程程度的差差異。這這種差異異是由隨隨機抽樣樣造成的的,稱稱為抽樣誤差差(samplingerror))。設有一個個總體,,總體體平均數(shù)數(shù)為μ,方差為σ2,總體中中各變量為x,將此總體稱為為原總體體?,F(xiàn)從從這個總總體中隨隨機抽取樣本本數(shù)為n的樣本,樣樣本平均均數(shù)記為為??梢栽O想想,從原原總體中中可抽出出很多甚甚至無窮窮多個含含量為n的樣本。由由這些樣樣本算得得的平均均數(shù)有大大有小,,不盡相相同,與與原總體體平均數(shù)數(shù)μ相比往往往表現(xiàn)出出不同程程度的差差異。這這種差異異是由隨隨機抽樣樣造成的的,稱稱為抽樣誤差差(samplingerror))。總體樣本觀測前樣本值1樣本值2…樣本值n隨抽機樣…(x1,x2,…xn)(x1,x2,…xn)(x1,x2,…xn)樣本值1樣本值2樣本值nX1,X2,…,Xn隨抽機樣樣本總體X觀測以后……………顯然,樣樣本平均均數(shù)也是是一個隨隨機變量量,其概概率分布布叫做樣本平均均數(shù)的抽抽樣分布布。由樣本本平均數(shù)數(shù)構成的的總體稱稱為樣本平均均數(shù)的抽抽樣總體體。其平均均數(shù)和標標準差分分別記為為和。是樣本平均均數(shù)抽樣樣總體的的標準差差,簡稱標準誤(standarderror),它表示平均均數(shù)抽樣樣誤差的的大小。統(tǒng)計學學上已證明總總體的兩個參參數(shù)與x總體的兩兩個參數(shù)數(shù)有如下下關系::(3-19)=μ,(1)若隨機機變量x服從正態(tài)態(tài)分布N(μσσ2),、、、…、是是由x總體得來來的隨機機樣本,,則統(tǒng)計計量=Σx/n的概率分布布也是正正態(tài)分布布,且且有=μ,即~~N(μ,σσ2/n)。(2)若隨機變量量x服從平均數(shù)是是μ,方差是是σ2的分布(不是正態(tài)態(tài)分布);,,,,…,是是由由此總體體得來的的隨機樣樣本,則統(tǒng)計量量=Σx/n的概率分分布,當n相當大時逼近近正態(tài)分分布N(μ,σσ2/n)。這就是是中心極極限定理理。X變量與變變量概率率分布間間的關系系可由下下列兩個個定理說說明:由中心極極限定理理可知,,不論x變量是連續(xù)型型的還是是離散型型的,也也無論x服從何種分布布,一般般只要n>30,就可認認為的的分布布是正態(tài)態(tài)的。若x的分布不很很偏倚,,在n>20時,的的分分布就近近似于正正態(tài)分布布。標準誤(平均數(shù)抽抽樣總體體的標準準差)的大小,,反映樣樣本平均均數(shù)的的抽樣誤差差的大小,,即精確確性的高高低。。標準準誤大,,說明各各樣本平平均數(shù)間間差異異程度大大,樣本本平均數(shù)數(shù)的精確確性低。。反之,,小小,說說明間的的差異程程度小,,樣樣本平均均數(shù)的精精確性高高。的的大小與與原總體體的標準準差σ成正比,,與樣本本含量n的平方根成成反比。。從特定總總體抽樣樣時,,因為σ是一常數(shù)數(shù),所所以只有有增大樣樣本含量量才能降降低樣本本平均數(shù)數(shù)的的抽樣誤誤差。均數(shù)標準準誤但在實際際工作中中,總體體標準差差σ往往是未未知的,,因而無無法求得得。。此此時,可可用樣本本標準差差S估計σ。于是,,以估估計。。記為為,,稱作作樣本標準準誤或均均數(shù)標準準誤。樣本標準誤是平均數(shù)數(shù)抽樣誤誤差的估估計值。若樣本本中各觀觀測值為為,,,,…,,,則則注意,樣樣本標準準差與樣樣本標準準誤是既既有聯(lián)系系又有區(qū)區(qū)別的兩兩個統(tǒng)計計量,(3-20)式已表明明了二者者的聯(lián)系系。二者者的區(qū)別別在于::樣本標準準差S是反映樣樣本中各觀測測值,,,,…,變變異程程度度大小的的一個指指標,它它的大小小說明了了對該樣本本代表性的的強弱。。樣本標準準誤是樣樣本平均均數(shù)的的標準準差,它它是抽樣樣誤差的的估計值值,其其大小說說明了樣樣本間變變異程度度的大小小及精確性的的高低。。對于大樣樣本資料料,常將將樣本標準準差S與樣本平均均數(shù)配配合使用用,記為為±S,用以說說明所考考察性狀狀或指標標的優(yōu)良良性與穩(wěn)穩(wěn)定性。。對于小樣樣本資
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度風力發(fā)電項目風機設備采購與投資分析合同
- 2025年度智能制造對賭協(xié)議約定倍收益合作協(xié)議
- 二零二五年度林地使用權變更及補償合同
- 2025年度藥店藥店藥品知識產權保護聘用勞動合同
- 股權代持協(xié)議書標準模板:2025年度股權激勵適用
- 2025年度森林土地承包與林木撫育合作協(xié)議
- 二零二五年度企業(yè)內部員工外出安全免責合同
- 二零二五年度汽車零部件貨物運輸保險協(xié)議
- 二零二五年度歷史文化街區(qū)拆除搬遷保護協(xié)議
- 2025年度服裝廠職工勞動合同模板書(智能化工廠)
- 2024解析:第九章液體壓強-基礎練(解析版)
- 2024解析:第十章 浮力、阿基米德原理及其應用-講核心(解析版)
- 隱睪手術配合
- 華東師范大學《社會學概論》2023-2024學年第一學期期末試卷
- 建筑工程財務流程制度(6篇)
- 閥門培訓課件
- 2024年四川省公務員錄用考試《行測》真題及答案解析
- 2024全新醫(yī)務人員手衛(wèi)生課件
- 高考英語一輪復習知識清單(全國版)專題01++定語從句十大考點歸納(清單)+含答案及解析
- 培訓機構收費退費管理規(guī)定
- 愛學習平臺登錄入口
評論
0/150
提交評論