版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第五
章概率分布與抽樣分布第一節(jié)隨機(jī)事件與概率分布第二節(jié)抽樣分布及其性質(zhì)學(xué)習(xí)目標(biāo)了解隨機(jī)事件及概率分布理解抽樣分布的意義了解抽樣分布的形成過(guò)程理解中心極限定理理解抽樣分布的性質(zhì)第一節(jié)隨機(jī)事件與概率分布一、隨機(jī)試驗(yàn)與隨機(jī)事件必然現(xiàn)象(確定性現(xiàn)象)變化結(jié)果是事先可以確定的,一定的條件必然導(dǎo)致某一結(jié)果這種關(guān)系通??梢杂霉交蚨蓙?lái)表示隨機(jī)現(xiàn)象(有不確定性,但不等同于偶然現(xiàn)象)在相同條件下可能發(fā)生也可能不發(fā)生的現(xiàn)象個(gè)別觀察的結(jié)果完全是偶然的、隨機(jī)會(huì)而定大量觀察的結(jié)果會(huì)呈現(xiàn)出某種規(guī)律性
(隨機(jī)性中寓含著規(guī)律性)
——統(tǒng)計(jì)規(guī)律性十五的夜晚能看見月亮?十五的月亮比初十圓!隨機(jī)試驗(yàn)嚴(yán)格意義上的隨機(jī)試驗(yàn)滿足三個(gè)條件:試驗(yàn)可以在相同的條件下重復(fù)進(jìn)行;每次試驗(yàn)的可能結(jié)果不止一個(gè),但試驗(yàn)的所有可能結(jié)果在試驗(yàn)之前是明確可知的;每次試驗(yàn)只能觀察到可能結(jié)果中的一個(gè),但在試驗(yàn)結(jié)束之前不能肯定哪一個(gè)結(jié)果會(huì)出現(xiàn)。廣義的隨機(jī)試驗(yàn)是指對(duì)隨機(jī)現(xiàn)象的觀察(或?qū)嶒?yàn))實(shí)際應(yīng)用中多數(shù)試驗(yàn)不能同時(shí)滿足上述條件,常常從廣義角度來(lái)理解。隨機(jī)事件(事件)隨機(jī)事件(簡(jiǎn)稱事件)隨機(jī)試驗(yàn)的每一個(gè)可能結(jié)果常用大寫英文字母A、B、……、來(lái)表示基本事件(樣本點(diǎn))——中國(guó)足球隊(duì)勝、負(fù)、平不可能再分成為兩個(gè)或更多事件的事件:樣本空間(Ω)在一項(xiàng)隨機(jī)試驗(yàn)中,每一個(gè)基本事件稱為一個(gè)樣本點(diǎn),而所有樣本點(diǎn)構(gòu)成這項(xiàng)試驗(yàn)的樣本空間。顯然,樣本空間等同于集合論中的全集,基本事件對(duì)應(yīng)于全集中的元素,滿足某些規(guī)定性質(zhì)的隨機(jī)事件就是集合論中的一個(gè)子集。隨機(jī)事件(續(xù))隨機(jī)事件的兩種特例必然事件在一定條件下,每次試驗(yàn)都必然發(fā)生的事件必然事件發(fā)生的概率為1
不可能事件在一定條件下,每次試驗(yàn)都必然不會(huì)發(fā)生的事件不可能事件是一個(gè)空集(Φ)二、隨機(jī)事件的概率概率用來(lái)度量隨機(jī)事件發(fā)生的可能性大小的數(shù)值必然事件的概率為1,表示為P(
)=1不可能事件發(fā)生的可能性是零,P(
)=0隨機(jī)事件A的概率介于0和1之間,0<P(A)<1概率的統(tǒng)計(jì)定義當(dāng)試驗(yàn)次數(shù)n
很大時(shí),事件A發(fā)生頻率m/n穩(wěn)定地在某一常數(shù)p上下波動(dòng),而且這種波動(dòng)的幅度一般會(huì)隨著試驗(yàn)次數(shù)增加而縮小,則定義p為事件A發(fā)生的概率當(dāng)n相當(dāng)大時(shí),可用事件發(fā)生的頻率m/n作為其概率的一個(gè)近似值——計(jì)算概率的統(tǒng)計(jì)方法(頻率方法):貝努利概型事件的概率例如,投擲一枚硬幣,出現(xiàn)正面和反面的頻率,隨著投擲次數(shù)n的增大,出現(xiàn)正面和反面的頻率穩(wěn)定在1/2左右試驗(yàn)的次數(shù)正面/試驗(yàn)次數(shù)1.000.000.250.500.750255075100125實(shí)驗(yàn)次數(shù)正面正面/實(shí)驗(yàn)次數(shù)111.00210.50310.33410.25520.40630.50740.57850.63960.671070.701180.731290.751390.691490.641590.6016100.6317100.5918100.5619110.5820120.6021130.6222140.6423150.6524160.6725160.64歷史上有很多人都曾經(jīng)做過(guò)拋硬幣試驗(yàn):試驗(yàn)者試驗(yàn)次數(shù)正面出現(xiàn)的頻率蒲豐40400.5069K.皮爾遜120000.5016K.皮爾遜240000.5005羅曼諾夫斯基806400.4979三、隨機(jī)變量的概念隨機(jī)變量——表示隨機(jī)試驗(yàn)結(jié)果的變量取值是隨機(jī)的,事先不能確定取哪一個(gè)值一個(gè)取值對(duì)應(yīng)隨機(jī)試驗(yàn)的一個(gè)可能結(jié)果用大寫字母如X、Y、Z...來(lái)表示,具體取值則用相應(yīng)的小寫字母如x、y、z…來(lái)表示根據(jù)取值特點(diǎn)的不同,可分為:離散型隨機(jī)變量——取值可以一一列舉連續(xù)型隨機(jī)變量——取值不能一一列舉離散型隨機(jī)變量隨機(jī)變量X取有限個(gè)值或所有取值都可以逐個(gè)列舉出來(lái)X1,X2,…以確定的概率取這些不同的值離散型隨機(jī)變量的一些例子試驗(yàn)隨機(jī)變量可能的取值抽查100個(gè)產(chǎn)品一家餐館營(yíng)業(yè)一天電腦公司一個(gè)月的銷售銷售一輛汽車取到次品的個(gè)數(shù)顧客數(shù)銷售量顧客性別0,1,2,…,1000,1,2,…0,1,2,…男性為0,女性為1連續(xù)型隨機(jī)變量隨機(jī)變量X取無(wú)限個(gè)值所有可能取值不可以逐個(gè)列舉出來(lái),而是取數(shù)軸上某一區(qū)間內(nèi)的任意點(diǎn)連續(xù)型隨機(jī)變量的一些例子試驗(yàn)隨機(jī)變量可能的取值抽查一批電子元件新建一座住宅樓測(cè)量一個(gè)產(chǎn)品的長(zhǎng)度使用壽命(小時(shí))半年后工程完成的百分比測(cè)量誤差(cm)X00
X100X0四、隨機(jī)變量的概率分布
1.離散型隨機(jī)變量的概率分布
2.連續(xù)型隨機(jī)變量的概率密度
3.分布函數(shù)不同的隨機(jī)試驗(yàn),其樣本空間的具體構(gòu)成千差萬(wàn)別。但是,實(shí)質(zhì)上,如果把具體內(nèi)容抽象掉,將隨機(jī)事件數(shù)量化,就會(huì)發(fā)現(xiàn)許多隨機(jī)試驗(yàn)中概率的計(jì)算具有某種共同性,遵循某一種概率分布模型。只要能找到這些概率分布模型,就會(huì)為我們計(jì)算概率和研究同類隨機(jī)現(xiàn)象的規(guī)律性提供方便?!虼耍S機(jī)變量及其概率分布是描述隨機(jī)現(xiàn)象的重要工具。概率函數(shù)P(X=xi)=pi離散型概率分布的表示:1.離散型隨機(jī)變量的概率分布離散變量X的概率分布
——離散型隨機(jī)變量X的每一個(gè)可能的取值xi與其概率pi(i=1,2,3,…,n)之間所確立的對(duì)應(yīng)關(guān)系稱為這個(gè)離散型隨機(jī)變量的分布。概率分布具有如下兩個(gè)基本性質(zhì):(1)pi≥0,i=1,2,…,n;(2)X=xix1x2…xnP(X=xi)=pip1p2…pn離散型隨機(jī)變量的概率分布
(實(shí)例)【例】如規(guī)定打靶中域Ⅰ得2分,中域Ⅱ得1分,中域Ⅲ及中域外得0分。今某射手每100次射擊,平均有30次中域Ⅰ,60次中域Ⅱ,10次中Ⅲ及中域外。則考察每次射擊得分為0,1,2這一離散型隨機(jī)變量,求其概率分布。射擊得分的概率分布表示:分布圖0.60.30012xP(x)圖3-5例3-9的概率分布X=xi012P(X=xi)pi0.10.60.32.連續(xù)型隨機(jī)變量的概率密度對(duì)于連續(xù)型隨機(jī)變量,我們關(guān)心的往往不是它取某個(gè)特定值的概率,而是該隨機(jī)變量落在一定區(qū)間內(nèi)的概率;連續(xù)型隨機(jī)變量的概率分布只能表示為:數(shù)學(xué)函數(shù)——概率密度函數(shù)f(x)和分布函數(shù)F(x)圖形——概率密度曲線和分布函數(shù)曲線概率密度函數(shù)f(x)的函數(shù)值不是概率;而x軸以上、概率密度曲線下方面積才表示概率。f(x)xab隨機(jī)變量X在一定區(qū)間(a,b)上的概率為:
什么是
概率密度?
連續(xù)數(shù)據(jù)的概率分布:表
零件尺寸的分組表按零件尺寸分組頻數(shù)(個(gè))105~110110~115115~120120~125125~130130~135135~140358141064合計(jì)50頻數(shù)直方圖頻數(shù)(個(gè))1512963105110115120125130135140零件尺寸圖
零件尺寸分布頻數(shù)的直方圖問(wèn)題:曲線下面積為1嗎?連續(xù)數(shù)據(jù)的概率分布:表
零件按尺寸數(shù)據(jù)的分組表按零件尺寸分組頻數(shù)(個(gè))頻率105~110110~115115~120120~125125~130130~135135~1403581410640.060.100.160.280.200.120.08合計(jì)501頻率=頻數(shù)/總數(shù)頻率直方圖頻率
0.32
0.240.180.120.06105110115120125130135140零件尺寸圖
零件尺寸分布頻率的直方圖問(wèn)題:曲線下面積為1嗎?連續(xù)數(shù)據(jù)的概率分布:表
零件按尺寸數(shù)據(jù)的分組表按零件尺寸分組頻數(shù)(個(gè))頻率頻率密度105~110110~115115~120120~125125~130130~135135~1403581410640.060.100.160.280.200.120.080.0120.0200.0320.0560.0400.0240.016合計(jì)501-----頻率密度=頻率/組距頻率密度直方圖頻率密度
0.060
0.0480.0360.0240.012105110115120125130135140
零件尺寸圖
零件尺寸分布頻率密度的直方圖問(wèn)題:曲線下面積為1嗎?頻數(shù)直方圖—頻率直方圖—頻率密度直方圖在頻數(shù)分布直方圖中,如果按各組的頻率密度來(lái)測(cè)定各直條的高,則第i個(gè)直條的面積等于該組的頻率,所有直條的面積之和等于1。與直方圖的直條高為頻率密度相仿,曲線上某一點(diǎn)的縱坐標(biāo)為隨機(jī)變量在相應(yīng)橫坐標(biāo)附近的一個(gè)狹小區(qū)間內(nèi)(在這個(gè)狹小區(qū)間的寬度趨近于零的過(guò)程中)取值概率的概率密度(即概率/區(qū)間寬度)。所以,這條曲線叫做隨機(jī)變量的(分布)密度曲線。今后可以看到,概率密度曲線可以用適當(dāng)?shù)臄?shù)學(xué)解析式來(lái)描述。我們把密度曲線以及相應(yīng)的數(shù)據(jù)解析式所表達(dá)的數(shù)學(xué)函數(shù)關(guān)系稱作隨機(jī)變量的(分布)密度函數(shù)。密度函數(shù)刻畫了連續(xù)型隨機(jī)變量的分布規(guī)律。相對(duì)于由頻率直方圖來(lái)描述的隨機(jī)變量的經(jīng)驗(yàn)分布來(lái)講,由密度函數(shù)所刻畫的連續(xù)型隨機(jī)變量的概率分布規(guī)律稱為它的理論分布。連續(xù)型隨機(jī)變量的分布綜上所述,連續(xù)型隨機(jī)變量X的一系列取值區(qū)間和隨機(jī)變量在該區(qū)間取值的概率之間確立的對(duì)應(yīng)關(guān)系,稱作這個(gè)連續(xù)型隨機(jī)變量的分布。連續(xù)型隨機(jī)變量的分布可以用密度函數(shù)來(lái)描述,隨機(jī)變量X的密度函數(shù)記作f(x)。頻數(shù)分布直方圖是用各組的頻率密度作直條的高來(lái)畫圖的。當(dāng)分組數(shù)無(wú)窮多,而組距(即直條的底邊長(zhǎng)趨近于0時(shí),直方圖演變成平滑的曲線。這時(shí),直條的高就成為f(x)。連續(xù)型隨機(jī)變量X在某一數(shù)值區(qū)間[a,b]
內(nèi)取值的概率等于豎立在該區(qū)間上的、以密度曲線為上底的曲邊梯形的面積。記作:概率密度f(wàn)(x)的性質(zhì)(1)f(x)≥0。概率密度是非負(fù)函數(shù)。(2)即:所有區(qū)域上取值的概率總和為1。只要滿足上述兩條性質(zhì),即可認(rèn)為是一個(gè)概率密度。f(x)xab
隨機(jī)變量X在一定區(qū)間(a,b)上的概率為:
密度曲線是把分布加以理想化之后產(chǎn)生的圖形,對(duì)于描繪大量觀測(cè)值的時(shí)候最為有用。密度曲線的結(jié)構(gòu)是利用曲線底下的面積表示落在該區(qū)的觀測(cè)值的比例。因此,必須選擇適當(dāng)?shù)某叨?,使得曲線底下的面積恰恰是1,這樣就得到一個(gè)密度曲線。3.分布函數(shù)適用于兩類隨機(jī)變量概率分布的描述分布函數(shù)的定義:F(x)=P{X≤x}連續(xù)型隨機(jī)變量的分布函數(shù)離散型隨機(jī)變量的分布函數(shù)
F(x)=f(x)xx0F(x0
)分布函數(shù)與概率密度4.隨機(jī)變量的數(shù)字特征
隨機(jī)變量的數(shù)學(xué)期望
隨機(jī)變量的方差和標(biāo)準(zhǔn)差
兩個(gè)隨機(jī)變量的協(xié)方差和相關(guān)系數(shù)(1)
隨機(jī)變量的數(shù)學(xué)期望又稱均值描述一個(gè)隨機(jī)變量的概率分布的中心位置離散型隨機(jī)變量X的數(shù)學(xué)期望:——相當(dāng)于所有可能取值以概率為權(quán)數(shù)的平均值連續(xù)型隨機(jī)變量X的數(shù)學(xué)期望:數(shù)學(xué)期望的主要數(shù)學(xué)性質(zhì)若k是一常數(shù),則
E(kX)=kE(X)對(duì)于任意兩個(gè)隨機(jī)變量X、Y,有
E(X+Y)=E(X)+E(Y)若兩個(gè)隨機(jī)變量X、Y相互獨(dú)立,則
E(XY)=E(X)E(Y)
(2)隨機(jī)變量的方差方差是它的各個(gè)可能取值偏離其均值的離差平方的均值,記為D(x)或σ2公式:離散型隨機(jī)變量的方差:連續(xù)型隨機(jī)變量的方差:方差和標(biāo)準(zhǔn)差(續(xù))標(biāo)準(zhǔn)差=方差的平方根方差和標(biāo)準(zhǔn)差都反映隨機(jī)變量取值的分散程度。它們的值越大,說(shuō)明離散程度越大,其概率分布曲線越扁平。方差的主要數(shù)學(xué)性質(zhì):若k是一常數(shù),則D(k)=0;D(kX)=k2D(X)
若兩個(gè)隨機(jī)變量X、Y相互獨(dú)立,則
D(X+Y)=D(X)+D(Y)
【例3-10】試求優(yōu)質(zhì)品件數(shù)的數(shù)學(xué)期望、方差和標(biāo)準(zhǔn)差。解:σ=0.6xi012pi0.10.60.3(3)兩個(gè)隨機(jī)變量的協(xié)方差協(xié)方差的定義如果X,Y獨(dú)立(不相關(guān)),則
Cov(X,Y)=0即E(XY)=E(X)E(Y)
協(xié)方差在一定程度上反映了X、Y之間的相關(guān)性協(xié)方差受兩個(gè)變量本身量綱的影響。(4)兩個(gè)隨機(jī)變量的相關(guān)系數(shù)相關(guān)系數(shù)ρ具有如下的性質(zhì):相關(guān)系數(shù)ρ是一個(gè)無(wú)量綱的值
0≤|ρ|≤0當(dāng)ρ=0,兩個(gè)變量不相關(guān)(不存在線性相關(guān))當(dāng)|ρ|=1,兩個(gè)變量完全線性相關(guān)五、常見的概率分布現(xiàn)實(shí)世界中的隨機(jī)現(xiàn)象有無(wú)限多種,相應(yīng)地,隨機(jī)變量及其概率分布也無(wú)窮無(wú)盡。但在不同應(yīng)用背景下,隨機(jī)變量往往具有相同的性質(zhì)。在概率論發(fā)展的歷程中,數(shù)學(xué)家們總結(jié)出了很多概率模型,為我們解決不同類型的大量現(xiàn)實(shí)問(wèn)題提供了極大的方便。常用概率分布及其均值、方差σ2μN(yùn)(μ,σ2)NORMDIST正態(tài)分布(a+b)/2均勻分布np(p=M/N)H(n,N,M)HYPGEOM-DIST超幾何分布λλP(λ)POISSON泊松分布p(1-p)pB(1,p)二點(diǎn)分布np(1-p)npB(n,p)BINOMDIST二項(xiàng)分布方差均值記號(hào)名稱1.二項(xiàng)試驗(yàn)
(貝努里試驗(yàn))二項(xiàng)分布與貝努里試驗(yàn)有關(guān)貝努里試驗(yàn)具有如下屬性試驗(yàn)包含了n
個(gè)相同的試驗(yàn)每次試驗(yàn)只有兩個(gè)可能的結(jié)果,即“成功”和“失敗”出現(xiàn)“成功”的概率p對(duì)每次試驗(yàn)結(jié)果是相同的;“失敗”的概率q也相同,且p+q=1n次試驗(yàn)是相互獨(dú)立的二項(xiàng)分布在n重貝努里試驗(yàn)中,“成功”的次數(shù)X服從參數(shù)為n、p的二項(xiàng)分布,記為X~B(n,p)二項(xiàng)分布的概率函數(shù):二項(xiàng)分布的數(shù)學(xué)期望和方差:n=1時(shí),二項(xiàng)分布就成了二點(diǎn)分布(0-1分布)二項(xiàng)分布圖形p=0.5時(shí),二項(xiàng)分布是以均值為中心對(duì)稱p≠0.5時(shí),二項(xiàng)分布總是非對(duì)稱的p<0.5時(shí)峰值在中心的左側(cè)p>0.5時(shí)峰值在中心的右側(cè)隨著n無(wú)限增大,二項(xiàng)分布趨近于正態(tài)分布p=0.3p=0.5p=0.7二項(xiàng)分布圖示2.泊松分布(應(yīng)用背景)通常是作為稀有事件發(fā)生次數(shù)X的概率分布模型。一段時(shí)間內(nèi)某繁忙十字路口發(fā)生交通事故的次數(shù)一定時(shí)間段內(nèi)某電話交換臺(tái)接到的電話呼叫次數(shù)…服從泊松分布的現(xiàn)象的共同特征在任意兩個(gè)很小的時(shí)間或空間區(qū)間內(nèi)事件發(fā)生次數(shù)是相互獨(dú)立的;各區(qū)間內(nèi)事件發(fā)生次數(shù)只與區(qū)間長(zhǎng)度成比例,與區(qū)間起點(diǎn)無(wú)關(guān);在一段充分小的區(qū)間內(nèi)事件發(fā)生兩次或兩次以上的概率可以忽略不計(jì)泊松分布X服從泊松分布,記為X~P(λ):E(X)=D(X)=λ當(dāng)λ很小時(shí),泊松分布呈偏態(tài),并隨著λ增大而趨于對(duì)稱當(dāng)λ為整數(shù)時(shí),λ和(λ-1)是最可能值3.超幾何分布
N個(gè)單位的有限總體中有M個(gè)單位具有某特征。用不重復(fù)抽樣方法從總體中抽取n個(gè)單位,樣本中具有某種特征的單位數(shù)X服從超幾何分布,記為X~H(n,N,M)數(shù)學(xué)期望和方差:N很大而n相對(duì)很小時(shí),趨于二項(xiàng)分布(p=M/N)4.均勻分布X只在一有限區(qū)間[a,b]上取值且概率密度是一個(gè)常數(shù)其概率密度為:X落在子區(qū)間[c,d]
內(nèi)的概率與該子區(qū)間的長(zhǎng)度成正比,與具體位置無(wú)關(guān)f(x)ac
dbxP(c≤X≤d)5.正態(tài)分布X~N(μ、σ2
),其概率密度為:正態(tài)分布的均值和標(biāo)準(zhǔn)差
均值E(X)=μ
方差D(X)=σ2
-∞<x<∞
正態(tài)密度曲線σ相同而μ不同的正態(tài)密度曲線
2xf(x)μ相同而σ不同的正態(tài)密度曲線f(x)σ較小σ較大x正態(tài)密度曲線的主要特性關(guān)于x=μ對(duì)稱的鐘形曲線參數(shù)μ決定正態(tài)曲線的中心位置參數(shù)σ
決定正態(tài)曲線的陡峭或扁平程度以X軸為漸近線,即當(dāng)x→±∞時(shí),f(x)→0正態(tài)密度曲線的性質(zhì)只要給出了平均數(shù)和標(biāo)準(zhǔn)差,就可以完全描述特定的正態(tài)曲線平均數(shù)決定分布的中心;標(biāo)準(zhǔn)差決定曲線的形狀:標(biāo)準(zhǔn)差就是從平均數(shù)到其左側(cè)或右側(cè)的曲率轉(zhuǎn)變點(diǎn)的距離圖6-12常用的正態(tài)概率值(在一般正態(tài)分布及標(biāo)準(zhǔn)正態(tài)分布中)-3
-2
-10
+1+2+3z-3σ-2σ-σ
+σ
+2σ+3σx99.73%95.45%68.27%3σ
原則(68-95-99.7規(guī)則)圖6-12常用的正態(tài)概率值(在一般正態(tài)分布及標(biāo)準(zhǔn)正態(tài)分布中)
-3
-2
-10
+1+2+3z-3σ-2σ-σ
+σ
+2σ+3σx99.73%95.45%68.27%|X-μ|>3σ的概率很小,因此可認(rèn)為正態(tài)隨機(jī)變量的取值幾乎全部集中在[μ-3σ,μ+3σ]區(qū)間內(nèi)——但要記住,沒(méi)有哪組資料是百分之百用正態(tài)分布描述的,68-95-99.7規(guī)則只是大體正確。利用正態(tài)分布做參數(shù)估計(jì)的圖示x95%的樣本-1.96x+1.96x99%的樣本-2.58x+2.58x90%的樣本-1.65x+1.65xGhiselietal.1981)在他們的研究中指出:要判斷數(shù)據(jù)是否服從正態(tài)分布主要是檢驗(yàn)數(shù)據(jù)的偏度(skewness)和峰度(kurtosis)這兩個(gè)指標(biāo),檢驗(yàn)標(biāo)準(zhǔn)如下:如果數(shù)據(jù)的均值(mean)和中位數(shù)(median)相近,且斜度小于2,峰度值小于5就可以認(rèn)為該數(shù)據(jù)滿足正態(tài)分布要求;如果峰度和斜度的絕對(duì)值都超過(guò)2,那么該樣本數(shù)據(jù)就不滿足正態(tài)分布的要求。參考:符合正態(tài)分布的判斷標(biāo)準(zhǔn)正態(tài)分布最常用、最重要大千世界中許多常見的隨機(jī)現(xiàn)象服從或近似服從正態(tài)分布例如,測(cè)量誤差,同齡人的身高、體重,一批棉紗的抗拉強(qiáng)度,一種設(shè)備的使用壽命,農(nóng)作物的產(chǎn)量…特點(diǎn)是“中間多兩頭少”由于正態(tài)分布特有的數(shù)學(xué)性質(zhì),正態(tài)分布在很多統(tǒng)計(jì)理論中都占有十分重要的地位正態(tài)分布是許多概率分布的極限分布,如二項(xiàng)式分布。根據(jù)中心極限定理,不論總體服從何種分布,只要其數(shù)學(xué)期望和方差存在,對(duì)這一總體進(jìn)行重復(fù)抽樣時(shí),當(dāng)樣本量n充分大,所有樣本之和以及樣本均值就趨于正態(tài)分布。該定理為均值的抽樣推斷奠定了理論基礎(chǔ)。統(tǒng)計(jì)推斷中許多重要的分布(如χ2分布、t分布、F分布)都是在正態(tài)分布的基礎(chǔ)上推導(dǎo)出來(lái)的。用正態(tài)分布近似二項(xiàng)分布用正態(tài)分布近似二項(xiàng)分布的前提n很大,p不能太接近0或1(否則二項(xiàng)分布太偏)一般要求——np和np(1-p)都要大于5如果np
或np(1-p)小于5,二項(xiàng)分布可以用泊松分布來(lái)近似標(biāo)準(zhǔn)正態(tài)分布μ=0、σ=1的正態(tài)分布,記為N(0,1)其概率密度φ(x),分布函數(shù)Ф(x)X~N(μ、σ2),則:Z~N(0,1
)若Z~N(0,1
),則有:
P(|Z|≤a)=2Ф(a)-1Ф(-a)=1-Ф(a)標(biāo)準(zhǔn)化標(biāo)準(zhǔn)正態(tài)曲線
-a
0aφ(z)zΦ(a)【例6-14】例6-14某廠生產(chǎn)的某種節(jié)能燈管的使用壽命服從正態(tài)分布,對(duì)某批產(chǎn)品測(cè)試的結(jié)果,平均使用壽命為1050小時(shí),標(biāo)準(zhǔn)差為200小時(shí)。試求:(a)使用壽命在500小時(shí)以下的燈管占多大比例?(b)使用壽命在850~1450小時(shí)的燈管占多大比例?(c)以均值為中心,95%的燈管的使用壽命在什么范圍內(nèi)?解:
X=使用壽命,X~N(1050,2002
)=Ф(2)-Ф(-1)=0.97725-0.15865=0.818695%的燈管壽命在均值左右392(即658~1442)小時(shí)=1-Ф(2.75)=1-0.99702=0.00298Excel計(jì)算正態(tài)分布的概率值方法一:先標(biāo)準(zhǔn)化——查標(biāo)準(zhǔn)正態(tài)分布函數(shù)值表方法二:利用Excel來(lái)計(jì)算首先標(biāo)準(zhǔn)化,再選擇函數(shù)“NORMSDIST”插入函數(shù)fx——選擇“統(tǒng)計(jì)”-“NORMSDIST”,進(jìn)入“函數(shù)參數(shù)”對(duì)話框中,在Z后填入正態(tài)隨機(jī)變量的Z值;計(jì)算隨機(jī)變量取值小于等于指定Z值的累積概率值。Excel計(jì)算正態(tài)分布的概率值利用Excel來(lái)計(jì)算時(shí),也可不必標(biāo)準(zhǔn)化,此時(shí)應(yīng)利用函數(shù)“NORMDIST”插入函數(shù)fx——選擇“統(tǒng)計(jì)”-“NORMDIST”,進(jìn)入“函數(shù)參數(shù)”對(duì)話框中,在X后填入正態(tài)隨機(jī)變量的取值區(qū)間點(diǎn);在Mean后填入正態(tài)分布的均值;在Standard_dev后填入正態(tài)分布的標(biāo)準(zhǔn)差;在Cumulative后填入1(或TRUE),表示計(jì)算隨機(jī)變量取值小于等于指定值x的累積概率值。已知隨機(jī)變量的取值x,求概率值:也可在選定的輸出單元格中,順次輸入函數(shù)名和參數(shù)值即可如輸入“=NORMDIST(500,1050,200,1)”,確定后即可得到所求概率值0.0029798。已知概率值F(X≤x),求隨機(jī)變量取值的區(qū)間點(diǎn)x:選擇函數(shù)“NORMINV”
如輸入“=NORMINV(0.0029798,1050,200)”,顯示計(jì)算結(jié)果為500?!绻龖B(tài)分布本身已經(jīng)標(biāo)準(zhǔn)化,則可直接使用函數(shù)NORMSDIST和NORMSINV計(jì)算正態(tài)分布的概率值常用概率分布及其均值、方差σ2μN(yùn)(μ,σ2)NORMDIST正態(tài)分布(a+b)/2均勻分布np(p=M/N)H(n,N,M)HYPGEOM-DIST超幾何分布λλP(λ)POISSON泊松分布p(1-p)pB(1,p)二點(diǎn)分布np(1-p)npB(n,p)BINOMDIST二項(xiàng)分布方差均值記號(hào)名稱練習(xí)題1.美國(guó)家庭日常交通費(fèi)用年平均支出為6312美元(Money,2001.8)。假定交通費(fèi)用服從正態(tài)分布。(1)若已知5%的美國(guó)家庭的日常交通費(fèi)用支出低于1000美元,求日常交通費(fèi)用支出的標(biāo)準(zhǔn)差;(2)日常交通費(fèi)用支出最高的3%家庭的年化費(fèi)有多大?2.某公司正考慮提供一項(xiàng)特殊服務(wù)合同,以負(fù)擔(dān)服務(wù)工作所要求的設(shè)備租憑的總成本。根據(jù)經(jīng)驗(yàn),公司經(jīng)理估計(jì)年勞務(wù)成本近似服從正態(tài)分布,均值150元,標(biāo)準(zhǔn)差25元。(1)如果公司以每年200元的價(jià)格向客戶提供這種服務(wù)合同,則一名客戶勞務(wù)成本超過(guò)200元的合同價(jià)格概率是多少?(2)該公司每個(gè)勞務(wù)合同的期望利潤(rùn)是多少?第二節(jié)抽樣分布與中心極限定理一、抽樣分布的概念二、樣本均值的抽樣分布三、樣本比率的抽樣分布四、樣本方差的抽樣分布總體概率分布與抽樣分布:如果已知總體的概率分布,就可以直接利用前面描述統(tǒng)計(jì)的有關(guān)知識(shí)計(jì)算總體的均值和方差等參數(shù);但是,在大多數(shù)的實(shí)踐應(yīng)用中,總體的概率分布是難以確知的,真實(shí)的總體均值和方差也是未知、需要我們進(jìn)行估計(jì)的;因此,我們必須先在總體中抽取樣本,根據(jù)抽樣分布計(jì)算樣本的統(tǒng)計(jì)量,并通過(guò)樣本統(tǒng)計(jì)量去估計(jì)總體參數(shù)??傮w參數(shù)
樣本統(tǒng)計(jì)量平均數(shù)標(biāo)準(zhǔn)差比例參數(shù)統(tǒng)計(jì)量xsp總體樣本樣本統(tǒng)計(jì)量本身是隨機(jī)變量樣本均值,樣本比例,樣本方差等結(jié)果來(lái)自容量相同的所有可能樣本所有樣本指標(biāo)(如均值、比例、方差等)所形成的分布稱為抽樣分布.抽樣分布是樣本統(tǒng)計(jì)量的概率分布,是一種理論分布即在大量重復(fù)抽樣試驗(yàn)的基礎(chǔ)上,根據(jù)統(tǒng)計(jì)量取值的集合以及相應(yīng)的概率,進(jìn)而通過(guò)判斷與比較得到統(tǒng)計(jì)量的概率分布。在實(shí)際應(yīng)用中,統(tǒng)計(jì)量的抽樣分布是通過(guò)數(shù)學(xué)推導(dǎo)或在計(jì)算機(jī)上利用程序進(jìn)行模擬而得到的.提供了樣本統(tǒng)計(jì)量長(zhǎng)遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù)
一、抽樣分布
(samplingdistribution)抽樣分布的形成過(guò)程
(samplingdistribution)總體計(jì)算樣本統(tǒng)計(jì)量如:樣本均值、比例、方差樣本樣本均值x是推斷總體均值
的理論基礎(chǔ)。樣本均值x的抽樣分布的形式與原有總體的分布和樣本容量n
有關(guān)。如果原有總體是正態(tài)分布,則無(wú)論樣本容量大小,樣本均值的抽樣分布都服從正態(tài)分布;如果原有總體的分布是非正態(tài)分布,就要看樣本容量的大小了。隨著樣本容量n的增大(通常要求n>30),樣本均值的抽樣分布將趨于正態(tài)分布;在樣本均值的抽樣分布符合正態(tài)分布條件時(shí),樣本均值的數(shù)學(xué)期望為總體均值,方差為總體方差的
1/n。
——(中心極限定理)二、樣本均值的抽樣分布樣本均值的抽樣分布
(一個(gè)例子)【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體),即總體單位數(shù)N=4。4個(gè)個(gè)體分別為X1=1、X2=2、X3=3、X4=4。總體的均值、方差及分布如下均值和方差總體分布14230.1.2.3樣本均值的抽樣分布
(一個(gè)例子)
現(xiàn)從總體中抽取n=2的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))樣本均值的抽樣分布
(一個(gè)例子)計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)樣本均值的抽樣分布1.00.1.2.3P(x)1.53.04.03.52.02.5x所有樣本均值的均值和方差式中:M為樣本數(shù)目比較及結(jié)論:1.樣本均值的均值(數(shù)學(xué)期望)等于總體均值
2.樣本均值的方差等于總體方差的1/n樣本均值的分布與總體分布的比較抽樣分布=2.5σ2=1.25總體分布14230.1.2.3P(x)1.00.1.2.31.53.04.03.52.02.5x樣本均值的抽樣分布
與中心極限定理=50
=10X總體分布n=4抽樣分布Xn=16當(dāng)總體服從正態(tài)分布N~(μ,σ2)時(shí),來(lái)自該總體的所有容量為n的樣本的均值X也服從正態(tài)分布,X
的數(shù)學(xué)期望為μ,方差為σ2/n。即X~N(μ,σ2/n)中心極限定理
(centrallimittheorem)當(dāng)樣本容量足夠大時(shí)(n
30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為,方差為
2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個(gè)任意分布的總體
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2023年浮標(biāo)式氧氣吸入器項(xiàng)目融資計(jì)劃書
- 生命科學(xué)試題庫(kù)
- 養(yǎng)老院老人生日慶祝制度
- 養(yǎng)老院老人緊急救援服務(wù)質(zhì)量管理制度
- 質(zhì)量管理體系國(guó)家審核員培訓(xùn)考試題
- 房建木工合同范本(2篇)
- 2025年鎮(zhèn)江c1貨運(yùn)從業(yè)資格證模擬考試題
- 2025年合作下載貨運(yùn)從業(yè)資格證模擬考試
- 2025年南寧貨運(yùn)從業(yè)資格證實(shí)操考試題
- 2025年舟山駕??荚囏涍\(yùn)從業(yè)資格證考試
- 化工裝置開車前安全檢查
- 2024年意識(shí)形態(tài)個(gè)人工作總結(jié)(7篇)
- 供水管網(wǎng)改造工程監(jiān)理細(xì)則
- 公開課古典概型省公開課一等獎(jiǎng)全國(guó)示范課微課金獎(jiǎng)?wù)n件
- 跟崗實(shí)踐總結(jié)1500字(3篇)
- 六年級(jí)上冊(cè)心理健康教案-6《健康上網(wǎng)快樂(lè)多》 北師大版
- (高清版)TDT 1013-2013 土地整治項(xiàng)目驗(yàn)收規(guī)程
- 中國(guó)老年2型糖尿病防治指南(2022年版)
- 礦山機(jī)電管理培訓(xùn)課件
- 組合邏輯電路習(xí)題及參考答案
- 粵價(jià)2002370號(hào)-關(guān)于白蟻防治收費(fèi)管理有關(guān)問(wèn)題的通知
評(píng)論
0/150
提交評(píng)論