第抽樣與抽樣分布

上傳人：基*** IP屬地：廣東上傳時(shí)間：2023-03-08 格式：PPT 頁(yè)數(shù)：106 大小：5.86MB 積分：15 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩101頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

目錄抽樣調(diào)查概述抽樣估計(jì)的原理抽樣分布SPSS在概率論中的應(yīng)用當(dāng)前1頁(yè)，總共106頁(yè)。5.1抽樣調(diào)查概述當(dāng)前2頁(yè)，總共106頁(yè)。抽樣調(diào)查：按照一定的規(guī)則從總體中取出一部分單元組成一個(gè)樣本，并收集樣本的數(shù)據(jù)資料的過(guò)程，簡(jiǎn)稱為抽樣。樣本：按照一定的抽樣規(guī)則從總體中抽取的一部分單位組成的集合。根據(jù)抽樣的原則不同，抽樣方法有隨機(jī)抽樣和非隨機(jī)抽樣兩種。隨機(jī)抽樣：根據(jù)一個(gè)已知的概率來(lái)抽取樣本單位，也稱隨機(jī)抽樣非隨機(jī)抽樣：研究人員有意識(shí)地選取樣本單位，樣本單位的選取不是隨機(jī)的。當(dāng)前3頁(yè)，總共106頁(yè)。隨機(jī)抽樣的特點(diǎn):按一定的概率以隨機(jī)原則抽取樣本；抽取樣本時(shí)，使每個(gè)單位都有一定的機(jī)會(huì)被抽中。每個(gè)單位被抽中的概率是已知的，或是可以計(jì)算出來(lái)的；當(dāng)用樣本對(duì)總體目標(biāo)量進(jìn)行估計(jì)時(shí)，要考慮到每個(gè)樣本單位被抽中的概率。當(dāng)前4頁(yè)，總共106頁(yè)。5.1.1簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單隨機(jī)抽樣：從總體N個(gè)單位中抽取n個(gè)單位作為樣本時(shí)，使得每一個(gè)總體單位都有相同的機(jī)會(huì)(概率)被抽中也稱純隨機(jī)抽樣是抽樣調(diào)查中應(yīng)用最多的方法之一也是最基本的抽樣方法之一當(dāng)前5頁(yè)，總共106頁(yè)。簡(jiǎn)單隨機(jī)抽樣抽取元素的具體方法有：重復(fù)抽樣：從總體中抽取一個(gè)單位并加以計(jì)量后，把這個(gè)單位放回到總體中再抽取第二個(gè)單位，直到抽取n個(gè)單位為止；不重復(fù)抽樣：一個(gè)單位被抽中后不再放回總體，然后再?gòu)乃Ｏ碌膯挝恢谐槿〉诙€(gè)單位，直到抽出n個(gè)單位為止。當(dāng)前6頁(yè)，總共106頁(yè)。特點(diǎn)：簡(jiǎn)單、直觀，在抽樣框完整時(shí)，可直接從中抽取樣本；用樣本統(tǒng)計(jì)量對(duì)目標(biāo)量進(jìn)行估計(jì)比較方便。局限性：當(dāng)N很大時(shí)，不易構(gòu)造抽樣框；抽出的單位很分散，給實(shí)施調(diào)查增加了困難；沒(méi)有利用其他輔助信息以提高估計(jì)的效率。當(dāng)前7頁(yè)，總共106頁(yè)。5.1.2分層抽樣分層抽樣：在抽樣之前先將總體的單位按某種特征或某種規(guī)則劃分為若干層（類），然后從不同的層中獨(dú)立、隨機(jī)地抽取一定數(shù)量的單位組成一個(gè)樣本，也稱分類抽樣（stratifiedsampling）。在分層或分類時(shí)，應(yīng)使層內(nèi)各單位的差異盡可能小，而使層與層之間的差異盡可能大。當(dāng)前8頁(yè)，總共106頁(yè)。分層抽樣的優(yōu)點(diǎn)：既可以對(duì)總體進(jìn)行估計(jì)，也可以對(duì)各層的子總體進(jìn)行估計(jì)；抽樣的組織和實(shí)施都比較方便；分層抽樣的樣本分布在各個(gè)層內(nèi)，從而使樣本在總體中的分布比較均勻；估計(jì)的精度高。當(dāng)前9頁(yè)，總共106頁(yè)。5.1.3系統(tǒng)抽樣系統(tǒng)抽樣：在抽樣中先將總體各單位按某種順序排列，并按某種規(guī)則在一定的范圍內(nèi)隨機(jī)確定一個(gè)起點(diǎn)，然后每隔一定的間隔抽取一個(gè)單位，直到抽取n個(gè)單位為止，也稱等距抽樣或機(jī)械抽樣。從數(shù)字1到k之間隨機(jī)抽取一個(gè)數(shù)字r作為初始單位，然后依次取r+k，r+2k，…，r+(n-1)k優(yōu)點(diǎn)：簡(jiǎn)便易行；系統(tǒng)抽樣的樣本在總體中的分布一般比較均勻，由此抽樣誤差通常要小于簡(jiǎn)單隨機(jī)抽樣。缺點(diǎn)：對(duì)估計(jì)量方差的估計(jì)比較困難。當(dāng)前10頁(yè)，總共106頁(yè)。5.1.4整群抽樣整群抽樣：調(diào)查時(shí)先將總體劃分成若干群,然后再以群作為調(diào)查單位從中抽取部分群，進(jìn)而對(duì)抽中的各個(gè)群中所包含的所有個(gè)體單位進(jìn)行調(diào)查和觀察。特點(diǎn)：抽樣時(shí)只需群的抽樣框，可簡(jiǎn)化工作量；調(diào)查的地點(diǎn)相對(duì)集中，節(jié)省調(diào)查費(fèi)用，方便調(diào)查的實(shí)施。缺點(diǎn)：估計(jì)的精度較差。當(dāng)前11頁(yè)，總共106頁(yè)。5.2抽樣估計(jì)的原理當(dāng)前12頁(yè)，總共106頁(yè)。抽樣估計(jì)：在抽樣調(diào)查的基礎(chǔ)上，利用樣本的數(shù)據(jù)資料計(jì)算樣本指標(biāo)，以樣本特征值對(duì)總體特征值做出具有一定可靠程度的估計(jì)和判斷。是由部分推斷總體的一種認(rèn)識(shí)方法，建立在隨機(jī)取樣的基礎(chǔ)上，主要運(yùn)用不確定的概率估計(jì)方法（分布理論、大數(shù)定律、中心極限定理和抽樣分布理論），其誤差可以事先計(jì)算并加以控制。其目的是用樣本統(tǒng)計(jì)量來(lái)推斷總體參數(shù)。當(dāng)前13頁(yè)，總共106頁(yè)。在簡(jiǎn)單隨機(jī)重復(fù)抽樣中，每次抽樣都是獨(dú)立的。如果從總體N個(gè)單元中抽取容量為n的樣本，隨機(jī)變量Xi表示第i次抽樣的結(jié)果，則Xi服從在總體N個(gè)單元上均勻取值的多項(xiàng)分布，所以為獨(dú)立同分布隨機(jī)變量序列X1,X2,…,Xn和的一個(gè)取值，其中當(dāng)前14頁(yè)，總共106頁(yè)。如果總體中具有性質(zhì)的A單元的比率為π，隨機(jī)變量Yi=1表示第i次抽樣取得的樣本單元具有性質(zhì)A，否則Yi=0，則Yi服從概率為π的兩點(diǎn)分布，所以np為獨(dú)立同分布隨機(jī)變量序列Y1,Y2,…,Yn和的一個(gè)取值，其中關(guān)于獨(dú)立同分布隨機(jī)變量和的概率分布，大數(shù)定律和中心極限定理給出了很好的解釋。當(dāng)前15頁(yè)，總共106頁(yè)。5.2.1抽樣估計(jì)的基本理論概率與概率分布必然現(xiàn)象（確定性現(xiàn)象）變化結(jié)果是事先可以確定的，一定的條件必然導(dǎo)致某一結(jié)果；這種關(guān)系通常可以用公式或定律來(lái)表示。隨機(jī)現(xiàn)象（不確定現(xiàn)象）在一定條件下可能發(fā)生也可能不發(fā)生的現(xiàn)象；個(gè)別觀察的結(jié)果完全是偶然的、隨機(jī)會(huì)而定；大量觀察的結(jié)果會(huì)呈現(xiàn)出某種規(guī)律性（隨機(jī)性中寓含著規(guī)律性）——統(tǒng)計(jì)規(guī)律性。十五的夜晚能看見(jiàn)月亮？十五的月亮比初十圓！當(dāng)前16頁(yè)，總共106頁(yè)。1.隨機(jī)試驗(yàn)嚴(yán)格意義上的隨機(jī)試驗(yàn)滿足三個(gè)條件：試驗(yàn)可以在系統(tǒng)條件下重復(fù)進(jìn)行；試驗(yàn)的所有可能結(jié)果是明確可知的；每次試驗(yàn)前不能肯定哪一個(gè)結(jié)果會(huì)出現(xiàn)。廣義的隨機(jī)試驗(yàn)是指對(duì)隨機(jī)現(xiàn)象的觀察（或?qū)嶒?yàn)）實(shí)際應(yīng)用中多數(shù)試驗(yàn)不能同時(shí)滿足上述條件，常常從廣義角度來(lái)理解。當(dāng)前17頁(yè)，總共106頁(yè)。2.隨機(jī)事件隨機(jī)事件（簡(jiǎn)稱事件）：隨機(jī)試驗(yàn)的某一個(gè)可能結(jié)果，常用大寫(xiě)英文字母A、B、……來(lái)表示?；臼录颖军c(diǎn)）：不可能再分成為兩個(gè)或更多事件的事件。復(fù)合事件：由簡(jiǎn)單事件組合而成的事件。樣本空間（）：基本事件的全體（全集）。當(dāng)前18頁(yè)，總共106頁(yè)。兩個(gè)特例必然事件：在一定條件下，每次試驗(yàn)都必然發(fā)生的事件。只有樣本空間才是必然事件不可能事件：在一定條件下，每次試驗(yàn)都必然不會(huì)發(fā)生的事件。不可能事件是一個(gè)空集（Φ）當(dāng)前19頁(yè)，總共106頁(yè)。3.隨機(jī)事件的概率概率：用來(lái)度量隨機(jī)事件發(fā)生可能性大小的數(shù)值。必然事件的概率為1，表示為P(

)=1不可能事件發(fā)生的可能性是零，P(

)=0隨機(jī)事件A的概率介于0和1之間，0≤P(A)

≤1概率的三種定義，給出了確定隨機(jī)事件概率的三條途經(jīng)。當(dāng)前20頁(yè)，總共106頁(yè)。概率的古典定義前提：古典概型定義（公式）【例】設(shè)有50件產(chǎn)品，其中有5件次品，現(xiàn)從這50件中任取2件，求抽到的兩件產(chǎn)品均為合格品的概率是多少？抽到的兩件產(chǎn)品均為次品的概率又是多少？當(dāng)前21頁(yè)，總共106頁(yè)。概率的統(tǒng)計(jì)定義若在相同的條件下重復(fù)進(jìn)行的n次試驗(yàn)中，事件A發(fā)生了m次，當(dāng)試驗(yàn)次數(shù)n很大時(shí)，事件A發(fā)生頻率m/n穩(wěn)定地在某一常數(shù)p上下波動(dòng)，而且這種波動(dòng)的幅度一般會(huì)隨著試驗(yàn)次數(shù)增加而縮小，則定義p為事件A發(fā)生的概率當(dāng)n相當(dāng)大時(shí)，可用事件發(fā)生的頻率m/n作為其概率的一個(gè)近似值——計(jì)算概率的統(tǒng)計(jì)方法（頻率方法）當(dāng)前22頁(yè)，總共106頁(yè)?！纠扛鶕?jù)古典概率定義可算出，拋一枚質(zhì)地均勻的硬幣，出現(xiàn)正面與出現(xiàn)反面的概率都是0.5。歷史上有很多人都曾經(jīng)做過(guò)拋硬幣試驗(yàn)。試驗(yàn)者試驗(yàn)次數(shù)正面出現(xiàn)的頻率蒲豐40400.5069K.皮爾遜120000.5016K.皮爾遜240000.5005羅曼諾夫斯基806400.4979當(dāng)前23頁(yè)，總共106頁(yè)?！纠磕车貐^(qū)幾年來(lái)新生兒性別的統(tǒng)計(jì)資料如下表所示，由此可判斷該地區(qū)新生兒為男嬰的概率是多少？觀察年份新生兒數(shù)（個(gè)）男嬰數(shù)（個(gè)）男嬰比例（％）200016248270.509200112056220.516200215127740.512200314077150.508當(dāng)前24頁(yè)，總共106頁(yè)。主觀概率有些隨機(jī)事件發(fā)生的可能性，既不能通過(guò)等可能事件個(gè)數(shù)來(lái)計(jì)算，也不能根據(jù)大量重復(fù)試驗(yàn)的頻率來(lái)近似。主觀概率——依據(jù)人們的主觀判斷而估計(jì)的隨機(jī)事件發(fā)生的可能性大小。例如某經(jīng)理認(rèn)為新產(chǎn)品暢銷的可能性是80％人們的經(jīng)驗(yàn)、專業(yè)知識(shí)、對(duì)事件發(fā)生的眾多條件或影響因素的分析等等，都是確定主觀概率的依據(jù)。當(dāng)前25頁(yè)，總共106頁(yè)。4.概率的性質(zhì)非負(fù)性：對(duì)任意事件A，有P(A)≥0規(guī)范性：必然事件的概率為1，即：P()=1可加性：若A與B互斥，則P(A∪B)=P(A)+P(B)上述三條基本性質(zhì)，也稱為概率的三條公理。當(dāng)前26頁(yè)，總共106頁(yè)。概率的公理化定義概率的以上三種定義，各有其特定的應(yīng)用范圍，也存在局限性，都缺乏嚴(yán)密性古典定義要求試驗(yàn)的基本事件有限且具有等可能性統(tǒng)計(jì)定義要求試驗(yàn)次數(shù)充分大，但試驗(yàn)次數(shù)究竟應(yīng)該取多大、頻率與概率有多么接近都沒(méi)有確切說(shuō)明主觀概率的確定又具有主觀隨意性蘇聯(lián)數(shù)學(xué)家柯?tīng)柲缏宸蛴?933年提出了概率的公理化定義通過(guò)規(guī)定應(yīng)具備的基本性質(zhì)來(lái)定義概率公理化定義為概率論嚴(yán)謹(jǐn)?shù)倪壿嬐评泶蛳铝藞?jiān)實(shí)的基礎(chǔ)當(dāng)前27頁(yè)，總共106頁(yè)。5.條件概率條件概率：在某些附加條件下計(jì)算的概率在已知事件B已經(jīng)發(fā)生的條件下A發(fā)生的條件概率——P(A|B)條件概率的一般公式：其中P(B)>0。乘法公式：

P(AB)

＝P(A)·P(B|A)

或P(AB)＝P(B)·P(A|B)當(dāng)前28頁(yè)，總共106頁(yè)。P(A|B)＝在B發(fā)生的所有可能結(jié)果中AB發(fā)生的概率。即在樣本空間?中考慮的條件概率P(A|B)，就變成在新的樣本空間B中計(jì)算事件AB的概率問(wèn)題了。一旦事件B已發(fā)生AB?ABBAB當(dāng)前29頁(yè)，總共106頁(yè)?！纠磕彻炯滓覂蓮S生產(chǎn)同種產(chǎn)品。甲廠生產(chǎn)400件，其中一級(jí)品為280件；乙廠生產(chǎn)600件，其中一級(jí)品有360件。若要從該廠的全部產(chǎn)品中任意抽取一件，試求：①已知抽出產(chǎn)品為一級(jí)品的條件下該產(chǎn)品出自甲廠的概率；②已知抽出產(chǎn)品出自甲廠的條件下該產(chǎn)品為一級(jí)品的概率。解：設(shè)A＝“甲廠產(chǎn)品”，B＝“一級(jí)品”，則：P(A)＝0.4，P(B)＝0.64，P(AB)＝0.28①所求概率為事件B發(fā)生條件下A發(fā)生的條件概率P(A|B)＝0.28/0.64②所求概率為事件A發(fā)生條件下B發(fā)生的條件概率P(B|A)＝0.28/0.4當(dāng)前30頁(yè)，總共106頁(yè)?！纠繉?duì)例3-1中的問(wèn)題（從這50件中任取2件產(chǎn)品，可以看成是分兩次抽取，每次只抽取一件，不放回抽樣）解：A1＝第一次抽到合格品

A2＝第二次抽到合格品

A1A2＝抽到兩件產(chǎn)品均為合格品當(dāng)前31頁(yè)，總共106頁(yè)。6.事件的獨(dú)立性兩個(gè)事件獨(dú)立一個(gè)事件的發(fā)生與否并不影響另一個(gè)事件發(fā)生的概率P(A|B)＝P(A)，或P(B|A)＝P(B)獨(dú)立事件的乘法公式：

P(AB)

＝P(A)·P(B)推廣到n個(gè)獨(dú)立事件，有：P(A1…An)＝P(A1)P(A2)…P(An)當(dāng)前32頁(yè)，總共106頁(yè)。7.隨機(jī)變量隨機(jī)變量——表示隨機(jī)試驗(yàn)結(jié)果的變量取值是隨機(jī)的，事先不能確定取哪一個(gè)值一個(gè)取值對(duì)應(yīng)隨機(jī)試驗(yàn)的一個(gè)可能結(jié)果用大寫(xiě)字母如X、Y、Z...來(lái)表示，具體取值則用相應(yīng)的小寫(xiě)字母如x、y、z…來(lái)表示根據(jù)取值特點(diǎn)的不同，可分為：離散型隨機(jī)變量——取值可以一一列舉連續(xù)型隨機(jī)變量——取值不能一一列舉當(dāng)前33頁(yè)，總共106頁(yè)。8.離散型隨機(jī)變量的概率分布X的概率分布——X的有限個(gè)可能取值為xi與其概率pi（i=1，2，3，…，n）之間的對(duì)應(yīng)關(guān)系概率分布具有如下兩個(gè)基本性質(zhì)：

pi≥0，i=1,2,…,n；

當(dāng)前34頁(yè)，總共106頁(yè)。離散型概率分布的表示概率函數(shù)：P(X=xi)=pi分布列：分布圖：X=xix1x2…xnP(X=xi)=pip1p2…pn當(dāng)前35頁(yè)，總共106頁(yè)。離散型隨機(jī)變量的數(shù)字特征數(shù)學(xué)期望：方差：性質(zhì)：當(dāng)前36頁(yè)，總共106頁(yè)。伯努利試驗(yàn)伯努利試驗(yàn)：每次試驗(yàn)有且僅有兩種可能結(jié)果。用“成功”代表所關(guān)心的結(jié)果，相反的結(jié)果為“失敗”。每次試驗(yàn)中“成功”的概率都是p。n重伯努利試驗(yàn)：將伯努利實(shí)驗(yàn)獨(dú)立地重復(fù)進(jìn)行n次。當(dāng)前37頁(yè)，總共106頁(yè)。二項(xiàng)分布在n重伯努利試驗(yàn)中，“成功”的次數(shù)X服從參數(shù)為n、p的二項(xiàng)分布，記為X～B(n,p)二項(xiàng)分布的概率函數(shù)：二項(xiàng)分布的數(shù)學(xué)期望和方差：n＝1時(shí)，二項(xiàng)分布就成了二點(diǎn)分布（0-1分布）。當(dāng)前38頁(yè)，總共106頁(yè)。二項(xiàng)分布圖形p＝0.5時(shí)，二項(xiàng)分布是以均值為中心對(duì)稱p≠0.5時(shí)，二項(xiàng)分布總是非對(duì)稱的p<0.5時(shí)峰值在中心的左側(cè)p>0.5時(shí)峰值在中心的右側(cè)p=0.3p=0.5p=0.7二項(xiàng)分布圖示當(dāng)前39頁(yè)，總共106頁(yè)。9.連續(xù)型隨機(jī)變量的概率分布連續(xù)型隨機(jī)變量的概率分布只能表示為：數(shù)學(xué)函數(shù)——概率密度函數(shù)f(x)和分布函數(shù)F(x)圖形——概率密度曲線和分布函數(shù)曲線概率密度函數(shù)f(x)的函數(shù)值不是概率連續(xù)型隨機(jī)變量取某個(gè)特定值的概率等于0只能計(jì)算隨機(jī)變量落在一定區(qū)間內(nèi)的概率由x軸以上、概率密度曲線下方面積來(lái)表示當(dāng)前40頁(yè)，總共106頁(yè)。對(duì)任意的實(shí)數(shù)x，函數(shù)F(x)＝P{X<x}為隨機(jī)變量X的分布函數(shù)。分布函數(shù)滿足下述兩個(gè)條件：0≤F(x)≤1；F(x)是一個(gè)單調(diào)非減的函數(shù)。當(dāng)前41頁(yè)，總共106頁(yè)。概率密度f(wàn)(x)的性質(zhì)概率密度函數(shù)f(x)為分布函數(shù)的導(dǎo)數(shù)。概率密度函數(shù)滿足下述兩個(gè)條件：f(x)≥0;

注意，對(duì)任意x，f(x)的值并不是一個(gè)概率。當(dāng)前42頁(yè)，總共106頁(yè)。隨機(jī)變量X落在區(qū)間[a，b）上的概率：即軸上方，概率密度曲線下方，直線X=a和X=b之間的面積。fX(x)abx事件{a≤X≤b}Ω當(dāng)前43頁(yè)，總共106頁(yè)。連續(xù)型隨機(jī)變量X的數(shù)字特征數(shù)學(xué)期望：方差：性質(zhì)：當(dāng)前44頁(yè)，總共106頁(yè)。正態(tài)分布X～N(μ,σ2

)，其概率密度為：正態(tài)分布的均值和方差均值E(X)=μ方差D(X)=σ2當(dāng)前45頁(yè)，總共106頁(yè)。正態(tài)曲線σ相同而μ不同的正態(tài)曲線

2xf(x)μ相同而σ不同的正態(tài)曲線f(x)σ較小σ較大x正態(tài)曲線的主要特性：關(guān)于x=μ對(duì)稱的鐘形曲線；參數(shù)μ決定正態(tài)曲線的中心位置；參數(shù)σ決定正態(tài)曲線的陡峭或扁平程度；以X軸為漸近線，即當(dāng)x→±∞時(shí)，f(x)→0。當(dāng)前46頁(yè)，總共106頁(yè)。標(biāo)準(zhǔn)正態(tài)分布μ＝0、σ

＝1的正態(tài)分布，記為N(0,1)。其概率密度φ(x)，分布函數(shù)Ф(x)X～N(μ,σ2),則Z～N(0,1

)若Z～N(0，1

)，則有：Ф(-a)=1－Ф(a)P（|Z|≤a）＝2Ф(a)－1標(biāo)準(zhǔn)化標(biāo)準(zhǔn)正態(tài)曲線

-a0aφ(z)zΦ(a)當(dāng)前47頁(yè)，總共106頁(yè)?！纠磕硰S生產(chǎn)的某種節(jié)能燈管的使用壽命服從正態(tài)分布，對(duì)某批產(chǎn)品測(cè)試的結(jié)果，平均使用壽命為1050小時(shí)，標(biāo)準(zhǔn)差為200小時(shí)。試求：使用壽命在500小時(shí)以下的燈管占多大比例？使用壽命在850～1450小時(shí)的燈管占多大比例？以均值為中心，95％的燈管的使用壽命在什么范圍內(nèi)？當(dāng)前48頁(yè)，總共106頁(yè)。解：X＝使用壽命，X～N(1050，2002

)95％的燈管壽命在均值左右392（即658～1442）小時(shí)。當(dāng)前49頁(yè)，總共106頁(yè)。3σ原則|X－μ|>3σ的概率很小，因此可認(rèn)為正態(tài)隨機(jī)變量的取值幾乎全部集中在[μ-3σ，μ+3σ]區(qū)間內(nèi)。廣泛應(yīng)用：產(chǎn)品質(zhì)量控制判斷異常情況……當(dāng)前50頁(yè)，總共106頁(yè)。z分布的α分為點(diǎn)對(duì)于給定的α(0<α<1)，稱滿足條件的點(diǎn)zα為z分布上的α分位點(diǎn)。由z分布概率密度函數(shù)的對(duì)稱性有【例】求z0.05和z0.95。當(dāng)前51頁(yè)，總共106頁(yè)。正態(tài)分布最常用、最重要大千世界中許多常見(jiàn)的隨機(jī)現(xiàn)象服從或近似服從正態(tài)分布例如：測(cè)量誤差，同齡人的身高、體重，棉紗的抗拉強(qiáng)度，設(shè)備的使用壽命，農(nóng)作物的產(chǎn)量…特點(diǎn)是“中間多兩頭少”由于正態(tài)分布特有的數(shù)學(xué)性質(zhì)，正態(tài)分布在很多統(tǒng)計(jì)理論中都占有十分重要的地位正態(tài)分布是許多概率分布的極限分布統(tǒng)計(jì)推斷中許多重要的分布（如χ2分布、t分布、F分布）都是在正態(tài)分布的基礎(chǔ)上推導(dǎo)出來(lái)的當(dāng)前52頁(yè)，總共106頁(yè)。10.χ2分布總體隨機(jī)變量X~N(μ,σ2)，為該總體的個(gè)樣本值的樣本平均數(shù)x1,x2,…,xn，則樣本統(tǒng)計(jì)量

是自由度為n-1的卡方分布，記作χ2(n-1)

。注意：χ2整個(gè)是一個(gè)符號(hào)，并不是χ的平方。當(dāng)前53頁(yè)，總共106頁(yè)。χ2分布的統(tǒng)計(jì)特性：χ2分布的變量值始終為正；χ2(n)分布的形狀取決于其自由度n的大小，通常為不對(duì)稱的右偏分布，但隨著自由度的增大逐漸趨于對(duì)稱；χ2分布的期望為：E(χ2(n))=n，方差為：D(χ2(n))=2n。χ2分布具有可加性。若U~χ2(n1)，V~χ2(n2)，則U+V～χ2(n1+n2)。當(dāng)前54頁(yè)，總共106頁(yè)。不同自由度的χ2(n)分布當(dāng)前55頁(yè)，總共106頁(yè)。對(duì)于給定的α(0<α<1)，稱滿足條件的點(diǎn)為χ2(n)分布的α分為點(diǎn)。當(dāng)前56頁(yè)，總共106頁(yè)。χ2分布α分為點(diǎn)的求法：對(duì)于n≤45的α分為點(diǎn)可查表求得；當(dāng)n充分大（n>45）時(shí)，近似地有其中zα為標(biāo)準(zhǔn)正態(tài)分布上的α分為點(diǎn)當(dāng)前57頁(yè)，總共106頁(yè)。例題分析

n=12,α=0.05,求

n=12,α=0.95,求

n=18,α=0.95,求和使得

n=50,α=0.05,求當(dāng)前58頁(yè)，總共106頁(yè)。11.t分布總體隨機(jī)變量X~N(μ,σ2)，x1,x2,…,xn為取自該總體的n個(gè)隨機(jī)樣本，當(dāng)σ未知時(shí)，以樣本方差s替代，則是自由度為n-1的t分布，記為t(n-1)。當(dāng)前59頁(yè)，總共106頁(yè)。t分布的統(tǒng)計(jì)特性：t(n-1)分布具有對(duì)稱性，且以t=0為對(duì)稱軸，其隨機(jī)變量取值范圍為(-∞,∞)t(n-1)分布期望值為0，方差為(n-1)/(n-3)，即當(dāng)前60頁(yè)，總共106頁(yè)。t(n-1)分布的形狀類似標(biāo)準(zhǔn)正態(tài)分布，但由于t(n-1)的方差大于1（當(dāng)n>3時(shí)，(n-1)/(n-3)>1），所以t(n-1)分布比標(biāo)準(zhǔn)正態(tài)分布更分散。即t(n-1)的概率密度函數(shù)是中央部分較標(biāo)準(zhǔn)正態(tài)分布低，而兩尾部分則較標(biāo)準(zhǔn)正態(tài)分布高。當(dāng)抽樣數(shù)目n增大時(shí)，t(n-1)的方差越來(lái)越接近1，同時(shí)t(n-1)分布的形狀也越來(lái)越接近標(biāo)準(zhǔn)正態(tài)分布。理論上，當(dāng)n→∞時(shí)t(n-1)與標(biāo)準(zhǔn)正態(tài)分布完全一致。一般認(rèn)為n≥30就說(shuō)t(n-1)與標(biāo)準(zhǔn)正態(tài)分布非常接近。當(dāng)前61頁(yè)，總共106頁(yè)。當(dāng)前62頁(yè)，總共106頁(yè)。對(duì)于給定的α(0<α<1)，稱滿足條件的點(diǎn)tα(n)為t分布上的α分為點(diǎn)。由t分布概率密度函數(shù)的對(duì)稱性有t分布α分為點(diǎn)的求法：對(duì)于n≤45的α分為點(diǎn)可查表求得；當(dāng)n充分大（n>45）時(shí)，近似地有當(dāng)前63頁(yè)，總共106頁(yè)。當(dāng)前64頁(yè)，總共106頁(yè)。例題分析

n=9,α=0.05,求t0.05(9)

n=9,α=0.95,求t0.95(9)

n=18,求t0.025(18)及t0.975(18)，使得P(t0.975(18)≤t≤t0.025(18))=0.95

n=50,α=0.05，求t0.05(50)當(dāng)前65頁(yè)，總共106頁(yè)。12.F分布設(shè)隨機(jī)變量U~χ2(n1)，V~χ2(n2)，且U,V獨(dú)立，則隨機(jī)變量

服從自由度為(n1,n2)的F分布，記為F(n1,n2)。由定義可知，如果F~F(n1,n2)，則1/F~F(n2,n1)。當(dāng)前66頁(yè)，總共106頁(yè)。當(dāng)前67頁(yè)，總共106頁(yè)。對(duì)于給定的α(0<α<1)，稱滿足

的點(diǎn)Fα(n1,n2)為分布F(n1,n2)的α分位點(diǎn)。容易證明【例5.5】求F0.05(10,5)和F0.95(5,10)。當(dāng)前68頁(yè)，總共106頁(yè)。當(dāng)前69頁(yè)，總共106頁(yè)。二、大數(shù)定律與中心極限定理大數(shù)定律是闡述大量同類隨機(jī)現(xiàn)象的平均結(jié)果穩(wěn)定性的一系列定理的總稱獨(dú)立同分布大數(shù)定律——設(shè)X1,X2,…,Xn是獨(dú)立同分布的隨機(jī)變量序列，且存在有限的數(shù)學(xué)期望E(Xi)＝μ（i=1,2,…），則對(duì)任意小的正數(shù)ε,有當(dāng)前70頁(yè)，總共106頁(yè)。該定律表明：當(dāng)n充分大時(shí)，相互獨(dú)立且服從同一分布的一系列隨機(jī)變量取值的算術(shù)平均數(shù)，與其數(shù)學(xué)期望μ的偏差任意小的概率接近于1。該定律給出了平均值具有穩(wěn)定性的科學(xué)描述，從而為使用樣本均值去估計(jì)總體均值（數(shù)學(xué)期望）提供了理論依據(jù)。當(dāng)前71頁(yè)，總共106頁(yè)。伯努利大數(shù)定律設(shè)m是n次獨(dú)立重復(fù)試驗(yàn)中事件A發(fā)生的次數(shù)，p是每次試驗(yàn)中事件A發(fā)生的概率，則對(duì)任意的ε>0，有該定律表明，當(dāng)重復(fù)試驗(yàn)次數(shù)n充分大時(shí)，事件A發(fā)生的頻率m/n依概率收斂于事件A發(fā)生的概率。闡明了頻率具有穩(wěn)定性，提供了用頻率估計(jì)概率的理論依據(jù)。當(dāng)前72頁(yè)，總共106頁(yè)。2.中心極限定理獨(dú)立同分布的中心極限定理——設(shè)X1,X2,…是獨(dú)立同分布的隨機(jī)變量序列,且存在有限的μ和方差σ2（i=1,2,…），當(dāng)n→∞時(shí)，或當(dāng)前73頁(yè)，總共106頁(yè)。上述定理表明：獨(dú)立同分布的隨機(jī)變量序列不管服從什么分布，其n項(xiàng)總和的分布趨近于正態(tài)分布?？傻贸鋈缦陆Y(jié)論：不論總體服從何種分布，只要其數(shù)學(xué)期望和方差存在，對(duì)這一總體進(jìn)行重復(fù)抽樣時(shí)，當(dāng)樣本量n充分大，就趨于正態(tài)分布。該定理為均值的抽樣推斷奠定了理論基礎(chǔ)。當(dāng)前74頁(yè)，總共106頁(yè)。例題分析【例】有一測(cè)繪小組對(duì)甲乙兩地之間的距離采用分段測(cè)量的方法進(jìn)行了測(cè)量，將甲乙之間的距離分成為100段。設(shè)每段測(cè)量值的誤差（單位：cm）服從區(qū)間（－1，1）上的均勻分布。試問(wèn)：對(duì)甲乙兩地之間距離的測(cè)量值的總誤差絕對(duì)值超過(guò)10cm的概率是多少？解：設(shè)Xi＝第i段測(cè)量誤差（i=1,2,…），由于Xi服從均勻分布，E(Xi)＝μ＝0，D(Xi

)＝σ2＝[1－(－1)]2/12=1/3。根據(jù)上述中心極限定理，可得，總誤差Y＝ΣXi～N(0,100/3)當(dāng)前75頁(yè)，總共106頁(yè)。棣莫佛－拉普拉斯中心極限定理設(shè)隨機(jī)變量X服從二項(xiàng)分布B(n,p)的，那么當(dāng)n→∞時(shí)，X服從均值為np、方差為np(1-p)的正態(tài)分布，即：該定理為用頻率估計(jì)概率奠定了基礎(chǔ)?；颍寒?dāng)前76頁(yè)，總共106頁(yè)。為什么很多隨機(jī)現(xiàn)象呈正態(tài)分布自然界和社會(huì)經(jīng)濟(jì)中，很多現(xiàn)象可以視為眾多獨(dú)立隨機(jī)變量之總和。例如：一個(gè)城市的居民生活用電總量是大量相互獨(dú)立居民戶用電量的總和。炮彈射擊的誤差，也可以看作是很多因素引起的小誤差之總和。由中心極限定理可知，即使各單個(gè)隨機(jī)變量的分布并不明確，但只要它們存在有限均值和方差，這個(gè)眾多獨(dú)立的隨機(jī)變量之總和的分布就趨近于正態(tài)分布。當(dāng)前77頁(yè)，總共106頁(yè)。5.2.2抽樣估計(jì)的基本概念總體參數(shù)：總體的數(shù)量特征，簡(jiǎn)稱為參數(shù)，一般是未知的常數(shù)。樣本統(tǒng)計(jì)量：根據(jù)樣本資料計(jì)算出來(lái)的，其值隨著樣本的不同而變化，是一個(gè)關(guān)于樣本的隨機(jī)變量?？傮w參數(shù)樣本統(tǒng)計(jì)量總體平均數(shù)：μ樣本平均數(shù)：總體比率：π

樣本比率：p總體方差：σ2

樣本方差：s2

總體標(biāo)準(zhǔn)差：σ樣本標(biāo)準(zhǔn)差：s

當(dāng)前78頁(yè)，總共106頁(yè)。抽樣誤差是指抽樣估計(jì)的過(guò)程中要重點(diǎn)控制的對(duì)象，主要分為三種：抽樣實(shí)際誤差：某一次具體抽樣中，樣本統(tǒng)計(jì)量的值與總體參數(shù)真實(shí)值之間的偏差。抽樣平均誤差：樣本統(tǒng)計(jì)量的所有可能取值與總體指標(biāo)之間的平均差異程度。當(dāng)樣本統(tǒng)計(jì)量的期望恰好等于被估計(jì)的總體參數(shù)時(shí)，其抽樣平均誤差就是該隨機(jī)變量的標(biāo)準(zhǔn)差，稱為抽樣標(biāo)準(zhǔn)差。抽樣極限誤差：一定概率下抽樣誤差的可能范圍，說(shuō)明樣本統(tǒng)計(jì)量在總體參數(shù)周圍變動(dòng)的范圍，記作Δ，又稱為允許誤差。當(dāng)前79頁(yè)，總共106頁(yè)。5.3抽樣分布當(dāng)前80頁(yè)，總共106頁(yè)。5.3.1總體分布總體中各元素的觀察值所形成的分布；分布通常是未知的；可以假定它服從某種分布?？傮w當(dāng)前81頁(yè)，總共106頁(yè)。5.3.2樣本分布一個(gè)樣本中各觀察值的分布也稱經(jīng)驗(yàn)分布當(dāng)樣本容量n逐漸增大時(shí)，樣本分布逐漸接近總體的分布樣本當(dāng)前82頁(yè)，總共106頁(yè)。5.3.3抽樣分布抽樣分布：是由來(lái)自某總體樣本的n個(gè)觀測(cè)值計(jì)算的統(tǒng)計(jì)量的概率分布，是一種理論分布。從同一個(gè)總體中重復(fù)選取容量為n的樣本時(shí)，由該統(tǒng)計(jì)量的所有可能取值形成的相對(duì)頻數(shù)分布。來(lái)自同一總體中容量相同的所有可能樣本。提供了樣本統(tǒng)計(jì)量長(zhǎng)遠(yuǎn)而穩(wěn)定的信息，是進(jìn)行推斷的理論基礎(chǔ)，也是抽樣推斷科學(xué)性的重要依據(jù)。當(dāng)前83頁(yè)，總共106頁(yè)。例題分析【例】設(shè)一個(gè)總體，含有4個(gè)元素(個(gè)體)，即總體單位數(shù)N=4。4個(gè)個(gè)體分別為x1=1，x2=2，x3=3，x4=4。總體的均值、方差及分布如下：總體分布14230.1.2.3均值和方差當(dāng)前84頁(yè)，總共106頁(yè)?，F(xiàn)從總體中抽取n＝2的簡(jiǎn)單隨機(jī)樣本，在重復(fù)抽樣條件下，共有42=16個(gè)樣本。所有樣本的結(jié)果為：所有可能的n=2的樣本（共16個(gè)）第一個(gè)觀察值第二個(gè)觀察值123411,11,21,31,422,12,22,32,433,13,23,33,444,14,24,34,4當(dāng)前85頁(yè)，總共106頁(yè)。計(jì)算出各樣本的均值，如下表。并給出樣本均值的抽樣分布：16個(gè)樣本的均值（）第一個(gè)觀察值第二個(gè)觀察值123411.01.52.02.521.52.02.53.032.02.53.03.542.53.03.54.0x樣本均值的抽樣分布1.000.10.20.3P(x)1.53.04.03.52.02.5當(dāng)前86頁(yè)，總共106頁(yè)。的分布律1.01.52.02.53.03.54.0P()1/162/163/164/163/162/161/16比較及結(jié)論：樣本均值的均值(數(shù)學(xué)期望)等于總體均值樣本均值的方差等于總體方差的1/n當(dāng)前87頁(yè)，總共106頁(yè)。

=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(x)1.00.1.2.31.53.04.03.52.02.5x當(dāng)前88頁(yè)，總共106頁(yè)。抽樣分布的形成過(guò)程總體計(jì)算樣本統(tǒng)計(jì)量如：樣本均值、比例、方差樣本當(dāng)前89頁(yè)，總共106頁(yè)。一、樣本均值的抽樣分布由獨(dú)立同分布中心極限定理，如果n充分大，當(dāng)重復(fù)抽樣時(shí)，樣本均值服從均值為μ，方差為σ2的正態(tài)分布，即即一般認(rèn)為，樣本容量n充分大的條件為n≥30。稱為樣本均值的抽樣標(biāo)準(zhǔn)差。當(dāng)前90頁(yè)，總共106頁(yè)。的分布趨于正態(tài)分布的過(guò)程當(dāng)前91頁(yè)，總共106頁(yè)。由標(biāo)準(zhǔn)正態(tài)分布的性質(zhì)，有當(dāng)前92頁(yè)，總共106頁(yè)。當(dāng)不重復(fù)抽樣時(shí)，可以證明，樣本均值仍服從正態(tài)分布，其均值仍為總體均值μ，而方差變?yōu)槠渲?N-n)/(N-1)為修正系數(shù)。當(dāng)N>>n時(shí)，修正系數(shù)可取近似值1，即(

人人文庫(kù)> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第抽樣與抽樣分布

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

第 抽樣與抽樣分布

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔

第抽樣與抽樣分布