版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、抽樣分布第1頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三學(xué)習(xí)目標(biāo)了解抽樣中的概率抽樣方法理解抽樣分布的意義了解抽樣分布的形成過程理解中心極限定理和大數(shù)定理理解抽樣分布的性質(zhì)第2頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三6.1.1 抽樣推斷 6.1.2 抽樣的方法 6.1.3 樣本容量和樣本個數(shù) 6.1.4 參數(shù)和樣本統(tǒng)計量 6.15 抽樣框 6.1.6 抽樣的組織形式 6.1.7 抽樣誤差 6.1 抽樣的基本概念第3頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三 從研究現(xiàn)象總體的所有單位中,按照隨機(jī)原則抽取部分單位作為樣本,然后以樣本的觀測結(jié)果對
2、總體的數(shù)量特征作出具有一定可靠程度和精度的估計或推斷的一種統(tǒng)計調(diào)查方法。抽樣推斷的含義總體隨機(jī)樣本第4頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三1.在調(diào)查單位的抽取上遵循隨機(jī)原則抽樣推斷方法的特點(diǎn)2.以樣本的數(shù)量特征去推斷總體的數(shù)量特征3.存在抽樣誤差,可計算并加以控制第5頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三一、了解不能或難以采用全面調(diào)查的總體的數(shù)量特征二、與全面調(diào)查相結(jié)合,修正和補(bǔ)充全面調(diào)查三、在生產(chǎn)過程中進(jìn)行質(zhì)量控制四、可以對總體的某種假設(shè)進(jìn)行檢驗抽樣推斷的作用第6頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三(一)參數(shù)估計(二)假設(shè)
3、檢驗抽樣推斷的內(nèi)容第7頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三6.1.2 抽樣的方法抽樣的方法重復(fù)抽樣不重復(fù)抽樣第8頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三重復(fù)抽樣:也叫回置抽樣。特點(diǎn):每個單位在每次抽中機(jī)會一樣。不重復(fù)抽樣:也叫不回置抽樣。特點(diǎn):每個單位在每次抽中機(jī)會不一樣;每個單位最多只能被抽中一次。不重復(fù)抽樣的抽樣平均誤差小于重復(fù)抽樣的抽樣平均誤差。第9頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三6.1.3 樣本容量和樣本個數(shù)樣本容量:樣本中的單位數(shù),通常用字母n表示。 通常,n30的樣本稱為大樣本, n30的樣本稱為小樣本。樣本個
4、數(shù):從總體中可能抽得的樣本的數(shù)目第10頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三樣本的可能數(shù)目從總體N中隨機(jī)抽取n個樣本單位共有多少種可能的抽選結(jié)果與抽樣方法和是否考慮順序有關(guān)。有以下四種組合: 重復(fù)抽樣考慮順序 不重復(fù)抽樣考慮順序3. 不重復(fù)抽樣不考慮順序4 重復(fù)抽樣不考慮順序(不常用)第11頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三 重復(fù)抽樣考慮順序的可能樣本數(shù)目: 不重復(fù)抽樣考慮順序的可能樣本數(shù)目:共n個3 不重復(fù)抽樣不考慮順序的可能樣本數(shù)目:第12頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三6.1.4 參數(shù)和統(tǒng)計量參數(shù)(paramet
5、er)來描述總體數(shù)量特征的指標(biāo),又稱總體指標(biāo)。即對總體特征的數(shù)量描述。參數(shù)已知,總體的分布特征就已知。所關(guān)心的參數(shù)主要有總體均值()、標(biāo)準(zhǔn)差()、總體比例(P/ )等用 表示參數(shù)的特點(diǎn):參數(shù)的數(shù)值是客觀存在的,總體一定,參數(shù)就唯一確定,但卻是未知的。第13頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三統(tǒng)計量(statistic)又稱樣本指標(biāo)或估計量,是根據(jù)樣本數(shù)據(jù)計算出來的一些量,用以推斷總體參數(shù)(總體指標(biāo))的綜合指標(biāo)。特點(diǎn):是隨樣本不同而不同的隨機(jī)變量,不含未知參數(shù)。所關(guān)心的樣本統(tǒng)計量有:樣本均值(x)、樣本標(biāo)準(zhǔn)差(s)、樣本比例(p)等用 表示第14頁,共120頁,2022年
6、,5月20日,14點(diǎn)30分,星期三平均數(shù)標(biāo)準(zhǔn)差比例參數(shù)統(tǒng)計量xsp總體樣本第15頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三6.15抽樣框抽樣框:全部抽樣單位的名單框架。抽樣框的好壞通常會直接影響到抽樣調(diào)查的隨機(jī)性和調(diào)查效果。有如下幾種抽樣框形式:名單抽樣框:列出全部總體單位的名錄一覽表。如職工名單,企業(yè)名單。區(qū)域抽樣框:按地理位置將總體范圍劃分為若干小區(qū),以小區(qū)為單位進(jìn)行抽樣。如市住房調(diào)查劃分為街道、區(qū)片。時間抽樣框:將總體全部單位按時間順序排列,每隔一定時間抽樣。如流水線抽樣進(jìn)行產(chǎn)品質(zhì)檢。第16頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三6.1.6 抽樣的組
7、織形式 一、簡單隨機(jī)抽樣 二、分層抽樣 三、系統(tǒng)抽樣 四、整群抽樣 五、多階段抽樣第17頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三對總體單位逐一編號,然后按隨機(jī)原則直接從總體中抽出若干單位構(gòu)成樣本應(yīng)用僅適用于規(guī)模不大、內(nèi)部各單位標(biāo)志值差異較小的總體是最簡單、最基本、最符合隨機(jī)原則,但同時也是抽樣誤差最大的抽樣組織形式簡單隨機(jī)抽樣(simple random sampling)抽簽、隨機(jī)數(shù)字表法第18頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三59079 46755 72348 69595 53408 92708 67110 68260 79820 91123
8、48391 76486 60421 69414 37271 89276 07577 43880 08133 0989867072 33693 81976 68018 89363 39340 93294 82290 95922 9632986050 07331 89994 36265 62934 47361 25352 61467 51683 4383384426 40439 57595 37715 16639 06343 00144 98294 64512 19201 注意: 必須先對總體中的每一個單位進(jìn)行編碼或編號,確定抽樣框。簡單隨機(jī)抽樣適合于調(diào)查標(biāo)志在各單位分布較均勻的總體,一般情況下,
9、簡單隨機(jī)抽樣的效果相對差些。 第19頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三將總體全部單位分類,形成若干個類型組,然后從各類型中分別抽取樣本單位組成樣本??傮wN樣本n等額抽取等比例抽取最優(yōu)抽取能使樣本結(jié)構(gòu)更接近于總體結(jié)構(gòu),提高樣本的代表性;能同時推斷總體指標(biāo)和各子總體的指標(biāo)分層抽樣(stratified sampling)第20頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三注意: 1、隨機(jī)性2、分層抽樣要求事先對總體有較多的了解。3、分層抽樣對層而言是全面調(diào)查,對層內(nèi)單位而言是非全面調(diào)查。4、能避免明顯的偏高或偏低情況。5、適合于調(diào)查標(biāo)志在各單位間的分布差異大
10、的總體。第21頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三等距抽樣/機(jī)械抽樣將總體單位按某一標(biāo)志排序,而后按一定的間隔抽取樣本單位。隨機(jī)起點(diǎn)半距起點(diǎn)對稱起點(diǎn)(總體單位按某一標(biāo)志排序)按無關(guān)標(biāo)志排隊,其抽樣效果相當(dāng)于簡單隨機(jī)抽樣;按有關(guān)標(biāo)志排隊,其抽樣效果相當(dāng)于類型抽樣。系統(tǒng)抽樣(systematic sampling)第22頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三 將總體全部單位分為若干“群”,然后隨機(jī)抽取一部分“群”,被抽中群體的所有單位構(gòu)成樣本例:總體群數(shù)R=16 樣本群數(shù)r=4ABCDEFGHIJKLMNOPLHPD樣本容量簡單、方便,能節(jié)省人力、物力
11、、財力和時間,但其樣本代表性可能較差整群抽樣(cluster sampling)第23頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三 指分兩個或兩個以上的階段來完成抽取樣本單位的過程例:在某省100多萬農(nóng)戶抽取1000戶調(diào)查農(nóng)戶生產(chǎn)性投資情況。 第一階段:從該省所有縣中抽取5個縣第二階段:從被抽中的5個縣中各抽4個鄉(xiāng) 第三階段:從被抽中的20個鄉(xiāng)中各抽5個村 第四階段:從被抽中的100個村中各抽10戶樣本n=10010=1000(戶)多階段抽樣第24頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三調(diào)查對象的性質(zhì)特點(diǎn)對調(diào)查對象的了解程度抽樣誤差的大小人力、財力和物力等條
12、件的限制在實際工作中,選擇適當(dāng)?shù)某闃咏M織方式主要應(yīng)考慮:抽樣組織方式的選擇第25頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三抽樣中的誤差登記性誤差,也叫調(diào)查誤差代表性誤差系統(tǒng)性誤差偶然性誤差偏差抽樣誤差抽樣中的誤差(抽樣誤差的計算在后邊講)第26頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三6.2 抽樣分布基本理論6.2.1 中心極限定理 6.2.2 正態(tài)分布的再生定理 6.2.3 大數(shù)定律 6.2.4 三種不同性質(zhì)的分布 6.2.5 常見的幾種抽樣分布 第27頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三中心極限定理:設(shè)從均值為,方差為 2的一個任
13、意總體中采取重復(fù)抽樣抽取容量為n的樣本,當(dāng)n充分大時,樣本均值的抽樣分布近似服從均值為、方差為2/n的正態(tài)分布不論總體服從何種分布,只要其數(shù)學(xué)期望和方差存在,對這一總體進(jìn)行重復(fù)抽樣時,當(dāng)樣本量n充分大,就趨于正態(tài)分布該定理為均值的抽樣推斷奠定了理論基礎(chǔ)。6.2.1中心極限定理第28頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三中心極限定理當(dāng)樣本容量足夠大時(n 30) ,樣本均值的抽樣分布逐漸趨于正態(tài)分布一個任意分布的總體x第29頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三中心極限定理x 的分布趨于正態(tài)分布的過程第30頁,共120頁,2022年,5月20日,14點(diǎn)
14、30分,星期三正態(tài)分布的再生定理 = 50 =10X總體分布n = 4抽樣分布xn =16當(dāng)總體服從正態(tài)分布N(,2)時,來自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x 的數(shù)學(xué)期望為,方差為2/n。即xN(,2/n)第31頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三例題分析 例某酒店電梯中質(zhì)量標(biāo)志注明最大載重為18人,1350kg。假定已知該酒店旅客及其攜帶行李的平均重量為70kg,標(biāo)準(zhǔn)差為6kg。試問隨機(jī)進(jìn)入電梯18人,總重量超重的概率是多少? 第32頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三例題分析 例 一個汽車電池的制造商聲稱其最好的電池壽命的
15、分布均值為54個月,標(biāo)準(zhǔn)差為6個月。假設(shè)某一消費(fèi)組織決定購買50個這種電池作為樣本來檢驗電池的壽命,以核實這一聲明。 (1)假設(shè)這個制造商所言真實,試描述這50個電池樣本的平均壽命的抽樣分布 (2)假設(shè)這個制造商所言真實,則消費(fèi)組織的樣本壽命均值小于或等于52個月的概率是多少?第33頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三第34頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三6.2.3 大數(shù)定律 1. 獨(dú)立同分布大數(shù)定律 2. 貝努里大數(shù)定律 大數(shù)定律是闡述大量同類隨機(jī)現(xiàn)象的平均結(jié)果的穩(wěn)定性的一系列定理的總稱。第35頁,共120頁,2022年,5月20日,14點(diǎn)
16、30分,星期三獨(dú)立同分布大數(shù)定律設(shè)X1, X2, 是獨(dú)立同分布的隨機(jī)變量序列,且存在有限的數(shù)學(xué)期望E(Xi)和方差D(Xi ) 2(i=1,2,),則對任意小的正數(shù), 有: 第36頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三大數(shù)定律(續(xù))該大數(shù)定律表明:當(dāng)n充分大時,相互獨(dú)立且服從同一分布的一系列隨機(jī)變量取值的算術(shù)平均數(shù),與其數(shù)學(xué)期望的偏差小于任意小的正數(shù)概率接近于1。 該定理給出了平均值具有穩(wěn)定性的科學(xué)描述,從而為使用樣本均值去估計總體均值(數(shù)學(xué)期望)提供了理論依據(jù)。 第37頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三貝努里大數(shù)定律設(shè)m是n次獨(dú)立重復(fù)試驗中事件
17、A發(fā)生的次數(shù),p是每次試驗中事件A發(fā)生的概率,則對任意的 0,有:它表明,當(dāng)重復(fù)試驗次數(shù)n充分大時,事件A發(fā)生的頻率m/n依概率收斂于事件A發(fā)生的概率闡明了頻率具有穩(wěn)定性,提供了用頻率估計概率的理論依據(jù)。 第38頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三總體分布總體中各元素的觀察值所形成的分布 分布通常是未知的可以假定它服從某種分布 6.2.4 三種不同性質(zhì)的分布總體第39頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三一個樣本中各觀察值的分布 也稱經(jīng)驗分布 當(dāng)樣本容量n逐漸增大時,樣本分布逐漸接近總體的分布 樣本分布樣本第40頁,共120頁,2022年,5月20
18、日,14點(diǎn)30分,星期三抽樣分布是來自容量相同的所有可能樣本的概率分布,是一種理論分布抽取容量為 n 的樣本時,由該統(tǒng)計量的所有可能取值形成的概率分布 樣本統(tǒng)計量(如樣本均值, 樣本比例,樣本方差等)是隨機(jī)變量 ,樣本不同,樣本統(tǒng)計量的計算值是不同的。3.抽樣分布反映樣本統(tǒng)計量的分布特征,是進(jìn)行推斷的理論基礎(chǔ),揭示樣本統(tǒng)計量和總體參數(shù)之間的關(guān)系,估計抽樣誤差,是抽樣推斷科學(xué)性的重要依據(jù) 抽樣分布第41頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三抽樣分布的形成過程總體計算樣本統(tǒng)計量如:樣本均值、比例、方差樣本第42頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三6.2
19、.5 常見的幾種抽樣分布XN(,2) 正態(tài)分布(略) 2分布t分布F分布第43頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三正態(tài)分布(normal distribution)由C.F.高斯(Carl Friedrich Gauss,17771855)作為描述誤差相對頻數(shù)分布的模型而提出描述連續(xù)型隨機(jī)變量的最重要的分布許多現(xiàn)象都可以由正態(tài)分布來描述 可用于近似離散型隨機(jī)變量的計算例如: 二項分布經(jīng)典統(tǒng)計推斷的基礎(chǔ)xf (x)第44頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三概率密度函數(shù)f(x) = 隨機(jī)變量 X 的頻數(shù) (概率密度函數(shù)) = 正態(tài)隨機(jī)變量X的均值 =
20、 正態(tài)隨機(jī)變量X的方差 = 3.1415926; e = 2.71828x = 隨機(jī)變量的取值 (- x )X服從參數(shù)為, 的正態(tài)分布,記為XN(, )第45頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三正態(tài)分布函數(shù)的性質(zhì)圖形是關(guān)于x=對稱鐘形曲線,且峰值在x= 處均值和標(biāo)準(zhǔn)差一旦確定,分布的具體形式也惟一確定,不同參數(shù)正態(tài)分布構(gòu)成一個完整的“正態(tài)分布族” 均值可取實數(shù)軸上的任意數(shù)值,決定正態(tài)曲線的具體位置;標(biāo)準(zhǔn)差決定曲線的“陡峭”或“扁平”程度。越大,正態(tài)曲線扁平;越小,正態(tài)曲線越高陡峭當(dāng)X的取值向橫軸左右兩個方向無限延伸時,曲線的兩個尾端也無限漸近橫軸,理論上永遠(yuǎn)不會與之相交
21、正態(tài)隨機(jī)變量在特定區(qū)間上的取值概率由正態(tài)曲線下的面積給出,而且其曲線下的總面積等于1 第46頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三 和 對正態(tài)曲線的影響xf(x)CAB =1/2 1 2=1 第47頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三正態(tài)分布的概率概率是曲線下的面積!abxf(x)第48頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三標(biāo)準(zhǔn)正態(tài)分布 標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)隨機(jī)變量具有均值為0,標(biāo)準(zhǔn)差為1的正態(tài)分布表示為XN(0,1) 標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù)第49頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三標(biāo)準(zhǔn)正態(tài)分布第
22、50頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三標(biāo)準(zhǔn)正態(tài)分布Xms 一般正態(tài)分布 =1Z標(biāo)準(zhǔn)正態(tài)分布 第51頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三 標(biāo)準(zhǔn)化證明通過 的線性變化將隨機(jī)變量XN(, )轉(zhuǎn)化成 XN(0,1 ) 的標(biāo)準(zhǔn)正態(tài)分布第52頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三標(biāo)準(zhǔn)正態(tài)分布表的使用對于標(biāo)準(zhǔn)正態(tài)分布,即ZN(0,1),有P (a Zb) b aP (|Z| a) 2 a 1對于負(fù)的 z ,可由 (-z) z得到對于一般正態(tài)分布,即XN( , ),有第53頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三標(biāo)準(zhǔn)化
23、的例子 P(5 X 6.2) X =5 =10一般正態(tài)分布6.2 =1Z標(biāo)準(zhǔn)正態(tài)分布 00.12.0478第54頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三標(biāo)準(zhǔn)化的例子P(2.9 X 7.1) 5s = 102.97.1X一般正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布0 s = 1-.21Z.21.1664.0832.0832第55頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三正態(tài)分布(例題分析)【例】假定某公司職員每周的加班津貼服從均值為50元、標(biāo)準(zhǔn)差為10元的正態(tài)分布,那么全公司中有多少比例的職員每周的加班津貼會超過70元,又有多少比例的職員每周的加班津貼在40元到60元之間呢?
24、解:設(shè)=50, =10,XN(50,102)第56頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三用正態(tài)分布近似二項分布在試驗次數(shù)n很大時,二項分布XN(n,p),則可以用均值=np, 2= n(1-p)的正態(tài)分布要求: np和 n (1-p)都大于,才能用正態(tài)分布來近似 第57頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三例題分析例假設(shè)有一批種子的發(fā)芽率為0.7,現(xiàn)在這種種子1000顆,試求其中有720顆以上發(fā)芽的概率解:第58頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三例: 一種電子元件的使用壽命(小時)服從正態(tài)分布(100,152),某儀器上裝有
25、3個這種元件,三個元件損壞與否是相互獨(dú)立的.求:使用的最初90小時內(nèi)無一元件損壞的概率.解:設(shè)Y為使用的最初90小時內(nèi)損壞的元件數(shù),故則YB(3,p)其中正態(tài)分布表第59頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三2分布第60頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三4.2分布的密度函數(shù)f(y)曲線a.分布可加性 若X 2(n1),Y 2(n2 ), X, Y獨(dú)立,則 X + Y 2(n1+n2 )b.期望與方差 若X 2(n),則E(X)= n,D(X)=2n5.2分布的性質(zhì)第61頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三C. 2(n)分布
26、的變量值總是為正;D. 2(n)分布的形狀取決于自由度n的大小,通常為不對稱的右偏分布,隨著自由度n的增大逐漸趨近于對稱分布第62頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三6. 分位點(diǎn) 設(shè)X 2(n),若對于:01, 存在滿足則稱為分布的上分位點(diǎn)。第63頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三若總體U則t 分布第64頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三t 分布性質(zhì) t 分布是類似正態(tài)分布的一種對稱分布,它通常要比正態(tài)分布平坦和分散。一個特定的t分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于標(biāo)準(zhǔn)正態(tài)分布 xt 分布與標(biāo)
27、準(zhǔn)正態(tài)分布的比較t 分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t (df = 13)t (df = 5)z第65頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三t 分布的概率密度函數(shù)為f(t)的極限為N(0,1)的密度函數(shù),即第66頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三t 分布分位點(diǎn)設(shè)Tt(n),若對:00, 滿足PTt(n)=,則稱t(n)為t(n)的上側(cè)分位點(diǎn)第67頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三注:第68頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三由統(tǒng)計學(xué)家費(fèi)舍() 提出的,以其姓氏的第一個字母來命名則設(shè)
28、若U為服從自由度為n1的2分布,即U2(n1),V為服從自由度為n2的2分布,即V2(n2),且U和V相互獨(dú)立,則為服從自由度n1和n2的F分布,隨機(jī)變量F簡稱為F變量。記為F分布 第69頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三3.其概率密度為F(1,20)(5,20)(10,20)F分布是偏右分布,隨著兩個自由度增大逐漸接近對稱分布第70頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三4. F分布的分位點(diǎn)對于:00,滿足PFF(n1, n2)=, 則稱F(n1, n2)為F(n1, n2)的上側(cè)分位點(diǎn);第71頁,共120頁,2022年,5月20日,14點(diǎn)30分
29、,星期三第72頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三6.3 樣本抽樣分布 6.3.1 樣本均值的抽樣分布 6.3.2 樣本比率的抽樣分布 6.3.3 抽樣平均誤差的計算 6.3.4 樣本方差的抽樣分布 6.3.5 兩個樣本統(tǒng)計量的抽樣分布第73頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三在選取容量為n的樣本時,由樣本均值的所有可能取值形成的概率分布推斷總體均值 的理論基礎(chǔ)6.3.1 樣本均值的抽樣分布第74頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三(例題分析)【例】設(shè)一個總體,含有4個元素(個體) ,即總體單位數(shù)N=4。4 個個體分別為x
30、1=1,x2=2,x3=3,x4=4 。總體的均值、方差及分布如下總體分布14230.1.2.3均值和方差第75頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三(例題分析) 現(xiàn)從總體中抽取n2的簡單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n = 2 的樣本(共16個)第76頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三樣本均值的抽樣分布(數(shù)學(xué)期望與方差)比較及結(jié)論:1. 樣本均值的均值(數(shù)學(xué)期望)
31、等于總體均值 2. 樣本均值的方差等于總體方差的1/n第77頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三x樣本均值的抽樣分布1.000.10.20.3P ( x )1.53.04.03.52.02.5 (例題分析) 計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)第78頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三樣本均值的分布與總體分布的比較 = 2.5 2 =1.25總體分布14230.1.2.3抽樣
32、分布P ( x )1.00.1.2.31.53.04.03.52.02.5x第79頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三樣本抽樣分布特征的證明第80頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三樣本均值的數(shù)學(xué)期望樣本均值的方差重復(fù)抽樣不重復(fù)抽樣樣本均值的抽樣分布特征(數(shù)學(xué)期望與方差)第81頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本正態(tài)分布正態(tài)分布非正態(tài)分布第82頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三1.總體服從正態(tài)分布N(, )時2. 總體分布未知,當(dāng)n充分
33、大時重復(fù)抽樣時 不重復(fù)抽樣時 重復(fù)抽樣時 不重復(fù)抽樣時 近似近似第83頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三比率:總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比不同性別的人與全部人數(shù)之比合格品(或不合格品) 與全部產(chǎn)品總數(shù)之比總體比率可表示為樣本比率可表示為6.3.2 樣本比率的抽樣分布第84頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三棣莫佛拉普拉斯中心極限定理設(shè)隨機(jī)變量X服從二項分布B(n, P)的,那么當(dāng)n 時,X服從均值為n P 、方差為 n P(1- P) 的正態(tài)分布,即: 或:上述定理表明: n很大,np 5, n (1p) 5時,二項分布
34、可以用正態(tài)分布去近似。第85頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三在重復(fù)選取容量為n的樣本時,由樣本比率的所有可能取值形成的相對頻數(shù)分布當(dāng)樣本容量很大時,樣本比率的抽樣分布可用正態(tài)分布近似 推斷總體比例的理論基礎(chǔ)樣本比率的抽樣分布中心極限定理第86頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三樣本比率的數(shù)學(xué)期望樣本比率的方差重復(fù)抽樣不重復(fù)抽樣樣本比率的抽樣分布(數(shù)學(xué)期望與方差)第87頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三 6.3.3 樣本方差的抽樣分布對總體為正態(tài)總體: 用樣本方差推斷總體方差,必須知道總體方差的抽樣分布。樣本方差的抽樣
35、分布在重復(fù)選取容量為n的樣本時,由樣本方差的所有可能取值形成的相對頻數(shù)分布。第88頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三6.3.5 兩個樣本統(tǒng)計量的抽樣分布兩個樣本均值之差的抽樣分布兩個樣本比率之差的抽樣分布兩個樣本方差比的抽樣分布第89頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三兩個總體都為正態(tài)分布,即 , 兩個樣本均值之差 的抽樣分布服從正態(tài)分布,其分布的數(shù)學(xué)期望為兩個總體均值之差 方差為各自的方差之和 一、兩個樣本均值之差的抽樣分布第90頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三第91頁,共120頁,2022年,5月20日,14點(diǎn)3
36、0分,星期三從兩個服從二項分布的總體中,分別獨(dú)立抽取兩個樣本,由兩個樣本比率之差的所有可能取值形成的相對頻數(shù)分布。分別從兩個服從二項分布總體中抽取容量為n1和n2的獨(dú)立樣本,當(dāng)兩個樣本都為大樣本時,兩個樣本比例之差的抽樣分布近似服從正態(tài)分布。分布的數(shù)學(xué)期望為方差為各自的方差之和 二、兩個樣本比率之差的抽樣分布第92頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三第93頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三三、兩個樣本方差比的抽樣分布1.兩個樣本方差比的抽樣分布:若兩個總體都為正態(tài)分布,即X1N(1,12) , X2N(2,22 ),從兩個總體中分別抽取容量為n
37、1和n2的獨(dú)立樣本,由兩個樣本方差比的所有可能取值形成的相對頻數(shù)分布。2.兩個樣本方差比的抽樣分布,服從分子自由度為(n1-1),分母自由度為(n2-1) 的F分布,即 第94頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三6.4抽樣誤差的計算第95頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三抽樣誤差實際抽樣誤差抽樣平均誤差抽樣極限誤差第96頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三實際抽樣誤差,指樣本統(tǒng)計量與總體參數(shù)之間的絕對離差。實際抽樣誤差 第97頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三抽樣誤差實際抽樣誤差抽樣平均誤差抽樣
38、極限誤差第98頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三抽樣平均誤差是樣本統(tǒng)計量與總體參數(shù)的平均離差,也即樣本統(tǒng)計量的標(biāo)準(zhǔn)差。1.抽樣平均誤差的概念第99頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三以均值的抽樣平均誤差為例測度所有樣本均值對其中心值的離散程度,所有可能的樣本均值的標(biāo)準(zhǔn)差所有樣本均值分布在總體均值的周圍,抽樣平均誤差反映了樣本估計值與相應(yīng)總體參數(shù)的平均差異程度抽樣平均誤差越小,樣本估計值的分布越集中在總體參數(shù)的附近,樣本估計值對總體的代表性越高第100頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三(1) 理論公式 2. 抽樣平均誤差
39、的計算第101頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三抽樣平均誤差計算式推導(dǎo)第102頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三例3現(xiàn)有A、B、C、D四名工人構(gòu)成的總體,他們的日產(chǎn)量分別為22、24、26、28件。從四名工人中任取兩名構(gòu)成一個樣本,請利用重復(fù)抽樣和不重復(fù)抽樣的方法計算抽樣平均誤差。 【分析】先計算出三類數(shù)值:根據(jù)抽樣平均誤差的計算公式,我們必須本題要求我們計算抽樣平均誤差??赡軜颖緜€數(shù)??傮w平均日產(chǎn)量、樣本平均日產(chǎn)量、第103頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三解: 但由于本題計算抽樣平均誤差要分別采用重復(fù)抽樣和不重復(fù)
40、抽樣兩種方法,因此,除總體平均日產(chǎn)量計算結(jié)果相同外,樣本平均日產(chǎn)量、可能樣本總數(shù)均不完全相同。為了準(zhǔn)確計算有關(guān)數(shù)據(jù),我們將所有可能的樣本及其平均數(shù)列舉出來,然后,根據(jù)列舉結(jié)果就可以計算出抽樣平均誤差。 列舉過程見表4-21.采用重復(fù)抽樣第104頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三2224262822(22,22)(22)(22,24)(23)(22,26)(24)(22,28)(25)24(24,22)(23)(24,24)(24)(24,26)(25)(24,28)(26)26(26,22)(24)(26,24)(25)(26,26)(26)(26,28)(27)28
41、(28,22)(25)(28,24)(26)(28,26)(27)(28,28)(28)第105頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三2224262822(22,24)(23)(22,26)(24)(22,28)(25)24(24,22)(23)(24,26)(25)(24,28)(26)26(26,22)(24)(26,24)(25)(26,28)(27)28(28,22)(25)(28,24)(26)(28,26)(27)第106頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三應(yīng)當(dāng)指出的是,上面計算抽樣平均誤差的這個理論公式,在實際應(yīng)用上會存在兩個困難:列舉過程見表4-32.采用不重復(fù)抽樣運(yùn)用這個公式要求把所有的樣本都抽選出來,然后計算它們的指標(biāo)數(shù)值。這在實際應(yīng)用過程中幾乎是不可能的。運(yùn)用上面公式要求總體平均數(shù)的數(shù)值是已知的。但實際上,總體平均數(shù)的數(shù)值是未知的,它正是抽樣調(diào)查要推斷的。第107頁,共120頁,2022年,5月20日,14點(diǎn)30分,星期三因此,根據(jù)上面這個理論公式計算樣本平均數(shù)的抽樣平均誤差是行不通的。必須選用其他計算公式。數(shù)理統(tǒng)計已經(jīng)證明,在隨機(jī)抽樣方式下,樣本平均數(shù)(成數(shù))的抽樣平均誤差可以按下述公式來計算。在重復(fù)抽樣條件下:樣本平均數(shù)的抽樣平均誤差樣本成數(shù)的抽樣平均誤差第108頁,共120頁,2022年,5月20日
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 期權(quán)行使程序協(xié)議參考
- 城市廣場內(nèi)部亮化協(xié)議
- 生物科技信用社薪酬制度
- 項目管理走動式管理實踐策略
- 預(yù)付款采購協(xié)議文本
- 醫(yī)療保險醫(yī)師聘用合同細(xì)則
- 體育賽事設(shè)施招投標(biāo)操作
- 演藝活動保證金協(xié)議書
- 游泳池水質(zhì)維護(hù)保潔合同
- 住宅區(qū)公共區(qū)域墻紙施工協(xié)議
- 紅色頒獎典禮公司年會員工表彰大會模板
- 2022-2023學(xué)年福建省泉州市惠安縣三年級(上)期末數(shù)學(xué)試卷
- 統(tǒng)編版語文三年級上冊2024-2025學(xué)年第三單元測試題 (含答案)
- 2024甘肅省安全員C證考試題庫
- 2024-2025學(xué)年上學(xué)期廣州初中地理七年級期末模擬卷1
- 八年級地理期末模擬卷(考試版A4)【測試范圍:晉教版八上全冊】
- 統(tǒng)編版語文2024-2025學(xué)年六年級上冊語文期末專題訓(xùn)練:字音字形(有答案)
- 2024年文化娛樂產(chǎn)業(yè)投資合同3篇
- 機(jī)器人課件模板下載
- 《肺癌病人的護(hù)理》課件
- 臨時工人勞動合同范本(3篇)
評論
0/150
提交評論