抽樣分布基本概念 .ppt_第1頁(yè)
抽樣分布基本概念 .ppt_第2頁(yè)
抽樣分布基本概念 .ppt_第3頁(yè)
抽樣分布基本概念 .ppt_第4頁(yè)
抽樣分布基本概念 .ppt_第5頁(yè)
已閱讀5頁(yè),還剩50頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、統(tǒng)計(jì)學(xué) -從典型案例到問(wèn)題和思想,經(jīng)濟(jì)管理類“十三五”規(guī)劃教材,典型案例【6】 第一節(jié) 抽樣分布基本概念 第二節(jié) 幾個(gè)常見(jiàn)的抽樣分布,第五章 抽樣分布,【典型案例6】如何決定是否購(gòu)買一批蘋(píng)果?,俗話說(shuō)“一日一蘋(píng)果,醫(yī)生遠(yuǎn)離我。” 假如現(xiàn)在面對(duì)一批蘋(píng)果,人們?nèi)绾瘟私馑?們口感的均值和差異值,以便作出是否購(gòu) 買這批蘋(píng)果的決策呢? 人們常用作法:從這批蘋(píng)果中隨機(jī)挑 出幾個(gè)品嘗后,得出這幾個(gè)蘋(píng)果口感的均 值和差異值,以此作為這批蘋(píng)果口感的均 值和差異值,從而作出是否購(gòu)買這批蘋(píng)果 的決策。,從統(tǒng)計(jì)學(xué)角度來(lái)講,挑出的幾個(gè)蘋(píng)果口感的均值和差異值就是樣本平均數(shù)和樣本方差,這批蘋(píng)果口感的均值和差異值是總體平均數(shù)

2、和總體方差。 這種用商品質(zhì)量數(shù)據(jù)的樣本平均數(shù)、樣本方差作為總體平均數(shù)、總體方差的作法,是人們購(gòu)買商品時(shí)常用的有效估計(jì)方法,其理論依據(jù)是本章將要學(xué)習(xí)的內(nèi)容。,【典型案例6】如何決定是否購(gòu)買一批蘋(píng)果?,第一節(jié) 抽樣分布基本概念,一、樣本容量和樣本個(gè)數(shù) 二、參數(shù)和統(tǒng)計(jì)量 三、抽樣分布 四、抽樣分布的數(shù)字特征,總體是研究的所有個(gè)體構(gòu)成的集合,其中的個(gè)體的數(shù)目常用 表示。 從中隨機(jī)抽取部分個(gè)體構(gòu)成一個(gè)樣本,構(gòu)成樣本的個(gè)體的數(shù)目,常用 表示,稱為樣本容量,也稱樣本量。 例如,典型案例6中,一批蘋(píng)果有400個(gè),從中抽取8個(gè)進(jìn)行品嘗,那么 ,而 。顯然,從中可以得到很多個(gè)樣本。,一、樣本容量和樣本個(gè)數(shù),從一個(gè)

3、含有N個(gè)個(gè)體的總體中,隨機(jī)抽取樣本容量為n的樣本,可得到很多個(gè)樣本,此即樣本個(gè)數(shù)。 典型案例6中,將400個(gè)蘋(píng)果編號(hào),則隨機(jī)抽取的樣本可能是由編號(hào)為18的這8個(gè)蘋(píng)果構(gòu)成,也可能是由編號(hào)為101108的8個(gè)蘋(píng)果構(gòu)成等等。,一、樣本容量和樣本個(gè)數(shù),參數(shù)是用來(lái)描述總體數(shù)量特征的,如總體均值 、總體比例 、總體方差 等; 統(tǒng)計(jì)量是用來(lái)描述樣本數(shù)量特征的,是由樣本構(gòu)造的函數(shù),如樣本均值 、樣本比例 、樣本方差 等。 由于總體是唯一的、固定不變的,故參數(shù)往往是一個(gè)未知的常數(shù);而樣本不唯一,且一旦抽取出來(lái),就成為已知,故統(tǒng)計(jì)量是隨機(jī)變量,其取值隨著樣本的變化而改變。,二、參數(shù)和統(tǒng)計(jì)量,抽樣的目的就是要根據(jù)樣

4、本統(tǒng)計(jì)量去估計(jì)或推斷總體參數(shù)。 比如,常用樣本均值 去推斷總體均值 、用樣本比例 去推斷總體比例 、用樣本方差 去推斷總體方差 。 以上做法的理論依據(jù)就是樣本統(tǒng)計(jì)量的抽樣分布。,二、參數(shù)和統(tǒng)計(jì)量,統(tǒng)計(jì)量是隨機(jī)變量。抽樣分布就是統(tǒng)計(jì)量的概率分布。 如樣本均值的概率分布、樣本比例的概率分布、樣本方差的概率分布等都稱為抽樣分布。,三、抽樣分布,以下將以樣本均值為例說(shuō)明統(tǒng)計(jì)量的 抽樣分布。,【例5-1】設(shè)有一個(gè)總體,含有5個(gè)個(gè)體:10、20、30、40、50,即 。采取重復(fù)抽樣的方式從中抽取樣本容量為2的樣本,即 。 試寫(xiě)出樣本均值 的抽樣分布。,三、抽樣分布,解:由于 =5, =2,從總體中采取重

5、復(fù)抽樣的方式抽取樣本,則樣本共有 =52 =25個(gè)。計(jì)算出這25個(gè)樣本的均值 ,其結(jié) 果如表5-1所示。,表5-1 n=2 時(shí)樣本均值的抽樣及其取值情況,表5-2 =2時(shí)樣本均值 的抽樣分布,從而,樣本均值 的概率分布如表5-2所示。,三、抽樣分布,在例5-1中,若樣本容量n=4,則樣本共有 個(gè),并且例5-1中的總體是一個(gè)非常小的總體,現(xiàn)實(shí)世界中,我們面對(duì)的總體往往很大,進(jìn)而樣本數(shù)目將很可觀,不可能將所有的樣本都抽取出來(lái)。 因此抽樣分布實(shí)質(zhì)上是一種理論分布。它可能是精確的某已知分布,也可能是以某已知分布為極限的極限分布。,三、抽樣分布,抽樣分布理論在推斷統(tǒng)計(jì)中具有重要的作用,它是后續(xù)參數(shù)估計(jì)和

6、假設(shè)檢驗(yàn)的理論依據(jù)和基礎(chǔ)。,三、抽樣分布,設(shè)總體的平均數(shù)為 ,方差為 ,采取重復(fù)抽樣的方式,從中抽取獨(dú)立同分布的樣本: , 。根據(jù)數(shù)學(xué)期望和方差的性質(zhì),可推出:,四、抽樣分布的數(shù)字特征,(一)樣本均值的數(shù)字特征,(5.1),在例5-1中,樣本均值的平均數(shù),總體均值,樣本均值的方差,總體方差,由于n =2,從而驗(yàn)證了(5.1)的正確性。,四、抽樣分布的數(shù)字特征,由式(5.1)可知: 的平均數(shù)為 ,方差為 。隨著 的增大,其方差越來(lái)越小,從而 的取值越來(lái)越向著 靠攏,故用 去估計(jì) 理論依據(jù)成立。,由此可見(jiàn),典型案例6中,人們用挑選 出的幾個(gè)蘋(píng)果口感的均值去估計(jì)這批蘋(píng)果 口感的均值的做法是站得住腳的

7、。,四、抽樣分布的數(shù)字特征,以上結(jié)論均建立在重復(fù)抽樣情形下,若是在不重復(fù)抽樣情形下,方差需要用系數(shù) 進(jìn)行修正,從而樣本均值的數(shù)字特征為:,(5.2),可見(jiàn):用 去估計(jì) 理論依據(jù)同樣成立。,四、抽樣分布的數(shù)字特征,比例:總體(或樣本)中具有某種屬性的個(gè)體數(shù)與全部個(gè)體數(shù)之比,總體比例記為 。 現(xiàn)有 ,采取重復(fù)抽樣的方式從中抽取獨(dú)立同分布的樣本: , 。樣本中變量值1出現(xiàn)次數(shù)記為 ,那么變量值1出現(xiàn)次數(shù)所占的比例為 / ,即 為樣本比例。,(二)樣本比例的數(shù)字特征,四、抽樣分布的數(shù)字特征,根據(jù)數(shù)學(xué)期望和方差的性質(zhì),可推出樣本比例 的數(shù)學(xué)期望、方差與總體的平均數(shù)、方差之間的關(guān)系:,(5.3),四、抽樣

8、分布的數(shù)字特征,由式(5.3)可知: 的平均數(shù)為總體 比例 ,方差為 。隨著 的增大, 方差越來(lái)越小,從而 的取值越來(lái)越向 靠攏,故用 去估計(jì) 理論依據(jù)成立。,以上結(jié)論均建立在重復(fù)抽樣情形下,若是在不重復(fù)抽樣情形下,當(dāng)樣本容量很大時(shí),方差需要用系數(shù)進(jìn)行修正,從而樣本比例的數(shù)字特征為:,(5.4),可見(jiàn):用 去估計(jì) 理論依據(jù)同樣成立。,四、抽樣分布的數(shù)字特征,設(shè)總體 的方差為 ,采取重復(fù)抽樣的方式,從中抽取獨(dú)立同分布的樣本: , , 。根據(jù)數(shù)學(xué)期望和方差的性質(zhì),可推出樣本方差的數(shù)學(xué)期望、方差與總體的方差之間的關(guān)系為:,(5.5),(三)樣本方差的數(shù)字特征,四、抽樣分布的數(shù)字特征,由式(5.5)可

9、知:樣本方差的平均數(shù)為 ,方差為 ,隨著 的增大,其方差越來(lái)越小,從而 的取值越來(lái)越向著 靠攏,故用 去估計(jì) 理論依據(jù)成立。,四、抽樣分布的數(shù)字特征,由此可見(jiàn),典型案例6中,人們用挑選 出的幾個(gè)蘋(píng)果口感的差異值去估計(jì)這批蘋(píng) 果口感的差異值的做法是站得住腳的。,以上結(jié)論均建立在重復(fù)抽樣情形下,若是在不重復(fù)抽樣情形下,方差需要用系數(shù)進(jìn)行修正,從而樣本方差的數(shù)字特征為:,(5.6),可見(jiàn):用 去估計(jì) 理論依據(jù)同樣成立。,四、抽樣分布的數(shù)字特征,統(tǒng)計(jì)量抽樣分布的標(biāo)準(zhǔn)差,稱為統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤,也稱標(biāo)準(zhǔn)誤差。 標(biāo)準(zhǔn)誤可用于說(shuō)明抽樣誤差的大小。抽樣誤差是指由抽樣的隨機(jī)性引起的樣本結(jié)果與總體的真實(shí)值之間的差異,

10、它描述的是所有樣本可能的結(jié)果與總體真值之間的平均性差異。若總體標(biāo)準(zhǔn)差未知,可用樣本標(biāo)準(zhǔn)差代替,此時(shí)的標(biāo)準(zhǔn)誤稱為估計(jì)標(biāo)準(zhǔn)誤。,(四)標(biāo)準(zhǔn)誤(重點(diǎn)),四、抽樣分布的數(shù)字特征,樣本比例的標(biāo)準(zhǔn)誤為 。當(dāng)總體比例 未知時(shí),可用樣本比例代替,此時(shí)得到的標(biāo)準(zhǔn)誤稱為估計(jì)標(biāo)準(zhǔn)誤。,四、抽樣分布的數(shù)字特征,樣本方差的標(biāo)準(zhǔn)誤為 。當(dāng)總體標(biāo)準(zhǔn) 差未知時(shí),可用樣本標(biāo)準(zhǔn)差代替,此時(shí)得 到的標(biāo)準(zhǔn)誤稱為估計(jì)標(biāo)準(zhǔn)誤。,樣本均值的標(biāo)準(zhǔn)誤為 。當(dāng)總體標(biāo)準(zhǔn) 差未知時(shí),可用樣本標(biāo)準(zhǔn)差代替,此時(shí)得 到的標(biāo)準(zhǔn)誤稱為估計(jì)標(biāo)準(zhǔn)誤。,一、樣本均值的抽樣分布 二、樣本比例的抽樣分布 三、樣本方差的抽樣分布 四、t分布和F分布,第二節(jié) 幾個(gè)常見(jiàn)的抽

11、樣分布,抽樣分布即統(tǒng)計(jì)量的概率分布。本節(jié)將分別對(duì)樣本均值、樣本比例以及樣本方差的抽樣分布作詳細(xì)的討論。,如無(wú)特別說(shuō)明,本章中的抽樣方式均 指重復(fù)抽樣。,第二節(jié) 幾個(gè)常見(jiàn)的抽樣分布,樣本均值的抽樣分布,就是采取重復(fù)抽樣的方式,選取容量為 的所有樣本,由樣本均值所有可能的取值形成的概率分布。它是推斷總體均值 的理論基礎(chǔ)。,以下分兩種情況來(lái)討論樣本均值 的 抽樣分布類型。,一、樣本均值的抽樣分布,正態(tài)分布的再生定理:若總體變量 ,從這個(gè)總體中抽取容量為 的樣本,則樣本均值 。,(一)總體服從正態(tài)分布,一、樣本均值的抽樣分布,正態(tài)分布:若 的概率密度函數(shù)為,(5.7),其中, 和 都是參數(shù),且 ,則稱

12、 服從參數(shù)為 和 的正態(tài)分布,記作 。其概率密度函數(shù)圖見(jiàn)圖5-1。,圖5-1 正態(tài)分布概率密度函數(shù)圖,一、樣本均值的抽樣分布,正態(tài)分布概率密度函數(shù) 的性質(zhì):,(1) ,即整個(gè)曲線都在x軸的上方; (2)曲線 相對(duì)于 對(duì)稱,并在 處達(dá)到最大值 ; (3)曲線的陡緩程度由 決定, 越大,曲線越平緩; 越小,曲線越陡峭。 (4)當(dāng) 趨于無(wú)窮時(shí),曲線以 軸為漸近線。 正態(tài)分布的概率密度曲線是一條對(duì)稱的鐘型曲線。 決定了圖形的中位置, 決定了圖形中曲線的陡峭程度。,特別地,當(dāng)參數(shù) =0, =1時(shí),這樣的正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布,記為 ,其概率密度函數(shù)為:,一、樣本均值的抽樣分布,獨(dú)立同分布中心極限定理表明

13、:無(wú)論總體服從何種分布,只要其平均數(shù)和方差存在,那么從中抽取的獨(dú)立同分布樣本 , ,其均值在當(dāng) 很大時(shí),就會(huì)近似服從正態(tài)分布 。,(二)總體服從非正態(tài)分布,實(shí)際應(yīng)用中,一般取 ,此時(shí)的樣 本稱為大樣本。若為小樣本,且總體分布 不是正態(tài)分布,此時(shí)不能按照正態(tài)分布來(lái) 處理,要運(yùn)用小樣本的相關(guān)理論來(lái)討論。,圖5-2 樣本均值的抽樣分布圖,一、樣本均值的抽樣分布,根據(jù)本章第一節(jié),在不重復(fù)抽樣情形下,樣本均值的抽樣分布為: ,(5.8),一、樣本均值的抽樣分布,【例5-2】假設(shè)在一個(gè)飯店門口等待出租車的時(shí)間是服從左偏分布的,均值為12分鐘,標(biāo)準(zhǔn)差為3分鐘?,F(xiàn)從飯店門口隨機(jī)抽取100名顧客并記錄他們等待出

14、租車的時(shí)間,考察100名顧客的平均等待時(shí)間的抽樣分布。,一、樣本均值的抽樣分布,解:依題意,總體均值 =12, =3,根據(jù)中心極限定理可知:樣本均值(100名顧客的平均等待時(shí)間)的抽樣分布為: ,即: ,一、樣本均值的抽樣分布,【例5-3】人口普查發(fā)現(xiàn),某地區(qū)成年男子的身高服從正態(tài)分布N(175, 62),采取重復(fù)抽樣的方式從該地區(qū)抽取64名成年男子構(gòu)成樣本,求樣本均值的平均數(shù)和方差。,一、樣本均值的抽樣分布,解:依題意,總體服從正態(tài)分布,且 =175, =62。根據(jù)正態(tài)分布的再生定理, 樣本均值 ,即樣本均值的平 均數(shù) ,樣本均值的方差 。,樣本比例 的抽樣分布,就是采取重復(fù)抽樣的方式,選取

15、容量為 的所有樣本,由樣本比例 的所有可能的取值形成的概率分布。它是推斷總體比例 的理論基礎(chǔ)。,二、樣本比例p的抽樣分布,可以看到,樣本比例是一種特殊的樣本均值。從而,根據(jù)樣本均值的抽樣分布理論可得樣本比例的抽樣分布。 一般地,若能同時(shí)滿足 和 ,就可以認(rèn)為樣本容量很大。,樣本比例 的抽樣分布為:在滿足條 件的情況下,即當(dāng)樣本容量很大時(shí) ,(5.9),二、樣本比例p的抽樣分布,在不重復(fù)抽樣情形下,當(dāng)樣本容量很大時(shí),樣本比例的抽樣分布為: ,(5.10),二、樣本比例p的抽樣分布,說(shuō)明:在不重復(fù)抽樣情形下,對(duì)于無(wú) 限總體也可以按重復(fù)抽樣來(lái)處理,即方差 不用修正;對(duì)于有限總體,要用修正系數(shù) 修正,

16、另外,若此時(shí) 很大而抽樣比 時(shí),修正系數(shù)趨于1,方差可以按重復(fù)抽樣 情形時(shí)(即不用修正)的公式計(jì)算。,樣本方差 的抽樣分布,就是采取重復(fù)抽樣的方式,選取容量為 的所有樣本,由樣本方差 的所有可能的取值形成的概率分布。它是推斷總體方差 的理論基礎(chǔ)。,三、樣本方差S2的抽樣分布,設(shè)總體服從均值為 ,方差 的正態(tài)分布, , , 為來(lái)自該總體的樣本,則樣本方差 的抽樣分布為: ,(5.11),稱 服從自由度為 的 分布(卡方 分布)。,三、樣本方差S2的抽樣分布,卡方分布:設(shè) , 為來(lái)自于標(biāo)準(zhǔn)正態(tài)總體N(0,1)的樣本,則 服從自由度為 的 分布,記為 ,讀作卡方分布。,三、樣本方差S2的抽樣分布,圖

17、5-3 卡方分布的概率密度函數(shù)圖,三、樣本方差S2的抽樣分布,卡方分布的數(shù)字特征為:若 ,則總體平均數(shù) ,方差 。,由卡方分布的數(shù)字特征,可得:,(5.12),在不重復(fù)抽樣情形下,方差為 。,三、樣本方差S2的抽樣分布,(一) t分布,t分布也稱為學(xué)生氏分布,是戈塞特于1908年在一篇以“Student”(學(xué)生)為筆名的論文中首次提出的。 設(shè) 且 與 相互獨(dú)立,則稱隨機(jī)變量 服從自由度為 的t分布,記作 t 。,四、t分布和F分布,圖5-4 分布的概率密度函數(shù)圖,四、t分布和F分布,分布概率密度函數(shù)曲線是以縱軸為對(duì)稱軸的單峰對(duì)稱圖形,其與標(biāo)準(zhǔn)正態(tài)分布曲線類似, 分布曲線頂部略低,兩尾部稍高而平。自由度 越大, 分布越趨近于標(biāo)準(zhǔn)正態(tài)分布,當(dāng) 時(shí), 分布與標(biāo)準(zhǔn)正態(tài)分布完

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論