




已閱讀5頁(yè),還剩31頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第二章 概率與理論分布,第三節(jié) 平均數(shù)抽樣分布,研究總體與從中抽取的樣本之間的關(guān)系是統(tǒng)計(jì)學(xué)的中心內(nèi)容 。對(duì)這種關(guān)系的研究可從兩方面著手: (1)抽樣分布:從總體到樣本 ,這就是研究抽樣分布(sampling distribution)的問(wèn)題,統(tǒng)計(jì)量的概率分布稱為抽樣分布; (2)統(tǒng)計(jì)推斷: 從樣本到總體,這就是統(tǒng)計(jì)推斷(statistical inference)問(wèn)題。,統(tǒng)計(jì)推斷是以總體分布和樣本抽樣分布的理論關(guān)系為基礎(chǔ)的。為了能正確地利用樣本去推斷總體,并能正確地理解統(tǒng)計(jì)推斷的結(jié)論,須對(duì)樣本的抽樣分布有所了解。 我們知道,由總體中隨機(jī)地抽取若干個(gè)體組成樣本,即使每次抽取的樣本含量相等,其統(tǒng)計(jì)量(如,S)也將隨樣本的不同而有所不同,因而樣本統(tǒng)計(jì)量也是隨機(jī)變量, 也有其概率分布。我們把統(tǒng)計(jì)量的概率分布稱為抽樣分布。,由總體隨機(jī)抽樣(random sampling)的方法可分為有復(fù)置抽樣和不復(fù)置抽樣兩種。 復(fù)置抽樣:指每次抽出一個(gè)個(gè)體后,這個(gè)個(gè)體應(yīng)返回原總體; 不復(fù)置抽樣:指每次抽出的個(gè)體不返回原總體。 對(duì)于無(wú)限總體,返回與否都可保證各個(gè)體被抽到的機(jī)會(huì)相等。 對(duì)于有限總體,就應(yīng)該采取復(fù)置抽樣,否則各個(gè)體被抽到的機(jī)會(huì)就不相等。,一、抽樣的目的go 二、樣本平均數(shù)及其分布go 三、樣本平均數(shù)差數(shù)及其分布go 四、t分布go,導(dǎo)言,一、抽樣的目的 運(yùn)用樣本推斷總體 試驗(yàn)測(cè)定所得 樣本數(shù)據(jù); 試驗(yàn)?zāi)康?獲得總體信息 因此要研究 樣本與總體關(guān)系 如何通過(guò)對(duì)樣本數(shù)據(jù)的分析獲得總體信息,總體 ,從總體抽取樣本,從樣本推斷總體,導(dǎo)言,總體 ,從總體抽取樣本,從樣本推斷總體,二、樣本平均數(shù)及其分布:,許多 Si 形成樣本標(biāo)準(zhǔn)差抽樣分布。,許多 形成樣本平均數(shù)抽樣分布。由樣本平均數(shù)構(gòu)成的總體稱為樣本平均數(shù)的抽樣總體。,和一個(gè)標(biāo)準(zhǔn)差Si 。,每一個(gè)樣本有一個(gè)樣本平均數(shù),樣本平均數(shù) 抽樣分布,二、樣本平均數(shù)及其分布:,抽樣分布總體與原總體有什么關(guān)系? 與 ? 與 ? 抽樣分布總體與原總體關(guān)系如下: 1、樣本平均數(shù)分布的平均數(shù)等于原總體平 2、樣本平均數(shù)分布的標(biāo)準(zhǔn)差等于原總體標(biāo) 即,(標(biāo)準(zhǔn)誤),準(zhǔn)差除以,均數(shù),即,標(biāo) 準(zhǔn) 誤 標(biāo) 準(zhǔn) 誤(平均數(shù)抽樣總體的標(biāo)準(zhǔn)差) 的大小反映樣本平均數(shù) 的抽樣誤差的大小,即精確性的高低 。 標(biāo)準(zhǔn)誤大,說(shuō)明各樣本平均數(shù) 間差異程度大,樣本平均數(shù)的精確性低。反之, 小,說(shuō)明各樣本平均數(shù) 間的差異程度小 , 樣本平均數(shù)的精確性高。 的大小與原總體的標(biāo)準(zhǔn)差成正比,與樣本含量n的平方根成反比。從某特定總體抽樣 ,因?yàn)槭且怀?shù) ,所以只有增大樣本含量才能降低樣本平均數(shù) 的抽樣誤差。,注意,樣本標(biāo)準(zhǔn)差與樣本標(biāo)準(zhǔn)誤是既有聯(lián)系又有區(qū)別的兩個(gè)統(tǒng)計(jì)量。二者的區(qū)別在于: 樣 本 標(biāo) 準(zhǔn) 差 S 是 反 映 樣 本中各 觀測(cè)值 x1 ,x2 ,xn,變 異 程 度大小的一個(gè)指標(biāo),它的大小說(shuō)明了 對(duì) 該 樣本代表性的強(qiáng)弱。 樣本標(biāo)準(zhǔn)誤是樣本平均數(shù) , , 的標(biāo)準(zhǔn)差,它是抽樣誤差的估計(jì)值, 其大小說(shuō)明了樣本間變異程度的大小及精確性的高低。,對(duì)于大樣本資料,常將樣本標(biāo)準(zhǔn)差S與樣本平均數(shù) 配合使用,記為 S,用以說(shuō)明所考察性狀或指標(biāo)的優(yōu)良性與穩(wěn)定性。 對(duì)于小樣本資料,常將樣本標(biāo)準(zhǔn)誤 與樣本平均數(shù) 配合使用,記為 , 用 以表示 所考察性狀或指標(biāo)的優(yōu)良性與 抽樣誤差的大小。,3、若原分布為正態(tài)分布,平均數(shù)分布亦為正態(tài)分布。 若原分布是非正態(tài)分布,當(dāng)n增大時(shí),平均數(shù)分布亦趨向正態(tài)分布。 所以n30時(shí),可以認(rèn)為新分布符合正態(tài)分布。,例3-4,某品種葡萄總體,果穗長(zhǎng)=30cm,=10.8cm, 隨機(jī)抽50個(gè)果穗,所得樣本平均數(shù)與相差不超過(guò)3cm的概率是多少? 解:已知U= 查附表3得 P (yU +0.28,以及y U -0.28) =0.78 P (U -0.28y U +0.28) =1-0.78=0.22=22% 以上做法對(duì)不對(duì) 不對(duì)! 分析:已知、,求 | -|3cm的概率,求樣本平均數(shù)的信息,算U值須用 ,上面的解答錯(cuò)用 。,?,正確做法: 從樣本均數(shù)分布規(guī)律入手 樣本均數(shù)分布 解: U= 查附表3得P (yU +1.96,以及y U -1.96) =0.05 P (U -1.96y U +1.96) =1-0.05=0.95,若題目改為某葡萄品種總體,果穗長(zhǎng)=30cm,=10.8cm,若從其中抽取50個(gè)穗,問(wèn)50 穗中,長(zhǎng)度與相差不超過(guò)3cm的果穗共有多少穗? 解:U= P=0.22=22% 500.22=11(穂),例3-5 某枇杷單果重=30g, =9.6g, 今從中抽取50個(gè) 分析:已知總體分布=30,=9.6, 問(wèn) 解:,的概率是多少?,的概率P?,樣本中,果,其平均單果重,查附表3得兩尾概率0.46,那么單尾概率=0.46/2=0.23,所以平均單果重小于等于29g的概率為0.23。,若將是題目改成:某枇杷品種平均單果重=30g,=9.6g,問(wèn)單果重小于29g的概率是多少? 解:U= P(29X30)=0.0398 P(X29)=0.5-0.0398=0.4602,查附表3得兩尾概率0.92,那么單尾概率=0.92/2=0.46,所以單果重小于等于29g的概率為0.46。,例:在江蘇沛縣調(diào)查336個(gè)平方米小地老虎蟲(chóng)危害情況的結(jié)果, =4.37頭, =2.63,試問(wèn)樣本容量n=30時(shí),由于隨機(jī)抽樣得到樣本平均數(shù) 等于或小于4.37的概率為多少? 查附表2,(u-0.75)=0.2266,即概率為22.66%(屬于一尾概率)。因所得概率較大,說(shuō)明差數(shù)-0.36是隨機(jī)誤差,從而證明這樣本平均數(shù)4.37是有代表性的。相對(duì)精確度估計(jì)為:,附:變異系數(shù) CV= 用處: (1)比較不同性質(zhì)、不同單位、平均數(shù)相差很遠(yuǎn)的資料之間的變異情況; (2)在空白試驗(yàn)中作為測(cè)定土壤差異的指標(biāo)(解釋空白試驗(yàn)); (3)在田間試驗(yàn)設(shè)計(jì)中,作為確定試驗(yàn)小區(qū)面積和重復(fù)次數(shù)的依據(jù)。,平均數(shù)有沒(méi)有變異系數(shù)? 反映樣本平均數(shù)的離散(變異)情況。 每一個(gè) 都代表總體平均數(shù), 可是它們之間存在差異。 為什么 因?yàn)榇嬖诔闃诱`差。,有。,之間有差異?,是的無(wú)偏估計(jì)。,是一個(gè)樣本的平均數(shù),,所以也是抽樣誤差的反映,即精確度。 因而, 又稱為精確度。 越大,精確度越低。 越小,精確度越高。,是,之間差異是抽樣誤差的反映,,之間差異的估量值,,三、樣本平均數(shù)差數(shù)的分布,總體1 1,總體2 2,三、樣本平均數(shù)差數(shù)的分布:,差數(shù)總體概率分布規(guī)律 1、差數(shù)總體平均數(shù) 即差數(shù)總體的平均數(shù)等于原來(lái)兩個(gè)總體平均數(shù)之差。 2、差數(shù)總體標(biāo)準(zhǔn)差,3、如果原來(lái)兩個(gè)總體作正態(tài)分布,則樣本平均數(shù)差數(shù) 如原兩個(gè)總體非正態(tài)分布(或分布未知): 1)當(dāng)n1 、n2均大于30,樣本平均數(shù)差數(shù) 2)當(dāng)n1 、n2 中有一小于或等于30 時(shí),樣本平均數(shù)差數(shù)(,總體遵從正態(tài)分布;,總體遵從正態(tài)分布,即,)總體遵從t分布。,附: 不同情況下的變形形式 當(dāng)平均數(shù)來(lái)自同一個(gè)總體,有1=2=,且n1=n2=n時(shí), 則 當(dāng)平均數(shù)來(lái)自不同總體,但是n1=n2=n時(shí), 當(dāng)平均數(shù)來(lái)自同一個(gè)總體,有1=2=,但n1n2時(shí) 則,則,平均數(shù)抽樣分布 平均數(shù)總體平均數(shù) 平均數(shù)總體標(biāo)準(zhǔn)差 平均數(shù)總體遵從什么分布 平均數(shù)差數(shù)的分布 差數(shù)總體平均數(shù) 差數(shù)總體標(biāo)準(zhǔn)差 差數(shù)總體遵從什么分布,五、二項(xiàng)總體的抽樣分布,(一)二項(xiàng)總體的分布參數(shù) 為了說(shuō)明二項(xiàng)(0、1)總體的抽樣分布特征,以總體內(nèi)包含5個(gè)個(gè)體為例,每一個(gè)體,y=0,y=1。若總體的變量為:0,1,0,1,1,則總體平均數(shù)和方差為: =(0+1+0+1+1)/5=3/5=0.6 2=(0-0.6)2+(1-0.6)2+(0-0.6)2+(1-0.6)2 +(1-0.6)2/5=0.24 = 二項(xiàng)總體的平均數(shù)=p,方差為2 =p(1-P)=pq,標(biāo)準(zhǔn)差為=,= 0.49,(二)樣本平均數(shù)(成數(shù))的抽樣分布 從二項(xiàng)總體進(jìn)行抽樣得到樣本,樣本平均數(shù)(成數(shù))的分布為二項(xiàng)式分布,平均數(shù) ,方差 ,標(biāo)準(zhǔn)誤 。 (三)樣本總和數(shù)(次數(shù))的抽樣分布 從二項(xiàng)總體進(jìn)行抽樣得到樣本,樣本總和數(shù)(次數(shù))的分布為二項(xiàng)式分布,平均數(shù) ,方差 ,標(biāo)準(zhǔn)誤,例、棉田盲椿象為害棉株分為受害株和未受害株。假定調(diào)查2000株作為一個(gè)總體,受害株為704株。此二項(xiàng)總體中受害率p=35.2%, =0.4776,現(xiàn)從這一總體抽樣,以株為單位,用簡(jiǎn)單隨機(jī)抽樣方法,調(diào)查200株棉株,獲得74株受害,那么,觀察受害率 ,試問(wèn)樣本平均數(shù)與總體真值的差數(shù)的概率為多少? p=0.352,差數(shù)=0.370-0.352=0.018,樣本平均數(shù)的標(biāo)準(zhǔn)差為: =0.034。由于樣本容量大于30,樣本平均數(shù)的分布可以看作正態(tài)分布,故可以計(jì)算正態(tài)離差u查出概率. 查附表3,當(dāng)u=0.53,概率值為0.59,兩尾概率為0.59,故樣本的受害率為37%有代表性。,第七節(jié) t 分 布,五、t分布 由樣本平均數(shù)抽樣分布的性質(zhì)知道: 若yN(, 2), 則 N(, 2/n)。 將隨機(jī)變量 標(biāo)準(zhǔn)化得: , 則uN(0,1)。 當(dāng)總體標(biāo)準(zhǔn)差未知時(shí), 以樣本標(biāo)準(zhǔn)差S代替所得到的統(tǒng)計(jì)量 記為t。在計(jì)算 時(shí),由于采用S來(lái)代替,使得t 變量不再服從標(biāo)準(zhǔn)正態(tài)分布,而是服從t分布(tdistribution)。它的概率分布密度函數(shù)如下:,(4-26) 式中,t的取值范圍是(-,+); df=n-1為自由度。 t分布的平均數(shù)和標(biāo)準(zhǔn)差為: t0 (df1), (df2) (4-27) t分布密度曲線如圖4-13 所示,其特點(diǎn)是:,圖4-13 不同自由度的t分布密度曲線,1、t分布受自由度的制約,每一個(gè)自由度都有一條t分布密度曲線。 2、t分布密度曲線以縱軸為對(duì)稱軸,左右對(duì)稱,且在t0時(shí),分布密度函數(shù)取得最大值。 3、與標(biāo)準(zhǔn)正態(tài)分布曲線相比,t分布曲線頂部略低,兩尾部稍高而平。df越小這種趨勢(shì)越明顯。df越大,t分布越趨近于標(biāo)準(zhǔn)正態(tài)分布。當(dāng)n 30時(shí),t分布與標(biāo)準(zhǔn)正態(tài)分布的區(qū)別很??;n 100時(shí),t分布基本與標(biāo)準(zhǔn)正態(tài)分布相同;n時(shí),t 分布與標(biāo)準(zhǔn)正態(tài)分布完全一致。,t分布的概率分布函數(shù)為: (4-28) 因而t在區(qū)間(t1,+)取值的概率右尾概率為1-F t (df)。由于t分布左右對(duì)稱,t在區(qū)間(-,-t1)取值的概率也為1-F t (df)。 于是 t 分布 曲線 下由-到- t 1和由t 1到+ 兩 個(gè) 相 等 的 概 率 之和兩尾概率為2(1-F t (df)。對(duì)于不同自由度下t分布的兩尾概率及其對(duì)應(yīng)的臨界t
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 學(xué)校教室探戈活動(dòng)方案
- 學(xué)校國(guó)風(fēng)活動(dòng)策劃方案
- 奶茶國(guó)慶活動(dòng)方案
- 婦聯(lián)圓夢(mèng)活動(dòng)方案
- 婚慶圣誕活動(dòng)方案
- 委員外出培訓(xùn)活動(dòng)方案
- 學(xué)習(xí)道德模范活動(dòng)方案
- 學(xué)校守法活動(dòng)方案
- 奇遇旅行活動(dòng)方案
- 如何設(shè)置美容院活動(dòng)方案
- 電氣設(shè)備點(diǎn)檢員習(xí)題(附參考答案)
- 美團(tuán)配送站長(zhǎng)述職報(bào)告
- 預(yù)防接種知識(shí)講座內(nèi)容
- 語(yǔ)文學(xué)科核心素養(yǎng)
- 做賬實(shí)操-數(shù)據(jù)處理和存儲(chǔ)服務(wù)業(yè)的賬務(wù)處理
- 礦產(chǎn)資源儲(chǔ)量報(bào)告編制和評(píng)審中常見(jiàn)問(wèn)題及其處理意見(jiàn)
- 2024年清理道路塌方協(xié)議書(shū)模板
- 河南省鄭州市管城回族區(qū)2023-2024學(xué)年五年級(jí)下學(xué)期期末數(shù)學(xué)試卷
- GB/T 24067-2024溫室氣體產(chǎn)品碳足跡量化要求和指南
- GB 44495-2024汽車整車信息安全技術(shù)要求
- 人教版五年級(jí)3《長(zhǎng)方體和正方體》 單元整體作業(yè)設(shè)計(jì)
評(píng)論
0/150
提交評(píng)論