版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第二節(jié) 抽樣分布生物統(tǒng)計(jì)學(xué)的主要任務(wù)就是研究總體和樣本的關(guān)系: 從樣本到總體 從總體到樣本 目的就是通過樣本來推斷總體 目的就是研究樣本統(tǒng)計(jì)量的分布及其與原總體的關(guān)系從特殊到一般, 從一般到特殊, 統(tǒng)計(jì)推斷 抽樣分布 抽樣分布是統(tǒng)計(jì)推斷的基礎(chǔ),研究抽樣分布的目的就是為了更好地進(jìn)行統(tǒng)計(jì)推斷,并能正確地理解統(tǒng)計(jì)推斷的結(jié)論 第二節(jié) 抽樣分布生物統(tǒng)計(jì)學(xué)的主要任務(wù)就是研究總體和樣本的關(guān)1. 抽樣分布的概念樣本平均數(shù) 和樣本方差S2是描述樣本特征的兩個(gè)最重要的統(tǒng)計(jì)量總體平均數(shù)和總體方差2是描述總體特征的兩個(gè)最重要的參數(shù) 因此,研究總體和樣本的關(guān)系,實(shí)際就是研究: S2 2 就總體而言,和2都是常量 從總體
2、中隨機(jī)地抽取若干個(gè)體所組成的樣本,即使每次抽取的樣本容量都相等,每一個(gè)樣本所得到的樣本平均數(shù)也不可能都相等,同時(shí)也不可能就等于總體平均數(shù) 樣本統(tǒng)計(jì)量將隨樣本的不同而有所不同,因而樣本統(tǒng)計(jì)量也是隨機(jī)變量,也有其概率分布 樣本統(tǒng)計(jì)量的概率分布稱為抽樣分布(sampling distribution) 樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異稱為抽樣誤差 (sampling error) 1. 抽樣分布的概念樣本平均數(shù) 和樣本方差S2是描述從總體中抽取樣本的過程稱為抽樣(sampling) 抽樣分為復(fù)置抽樣和不復(fù)置抽樣兩種: 復(fù)置抽樣是指每次抽出一個(gè)個(gè)體后,這個(gè)個(gè)體應(yīng)返回原總體 不復(fù)置抽樣是指每次抽出的個(gè)體不
3、返回原總體 對(duì)于無限總體,或者樣本容量n與總體容量N相比很小時(shí),返回與否都可保證每個(gè)個(gè)體被抽到的機(jī)會(huì)相等,復(fù)置抽樣等同于不復(fù)置抽樣 對(duì)于有限總體,應(yīng)該采取復(fù)置抽樣,否則各個(gè)體被抽到的機(jī)會(huì)就不相等在實(shí)際操作中均為不復(fù)置抽樣 在理論研究中則以復(fù)置抽樣為主 從總體中抽取樣本的過程稱為抽樣(sampling) 抽樣分為2. 樣本平均數(shù)的抽樣分布2.1 樣本平均數(shù)抽樣分布的概念從總體容量為N的總體中進(jìn)行抽樣,如果每個(gè)樣本的樣本容量均為n,將所有這樣的樣本都抽出來,并計(jì)算出每一個(gè)樣本的平均數(shù)新總體(即樣本平均數(shù)抽樣總體)中,樣本平均數(shù)的個(gè)數(shù)即總體容量為: Nn 原來的那個(gè)總體,稱為原總體 由樣本平均數(shù)組成
4、的分布稱為樣本平均數(shù)抽樣分布 如果原總體的平均數(shù)為,標(biāo)準(zhǔn)差為,那么樣本平均數(shù)抽樣總體:平均數(shù)為:標(biāo)準(zhǔn)差為:稱為樣本平均數(shù)抽樣總體的標(biāo)準(zhǔn)誤差 簡(jiǎn)稱為標(biāo)準(zhǔn)誤(standard error) 由樣本平均數(shù)組成的新總體,就稱為樣本平均數(shù)抽樣總體 2. 樣本平均數(shù)的抽樣分布2.1 樣本平均數(shù)抽樣分布的概念從標(biāo)準(zhǔn)誤表示平均數(shù)抽樣誤差的大小,反映樣本平均數(shù)與新總體平均數(shù)之間的離散程度 標(biāo)準(zhǔn)差表示的是原總體中原始數(shù)據(jù)與原總體平均數(shù)的關(guān)系 標(biāo)準(zhǔn)誤表示的是從原總體中抽取的樣本平均數(shù)與樣本平均數(shù)抽樣總體平均數(shù)的關(guān)系 研究總體與樣本的關(guān)系就轉(zhuǎn)化成了討論原總體與樣本平均數(shù)抽樣總體的關(guān)系:例6:設(shè)有一總體,總體容量為N=
5、3,觀測(cè)值分別為2、4、6,以樣本容量n=2對(duì)該總體進(jìn)行復(fù)置抽樣,證明: (1)(2)標(biāo)準(zhǔn)誤表示平均數(shù)抽樣誤差的大小,反映樣本平均數(shù)與新總體平均數(shù)原總體的總體平均數(shù)為:(1)以樣本容量n = 2對(duì)該總體進(jìn)行復(fù)置抽樣,則樣本平均數(shù)抽樣總體為: 樣本平均數(shù)抽樣總體的總體容量為: 樣本平均數(shù)抽樣總體的總體平均數(shù)為: 原總體的總體平均數(shù)為:(1)以樣本容量n = 2對(duì)該總體進(jìn)行(2)原總體的總體標(biāo)準(zhǔn)差為:樣本平均數(shù)抽樣總體的總體標(biāo)準(zhǔn)差為: (2)原總體的總體標(biāo)準(zhǔn)差為:樣本平均數(shù)抽樣總體的總體標(biāo)準(zhǔn)差為2.2 樣本平均數(shù)抽樣分布的特點(diǎn)(1)樣本平均數(shù)抽樣總體的總體平均數(shù)與原總體的總體平均數(shù)相等,因此,可用
6、代替(2)樣本平均數(shù)抽樣總體的方差與原總體的方差的關(guān)系為 (3)當(dāng)隨機(jī)變量xN(,2)時(shí),樣本平均數(shù) 當(dāng)隨機(jī)變量x不呈正態(tài)分布或分布未知時(shí),只要樣本容量n不斷增大(或足夠大),則樣本平均數(shù)的分布逐漸趨向于正態(tài)分布,且平均數(shù)為,方差為(4)樣本平均數(shù)是總體平均數(shù)的無偏估計(jì)量;樣本方差是總體方差的無偏估計(jì)量;但樣本標(biāo)準(zhǔn)差不是總體標(biāo)準(zhǔn)差的無偏估計(jì)量 中心極限定理2.2 樣本平均數(shù)抽樣分布的特點(diǎn)(1)樣本平均數(shù)抽樣總體的總2.3 與 的關(guān)系(1) (2)表示原總體中各觀測(cè)值的離散程度 表示樣本平均數(shù)抽樣總體中各樣本平均數(shù)的離散程度(3)是總體中各觀測(cè)值變異程度的度量值 是樣本平均數(shù)抽樣誤差的度量值是用
7、來衡量樣本平均數(shù)代表總體平均數(shù)的代表程度的(4)稱為標(biāo)準(zhǔn)差,用Sd表示 稱為標(biāo)準(zhǔn)誤,用Se表示 2.3 與 的關(guān)系(1) (2)表示原總體中各觀測(cè)值3. 樣本平均數(shù)差數(shù)的抽樣分布假設(shè)有這樣兩個(gè)總體: 總體1 總體2 N1 N2 從以上兩個(gè)總體中獨(dú)立地抽取樣本容量分別為n1和n2的樣本,可得: 繼續(xù)進(jìn)行抽樣, 最終可分別得到: 如果將這兩組樣本平均數(shù)配成差數(shù): 則可得到差數(shù): 3. 樣本平均數(shù)差數(shù)的抽樣分布假設(shè)有這樣兩個(gè)總體: 總體1 由這些樣本平均數(shù)的差數(shù)所組成的新總體稱為樣本平均數(shù)差數(shù)抽樣總體 由這些樣本平均數(shù)的差數(shù)形成的分布稱為樣本平均數(shù)差數(shù)抽樣分布 樣本平均數(shù)差數(shù)的抽樣分布有兩個(gè)參數(shù):
8、平均數(shù): 方差: 當(dāng)原總體服從正態(tài)分布或非正態(tài)分布,只要所抽樣本容量較大(n130,n230),樣本平均數(shù)差數(shù)的抽樣分布就可認(rèn)為是正態(tài)分布樣本平均數(shù)差數(shù)的抽樣總體與原來的兩個(gè)總體的關(guān)系為:樣本平均數(shù)差數(shù)標(biāo)準(zhǔn)誤 度量樣本平均數(shù)差數(shù)的抽樣誤差的大小由這些樣本平均數(shù)的差數(shù)所組成的新總體稱為樣本平均數(shù)差數(shù)抽樣總4. 標(biāo)準(zhǔn)誤的作用(1)衡量樣本平均數(shù)間的變異程度(2)推斷總體平均數(shù)的可能范圍 標(biāo)準(zhǔn)誤大,說明樣本平均數(shù)間的變異程度大 用樣本平均數(shù)來估計(jì)總體平均數(shù)的效果差,樣本平均數(shù)的代表性弱 在通常情況下,可以用樣本標(biāo)準(zhǔn)誤來估計(jì)總體標(biāo)準(zhǔn)誤 可用樣本平均數(shù)標(biāo)準(zhǔn)誤來估計(jì)總體平均數(shù)的可能范圍表示原始數(shù)據(jù)的變異程
9、度 是用樣本平均數(shù)來估計(jì)總體平均數(shù)的可能范圍4. 標(biāo)準(zhǔn)誤的作用(1)衡量樣本平均數(shù)間的變異程度(2)推斷(3)估計(jì)總體平均數(shù)的置信區(qū)間研究抽樣和抽樣分布的目的,就是希望用樣本統(tǒng)計(jì)量來估計(jì)總體參數(shù) 一般情況下,不可能精確地估計(jì)出總體參數(shù)的具體值 只能在一定的概率(1-)保證下,估計(jì)出總體參數(shù)所在的范圍 點(diǎn)估計(jì) 區(qū)間估計(jì) 置信區(qū)間的上下限,分別稱為置信上限和置信下限 置信區(qū)間的長(zhǎng)度稱為置信距 保證概率(1-)又稱為置信度或置信系數(shù) 在(1-)概率保證下總體平均數(shù)的置信區(qū)間公式為: 1-=95%: 1-=99%: (3)估計(jì)總體平均數(shù)的置信區(qū)間研究抽樣和抽樣分布的目的,就是5. t-分布5.1 t-
10、分布的定義正態(tài)分布的標(biāo)準(zhǔn)化公式為: 根據(jù)公式可以計(jì)算出隨機(jī)變量x在某一區(qū)間內(nèi)出現(xiàn)的概率: 對(duì)于總體方差2已知的總體,根據(jù)標(biāo)準(zhǔn)正態(tài)分布可以知道樣本平均數(shù)在某一區(qū)間內(nèi)出現(xiàn)的概率,公式為: 5. t-分布5.1 t-分布的定義正態(tài)分布的標(biāo)準(zhǔn)化公式為:假如2未知,而且樣本容量又比較小(n30)時(shí): 標(biāo)準(zhǔn)化公式可變換為:t統(tǒng)計(jì)量組成的分布,就稱為t分布(t distribution) 不再服從標(biāo)準(zhǔn)正態(tài)分布t分布是一組曲線,自由度不同,曲線不同,但均以y軸為對(duì)稱 t分布只有一個(gè)參數(shù),即自由度 dft分布的平均數(shù)和標(biāo)準(zhǔn)差為: 0 (df 1) (df 2)服從t-分布假如2未知,而且樣本容量又比較?。╪30
11、)時(shí): 標(biāo)準(zhǔn)化公5.2 t-分布的特點(diǎn)(1)t分布為對(duì)稱分布,關(guān)于t = 0對(duì)稱;只有一個(gè)峰,峰值在t = 0處;與標(biāo)準(zhǔn)正態(tài)分布曲線相比,t分布曲線頂部略低,兩尾部稍高而平 (2)t分布曲線受自由度df 的影響,自由度越小,離散程度越大(3) t分布的極限是正態(tài)分布。df越大,t分布越趨近于標(biāo)準(zhǔn)正態(tài)分布 當(dāng)n 30時(shí),t分布與標(biāo)準(zhǔn)正態(tài)分布的區(qū)別很??;n 100時(shí),t分布基本與標(biāo)準(zhǔn)正態(tài)分布相同;n時(shí),t 分布與標(biāo)準(zhǔn)正態(tài)分布完全一致5.2 t-分布的特點(diǎn)(1)t分布為對(duì)稱分布,關(guān)于t = 05.3 t-分布的概率計(jì)算附表4給出了t分布的兩尾臨界值 當(dāng)左尾和右尾的概率之和為(每側(cè)為 /2)時(shí),t分布
12、在橫坐標(biāo)上的臨界值的絕對(duì)值,記為t 例7:根據(jù)附表4查出相應(yīng)的臨界 t值 :(1)df =9,=0.05; (2)df =9,=0.015.3 t-分布的概率計(jì)算附表4給出了t分布的兩尾臨界值 當(dāng)從一個(gè)已知平均數(shù)為,方差為2的正態(tài)總體中,進(jìn)行獨(dú)立地抽樣,可獲得隨機(jī)變量x,則其標(biāo)準(zhǔn)離差: N(0,1)如果連續(xù)進(jìn)行n次獨(dú)立抽樣,可得n個(gè)標(biāo)準(zhǔn)正態(tài)離差ui,對(duì)這n個(gè)獨(dú)立的標(biāo)準(zhǔn)正態(tài)離差ui進(jìn)行平方求和就得到一個(gè)新的統(tǒng)計(jì)量2:6. 2-分布6.1 2-分布的定義從一個(gè)已知平均數(shù)為,方差為2的正態(tài)總體中,進(jìn)行獨(dú)立地抽樣如果用樣本進(jìn)行計(jì)算:由這些2值所組成的一個(gè)分布,就稱之為2分布(2 distributio
13、n)如果用樣本進(jìn)行計(jì)算:由這些2值所組成的一個(gè)分布,就稱之為6.2 2-分布的特點(diǎn)(1)2分布的取值范圍為0,+),無負(fù)值(2)2分布的平均數(shù)為: 方差為: (3)2分布的形狀決定于自由度df 當(dāng)df =1時(shí),曲線呈反 J 形 隨著df 的增大,曲線漸趨對(duì)稱 當(dāng)df 30時(shí),向正態(tài)分布漸近 (4)2還可以定義為理論次數(shù)與觀察次數(shù)間的符合程度 O 觀察次數(shù) E 理論次數(shù) 6.2 2-分布的特點(diǎn)(1)2分布的取值范圍為0,+6.3 2-分布的概率計(jì)算附表3給出了2分布的右尾臨界值 當(dāng)右尾概率為時(shí),2分布在橫坐標(biāo)上的臨界值的絕對(duì)值,記為例8:根據(jù)附表3查出相應(yīng)的右尾臨界2值 : (1)df =9,=
14、0.05;(2)df =9,=0.01如果計(jì)算左尾概率為 時(shí)2分布的臨界值,只需查右尾概率為1- 的右尾臨界值即可6.3 2-分布的概率計(jì)算附表3給出了2分布的右尾臨界值7. F-分布7.1 F-分布的定義從一個(gè)方差2的正態(tài)總體中獨(dú)立地抽取樣本容量分別為n1、n2的兩個(gè)樣本,這兩個(gè)樣本的方差分別為:則有:這兩個(gè)2變量除以各自的自由度后的比值為:由一系列F值所構(gòu)成的分布稱為F分布(F distribution) F F(df1,df2) 7. F-分布7.1 F-分布的定義從一個(gè)方差2的正態(tài)總體7.2 F-分布的特點(diǎn)(1)F分布密度曲線是隨自由度df1、df2的變化而變化的一簇偏態(tài)曲線 其形狀隨著df1、df2的增大逐漸趨于對(duì)稱;(2)F分布的取值范圍是(0,+),其平均數(shù):7.2 F
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年一年級(jí)語文上全冊(cè)各單元測(cè)試題分解
- 年度其它新型計(jì)算機(jī)外圍設(shè)備戰(zhàn)略市場(chǎng)規(guī)劃報(bào)告
- 年度碳纖維預(yù)浸布市場(chǎng)分析及競(jìng)爭(zhēng)策略分析報(bào)告
- 2025年度專業(yè)打印紙銷售渠道建設(shè)合同4篇
- 2025年度新能源項(xiàng)目出借咨詢及項(xiàng)目管理協(xié)議4篇
- 2025年新型門窗安裝工程承包合同4篇
- 錘片粉碎機(jī)課程設(shè)計(jì)
- 精壓機(jī)課程設(shè)計(jì)2020
- 二零二五年度網(wǎng)絡(luò)安全檢測(cè)與評(píng)估服務(wù)合同4篇
- 高校創(chuàng)客 課程設(shè)計(jì)合同
- 吸入療法在呼吸康復(fù)應(yīng)用中的中國(guó)專家共識(shí)2022版
- 1-35kV電纜技術(shù)參數(shù)表
- 信息科技課程標(biāo)準(zhǔn)測(cè)(2022版)考試題庫(kù)及答案
- 施工組織設(shè)計(jì)方案針對(duì)性、完整性
- 2002版干部履歷表(貴州省)
- DL∕T 1909-2018 -48V電力通信直流電源系統(tǒng)技術(shù)規(guī)范
- 2024年服裝制版師(高級(jí))職業(yè)鑒定考試復(fù)習(xí)題庫(kù)(含答案)
- 門診部縮短就診等候時(shí)間PDCA案例-課件
- 第21課《鄒忌諷齊王納諫》對(duì)比閱讀 部編版語文九年級(jí)下冊(cè)
- NB-T32042-2018光伏發(fā)電工程建設(shè)監(jiān)理規(guī)范
評(píng)論
0/150
提交評(píng)論