




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、1,第六章 參數估計基礎,總體,樣本,統計推斷:用樣本信息推斷總體特征,包括參數估計和假設檢驗,2,圖示:總體與樣本,Population,sample2,sample1,sample3,sample4,sample5,3,抽樣試驗(n=5,4,抽樣試驗(n=10,5,抽樣試驗(n=30,6,1000份樣本抽樣計算結果,7,3個抽樣實驗結果圖示,8,各樣本均數未必等于總體均數; 各樣本均數間存在差異; 樣本均數的分布為中間多,兩邊少,左右基本對稱。 樣本均數的變異范圍較之原變量的變異范圍大大縮小,樣本均數的抽樣分布具有如下特點,9,10,中心極限定理,1)從正態(tài)總體中作隨機抽樣,則樣本均數服從
2、正態(tài)分布;從偏態(tài)總體中作隨機抽樣,樣本含量n足夠大(n30)則樣本均數近似服從正態(tài)分布,2)從總體均數為,標準差為的正態(tài)總體中抽取例數為n的樣本,樣本均數的總體均數為,標準差為,11,12,樣本頻率的抽樣分與抽樣誤差,黑球的比例為20%,重復摸球50次,計算摸到黑球的頻率,表6-3 =20%的隨機抽樣結果(n=50,13,一、抽樣誤差與標準誤,1.抽樣誤差:由于抽樣造成的樣本統計量與總體參數以及樣本統計量與樣本統計量之間的差異。 抽樣誤差是不可避免的,但可以估計。 2.標準誤(Standard error,SE):標準誤為樣本均數的標準差,用 表示,是說明樣本均數抽樣誤差的大小的指標,描述樣本
3、均數的離散程度,反映用樣本均數估計或推斷總體均數的可靠性,14,3.標準誤的計算,均數的標準誤與標準差成正比,與樣本例數的平方根成反比。 若標準差固定不變時,可增加n而縮小抽樣誤差,15,對于二項分布,XB(n,), 則樣本頻率 其標準誤,實際中, 一般未知, 常用樣本頻率p近似代替 則其標準誤,16,4. 標準誤的應用,1)表示抽樣誤差大小,描述(n相同)樣本統計量的離散程度,反映用樣本統計量估計或推斷總體參數的可靠性; (2)用于估計總體參數的可信區(qū)間; (3)用于進行樣本均數/頻率的假設檢驗,17,18,二、t 分布的概念,19,20,式中 為自由度(degree of freedom,
4、 df,3實際工作中,由于 未知,用 代替,則 不再服從標準正態(tài)分布,而服從t 分布,21,22,4. t 分布曲線的特征,1)t 分布是一簇曲線。它受自由度的影響,自由度不同曲線形狀不同。 (2)是t 分布曲線的參數: n越小,越小,曲線越平緩 n越大,越大,曲線越陡峭 n,曲線近似于標準正態(tài)分布曲線。 (3)以0為中心,左右對稱呈鐘形。 (4)標準正態(tài)分布是t 分布的特例,23,24,t界值表:詳見附表2,可反映t分布曲線下的面積。 單側概率或單尾概率:用 表示; 雙側概率或雙尾概率:用 表示,25,26,三、總體參數的估計,1.參數估計:用樣本統計量估計總體參數。包括點估計和區(qū)間估計。
5、(1)點估計(Point Estimation):直接用樣本指標作為總體參數的估計; (2)區(qū)間估計(Interval Estimation) :用預先給定的概率(可信度、把握度1-)估計總體參數所在的范圍。此范圍稱為置信區(qū)間(可信區(qū)間):Confidence Interval, CI,27,1點估計(point estimation) 用相應樣本統計量直接作為其總體參數的估計值,S估計,其方法雖簡單,但未考慮抽樣誤差的大小,28,按預先給定的概率(1)所確定的包含未知總體參數的一個范圍。 總體均數的區(qū)間估計:按預先給定的概率(1)所確定的包含未知總體均數的一個范圍。 如給定=0.05,該范圍
6、稱為參數的95%可信區(qū)間或置信區(qū)間; 如給定=0.01,該范圍稱為參數的99%可信區(qū)間或置信區(qū)間,2區(qū)間估計(interval estimation,29,總體均數置信區(qū)間的計算需考慮: (1)總體標準差是否已知, (2)樣本含量n的大小 通常有兩類方法: (1) t分布法 (2)z分布法,總體均數置信區(qū)間的計算,30,總體均數置信區(qū)間的計算,1、t分布法 當總體標準差未知且n50時,總體均數的雙側(1-)置信區(qū)間,總體均數的單側(1-)置信區(qū)間,31,32,33,2、正態(tài)分布近似法 當已知 或 未知,但 n50 時,總體均數的雙側(1-)置信區(qū)間,34,總體均數的單側(1-)置信區(qū)間,35,
7、例3-3 某地抽取正常成年人200名,測得其血清膽固醇的均數為3.64 mmol/L,標準差為1.20mmol/L,估計該地正常成年人血清膽固醇均數的95%置信區(qū)間,36,故該地正常成年人血清膽固醇均數的雙側95%可信區(qū)間為(3.47, 3.81)mmolL,37,參數估計的方法,1)已知,根據正態(tài)分布原理,95%、99%CI,2)未知,n較小,據t分布原理:95%、99%CI,3)未知,n較大,據近似正態(tài)分布原理,38,正態(tài)分布法 樣本含量n足夠大, np與n(1-p)均5時,總體概率的置信區(qū)間計算,39,For example,例6-6 用某種儀器檢查已確診的乳腺癌患者120名,檢出乳腺癌
8、患者94例,檢出率為78.3%。估計該儀器乳腺癌總體檢出率的95%置信區(qū)間。 95%的置信區(qū)間為: 該儀器乳腺癌總體檢出率的95%置信區(qū)間 ( 70.9%,85.7,40,查表法 當樣本含量較?。ㄈ鏽50),np或n(1p)5時,樣本率的分布呈二項分布,總體率的置信區(qū)間可據二項分布的理論求得。 例6-7 某醫(yī)院用某藥治療腦動脈硬化癥22例,其中顯效者10例。問該藥總顯效率的95%置信區(qū)間為多少? 本例n=22, X=10, 查附表6(478頁),得此兩數相交處的數值為2468,即該藥總顯效率的95%置信區(qū)間為(24%,68,41,三)置信區(qū)間的確切涵義,42,1. 95%的置信區(qū)間的理解: (1)所要估計的總體參數有95%的可能在我們所估計的置信區(qū)間內。 (2)從正態(tài)總體中隨機抽取100個樣本,可算得100個樣本均數和標準差,也可算得100個均數的置信區(qū)間,平均約有95個置信區(qū)間包含了總體均數 。 (3)但在實際工作中,只能根據一次試驗結果估計置信區(qū)間,我們就認為該區(qū)間包含了總體均數,43,2.置信區(qū)間的兩個要素 (1)準確度:用可信度(1)表示:即區(qū)間包含總體均數的理論概率大小 。 當然它愈接近1愈好,如99%的置信區(qū)間比95%的置信區(qū)間要好 (2)精確度:即區(qū)間的寬度 區(qū)間愈窄愈好,如95%的置信區(qū)間比99%的置信區(qū)間要好,44,當n
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025知識產權合同范本:網絡游戲軟件授權許可合同
- 2025屆東北三省四城市聯考暨遼寧省沈陽市高三下學期質量監(jiān)測(二)物理試卷答案
- 酒店內部設計合同范本
- 幼兒照護知到課后答案智慧樹章節(jié)測試答案2025年春孝感市工業(yè)學校
- 外貿家具出售合同范本
- 2025共同投資合同
- 2025年建筑行業(yè)《基礎設施建設租賃合同》
- 2025中介租房合同示范文本
- 2024年先進技術成果西安轉化中心招聘真題
- 2024年南充市教育和體育局南充衛(wèi)生職業(yè)學院招聘真題
- 2024全新潔凈室培訓
- 國企內部紀檢監(jiān)督培訓
- 團員發(fā)展紀實簿
- 人教版五年級英語單詞
- 大象版科學三年級下冊全冊練習題(含答案)
- 新《斜視弱視學》期末考試復習題庫(含答案)
- 2015年919公務員聯考《申論》政法干警河北卷及參考答案
- 建筑施工企業(yè)全面預算管理方案
- 深海采礦技術及環(huán)境影響
- 【天潤乳業(yè)公司薪酬管理存在的問題及優(yōu)化建議分析(含問卷)9900字(論文)】
- GB/T 23236-2024數字航空攝影測量空中三角測量規(guī)范
評論
0/150
提交評論