統計學第五章 參數估計(七年制)_第1頁
統計學第五章 參數估計(七年制)_第2頁
統計學第五章 參數估計(七年制)_第3頁
統計學第五章 參數估計(七年制)_第4頁
統計學第五章 參數估計(七年制)_第5頁
已閱讀5頁,還剩22頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第五章

參數估計

統計推斷在醫(yī)學研究中,通常在總體中隨機抽取一定數量觀察單位作為樣本進行抽樣研究,然后由樣本信息推斷總體特征,這個過程稱為統計推斷,包括參數估計和假設檢驗。一、均數的抽樣誤差與標準誤抽樣誤差:由于抽樣所引起的樣本統計量(樣本均數、標準差、樣本率)間以及樣本統計量與總體參數間的差異。均數的抽樣誤差:由于抽樣引起的樣本均數與總體均數間以及樣本均數之間的差異。均數的抽樣誤差總體μ=5,σ=0.5

樣本號紅細胞計數(1012/L,)1234…M5.595.114.265.114.74…5.554.654.655.595.704.46…5.324.564.875.214.534.53…4.234.084.734.844.884.65…5.33…5.164.495.265.024.64…4.565.045.034.714.66…4.900.440.520.330.46…0.29樣本均數的分布

1.可表示抽樣誤差的大小,但μ未知,因而抽樣誤差大小不能直接得到,我們先來研究的分布。2.中心極限定理:(1)從總體中隨機抽取多個樣本例數相等的樣本,計算每個樣本的均數,則的分布也服從正態(tài)。(2)x不服從正態(tài)分布,只要樣本例數n足夠大(n>50),也近似正態(tài)分布。樣本均數的分布

3.的總體均數為μ

,

的總體標準差為標準誤(standarderror,SE)樣本均數的標準差又稱標準誤,它反映了樣本均數之間的離散程度,也反映了樣本均數與總體均數間的差異,說明抽樣誤差的大小。樣本均數標準誤的估計值為:

Foranormaldistributionfollowsastandardnormaldistribution---N(0,1).Whenisunknown,followsatdistribution.t分布

(t-distribution)t

分布(與u分布比較的特點)t分布特點以0為中心左右對稱自由度v越大,t分布越接近于正態(tài),當v→∞時,t分布近似標準正態(tài)分布t界值縱坐標:自由度,υ

橫坐標:概率,P,即曲線下陰影部分的面積;

表中的數字:相應的|t|界值,用tα(v)表示。t

值表規(guī)律:自由度(υ)一定時,p與t

成反比;

概率(p)一定時,υ

與t

成反比;t

界值表

t

值表規(guī)律:(1)自由度(υ)一定時,p與t

成反比(2)概率(p)一定時,υ與t

成反比二、樣本率的抽樣誤差與標準誤1.樣本率(P)與總體率(π)及樣本率之間的差別,稱為率的抽樣誤差。2.率的標準誤:即樣本率的標準差,它描述了樣本率的離散程度。例5-2某地2002年50歲以上的中老年婦女骨質疏松癥的患病率為40%。現利用計算機從該總體中重復隨機抽樣10000次,每次抽取樣本含量為30,每個樣本計算其樣本率。圖5-2(b)為其頻數圖。參數估計的概念參數估計:是指由樣本統計量估計總體參數,是統計推斷的一個重要內容。點估計(pointestimation)

區(qū)間估計(intervalestimation)

1.點估計(pointestimation):用樣本統計量直接作為總體參數的估計值。2.區(qū)間估計(intervalestimation)

是指按預先給定的概率(1-α)估計未知總體均數的可能范圍(confidenceinterval,CI)該范圍通常稱為參數的可信區(qū)間或置信區(qū)間

??尚哦龋褐眯哦?,指預先給定的概率1-α,常取95%、99%。可信限(confidencelimit,CL)可信區(qū)間的涵義:有1-α的可能性認為計算出的可信區(qū)間包含了總體參數。若做100次抽樣算得100個可信區(qū)間,平均有95個可信區(qū)間包含總體參數。總體均數可信區(qū)間的計算

1.σ未知2.σ已知或σ未知但n足夠大

σ已知

σ未知但n足夠大可信區(qū)間的兩個要素

1.準確度:反映在可信度1-α的大小,1-α越大越準確。2.精密度:反映在區(qū)間的長度,區(qū)間長度越小精密度愈高。在樣本含量確定的情況下,二者是矛盾的。需要兼顧二者。在可信度確定的情況下,增加樣本含量,可減少可信區(qū)間長度,提高精密度。可信區(qū)間的含義均數可信區(qū)間與參考值范圍的區(qū)別正常值范圍概念:絕大多數正常人的某指標范圍。(95%,99%,指絕大多數正常人)計算公式:用途:判斷觀察對象的某項指標是否正常.可信區(qū)間概念:包含總體均數的數值范圍(95%,99%指可信度)計算公式:用途:估計總體均數兩總體均數之差的可信區(qū)間總體率的可信區(qū)間正態(tài)近似法:

n>50,且np和n(1-p)都大于5時,樣本率p近似正態(tài)分布,可信區(qū)間

查表法

n≤50,查表小結參數估計是統計推斷的一個重要方面。均數的估計可利用t分布,總體率的估計可用正態(tài)近似法和查表法。習題1.抽樣誤差產生的原因是A.觀察對象不純B.非正態(tài)分布資料C.個體差異D.非分類變量資料E.隨機抽樣方法錯誤2.為了解某地區(qū)9歲女孩血紅蛋白含量的平均水平,某醫(yī)療機構隨機抽取該地9歲女孩200名,獲得其血紅蛋白含量均數為139.2g/L,標準差為2.5g/L,因而估計該地9歲女孩血紅蛋白含量的平均水平為134.3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論