區(qū)間估計和假設檢驗_第1頁
區(qū)間估計和假設檢驗_第2頁
區(qū)間估計和假設檢驗_第3頁
區(qū)間估計和假設檢驗_第4頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、區(qū)間估計和假設檢驗區(qū)間估計和假設檢驗 趙耐青趙耐青復旦大學衛(wèi)生統(tǒng)計教研室復旦大學衛(wèi)生統(tǒng)計教研室2內(nèi)容內(nèi)容假設檢驗假設檢驗2可信區(qū)間與假設檢驗的關(guān)系可信區(qū)間與假設檢驗的關(guān)系3STATA命令命令4區(qū)間估計區(qū)間估計13統(tǒng)計推斷統(tǒng)計推斷 點值估計點值估計 參數(shù)估計參數(shù)估計 區(qū)間估計區(qū)間估計統(tǒng)計推斷統(tǒng)計推斷 假設檢驗:均數(shù)間的比較假設檢驗:均數(shù)間的比較 比例、率的比較比例、率的比較 4點估計和區(qū)間估計點估計和區(qū)間估計v參數(shù)估計可以分為點估計和區(qū)間估計參數(shù)估計可以分為點估計和區(qū)間估計v點估計就是估計某個參數(shù)為某個數(shù)值點估計就是估計某個參數(shù)為某個數(shù)值(如樣如樣本均數(shù),樣本率等本均數(shù),樣本率等)v由于隨機抽樣

2、存在抽樣誤差,由于點估計由于隨機抽樣存在抽樣誤差,由于點估計無法評價抽樣誤差的大小,而區(qū)間估計可無法評價抽樣誤差的大小,而區(qū)間估計可以在以在95%可信度的尺度上估計參數(shù)的范圍,可信度的尺度上估計參數(shù)的范圍,范圍越小,說明參數(shù)估計的抽樣誤差就越范圍越小,說明參數(shù)估計的抽樣誤差就越小。小。5總體均數(shù)的區(qū)間估計總體均數(shù)的區(qū)間估計v 假定資料假定資料 近似服從正態(tài)分布近似服從正態(tài)分布 。v 對于隨機抽樣而言,計算統(tǒng)計量對于隨機抽樣而言,計算統(tǒng)計量v 因此因此v 基于隨機抽樣而言和基于隨機抽樣而言和 成立的概率為成立的概率為0.95前提下前提下v 總體均數(shù)的區(qū)間估計總體均數(shù)的區(qū)間估計 v 這個區(qū)間稱為總

3、體均數(shù)的這個區(qū)間稱為總體均數(shù)的95%可信區(qū)間可信區(qū)間12,nXXX2( ,)N (1)/Xtt nSn分布0.05/2Pr(| |)0.95tt0.05/2Pr(| |)0.95tt0.05/2| | tt0.05/2| | tt總體均數(shù)的區(qū)間估計總體均數(shù)的區(qū)間估計12,nXXX2( ,)N 總體均數(shù)的區(qū)間估計總體均數(shù)的區(qū)間估計12,nXXX(1)/Xtt nSn分布2( ,)N 總體均數(shù)的區(qū)間估計總體均數(shù)的區(qū)間估計12,nXXX0.05/2Pr(| |)0.95tt(1)/Xtt nSn分布2( ,)N 總體均數(shù)的區(qū)間估計總體均數(shù)的區(qū)間估計12,nXXX0.05/2| | tt0.05/2P

4、r(| |)0.95tt(1)/Xtt nSn分布2( ,)N 總體均數(shù)的區(qū)間估計總體均數(shù)的區(qū)間估計12,nXXX0.05/2| | tt0.05/2Pr(| |)0.95tt(1)/Xtt nSn分布2( ,)N 總體均數(shù)的區(qū)間估計總體均數(shù)的區(qū)間估計12,nXXX0.05/20.05/2tStSXXnn0.05/2| | tt0.05/2Pr(| |)0.95tt(1)/Xtt nSn分布2( ,)N 總體均數(shù)的區(qū)間估計總體均數(shù)的區(qū)間估計12,nXXX0.05/20.05/2tStSXXnn0.05/20.05/2tStSXXnn0.05/2| | tt0.05/20.05/2tStSXXn

5、n0.05/2Pr(| |)0.95tt0.05/2| | tt0.05/20.05/2tStSXXnn(1)/Xtt nSn分布0.05/2Pr(| |)0.95tt0.05/2| | tt0.05/20.05/2tStSXXnn12,nXXX(1)/Xtt nSn分布0.05/2Pr(| |)0.95tt0.05/2| | tt0.05/20.05/2tStSXXnn2( ,)N 12,nXXX(1)/Xtt nSn分布0.05/2Pr(| |)0.95tt0.05/2| | tt0.05/20.05/20.05/20.05/2/XtStSttXSnnn 0.05/20.05/2tStSX

6、Xnn6總體均數(shù)的總體均數(shù)的95%可信區(qū)間舉例可信區(qū)間舉例v例如:在某地區(qū)例如:在某地區(qū)7歲男孩的人群中隨機抽樣,抽歲男孩的人群中隨機抽樣,抽取取200人,測量其身高,得到樣本均數(shù)為人,測量其身高,得到樣本均數(shù)為121cm,樣本標準差為,樣本標準差為5.4cm,估計該地區(qū),估計該地區(qū)7歲男孩人群的平均身高在什么范圍內(nèi)歲男孩人群的平均身高在什么范圍內(nèi)。0.05/21.972 5.3121200121 0.753(120.247,121.753)tSXncm7(1- ) 100%可信區(qū)間及其意義可信區(qū)間及其意義v更一般而言,可以計算(更一般而言,可以計算(1- ) 100%可信區(qū)間,稱可信區(qū)間,稱

7、(1- )為可信度。)為可信度。v可信度的意義:在同一正態(tài)總體中隨機抽可信度的意義:在同一正態(tài)總體中隨機抽100個樣本,每個樣本可以計算一個個樣本,每個樣本可以計算一個95%可信區(qū)間,平均有可信區(qū)間,平均有95個可信區(qū)間包含該總個可信區(qū)間包含該總體的總體均數(shù)。體的總體均數(shù)。/ 2,1ntSXn8(1- ) 100%可信區(qū)間及其意義可信區(qū)間及其意義v可信度可信度1- 越大,計算可信區(qū)間包含總體均數(shù)的越大,計算可信區(qū)間包含總體均數(shù)的正確率就越高,但可信區(qū)間的寬度就越大,也就正確率就越高,但可信區(qū)間的寬度就越大,也就是估計總體均數(shù)的精度就越差。是估計總體均數(shù)的精度就越差。v一般而言,一般而言,95%

8、可信區(qū)間是兼顧了正確性和估可信區(qū)間是兼顧了正確性和估計精度,對于特殊情況,可以計算計精度,對于特殊情況,可以計算90%可信區(qū)可信區(qū)間或間或99%可信區(qū)間??尚艆^(qū)間。v對于隨機抽樣前而言,隨機抽取一個樣本量為對于隨機抽樣前而言,隨機抽取一個樣本量為n的樣本,計算的樣本,計算95%可信區(qū)間,則該區(qū)間將包含可信區(qū)間,則該區(qū)間將包含總體均數(shù)的概率為總體均數(shù)的概率為95%,不包含其總體均數(shù)的,不包含其總體均數(shù)的概率為概率為0.05,這是一個小概率事件,對于一次隨,這是一個小概率事件,對于一次隨機抽樣而言,一般是不會發(fā)生的,所以機抽樣而言,一般是不會發(fā)生的,所以95%可可信區(qū)間一般被認為就是總體均數(shù)的范圍

9、。信區(qū)間一般被認為就是總體均數(shù)的范圍。9假設檢驗假設檢驗(hypothesis testing)v樣本均數(shù)與總體均數(shù)不等或兩樣本均數(shù)不等,有樣本均數(shù)與總體均數(shù)不等或兩樣本均數(shù)不等,有兩種可能:兩種可能: 由抽樣誤差所致由抽樣誤差所致 兩者來自不同的總體兩者來自不同的總體 假設檢驗假設檢驗是用來判斷樣本與樣本,樣本與總體的差異是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計推斷方法是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計推斷方法10總體總體隨機抽樣隨機抽樣不是抽樣誤差?不是抽樣誤差?即:即:0?X樣本樣本總體總體0 = 0?即:抽樣誤差?即:抽樣誤差?假設檢驗問題假設檢

10、驗問題總體總體總體總體X總體總體總體總體0X總體總體不是抽樣誤差?不是抽樣誤差?即:即:0?總體總體0X總體總體 = 0?即:抽樣誤差?即:抽樣誤差?不是抽樣誤差?不是抽樣誤差?即:即:0?總體總體0X總體總體11總體總體2 2樣本樣本2隨隨機機抽抽樣樣樣本均數(shù)不等的原因樣本均數(shù)不等的原因統(tǒng)計推斷統(tǒng)計推斷抽樣誤差抽樣誤差即:即: 1= 2 ?樣本樣本1假設檢驗問題假設檢驗問題總體總體1 121XX 不是抽樣誤差不是抽樣誤差即:即: 12 ?12假設檢驗一般思想v小概率思想是指小概率事件(小概率思想是指小概率事件(P0.01P0.01或或P0.05P0=72為真,在大多數(shù)情況下, 應該遠離72,

11、 應該比較大。注意:X的總體均數(shù)不一定為72,只有H0為真時,X的總體均數(shù)為72,726/25XtXX726/25Xt72X 即:才是抽樣誤差72X 即:不一定是抽樣誤差72X 即:才是抽樣誤差72X 即:不一定是抽樣誤差726/25Xt72X 即:才是抽樣誤差72X 即:不一定是抽樣誤差X726/25Xt72X 即:才是抽樣誤差72X 即:不一定是抽樣誤差726/25XtX726/25Xt72X 即:才是抽樣誤差72X 即:不一定是抽樣誤差X726/25XtX726/25Xt72X 即:才是抽樣誤差72X 即:不一定是抽樣誤差26樣本均數(shù)與總體均數(shù)比較樣本均數(shù)與總體均數(shù)比較可以證明:當0為真

12、時,檢驗統(tǒng)計量服從自由度為24的t分布(即:df=24),查t分布表,臨界值t0.025=2.064,檢驗統(tǒng)計量t=3.52.064是小概率事件,對于一次隨機抽樣而言,一般是不會發(fā)生的,因此拒絕0,并且可以認為該山區(qū)成年男性的脈搏均數(shù)高于一般成年男性。27定義值和應用定義值和應用v 以下以單側(cè)檢驗為例:v 即:在0為真的情況下,檢驗統(tǒng)計量大于樣本計算的統(tǒng)計量數(shù)值的概率。也就是值=樣本統(tǒng)計量數(shù)值開始的尾部面積(示意見圖)。v 意義:如果t檢驗統(tǒng)計量樣本值t=t0.05,則P=t0.05尾部的面積,故=0.05。值值=P(檢驗統(tǒng)計量檢驗統(tǒng)計量檢驗統(tǒng)計量樣本值檢驗統(tǒng)計量樣本值0)28定義值和應用定義

13、值和應用v 如果檢驗統(tǒng)計量樣本值tt0.05(u值比U0.05更右側(cè)),則P=t尾部的面積t0.05尾部的面積,則P0.05。v 如果檢驗統(tǒng)計量樣本值tt0.05尾部的面積,則P0.05。綜合上述,綜合上述,P 檢驗統(tǒng)計量值檢驗統(tǒng)計量值臨界值臨界值,不拒絕不拒絕H0 。 P臨界值,拒絕臨界值,拒絕H0。29值示意圖值示意圖在實際研究中,只需計算值并判斷是否在實際研究中,只需計算值并判斷是否P 決定是否拒絕決定是否拒絕0。30假設檢驗的基本步驟假設檢驗的基本步驟 若若P值小于預先設定的檢驗水準值小于預先設定的檢驗水準 ,則,則H0成立的可能性成立的可能性小,即拒絕小,即拒絕H0。 若若P值不小于

14、預先設定的檢驗水準值不小于預先設定的檢驗水準 ,則,則H0成立的可能成立的可能性還不小,還不能拒絕性還不小,還不能拒絕H0。 P值的大小一般可通過查閱相應的界值表得到。值的大小一般可通過查閱相應的界值表得到。31定義值和應用定義值和應用v 確定概率,作出判斷確定概率,作出判斷 以自由度v=n-1查t界值表,0.025P 1 v =0.05v 計算計算t檢驗統(tǒng)計量檢驗統(tǒng)計量v 查查t檢驗的單側(cè)界值檢驗的單側(cè)界值 ,如果檢驗統(tǒng)計量,如果檢驗統(tǒng)計量v 則拒絕則拒絕H0,反之不能拒絕,反之不能拒絕H0。v 單側(cè)的單側(cè)的P值值=t分布中大于分布中大于t的右側(cè)尾部面積的右側(cè)尾部面積nSXt/00.05,1

15、nt0.05tt33兩類錯誤兩類錯誤 H0是真的 H1是真的 拒絕H0的概率 (稱為I類錯誤) 1 接受H0的概率 1 (稱為II類錯誤) 34兩類錯誤示意圖兩類錯誤示意圖35檢驗效能檢驗效能H1是真的,實際拒絕是真的,實際拒絕H0的概率的概率= 1- 稱為稱為Power,又稱為檢驗效能又稱為檢驗效能36進行假設檢驗應注意的問題進行假設檢驗應注意的問題v做假設檢驗之前,應注意資料本身是否有可比性。v當差別有統(tǒng)計學意義時應注意這樣的差別在實際應用中有無意義。v根據(jù)資料類型和特點選用正確的假設檢驗方法。v根據(jù)專業(yè)及經(jīng)驗確定是選用單側(cè)檢驗還是雙側(cè)檢驗。37進行假設檢驗應注意的問題進行假設檢驗應注意的

16、問題v當檢驗結(jié)果為拒絕無效假設時,應注意有發(fā)生I類錯誤的可能性,即錯誤地拒絕了本身成立的H0,發(fā)生這種錯誤的概率預先是知道的,即檢驗水準那么大;v當檢驗結(jié)果為不拒絕無效假設時,應注意有發(fā)生II類錯誤的可能性,即仍有可能錯誤地接受了本身就不成立的H0,發(fā)生這種錯誤的可能性預先是不知道的,但與樣本含量和I類錯誤的大小有關(guān)系。v當?shù)谝活愬e誤增大時,第二類錯誤減小。38進行假設檢驗應注意的問題進行假設檢驗應注意的問題v判斷結(jié)論時不能絕對化,應注意無論接受或拒絕檢驗假設,都有判斷錯誤的可能性。v報告結(jié)論時是應注意說明所用的統(tǒng)計量,檢驗的單雙側(cè)及P值的確切范圍。39進行假設檢驗應注意的問題進行假設檢驗應注意的問題vt檢驗和u檢驗就是統(tǒng)計量為t,u的假設檢驗,兩者均是常見的假設檢驗方法。 當樣本含量n較大時,樣本均數(shù)符合正態(tài)分布,故可用u檢驗進行分析。 當樣本含量n小時,若觀察值x符合正態(tài)分布,則用t檢驗(因此時樣本均數(shù)符合t分布) 當x為未知分布時應采用秩和檢驗。40可信區(qū)間與假設檢驗的關(guān)系可信區(qū)間與假設檢驗的關(guān)系v不同:不同: 可信區(qū)間可信區(qū)間量的問題量的問題 假設檢驗假設檢驗質(zhì)的問題質(zhì)的問題可信區(qū)間亦可用于回答假設檢驗的問題可信區(qū)間亦可用于回答假設檢驗的問題可信區(qū)間比假設

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論