假設檢驗基礎_第1頁
假設檢驗基礎_第2頁
假設檢驗基礎_第3頁
假設檢驗基礎_第4頁
假設檢驗基礎_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、假設檢驗基礎第1頁,共36頁,2022年,5月20日,1點44分,星期一2假設檢驗(hypothesis test) 在數(shù)理統(tǒng)計上亦稱顯著性檢驗是對所估計的總體首先提出一個假設,然后通過樣本數(shù)據(jù)去推斷是否拒絕這一假設科研數(shù)據(jù)處理的重要工具;某事發(fā)生了: 是由于碰巧?還是由于必然的原因?統(tǒng)計學家運用顯著性檢驗來處理這類問題舉例:上課遲到,買雞蛋第2頁,共36頁,2022年,5月20日,1點44分,星期一3假設檢驗的原因 由于個體差異的存在,即使從同一總體中嚴格的隨機抽樣,X1、X2、X3、X4、,不同。 因此,X1、X2 不同有兩種(而且只有兩種)可能:(1)分別所代表的總體均數(shù)相同,由于抽樣誤

2、差造成了樣本均數(shù)的差別。差別無統(tǒng)計學意義 。(2)分別所代表的總體均數(shù)不同。差別有統(tǒng)計學意義。第3頁,共36頁,2022年,5月20日,1點44分,星期一4 假設檢驗的基本原理已知健康成年男子的脈搏均數(shù)為72次/分。某醫(yī)生在某山區(qū)隨機調查25名健康男子,求得脈搏均數(shù)為74.2次/分,標準差6.5次/分。能否認為該山區(qū)的成年男子的脈搏均數(shù)高于一般成年男子的脈搏均數(shù)?樣本均數(shù)和總體均數(shù)的差異有兩種可能:抽樣誤差所致,有本質差異n=25第4頁,共36頁,2022年,5月20日,1點44分,星期一5利用反證法思想,假設是由于第一個原因,計算產生 的概率(P)。若P較小,是小于或等于小概率事件的概率,即

3、在一次抽樣中一般不能發(fā)生,現(xiàn)在發(fā)生了,則有理由拒絕原假設 ,接受與之對立的假設。若P不是很小,暫時接受原假設。 第5頁,共36頁,2022年,5月20日,1點44分,星期一6假設檢驗的一般步驟建立假設、確定檢驗水準1兩種假設:(1)檢驗假設:又稱無效假設、零假設、原假設,是從反證法思想提出的。(2)備擇假設:拒絕H0時而被接受的假設,與H0對立。有三種情況: 雙側檢驗 單側檢驗 單側檢驗2單、雙側的選擇:由專業(yè)知識來確定。3檢驗水準:,又稱顯著性水準,是小概率事件的概率。通常取0.05。第6頁,共36頁,2022年,5月20日,1點44分,星期一7選定檢驗方法,計算檢驗統(tǒng)計量根據(jù)資料類型和推斷

4、目的選用不同的檢驗方法。不同的檢驗方法有相應不同的檢驗統(tǒng)計量及計算公式。所有檢驗統(tǒng)計量都是在H0 成立的條件下計算出來的,反映了抽樣誤差的大小,并且服從已知的分布。 例: 成立條件下 , 則 用s代替,檢驗統(tǒng)計量為 第7頁,共36頁,2022年,5月20日,1點44分,星期一8-2.0641.692 2.0640 =240.0250.025t0.05,24=2.064 P =P ( |t| 2.064 )=0.05 P=P(|t|1.692)0.05第8頁,共36頁,2022年,5月20日,1點44分,星期一9確定P值,作出推斷結論1P的含義:從規(guī)定的總體隨機抽得等于及大于(或等于及小于)現(xiàn)有

5、樣本獲得的檢驗統(tǒng)計量值的概率。根據(jù)檢驗統(tǒng)計量值,查相應的界值表,確定P值。2得出結論:若 ,按檢驗水準拒絕H0 ,接受H1 ,有統(tǒng)計學意義;若 ,按檢驗水準不拒絕,無統(tǒng)計學意義。第9頁,共36頁,2022年,5月20日,1點44分,星期一10假設檢驗特點1.類似于數(shù)學中的反證法 先建立假設(假設上課不遲到,雞蛋是新鮮的),然后通過計算證明,得出小概率事件發(fā)生,則該假設不成立。2.數(shù)學推斷是確定性的,而統(tǒng)計學推斷是以概率給出的,因此結論是相對的,得到任何結論都存在發(fā)生錯誤的可能。第10頁,共36頁,2022年,5月20日,1點44分,星期一11u ( Z )檢驗均數(shù)的 u 檢驗 應用條件:樣本含

6、量n較大,或總體標準差已知 1.單樣本u檢驗2.兩大樣本的u檢驗 第11頁,共36頁,2022年,5月20日,1點44分,星期一12例題71根據(jù)1983年大量調查結果,已知某地成年男子的脈搏均數(shù)為72次/分,某醫(yī)生2003年在該地隨機調查了75名成年男子,求其脈搏均數(shù)為74.2次/分,標準差為6.5次/分,能否據(jù)此認為該地成年男子的脈搏不同于1983年?第12頁,共36頁,2022年,5月20日,1點44分,星期一13第13頁,共36頁,2022年,5月20日,1點44分,星期一14例題72為研究孕婦補鋅對胎兒生長發(fā)育的影響,將96名孕婦隨機分為試驗組和對照組,一組在孕期不同時間按要求補鋅,另

7、一組為對照,觀察兩組孕婦所生新生兒體重有無不同,兩組的例數(shù)、均數(shù)、標準差分別為:第14頁,共36頁,2022年,5月20日,1點44分,星期一15第15頁,共36頁,2022年,5月20日,1點44分,星期一16率的u檢驗應用條件:當n較大,p和1-p均不太小時,即np及n(1-p)均大于5時 1.樣本率與總體率的比較2.兩樣本率的比較第16頁,共36頁,2022年,5月20日,1點44分,星期一17例題7-3全國調查結果顯示,學齡前兒童營養(yǎng)性貧血患病率為23.5%,某醫(yī)院為了解當?shù)貙W齡前兒童營養(yǎng)性貧血患病情況,對當?shù)?396例學齡前兒童進行了抽樣調查,查出營養(yǎng)性貧血患兒363例,患病率26.

8、0%。問該地學齡前兒童營養(yǎng)性貧血患病率是否不同于全國平均水平?第17頁,共36頁,2022年,5月20日,1點44分,星期一18第18頁,共36頁,2022年,5月20日,1點44分,星期一19例題7-4為了解某地在校男大學生肥胖與超重的情況,用隨機的方法分別調查了該地一所文科大學和一所工科大學的部分在校男生,其中文科大學調查了765人,檢出超重53人,超重率為6.9%,工科大學調查了882人,檢出超重22人,超重率為2.5%,試比較兩所大學男生的超重檢出率有無差別。第19頁,共36頁,2022年,5月20日,1點44分,星期一20第20頁,共36頁,2022年,5月20日,1點44分,星期一

9、21假設檢驗兩類錯誤 棄真錯誤,即類錯誤(),和存?zhèn)五e誤,即類錯誤( ) 大,則小,反之小大第21頁,共36頁,2022年,5月20日,1點44分,星期一22第22頁,共36頁,2022年,5月20日,1點44分,星期一23假設檢驗中需注意的幾個問題1.建立假設 “假設”是對總體特征的表述 H0與H1的表述隨資料性質、分析目的和檢驗方法而定。第23頁,共36頁,2022年,5月20日,1點44分,星期一24 2.不同變量或資料應選用不同的檢驗 3.資料的代表性與可比性 所謂代表性是指該樣本從相應總體中經隨機抽樣獲得,能夠代表總體的特征;所謂可比性是指各對比組間除了要比較的主要因素外,其它影響結

10、果的因素應盡可能相同或相近 為了保證資料的可比性,必須要有嚴密的實驗設計,保證樣本隨機抽取于同質總體,這是假設檢驗得以正確應用的前提 第24頁,共36頁,2022年,5月20日,1點44分,星期一254.結論不能絕對化 報告結果應說明P 值。 5.統(tǒng)計結論必須與專業(yè)結論有機的結合 在做專業(yè)結論時,應在綜合考慮兩均數(shù)大小的實際意義、P值大小和設計科學性的基礎上進行統(tǒng)計結論的專業(yè)解釋。第25頁,共36頁,2022年,5月20日,1點44分,星期一266.檢驗水準的確定 犯型錯誤后果嚴重時,要減小。 如一種新藥治療高血壓,該藥物副作用小,成本低。經檢驗若拒絕 ,則該藥有效,可推廣使用,這時為減小犯型

11、錯誤的概率,降低 。 如新檢測方法與舊方法比較,不拒絕 ,可用新檢測方法代替舊方法,這時應慎重,減少犯型錯誤的概率,提高 。第26頁,共36頁,2022年,5月20日,1點44分,星期一277.單雙側的選擇:結合專業(yè)知識確定。 應該用雙側,用了單側,易拒絕,易得出有差別的結論;應該用單側,用了雙側,降低了檢驗效能。 第27頁,共36頁,2022年,5月20日,1點44分,星期一28-2.0642.0640 =240.0250.025第28頁,共36頁,2022年,5月20日,1點44分,星期一29假設檢驗的統(tǒng)計意義 1. P值的正確理解 2. 檢驗結果的正確理解 . 統(tǒng)計結論的表述 . 假設檢

12、驗與可信區(qū)間的區(qū)別與聯(lián)系 第29頁,共36頁,2022年,5月20日,1點44分,星期一30假設檢驗的實際意義 P說明如果總體均數(shù)相等,得到本次實驗(觀察結果(如兩樣本均數(shù)的差值)不大可能出現(xiàn),因而拒絕此H0,并不是說發(fā)現(xiàn)的差異一定有實際意義。從本章u檢驗的所有計算公式中可以看出,假設檢驗的結論與樣本大小有關。當樣本量足夠大時,標準誤趨于,無論兩樣本均數(shù)或兩樣本率相差多少,都能得足以拒絕H0的u值和P值。 反之,當樣本很小時,即使樣本均數(shù)差別較大也會得出較小的檢驗統(tǒng)計量值和較大的P值而作出差別無統(tǒng)計意義的結論。因此,P值大小只能說明統(tǒng)計學意義的“顯著”,不一定有實際意義。 第30頁,共36頁,

13、2022年,5月20日,1點44分,星期一31影響檢驗效能的4個因素 檢驗效能用概率1-表示,其中為假設檢驗不拒絕H0時犯類錯誤的概率。檢驗效能的意義是,當兩總體確有差別,按檢驗水準假設檢驗能發(fā)現(xiàn)其差別(拒絕H0)的能力。 .總體參數(shù)的差異越大,檢驗效能越大。 .個體差異(標準差)越小,檢驗效能越大。 3. 樣本量越大,檢驗效能越大。 .檢驗水準(類錯誤的概率)定得越寬,檢驗效能越大。 第31頁,共36頁,2022年,5月20日,1點44分,星期一32多次重復檢驗問題 多個觀察指標的多次重復檢驗問題 一個觀察指標多次測量的重復檢驗問題 第32頁,共36頁,2022年,5月20日,1點44分,星

14、期一33小結1.假設檢驗的過程是:建立假設;選擇檢驗方法,計算檢驗統(tǒng)計量;確定P值,得出結論。2.假設檢驗的基本思想是:小概率事件在一次抽樣中不太可能出現(xiàn)。3.假設檢驗方法很多,每種方法均有相應的適用條件。綜合考慮研究目的、設計類型、變量類型、樣本含量等要素,才能選擇合適的檢驗方法。第33頁,共36頁,2022年,5月20日,1點44分,星期一34u檢驗資料檢驗假設應用條件計算公式大樣本均數(shù)和總體均數(shù)比較n30兩獨立大樣本均數(shù)比較n1與n2均大于30樣本率與總體率的比較np及n(1-p)均大于5兩獨立樣本率比較兩組np及n(1-p)均大于5第34頁,共36頁,2022年,5月20日,1點44分,星期一35習題1.兩個樣本均數(shù)比較,經t檢驗,差別有統(tǒng)計學意義時,P值越小,說明( ) A.兩樣本差別越大 B.兩總體均數(shù)差別越大C.越有理由認為兩總體均數(shù)不同 D.越有理由認為兩樣本均數(shù)不同 E.拒絕H1犯錯誤的概率越小2.兩樣本均數(shù)比較時,以下檢驗水準中第二類錯誤最小的是(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論