教育與心理統(tǒng)計-第-九-章-假設(shè)檢驗課件_第1頁
教育與心理統(tǒng)計-第-九-章-假設(shè)檢驗課件_第2頁
教育與心理統(tǒng)計-第-九-章-假設(shè)檢驗課件_第3頁
教育與心理統(tǒng)計-第-九-章-假設(shè)檢驗課件_第4頁
教育與心理統(tǒng)計-第-九-章-假設(shè)檢驗課件_第5頁
已閱讀5頁,還剩94頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、現(xiàn)代心理與教育統(tǒng)計學(xué) PowerPoint統(tǒng)計學(xué)南昌大學(xué)教育學(xué)院心理 李力第 九 章 假設(shè)檢驗 假設(shè)檢驗的基本問題 一個總體參數(shù)的檢驗 兩個總體參數(shù)的檢驗假設(shè)檢驗在統(tǒng)計方法中的地位統(tǒng)計方法描述統(tǒng)計推斷統(tǒng)計參數(shù)估計假設(shè)檢驗學(xué)習(xí)目標假設(shè)檢驗的基本思想和原理 假設(shè)檢驗的步驟一個總體參數(shù)的檢驗兩個總體參數(shù)的檢驗P值的計算與應(yīng)用 假設(shè)檢驗的基本問題 假設(shè)的陳述 兩類錯誤與顯著性水平 統(tǒng)計量與拒絕域 利用P值進行決策什么是假設(shè)檢驗? (hypothesis test)先對總體的參數(shù)(或分布形式)提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成立的過程有參數(shù)檢驗和非參數(shù)檢驗邏輯上運用反證法,統(tǒng)計上依據(jù)小概率原理

2、假設(shè)檢驗的基本思想. 因此我們拒絕假設(shè) = 50. 如果這是總體的真實均值樣本均值m = 50抽樣分布H0這個值不像我們應(yīng)該得到的樣本均值 .20原假設(shè)與備擇假設(shè)原假設(shè)(null hypothesis)研究者想收集證據(jù)予以反對的假設(shè)又稱“0假設(shè)”總是有符號 , 或4.表示為 H0H0 : = 某一數(shù)值 指定為符號 =, 或 例如, H0 : 10cm研究者想收集證據(jù)予以支持的假設(shè)也稱“研究假設(shè)”總是有符號 , 或 表示為 H1H1 : 某一數(shù)值,或 某一數(shù)值例如, H1 : 10cm,或 10cm備擇假設(shè)(alternative hypothesis)【例】某品牌洗滌劑在它的產(chǎn)品說明書中聲稱:

3、平均凈含量不少于500克。從消費者的利益出發(fā),有關(guān)研究人員要通過抽檢其中的一批產(chǎn)品來驗證該產(chǎn)品制造商的說明是否屬實。試陳述用于檢驗的原假設(shè)與備擇假設(shè)提出假設(shè)解:研究者抽檢的意圖是傾向于證實這種洗滌劑的平均凈含量并不符合說明書中的陳述 。建立的原假設(shè)和備擇假設(shè)為 H0 : 500 H1 : ”或“”的假設(shè)檢驗,稱為單側(cè)檢驗或單尾檢驗(one-tailed test)備擇假設(shè)的方向為“”,稱為右側(cè)檢驗 雙側(cè)檢驗與單側(cè)檢驗雙側(cè)檢驗與單側(cè)檢驗 (假設(shè)的形式)假設(shè)雙側(cè)檢驗單側(cè)檢驗左側(cè)檢驗右側(cè)檢驗原假設(shè)H0 : m = m0H0 : m m0H0 : m m0備擇假設(shè)H1 : m m0H1 : m m0兩

4、類錯誤與顯著性水平H0: 無罪假設(shè)檢驗中的兩類錯誤(決策結(jié)果)陪審團審判裁決實際情況無罪有罪無罪正確錯誤有罪錯誤正確H0 檢驗決策實際情況H0為真H0為假未拒絕H0正確決策(1 a)第類錯誤(b )拒絕H0第類錯誤(a )正確決策(1-b )假設(shè)檢驗就好像一場審判過程統(tǒng)計檢驗過程 錯誤和 錯誤的關(guān)系你不能同時減少兩類錯誤!和 的關(guān)系就像翹翹板,小 就大, 大 就小顯著性水平 (significant level)1.是一個概率值2.原假設(shè)為真時,拒絕原假設(shè)的概率被稱為抽樣分布的拒絕域3.表示為 (alpha)常用的 值有0.01, 0.05, 0.104.由研究者事先確定思考題:繪圖解釋說明在

5、樣本容量和顯著水平都不變的條件下,單側(cè)檢驗犯 錯誤的概率比雙側(cè)檢驗要小。統(tǒng)計量與拒絕域根據(jù)樣本觀測結(jié)果計算得到的,并據(jù)以對原假設(shè)和備擇假設(shè)作出決策的某個樣本統(tǒng)計量對樣本估計量的標準化結(jié)果原假設(shè)H0為真點估計量的抽樣分布 檢驗統(tǒng)計量(test statistic) 標準化的檢驗統(tǒng)計量 顯著性水平和拒絕域(雙側(cè)檢驗 )抽樣分布0臨界值臨界值a/2 a/2 樣本統(tǒng)計量拒絕H0拒絕H01 - 置信水平顯著性水平和拒絕域(雙側(cè)檢驗 )0臨界值臨界值a /2 a /2 樣本統(tǒng)計量拒絕H0拒絕H0抽樣分布1 - 置信水平顯著性水平和拒絕域(雙側(cè)檢驗 )0臨界值臨界值 a /2 a /2 樣本統(tǒng)計量拒絕H0拒

6、絕H0抽樣分布1 - 置信水平顯著性水平和拒絕域(雙側(cè)檢驗 )0臨界值臨界值a /2 a /2 樣本統(tǒng)計量拒絕H0拒絕H0抽樣分布1 - 置信水平顯著性水平和拒絕域(單側(cè)檢驗 )0臨界值a樣本統(tǒng)計量拒絕H0抽樣分布1 - 置信水平顯著性水平和拒絕域(左側(cè)檢驗 )0臨界值a樣本統(tǒng)計量拒絕H0抽樣分布1 - 置信水平觀察到的樣本統(tǒng)計量顯著性水平和拒絕域(右側(cè)檢驗 )0臨界值a樣本統(tǒng)計量拒絕H0抽樣分布1 - 置信水平觀察到的樣本統(tǒng)計量決策規(guī)則給定顯著性水平,查表得出相應(yīng)的臨界值z或z/2, t或t/2將檢驗統(tǒng)計量的值與 水平的臨界值進行比較作出決策雙側(cè)檢驗:統(tǒng)計量 臨界值,拒絕H0左側(cè)檢驗:統(tǒng)計量

7、 臨界值,拒絕H0利用 P 值 進行決策什么是P 值?(P-value)在原假設(shè)為真的條件下,檢驗統(tǒng)計量的觀察值大于或等于其計算值的概率雙側(cè)檢驗為分布中兩側(cè)面積的總和反映實際觀測到的數(shù)據(jù)與原假設(shè)H0之間不一致的程度被稱為觀察到的(或?qū)崪y的)顯著性水平?jīng)Q策規(guī)則:若p值, 拒絕 H0雙側(cè)檢驗的P 值 / 2 / 2 Z拒絕H0拒絕H00臨界值計算出的樣本統(tǒng)計量計算出的樣本統(tǒng)計量臨界值1/2 P 值1/2 P 值左側(cè)檢驗的P 值0臨界值a樣本統(tǒng)計量拒絕H0抽樣分布1 - 置信水平計算出的樣本統(tǒng)計量P 值右側(cè)檢驗的P 值0臨界值a拒絕H0抽樣分布1 - 置信水平計算出的樣本統(tǒng)計量P 值假設(shè)檢驗步驟建立

8、原假設(shè)和備擇假設(shè)從所研究的總體中抽出一個隨機樣本確定一個適當?shù)臋z驗統(tǒng)計量,并利用樣本數(shù)據(jù)算出其具體數(shù)值確定一個適當?shù)娘@著性水平,并計算出其臨界值,指定拒絕域?qū)⒔y(tǒng)計量的值與臨界值進行比較,作出決策統(tǒng)計量的值落在拒絕域,拒絕H0,否則不拒絕H0也可以直接利用P值作出決策 (單雙)總體均值的檢驗 (單雙)總體比例的檢驗 (單雙)總體方差的檢驗 (單雙)總體相關(guān)系數(shù)的檢驗 一個總體參數(shù)的檢驗z 檢驗(單尾和雙尾) t 檢驗(單尾和雙尾)z 檢驗(單尾和雙尾) 2 檢驗(單尾和雙尾)均值一個總體比例方差兩個總體參數(shù)的檢驗兩個總體參數(shù)的檢驗z 檢驗(大樣本)t 檢驗(小樣本)t 檢驗(小樣本)z 檢驗F

9、檢驗獨立樣本配對樣本均值比例方差總體均值的檢驗總體均值的檢驗(作出判斷) 是否已知小樣本容量n大 是否已知否 t 檢驗否z 檢驗是z 檢驗 是z 檢驗總體均值的檢驗(大樣本)總體均值的檢驗 (大樣本)1.假定條件正態(tài)總體或非正態(tài)總體大樣本(n30)使用z檢驗統(tǒng)計量 2 已知: 2 未知:【例】 P234 8-2,8-3總體均值的檢驗( 2 已知)【例】一種罐裝飲料采用自動生產(chǎn)線生產(chǎn),每罐的容量是255ml,標準差為5ml。為檢驗每罐容量是否符合要求,質(zhì)檢人員在某天生產(chǎn)的飲料中隨機抽取了40罐進行檢驗,測得每罐平均容量為255.8ml。取顯著性水平=0.05 ,檢驗該天生產(chǎn)的飲料容量是否符合標準

10、要求?雙側(cè)檢驗綠色健康飲品綠色健康飲品255255總體均值的檢驗( 2 已知)H0 :0 = 1 =255H1 : 0 1 = 0.05n = 40臨界值:Z /2=1.96檢驗統(tǒng)計量:z01.96-1.960.025拒絕 H0拒絕 H00.025決策:結(jié)論: |Z|=1.011.96,即接受原假設(shè)H0樣本提供的證據(jù)表明:該天生產(chǎn)的飲料符合標準要求 總體均值的檢驗( 2 未知)【例】一種機床加工的零件尺寸絕對平均誤差允許值為1.35mm。生產(chǎn)廠家現(xiàn)采用一種新的機床進行加工以期進一步降低誤差。為檢驗新機床加工的零件平均誤差與舊機床相比是否有顯著降低,從某天生產(chǎn)的零件中隨機抽取50個進行檢驗。利用

11、這些樣本數(shù)據(jù),檢驗新機床加工的零件尺寸的平均誤差與舊機床相比是否有顯著降低? (=0.01) 左側(cè)檢驗50個零件尺寸的誤差數(shù)據(jù) (mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86總體均值的檢驗( 2 未知)H0 : 1 0=1.35H1 :

12、1 2.33,即拒絕原假設(shè)H0新機床加工的零件尺寸的平均誤差與舊機床相比有顯著降低決策:結(jié)論:-2.33z0拒絕H00.01總體均值的檢驗(z檢驗) (P 值的圖示)0-2.33a =0.01z拒絕H0抽樣分布1 - 計算出的樣本統(tǒng)計量=-2.6061P 值P=0.004579 總體均值的檢驗( 2 未知)【例】某一小麥品種的平均產(chǎn)量為5200kg/hm2 。一家研究機構(gòu)對小麥品種進行了改良以期提高產(chǎn)量。為檢驗改良后的新品種產(chǎn)量是否有顯著提高,隨機抽取了36個地塊進行試種,得到的樣本平均產(chǎn)量為5275kg/hm2,標準差為120/hm2 。試檢驗改良后的新品種產(chǎn)量是否有顯著提高? (=0.05

13、) 右側(cè)檢驗總體均值的檢驗( 2 未知)H0 : 5200H1 : 5200 = 0.05n = 36臨界值: Z =1.645檢驗統(tǒng)計量: |Z|=3.751.645,即拒絕原假設(shè)H0 (P = 0.000088 = 0.05)改良后的新品種產(chǎn)量有顯著提高 決策:結(jié)論:z0拒絕H00.051.645總體均值的檢驗(z檢驗) (P 值的圖示)抽樣分布P = 0.000088 01.645a =0.05拒絕H01 - 計算出的樣本統(tǒng)計量=3.75P 值總體均值的檢驗 (大樣本檢驗方法的總結(jié))假設(shè)雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗假設(shè)形式H0 : m =m0H1 : m m0H0 : m m0H1 : m

14、m0統(tǒng)計量 已知: 未知:拒絕域P值決策拒絕H0總體均值的檢驗(小樣本)總體均值的檢驗 (小樣本)1.假定條件總體服從正態(tài)分布小樣本(n 30)檢驗統(tǒng)計量 2 已知: 2 未知:總體均值的檢驗【例】一種汽車配件的平均長度要求為12cm,高于或低于該標準均被認為是不合格的。汽車生產(chǎn)企業(yè)在購進配件時,通常是經(jīng)過招標,然后對中標的配件提供商提供的樣品進行檢驗,以決定是否購進?,F(xiàn)對一個配件提供商提供的10個樣本進行了檢驗。假定該供貨商生產(chǎn)的配件長度服從正態(tài)分布,在0.05的顯著性水平下,檢驗該供貨商提供的配件是否符合要求? 10個零件尺寸的長度 (cm)12.210.812.011.811.912.4

15、11.312.212.012.3總體均值的檢驗H0 : = 12H1 : 12 = 0.05df = 10 - 1 = 9臨界值:t /2=2.262檢驗統(tǒng)計量: |t|=0.70352.262即接受原假設(shè)H0該供貨商提供的零件符合要求 決策:結(jié)論:t02.262-2.2620.025拒絕 H0拒絕 H00.025總體均值的檢驗 (小樣本檢驗方法的總結(jié))假設(shè)雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗假設(shè)形式H0 : m =m0H1 : m m0H0 : m m0H1 : m m0統(tǒng)計量 已知: 未知:拒絕域P值決策拒絕H0注: 已知的拒絕域同大樣本兩個總體均值之差的檢驗兩個總體均值之差的檢驗 ( 12, 22

16、已知)假定條件兩個獨立的樣本兩個總體都是正態(tài)分布 12, 22已知檢驗統(tǒng)計量例:P239 8-6兩個總體均值之差的檢驗 (12,22 未知但12=22)假定條件兩個獨立的小樣本兩個總體都是正態(tài)分布12、 22未知但相等,即12=22檢驗統(tǒng)計量其中:自由度:例:P241 8-8兩個總體均值之差的檢驗 (12, 22 未知且不相等1222)假定條件兩個總體都是正態(tài)分布12, 22未知且不相等,即1222檢驗統(tǒng)計量自由度:臨界值:例:P243 8-9相關(guān)樣本的均值差異檢驗(相關(guān)系數(shù)未知)假定條件兩個總體對應(yīng)數(shù)據(jù)差值構(gòu)成的總體服從正態(tài)分布檢驗統(tǒng)計量其中:自由度:例:P245 8-10相關(guān)樣本的均值差異

17、檢驗(相關(guān)系數(shù)已知)檢驗統(tǒng)計量兩個總體均值之差的檢驗 (獨立大樣本)1.假定條件兩個樣本是獨立的隨機樣本正態(tài)總體或非正態(tài)總體大樣本(n130和 n230)檢驗統(tǒng)計量 12 , 22 已知: 12 , 22 未知:總體方差的檢驗( 2 檢驗)總體方差的檢驗 ( 2檢驗) 檢驗一個總體的方差或標準差假設(shè)總體近似服從正態(tài)分布使用 2分布檢驗統(tǒng)計量樣本方差假設(shè)的總體方差總體方差的檢驗 (檢驗方法的總結(jié))假設(shè)雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗假設(shè)形式H0 : 2= 02 H1 : 2 02H0 : 2 02 H1 : 2 02統(tǒng)計量拒絕域P值決策 拒絕H0總體方差的檢驗【例】啤酒生產(chǎn)企業(yè)采用自動生產(chǎn)線灌裝啤酒,每

18、瓶的裝填量為640ml,但由于受某些不可控因素的影響,每瓶的裝填量會有差異。此時,不僅每瓶的平均裝填量很重要,裝填量的方差同樣很重要。如果方差很大,會出現(xiàn)裝填量太多或太少的情況,這樣要么生產(chǎn)企業(yè)不劃算,要么消費者不滿意。假定生產(chǎn)標準規(guī)定每瓶裝填量的標準差不應(yīng)超過和不應(yīng)低于4ml。企業(yè)質(zhì)檢部門抽取了10瓶啤酒進行檢驗,得到的樣本標準差為s=3.8ml。試以0.10的顯著性水平檢驗裝填量的標準差是否符合要求?朝日BEER朝日BEER朝日BEER朝日總體方差的檢驗H0 : 2 = 42H1 : 2 42 = 0.10df = 10 - 1 = 9臨界值(s):統(tǒng)計量:不拒絕H0裝填量的標準差符合要求

19、 2016.91903.32511 /2 =0.05決策:結(jié)論:兩個總體方差比的檢驗兩個總體方差比的檢驗(F 檢驗)假定條件兩個總體都服從正態(tài)分布,且方差相等兩個獨立的隨機樣本檢驗統(tǒng)計量兩個總體方差比的 F 檢驗(臨界值)FF1- F 拒絕H0方差比F檢驗示意圖拒絕H0兩個總體方差比的檢驗(檢驗方法的總結(jié))假設(shè)雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗假設(shè)形式H0: 12/22=1H1 : 12/221H0: 12/221H1 :12/221 統(tǒng)計量拒絕域兩個總體方差比的檢驗【例】一家房地產(chǎn)開發(fā)公司準備購進一批燈泡,公司打算在兩個供貨商之間選擇一家購買。這兩家供貨商生產(chǎn)的燈泡平均使用壽命差別不大,價格也很相近,

20、考慮的主要因素就是燈泡使用壽命的方差大小。如果方差相同,就選擇距離較近的一家供貨商進貨。為此,公司管理人員對兩家供貨商提供的樣品進行了檢測,得到的數(shù)據(jù)如右表。檢驗兩家供貨商燈泡使用壽命的方差是否有顯著差異 (=0.05) 35人的大卡攝取量 樣本1650569622630596637628706617624563580711480688723651569709632樣本2568540596555496646607562589636529584681539617相關(guān)系數(shù)的顯著性檢驗(P251)一、積差相關(guān)系數(shù)的假設(shè)檢驗二、其他類型相關(guān)系數(shù)的顯著性檢驗總體比例的檢驗總體比例檢驗假定條件總體服從二項

21、分布可用正態(tài)分布來近似(大樣本)檢驗的 z 統(tǒng)計量 0為假設(shè)的總體比例總體比例的檢驗 (檢驗方法的總結(jié))假設(shè)雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗假設(shè)形式H0: = 0H1: 0H0 : 0H1 : 0統(tǒng)計量拒絕域P值決策拒絕H0總體比例的檢驗【例】一種以休閑和娛樂為主題的雜志,聲稱其讀者群中有80%為女性。為驗證這一說法是否屬實,某研究部門抽取了由200人組成的一個隨機樣本,發(fā)現(xiàn)有146個女性經(jīng)常閱讀該雜志。分別取顯著性水平 =0.05和=0.01 ,檢驗該雜志讀者群中女性的比例是否為80%?它們的值各是多少?雙側(cè)檢驗總體比例的檢驗H0 : = 80%H1 : 80% = 0.05n = 200臨界值(c

22、):檢驗統(tǒng)計量:拒絕H0 (P = 0.013328 = 0.01)該雜志的說法屬實 決策:結(jié)論:z02.58-2.580.025拒絕 H0拒絕 H00.025兩個總體比例之差的檢驗1.假定條件兩個總體都服從二項分布可以用正態(tài)分布來近似檢驗統(tǒng)計量檢驗H0:1-2=0檢驗H0:1-2=d0兩個總體比例之差的檢驗兩個總體比例之差的檢驗(檢驗方法的總結(jié))假設(shè)雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗假設(shè)形式H0 :1-2=0H1 :1-20H0 :1-20 H1 :1-20 統(tǒng)計量拒絕域P值決策拒絕H0兩個總體比例之差的檢驗 【例】一所大學(xué)準備采取一項學(xué)生在宿舍上網(wǎng)收費的措施,為了解男女學(xué)生對這一措施的看法是否存在差異,分別抽取了200名男學(xué)生和200名女學(xué)生進行調(diào)查,其中的一個問題是:“你是否贊成采取上網(wǎng)收費的措施?”其中男學(xué)生表示贊成的比例為27%,女學(xué)生表示贊成的比例為35%。調(diào)查者認為,男學(xué)生中表示贊成的比例顯著低于女學(xué)生。取顯著性水平=0.01,樣本提供的證據(jù)是否支持調(diào)查者的看法? 21netnet兩個總體比例之差的檢驗H0 :1- 2 0H1 :1- 2 0 = 0.05

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論