spss講稿5(1) SPSS參數(shù)檢驗和區(qū)間估計(一)_第1頁
spss講稿5(1) SPSS參數(shù)檢驗和區(qū)間估計(一)_第2頁
spss講稿5(1) SPSS參數(shù)檢驗和區(qū)間估計(一)_第3頁
spss講稿5(1) SPSS參數(shù)檢驗和區(qū)間估計(一)_第4頁
spss講稿5(1) SPSS參數(shù)檢驗和區(qū)間估計(一)_第5頁
已閱讀5頁,還剩70頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

SPSS參數(shù)檢驗和區(qū)間估計

(一)假設檢驗概述假設檢驗是一種根據(jù)樣本數(shù)據(jù)來推斷總體的分布或均值、方差等總體統(tǒng)計參數(shù)的方法。根據(jù)樣本來推斷總體的原因:總體數(shù)據(jù)不可能全部收集到。如:質量檢測問題收集到總體全部數(shù)據(jù)要耗費大量的人力和財力假設檢驗包括:參數(shù)檢驗非參數(shù)檢驗統(tǒng)計方法描述統(tǒng)計推斷統(tǒng)計參數(shù)估計假設檢驗假設檢驗的基本原理基本信念:利用小概率原理進行反證明。小概率事件在一次實驗中不可能發(fā)生。例如:對人民大學男生平均身高進行推斷H0:平均身高為173樣本平均身高為178,由于存在抽樣誤差,不能直接拒絕H0。而需要考慮:在H0成立的條件下,一次抽樣得到平均身高為178的可能性有多大。如果可能性較大,是個大概率事件(與相比較),則不能認為H0不正確。否則,如果可能性較小,是個小概率事件,但確實發(fā)生了,則只能認為H0不正確。概率P值即為觀測結果或更極端現(xiàn)象在零假設成立時出現(xiàn)的概率總體分布(populationdistribution)總體中各元素的觀察值所形成的分布分布通常是未知的可以假定它服從某種分布總體三種不同性質的分布樣本分布(sampledistribution)一組樣本中各觀察值的分布,也稱經(jīng)驗分布當樣本容量n逐漸增大時,樣本分布逐漸接近總體的分布三種不同性質的分布樣本抽樣分布(samplingdistribution)樣本統(tǒng)計量(樣本均值,樣本比例,樣本方差等)的概率分布結果來自容量相同的所有可能樣本提供了樣本統(tǒng)計量穩(wěn)定性的信息,是進行推斷的理論基礎,也是抽樣推斷科學性的重要依據(jù) 三種不同性質的分布總體計算樣本統(tǒng)計量例如:樣本均值、比例、方差樣本三種不同性質的分布抽樣分布容量相同的所有可能樣本的樣本均值的概率分布推斷總體均值的理論基礎【例】設一個總體,含有4個元素(個體)

,即總體單位數(shù)N=4。4

個個體分別為x1=1、x2=2、x3=3

、x4=4

??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差樣本均值的抽樣分布現(xiàn)從總體中抽取n=2的簡單隨機樣本,在重復抽樣條件下,共有42=16個樣本。所有樣本的結果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)樣本均值的抽樣分布計算出各樣本的均值3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)X樣本均值的抽樣分布1.00.1.2.3P(X)1.53.04.03.52.02.5樣本均值的抽樣分布=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(X)1.00.1.2.31.53.04.03.52.02.5X樣本均值的抽樣分布=50

=10X總體分布n=4抽樣分布Xn=16當總體服從正態(tài)分布N~(μ,σ2)時,來自該總體的所有容量為n的樣本的均值X也服從正態(tài)分布,X

的數(shù)學期望為μ,方差為σ2/n。即X~N(μ,σ2/n)樣本均值的抽樣分布當樣本容量足夠大時(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理設從均值為,方差為2的一個任意總體中抽取容量為n的樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個任意分布的總體X樣本均值的抽樣分布的分布趨于正態(tài)分布的過程樣本均值的抽樣分布假設檢驗的基本問題假設檢驗的概念和基本思想什么是假設(hypothesis)假設是對總體參數(shù)的數(shù)值所作的一種陳述總體參數(shù)包括總體均值、比例、方差等分析之前必需陳述事先對總體參數(shù)或分布形式作出某種假設,然后利用樣本信息來判斷原假設是否成立我認為該地區(qū)新生嬰兒的平均體重為3190克!我認為人口平均年齡為50歲總體抽取隨機樣本均值

X=20我認為人口的平均年齡是50歲提出假設

拒絕假設!

別無選擇.作出決策假設檢驗的基本問題...因此我們拒絕假設

=50...如果這是總體的真實均值樣本均值m=50抽樣分布H0這個值不像我們應該得到的樣本均值...20假設檢驗的基本問題假設檢驗的概念和基本思想假設檢驗的基本問題假設檢驗的概念和基本思想依據(jù)統(tǒng)計上的小概率原理,采用邏輯上的反證法。小概率:在一次試驗中,一個幾乎不可能發(fā)生的事件發(fā)生的概率在一次試驗中小概率事件一旦發(fā)生,我們就有理由拒絕原假設小概率由研究者事先確定假設檢驗的基本問題假設檢驗的概念和基本思想假設檢驗的基本步驟提出假設確定適當?shù)臋z驗統(tǒng)計量規(guī)定顯著性水平計算檢驗統(tǒng)計量的觀測值和概率P值作出統(tǒng)計決策假設檢驗的基本步驟:提出原假設或備擇假設什么是原假設?(nullhypothesis)待檢驗的假設,又稱“0假設”,表示為H0研究者想收集證據(jù)予以反對的假設(支持不容易,則找一個反例來拒絕)總是有等號,或,表示為:H0:

某一數(shù)值H0:

某一數(shù)值H0:某一數(shù)值例如,H0:

50(歲)假設檢驗的基本問題假設檢驗的基本步驟:提出原假設或備擇假設什么是備擇假設?(alternativehypothesis)與原假設對立的假設,也稱“研究假設”,表示為H1研究者想收集證據(jù)予以支持的假設??偸怯胁坏忍?,

或,表示為:H1:

某一數(shù)值H1:

<某一數(shù)值H1:某一數(shù)值例如,H1:

50(歲),或50(歲)假設檢驗的基本問題假設檢驗的基本步驟:確定恰當?shù)臋z驗統(tǒng)計量什么是檢驗統(tǒng)計量?用于假設檢驗決策的統(tǒng)計量,用于反映在原假設成立條件下,樣本或更極端情況出現(xiàn)的可能性或樣本與零假設間的差距。應針對不同的問題選擇不同的統(tǒng)計量,如:是大樣本還是小樣本總體方差已知還是未知如:檢驗統(tǒng)計量的基本形式為假設檢驗的基本問題假設檢驗的基本步驟:規(guī)定顯著性水平

(significantlevel)什么是顯著性水平?是一個概率值,表示為(alpha)原假設為真時,拒絕原假設(棄真)的概率;小概率標準常用的值有0.01,0.05,0.10,由研究者事先確定

值是決定樣本能否推翻原假設的依據(jù)假設檢驗的基本問題假設檢驗的基本步驟:計算檢驗統(tǒng)計量的觀測值和概率P值什么是檢驗統(tǒng)計量的觀測值?即:樣本所反映的信息與原假設間的差距。什么是檢驗統(tǒng)計量的概率P值?即:一個概率值,觀察到的樣本或更極端情況在原假設成立時出現(xiàn)的可能性如果原假設為真,P值是抽樣分布中大于或小于樣本統(tǒng)計量的概率假設檢驗的基本問題H0值臨界值臨界值a/2a/2

樣本統(tǒng)計量拒絕域拒絕域抽樣分布1-置信水平假設檢驗的基本問題H0值臨界值臨界值

a/2a/2

樣本統(tǒng)計量拒絕域拒絕域抽樣分布1-置信水平假設檢驗的基本問題H0值臨界值臨界值a/2a/2

樣本統(tǒng)計量拒絕域拒絕域抽樣分布1-置信水平假設檢驗的基本問題/

2/

2Z拒絕拒絕H0值臨界值計算出的樣本統(tǒng)計量計算出的樣本統(tǒng)計量臨界值1/2P值1/2P值假設檢驗的基本問題假設檢驗的基本步驟:作出統(tǒng)計決策根據(jù)給定的顯著性水平,查表得出相應的臨界值z或z/2,t或t/2。將檢驗統(tǒng)計量的觀測值與水平的臨界值進行比較,或將檢驗統(tǒng)計量的概率P值與進行比較。得出拒絕或不能拒絕原假設的結論若檢驗統(tǒng)計量觀測值的絕對值大于水平的臨界值,則應拒絕H0若檢驗統(tǒng)計量觀測值的絕對值小于水平的臨界值,則不應拒絕H0若檢驗統(tǒng)計量的概率p-值<,則應拒絕H0若檢驗統(tǒng)計量的概率p值>

,則不能拒絕H0假設檢驗的基本問題一個正態(tài)總體參數(shù)的假設檢驗假設檢驗的基本問題Z檢驗(單尾和雙尾)t檢驗(單尾和雙尾)Z檢驗(單尾和雙尾)

2檢驗(單尾和雙尾)均值一個總體比例方差總體是否已知?用樣本標準差S代替t檢驗小樣本容量n否是z檢驗

z檢驗大

一個總體均值的假設檢驗總體均值的檢驗(2

已知或2未知大樣本)假定條件總體服從正態(tài)分布若不服從正態(tài)分布,可用正態(tài)分布來近似(n30)使用Z-統(tǒng)計量2

已知:2

未知:

一個總體均值的假設檢驗總體均值的檢驗(2

未知小樣本)假定條件總體為正態(tài)分布2未知,且小樣本使用t

統(tǒng)計量

一個總體均值的假設檢驗t分布:英國釀造化學師戈塞特,小樣本研究提出的Student分布

t分布是類似正態(tài)分布的一種對稱分布,它通常要比正態(tài)分布平坦和分散。一個特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布Xt

分布與標準正態(tài)分布的比較t分布標準正態(tài)分布t不同自由度的t分布標準正態(tài)分布t(df=13)t(df=5)Z

一個總體均值的假設檢驗SPSS單樣本t檢驗含義:檢驗某變量的總體均值與指定的檢驗值之間是否存在顯著差異。例如:人均住房面積的平均值是否為20平方米基本操作步驟(1)菜單選項:Analyze->comparemeans->one-samplesTtest(2)指定檢驗值:在test后的框中輸入檢驗值應用舉例人均住房面積的平均值是否為20平方米注意書寫步驟SPSS單樣本t檢驗(3)option選項:Missingvalues:缺失值的處理(單樣本檢驗時以下選項沒有差別)

excludecasesanalysisbyanalysis:當分析時涉及到有缺失值變量時再剔除相應的個案excludecaseslistwise:剔除所有含缺失值的個案后再分析參數(shù)估計的一般問題點估計(pointestimate)用樣本值直接作為總體參數(shù)的估計值例如:用樣本均值直接作為總體均值的估計沒有給出估計值接近總體參數(shù)程度的信息假設檢驗統(tǒng)計方法描述統(tǒng)計推斷統(tǒng)計參數(shù)估計區(qū)間估計(intervalestimate)在點估計的基礎上,以一定的把握程度(置信水平)將總體參數(shù)估計在一個區(qū)域(置信區(qū)間)內(nèi)比如,某班級平均分數(shù)在75~85之間,把握程度是95%

樣本統(tǒng)計量

(點估計)置信區(qū)間置信下限置信上限參數(shù)估計的一般問題置信區(qū)間和置信水平由樣本統(tǒng)計量所構造的總體參數(shù)的估計區(qū)間稱為置信區(qū)間統(tǒng)計學家在某種程度上確信這個區(qū)間會包含真正的總體參數(shù),所以給它取名為置信區(qū)間用一個具體的樣本所構造的區(qū)間是一個特定的區(qū)間,我們無法知道這個樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值我們只能是希望這個區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個,但它也可能是少數(shù)幾個不包含參數(shù)真值的區(qū)間中的一個參數(shù)估計的一般問題置信區(qū)間和置信水平將構造置信區(qū)間的步驟重復很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平,表示為(1-為是總體參數(shù)未在區(qū)間內(nèi)的比例常用的置信水平值有99%,95%,90%,相應的為0.01,0.05,0.10參數(shù)估計的一般問題一個總體均值的區(qū)間估計總體均值的區(qū)間估計假定條件總體服從正態(tài)分布,且方差(2)

已知如果不是正態(tài)分布,大樣本(n

30)可由正態(tài)分布來近似區(qū)間估計思路總體均值在1-置信水平下的置信區(qū)間為邊際誤差一個總體均值的區(qū)間估計總體均值的區(qū)間估計假定條件總體服從正態(tài)分布,且方差(2)未知大樣本(n

30)總體均值在1-置信水平下的置信區(qū)間為總體均值的區(qū)間估計假定條件總體服從正態(tài)分布,且方差(2)

未知小樣本(n<30)t

分布總體均值在1-置信水平下的置信區(qū)間為一個總體均值的區(qū)間估計利用SPSS單樣本t檢驗進行區(qū)間估計option選項:confidenceinterval:指定輸出-0的置信區(qū)間.默認值為95%.可以再計算99%的置信區(qū)間,和95%的置信區(qū)間進行對比區(qū)間估計和假設檢驗的關系:如果檢驗值在置信區(qū)間內(nèi),則無法拒絕原假設如果檢驗值不在置信區(qū)間內(nèi),則拒絕原假設雙側檢驗和單側檢驗雙側檢驗例如,某種零件的尺寸,要求其平均長度為10cm,大于或小于10cm均屬于不合格拒絕原假設有兩種可能:大于或小于。我們想要證明(檢驗)的是這兩種可能性中的任何一種是否成立。假設檢驗中的拒絕域在左右兩邊均存在建立的原假設與備擇假設應為:

H0:

=10H1:

10單側檢驗例:一項研究表明,采用新技術生產(chǎn)后,將會使產(chǎn)品的使用壽命明顯延長到1500小時以上。檢驗這一結論是否成立研究者總是想證明自己的研究結論(壽命延長)是正確的拒絕假設的情況只有一種例:一項研究表明,改進生產(chǎn)工藝后,會使產(chǎn)品的廢品率降低到2%以下。檢驗這一結論是否成立研究者總是想證明自己的研究結論(廢品率降低)是正確的拒絕假設的情況只有一種雙側檢驗和單側檢驗假設研究的問題雙側檢驗左側檢驗右側檢驗H0m=m0m

m0m

m0H1m≠m0m<m0m>m0假設檢驗的類型:雙側檢驗和單側檢驗雙側檢驗和單側檢驗單側檢驗中如何提出假設將研究者想收集證據(jù)予以支持的假設作為備擇假設H1,例如:一個研究者總是想證明自己的研究結論是正確的一個銷售商總是想證明供貨商的說法是不正確的備擇假設H1的方向與想要證明其正確性的方向一致將研究者想收集證據(jù)證明其不正確的假設作為原假設H0先確立備擇假設H1,再確立原假設H0雙側檢驗和單側檢驗單側檢驗如何提出假設例:一項研究表明,改進生產(chǎn)工藝后,會使產(chǎn)品的廢品率降低到2%以下。檢驗這一結論是否成立研究者總是想證明自己的研究結論(廢品率降低)是正確的備擇假設的方向為“<”(廢品率降低)建立的原假設與備擇假設應為

H0:2%H1:

<2%為左側檢驗雙側檢驗和單側檢驗與研究角度有關H0值臨界值a樣本統(tǒng)計量拒絕域抽樣分布1-置信水平觀察到的樣本統(tǒng)計量單側檢驗中的決策問題(左側)雙側檢驗和單側檢驗H0值臨界值a樣本統(tǒng)計量拒絕域抽樣分布1-置信水平單側檢驗中的決策問題(左側)雙側檢驗和單側檢驗H0值臨界值a樣本統(tǒng)計量拒絕域抽樣分布1-置信水平計算出的樣本統(tǒng)計量P值左側檢驗拒絕原假設的區(qū)域在左邊雙側檢驗和單側檢驗左側檢驗時,P-值為曲線上方小于等于檢驗統(tǒng)計量部分的面積單側檢驗如何提出假設例:一項研究表明,采用新技術生產(chǎn)后,將會使產(chǎn)品的使用壽命明顯延長到1500小時以上。檢驗這一結論是否成立研究者總是想證明自己的研究結論(壽命延長)是正確的備擇假設的方向為“>”(壽命延長)建立的原假設與備擇假設應為

H0:

1500H1:

1500,為右側檢驗雙側檢驗和單側檢驗與研究角度有關H0值臨界值a樣本統(tǒng)計量拒絕域抽樣分布1-置信水平觀察到的樣本統(tǒng)計量單側檢驗中的決策問題(右側)雙側檢驗和單側檢驗H0值臨界值a樣本統(tǒng)計量抽樣分布1-置信水平拒絕域單側檢驗中的決策問題(右側)雙側檢驗和單側檢驗H0值臨界值a拒絕域抽樣分布1-置信水平計算出的樣本統(tǒng)計量P值雙側檢驗和單側檢驗右側檢驗時,P-值為曲線上方大于等于檢驗統(tǒng)計量部分的面積右側檢驗拒絕原假設的區(qū)域在右邊【例】根據(jù)過去大量資料,某廠生產(chǎn)的燈泡的使用壽命服從正態(tài)分布N~(1020,1002)?,F(xiàn)從最近生產(chǎn)的一批產(chǎn)品中隨機抽取16只,測得樣本平均壽命為1080小時。試在0.05的顯著性水平下判斷這批產(chǎn)品的使用壽命是否有顯著提高?(=0.05)(2

已知)單側檢驗一個總體參數(shù)的單側檢驗基本步驟提出假設:H0:

1020,H1:>1020(右側)選擇檢驗統(tǒng)計量:確定顯著性水平:

=

0.05計算檢驗統(tǒng)計量的觀測值和概率P值:決策:P=0.008198在

=0.05的水平上拒絕H0,表明這批燈泡的使用壽命有顯著提高Z0拒絕域0.051.645能否站在項目驗收者的角度?一個總體參數(shù)的單側檢驗

【例】一個汽車輪胎制造商聲稱,某一等級的輪胎的平均壽命在一定的汽車重量和正常行駛條件下大于40000公里,對一個由20個輪胎組成的隨機樣本作了試驗,測得平均值為41000公里,標準差為5000公里。已知輪胎壽命的公里數(shù)服從正態(tài)分布,我們能否根據(jù)這些數(shù)據(jù)作出結論,該制造商的產(chǎn)品同他所說的標準相符?(=0.05)(2

未知小樣本)單側檢驗!一個總體參數(shù)的單側檢驗基本步驟提出假設:H0:

40000,H1:

<40000(左側)選擇檢驗統(tǒng)計量:確定顯著性水平:

=

0.05計算檢驗統(tǒng)計量的觀測值和概率P值:決策:P=0.191253在

=0.05的水平上不能拒絕H0,不能認為該輪胎的平均壽命小于40000公里-1.7291t0拒絕域.05站在誰的角度?換個角度呢?應本著尊重樣本事實的原則一個總體參數(shù)的單側檢驗利用SPSS單樣本t檢驗進行單側檢驗例如:檢驗保險公司具有高等教育水平的員工比例的平均值是否低于0.8假設的提出p/2與比較單區(qū)間和假設檢驗的關系:左側檢驗中,檢驗統(tǒng)計量觀測值值小于右側檢驗中,檢驗統(tǒng)計量觀測值大于則拒絕原假設,否則,不能拒絕利用SPSS單樣本t檢驗進行單側檢驗單側置信區(qū)間:應關注問題本身產(chǎn)品壽命等問題中,由于更關注最低值(不得低于某值),可將上限設為+,只計算置信下限次品率等問題中,由于更關注最大值(不得高于某值),可將下限設-,只計算置信上限計算方法:假設檢驗中的兩類錯誤1. 第一類錯誤(棄真錯誤)原假設為真時拒絕原假設,即:棄真錯誤第一類錯誤的概率為例如:身高175(真),但抽到的樣本是籃球隊隊員2. 第二類錯誤(取偽錯誤)原假設為假時接受原假設,即:取偽錯誤第二類錯誤的概率為(Beta)例如:身高200(假),抽到的樣本是籃球隊隊員假設檢驗中的兩類錯誤紅線越接近藍線(假與真越接近),越大;反之,越小越小,越大;反之,越小通常希望發(fā)生這兩類錯誤的概率越小越好但在一定的樣本容量下,不可能作到兩類錯誤同時減少通常,較容易控制,而會受到諸多因素的影響。當真值和假設檢驗值相差較小時,很容易犯取偽錯誤拒絕零假設,接受備擇假設犯錯的概率是可控制的,即為接受零假設是無意義的,因為犯錯誤的可能性是不可控的;應將希望證明的假設放在H1上假設檢驗中的兩類錯誤【例】一項統(tǒng)計結果聲稱,某市老年人口(年齡在65歲以上)的比重為14.7%,該市老年人口研究會為了檢驗該項統(tǒng)計是否可靠,隨機抽選了400名居民,發(fā)現(xiàn)其中有57人年齡在65歲以上。調(diào)查結果是否支持該市老年人口比重為14.7%的看法?(=0.05)雙側檢驗一個總體比例的檢驗假定條件有兩類結果總體服從二項分布可用正態(tài)分布來近似比例檢驗的Z統(tǒng)計量0為假設的總體比例一個總體比例的檢驗H0:

=14.7%H1:

14.7%

=0.05n

=400臨界值(s):檢驗統(tǒng)計量:在

=0.05的水平上不能拒絕H0認為該市老年人口比重與14.7%無顯著差異決策:結論:Z01.96-1.96.025拒絕H0拒絕H0.025一個總體比例的檢驗利用SPSS單樣本t檢驗進行比例檢驗例:利用住房調(diào)查數(shù)據(jù),對總體的性別比例進行推斷數(shù)據(jù)的1、0轉換假設檢驗和區(qū)間估計一個總體均值檢驗和區(qū)間估計總結提出原假設和備擇假設將希望證明的假設放在H1上,希望推翻的假設放在H0上確定適當?shù)臋z驗統(tǒng)計量總體是否已知?小樣本容量n否是

大規(guī)定顯著性水平計算檢驗統(tǒng)計量的觀測值和概率

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論