均值比較與T檢驗chap5_第1頁
均值比較與T檢驗chap5_第2頁
均值比較與T檢驗chap5_第3頁
均值比較與T檢驗chap5_第4頁
均值比較與T檢驗chap5_第5頁
已閱讀5頁,還剩52頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第五章均值比較與T檢驗統(tǒng)計分析常常采取抽樣研究的方法。即從總體中隨機抽取一定數(shù)量的樣本進行研究來推論總體的特性。由于總體中的每個個體間均存在差異,即使嚴格遵守隨機抽樣原則也會由于多抽到一些數(shù)值較大或較小的個體致使樣本統(tǒng)計量與總體參數(shù)之間有所不同。由此可以得出這樣的認識:均值不相等的兩個樣本不一定來自均值不同的總體。能否用樣本均數(shù)估計總體均數(shù),兩個變量均數(shù)接近的樣本是否來自均值相同的總體?換句話說,兩個樣本某變量均值不同,其差異是否具有統(tǒng)計意義,能否說明總體差異?這是各種研究工作中經(jīng)常提出的問題。這就要進行均值比較。對來自正態(tài)總體的兩個樣本進行均值比較常使用T檢驗的方法。T檢驗要求兩個被比較的樣本來自正態(tài)總體。兩個樣本方差相等與不等時使用的計算t值的公式不同。進行方差齊次性檢驗使用F檢驗。對應(yīng)的零假設(shè)是:兩組樣本方差相等。p值小于0.05說明在該水平上否定原假設(shè),方差不齊;否則兩組方差無顯著性差異。F值的計算公式是:F=S12(較大)/S22(較小)進行均值比較及檢驗的過程MEANS過程Ttest過程單一樣本T檢驗獨立樣本的T檢驗配對樣本的T檢驗單因素方差分析SPSS的均值過程是描述和分析尺度變量(Scale)的一種有用的方法,可以獲得需要分析變量的許多中心趨勢和離散趨勢的統(tǒng)計指標(biāo),同時它可以對不同的組別或者交叉組別進行比較。當(dāng)觀測量按一個分類變量分組時,均值過程可以進行分組計算。例如:要計算學(xué)生的平均身高,SEX變量把學(xué)生按性別分為男、女生兩組,均值過程可以分別計算男、女生平均身高。注意用于形成分組的變量應(yīng)該是其值數(shù)量少且能明確表明其特征的變量。

一、MEANS過程

使用均值過程求若干組的描述統(tǒng)計量,目的在于比較。因此必須分組求均值。這是與Descriptives過程不同之處。

MEANS過程的基本功能是分組計算指定變量的描述統(tǒng)計量。包括均值、標(biāo)準(zhǔn)差、總和、觀測量數(shù)、方差等一系列單變量描述統(tǒng)計量。也可以從該過程獲得單因素方差分析、eta和線性相關(guān)檢驗。Mean過程的數(shù)據(jù)文件要求:至少有一個連續(xù)變量、一個分類變量(離散變量)。對連續(xù)變量求其基本描述統(tǒng)計量。分類變量用來分組。以30個學(xué)生的身高為例說明操作步驟(學(xué)生身高體重數(shù)據(jù).sav)變量number編號,sex性別,age年齡,height身高,weight體重。相同年齡的男孩和女孩是否身高有所不同?是否身高隨年齡的增長呈線性關(guān)系?如果解決這樣的問題,只建立一個控制層就不夠了。應(yīng)該考慮,選擇身高作為因變量,分類變量年齡作為第一層控制變量,性別為第二層控制變量。兩個分類變量分別放在兩層中,且使用選擇項。ANOVAtableandeta:輸出第一層控制變量給出的方差分析表和eta統(tǒng)計值η和η2

。η統(tǒng)計量表明因變量和自變量之間聯(lián)系的強度。η2

是組間平方和與總平方和之比。Testforlinearity:線性檢驗,輸出R和R2,只有在控制變量有基本的控制級,且自變量有三個水平以上時才能選用。對第一層變量的方差分析結(jié)果身高*年齡(方差分析的變量信息):分析不同年齡的身高均值間是否存在顯著性差異;SumofSquares(偏差平方和);df(自由度);Meansquare(均方);F(方差值);sig(P值);BetweenGroups(組間偏差平方和):由兩部分組成:Linearity是由因變量與控制變量之間的線性關(guān)系引起的;Deviationfromlinearity不是由因變量與控制變量之間的線性關(guān)系引起的;WithinGroups(組內(nèi)偏差平方和):各組內(nèi)的變異相對于組均值的變異;Total(偏差平方和的總和):為組間偏差平方和與組內(nèi)偏差平方和之和。線性檢驗結(jié)果R是因變量身高的觀測值與預(yù)測值之間的的相關(guān)系數(shù),R值越接近1表明回歸方程的預(yù)測性越好;Eta:即η值(0~1)說明因變量與自變量之間的聯(lián)系程度;EtaSquared:η2為組間偏差平方和與偏差平方和總和之比。練習(xí)題試按性別、年齡對體重做平均數(shù)分析。單樣本T檢驗單樣本T檢驗即檢驗?zāi)硞€變量的樣本均值和某指定值(總體均值)之間是否存在著顯著性差異。如果是大樣本的單樣本檢驗,統(tǒng)計教科書上稱為U檢驗,它采用服從正態(tài)分布的U統(tǒng)計量作為檢驗統(tǒng)計量;如果是小樣本并且樣本服從正態(tài)分布,則采用服從t分布的t統(tǒng)計量進行單樣本T檢驗;否則,采取非參數(shù)檢驗。T檢驗穩(wěn)健性(Robust)較好,如果樣本分布偏離正態(tài)分布不太嚴重,也可采用T檢驗。二、Ttest過程1、單一樣本T檢驗(One-sampleTTest)

檢驗單個變量的均值是否與給定的常數(shù)(一般為理論值、標(biāo)準(zhǔn)值或經(jīng)過大量觀察所得的穩(wěn)定值等)之間存在差異。樣本均數(shù)與總體均數(shù)之間的差異顯著性檢驗屬于單一樣本T檢驗。如某廠的燈泡壽命的平均值為1500小時,后采用新工藝組織生產(chǎn),要想了解燈泡壽命是否提高?方法:從新工藝下生產(chǎn)的燈泡中隨機抽查若干只燈泡,測得壽命,并計算平均壽命,再與1500小時進行比較,判斷是否有顯著差異?如果是大樣本的單樣本檢驗,統(tǒng)計教科書上稱為U檢驗,它采用服從正態(tài)分布的U統(tǒng)計量作為檢驗統(tǒng)計量;如果是小樣本并且樣本服從正態(tài)分布,則采用服從t分布的t統(tǒng)計量進行單樣本T檢驗;否則,采取非參數(shù)檢驗。T檢驗穩(wěn)健性(Robust)較好,如果樣本分布偏離正態(tài)分布不太嚴重,也可采用T檢驗。例:收集26家保險公司人員構(gòu)成數(shù)據(jù),希望對目前保險公司從業(yè)人員受高等教育程度和年輕化程度進行推斷。具體而言,就是推斷具有高等教育水平的員工平均比例是否不低于0.8,年輕人的平均比例是否為0.5,具體數(shù)據(jù)文件名為保險公司人員構(gòu)成情況.sav提出原假設(shè):保險公司具有高等教育水平的員工比例的平均值不低于0.8,即H0:u>=(u0=0.8)年輕人比例的平均值與0.5無顯著差異,即:H0:u=u0=0.5分析過程:計算具有高等教育水平的員工數(shù),35歲以下員工數(shù)占總員工數(shù)的比例。(利用轉(zhuǎn)換菜單計算)進行單樣本t檢驗分析:由于調(diào)查的26家公司,有7家在文化程度變量上有缺失值,因此在選項窗口中選擇【按分析順序排除個案】進行缺失值處理。Confidenceinterval:95%:置信區(qū)間項,可以自定義。MissingValues:選擇對缺失值的處理方法

Excludecasesanalysisbyanalysis:帶有缺失值的觀測值當(dāng)它與分析有關(guān)時才被剔除;

Excludecaseslistwise:剔除所有列在Test、Grouping矩形框中的變量帶缺失值的項受高等教育比例的基本描述統(tǒng)計量被調(diào)查的26家保險公司有效的19家,其中具有高等教育水平員工比例的平均數(shù)是0.745,標(biāo)準(zhǔn)差為0.167,標(biāo)準(zhǔn)誤為0.038單樣本T檢驗分析結(jié)果95%ConfidenceIntervaloftheDifference(差值的95%置信區(qū)間):95%的置信區(qū)間=均值±1.96標(biāo)準(zhǔn)誤。根據(jù)上表比例總體均值的95%置信區(qū)間是0.745±1.96×0.038即(0.664,0.8255)。由此推出,該范圍與總體均數(shù)之差為0.664-0.8~0.8255-0.8,即表中-0.1358和0.0255的含義。單樣本t檢驗中t統(tǒng)計量的雙尾概率p-為0.168,若顯著性水平a為0.05,則p>a,由此接受原假設(shè),也就是保險公司員工受高等教育比例顯著高于0.8。(0.8大于95%的置信區(qū)間下限)練習(xí):年輕人比例t檢驗操作年輕人比例的基本描述統(tǒng)計量調(diào)查的26家保險公司,年輕人比例的平均數(shù)是0.7139,標(biāo)準(zhǔn)差為0.151,標(biāo)準(zhǔn)誤為0.03單樣本T檢驗分析結(jié)果95%ConfidenceIntervaloftheDifference(差值的95%置信區(qū)間):95%的置信區(qū)間=均值±1.96標(biāo)準(zhǔn)誤。根據(jù)上表比例總體均值的95%置信區(qū)間是0.7139±1.96×0.03即(0.655,0.773)。由此推出,該范圍與總體均數(shù)之差為0.655-0.5~0.773-0.5,即表中0.1530和0.2747的含義。單樣本t檢驗中t統(tǒng)計量的雙尾概率p-為0,若顯著性水平a為0.05,則p<a,由此拒絕原假設(shè),樣本均數(shù)與總體均數(shù)有顯著性差異。也就是保險公司年輕人比例與0.5存在顯著性差異。練習(xí)題已知某水樣中含CaCO3的真值為20.7mg/L,現(xiàn)用某方法重復(fù)測定該水樣11次CaCO3的含量(mg/L)為:20.99,20.41,20.10,20.00,20.91,22.60,20.99,20.41,20.00,23.00,22.00。問該方法測得的均值是否偏高?2、IndependentSampleTtest

(獨立樣本T檢驗)獨立樣本的T檢驗用于檢驗兩個不相關(guān)的樣本是否來自具有相同均值的總體。兩獨立樣本是指兩個樣本所來自的總體相互獨立,兩個獨立樣本各自接受相同的測量,研究者或分析者的主要目的是分析兩個獨立樣本的均值是否有顯著的統(tǒng)計差異。獨立樣本T檢驗必須注意使用這種檢驗的條件是必須具有來自兩個不相關(guān)組(非配對)的觀測量,其均值必須是對你想在兩組中都計算的變量的綜合測度。例如,比較女性和男性的身高,教育從業(yè)者和金融從業(yè)者的起始工資等,都是兩獨立樣本的例子。

兩獨立樣本T檢驗的前提條件獨立性:兩樣本所來自的總體互相獨立。正態(tài)性:樣本來自的兩個總體應(yīng)服從正態(tài)分布。在樣本所來自的總體不滿足正態(tài)性條件時,如果兩個樣本的分布形狀相似,它們的樣本量相差不是太大并且樣本量較大,仍然可以應(yīng)用T檢驗。方差齊性:待比較的兩個樣本的方差相同。如果兩個組的樣本量大致相等,略微偏離了方差齊性對檢驗結(jié)果的精度影響不大。在T檢驗中,SPSS提供了方差齊性的Levene檢驗,當(dāng)方差齊性不滿足時,會提供方差齊性校正后的T檢驗結(jié)果。如果分組樣本彼此不獨立,例如測量的是研究對象用藥前后某項指標(biāo),要求比較用藥前后某項指標(biāo)均值是否有顯著性差異,應(yīng)該使用配對T檢驗的功能(PairedSampleTtest)。如果分組不止兩個,應(yīng)該使用One-WayANOV過程進行單變量方差分析。如果你試圖比較的變量明顯不是正態(tài)分布的,則應(yīng)該考慮使用一種非參數(shù)檢驗過程(Nonparametrictest)。如果想比較的變量是分類變量,應(yīng)該使用Crosstabs功能。例:學(xué)生參加為期三天的計算機等級測試培訓(xùn),有15名學(xué)生報名參加A公司的培訓(xùn),12名參加B公司的培訓(xùn),培訓(xùn)結(jié)束后學(xué)生參加測試,想知道學(xué)生在這兩家公司不同培訓(xùn)方法下,測試成績的均值是否存在顯著差異。分析:培訓(xùn)方式A與培訓(xùn)方式B可以看成是兩個獨立樣本Spss操作步驟Usespecialvalues使用指定值:按分組變量的值進行分組Cutpoint割點:當(dāng)分組變量為連續(xù)變量時,選擇該選項后,在后面的矩形框中輸入一個連續(xù)變量值,將觀測量分為大于該值和小于該值的兩個組,檢驗在這兩個組之間進行,比較其因變量在兩組的均數(shù)間是否有顯著性差異。Confidenceinterval:95%:置信區(qū)間項,可以自定義。MissingValues:選擇對缺失值的處理方法

Excludecasesanalysisbyanalysis:帶有缺失值的觀測值當(dāng)它與分析有關(guān)時才被剔除;

Excludecaseslistwise:剔除所有列在Test、Grouping矩形框中的變量帶缺失值的項分析變量的簡單描述性統(tǒng)計量左第一欄為分析變量標(biāo)簽和分類變量標(biāo)簽N觀測量數(shù)目Mean均值Std.Deviation標(biāo)準(zhǔn)差Std.ErrorMean標(biāo)準(zhǔn)誤參加培訓(xùn)方法A的學(xué)生的平均測試成績47.73,低于培訓(xùn)方法B學(xué)生的平均測試成績8.77分兩組學(xué)生測試成績的標(biāo)準(zhǔn)差相差不大,參加培訓(xùn)方法A的略大獨立樣本T檢驗結(jié)果Levene’sTestforEqualityofVariances:方差齊性檢驗F方差值:0.258Sig:P值為0.616>0.05,接受原假設(shè)即方差相等。t-testforEqualityofMeans為T檢驗結(jié)果欄t:t值;df:自由度;Sig:顯著性概率即P值=0<0.05,拒絕原假設(shè)u1-u2=0;MeanDifference:兩組均值之差。表現(xiàn)培訓(xùn)方法A學(xué)生平均測試成績低于培訓(xùn)方法B學(xué)生成績8.767;Std.ErrorDifference:差值的標(biāo)準(zhǔn)誤為1.686;95%ConfidenceIntervaloftheDifference:差值的95%置信區(qū)間。在-12.24~-5.294之間,不包括0即兩組均值之差與0有顯著性差異。例題二有29名13歲男生的身高、體重、肺活量數(shù)據(jù)(學(xué)生肺活量數(shù)據(jù).sav),試分析大于等于155cm的與身高小于155cm的兩組男生的肺活量均值是否有顯著差異。分析:155以下和155以上身高的男生平均肺活量顯著性檢驗例題二身高大于等于155cm與身高小于155cm的兩組男生的肺活量平均值在95%水平上顯著存在差異。練習(xí)題某克山病區(qū)測得11例急性克山病患者與13名健康人的血磷值如下:患者:2.60,3.24,3.73,3.73,4.32,5.18,4.73,5.58,5.78,6.40,6.53健康人:1.67,1.98,1.98,2.33,2.34,2.50,3.60,3.73,4.14,4.17,4.57,4.82,5.78問該地區(qū)急性克山病患者與健康人的血鱗值是否不同?三、配對樣本T檢驗配對樣本T檢驗(PairedSampleTtest)用于檢驗兩個相關(guān)的樣本是否來自具有相同均值的總體。這種相關(guān)的或配對的樣本常常來自這樣的實驗結(jié)果,在實驗中被觀測對象在實驗前后均被觀測。兩個變量可以是beforeafter,配對分析的測度也不是必須來自同一個觀測對象。一對可以兩者組合而成。

進行配對樣本的T檢驗要求被比較的兩個樣本有配對關(guān)系。要求兩個樣本均來自正態(tài)總體。而且均值是對于檢驗有意義的描述統(tǒng)計量。均值的配對比較是比較常見(見以下幾個例子)。同一窩實驗用白鼠按性別、體重相同的配對,再隨機分到實驗組和對照組,分別喂加入海藻的飼料和普通飼料,三個月后,分別將每對白鼠置于水中,測量其到溺死前的游泳時間。比較兩組白鼠游泳時間均值,從而比較兩種飼料對抗疲勞的作用。在研究人體各部位體溫是否有差別,一個人的兩個部位的溫度構(gòu)成一對數(shù)據(jù)。測量若干人的同樣兩個部位的溫度數(shù)據(jù),可以比較這兩個部位平均溫度是否有顯著性差異。使用配對t檢驗。

同一組高血壓病人在進行體育療法前后,測量其血壓。每個病人在體育療法前后的血壓測量值構(gòu)成觀測量對。可以求這組病人體育療法前后血壓平均值。進行配對T檢驗,分析體育療法對降血壓的療效。配對樣本T檢驗實際上是先求出每對測量值之差值,對差值求均值,檢驗配對變量均值之間差異是否顯著。其實質(zhì)檢驗的假設(shè)實際上是差值的均值與零均值之間差異的顯著性。如果差值均值與零均值無顯著性差異說明配對變量均值之間無顯著性差異。配對樣本T檢驗與獨立樣本T檢驗均使用T-TEST過程,但調(diào)用該過程的菜單不同,對數(shù)據(jù)文件結(jié)構(gòu)的要求不同和所使用的命令語句也有區(qū)別。進行配對樣本T檢驗的數(shù)據(jù)文件中一對數(shù)據(jù)必須作為同一個觀測量中兩個變量值。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論