版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 第二章 均值向量和協(xié)方差陣的檢驗(yàn) 假設(shè)檢驗(yàn)的基本問(wèn)題1、假設(shè)檢驗(yàn)的基本原理 小概率事件原理小概率思想是指小概率事件(P0.01或P0,檢驗(yàn)水準(zhǔn)為單側(cè)0.05。b. 計(jì)算統(tǒng)計(jì)量 進(jìn)行樣本均數(shù)與總體均數(shù)比較的t檢驗(yàn)時(shí)t值為樣本均數(shù)與總體均數(shù)差值的絕對(duì)值除以標(biāo)準(zhǔn)誤的商,其中標(biāo)準(zhǔn)誤為標(biāo)準(zhǔn)差除以樣本含量算術(shù)平方根的商3. 確定概率,作出判斷 以自由度v(樣本含量n減1)查t界值表,0.025P2或10或d0,即差值的總體均數(shù)不為“0”,檢驗(yàn)水平為 。B. 計(jì)算統(tǒng)計(jì)量 進(jìn)行配對(duì)設(shè)計(jì)t檢驗(yàn)時(shí) t值為差值均數(shù)與0之差的絕對(duì)值除以差值標(biāo)準(zhǔn)誤的商,其中差值標(biāo)準(zhǔn)誤為差值標(biāo)準(zhǔn)差除以樣本含量算術(shù)平方根的商。C. 確定
2、概率,作出判斷 以自由度v(對(duì)子數(shù)減1)查t界值表,若P=,則還不能拒絕H0。例4:要比較50個(gè)人在減肥前和減肥后的重量。這樣就有了兩個(gè)樣本,每個(gè)都有50個(gè)數(shù)目。這里不能用前面的獨(dú)立樣本均值差的檢驗(yàn);這是因?yàn)閮蓚€(gè)樣本并不獨(dú)立。每一個(gè)人減肥后的重量都和自己減肥前的重量有關(guān)。但不同人之間卻是獨(dú)立的。令減肥前的重量均值為 1 ,而減肥后的均值為2 ;這樣所要進(jìn)行的檢驗(yàn)為: H0: 12 H1: 1大于2也可以把兩個(gè)樣本中配對(duì)的觀測(cè)值逐個(gè)相減,形成一個(gè)由獨(dú)立觀測(cè)值組成的樣本;然后用單樣本檢驗(yàn)方法,看其均值是否為零。在相減之后公式和單樣本均值檢驗(yàn)無(wú)異。 用 SPSS 處理數(shù)據(jù): Spss 選項(xiàng):Anal
3、yzeCompare Means Paired-Samples T Test SPSS輸出結(jié)果 : Spss 輸出結(jié)果得到雙尾 p- 值為 0.002 ,這里的單尾 p- 值于是為 0.001 因此減肥后和減肥前相比,平均重量顯著要輕。 (4)多元、多總體的均值檢驗(yàn)?:各總體均值是否相等?各個(gè)總體之間的差異表現(xiàn)在哪兒?是由什么引起的?能否繼續(xù)采用前面的3種類型所選用的t檢驗(yàn)?為什么? 不能,因?yàn)椋?a、計(jì)算工作量大 變量或總體兩兩檢驗(yàn) b、估計(jì)的精確性和檢驗(yàn)的靈敏度降低如何解決?方差分析( analysis of variance , ANOVA )一、方差分析的基本思想1、定義 方差分析又稱
4、變異數(shù)分析或F檢驗(yàn),其目的是推斷兩組或多組資料的總體均數(shù)是否相同,檢驗(yàn)兩個(gè)或多個(gè)樣本均數(shù)的差異是否有統(tǒng)計(jì)學(xué)意義。2、了解方差分析中幾個(gè)重要概念:(1)觀測(cè)因素或稱為觀測(cè)變量 如:考察農(nóng)作物產(chǎn)量的影響因素。農(nóng)作物產(chǎn)量就是觀測(cè)變量。(2)控制因素或稱控制變量 進(jìn)行試驗(yàn)(實(shí)驗(yàn))時(shí),我們稱可控制的試驗(yàn)條件為因素(Factor),因素變化的各個(gè)等級(jí)為水平(Level)。 影響農(nóng)作物產(chǎn)量的因素,如品種、施肥量、土壤等。 如果在試驗(yàn)中只有一個(gè)因素在變化,其他可控制的條件不變,稱它為單因素試驗(yàn); 若試驗(yàn)中變化的因素有兩個(gè)或兩個(gè)以上,則稱為雙因素或多因素試驗(yàn) 。 方差分析就是從觀測(cè)變量的方差入手,研究諸多控制變
5、量(因素)中哪些變量是對(duì)觀測(cè)變量有顯著影響的變量3、方差分析的基本原理 設(shè)有r個(gè)總體,各總體分別服從 ,假定各總體方差相等。現(xiàn)從各總體隨機(jī)抽取樣本。透過(guò)各總體的樣本數(shù)據(jù)推斷r個(gè)總體的均值是否相等? :至少有一組數(shù)據(jù)的平均值與其它組的平均值有顯著性差異。 分析的思路:用離差平方和(SS)描述所有樣本總的變異情況,將總變異分為兩個(gè)來(lái)源: (1)組內(nèi)變動(dòng)(within groups),代表本組內(nèi)各樣本與該組平均值的離散程度,即水平內(nèi)部(組內(nèi))方差 (2)組間變動(dòng)(between groups),代表各組平均值關(guān)于總平均值的離散程度。即水平之間(組間)方差即:SS總=SS組間+SS組內(nèi)消除各組樣本數(shù)不
6、同的影響-離差平方和除以自由度(即均方差)。從而構(gòu)造統(tǒng)計(jì)量:方差分析的基本思想就是通過(guò)組內(nèi)方差與組間方差的比值構(gòu)造的F統(tǒng)計(jì)量,將其與給定顯著性水平、自由度下的F值相對(duì)比,判定各組均數(shù)間的差異有無(wú)統(tǒng)計(jì)學(xué)意義。零假設(shè)否定域:例1:某公司計(jì)劃購(gòu)買一臺(tái)計(jì)算機(jī)。為了選擇優(yōu)良型號(hào)的計(jì)算機(jī)以減少日后的維修問(wèn)題,他們對(duì)6種型號(hào)的計(jì)算機(jī)作了初步調(diào)查,每種型號(hào)調(diào)查4臺(tái),結(jié)果列于表1。這些結(jié)果表示每個(gè)型號(hào)的計(jì)算機(jī)上個(gè)月維修的小時(shí)數(shù)。試問(wèn)由此結(jié)果能否判定由于計(jì)算機(jī)型號(hào)不同而造成它們?cè)诰S修時(shí)間方面有顯著差異? 研究的指標(biāo)(即觀測(cè)變量)就是維修時(shí)間,記作Y;控制因素是計(jì)算機(jī)的型號(hào),分為6個(gè)水平即A,B,C,D,E,F,把
7、每個(gè)水平所對(duì)應(yīng)的指標(biāo)看成一個(gè)總體。現(xiàn)在的試驗(yàn)就是進(jìn)行調(diào)查,每種型號(hào)調(diào)查4臺(tái),相當(dāng)于每個(gè)總體中抽取一個(gè)容量為4的樣本,得到的數(shù)據(jù)記作 即為表1數(shù)據(jù)。 該例考察的問(wèn)題是:不同型號(hào)的計(jì)算機(jī)的平均維修時(shí)間是相同?首先計(jì)算各樣本平均數(shù)若按兩個(gè)總體平均值比較的檢驗(yàn)法,把樣本平均數(shù)兩兩組成對(duì): 將這15對(duì)平均數(shù)一一進(jìn)行比較檢驗(yàn)計(jì)算工作量太大即使每對(duì)都進(jìn)行了比較,并且都以0.95的置信度得出每對(duì)均值都相等的結(jié)論,但是由此要得出這6個(gè)型號(hào)的維修時(shí)間的均值都相等這一結(jié)論的置信度僅是 估計(jì)的精確性和檢驗(yàn)的靈敏度降低其他方法?按照統(tǒng)計(jì)假設(shè)檢驗(yàn)的原理,在本例中原假設(shè)是:不同型號(hào)的計(jì)算機(jī)的平均維修時(shí)間是相同的。如果這個(gè)原
8、假設(shè)為真,那么各型號(hào)的樣本平均數(shù)之間的變異程度就不可能太大。因此,我們考慮應(yīng)該使用方差或觀測(cè)值的偏差平方和的概念來(lái)進(jìn)行檢驗(yàn)。 方差分析的基本原理就是按照上述統(tǒng)計(jì)思想進(jìn)行的,即:(1)將數(shù)據(jù)總的偏差平方和按照產(chǎn)生的原因分解成由因素的水平不同引起的偏差平方和以及由試驗(yàn)誤差引起的偏差平方和兩部分之和: (總的偏差平方和)=(由因素水平引起的偏差平方和)+(試驗(yàn)誤差平方和) (2)上式右邊兩個(gè)平方和的相對(duì)大小可以說(shuō)明因素的不同水平是否使得各平均值(各型號(hào)的平均維修時(shí)間)產(chǎn)生顯著性差異,為此進(jìn)行適當(dāng)?shù)慕y(tǒng)計(jì)假設(shè)檢驗(yàn)。 例2 SIM手機(jī)高、中、低三種收入水平被調(diào)查者的用戶滿意度是否有顯著性差異 即:研究被調(diào)
9、查者的收入水平是否會(huì)影響其對(duì)SIM手機(jī)的滿意程度。SPSS處理:Analyze Compare Mean One-Way ANOVA 結(jié)果如下:以上是一元方差分析統(tǒng)計(jì)量,多元方差分析統(tǒng)計(jì)量?書27頁(yè)多元的均值向量檢驗(yàn)?例5: 調(diào)查某中學(xué)同年級(jí)22名男女生, 測(cè)量其身高(cm)、體重(kg)和胸圍(cm),數(shù)據(jù)見表。試檢驗(yàn)該中學(xué)全體男女生的身體發(fā)育狀況有無(wú)差別。某中學(xué)22名男、女生身體測(cè)量資料 男 生 女 生 編號(hào) 身高 體重 胸圍 編號(hào) 身高 體重 胸圍 1 171 58.5 81.0 1 152 44.8 74 2 175 65 87 2 153 46.5 80 3 159 38 71 3
10、158 48.5 73.5 4 155.3 45 74 4 150 50.5 87 5 152 35 63 5 144 36.3 68 6 158.3 44.5 75 6 160.5 54.7 86 7 154.8 44.5 74 7 158 49 84 8 164 51 72 8 154 50.8 76 9 165.2 55 79 9 153 40 70 10 164.5 46 71 10 159.6 52 76 11 159.1 48 72.5 12 164.2 46.5 73一元方差分析的結(jié)果 身高 體重 胸圍 組別 平均值 標(biāo)準(zhǔn)差 平均值 標(biāo)準(zhǔn)差 平均值 標(biāo)準(zhǔn)差 男 161.9 6.8
11、 48.1 8.3 74.4 5.9 女 154.2 5.0 47.3 5.6 77.4 6.6 F值 8.7* 0.1 1.3 * P0.01從表可以看出,該校男、女生的身高差異有顯著性意義,而體重、胸圍差異無(wú)顯著性意義。那么, 該年級(jí)全體男女生的身體發(fā)育狀況有無(wú)差別,我們不能得到一個(gè)明確的結(jié)論。多元方差分析(操作參見書例2.1,第36頁(yè)):SPSS 選項(xiàng): Analyze General Linear Model Multivariate 可用男、女生的身高、體重、胸圍組成的樣本均數(shù)向量推論該年級(jí)男、女生身體發(fā)育指標(biāo)的總體均數(shù)向量1和2相等與否, 得到: F=8.8622,P=0.0008
12、。拒絕該年級(jí)男女生身體發(fā)育指標(biāo)的總體均數(shù)向量相等的假設(shè),從而可認(rèn)為該校男女生身體發(fā)育狀況不同。 4、方差分析的應(yīng)用條件 (1)可比性,若資料中各組均數(shù)本身不具可比性則不適用方差分析。 (2)正態(tài)性,各組的觀察數(shù)據(jù),是從服從正態(tài)分布的總體中隨機(jī)抽取的樣本。即偏態(tài)分布資料不適用方差分析。對(duì)偏態(tài)分布的資料應(yīng)考慮用對(duì)數(shù)變換、平方根變換、倒數(shù)變換、平方根反正弦變換等變量變換方法變?yōu)檎龖B(tài)或接近正態(tài)后再進(jìn)行方差分析。(3)方差齊性,各組的觀察數(shù)據(jù),是從具有相同方差的相互獨(dú)立的總體中抽取得到的。即若組間方差不齊則不適用方差分析。二、方差分析的內(nèi)容1、類型: 依據(jù)涉及的分析變量多少分為:一元方差分析、多元方差分
13、析 依據(jù)對(duì)分析變量的影響因素的數(shù)量分為:?jiǎn)我蛩胤讲罘治觥⒍嘁蛩胤讲罘治?2、分析步驟: (1)建立檢驗(yàn)假設(shè); H0:多個(gè)樣本總體均數(shù)相等。 H1:多個(gè)樣本總體均數(shù)不相等或不全等。(2)確定檢驗(yàn)統(tǒng)計(jì)量;(3)給定顯著水平;(3)計(jì)算統(tǒng)計(jì)量、確定P值并作出推斷結(jié)果。單因素方差分析一、單因素方差分析概念: 分析某一個(gè)因素A的不同水平是否對(duì)觀測(cè)變量Y產(chǎn)生了顯著影響。例:某飲料生產(chǎn)企業(yè)研制出一種新型飲料. 飲料的顏色共有四種 : 橘黃色、粉色、綠色和無(wú)色透明。這四種飲料的營(yíng)養(yǎng)含量、味道、價(jià)格、包裝等可能影響銷售量的因素全部相同?,F(xiàn)從地理位置相似、經(jīng)營(yíng)規(guī)模相仿的五家超市上收集了該種飲料的銷售情況。 問(wèn)題:
14、飲料的顏色是否對(duì)銷售量產(chǎn)生影響? 其中:飲料的顏色即是影響因素(控制因素、變量) 銷售量是觀測(cè)變量。在其他條件相同的情況下,上述問(wèn)題就歸結(jié)為一個(gè)檢驗(yàn)問(wèn)題,即:差異的產(chǎn)生來(lái)自兩個(gè)方面: 一方面是由不同顏色的差異造成的,既不同的飲料顏色對(duì)銷售量產(chǎn)生了影響。用組間方差表示 另一方面是由于抽選樣本的隨機(jī)性而產(chǎn)生的差異,即各顏色內(nèi)的隨機(jī)誤差,如相同顏色的飲料在不同的商場(chǎng)銷售量也不同。用組內(nèi)方差表示。Spss 選項(xiàng): Analyze Compare Mean One-Way ANOVA (一元單因素方差分析)SPSS 輸出結(jié)果:可看出F值為10.486,P值是0.000。推斷零假設(shè)不成立。表明顏色不同飲料
15、的銷量也不同。 如何用SPSS對(duì)方差分析的方差相等要求進(jìn)行判定?(因正態(tài)分布的要求不是很嚴(yán)格 ,分析忽略)Spss 選項(xiàng):在 One-Way ANOVA 中選擇Option ,選定 Homogeneity-of variance進(jìn)一步考察: 究竟是哪一個(gè)水平對(duì)觀察變量產(chǎn)生了顯著影響,即那種顏色的飲料對(duì)銷售量有顯著影響?運(yùn)用單因素方差分析的多重比較檢驗(yàn)SPSS窗口中Post Hoc選項(xiàng)進(jìn)行選擇。 例:考察漢族、藏族、蒙古族三個(gè)民族的人均收入水平 INC、15歲及以上人口上學(xué)或畢業(yè)比例 EDU是否有差異。(多元單因素分析問(wèn)題)需考察的影響因素為:民族觀測(cè)變量為:INC和EDU SPSS處理:Ana
16、lyze General Linear Model Multivariate 人均收入、教育比例Dependent Variables 民族 Fixed Factors 結(jié)果:結(jié)果分析:三個(gè)民族的人均收入、受教育比例有顯著差異。雙因素、多因素方差分析一、基本思想研究?jī)蓚€(gè)或兩個(gè)以上因素(控制變量)是否對(duì)觀測(cè)變量產(chǎn)生顯著性影響。如:飲料銷售,除了關(guān)心飲料顏色之外,還想了解銷售地區(qū)、銷售策略是否影響銷售量?若把飲料的顏色看作影響銷售量的因素A,飲料的銷售地區(qū)看作影響因素B,銷售策略看作影響因素C。對(duì)因素A和因素B同時(shí)進(jìn)行分析,就屬于雙因素方差分析。對(duì)因素A、B以及C (或更多因素)同時(shí)進(jìn)行分析,就屬
17、多因素方差分析。 雙(多)因素方差分析是對(duì)影響因素進(jìn)行檢驗(yàn),究竟是一個(gè)因素在起作用,還是兩個(gè)(多個(gè))因素都起作用,或是兩個(gè)(多個(gè))因素的影響都不顯著。 二、分類:雙(多)因素方差分析有兩種類型:1、無(wú)交互作用的雙(多)因素方差分析,它假定因素A和因素B的效應(yīng)是相互獨(dú)立的,不存在相互關(guān)系;2、有交互作用的雙(多)因素方差分析,它假定因素A和因素B的結(jié)合會(huì)產(chǎn)生出一種新的效應(yīng)(相互影響)。例如,若假定不同地區(qū)的消費(fèi)者對(duì)某種顏色有與其他地區(qū)消費(fèi)者不同的特殊偏愛,這就是兩個(gè)因素結(jié)合后產(chǎn)生的新效應(yīng),屬于有交互作用的背景;否則,就是無(wú)交互作用的背景。 三、以雙因素為例:FA=MSA/MSE FB=MSB/M
18、SE 例4 某商品有五種不同的包裝方式(因素A),在五個(gè)不同地區(qū)銷售(因素B),現(xiàn)從每個(gè)地區(qū)隨機(jī)抽取一個(gè)規(guī)模相同的超級(jí)市場(chǎng),得到該商品不同包裝的銷售資料如下表。 表4 某種商品不同地區(qū)不同包裝的銷售資料 檢驗(yàn)包裝方式和銷售地區(qū)對(duì)該商品銷售是否有顯著性影響?(=0.05) (1)建立假設(shè)對(duì)因素A :對(duì)因素B:(2)計(jì)算統(tǒng)計(jì)量因素A的列均值分別為:因素B的行均值分別為:總均值=15.04SST=(20-15.04)2 +(10-15.04)2=880.96 SSA=5(21.6-15.04)2 +5(11.6-15.04)2=335.36 SSB=3(15.2-15.04)2 +3(16.8-15
19、.04)2=199.36SSE=880.96-335.36-199.36=346.24 (3)統(tǒng)計(jì)決策對(duì)于因素A,因?yàn)镕A=1.903F-crit;故拒絕H0,接受H1,說(shuō)明不同的地區(qū)對(duì)該商品的銷售產(chǎn)生不同的影響。 SPSS處理(一元多因素方差分析): Analyze General Linear Model Univariate (1)無(wú)交互效應(yīng)(2)有交互效應(yīng)例5 職業(yè)、年齡是否是居民儲(chǔ)蓄(存取款額、收入水平)的影響因素SPSS處理(多元多因素方差分析): Analyze General Linear Model Multivariate (1)有交互作用(2)無(wú)交互作用2.2 協(xié)方差陣的檢驗(yàn)(1)檢驗(yàn)(2)檢驗(yàn)SPSS處理:參見均值檢驗(yàn)2.3 形象分析(Pro)一、問(wèn)題提出 設(shè)從總體 ,中各自獨(dú)立地抽取樣本 和 , 。他們的均值向量差為:例 在愛情和婚姻的調(diào)查中,對(duì)一個(gè)由若干名丈夫和妻子組成的樣本進(jìn)行了問(wèn)卷調(diào)查,請(qǐng)他們回答以下幾個(gè)問(wèn)題:(1)你對(duì)伴侶的愛情的“熱度”感覺如何?(2)伴侶對(duì)你的愛情的“熱度”感覺如何?(3)你對(duì)伴侶的愛情的“可結(jié)伴”水平感覺如何?(4)伴侶對(duì)你的愛情的“可結(jié)伴”水平感覺如何? 回答采用沒有、很小、有些、很大和非常大5個(gè)等級(jí),得到結(jié)果如表。丈夫?qū)ζ拮悠拮訉?duì)丈夫 X1 X2 X3 X4 X1 X2
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 45168-2024保健食品中吡啶甲酸鉻的測(cè)定
- A證(企業(yè)負(fù)責(zé)人)-安全員A證考試模擬題練習(xí)
- 滬科版九年級(jí)物理全一冊(cè)《第十七章從指南針到磁浮列車》章末測(cè)試卷含答案
- 國(guó)企工會(huì)換屆上的領(lǐng)導(dǎo)講話-凝聚奮進(jìn)力量 彰顯工會(huì)作為
- 科技孵化器入駐企業(yè)潛力篩選
- 電力系統(tǒng)設(shè)備故障預(yù)防與處理流程
- 高一化學(xué)二第三章有機(jī)化合物練習(xí)
- 2024屆安徽省示范高中培優(yōu)聯(lián)盟高考化學(xué)三模試卷含解析
- 2024高中地理第3章地理信息技術(shù)應(yīng)用第2節(jié)遙感技術(shù)及其應(yīng)用學(xué)案湘教版必修3
- 2024高中物理第二章交變電流第二節(jié)交變電流的描述達(dá)標(biāo)作業(yè)含解析粵教版選修3-2
- 電梯維修協(xié)議書
- 礦工睡崗檢查書
- 仁恒江灣城修建幕墻工程監(jiān)理實(shí)施細(xì)則
- 廣東省佛山南海區(qū)四校聯(lián)考2023屆中考試題猜想數(shù)學(xué)試卷含解析
- 2023年江蘇蘇州工業(yè)園區(qū)管委會(huì)招聘筆試參考題庫(kù)附帶答案詳解
- GB/T 10752-2005船用鋼管對(duì)焊接頭
- 酒店婚宴銷售年度工作計(jì)劃4篇
- 健康教育工作考核記錄表
- 裝飾工程施工技術(shù)ppt課件(完整版)
- SJG 05-2020 基坑支護(hù)技術(shù)標(biāo)準(zhǔn)-高清現(xiàn)行
- 汽車維修價(jià)格表
評(píng)論
0/150
提交評(píng)論