第十章 卡方檢驗(yàn)_第1頁
第十章 卡方檢驗(yàn)_第2頁
第十章 卡方檢驗(yàn)_第3頁
第十章 卡方檢驗(yàn)_第4頁
第十章 卡方檢驗(yàn)_第5頁
已閱讀5頁,還剩71頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第十章卡方檢驗(yàn)李金德思考:例1:隨機(jī)抽取60名學(xué)生,詢問他們?cè)诟咧惺欠裥枰睦矸挚?,贊成分科?9人,反對(duì)分科的21人,問他們對(duì)分科的意見是否有顯著差異?39大于21,所以學(xué)校決定不要分科。這樣做可以嗎?例2:例某企業(yè)生產(chǎn)三種類型的手機(jī):A類型、B類型、C類型。在一次市場(chǎng)調(diào)查中,公司市場(chǎng)研究小組提出了男女使用者對(duì)于三種手機(jī)類型偏好是否有差異的問題。有的人因此用t檢驗(yàn)檢驗(yàn)兩者的差異,這樣做行嗎?ABC男204020女303010第一節(jié)檢驗(yàn)的原理一、檢驗(yàn)的假設(shè)(一)分類相互排斥,互不包容檢驗(yàn)中的分類必須相互排斥,這樣每一個(gè)觀測(cè)值就會(huì)被劃分到一個(gè)類別或另一個(gè)類別之中。此外,分類必須互不包容,這樣,就不會(huì)出現(xiàn)某一觀測(cè)值同時(shí)劃分到更多的類別當(dāng)中去的情況。(二)觀測(cè)值相互獨(dú)立各個(gè)被試的觀測(cè)值之間彼此獨(dú)立,這是最基本的一個(gè)假定,如一個(gè)被試對(duì)某一品牌的選擇對(duì)另一個(gè)被試的選擇沒有影響。當(dāng)同一被試被劃分到一個(gè)以上的類別中時(shí),常常會(huì)違反這個(gè)假定。

注意:當(dāng)討論列聯(lián)表時(shí),獨(dú)立性假定是指變量之間的相互獨(dú)立。這種情況下,這種變量的獨(dú)立性正在被檢測(cè)。而觀測(cè)值的獨(dú)立性則是預(yù)先的一個(gè)假定。(三)期望次數(shù)的大小有規(guī)定為了努力使分布成為值合理準(zhǔn)確的近似估計(jì),每一個(gè)單元格中的期望次數(shù)應(yīng)該至少在5以上。一些更加謹(jǐn)慎的統(tǒng)計(jì)學(xué)家提出了更嚴(yán)格的標(biāo)準(zhǔn),當(dāng)自由度等于1時(shí),在進(jìn)行檢驗(yàn)時(shí),每一個(gè)單元格的期望次數(shù)至少不應(yīng)低于10,這樣才能保證檢驗(yàn)的準(zhǔn)確性。另外,在許多分類研究中會(huì)存在這樣一種情況,如自由度很大,有幾個(gè)類別的理論次數(shù)雖然很小,但在給以接受的標(biāo)準(zhǔn)范圍內(nèi),只有一個(gè)類別的理論次數(shù)低于1。此時(shí),一個(gè)簡(jiǎn)單的處理原則是設(shè)法使每一個(gè)類別的理論次數(shù)都不要低于1,分類中不超過20%的類別的理論次數(shù)可以小于5。在理論次數(shù)較小的特殊的四格表中,應(yīng)運(yùn)用一個(gè)精確的多項(xiàng)檢驗(yàn)來避免使用近似的檢驗(yàn)。

二、檢驗(yàn)的類別(一)配合度檢驗(yàn)

配合度檢驗(yàn)主要用來檢驗(yàn)一個(gè)因素多項(xiàng)分類的實(shí)際觀察數(shù)與某理論次數(shù)是否接近。這種檢驗(yàn)方法有時(shí)也稱為無差假說檢驗(yàn)。當(dāng)對(duì)連續(xù)數(shù)據(jù)的正態(tài)性進(jìn)行檢驗(yàn)時(shí),這種檢驗(yàn)又可稱為正態(tài)吻合性檢驗(yàn)。

(二)獨(dú)立性檢驗(yàn)

獨(dú)立性檢驗(yàn)是用來檢驗(yàn)兩個(gè)或兩個(gè)以上因素各種分類之間是否有關(guān)聯(lián)或是否具有獨(dú)立性的問題。這種類型的檢驗(yàn)適用于探討兩個(gè)變量之間是否具有關(guān)聯(lián)(非獨(dú)立)或無關(guān)(獨(dú)立),如果再加入另一個(gè)變量的影響,即探討三個(gè)變量之間關(guān)系時(shí),就必須使用多維列聯(lián)表分析方法。(三)同質(zhì)性檢驗(yàn)

同質(zhì)性檢驗(yàn)的主要目的在于檢定不同人群母總體在某一個(gè)變量的反應(yīng)是否具有顯著差異。當(dāng)用同質(zhì)性檢驗(yàn)檢測(cè)雙樣本在單一變量的分布情形,如果兩樣本沒有差異,就可以說兩個(gè)母總體是同質(zhì)的,反之,則說這兩個(gè)母總體是異質(zhì)的。

三、檢驗(yàn)的基本公式

檢驗(yàn)的統(tǒng)計(jì)原理,是比較觀察值與理論值的差別:1.如果兩者的差異越小,檢驗(yàn)的結(jié)果越不容易達(dá)到顯著性水平;2.兩者的差異越大,檢驗(yàn)的結(jié)果越可能達(dá)到顯著性水平,就可以下結(jié)論拒絕虛無假設(shè)而接受備擇假設(shè)?;竟饺缦拢?/p>

其中表示實(shí)際觀察次數(shù),表示某理論次數(shù)。要求:≥5四、小期望次數(shù)的連續(xù)性校正運(yùn)用檢驗(yàn)時(shí),有一個(gè)特殊的要求,單元格的理論次數(shù)不得小于5,小于5時(shí)可能違反統(tǒng)計(jì)基本假設(shè),導(dǎo)致統(tǒng)計(jì)檢驗(yàn)高估的情形出現(xiàn)。通常需要有80%以上的單元格理論值要大于5,否則檢驗(yàn)的結(jié)果偏差非常明顯。當(dāng)單元格的人數(shù)過少時(shí),處理的方法有四種:?jiǎn)卧窈喜⒎ㄔ黾訕颖緮?shù)去除樣本法使用校正公式第二節(jié)配合度檢驗(yàn)配合度檢驗(yàn)(goodnessoffittest)主要用于檢驗(yàn)單一變量的實(shí)際觀察次數(shù)分布與某理論次數(shù)是否有差別。由于它檢驗(yàn)的內(nèi)容僅涉及一個(gè)因素多項(xiàng)分類的計(jì)數(shù)資料,故可以說是一種單因素檢驗(yàn)(One-waytest)。一、配合度檢驗(yàn)的一般問題(一)統(tǒng)計(jì)假設(shè)

統(tǒng)計(jì)假設(shè)如下:基本公式:

(二)自由度的確定

自由度確定的一般原則是:以相互獨(dú)立的類別數(shù)k(或C)減去所受的限制數(shù),即在各種適合性檢驗(yàn)中,如果理論次數(shù)只受到總和的限制,即受的限制,則自由度為在正態(tài)分布的適合性檢驗(yàn),受到三個(gè)條件的限制,其自由度為

(三)理論次數(shù)的計(jì)算規(guī)則

數(shù)據(jù)分布以其理論概率為依據(jù),這時(shí)的理論次數(shù)等于總次數(shù)乘以某種屬性出現(xiàn)的概率,即

理論次數(shù)的計(jì)算,一般是根據(jù)某種理論,按一定的概率通過樣本即實(shí)際觀察次數(shù)計(jì)算。某種理論有經(jīng)驗(yàn)概率,也有理論概率,如二項(xiàng)分布、正態(tài)分布等。

二、配合度檢驗(yàn)的應(yīng)用(一)檢驗(yàn)無差假說

無差假說,是指各項(xiàng)分類的實(shí)計(jì)數(shù)之間沒有差異,也就是假設(shè)各項(xiàng)分類之間的機(jī)會(huì)相等,或概率相等,因此理論次數(shù)完全按概率相等的條件計(jì)算。即:

理論次數(shù)=總數(shù)×例10-1:隨機(jī)抽取60名學(xué)生,詢問他們?cè)诟咧惺欠裥枰睦矸挚?,贊成分科?9人,反對(duì)分科的21人,問他們對(duì)分科的意見是否有顯著差異?(p298)

解:此題只有兩項(xiàng)分類。假設(shè)兩項(xiàng)分類的實(shí)計(jì)數(shù)相等或無差別,其各項(xiàng)實(shí)計(jì)數(shù)的概率應(yīng)相同,即p=q=0.5。因此,檢驗(yàn)的問題“對(duì)分科的意見是否有顯著差異”實(shí)際上是指每種態(tài)度的實(shí)計(jì)數(shù)與理論次數(shù)差異是否顯著,因各項(xiàng)的理論次數(shù)項(xiàng)數(shù)相同,故可理解為對(duì)分科的態(tài)度是否一樣或是否有差異。故:1)建立假設(shè)3)統(tǒng)計(jì)決策例10-2:某項(xiàng)民意測(cè)驗(yàn),答案有同意、不置可否、不同意三種。調(diào)查了48人,結(jié)果同意的24人,不置可否的12人,不同意的12人。問持這三種意見的人數(shù)是否有顯著不同?(p299)

解:此題為檢驗(yàn)無差假說,已知分類的項(xiàng)數(shù)為三,故各項(xiàng)分類假設(shè)實(shí)計(jì)數(shù)相等。所以

1)建立假設(shè)

2)計(jì)算統(tǒng)計(jì)量

3)進(jìn)行統(tǒng)計(jì)決策

查表,當(dāng)時(shí),因?yàn)?,所以。達(dá)到顯著性水平,拒絕原假設(shè)。說明三種態(tài)度有顯著差異。

(二)檢驗(yàn)假設(shè)分布的概率

假設(shè)某因素各項(xiàng)分類的次數(shù)分布為正態(tài),檢驗(yàn)實(shí)計(jì)數(shù)與理論上期望的結(jié)果之間是否有差異。因?yàn)橐鸭俣ㄋ^察的資料是按正態(tài)分布的,故其理論次數(shù)的計(jì)算應(yīng)按正態(tài)分布概率,分別計(jì)算各項(xiàng)分類的理論次數(shù)。具體方法是先按正態(tài)分布理論計(jì)算各項(xiàng)分類應(yīng)有的概率再乘以總數(shù),便得到各項(xiàng)分類的理論次數(shù)。

如果不是事先假定所觀察的資料為正態(tài)分布而是其他分布,如二項(xiàng)分布、泊松分布等,其概率應(yīng)按各所假定的分布計(jì)算。事先假定的分布不是理論分布而是經(jīng)驗(yàn)分布,亦可按此經(jīng)驗(yàn)分布計(jì)算概率,在乘以總數(shù)便可得到理論次數(shù),從而進(jìn)一步檢驗(yàn)假設(shè)分布與實(shí)計(jì)數(shù)的分布之間,亦即實(shí)計(jì)數(shù)與理論次數(shù)之間差異是否顯著。例10-3:某班有學(xué)生50人,體檢結(jié)果按一定標(biāo)準(zhǔn)劃分為甲乙丙三類,其中甲類16人,乙類24人,丙類10人,問該班學(xué)生的身體狀況是否符合正態(tài)分布?(299)解:該題中的理論次數(shù)應(yīng)按假設(shè)的正態(tài)分布概率計(jì)算。按正態(tài)分布,就可以認(rèn)為包括了全體,各等級(jí)所占的橫坐標(biāo)應(yīng)該相同(),故各類人數(shù)應(yīng)占的比率為:

答:可以說該班學(xué)生的身體狀態(tài)不符合正態(tài)分布,或者說該班學(xué)生身體狀況甲乙丙三類的人數(shù)分布與正態(tài)分布有顯著差異。2)計(jì)算統(tǒng)計(jì)量例10-4:根據(jù)以往的經(jīng)驗(yàn),某校長(zhǎng)認(rèn)為高中生升學(xué)的男女比例為2:1,今年的升學(xué)情況是男生85人,女生35人,問今年升學(xué)的男女比例是否符合該校長(zhǎng)的經(jīng)驗(yàn)?(p300)解:此題是假設(shè)男女生升學(xué)的人數(shù)分布與校長(zhǎng)的經(jīng)驗(yàn)分布相同,故理論次數(shù)應(yīng)按經(jīng)驗(yàn)分布的概率計(jì)算。理論次數(shù)為:1)建立假設(shè)H0:男女升學(xué)比例符合校長(zhǎng)經(jīng)驗(yàn)H1:男女升學(xué)比例不符合校長(zhǎng)經(jīng)驗(yàn)

三、連續(xù)變量分布的吻合性檢驗(yàn)(自學(xué))復(fù)習(xí)1、什么是檢驗(yàn)2、檢驗(yàn)的步驟3、檢驗(yàn)的類別(第二節(jié))

目的:實(shí)際觀察頻數(shù)分布與理論頻數(shù)分布是否相一致,或者說有無顯著差異問題。包括:一個(gè)因素的多個(gè)分類多個(gè)因素的多個(gè)分類檢驗(yàn)統(tǒng)計(jì)量:應(yīng)用:計(jì)數(shù)數(shù)據(jù)返回

步驟(1)建立檢驗(yàn)假設(shè)

H0:fe-f0=0H1

:fe-f0≠0(2)求檢驗(yàn)統(tǒng)計(jì)量值(4)確定臨界值,進(jìn)行統(tǒng)計(jì)決策返回(3)確定自由度,顯著性水平=0.05

如果>0.05(df),則拒絕H0配合度檢驗(yàn):擬合優(yōu)度檢驗(yàn),重點(diǎn)考察一個(gè)觀測(cè)次數(shù)分布(實(shí)際頻數(shù))與理論預(yù)測(cè)次數(shù)分布(理論頻數(shù))之間的差異。適用于研究某總體的分布是否與某種分布相符合。如:課堂練習(xí)例某企業(yè)生產(chǎn)三種類型的手機(jī):A類型、B類型、C類型。在一次市場(chǎng)調(diào)查中,公司市場(chǎng)研究小組提出了男女使用者對(duì)于三種手機(jī)類型偏好是否有差異的問題。ABC男204020女303010問題:

手機(jī)偏好與使用者性別是否有關(guān)聯(lián)??jī)蓚€(gè)因素是否關(guān)聯(lián)第三節(jié)獨(dú)立性檢驗(yàn)

教學(xué)內(nèi)容一、獨(dú)立性檢驗(yàn)的一般問題與步驟1、幾個(gè)重要概念2、獨(dú)立性檢驗(yàn)的內(nèi)涵3、獨(dú)立性檢驗(yàn)的步驟四、獨(dú)立性檢驗(yàn)的兩種類別四格表獨(dú)立性檢驗(yàn)列聯(lián)表獨(dú)立性檢驗(yàn)五、列聯(lián)表獨(dú)立性檢驗(yàn)一、幾個(gè)重要概念1、列聯(lián)表定義:呈現(xiàn)兩個(gè)變量之間關(guān)系的表格記錄兩個(gè)變量不同水平的各種組合的被試頻數(shù)2、觀測(cè)頻數(shù)實(shí)際觀測(cè)到的頻次3、期望頻數(shù)假設(shè)兩個(gè)變量之間沒有任何聯(lián)系的情況下,我們所預(yù)期的各種變量組合應(yīng)有的頻次4、邊緣值列聯(lián)表中每一行和每一列的觀測(cè)頻數(shù)的總和返回橫標(biāo)目縱標(biāo)目表示變量X的r種水平表示變量Y的c種水平32列聯(lián)表單元有20名被試在性別變量上是“男性”,在偏愛的手機(jī)上是“A類型”返回ABC男204020女303010計(jì)算期望次數(shù)如果性別與偏好無關(guān),說明表中150個(gè)被試,8/15是男性,7/15是女性,則喜愛A類型的50人中,有8/15是男性,7/15是女性邊緣值邊緣值fe1=(5080)/150=26.67fe2=(7080)/150=37.3fe3=(3080)/150=16fe4=(5070)/150=23.33fe5=(7070)/150=32.7fe6=(3070)/150=14返回二、獨(dú)立性檢驗(yàn)的內(nèi)涵獨(dú)立性檢驗(yàn)表示——對(duì)于x的每個(gè)值,y值的次數(shù)分布是否有差異。如果對(duì)于x的每個(gè)值,y值的次數(shù)分布一樣,則表示:x變量和y變量毫無關(guān)系。如果對(duì)于x的每個(gè)值,y值的次數(shù)分布有差異,則表示:x變量和y變量有關(guān)聯(lián),或說兩變量存在相關(guān)。所以,獨(dú)立性檢驗(yàn)也是對(duì)兩個(gè)變量之間相關(guān)程度的一種檢驗(yàn)。如果性別與手機(jī)類型偏好之間無聯(lián)系,則表示不論男女,對(duì)這些手機(jī)都具有一致的偏好。那么,每個(gè)觀測(cè)頻次就應(yīng)該與相應(yīng)的期望頻次相同,這時(shí)卡方值為0。如果性別與手機(jī)類型偏好之間聯(lián)系越緊密,則表示較多的男性喜歡某種類型,而較多的女性喜歡其他類別的手機(jī)。則觀測(cè)頻次與相應(yīng)的期望頻次的差異越大。兩個(gè)變量之間聯(lián)系越緊密,觀測(cè)頻次與相應(yīng)期望頻次的差異就越大,這時(shí)卡方值就越大。返回例某企業(yè)生產(chǎn)三種類型的手機(jī):A類型、B類型、C類型。在一次市場(chǎng)調(diào)查中,公司市場(chǎng)研究小組提出了男女使用者對(duì)于三種手機(jī)類型偏好是否有差異的問題。ABC

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論