獨(dú)立性檢驗(yàn)課件_第1頁
獨(dú)立性檢驗(yàn)課件_第2頁
獨(dú)立性檢驗(yàn)課件_第3頁
獨(dú)立性檢驗(yàn)課件_第4頁
獨(dú)立性檢驗(yàn)課件_第5頁
已閱讀5頁,還剩19頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 某醫(yī)療機(jī)構(gòu)為了了解呼吸道疾病與吸某醫(yī)療機(jī)構(gòu)為了了解呼吸道疾病與吸煙是否有關(guān),進(jìn)行了一次抽樣調(diào)查,共調(diào)煙是否有關(guān),進(jìn)行了一次抽樣調(diào)查,共調(diào)查了查了515515個(gè)成年人,其中吸煙者個(gè)成年人,其中吸煙者220220人,不人,不吸煙者吸煙者295295人,調(diào)查結(jié)果是:吸煙的人,調(diào)查結(jié)果是:吸煙的220220人人中中3737人患人患病病, 183183人不患人不患病病;不吸煙的;不吸煙的295295人中人中2121人患人患病病, 274274人不患人不患病病。 根據(jù)這些數(shù)據(jù)能否斷定:患病與根據(jù)這些數(shù)據(jù)能否斷定:患病與吸煙有關(guān)嗎?吸煙有關(guān)嗎?患病患病不患病不患病總計(jì)總計(jì)吸煙吸煙3737183183220

2、220不吸煙不吸煙2121274274295295總計(jì)總計(jì)5858457457515515為了研究這個(gè)問題,我們將上述問題用下表表示:為了研究這個(gè)問題,我們將上述問題用下表表示:2 22 2列聯(lián)表列聯(lián)表注:什么叫列聯(lián)表?注:什么叫列聯(lián)表?列聯(lián)表列聯(lián)表:列出兩個(gè)分類變量的頻數(shù)統(tǒng)計(jì)表列出兩個(gè)分類變量的頻數(shù)統(tǒng)計(jì)表分類變量:變量的不同“值”表示個(gè)體所屬的不同類別,這樣的變量稱為分類變量.注:分類變量的取值一定是離散的,而且不同的取值僅表示個(gè)體所屬的類別如性別變量,只取男、女兩個(gè)值,商品的等級(jí)變量只取一級(jí)、二級(jí),等等. 性別有兩種:性別變量,只取男、女兩個(gè)值男、女患病患病不患病不患病總計(jì)總計(jì)吸煙吸煙37

3、37183183220220不吸煙不吸煙2121274274295295總計(jì)總計(jì)5858457457515515為了研究這個(gè)問題,我們將上述問題用下表表示:為了研究這個(gè)問題,我們將上述問題用下表表示:2 22 2列聯(lián)表列聯(lián)表在不吸煙者中患病的比重是在不吸煙者中患病的比重是 在吸煙者中患病的比重是在吸煙者中患病的比重是 21/295 7.12%21/295 7.12%37/22016.82%37/22016.82%上述結(jié)論能說明吸煙與患病有關(guān)嗎?能有多大把上述結(jié)論能說明吸煙與患病有關(guān)嗎?能有多大把握認(rèn)為吸煙與患病有關(guān)呢?握認(rèn)為吸煙與患病有關(guān)呢?不患病患病1)通過圖形直觀判斷通過圖形直觀判斷三維柱

4、三維柱狀圖狀圖不患病患病2) 通過圖形直觀判斷通過圖形直觀判斷二維條二維條形圖形圖問題1:吸煙與不吸煙,患病的可能性的大小是否有差異? 吸煙者和不吸煙者患吸煙者和不吸煙者患呼吸道疾病呼吸道疾病的可能性存在差的可能性存在差異,吸煙者患呼吸道疾病的可能性大異,吸煙者患呼吸道疾病的可能性大問題2:差異大到什么程度才能作出“吸煙與患病有關(guān)”的判斷?問題3:能否用數(shù)量刻畫出“有關(guān)”的程度?初步結(jié)論:初步結(jié)論: 有一個(gè)顛撲不破的真理,那就是當(dāng)我們不能確定什么是真的時(shí),我們就應(yīng)該去探求什么是最可能的。笛卡爾能否用數(shù)量來刻畫能否用數(shù)量來刻畫“有關(guān)有關(guān)”程度程度患病患病不患病不患病總計(jì)總計(jì)吸煙吸煙不吸煙不吸煙總

5、計(jì)總計(jì)如果“吸煙與患病沒有關(guān)系”,則在吸煙者中患病的比例應(yīng)該與不吸煙者中相應(yīng)的比例差不多,即0aca cdc abadbcabcd因此|越小,說明吸煙與患病之間關(guān)系越弱; | 越大,說明吸煙與患病之間關(guān)系越強(qiáng).為便于研究,用字母代替數(shù)據(jù),得為便于研究,用字母代替數(shù)據(jù),得22列聯(lián)表列聯(lián)表患病患病不患病不患病總計(jì)總計(jì)吸煙吸煙不吸煙不吸煙總計(jì)總計(jì)列出列出2 22 2列聯(lián)表列聯(lián)表 我們不妨作出相反的假設(shè),我們不妨作出相反的假設(shè),H H0 0:吸煙和患病之間沒有關(guān)系:吸煙和患病之間沒有關(guān)系 即即H H0 0:P(AB)P(AB)P(A)P(B) P(A)P(B) 其中其中A A為某人吸煙,為某人吸煙,B

6、 B為某人患病為某人患病 設(shè)設(shè)n na ab bc cd d 為為樣本量樣本量 則則P(A) P(A) nba P(B) P(B) nca 故故P(AB) P(AB) ncanba吸煙且患病人數(shù)吸煙且患病人數(shù)ncanbanABPn)(吸煙但未患病人數(shù)吸煙但未患病人數(shù)ndbnbanBAPn)(不吸煙但患病人數(shù)不吸煙但患病人數(shù)ncandcnBAPn)(不吸煙且未患病人數(shù)不吸煙且未患病人數(shù)ndbndcnBAPn)(怎樣描述實(shí)際觀測(cè)值與預(yù)期值的差異呢?怎樣描述實(shí)際觀測(cè)值與預(yù)期值的差異呢?統(tǒng)計(jì)學(xué)中,為度量觀測(cè)值與預(yù)期值的差值統(tǒng)計(jì)學(xué)中,為度量觀測(cè)值與預(yù)期值的差值皮爾遜(皮爾遜(K.Pearson)引進(jìn)卡方

7、統(tǒng)計(jì)量)引進(jìn)卡方統(tǒng)計(jì)量ncanbanncanbanaK22)(ndbnbanndbnbanb2)(ncandcnncandcnc2)(ndbndcnndbndcnd2)()()()()(22dcbadbcabcadnK化簡(jiǎn)得2( 2 2觀觀測(cè)測(cè)值值預(yù)預(yù)期期值值) )用用卡卡方方統(tǒng)統(tǒng)計(jì)計(jì)量量: :K K預(yù)預(yù)期期值值來來刻刻畫畫實(shí)實(shí)際際觀觀測(cè)測(cè)值值與與估估計(jì)計(jì)值值的的差差異異. .即即卡爾.皮爾遜英國著名的應(yīng)用數(shù)學(xué)家 、生物統(tǒng)計(jì)學(xué)家、優(yōu)生學(xué)家和科學(xué)哲學(xué)家.若H0成立,即“吸煙與患病沒有關(guān)系”,則 應(yīng)很小2K 獨(dú)立性檢驗(yàn)通過公式計(jì)算通過公式計(jì)算863.114575829522018321274375

8、1522KH H0 0: 吸煙吸煙和和患病患病之間沒有關(guān)系之間沒有關(guān)系解解:這個(gè)值是不是很大呢?在H0成立的情況下,統(tǒng)計(jì)學(xué)家估算出如下的概率: H0成立可能性只有1%,因此我們有99%的把握認(rèn)為H0不成立,即有99%的把握認(rèn)為“吸煙與患病有關(guān)系”01. 0)635. 6(2KP 即在H0成立的情況下, 的值大于6.635的概率非常小,近似于0.01.2KP( k0) 0.50 0.400.250.150.100.050.025 0.010 0.005 0.001k00.4550.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.8282K 獨(dú)立性

9、檢驗(yàn)的思想類似于數(shù)學(xué)上的反證法.要確認(rèn)“兩個(gè)分類變量有關(guān)系”這一結(jié)論成立,首先假設(shè)該結(jié)論不成立,即假設(shè)結(jié)論“兩個(gè)分類變量沒有關(guān)系”成立. 在該假設(shè)下我們構(gòu)造的隨機(jī)變量 應(yīng)該很小,如果由觀測(cè)數(shù)據(jù)計(jì)算得到的 的觀測(cè)值很大,則在一定程度上說明假設(shè)不合理.2K2K 獨(dú)立性檢驗(yàn)第一步:第一步:H H0 0: 吸煙吸煙和和患病患病之間沒有關(guān)系之間沒有關(guān)系 通過數(shù)據(jù)和圖表分析,得到通過數(shù)據(jù)和圖表分析,得到結(jié)論是:結(jié)論是:吸煙與患病有關(guān)吸煙與患病有關(guān)結(jié)論的可靠結(jié)論的可靠程度如何?程度如何? 患病患病不患病不患病總計(jì)總計(jì)吸煙吸煙a ab ba+ba+b不吸煙不吸煙c cd dc+dc+d總計(jì)總計(jì)a+ca+cb+

10、db+da+b+c+da+b+c+d第二步:列出第二步:列出2 22 2列聯(lián)表列聯(lián)表 用用K K2 2統(tǒng)計(jì)量研究這統(tǒng)計(jì)量研究這類問題的方法類問題的方法步驟步驟第三步:引入一個(gè)隨機(jī)變量:第三步:引入一個(gè)隨機(jī)變量:卡方統(tǒng)計(jì)量卡方統(tǒng)計(jì)量第四步:查對(duì)臨界值表,作出判斷。第四步:查對(duì)臨界值表,作出判斷。dcban其中 22na db cKabcdacbdP( k0) 0.50 0.400.250.150.100.050.025 0.010 0.005 0.001k00.4550.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.8282KP( k0) 0.

11、50 0.400.250.150.100.050.025 0.010 0.0050.001k00.4550.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828828.102K635. 62K706. 22K706. 22K0.1%0.1%把握認(rèn)把握認(rèn)為為A A與與B B無關(guān)無關(guān)1%1%把握認(rèn)為把握認(rèn)為A A與與B B無關(guān)無關(guān)99.9%99.9%把握認(rèn)把握認(rèn)為為A A與與B B有關(guān)有關(guān)99%99%把握認(rèn)把握認(rèn)為為A A與與B B有關(guān)有關(guān)90%90%把握認(rèn)把握認(rèn)為為A A與與B B有關(guān)有關(guān)10%10%把握認(rèn)為把握認(rèn)為A A與與B B無關(guān)無關(guān)沒有

12、充分的依據(jù)顯示沒有充分的依據(jù)顯示A A與與B B有關(guān),有關(guān),但也不能顯示但也不能顯示A A與與B B無關(guān)無關(guān)例如例如:2K反證法原理與假設(shè)檢驗(yàn)原理反證法原理: 在一個(gè)已知假設(shè)下,如果推出一個(gè)矛盾,就證明了這個(gè)假設(shè)不成立。假設(shè)檢驗(yàn)原理:在一個(gè)已知假設(shè)下,如果一個(gè)與該假設(shè)矛盾的小概率事件發(fā)生,就推斷這個(gè)假設(shè)不成立。在某醫(yī)院,因?yàn)榛夹呐K病而住院的在某醫(yī)院,因?yàn)榛夹呐K病而住院的665名男性病人名男性病人中,有中,有214人禿頂,而另外人禿頂,而另外772名不是因?yàn)榛夹呐K病名不是因?yàn)榛夹呐K病而住院的男性病人中有而住院的男性病人中有175人禿頂。利用圖形判斷人禿頂。利用圖形判斷禿頂與患心臟病是否有關(guān)系。能

13、夠以禿頂與患心臟病是否有關(guān)系。能夠以99%的把握認(rèn)的把握認(rèn)為禿頂與患心臟病有關(guān)系嗎?為什么?為禿頂與患心臟病有關(guān)系嗎?為什么?例1患心臟病患心臟病換其他病換其他病總計(jì)總計(jì)禿頂禿頂214175389不禿頂不禿頂4515971048總計(jì)總計(jì)6657721437 底面副對(duì)角線上兩個(gè)柱體高度的乘積要大一些,因底面副對(duì)角線上兩個(gè)柱體高度的乘積要大一些,因此可以在某種程度上認(rèn)為此可以在某種程度上認(rèn)為“禿頂與患心臟病有關(guān)禿頂與患心臟病有關(guān)”21437 (214 597 175 451)16.3736.635389 1048 665 772k所以有所以有99%的把握認(rèn)為的把握認(rèn)為“禿頂與患心臟病有關(guān)禿頂與患心

14、臟病有關(guān)”因?yàn)檫@組數(shù)據(jù)來因?yàn)檫@組數(shù)據(jù)來自被調(diào)查的醫(yī)院,自被調(diào)查的醫(yī)院,因此此結(jié)論只是因此此結(jié)論只是用于該醫(yī)院住院用于該醫(yī)院住院的病人群體的病人群體例例2 為了考察高中生的性別與是否喜歡數(shù)學(xué)課為了考察高中生的性別與是否喜歡數(shù)學(xué)課程之間的關(guān)系,在某城市的某校高中生中隨即程之間的關(guān)系,在某城市的某校高中生中隨即抽取抽取300名學(xué)生,得到如下列聯(lián)表:名學(xué)生,得到如下列聯(lián)表:由表中數(shù)據(jù)計(jì)算得到由表中數(shù)據(jù)計(jì)算得到 的觀值的觀值 。能。能夠以夠以95%的把握認(rèn)為高中生的性別與是否喜歡數(shù)的把握認(rèn)為高中生的性別與是否喜歡數(shù)學(xué)課程之間有關(guān)系嗎?為什么?學(xué)課程之間有關(guān)系嗎?為什么?喜歡數(shù)學(xué)課程喜歡數(shù)學(xué)課程不喜歡數(shù)學(xué)課程不喜歡數(shù)學(xué)課程總計(jì)總計(jì)男男3785122女女35143178總計(jì)總計(jì)722283002K4.514k 222(3.841)0.054.5143.841P KKk解:在假設(shè)“性別與是否喜歡數(shù)學(xué)之間沒有關(guān)系”的前提下,K 應(yīng)該很小,并且 而 的觀測(cè)值超過

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論