人教A版選修2-3課件:32獨(dú)立性檢驗的基本思想及其初步應(yīng)用_第1頁
人教A版選修2-3課件:32獨(dú)立性檢驗的基本思想及其初步應(yīng)用_第2頁
人教A版選修2-3課件:32獨(dú)立性檢驗的基本思想及其初步應(yīng)用_第3頁
人教A版選修2-3課件:32獨(dú)立性檢驗的基本思想及其初步應(yīng)用_第4頁
人教A版選修2-3課件:32獨(dú)立性檢驗的基本思想及其初步應(yīng)用_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、3.2 獨(dú)立性檢驗的基本思想及其初步應(yīng)用 吸煙與肺癌列聯(lián)表不患肺癌患肺癌總計不吸煙7775427817吸煙2099492148總計9874919965為了調(diào)查吸煙是否對肺癌有影響,某腫瘤研究所隨機(jī)地調(diào)查了9965人,得到如下結(jié)果(單位:人)列聯(lián)表在不吸煙者中患肺癌的比重是 在吸煙者中患肺癌的比重是 說明:吸煙者和不吸煙者患肺癌的可能性存在差異,吸煙者患肺癌的可能性大。0.54%2.28%探究分類變量患肺癌比例不患肺癌比例不吸煙吸煙不患肺癌患肺癌總計不吸煙7775427817吸煙2099492148總計98749199651、列聯(lián)表通過圖形直觀判斷兩個分類變量是否相關(guān):2、等高條形圖等高條形圖更

2、清晰地表達(dá)了兩種情況下患肺癌的比例。 上面我們通過分析數(shù)據(jù)和圖形,得到的直觀印象是吸煙和患肺癌有關(guān),那么事實(shí)是否真的如此呢?這需要用統(tǒng)計觀點(diǎn)來考察這個問題。 現(xiàn)在想要知道能夠以多大的把握認(rèn)為“吸煙與患肺癌有關(guān)”,為此先假設(shè) H0:吸煙與患肺癌沒有關(guān)系. 用A表示不吸煙,B表示不患肺癌,則“吸煙與患肺癌沒有關(guān)系”等價于“吸煙與患肺癌獨(dú)立”, 即假設(shè)H0等價于 P(AB)=P(A)P(B).因此|ad-bc|越小,說明吸煙與患肺癌之間關(guān)系越弱; |ad-bc|越大,說明吸煙與患肺癌之間關(guān)系越強(qiáng)。不患肺癌患肺癌總計不吸煙aba+b吸煙cdc+d總計a+cb+da+b+c+d=nA表示不吸煙,B表示不

3、患肺癌H0成立時(n=a+b+c+d) 為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評判標(biāo)準(zhǔn),基于上述分析,我們構(gòu)造一個隨機(jī)變量(1) 若 H0成立,即“吸煙與患肺癌沒有關(guān)系”,則K2應(yīng)很小。根據(jù)表3-7中的數(shù)據(jù),利用公式(1)計算得到K2的觀測值為:那么這個值到底能告訴我們什么呢?(2) 獨(dú)立性檢驗在H0成立的情況下,統(tǒng)計學(xué)家估算出如下的概率 即在H0成立的情況下,K2的值大于6.635的概率非常小,近似于0.01。 也就是說,在H0成立的情況下,對隨機(jī)變量K2進(jìn)行多次觀測,觀測值超過6.635的頻率約為0.01。思考 答:判斷出錯的概率為0.01。獨(dú)立性檢驗的基本思想(類似反證法)(1)假設(shè)結(jié)論不成立

4、,即H0 “兩個分類變量沒有關(guān)系”.(2)在此假設(shè)下我們所構(gòu)造的隨機(jī)變量 K2 應(yīng)該很小,如果由觀測數(shù)據(jù)計算得到K2的觀測值k很大,則說明 H0 不成立.即認(rèn)為“兩個分類變量有關(guān)系”;如果k的值很小,則說明由樣本觀測數(shù)據(jù)沒有發(fā)現(xiàn)反對H0的充分證據(jù)。(3)判斷隨機(jī)變量K2的觀測值k是大還是小,需要確定一個正數(shù)k0,由實(shí)際計算出的kk0 時,就認(rèn)為K2的觀測值k大.就認(rèn)為 “兩個分類變量有關(guān)系”判斷錯誤的概率不超過 P( K2 k0 )上面這種利用隨機(jī)變量K2來判斷“兩個分類變量有關(guān)系”的方法,稱為兩個分類變量的獨(dú)立性檢驗。反證法原理與獨(dú)立性檢驗原理的比較反證法原理在假設(shè)H0下,如果推出了矛盾,就

5、證明了H0不成立獨(dú)立性檢驗原理在假設(shè)H0下,如果出現(xiàn)了一個與H0相矛盾的小概率事件,就推斷H0不成立,且該推斷犯錯誤的概率不超過這個小概率.獨(dú)立性檢驗的步驟1.確定容許推斷“兩個分類變量有關(guān)系”的犯錯誤概率的上界,查表確定臨界值k0 .2.利用公式計算隨機(jī)變量K2觀測值k .3.如果k k0,就推斷“x與y有關(guān)系”,這種推斷犯錯誤的概率不超過,否則,就認(rèn)為在犯錯誤的概率不超過的前提下,不能推斷“x與y有關(guān)系”,或者在樣本數(shù)據(jù)中沒有發(fā)現(xiàn)足夠證據(jù)支持結(jié)論“x與y有關(guān)系” .P(K2k)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081

6、.3232.0722.7063.8415.0246.6357.87910.828獨(dú)立性檢驗的步驟計算K2的觀測值k; 將觀測值k與臨界值k0進(jìn)行比較,并作出判斷.如下:(1)當(dāng)K22.706,有_的把握判定兩個分類變量有關(guān)系;(2) 當(dāng)K23.841,有_ 的把握判定兩個分類變量有關(guān)系;(3) 當(dāng)K26.635,有_ 的把握判定兩個分類變量有關(guān)系;P(K2k)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.82890%95%99%例1 在某醫(yī)院,因為患心臟

7、病而住院的665名男性病人中,有214人禿頂;而另外772名不是因為患心臟病而住院的男性病人中有175人禿頂。分別利用圖形和獨(dú)立性檢驗方法判斷禿頂與患心臟病是否有關(guān)系?你所得的結(jié)論在什么范圍內(nèi)有效?解:根據(jù)題目所給數(shù)據(jù)得到如下列聯(lián)表:患心臟病不患心臟病總計禿頂214175389不禿頂4515971048總計6657721437 根據(jù)聯(lián)表1-13中的數(shù)據(jù),得到所以有99%的把握認(rèn)為“禿頂患心臟病有關(guān)”。P(K2k)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.8791

8、0.828課堂練習(xí)1.為考察高中生性別與是否喜歡數(shù)學(xué)課程之間的關(guān)系,在某城市的某校高中生中隨機(jī)抽取300名學(xué)生,得到如下列聯(lián)表:喜歡數(shù)學(xué)課程不喜歡數(shù)學(xué)課程總計男3785122女35143178總計72228300由表中數(shù)據(jù)計算得K24.513. 問:能夠有95的把握認(rèn)為高中生的性別與是否喜歡數(shù)學(xué)課程之間有關(guān)系嗎? 為調(diào)查某地區(qū)老年人是否需要志愿者提供幫助,用簡單的隨機(jī)抽樣方法從該地區(qū)調(diào)查了500名老年人,結(jié)果如下:(1)估計該地區(qū)老年人中,需要志愿者提供幫助的老年人的比例;(2)能夠有99%的把握認(rèn)為該地區(qū)老年人是否需要志愿者提供幫助與性別有關(guān)?(3)根據(jù)(2)的結(jié)論,能否提出更好的調(diào)查方法來估計該地區(qū)的老年人中,需要志愿者提供幫助的老年人的比例?說明理由。是否需要志愿者男女需要4030不需要160270為調(diào)查某地區(qū)老年人是否需要志愿者提供幫助,用簡單的隨機(jī)抽樣方法從該地區(qū)調(diào)查了500名老年人,結(jié)果如下:(1)估計該地區(qū)老年人中,需要志愿者提供幫助的老年人的比例(2)能夠有99%的把

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論