32獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用_第1頁
32獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用_第2頁
32獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用_第3頁
32獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用_第4頁
32獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、2022-3-5思思想想及及其其初初步步應(yīng)應(yīng)用用獨(dú)獨(dú)立立性性檢檢驗(yàn)驗(yàn)的的基基本本2.32022-3-5.,.,.,等等等等國(guó)國(guó)籍籍宗宗教教信信仰仰否否吸吸煙煙是是例例如如分分類類變變量量是是大大量量存存在在的的生生活活中中在在現(xiàn)現(xiàn)實(shí)實(shí)像像這這類類變變量量稱稱為為別別類類表表示示個(gè)個(gè)體體所所屬屬的的不不同同值值種種變變量量的的不不同同這這其其取取值值為為男男和和女女兩兩種種對(duì)對(duì)于于性性別別變變量量分類變量分類變量.?,.,等等等等影影響響有有程程數(shù)數(shù)學(xué)學(xué)課課別別對(duì)對(duì)于于是是否否喜喜歡歡性性有有關(guān)關(guān)系系吸吸煙煙與與肺肺癌癌是是否否例例如如量量之之間間是是否否有有關(guān)關(guān)系系變變我我們們常常常常關(guān)關(guān)心心

2、兩兩個(gè)個(gè)分分類類在在日日常常生生活活中中2022-3-5: ):(,9659,人人單位單位結(jié)果結(jié)果得到如下得到如下人人了了腫瘤研究所隨機(jī)地調(diào)查腫瘤研究所隨機(jī)地調(diào)查某某癌有影響癌有影響為調(diào)查吸煙是否對(duì)患肺為調(diào)查吸煙是否對(duì)患肺探究探究996591987421484920997817427775總總計(jì)計(jì)吸吸煙煙不不吸吸煙煙總總計(jì)計(jì)患患肺肺癌癌不不患患肺肺癌癌吸吸煙煙與與患患肺肺癌癌列列聯(lián)聯(lián)表表表表73 ?有有影影響響那那么么吸吸煙煙是是否否對(duì)對(duì)患患肺肺癌癌2022-3-5.:,.%28.2,;%54.0,:.,73在差異在差異肺癌可能存肺癌可能存煙者患煙者患吸煙者和不吸吸煙者和不吸結(jié)論結(jié)論直觀上可以

3、得出直觀上可以得出因此因此患有肺癌患有肺癌有有在吸煙者中在吸煙者中患有肺癌患有肺癌有有吸煙者中吸煙者中在不在不估計(jì)出估計(jì)出表可以粗略表可以粗略癌情況的列聯(lián)癌情況的列聯(lián)由吸煙情況和患肺由吸煙情況和患肺稱為稱為頻數(shù)表頻數(shù)表的的樣列出的兩個(gè)分類變量樣列出的兩個(gè)分類變量這這像表像表列聯(lián)表列聯(lián)表,.與表格相比 圖形能更直觀地反映出相關(guān)數(shù)據(jù)的總體狀況2022-3-532.3圖圖不不吸吸煙煙吸吸煙煙,;.在等高條形圖中 綠色的條高表示不患肺癌的百分比 黑色的條高表示患肺癌的百分比2022-3-5?.,呢呢?zé)煙熍c與患患肺肺癌癌有有關(guān)關(guān)吸吸的的把把握握認(rèn)認(rèn)為為或或者者說說我我們們能能夠夠以以多多大大此此呢呢那那

4、么么事事實(shí)實(shí)是是否否真真的的如如象象是是吸吸煙煙和和患患肺肺癌癌有有關(guān)關(guān)得得到到的的直直觀觀印印和和圖圖形形上上面面我我們們通通過過分分析析數(shù)數(shù)據(jù)據(jù).:H,0吸煙與患肺癌沒有關(guān)系我們先假設(shè)為了回答上述問題 .BPAPABPH, ,B,A0等價(jià)于即吸煙與患肺癌獨(dú)立等價(jià)于癌沒有關(guān)系肺吸煙與患則表示不患肺癌表示不吸煙用2022-3-5:,73母表示的列聯(lián)表母表示的列聯(lián)表得到如下用字得到如下用字中的數(shù)字用字母代替中的數(shù)字用字母代替把表把表dcbadbcadcdcbaba總總計(jì)計(jì)吸吸煙煙不不吸吸煙煙總總計(jì)計(jì)患患肺肺癌癌不不患患肺肺癌癌吸吸煙煙與與患患肺肺癌癌列列聯(lián)聯(lián)表表表表83 成立的條件下應(yīng)有所以在于

5、頻率近似于概率由發(fā)生的頻數(shù)和恰恰好分別為事件和發(fā)生的頻數(shù)恰好為事件中在表0H,.BAcaba:ABa,832022-3-5,cabaadcba,dcban,ncanbana即量為樣本容其中.bcad 即.,|bcad;|,|bcad,|關(guān)系越強(qiáng)說明吸煙與患肺癌之間越大系越弱關(guān)說明吸煙與患肺癌之間越小因此 .dcban1dbcadcbabcadnK,22為樣本容量其中我們構(gòu)造一個(gè)隨機(jī)變量基于上面的分析準(zhǔn)數(shù)據(jù)有統(tǒng)一的評(píng)判標(biāo)為了使不同樣本容量的2022-3-5 ,632.56919874214878172099424977759965kK1,73,.K, ,H2220的觀測(cè)值為算得計(jì)利用公式中的數(shù)據(jù)

6、根據(jù)表現(xiàn)在很小應(yīng)該則吸煙與肺癌沒有關(guān)系即成立若?這個(gè)值是不是很大呢 2.01.0635.6KP,H20率統(tǒng)計(jì)學(xué)家估算出如下概成立的情況下在成立的情況在也就是說近似于非常小的概率的值大于成立的情況下即在020H.01.0.635.6KH2022-3-5.1001635.6,K2的頻率約為觀測(cè)值超過進(jìn)行多次觀測(cè)下對(duì)隨機(jī)變量 .5d, c, b, a,.,n,2都不小于都不小于要求要求通常通常在實(shí)際應(yīng)用中在實(shí)際應(yīng)用中近似程度越高近似程度越高越大越大中中在在?,H,635.6K02斷出錯(cuò)的可能性有多大斷出錯(cuò)的可能性有多大這種判這種判不成立不成立就斷定就斷定如果如果思考思考 056.6326.635,2

7、0.01.0.01.kH現(xiàn)在觀測(cè)值遠(yuǎn)遠(yuǎn)大于在成立的條件下 由式可知能夠出現(xiàn)這樣的觀測(cè)值的概率不超過因此,在我們認(rèn)為 吸煙與肺癌有關(guān)系 的犯錯(cuò)誤概率不會(huì)超過2022-3-5.2個(gè)分類變量的的方法稱為兩兩個(gè)分類變量有關(guān)系可以認(rèn)為來確定在多大程度上上面這種利用隨機(jī)變量 K.獨(dú)立性檢驗(yàn)獨(dú)立性檢驗(yàn)22.,.,.KK獨(dú)立性檢驗(yàn)的基本思想類似于反證法 要確認(rèn) 兩個(gè)分類變量有關(guān)系 這一結(jié)論成立的可信程度 首先假設(shè)該結(jié)論不成立 即假設(shè)結(jié)論 兩個(gè)分類變量沒有關(guān)系 成立 在該假設(shè)下構(gòu)造的隨機(jī)變量應(yīng)該很小 如果由觀測(cè)數(shù)據(jù)計(jì)算得到的的觀察值很大 則在一定程度上說明假設(shè)不合理2022-3-5?,量量是是否否相相關(guān)關(guān)嗎嗎形

8、形圖圖中中看看出出兩兩個(gè)個(gè)分分類類變變你你能能從從列列聯(lián)聯(lián)表表的的三三維維柱柱利利用用上上面面的的結(jié)結(jié)論論思思考考:)22(,y,yx,x,YX,2121為為列聯(lián)表列聯(lián)表稱為稱為其樣本頻數(shù)列聯(lián)表其樣本頻數(shù)列聯(lián)表和和別為別為它們的值域分它們的值域分和和假設(shè)兩個(gè)分類變量假設(shè)兩個(gè)分類變量一般地一般地dcbadbcadcdcxbabaxyy2121總總計(jì)計(jì)總總計(jì)計(jì)93表表列聯(lián)表列聯(lián)表222022-3-5111121121:.,;.3-9,;,.,.HXYP Yy XxP Yy XxXYaXxYyXxabcYycdacabcd若要推斷的論述為與 有關(guān)系 ,可以通過頻率直觀判斷兩個(gè)條件概率和是否相等 如果

9、判斷它們相等 就意味著 和 沒有關(guān)系 否則就認(rèn)為它們有關(guān)系由表知 在的情況下的頻率為在的情況下的頻率為因此 如果通過直接計(jì)算或等高條形圖發(fā)現(xiàn)和相差很大 就判斷兩個(gè)變量之間有關(guān)系2022-3-5020,.:(1),(310).,;kKkkkXY上 面 的 這 種 直 觀 判 斷 不 足 之 處 在 于 不 能 給 出 推 斷兩 個(gè) 分 類 變 量 有 關(guān) 系 犯 錯(cuò) 誤 概 率 而 獨(dú) 立 性 檢 驗(yàn)則 可 以 彌 補(bǔ) 這 個(gè) 不 足 獨(dú) 立 性 檢 驗(yàn) 的 具 體 做 法 是根 據(jù) 實(shí) 際 問 題 的 需 要 確 定 容 許 推 斷 兩 個(gè) 分 類變 量 有 關(guān) 系 犯 錯(cuò) 誤 概 率 的 上

10、 界然 后 通 過 查 表表確 定 臨 界 值( 2) 利 用 公 式 計(jì) 算 變 量的 觀 測(cè) 值( 3) 如 果就 推 斷與有 關(guān) 系這 種 推 斷 犯錯(cuò) 誤 的 概 率 不 超 過否 則 就 認(rèn) 為 在 犯 錯(cuò) 誤 概 率 不超 過的 前 提,.XYXY下 不 能 推 斷與有 關(guān) 系或 者 在 樣本 數(shù) 據(jù) 中 沒 有 發(fā) 現(xiàn) 足 夠 的 證 據(jù) 支 持 結(jié) 論與有關(guān) 系2022-3-5.,5d, c, b, a確確的的檢檢驗(yàn)驗(yàn)方方法法需需采采用用很很復(fù)復(fù)雜雜的的精精時(shí)時(shí)中中有有小小于于當(dāng)當(dāng)觀觀測(cè)測(cè)數(shù)數(shù)據(jù)據(jù)706.2072.2323.1708.0455.0k10.015.025.040.

11、050.0kKP2828.10879.7635.6024.5841.3001.0005.0010.0025.005.0103表表2022-3-51,665,214,772175.(1);(2)0.01?例在某醫(yī)院 因?yàn)樾呐K病而住院的名男性病人中 有人禿頂 而另外名不是因?yàn)榛夹呐K病而住院的男性病人中有人禿頂利用圖形判斷禿頂與患心臟病是否有關(guān)系能否在犯錯(cuò)誤概率不超過的前提下認(rèn)為禿頂與患心臟病有關(guān)系如下列聯(lián)表根據(jù)題目所給數(shù)據(jù)得到解禿頂與患心臟病列聯(lián)表表11314377726651048597451389175214總計(jì)不禿頂禿頂總計(jì)患其他病患心臟病2022-3-5(1)等高條形圖(圖略)所示,透頂樣

12、本中患心臟病的頻率明顯高于不禿頂中患心臟病的頻率,因此可以認(rèn)為禿頂與患心臟病有關(guān)系。(2)根據(jù)列聯(lián)表中的數(shù)據(jù),得到因此,在犯錯(cuò)誤概率不超過0.01的前提下,認(rèn)為禿頂與患心臟病有關(guān)系.21437214 597-175 45116. 3736. 635389 1048 665 772k2022-3-5:,300,2得得到到如如下下列列聯(lián)聯(lián)表表名名學(xué)學(xué)生生抽抽出出中中隨隨機(jī)機(jī)在在某某城城市市的的某某校校高高中中生生之之間間的的關(guān)關(guān)系系是是否否喜喜歡歡數(shù)數(shù)學(xué)學(xué)課課程程為為考考察察高高中中生生的的性性別別與與例例30022872178143351228537總總計(jì)計(jì)女女男男總總計(jì)計(jì)不不喜喜歡歡數(shù)數(shù)學(xué)學(xué)課

13、課程程喜喜歡歡數(shù)數(shù)學(xué)學(xué)課課程程聯(lián)聯(lián)表表性性別別與與喜喜歡歡數(shù)數(shù)學(xué)學(xué)課課程程列列表表123 ?.513.4K2為為什什么么否否有有關(guān)關(guān)系系否否喜喜歡歡數(shù)數(shù)學(xué)學(xué)課課程程之之間間是是高高中中生生的的性性別別與與是是由由表表中中數(shù)數(shù)據(jù)據(jù)計(jì)計(jì)算算得得2022-3-5.dcbabdacdccbaa,dccbaa,.d, c, b, a應(yīng)很大即相差很多應(yīng)該數(shù)學(xué)課的人數(shù)比例與女生中喜歡例的比課學(xué)數(shù)歡中喜生則男系有關(guān)課學(xué)數(shù)歡如果性別與是否喜生人數(shù)數(shù)、不喜歡數(shù)學(xué)課的女?dāng)?shù)學(xué)課的女生人數(shù)、喜歡不喜歡數(shù)學(xué)課的男生人的男生人數(shù)、表示樣本中喜歡數(shù)學(xué)課分別用解:在犯錯(cuò)誤概率不超過0.05的前提下,認(rèn)為性別與是否喜歡數(shù)學(xué)課程有關(guān)系.2022-3-5,dbcadcbadcba乘以常數(shù)因子將上式等號(hào)右邊的式子,dbcadcbabdacnK22然后平方得. ,K. dcban2成立的可能性越大歡數(shù)學(xué)課之間有關(guān)系性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論