版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、8.3列聯表與獨立性檢驗學習目標1.通過實例,理解22列聯表的統(tǒng)計意義.2.通過實例,了解22列聯表獨立性檢驗及其應用知識點一分類變量為了表述方便,我們經常會使用一種特殊的隨機變量,以區(qū)別不同的現象或性質,這類隨機變量稱為分類變量分類變量的取值可以用實數表示知識點二22列聯表122列聯表給出了成對分類變量數據的交叉分類頻數2定義一對分類變量X和Y,我們整理數據如下表所示:XY合計Y0Y1X0ababX1cdcd合計acbdnabcd像這種形式的數據統(tǒng)計表稱為22列聯表知識點三獨立性檢驗1定義:利用2的取值推斷分類變量X和Y是否獨立的方法稱為2獨立性檢驗,讀作“卡方獨立性檢驗”簡稱獨立性檢驗22
2、eq f(nadbc2,abcdacbd),其中nabcd.3獨立性檢驗解決實際問題的主要環(huán)節(jié)(1)提出零假設H0:X和Y相互獨立,并給出在問題中的解釋(2)根據抽樣數據整理出22列聯表,計算2的值,并與臨界值x比較(3)根據檢驗規(guī)則得出推斷結論(4)在X和Y不獨立的情況下,根據需要,通過比較相應的頻率,分析X和Y間的影響規(guī)律思考獨立性檢驗與反證法的思想類似,那么獨立性檢驗是反證法嗎?答案不是因為反證法不會出錯,而獨立性檢驗依據的是小概率事件幾乎不發(fā)生1分類變量中的變量與函數的變量是同一概念()2等高堆積條形圖可初步分析兩分類變量是否有關系,而獨立性檢驗中2取值則可通過統(tǒng)計表從數據上說明兩分類
3、變量的相關性的大小()3事件A與B的獨立性檢驗無關,即兩個事件互不影響()42的大小是判斷事件A與B是否相關的統(tǒng)計量()一、等高堆積條形圖的應用例1為了解鉛中毒病人與尿棕色素為陽性是否有關系,分別對病人組和對照組的尿液作尿棕色素定性檢查,結果如下:組別尿棕色素合計陽性數陰性數鉛中毒病人29736對照組92837合計383573試畫出列聯表的等高堆積條形圖,分析鉛中毒病人和對照組的尿棕色素陽性數有無差別,鉛中毒病人與尿棕色素為陽性是否有關系?解等高堆積條形圖如圖所示:其中兩個淺色條的高分別代表鉛中毒病人和對照組樣本中尿棕色素為陽性的頻率由圖可以直觀地看出鉛中毒病人與對照組相比,尿棕色素為陽性的頻
4、率差異明顯,因此鉛中毒病人與尿棕色素為陽性有關系反思感悟等高堆積條形圖的優(yōu)劣點(1)優(yōu)點:較直觀地展示了eq f(a,ab)與eq f(c,cd)的差異性(2)劣點:不能給出推斷“兩個分類變量有關系”犯錯誤的概率跟蹤訓練1網絡對現代人的生活影響較大,尤其是對青少年,為了解網絡對中學生學習成績的影響,某地區(qū)教育主管部門從轄區(qū)初中生中隨機抽取了1 000人調查,發(fā)現其中經常上網的有200人,這200人中有80人期末考試不及格,而另外800人中有120人不及格利用等高堆積條形圖判斷學生學習成績與經常上網有關嗎?解根據題目所給的數據得到如下22列聯表:學習成績上網合計經常不經常不及格80120200及
5、格120680800合計2008001 000得出等高堆積條形圖如圖所示:比較圖中陰影部分高可以發(fā)現經常上網不及格的頻率明顯高于經常上網及格的頻率,因此可以認為學習成績與經常上網有關二、由2進行獨立性檢驗命題角度1有關“相關的檢驗”例2某校對學生課外活動進行調查,結果整理成下表:試根據小概率值0.005的獨立性檢驗,分析喜歡體育還是文娛與性別是否有關系性別喜歡合計體育文娛男生212344女生62935合計275279解零假設為H0:喜歡體育還是喜歡文娛與性別沒有關系a21,b23,c6,d29,n79,2eq f(nadbc2,abcdacbd)eq f(7921292362,44352752
6、)8.1067.879x0.005.根據小概率值0.005的獨立性檢驗,我們推斷H0不成立,即認為喜歡體育還是喜歡文娛與性別有關反思感悟用2進行“相關的檢驗”步驟(1)零假設:即先假設兩變量間沒關系(2)計算2:套用2的公式求得2值(3)查臨界值:結合所給小概率值查得相應的臨界值x.(4)下結論:比較2與x的大小,并作出結論跟蹤訓練2甲、乙兩機床加工同一種零件,抽檢得到它們加工后的零件尺寸x(單位:cm)及個數y,如下表:零件尺寸x1.011.021.031.041.05零件個數y甲37893乙7444a由表中數據得y關于x的經驗回歸方程為eq o(y,sup6()91100 x(1.01x1
7、.05),其中合格零件尺寸為1.030.01(cm)完成下面列聯表,并依據小概率值0.01的獨立性檢驗,分析加工零件的質量與甲、乙是否有關機床加工零件的質量合計合格零件數不合格零件數甲乙合計解eq xto(x)1.03,eq xto(y)eq f(a49,5),由eq o(y,sup6()91100 x,知eq f(a49,5)911001.03,所以a11.由于合格零件尺寸為1.030.01 cm,故甲、乙加工的合格與不合格零件的數據表為:機床加工零件的質量合計合格零件數不合格零件數甲24630乙121830合計362460零假設為H0:加工零件的質量與甲、乙無關則2eq f(nadbc2,
8、abcdacbd)eq f(6024186122,30303624)10,因為2106.635x0.01,根據小概率值0.01的獨立性檢驗,我們推斷H0不成立即認為加工零件的質量與甲、乙有關命題角度2有關“無關的檢驗”例3下表是某屆某校本科志愿報名時,對其中304名學生進入高校時是否知道想學專業(yè)的調查表:知道想學專業(yè)不知道想學專業(yè)合計男生63117180女生4282124合計105199304根據表中數據,則下列說法正確的是_(填序號)性別與知道想學專業(yè)有關;性別與知道想學專業(yè)無關;女生比男生更易知道所學專業(yè)答案解析2eq f(3046382421172,180124105199)0.0412
9、.706x0.1,所以性別與知道想學專業(yè)無關反思感悟獨立性檢驗解決實際問題的主要環(huán)節(jié)(1)提出零假設H0:X和Y相互獨立,并給出在問題中的解釋(2)根據抽樣數據整理出22列聯表,計算2的值,并與臨界值x比較(3)根據檢驗規(guī)則得出推斷結論(4)在X和Y不獨立的情況下,根據需要,通過比較相應的頻率,分析X和Y間的影響規(guī)律跟蹤訓練3某省進行高中新課程改革,為了解教師對新課程教學模式的使用情況,某一教育機構對某學校的教師關于新課程教學模式的使用情況進行了問卷調查,共調查了50人,其中有老教師20人,青年教師30人老教師對新課程教學模式贊同的有10人,不贊同的有10人;青年教師對新課程教學模式贊同的有2
10、4人,不贊同的有6人(1)根據以上數據建立一個22列聯表;(2)試根據小概率值0.01的獨立性檢驗,分析對新課程教學模式的贊同情況與教師年齡是否有關系解(1)22列聯表如下表所示:教師年齡對新課程教學模式合計贊同不贊同老教師101020青年教師24630合計341650(2)零假設為H0:對新課程教學模式的贊同情況與教師年齡無關由公式得2eq f(5010624102,34162030)4.9633.841x0.05.犯錯誤的概率不超過0.05.3(多選)若在研究吸煙與患肺癌的關系中,通過收集、整理分析數據得“吸煙與患肺癌有關”的結論,并且有99%以上的把握認為這個結論是成立的,則下列說法中正
11、確的是()A在犯錯誤的概率不超過0.01的前提下,認為吸煙和患肺癌有關系B1個人吸煙,那么這個人有99%的概率患有肺癌C在100個吸煙者中一定有患肺癌的人D在100個吸煙者中可能一個患肺癌的人也沒有答案AD解析獨立性檢驗的結論是一個統(tǒng)計量,統(tǒng)計的結果只是說明事件發(fā)生的可能性的大小,具體到一個個體,則不一定發(fā)生4根據如圖所示的等高堆積條形圖可知喝酒與患胃病_關系(填“有”或“沒有”)答案有解析從等高堆積條形圖上可以明顯地看出喝酒患胃病的頻率遠遠大于不喝酒患胃病的頻率5某銷售部門為了研究具有相關大學學歷和能按時完成銷售任務的關系,對本部門200名銷售人員進行調查,所得數據如下表所示:能按時完成銷售
12、任務不能按時完成銷售任務合計具有相關大學學歷574299不具有相關大學學歷3665101合計93107200根據上述數據能得出結論:有_以上的把握認為“銷售人員具有相關大學學歷與能按時完成銷售任務是有關系的”答案99%解析由公式2eq f(nadbc2,abcdacbd),得2eq f(200576542362,9910193107)9.67.因為9.676.635x0.01,所以有99%以上的把握認為“銷售人員具有相關大學學歷與能按時完成銷售任務是有關系的”1知識清單:(1)分類變量(2)22列聯表(3)等高堆積條形圖(4)獨立性檢驗,2公式2方法歸納:數形結合3常見誤區(qū):對獨立性檢驗的原理
13、不理解,導致不會用2分析問題1觀察下列各圖,其中兩個分類變量x,y之間關系最強的是()答案D解析觀察等高堆積條形圖易知D選項兩個分類變量之間關系最強2(多選)給出下列實際問題,其中用獨立性檢驗可以解決的問題有()A兩種藥物治療同一種病是否有區(qū)別B吸煙者得肺病的概率C吸煙是否與性別有關系D網吧與青少年的犯罪是否有關系答案ACD解析獨立性檢驗是判斷兩個分類變量是否有關系的方法,而B是概率問題,故選ACD.3為了研究高中學生中性別與對鄉(xiāng)村音樂態(tài)度(喜歡和不喜歡兩種態(tài)度)的關系,運用22列聯表進行獨立性檢驗,經計算28.01,則所得到的統(tǒng)計學結論是認為“性別與喜歡鄉(xiāng)村音樂有關系”的把握約為()A0.1
14、% B0.5%C99.5% D99.9%答案C解析因為28.017.879x0.005,所以認為性別與喜歡鄉(xiāng)村音樂有關系的把握有99.5%.4某同學寒假期間對其30位親屬的飲食習慣進行了一次調查,列出了如下22列聯表:年齡飲食習慣合計偏愛蔬菜偏愛肉類50歲以下481250歲以上16218合計201030則可以說其親屬的飲食習慣與年齡有關的把握為()A95% B99%C99.5% D99.9%答案C解析因為2eq f(30421682,12182010)107.879x0.005,所以有99.5%的把握認為其親屬的飲食習慣與年齡有關5考察棉花種子處理情況跟生病之間的關系得到下表數據:種子種子合計
15、處理未處理得病32101133不得病61213274合計93314407根據以上數據,可得出()A種子是否經過處理跟生病有關B種子是否經過處理跟生病無關C種子是否經過處理決定是否生病D以上都是錯誤的答案B解析由2eq f(40732213611012,93314133274)0.1643.841,所以判定主修統(tǒng)計專業(yè)與性別有關系,那么這種判斷出錯的可能性最大為_答案5%解析因為23.841x0.05,所以依據小概率值0.05的獨立性檢驗,認為主修統(tǒng)計專業(yè)與性別有關,出錯的可能性最大為5%.9在某測試中,卷面滿分為100分,60分為及格,為了調查午休對本次測試前兩個月復習效果的影響,特對復習中進
16、行午休和不進行午休的考生進行了測試成績的統(tǒng)計,數據如下表所示:分數段29404150516061707180819091100午休考生人數23473021143114不午休考生人數1751671530173(1)根據上述表格完成列聯表;人數合計及格人數不及格人數午休不午休合計(2)根據列聯表可以得出什么樣的結論?對今后的復習有什么指導意義?解(1)22列聯表如下表所示:人數合計及格人數不及格人數午休80100180不午休65135200合計145235380(2)計算可知,午休的考生及格率為P1eq f(80,180)eq f(4,9).不午休的考生的及格率為P2eq f(65,200)eq
17、f(13,40),由P1P2,可以粗略判斷午休與考生考試及格有關系,并且午休的及格率高,所以在以后的復習中考生應盡量適當午休,以保持最佳的學習狀態(tài)10為了解某班學生喜愛打籃球是否與性別有關,對本班48人進行了問卷調查得到了如下的22列聯表:性別打籃球合計喜愛不喜愛男生6女生10合計48已知在全班48人中隨機抽取1人,抽到喜愛打籃球的學生的概率為eq f(2,3).(1)請將上面的22列聯表補充完整(不用寫計算過程);(2)根據小概率值0.05的獨立性檢驗,能否據此推斷喜愛打籃球與性別有關?(3)現從女生中抽取2人進一步調查,設其中喜愛打籃球的女生人數為X,求X的分布列與均值解(1)列聯表補充如
18、下:性別打籃球合計喜愛不喜愛男生22628女生101020合計321648(2)零假設H0:喜愛打籃球與性別無關,由2eq f(48220602,28203216)4.2863.841x0.05,根據小概率值0.05的獨立性檢驗,我們推斷H0不成立,即認為喜愛打籃球與性別有關(3)喜愛打籃球的女生人數X的可能取值為0,1,2.其概率分別為P(X0)eq f(Coal(2,10),Coal(2,20)eq f(9,38),P(X1)eq f(Coal(1,10)Coal(1,10),Coal(2,20)eq f(10,19),P(X2)eq f(Coal(2,10),Coal(2,20)eq f
19、(9,38),故X的分布列為X012Peq f(9,38)eq f(10,19)eq f(9,38)X的均值為E(X)0eq f(10,19)eq f(9,19)1.11(多選)下列關于回歸分析與獨立性檢驗的說法不正確的是()A回歸分析和獨立性檢驗沒有什么區(qū)別B回歸分析是對兩個變量準確關系的分析,而獨立性檢驗是分析兩個變量之間的不確定關系C回歸分析研究兩個變量之間的相關關系,獨立性檢驗是對兩個變量是否具有某種關系的一種檢驗D獨立性檢驗可以100%確定兩個變量之間是否具有某種關系答案ABD解析由回歸分析及獨立性檢驗的特點知,選項C正確12在調查中發(fā)現480名男人中有38名患有色盲,520名女人中
20、有6名患有色盲下列說法正確的是()A男人、女人中患色盲的頻率分別為0.038和0.006B男、女患色盲的概率分別為eq f(19,240),eq f(3,260)C男人中患色盲的比例比女人中患色盲的比例大,可以認為患色盲與性別是有關的D調查人數太少,不能說明色盲與性別有關答案C解析男人中患色盲的比例為eq f(38,480)eq f(19,240),要比女人中患色盲的比例eq f(6,520)eq f(3,260)大,其差值為eq blc|rc|(avs4alco1(f(38,480)f(6,520)0.067 6,差值較大,故認為患色盲與性別是有關的13某人研究中學生的性別與成績、視力、智商
21、、閱讀量這4個變量的關系,隨機抽查了52名中學生,得到統(tǒng)計數據如表1至表4,則與性別有關聯的可能性最大的變量是()表1性別成績合計不及格及格男61420女102232合計163652表2性別視力合計好不好男41620女122032合計163652表3性別智商合計偏高正常男81220女82432合計163652表4性別閱讀量合計豐富不豐富男14620女23032合計163652A.成績 B視力C智商 D閱讀量答案D解析因為eq oal(2,1)eq f(5262214102,16363220)eq f(5282,16363220),eq oal(2,2)eq f(5242016122,16363
22、220)eq f(521122,16363220),eq oal(2,3)eq f(528241282,16363220)eq f(52962,16363220),eq oal(2,4)eq f(521430622,16363220)eq f(524082,16363220),則有eq oal(2,4)eq oal(2,2)eq oal(2,3)eq oal(2,1),所以閱讀量與性別有關聯的可能性最大14世界杯期間,某一電視臺對年齡高于40歲和不高于40歲的人是否喜歡西班牙隊進行調查,對高于40歲的調查了50人,不高于40歲的調查了50人,所得數據制成如下列聯表:年齡西班牙隊合計不喜歡喜歡高
23、于40歲pq50不高于40歲153550合計ab100若工作人員從所有統(tǒng)計結果中任取一個,取到喜歡西班牙隊的人的概率為eq f(3,5),則有超過_的把握認為年齡與西班牙隊的被喜歡程度有關附:2eq f(nadbc2,abcdacbd).臨界值表:0.100.050.0100.0050.001x2.7063.8416.6357.87910.828答案95%解析設“從所有人中任意抽取一個,取到喜歡西班牙隊的人”為事件A,由已知得P(A)eq f(q35,100)eq f(3,5),所以q25,p25,a40,b60.2eq f(100253525152,40605050)eq f(25,6)4.1673.841x0.05.故有超過95%的把握認為年齡與西班牙隊的被喜歡程度有關15(多選)有兩個分類變量X,Y,其22列聯表如下所示:XY合計Y1Y2X1a20a20X215a30a45合計155065其中a,15a均為大于5的整數,若依據小概率值0.05的獨立性檢驗
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 數字營銷設計合同細節(jié)
- 《PE燃氣球閥》課件
- 報任安書課件圖
- 人格心理學課件-現象學范型
- 藥物分析課件(生物堿)
- 2025屆黑龍江省哈爾濱市第35中學中考生物模試卷含解析
- 福建省各市區(qū)達標名校2025屆中考生物全真模擬試卷含解析
- 湖南省益陽赫山區(qū)六校聯考2025屆中考生物最后沖刺模擬試卷含解析
- 浙江省紹興市諸暨市2025屆中考考前最后一卷生物試卷含解析
- 醫(yī)院等級評審實施方案樣本(2篇)
- 2024(部編版)道德與法治九年級上冊 第二單元 民主與法治 單元測試(學生版+解析版)
- YDT 4525-2023通信局(站)液冷系統(tǒng)總體技術要求
- 基因檢測銷售基礎知識培訓手冊
- 創(chuàng)新人才認證(解決方案)考試題庫(附答案)
- 3年級數學三位數除以一位數2000題
- 20以內最大最小能填幾專項練習126+129題
- 2024初中數學競賽9年級競賽輔導講義專題13 旋轉變換含答案
- 某市中心人民醫(yī)院急救中心改擴建項目可行性研究報告
- 項目實施的保障和支持措施
- 統(tǒng)籌經營策劃方案
評論
0/150
提交評論