版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1.2獨立性檢驗的基本思想及其初步應用eq\x(基)eq\x(礎)eq\x(梳)eq\x(理)1.分類變量的定義.如果某種變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量.2.2×2列聯(lián)表.一般地,假設有兩個分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為:y1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+d3.獨立性檢驗.,eq\x(基)eq\x(礎)eq\x(自)eq\x(測)1.下列變量中不屬于分類變量的是(B)A.性別B.吸煙C.宗教信仰D.國籍解析:“吸煙”不是分類變量,“是否吸煙”才是分類變量.故選B.2.下面是一個2×2列聯(lián)表y1y2合計x1a2173x222527合計b46100則表中a、b的值分別為(C)A.94、96B.52、50C.52、54D.54、52解析:由a+21=73,得a=52,由b+46=100,得b=54.3.某高?!敖y(tǒng)計初步”課程的教師隨機調(diào)查了選修該課程的一些學生情況,具體數(shù)據(jù)如下表:為了判斷主修統(tǒng)計專業(yè)是否與性別有關系,根據(jù)表中的數(shù)據(jù),得到K2=eq\f(50×(13×20-10×7)2,23×27×20×30)≈>,所以判定主修統(tǒng)計專業(yè)與性別有關系,那么這種判斷出錯的可能性為____________.解析:P(K2>=,判斷出錯的可能性為5%.答案:5%eq\a\vs4\al((一)重點)通過案例理解分類變量、列聯(lián)表、獨立性檢驗的含義,利用列聯(lián)表的獨立性檢驗進行估計.eq\a\vs4\al((二)難點)獨立性檢驗的基本思想,隨機變量K2的含義.eq\a\vs4\al((三)知識結(jié)構(gòu)圖)eq\a\vs4\al((三)思維總結(jié))(1)直觀分析的兩種方法.①頻率分析.通過對樣本的每個分類變量的不同類別和事件發(fā)生的頻率的大小比較來分析變量之間是否有關系,通常通過列聯(lián)表列出兩個分類變量進行分析.一般地,假設有兩個分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為:yxy1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+d在列聯(lián)表中,如果兩個分類變量沒有關系,則應該滿足ad-bc≈0.因此|ad-bc|越小,說明兩個分量之間的關系越弱;|ad-bc|越大,說明兩個分類變量之間的關系越強.②圖形分析.利用等高條形圖來分析兩分類變量之間是否具有相關關系,形象、直觀地反映兩個分類變量之間的總體狀態(tài)和差異大小,進而推斷它們之間是否有關系.a(chǎn).繪制等高條形圖時,列聯(lián)表的行對應的是高度,兩行的數(shù)據(jù)不相等,但對應的條形圖的高度是相同的,兩列的數(shù)據(jù)對應不同顏色.b.等高條形圖中有兩個高度相同的矩形,每一個矩形中都有兩種顏色,觀察下方顏色區(qū)域的高度,如果兩個高度相差比較明顯eq\b\lc\(\rc\)(\a\vs4\al\co1(即\f(a,a+b)和\f(c,c+d)相差很大)),就判斷兩個分類變量之間有關系.(2)獨立性檢驗及其基本思想.①獨立性檢驗.利用隨機變量K2來確定在多大程度上可以認為“兩個分類變量有關系”的方法稱為兩個分類變量的獨立性檢驗.利用上訴公式求出K2的觀測值為k=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).再得出X與Y有關系的程度,通常用到以下數(shù)據(jù):(i)如果k>,在犯錯誤的概率不超過的前提下認為X與Y有關系;(ii)如果k>,在犯錯誤的概率不超過的前提下認為X與Y有關系;值得注意的是:觀察值k越大,越有利于結(jié)論“X和Y有關系”,越小越有利于結(jié)論“X和Y沒有關系”.因此,可以建立一定的規(guī)則:當k≥k0時就說X與Y有關系,k<k0時就說X和Y沒有關系,故求得觀測值后只要與建立的規(guī)則進行比較即可得出結(jié)論.②獨立性檢驗的基本思想.獨立性檢驗的基本思想是要確認“兩個分類變量有關系”這一結(jié)論成立的可信程度,首先假設該結(jié)論不成立,即假設“兩個分類變量沒有關系”成立,在該假設下我們構(gòu)造的隨機變量K2應該很小,如果由觀察數(shù)據(jù)計算得到K2的觀測值k很大,則在一定程度上說明假設不合理,根據(jù)隨機變量K2的含義,可以通過P(k≥≈來評價假設不合理的程度,由實際計算出k>,說明假設不合理的程度約為99%,即兩個分類變量有關系這一結(jié)論成立的可信度為99%,不合理的程度可查下表得出:1.獨立性檢驗是對兩個分類變量間是否有關系的一種案例分析方法,其分析方法有:等高條形圖法和利用假設的思想方法,計算出某一個隨機變量K2的觀測值來進行判斷.2.在等高條形圖中,可以估計滿足條件X=x1的個體中具有Y=y(tǒng)1的個體所占的比例為eq\f(a,a+b),也可以估計滿足條件X=x2的個體中具有Y=y(tǒng)2的個體所占的比例為eq\f(c,c+d),兩個比例的值相差越大,兩個分類變量相關的可能性就越大.3.獨立性檢驗的一般步驟:(1)根據(jù)樣本數(shù)據(jù)制成2×2列聯(lián)表;(2)根據(jù)公式K2=eq\f(n(ad-bc)2,(a+b)(a+c)(b+d)(c+d))計算K2的觀測值;(3)比較K2與臨界值的大小關系作統(tǒng)計推斷.1.在等高條形圖形中,下列哪兩個比值相差越大,“兩個分類變量有關系”成立的可能性越大(C)\f(a,a+b)與eq\f(d,c+d)\f(c,a+b)與eq\f(a,c+d)\f(a,a+b)與eq\f(c,c+d)\f(a,a+b)與eq\f(c,b+c)2.通過隨機詢問110名性別不同的大學生是否愛好某項運動,得到如下的列聯(lián)表;男女合計愛好402060不愛好203050總計6050110由K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))算得,K2=eq\f(110(40×30-20×20)2,60×50×60×50)≈.附表:P(F2≥k0)k0參照附表,得到的正確結(jié)論是(A)A.有99%以上的把握認為“愛好該項運動與性別有關”B.有99%以上的把握認為“愛好該項運動與性別無關”C.在犯錯誤的概率不超過%的前提下,認為“愛好該項運動與性別有關”D.在犯錯誤的概率不超過%的前提下,認為“愛好該項運動與性別無關”3.某高?!敖y(tǒng)計初步”課程的教師隨機調(diào)查了選該課的一些學生的情況,具體數(shù)據(jù)如下表:專業(yè)性別非統(tǒng)計專業(yè)統(tǒng)計專業(yè)男1310女720為了判斷主修統(tǒng)計專業(yè)是否與性別有關系,根據(jù)表中數(shù)據(jù)得到,k=eq\f(50(13×20-10×7)2,20×30×23×27)≈,因為k>,所以確定主修統(tǒng)計專業(yè)與性別有關系,那么這種判斷出錯的可能性為________.解析:∵k=>,∴有95%的把握可以確定主修統(tǒng)計專業(yè)與性別有關,那么這種判斷出錯的可能性為5%.答案:5%1.在研究兩個分類變量之間是否有關系時,可以粗略地判斷兩個分類變量是否有關的是(B)A.散點圖B.等高條形圖C.2×2列聯(lián)表D.以上均不對2.對分類變量X與Y的隨機變量K2的觀測值k,說法正確的是(B)A.k越大,“X與Y有關系”可信程度越小B.k越小,“X與Y有關系”可信程度越小C.k越接近0,“X與Y無關”程度越小D.k越大,“X與Y無關”程度越大3.下面是一個2×2列聯(lián)表:y1y2總計x1522173x22ab總計5446100則表中a、b的值分別是(C)A.94、96B.25、21C.25、27D.27、254.分類變量x和y的列聯(lián)表如下,則(C)y1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+d-bc越小,說明x與y的關系越弱B.a(chǎn)d-bc越大,說明x與y的關系越弱C.(ad-bc)2越大,說明x與y的關系越強D.(ad-bc)2越小,說明x與y的關系越強解析:由K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))知,(ad-bc)2越大,K2值越大,說明x與y的關系越強.5.某班主任對全班50名學生進行了作業(yè)量多少的調(diào)查,數(shù)據(jù)如下表:認為作業(yè)多認為作業(yè)不多總數(shù)喜歡玩電腦游戲18927不喜歡玩電腦游戲81523總數(shù)262450則認為喜歡玩電腦游戲與認為作業(yè)多少有關系的把握大約為(B)A.99%B.95%C.90%D.無充分依據(jù)解析:由表中數(shù)據(jù)計算K2=eq\f(50×(18×15-8×9)2,26×24×27×23)≈,而K2=>,所以約有95%的把握認為兩變量之間有關.6.為了探究電離輻射的劑量與人體的受損程度是否有關,用兩種不同劑量的電離輻射照射小白鼠,在照射后14天內(nèi)的結(jié)果如下表所示:死亡存活合計第一種劑量141125第二種劑量61925合計203050進行統(tǒng)計分析時的統(tǒng)計假設是________.解析:根據(jù)獨立性檢驗的基本思想,可知其類似反證法,即要確認“兩個分類變量有關系”這一結(jié)論成立的可信程度,首先假設結(jié)論不成立,即假設結(jié)論“兩個分類變量沒有關系”成立,對本題,進行統(tǒng)計分析時的統(tǒng)計假設應是“小白鼠的死亡與劑量無關”.答案:小白鼠的死亡與劑量無關7.(2023·韶關二模)以下四個命題中:①在一次試卷分析中,從每個試室中抽取第5號考生的成績進行統(tǒng)計,是簡單隨機抽樣;②樣本數(shù)據(jù)3,4,5,6,7的方差為2;③對于相關系數(shù)r。|r|越接近1,則線性相關程度越強;④通過隨機詢問110名性別不同的行人,對過馬路是愿意走斑馬線還是愿意走人行天橋進行抽樣調(diào)查,得到如下列聯(lián)表:男女總計走天橋402060走斑馬線203050總計6050110由K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))可得,K2=eq\f(110×(40×30-20×20)2,60×50×60×50)=,則有99%以上的把握認為“選擇過馬路方式與性別有關”.附表:P(K2≥k0)k0其中正確命題的序號是________.答案:②③④8.某學校為了調(diào)查喜歡語文學科與性別的關系,隨機調(diào)查了一些學生情況,具體數(shù)據(jù)如下表:類別性別不喜歡語文喜歡語文男1310女720為了判斷喜歡語文學科是否與性別有關系,根據(jù)表中的數(shù)據(jù),得到K2的觀測值k=eq\f(50×(13×20-10×7)2,23×27×20×30)≈,因為k≥,根據(jù)下表中的參考數(shù)據(jù):P(K2≥k0)k0P(K2≥k0)k0判定喜歡語文學科與性別有關系,那么這種判斷出錯的可能性為________.答案:5%9.調(diào)查某班學生,按性別和籍貫分類得調(diào)查表如下:天津非天津合計男122840女61925合計184765性別對籍貫的影響中,可信度小于________.解析:k=eq\f(65(12×19-28×6)2,40×25×18×47)≈∵<,∴查表可知小于.答案:50%10.在對人們休閑方式的一次調(diào)查中,共調(diào)查了124人,其中女性70人,男性54人,女性中有43人主要的休閑方式是看電視,另外27人主要的休閑方式是運動;男性中有21人主要的休閑方式是看電視,另外33人主要的休閑方式是運動,你能否判斷性別與休閑方式是否有關系?解析:首先建立列聯(lián)表如下休閑方式為看電視休閑方式為運動合計女性432770男性213354合計6460124∵a=43,b=27,a+b=70,c=21,d=33,c+d=54,a+b+c+d=124,a+c=64,b+d=60,∴k=eq\f(n(ad+bc)2,(a+b)(c+d)(a+c)(b+d))=eq\f(124×8522,14515200)≈>,即有%的把握認為休閑方式與性別有關.11.(2023·深圳二模)2023年3月14日,CCTV財經(jīng)頻道報道了某地建筑市場存在違規(guī)使用未經(jīng)淡化海砂的現(xiàn)象.為了研究使用淡化海砂與混凝土耐久性是否達標有關,某大學實驗室隨機抽取了60個樣本,得到了相關數(shù)據(jù)如下表:混凝土耐久性達標混凝土耐久性不達標總計使用淡化海砂25530使用未經(jīng)淡化海砂151530總計402060(1)根據(jù)表中數(shù)據(jù),利用獨立性檢驗的方法判斷,能否在犯錯誤的概率不超過1%的前提下,認為使用淡化海砂與混凝土耐久性是否達標有關?(2)若用分層抽樣的方法在使用淡化海砂的樣本中抽取了6個,現(xiàn)從這6個樣本中任取2個,則取出的2個樣本混凝土耐久性都達標的概率是多少?參考數(shù)據(jù):P(K2≥k)k解析:(1)提出假設H0:使用淡化海砂與混凝土耐久性是否達標無關.根據(jù)表中數(shù)據(jù),求得K2的觀測值k=eq\f(60×(25×15-15×5)2,302×40×20)=>.查表得P(K2≥=.∴能在犯錯誤的概率不超過1%的前提下,認為使用淡化海砂與混凝土耐久性是否達標有關.(2)用分層抽樣的方法在使用淡化海砂的樣本中抽取6個,其中應抽取“混凝土耐久性達標”的為eq\f(25,30)×6=5,“混凝土耐久性不達標”的為6-5=1,“混凝土耐久性達標記”為A1,A2,A3,A4,A5”;“混凝土耐久性不達標”的記為B.在這6個樣本中任取2個,有以下幾種可能:(A1,A2),(A1,A3),(A1,A4),(A1,A5),(A1,B),(A2,A3),(A2,A4),(A2,A5),(A2,B),(A3,A4),(A3,A5),(A3,B),(A4,A5),(A4,B)(A5,B),共15種.設“取出的2個樣本混凝土耐久性都達標”為事件A,它的對立事件eq\o(A,\s\up6(-))為“取出的2個樣本至少有1個混凝土耐久性不達標”,包含(A1,B),(A2,B),(A3,B),(A4,B),(A5,B),共5種可能.∴P(A)=1-P(eq\o(A,\s\up6(-)))=1-eq\f(5,15)=eq\f(2,3).即取出的2個樣本混凝土耐久性都達標的概率是eq\f(2,3).12.某食品廠為了檢查甲、乙兩條自動包裝流水線的生產(chǎn)情況,隨機在這兩條流水線上各抽取40件產(chǎn)品作為樣本稱出它們的重量(單位:克),重量值落在(495,510]的產(chǎn)品為合格品,否則為不合格品.左下表是甲流水線樣本頻數(shù)分布表,右下圖是乙流水線樣本的頻率分布直方圖.甲流水線樣本頻數(shù)分布表(1)根據(jù)上表數(shù)據(jù)作出甲流水線樣本的頻率分布直方圖;(2)若以頻率作為概率,試估計從兩條流水線分別任取1件產(chǎn)品,該產(chǎn)品恰好是合格品的概率;(3)由以上統(tǒng)計數(shù)據(jù)完成下面2×2列聯(lián)表,能否在犯錯誤的概率不超過的前提下認為產(chǎn)品的包裝質(zhì)量與兩條自動包裝流水線的選擇有關?甲流水線乙流水線合計合格品a=b=不合格品c=d=合計n=附:K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))P(K2≥k0)k0解析:(1)甲流水線樣本的頻率分布直方圖如下:(2)由題表知甲樣本中合格品數(shù)為8+14+8=30,由題圖知乙樣本中合格品數(shù)為++×5×40=36,故甲樣本合格品的頻率為eq\f(30,40)=,乙樣本合格品的頻率為eq\f(36,40)=.據(jù)此可估計從甲流水線任取1件產(chǎn)品,該產(chǎn)品恰好是合格品的概率為.從乙流水線任取1件產(chǎn)品,該產(chǎn)品恰好是合格品的概率為.(3)2×2列聯(lián)表如下:甲流水線乙流水線合計合格品a=30b=3666不合格品c=10d=414合計4040n=80∵K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))=eq\f(80×(120-360)2,66×14×40×40)≈>.∴在犯錯誤的概率不超過的前提下認為產(chǎn)品的包裝質(zhì)量與兩條自動包裝流水線的選擇有關.?品味高考1.為調(diào)查某地區(qū)老年人是否需要志愿者提供幫助,用簡單隨機抽樣方法從該地區(qū)調(diào)查了500位老人,結(jié)果如下:性別是否需要志愿者男女需要4030不需要160270(1)估計該地區(qū)老年人中需要志愿者提供幫助的老年人的比例.(2)能否在犯錯誤的概率不超過的前提下認為該地區(qū)的老年人是否需要志愿者提供幫助與性別有關?(3)根據(jù)(2)的結(jié)論,能否提出更好的調(diào)查辦法來估計該地區(qū)的老年人中需要志愿者提供幫助的老年人的比例?說明理由.附:K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))P(K2≥k0)k0解析:(1)調(diào)查的500位老年人中有70位需要志愿者提供幫助,因此該地區(qū)老年人中需要幫助的老年人的比例的估計值為eq\f(70,500)=14%.(2)K2的觀測值k=eq\f(500×(40×270-30×160)2,200×300×70×430)≈,由于>,所以在犯錯誤的概率不超過的前提下認為該地區(qū)的老年人是否需要志愿者提供幫助與性別有關.(3)由(2)的結(jié)論知,該地區(qū)的老年人是否需要志愿者提供幫助與性別有關,并且從樣本數(shù)據(jù)能看出該地區(qū)男性老年人與女性老年人中需要志愿者提供幫助的比例有明顯差異,因此在調(diào)查時,先確定該地區(qū)老年人中男、女的比例,再把老年人分成男、女兩層并采用分層抽樣方法抽樣調(diào)查,比采用簡單隨機
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中班語言活動不浪費水
- 新生兒過敏知識培訓
- 江西省宜春市豐城市第九中學2024-2025學年八年級上學期第一次段考化學試卷(含解析)
- 甘肅省會寧縣第四中學2024-2025學年高三上學期第一次月考化學試卷
- 全球無人機探測與防控系統(tǒng)市場運營現(xiàn)狀及發(fā)展策略研究報告2024-2030年
- 初中七年級生物上學期期中考前測試卷(人教版)含答案解析
- T-YNRZ 019-2024 珠芽黃魔芋組培種苗生產(chǎn)技術(shù)規(guī)程
- 內(nèi)蒙古自治區(qū)通遼市科爾沁左翼中旗聯(lián)盟校2024-2025學年六年級上學期期中考試英語試題
- 【課件】Unit+3+SectionB+1a-2b+課件人教版英語七年級上冊
- 高中語文11琵琶行并序錦瑟課件蘇教版必修
- 婦幼保健院急診預檢、分診流程圖
- B737-300輪艙部件圖
- 各種注射法(課堂PPT)
- 中國加工貿(mào)易的發(fā)展歷程與政策演變
- 譯林牛津英語7A-unit3-Welcome-to-our-school教案(6課時)
- 新規(guī)范箱涵結(jié)構(gòu)設計(單孔)
- 醫(yī)師執(zhí)業(yè)注冊授權(quán)委托書
- 飛利浦16排螺旋CT機操作規(guī)程(1)
- (完整版)初中英語同義詞(近義詞)歸納
- 質(zhì)量與安全監(jiān)測指標分析報告
- 北京營業(yè)性演出申請登記表
評論
0/150
提交評論