高中數(shù)學(xué)人教A版3第三章統(tǒng)計(jì)獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用_第1頁
高中數(shù)學(xué)人教A版3第三章統(tǒng)計(jì)獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用_第2頁
高中數(shù)學(xué)人教A版3第三章統(tǒng)計(jì)獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用_第3頁
高中數(shù)學(xué)人教A版3第三章統(tǒng)計(jì)獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用_第4頁
高中數(shù)學(xué)人教A版3第三章統(tǒng)計(jì)獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

3.2獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用[學(xué)習(xí)目標(biāo)]1.了解獨(dú)立性檢驗(yàn)的基本思想、方法及其簡單應(yīng)用;2.理解判斷兩個(gè)分類變量是否有關(guān)系的常用方法、獨(dú)立性檢驗(yàn)中K2的含義及其實(shí)施步驟.[知識鏈接]1.舉例說明什么是分類變量?答變量的不同“值”表示個(gè)體所屬的不同類別的變量稱為分類變量,分類變量的取值一定是離散的,而且不同的取值僅表示個(gè)體所屬的類別,如性別變量,只取男、女兩個(gè)值,商品的等級變量只取一級、二級、三級等等.2.什么是列聯(lián)表?怎樣從列聯(lián)表判斷兩個(gè)分類變量有無關(guān)系?答一般地,假設(shè)兩個(gè)分類變量X和Y,它們的值域分別為{x1,x2}和{y1,y2},列出兩個(gè)變量的頻數(shù)表,稱為列聯(lián)表(如下圖)y1y2總計(jì)x1aba+bx2cdc+d總計(jì)a+cb+da+b+c+d|ad-bc|越小,說明兩個(gè)分類變量x,y之間的關(guān)系越弱;|ad-bc|越大,說明兩個(gè)分類變量x,y之間的關(guān)系越強(qiáng).[預(yù)習(xí)導(dǎo)引]1.分類變量和列聯(lián)表(1)分類變量:變量的不同“值”表示個(gè)體所屬的不同類別,像這樣的變量稱為分類變量.(2)列聯(lián)表①定義:列出的兩個(gè)分類變量的頻數(shù)表稱為列聯(lián)表.②2×2列聯(lián)表一般地,假設(shè)兩個(gè)分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(也稱為2×2列聯(lián)表)為下表.y1y2總計(jì)x1aba+bx2cdc+d總計(jì)a+cb+da+b+c+d2.等高條形圖(1)等高條形圖與表格相比,更能直觀地反映出兩個(gè)分類變量間是否相互影響,常用等高條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征.(2)觀察等高條形圖發(fā)現(xiàn)eq\f(a,a+b)和eq\f(c,c+d)相差很大,就判斷兩個(gè)分類變量之間有關(guān)系.3.獨(dú)立性檢驗(yàn)(1)定義:利用隨機(jī)變量K2來判斷“兩個(gè)分類變量有關(guān)系”的方法稱為獨(dú)立性檢驗(yàn).(2)K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),其中n=a+b+c+d.(3)獨(dú)立性檢驗(yàn)的具體做法①根據(jù)實(shí)際問題的需要確定容許推斷“兩個(gè)分類變量有關(guān)系”犯錯(cuò)誤概率的上界α,然后查表確定臨界值k0.②利用公式計(jì)算隨機(jī)變量K2的觀測值k.③如果k≥k0,就推斷“X與Y有關(guān)系”,這種推斷犯錯(cuò)誤的概率不超過α,否則就認(rèn)為在犯錯(cuò)誤的概率不超過α的前提下不能推斷“X與Y有關(guān)系”,或者在樣本數(shù)據(jù)中沒有發(fā)現(xiàn)足夠證據(jù)支持結(jié)論“X與Y有關(guān)系”.要點(diǎn)一有關(guān)“相關(guān)的檢驗(yàn)”例1某校對學(xué)生課外活動進(jìn)行調(diào)查,結(jié)果整理成下表:用你所學(xué)過的知識進(jìn)行分析,能否在犯錯(cuò)誤的概率不超過的前提下,認(rèn)為“喜歡體育還是文娛與性別有關(guān)系”?體育文娛總計(jì)男生212344女生62935總計(jì)275279解判斷方法如下:假設(shè)H0“喜歡體育還是喜歡文娛與性別沒有關(guān)系”,若H0成立,則K2應(yīng)該很?。遖=21,b=23,c=6,d=29,n=79,∴K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))=eq\f(79×(21×29-23×6)2,44×35×27×52)≈.且P(K2≥≈即我們得到的K2的觀測值k≈超過,這就意味著:“喜歡體育還是文娛與性別沒有關(guān)系”這一結(jié)論成立的可能性小于,即在犯錯(cuò)誤的概率不超過的前提下認(rèn)為“喜歡體育還是喜歡文娛與性別有關(guān)”.規(guī)律方法(1)利用K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))求出K2的觀測值k的值.再利用臨界值的大小來判斷假設(shè)是否成立.(2)解題時(shí)應(yīng)注意準(zhǔn)確代數(shù)與計(jì)算,不可錯(cuò)用公式,準(zhǔn)確進(jìn)行比較與判斷.跟蹤演練1為研究學(xué)生的數(shù)學(xué)成績與對學(xué)習(xí)數(shù)學(xué)的興趣是否有關(guān),對某年級學(xué)生作調(diào)查得到如下數(shù)據(jù):成績優(yōu)秀成績較差總計(jì)興趣濃厚的643094興趣不濃厚的227395總計(jì)86103189判斷學(xué)生的數(shù)學(xué)成績好壞與對學(xué)習(xí)數(shù)學(xué)的興趣是否有關(guān)?解由公式得K2的觀測值k=eq\f(189×(64×73-22×30)2,86×103×95×94)≈.∵>,∴有%的把握說學(xué)生學(xué)習(xí)數(shù)學(xué)的興趣與數(shù)學(xué)成績是有關(guān)的.要點(diǎn)二有關(guān)“無關(guān)的檢驗(yàn)”例2為了探究學(xué)生選報(bào)文、理科是否與對外語的興趣有關(guān),某同學(xué)調(diào)查了361名高二在校學(xué)生,調(diào)查結(jié)果如下:理科對外語有興趣的有138人,無興趣的有98人,文科對外語有興趣的有73人,無興趣的有52人.分析學(xué)生選報(bào)文、理科與對外語的興趣是否有關(guān)?解列出2×2列聯(lián)表理文總計(jì)有興趣13873211無興趣9852150總計(jì)236125361代入公式得K2的觀測值k=eq\f(361×(138×52-73×98)2,236×125×211×150)≈×10-4.∵×10-4<,∴可以認(rèn)為學(xué)生選報(bào)文、理科與對外語的興趣無關(guān).規(guī)律方法運(yùn)用獨(dú)立性檢驗(yàn)的方法:(1)列出2×2列聯(lián)表,根據(jù)公式計(jì)算K2的觀測值k.(2)比較k與k0的大小作出結(jié)論.跟蹤演練2第16屆亞運(yùn)會于2023年11月12日至27日在中國廣州進(jìn)行,為了搞好接待工作,組委會招募了16名男志愿者和14名女志愿者,調(diào)查發(fā)現(xiàn),男、女志愿者中分別有10人和6人喜愛運(yùn)動,其余人不喜愛運(yùn)動.(1)根據(jù)以上數(shù)據(jù)完成以下2×2列聯(lián)表:喜愛運(yùn)動不喜愛運(yùn)動總計(jì)男1016女614總計(jì)30(2)根據(jù)列聯(lián)表的獨(dú)立性檢驗(yàn),能否在犯錯(cuò)誤的概率不超過的前提下認(rèn)為性別與喜愛運(yùn)動有關(guān)?解(1)喜愛運(yùn)動不喜愛運(yùn)動總計(jì)男10616女6814總計(jì)161430(2)假設(shè)是否喜愛運(yùn)動與性別無關(guān),由已知數(shù)據(jù)可求得:K2=eq\f(30×(10×8-6×6)2,(10+6)(6+8)(10+6)(6+8))≈5<,因此,在犯錯(cuò)誤的概率不超過的前提下不能判斷喜愛運(yùn)動與性別有關(guān).要點(diǎn)三獨(dú)立性檢驗(yàn)的基本思想例3某企業(yè)有兩個(gè)分廠生產(chǎn)某種零件,按規(guī)定內(nèi)徑尺寸(單位:mm)的值落在,的零件為優(yōu)質(zhì)品.從兩個(gè)分廠生產(chǎn)的零件中各抽出500件,量其內(nèi)徑尺寸,結(jié)果如下表:甲廠分組[,[,[,[,[,[,[,頻數(shù)12638618292614乙廠分組[,[,[,[,[,[,[,頻數(shù)297185159766218(1)試分別估計(jì)兩個(gè)分廠生產(chǎn)的零件的優(yōu)質(zhì)品率;(2)由以上統(tǒng)計(jì)數(shù)據(jù)填下面2×2列聯(lián)表,并問是否有99%的把握認(rèn)為“兩個(gè)分廠生產(chǎn)的零件的質(zhì)量有差異”.甲廠乙廠總計(jì)優(yōu)質(zhì)品非優(yōu)質(zhì)品總計(jì)附:K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),P(K2≥k0)k0解(1)甲廠抽查的產(chǎn)品中有360件優(yōu)質(zhì)品,從而甲廠生產(chǎn)的零件的優(yōu)質(zhì)品率估計(jì)為eq\f(360,500)=72%;乙廠抽查的產(chǎn)品中有320件優(yōu)質(zhì)品,從而乙廠生產(chǎn)的零件的優(yōu)質(zhì)品率估計(jì)為eq\f(320,500)=64%.(2)甲廠乙廠總計(jì)優(yōu)質(zhì)品360320680非優(yōu)質(zhì)品140180320總計(jì)5005001000K2=eq\f(1000×(360×180-320×140)2,500×500×680×320)≈>,所以有99%的把握認(rèn)為“兩個(gè)分廠生產(chǎn)的零件的質(zhì)量有差異”.規(guī)律方法(1)解答此類題目的關(guān)鍵在于正確利用K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))計(jì)算k的值,再用它與臨界值k0的大小作比較來判斷假設(shè)檢驗(yàn)是否成立,從而使問題得到解決.(2)此類題目規(guī)律性強(qiáng),解題比較格式化,填表計(jì)算分析比較即可,要熟悉其計(jì)算流程,不難理解掌握.跟蹤演練3下表是某地區(qū)的一種傳染病與飲用水的調(diào)查表:得病不得病總計(jì)干凈水52466518不干凈水94218312總計(jì)146684830(1)這種傳染病是否與飲用水的衛(wèi)生程度有關(guān),請說明理由;(2)若飲用干凈水得病5人,不得病50人,飲用不干凈水得病9人,不得病22人.按此樣本數(shù)據(jù)分析這種疾病是否與飲用水有關(guān),并比較兩種樣本在反映總體時(shí)的差異.解(1)假設(shè)H0:傳染病與飲用水無關(guān).把表中數(shù)據(jù)代入公式得:K2的觀測值k=eq\f(830×(52×218-466×94)2,146×684×518×312)≈,∵>,所以拒絕H0.因此我們有%的把握認(rèn)為該地區(qū)這種傳染病與飲用不干凈水有關(guān).(2)依題意得2×2列聯(lián)表:得病不得病總計(jì)干凈水55055不干凈水92231總計(jì)147286此時(shí),K2的觀測值k=eq\f(86×(5×22-50×9)2,14×72×55×31)≈.由于>,所以我們有%的把握認(rèn)為該種疾病與飲用不干凈水有關(guān).兩個(gè)樣本都能統(tǒng)計(jì)得到傳染病與飲用不干凈水有關(guān)這一相同結(jié)論,但(1)中我們有%的把握肯定結(jié)論的正確性,(2)中我們只有%的把握肯定.1.觀察下列各圖,其中兩個(gè)分類變量x,y之間關(guān)系最強(qiáng)的是()答案D解析觀察等高條形圖發(fā)現(xiàn)eq\f(x1,x1+y1)=eq\f(x2,x2+y2)相差很大,就判斷兩個(gè)分類變量之量關(guān)系最強(qiáng).2.下面是一個(gè)2×2列聯(lián)表:y1y2總計(jì)x1a2173x282533總計(jì)b46106則表中a,b處的值分別為()A.94,96B.52,50C.52,60D.54,52答案C解析∵a+21=73,∴a=52,b=a+8=52+8=60.3.經(jīng)過對K2的統(tǒng)計(jì)量的研究,得到了若干個(gè)臨界值,當(dāng)K2的觀測值k>時(shí),我們()A.在犯錯(cuò)誤的概率不超過的前提下可認(rèn)為X與Y有關(guān)B.在犯錯(cuò)誤的概率不超過的前提下可認(rèn)為X與Y無關(guān)C.在犯錯(cuò)誤的概率不超過的前提下可認(rèn)為X與Y有關(guān)D.沒有充分理由說明事件X與Y有關(guān)系答案A4.根據(jù)下表計(jì)算:不看電視看電視男3785女35143K2的觀測值k≈________(保留3位小數(shù)).答案解析k=eq\f(300×(37×143-85×35)2,122×178×72×228)≈.1.列聯(lián)表與等高條形圖列聯(lián)表由兩個(gè)分類變量之間頻率大小差異說明這兩個(gè)變量之間是否有關(guān)聯(lián)關(guān)系,而利用等高條形圖能形象直觀地反映它們之間的差異,進(jìn)而推斷它們之間是否具有關(guān)聯(lián)關(guān)系.2.對獨(dú)立性檢驗(yàn)思想的理解獨(dú)立性檢驗(yàn)的基本思想類似于數(shù)學(xué)中的反證法.先假設(shè)“兩個(gè)分類變量沒有關(guān)系”成立,計(jì)算隨機(jī)變量K2的值,如果K2值很大,說明假設(shè)不合理.K2越大,兩個(gè)分類變量有關(guān)系的可能性越大.一、基礎(chǔ)達(dá)標(biāo)1.下面說法正確的是()A.統(tǒng)計(jì)方法的特點(diǎn)是統(tǒng)計(jì)推斷準(zhǔn)確、有效B.獨(dú)立性檢驗(yàn)的基本思想類似于數(shù)學(xué)上的反證法C.任何兩個(gè)分類變量有關(guān)系的可信度都可以通過查表得到D.不能從等高條形圖中看出兩個(gè)分類變量是否相關(guān)答案B2.用獨(dú)立性檢驗(yàn)來考察兩個(gè)分類變量x與y是否有關(guān)系,當(dāng)統(tǒng)計(jì)量K2的觀測值()A.越大,“x與y有關(guān)系”成立的可能性越小B.越大,“x與y有關(guān)系”成立的可能性越大C.越小,“x與y沒有關(guān)系”成立的可能性越小D.與“x與y有關(guān)系”成立的可能性無關(guān)答案B3.在一個(gè)2×2列聯(lián)表中,由其數(shù)據(jù)計(jì)算得K2的觀測值k=,則這兩個(gè)變量間有關(guān)系的可能性為()A.99%B.%C.%D.無關(guān)系答案A解析K2的觀測值<k<,所以有99%的把握認(rèn)為兩個(gè)變量有關(guān)系.4.對兩個(gè)分類變量A,B的下列說法中正確的個(gè)數(shù)為()①A與B無關(guān),即A與B互不影響;②A與B關(guān)系越密切,則K2的值就越大;③K2的大小是判定A與B是否相關(guān)的唯一依據(jù)A.0B.1C.2D.3答案B解析①正確,A與B無關(guān)即A與B相互獨(dú)立;②不正確,K2的值的大小只是用來檢驗(yàn)A與B是否相互獨(dú)立;③不正確,例如借助三維柱形圖、二維條形圖等.故選B.5.如果K2的觀測值為,可以認(rèn)為“x與y無關(guān)”的可信度是________.答案1%解析查表可知可信度為1%.6.為了解高中生作文成績與課外閱讀量之間的關(guān)系,某研究機(jī)構(gòu)隨機(jī)抽取了60名高中生,通過問卷調(diào)查,得到以下數(shù)據(jù):作文成績優(yōu)秀作文成績一般總計(jì)課外閱讀量較大221032課外閱讀量一般82028總計(jì)303060由以上數(shù)據(jù),計(jì)算得到K2的觀測值k≈,根據(jù)臨界值表,有________把握認(rèn)為課外閱讀量大與作文成績優(yōu)秀有關(guān).答案%解析根據(jù)臨界值表,>,在犯錯(cuò)誤的概率不超過的前提下,認(rèn)為課外閱讀量大與作文成績優(yōu)秀有關(guān),即有%的把握認(rèn)為課外閱讀量大與作文成績優(yōu)秀有關(guān).7.在某測試中,卷面滿分為100分,60分為及格,為了調(diào)查午休對本次測試前兩個(gè)月復(fù)習(xí)效果的影響,特對復(fù)習(xí)中進(jìn)行午休和不進(jìn)行午休的考生進(jìn)行了測試成績的統(tǒng)計(jì),數(shù)據(jù)如下表所示:分?jǐn)?shù)段29~4041~5051~6061~7071~8081~9091~100午休考生人數(shù)23473021143114不午休考生人數(shù)1751671530173(1)根據(jù)上述表格完成列聯(lián)表:及格人數(shù)不及格人數(shù)總計(jì)午休不午休總計(jì)(2)根據(jù)列聯(lián)表可以得出什么樣的結(jié)論?對今后的復(fù)習(xí)有什么指導(dǎo)意義?解(1)根據(jù)題表中數(shù)據(jù)可以得到列聯(lián)表如下:及格人數(shù)不及格人數(shù)總計(jì)午休80100180不午休65135200總計(jì)145235380(2)計(jì)算可知,午休的考生及格率為P1=eq\f(80,180)=eq\f(4,9),不午休的考生的及格率為P2=eq\f(65,200)=eq\f(13,40),則P1>P2,因此,可以粗略判斷午休與考生考試及格有關(guān)系,并且午休的及格率高,所以在以后的復(fù)習(xí)中考生應(yīng)盡量適當(dāng)午休,以保持最佳的學(xué)習(xí)狀態(tài).二、能力提升8.在等高條形圖中,下列哪兩個(gè)比值相差越大,要推斷的論述成立的可能性就越大()\f(a,a+b)與eq\f(d,c+d)\f(c,a+b)與eq\f(a,c+d)\f(a,a+b)與eq\f(c,c+d)\f(a,a+b)與eq\f(c,b+c)答案C解析由等高條形圖可知eq\f(a,a+b)與eq\f(c,c+d)的值相差越大,|ad-bc|就越大,相關(guān)性就越強(qiáng).9.考察棉花種子經(jīng)過處理跟生病之間的關(guān)系得到下表數(shù)據(jù):種子處理種子未處理總計(jì)得病32101133不得病61213274總計(jì)93314407根據(jù)以上數(shù)據(jù),可得出()A.種子是否經(jīng)過處理跟是否生病有關(guān)B.種子是否經(jīng)過處理跟是否生病無關(guān)C.種子是否經(jīng)過處理決定是否生病D.以上都是錯(cuò)誤的答案B解析由K2=eq\f(407×(32×213-61×101)2,93×314×133×274)≈<,即沒有把握認(rèn)為種子是否經(jīng)過處理跟是否生病有關(guān).10.為研究某新藥的療效,給50名患者服用此藥,跟蹤調(diào)查后得下表中的數(shù)據(jù):無效有效總計(jì)男性患者153550女性患者64450總計(jì)2179100設(shè)H0:服用此藥的效果與患者的性別無關(guān),則K2的觀測值k≈________(小數(shù)點(diǎn)后保留三位有效數(shù)字),從而得出結(jié)論:服用此藥的效果與患者的性別有關(guān),這種判斷出錯(cuò)的可能性為________.答案5%解析由公式計(jì)算得K2的觀測值k≈,∵k>,∴我們有95%的把握認(rèn)為服用此藥的效果與患者的性別有關(guān),從而有5%的可能性出錯(cuò).11.高中流行這樣一句話“文科就怕數(shù)學(xué)不好,理科就怕英語不好”.下表是一次針對高三文科學(xué)生的調(diào)查所得數(shù)據(jù),試問:在出錯(cuò)概率不超過的前提下,能否判斷“文科學(xué)生總成績不好與數(shù)學(xué)成績不好有關(guān)系”?總成績不好總成績好總計(jì)數(shù)學(xué)成績不好47812490數(shù)學(xué)成績好39924423總計(jì)87736913解依題意,計(jì)算隨機(jī)變量K2的觀測值:k=eq\f(913×(478×24-399×12)2,490×423×877×36)≈>,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論