【數(shù)學(xué)】獨(dú)立性檢驗(yàn) 課件-2023-2024學(xué)年高二下學(xué)期數(shù)學(xué)人教A版2019選擇性必修三冊(cè)_第1頁(yè)
【數(shù)學(xué)】獨(dú)立性檢驗(yàn) 課件-2023-2024學(xué)年高二下學(xué)期數(shù)學(xué)人教A版2019選擇性必修三冊(cè)_第2頁(yè)
【數(shù)學(xué)】獨(dú)立性檢驗(yàn) 課件-2023-2024學(xué)年高二下學(xué)期數(shù)學(xué)人教A版2019選擇性必修三冊(cè)_第3頁(yè)
【數(shù)學(xué)】獨(dú)立性檢驗(yàn) 課件-2023-2024學(xué)年高二下學(xué)期數(shù)學(xué)人教A版2019選擇性必修三冊(cè)_第4頁(yè)
【數(shù)學(xué)】獨(dú)立性檢驗(yàn) 課件-2023-2024學(xué)年高二下學(xué)期數(shù)學(xué)人教A版2019選擇性必修三冊(cè)_第5頁(yè)
已閱讀5頁(yè),還剩28頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

8.3.2獨(dú)立性檢驗(yàn)學(xué)習(xí)目標(biāo)

基于2×2列聯(lián)表,通過(guò)實(shí)例了解獨(dú)立性檢驗(yàn)的基本思想,掌握獨(dú)立性檢驗(yàn)的基本步驟,會(huì)用獨(dú)立性檢驗(yàn)解決簡(jiǎn)單的實(shí)際問(wèn)題,提升數(shù)據(jù)分析能力。3學(xué)習(xí)重點(diǎn):獨(dú)立性檢驗(yàn)的思想和方法。學(xué)習(xí)難點(diǎn):χ2統(tǒng)計(jì)量的導(dǎo)出和意義,獨(dú)立性檢驗(yàn)的思想和方法。

在現(xiàn)實(shí)問(wèn)題中,我們常常需要推斷兩個(gè)分類(lèi)變量之間是否存在關(guān)聯(lián),通過(guò)分類(lèi)變量的樣本觀測(cè)數(shù)據(jù)(2×2列聯(lián)表),依據(jù)隨機(jī)事件頻率的穩(wěn)定性推斷兩個(gè)分類(lèi)變量之間是否有關(guān)聯(lián).

通過(guò)上節(jié)課的學(xué)習(xí)我們已經(jīng)知道,對(duì)于隨機(jī)樣本而言,因?yàn)轭l率具有隨機(jī)性,頻率與概率之間存在誤差,所以我們的推斷可能犯錯(cuò)誤,而且在樣本容量較小時(shí),犯錯(cuò)誤的可能性會(huì)較大.因此需要找到一種更為合理的推斷方法,同時(shí)也希望能對(duì)出現(xiàn)錯(cuò)誤推斷的概率有一定的控制或估算.這是本節(jié)課的主要任務(wù)。環(huán)節(jié)一:創(chuàng)設(shè)情境,引入課題

問(wèn)題1:在上節(jié)例1中,我們通過(guò)頻率比較得到“兩所學(xué)校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率存在差異”的結(jié)論,但由于數(shù)據(jù)的隨機(jī)性,這一推斷有可能是錯(cuò)誤的.那么犯錯(cuò)誤的概率有多大呢、如何從概率的角度去研究?jī)蓚€(gè)分類(lèi)變量X和Y是否有關(guān)聯(lián)?設(shè)X和Y為定義在樣本空間Ω上的兩個(gè)分類(lèi)變量,可設(shè)X,Y∈{0,1}.例:我們希望判別的是學(xué)校因素是否影響學(xué)生的數(shù)學(xué)成績(jī),即事件{Y=1}和{X=1}或{X=0}之間是否有關(guān)聯(lián).用概率語(yǔ)言表示,就是判斷下面的關(guān)系是否成立:H0:P(Y=1|X=0)=P(Y=1|X=1)考慮以Ω為樣本空間的古典概型,設(shè)X和Y為定義在Ω上,取值于{0,1}的成對(duì)分類(lèi)變量,判斷事件{X=1}和{Y=1}之間是否有關(guān)聯(lián).即判斷下面的假定關(guān)系H0:P(Y=1|X=0)=P(Y=1|X=1)是否成立,通常稱(chēng)H0為零假設(shè)或原假設(shè).注意:{X=0}和{X=1},{Y=0}和{Y=1}都是互對(duì)立事件.

P(Y=1|X=0)表示從{X=0}中隨機(jī)選取一個(gè)樣本點(diǎn),該樣本點(diǎn)屬于{X=0,Y=1}的概率;P(Y=1|X=1)表示從{X=1}中隨機(jī)選取一個(gè)樣本點(diǎn),該樣本點(diǎn)屬于{X=1,Y=1}的概率.思考:請(qǐng)用條件概率的知識(shí),分析零假設(shè),給出分類(lèi)變量X和Y獨(dú)立的定義.由條件概率的定義可知,零假設(shè)H0等價(jià)于或P(X=0,Y=1)P(X=1)=P(X=1,Y=1)P(X=0)①因?yàn)閧X=0}和{X=1}為對(duì)立事件,P(X=0)=1-P(X=1)所以P(X=0,Y=1)=P(Y=1)-P(X=1,Y=1).①式等價(jià)于P(X=1)P(Y=1)=P(X=1,Y=1).因此,零假設(shè)H0等價(jià)于{X=1}和{Y=1}獨(dú)立.{X=0}與{Y=0}獨(dú)立;{X=0}與{Y=1}獨(dú)立;{X=1}與{Y=0}獨(dú)立;{X=1}與{Y=1}獨(dú)立.根據(jù)已經(jīng)學(xué)過(guò)的概率知識(shí),下面的四條性質(zhì)彼此等價(jià):以上性質(zhì)成立,分類(lèi)變量X和Y獨(dú)立,即下面四個(gè)等式成立:H0:分類(lèi)變量X和Y獨(dú)立.用概率語(yǔ)言,將零假設(shè)改述為P(X=0,Y=0)=P(X=0)P(Y=0);P(X=0,Y=1)=P(X=0)P(Y=1);P(X=1,Y=0)=P(X=1)P(Y=0);P(X=1,Y=1)=P(X=1)P(Y=1).②根據(jù)我們通過(guò)簡(jiǎn)單隨機(jī)抽樣得到了X和Y的抽樣數(shù)據(jù)列聯(lián)表,如表8.3-3所示.XY合計(jì)Y=0Y=1X=0aba+bX=1cdc+d合計(jì)a+cb+dn=a+b+c+d對(duì)于隨機(jī)樣本,表8.3-3中的頻數(shù)a,b,c,d都是隨機(jī)變量,而表8.3-2中的響應(yīng)數(shù)據(jù)是這些隨機(jī)變量的一次觀測(cè)結(jié)果.思考:如何基于②中的四個(gè)等式及列聯(lián)表8.3-3中的數(shù)據(jù),構(gòu)造適當(dāng)?shù)慕y(tǒng)計(jì)量,對(duì)成對(duì)的分類(lèi)變量X和Y是否相互獨(dú)立作出推斷?環(huán)節(jié)二:觀察分析,感知概念綜合②中的四個(gè)式子,如果零假設(shè)H0成立,下面四個(gè)量的取值都不應(yīng)該太大:

反之,當(dāng)這些量的取值較大時(shí),就可以推斷H0不成立. 一般來(lái)說(shuō),若頻數(shù)的期望值較大,則③中相應(yīng)的差的絕對(duì)值也會(huì)較大;而若頻數(shù)的期望值較小,則③中相應(yīng)的差的絕對(duì)值也會(huì)較小.為了合理地平衡這種影響,作如下處理:化簡(jiǎn)得環(huán)節(jié)三:抽象概括,形成概念

0.10.050.010.0050.0012.7063.8416.6357.87910.828表8.3-4χ2獨(dú)立性檢驗(yàn)中幾個(gè)常用的小概率值和相應(yīng)的臨界值.我們推斷H0不成立,即認(rèn)為X和Y不獨(dú)立,該推斷犯錯(cuò)誤的概率不超過(guò)0.05;(2)當(dāng)χ2<x0.05=3.841時(shí),我們沒(méi)有充分證據(jù)推斷H0不成立,可以認(rèn)為X和Y獨(dú)立.例如:對(duì)于小概率值α=0.05,我們有如下的具體檢測(cè)規(guī)則:(1)當(dāng)χ2≥x0.05=3.841時(shí),α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828環(huán)節(jié)四:辨析理解,深化概念學(xué)校數(shù)學(xué)成績(jī)合計(jì)不優(yōu)秀(Y=0)優(yōu)秀(Y=1)甲校(X=0)331043乙校(X=1)38745合計(jì)711788

解:零假設(shè)為H0:分類(lèi)變量X與Y相互獨(dú)立,即兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率無(wú)差異.計(jì)算得:

上節(jié)例1沒(méi)有考慮由樣本隨機(jī)性可能導(dǎo)致的錯(cuò)誤,推斷依據(jù)不太充分.

當(dāng)我們接受零假設(shè)H0時(shí),也可能犯錯(cuò)誤.我們不知道犯這類(lèi)錯(cuò)誤的概率p的大小,但是知道,若α越大,則p越小

療法療效合計(jì)未治愈治愈甲155267乙66369合計(jì)21115136解:零假設(shè)為H0:療法與療效獨(dú)立,即兩種療法效果沒(méi)有差異.將所給數(shù)據(jù)進(jìn)行整理,得到兩種療法治療數(shù)據(jù)的列聯(lián)表,根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計(jì)算得到

x

療法療效合計(jì)未治愈治愈甲155267乙66369合計(jì)21115136療法療效合計(jì)未治愈治愈乙66369甲155267合計(jì)21115136療法療效合計(jì)治愈未治愈甲521567乙63669合計(jì)11521136

例4:為了調(diào)查吸煙是否對(duì)肺癌有影響,某腫瘤研究所采取有放回簡(jiǎn)單隨機(jī)抽樣,調(diào)查了9965人,得到如下結(jié)果(單位:人)依據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),分析吸煙是否會(huì)增加患肺癌的風(fēng)險(xiǎn).解:零假設(shè)為H0:吸煙和患肺癌之間無(wú)關(guān)聯(lián),根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計(jì)算得χ2=

根據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),推斷H0不成立,即認(rèn)為吸煙與患肺癌有關(guān)聯(lián),此推斷犯錯(cuò)誤的概率不大于0.001,即我們有99.9%的把握認(rèn)為“吸煙與患肺癌有關(guān)系”.吸煙肺癌合計(jì)非肺癌患者肺癌患者非吸煙者7775427817吸煙者2099492148合計(jì)9874919965環(huán)節(jié)五:課堂練習(xí),鞏固運(yùn)用根據(jù)表中的數(shù)據(jù)計(jì)算不吸煙者中不患肺癌和患肺癌的頻率分別為吸煙者中不患肺癌和患肺癌的頻率分別為 可見(jiàn),在被調(diào)查者中,吸煙者患肺癌的頻率是不吸煙者患肺癌頻率的4倍以上.于是,根據(jù)頻率穩(wěn)定于概率的原理,我們可以認(rèn)為吸煙者患肺癌的概率明顯大于不吸煙者患肺癌概率,即吸煙更容易引發(fā)肺癌.由通過(guò)頻率分析吸煙對(duì)患肺癌影響的規(guī)律:

應(yīng)用獨(dú)立性檢驗(yàn)解決實(shí)際問(wèn)題大致應(yīng)包括以下幾個(gè)主要環(huán)節(jié):歸納總結(jié)1.小概率值α的臨界值:忽略χ2的實(shí)際分布與該近似分布的誤差后,對(duì)于任何小概率值α,可以找到相應(yīng)的正實(shí)數(shù)xα,使得P(χ2≥xα)=α成立.我們稱(chēng)xα為α的臨界值,這個(gè)臨界值就可作為判斷χ2大小的標(biāo)準(zhǔn),概率值α越小,臨界值xα越大.2.χ2計(jì)算公式:3.基于小概率值α的檢驗(yàn)規(guī)則是:當(dāng)χ2≥xα?xí)r,我們就推斷H0不成立,即認(rèn)為X和Y不獨(dú)立,該推斷犯錯(cuò)誤的概率不超過(guò)α;當(dāng)χ2<xα?xí)r,我們沒(méi)有充分證據(jù)推斷H0不成立,可以認(rèn)為X和Y獨(dú)立.環(huán)節(jié)六:歸納總結(jié),反思提升4.分類(lèi)變量X和Y的抽樣數(shù)據(jù)的2×2列聯(lián)表:5.獨(dú)立性檢驗(yàn)的一般步驟:(1)提出零假設(shè)H0:X和Y相互獨(dú)立,并給出在問(wèn)題中的解釋.(2)根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計(jì)算χ2的值,并與臨界值xα比較.(3)根據(jù)檢驗(yàn)規(guī)則得出推斷結(jié)論.(4)在X和Y不獨(dú)立的情況下,根據(jù)需要,通過(guò)比較相應(yīng)的頻率,分析X和Y間的影響規(guī)律.n=a+b+c+db+da+c合計(jì)c+ddcX=1a+bbaX=0Y=1Y=0合計(jì)YX

環(huán)節(jié)七:目標(biāo)檢測(cè),作業(yè)布置練習(xí)

第134頁(yè)療法療效合計(jì)未治愈治愈甲155267乙66369合計(jì)211151362.根據(jù)同一抽查數(shù)據(jù)推斷兩個(gè)分類(lèi)變量之間是否有關(guān)聯(lián),應(yīng)用不同的小概率值,是否會(huì)得出不同的結(jié)論?為什么?3.為考察某種藥物A對(duì)預(yù)防疾病B的效果,進(jìn)行了動(dòng)物試驗(yàn),根據(jù)105個(gè)有放回簡(jiǎn)單隨機(jī)樣本的數(shù)據(jù),得到如下列聯(lián)表:藥物A疾病B合計(jì)未患病患病未服用291544服用471461合計(jì)7629105單位:只零假設(shè)H0為:藥物A與預(yù)防疾病B無(wú)關(guān)聯(lián),即藥物A對(duì)預(yù)防疾病B沒(méi)有效果.4.從某學(xué)校獲取了容量為400的有放回簡(jiǎn)單隨

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論