分類變量與列聯(lián)表高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修三_第1頁(yè)
分類變量與列聯(lián)表高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修三_第2頁(yè)
分類變量與列聯(lián)表高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修三_第3頁(yè)
分類變量與列聯(lián)表高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修三_第4頁(yè)
分類變量與列聯(lián)表高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修三_第5頁(yè)
已閱讀5頁(yè),還剩30頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

8.3列聯(lián)表與獨(dú)立性檢驗(yàn)學(xué)習(xí)目標(biāo)1.通過實(shí)例,理解2×2的統(tǒng)計(jì)意義。2.通過實(shí)例,了解2×2列聯(lián)表與獨(dú)立性檢驗(yàn)及其應(yīng)用。重點(diǎn):獨(dú)立性檢驗(yàn)的基本思想、獨(dú)立性檢驗(yàn)的基本方法;難點(diǎn):χ2的含義、獨(dú)立性檢驗(yàn)及其應(yīng)用在現(xiàn)實(shí)生活中,人們經(jīng)常需要回答一定范圍內(nèi)的兩種現(xiàn)象或性質(zhì)之間是否存在關(guān)聯(lián)性或互相影響的問題。例如:就讀不同學(xué)校是否對(duì)學(xué)生的成績(jī)有影響,不同班級(jí)學(xué)生用于體育鍛煉的時(shí)間是否存在區(qū)別,吸煙是否會(huì)增加患肺癌的風(fēng)險(xiǎn)等。為了方便表述eg:班級(jí):1、2、3,男生、女生:0、1本節(jié)主要討論取值于{0,1}的分類變量的關(guān)聯(lián)性。在討論上述問題時(shí),為了表述方便,我們經(jīng)常會(huì)使用一種特殊的隨機(jī)變量,以區(qū)別不同的現(xiàn)象或性質(zhì),這類隨機(jī)變量稱為分類變量比較經(jīng)常鍛煉的學(xué)生在女生和男中的比率.男生經(jīng)常鍛煉的比率比女生高出15.4個(gè)百分點(diǎn),所以該校的女生和男生在體育鍛煉的經(jīng)常性方面有差異,而且男生更經(jīng)常鍛煉。解法一:?jiǎn)栴}1:為了有針對(duì)性地提高學(xué)生體育鍛煉的積極性,某中學(xué)需要了解性別因素是否對(duì)本校學(xué)生體育鍛煉的經(jīng)常性有影響,為此對(duì)學(xué)生是否經(jīng)常鍛煉的情況進(jìn)行了普查.全校學(xué)生的普查數(shù)據(jù)如下:523名女生中有331名經(jīng)常鍛煉;601名男生中有473名經(jīng)常鍛煉。你能利用這些數(shù)據(jù),說明該校女生和男生在體育鍛煉的經(jīng)常性方面是否存在差異嗎?解法二:對(duì)于Ω中的每一名學(xué)生,分別令性別對(duì)體育鍛煉的經(jīng)常性沒有影響:性別對(duì)體育鍛煉的經(jīng)常性有影響:?jiǎn)栴}1:為了有針對(duì)性地提高學(xué)生體育鍛煉的積極性,某中學(xué)需要了解性別因素是否對(duì)本校學(xué)生體育鍛煉的經(jīng)常性有影響,為此對(duì)學(xué)生是否經(jīng)常鍛煉的情況進(jìn)行了普查.全校學(xué)生的普查數(shù)據(jù)如下:523名女生中有331名經(jīng)常鍛煉;601名男生中有473名經(jīng)常鍛煉。你能利用這些數(shù)據(jù),說明該校女生和男生在體育鍛煉的經(jīng)常性方面是否存在差異嗎?性別鍛煉合計(jì)不經(jīng)常(Y=0)經(jīng)常(Y=1)女生(X=0)男生(X=1)合計(jì)問題1:為了有針對(duì)性地提高學(xué)生體育鍛煉的積極性,某中學(xué)需要了解性別因素是否對(duì)本校學(xué)生體育鍛煉的經(jīng)常性有影響,為此對(duì)學(xué)生是否經(jīng)常鍛煉的情況進(jìn)行了普查.全校學(xué)生的普查數(shù)據(jù)如下:523名女生中有331名經(jīng)常鍛煉;601名男生中有473名經(jīng)常鍛煉。你能利用這些數(shù)據(jù),說明該校女生和男生在體育鍛煉的經(jīng)常性方面是否存在差異嗎?19233112847352360132080411242?2列聯(lián)表的概念XY合計(jì)Y=0Y=1X=0aba+bX=1cdc+d合計(jì)a+cb+dn=a+b+c+d分類變量X和Y的抽樣數(shù)據(jù)的2?2列聯(lián)表:用途:可以清晰的給出成對(duì)分類變量數(shù)據(jù)的交叉分類頻數(shù)。在上面問題的兩種解答中,使用了學(xué)校全部學(xué)生的調(diào)查數(shù)據(jù),利用這些數(shù)據(jù)能夠完全確定解答問題所需的比率和條件概率.然而,對(duì)于大多數(shù)實(shí)際問題,我們無法獲得所關(guān)心的全部對(duì)象的數(shù)據(jù),因此無法準(zhǔn)確計(jì)算出有關(guān)的比率或條件概率.在這種情況下,上述古典概型和條件概率的觀點(diǎn)為我們提供了一個(gè)解決問題的思路.比較簡(jiǎn)單的做法是利用隨機(jī)抽樣獲得一定數(shù)量的樣本數(shù)據(jù),再利用隨機(jī)事件發(fā)生的頻率穩(wěn)定于概率的原理對(duì)問題答案作出推斷。例1:為比較甲、乙兩所學(xué)校學(xué)生的數(shù)學(xué)水平,采用簡(jiǎn)單隨機(jī)抽樣的方法抽取88名學(xué)生.通過測(cè)驗(yàn)得到了如下數(shù)據(jù):甲校43名學(xué)生中有10名數(shù)學(xué)成績(jī)優(yōu)秀;乙校45名學(xué)生中有7名數(shù)學(xué)成績(jī)優(yōu)秀.試分析兩校學(xué)生中數(shù)學(xué)成績(jī)優(yōu)秀率之間是否存在差異.例1:為比較甲、乙兩所學(xué)校學(xué)生的數(shù)學(xué)水平,采用簡(jiǎn)單隨機(jī)抽樣的方法抽取88名學(xué)生.通過測(cè)驗(yàn)得到了如下數(shù)據(jù):甲校43名學(xué)生中有10名數(shù)學(xué)成績(jī)優(yōu)秀;乙校45名學(xué)生中有7名數(shù)學(xué)成績(jī)優(yōu)秀.試分析兩校學(xué)生中數(shù)學(xué)成績(jī)優(yōu)秀率之間是否存在差異.解:用Ω表示兩所學(xué)校的全體學(xué)生構(gòu)成的集合.考慮以Ω為樣本空間的古典概型.對(duì)于Ω中每一名學(xué)生,定義分類變量X和Y如下:

學(xué)校數(shù)學(xué)成績(jī)合計(jì)不優(yōu)秀(Y=0)優(yōu)秀(Y=1)甲校(X=0)331043乙校(X=1)38745合計(jì)711788所以

例1:為比較甲、乙兩所學(xué)校學(xué)生的數(shù)學(xué)水平,采用簡(jiǎn)單隨機(jī)抽樣的方法抽取88名學(xué)生.通過測(cè)驗(yàn)得到了如下數(shù)據(jù):甲校43名學(xué)生中有10名數(shù)學(xué)成績(jī)優(yōu)秀;乙校45名學(xué)生中有7名數(shù)學(xué)成績(jī)優(yōu)秀.試分析兩校學(xué)生中數(shù)學(xué)成績(jī)優(yōu)秀率之間是否存在差異.解:我們可以用等高堆積條形圖直觀地展示上述計(jì)算結(jié)果:

通過比較發(fā)現(xiàn),兩個(gè)學(xué)校學(xué)生抽樣數(shù)據(jù)中數(shù)學(xué)成績(jī)優(yōu)秀的頻率存在差異,甲校的頻率明顯高于乙校的頻率.依據(jù)頻率穩(wěn)定于概率的原理,我們可以推斷那么甲校學(xué)生數(shù)學(xué)成績(jī)優(yōu)秀的概率大于乙校學(xué)生數(shù)學(xué)成績(jī)優(yōu)秀的概率.因此,可以認(rèn)為兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率存在差異,甲校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率比乙校學(xué)生的高.方法總結(jié)判斷兩個(gè)分類變量之間相關(guān)性的方法:1.頻率分析法:通過列聯(lián)表中與的差可粗略地判斷,相差越大,分類變量的相關(guān)性越強(qiáng),獨(dú)立性越弱2.圖形分析法:通過等高堆積條形圖的高度差可粗略地判斷,相差越大,分類變量的相關(guān)性越強(qiáng),獨(dú)立性越弱跟蹤訓(xùn)練1.1為了解對(duì)某班學(xué)生經(jīng)常打籃球和性別是否有關(guān),對(duì)該班40名學(xué)生進(jìn)行了問卷調(diào)查,得到如下的2×2列聯(lián)表.性別打籃球合計(jì)經(jīng)常不經(jīng)常男生m420女生8

20合計(jì)

n40則m=_____,n=_____.1616題型一列聯(lián)表完善與分析跟蹤訓(xùn)練1.2觀察下列各圖,其中兩個(gè)分類變量x,y之間關(guān)系最強(qiáng)的是()題型一列聯(lián)表完善與分析問題2:你認(rèn)為“兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率存在差異”這一結(jié)論是否有可能

是錯(cuò)誤的?答:有可能?!皟尚W(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率存在差異”這個(gè)結(jié)論是根據(jù)兩個(gè)頻率間存在差異推斷出來的.有可能出現(xiàn)這種情況:在隨機(jī)抽取的這個(gè)樣本中,兩個(gè)頻率間確實(shí)存在差異,但兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率實(shí)際上是沒有差別的.對(duì)于隨機(jī)樣本而言,因?yàn)轭l率具有隨機(jī)性,頻率與概率之間存在誤差,所以我們的推斷可能犯錯(cuò)誤,而且在樣本容量較小時(shí),犯錯(cuò)誤的可能性會(huì)較大.因此,需要找到一種更為合理的推斷方法,同時(shí)也希望能對(duì)出現(xiàn)錯(cuò)誤推斷的概率有一定的控制或估算.獨(dú)立性檢驗(yàn)方法1.獨(dú)立性檢驗(yàn):利用χ2的取值推斷分類變量X和Y是否獨(dú)立的方法稱為χ2獨(dú)立性檢驗(yàn),讀作“

”,簡(jiǎn)稱

.2.χ2=

,其中n=a+b+c+d.注意點(diǎn):(1)χ2越大,相關(guān)性越強(qiáng),獨(dú)立性越弱;χ2越小,相關(guān)性越弱,獨(dú)立性越強(qiáng).(2)當(dāng)χ2≥xα?xí)r,我們就推斷H0不成立,即認(rèn)為X和Y不獨(dú)立,該推斷犯錯(cuò)誤的概率不超過α;當(dāng)χ2<xα?xí)r,我們沒有充分證據(jù)推斷H0不成立

,可以認(rèn)為X和Y獨(dú)立.提出零假設(shè)(原假設(shè))H0:分類變量X和Y獨(dú)立.1.獨(dú)立性檢驗(yàn)公式及定義

:卡方獨(dú)立性檢驗(yàn)獨(dú)立性檢驗(yàn)2.臨界值的定義:

α0.10.050.010.0050.001Xα2.7063.8416.6357.87910.828

題型二

隨機(jī)變量χ2的意義經(jīng)典例題α0.100.050.0250.0100.0050.001xα2.7063.8415.0246.6357.87910.828A.大于10.828B.大于3.841C.小于6.635 D.大于2.706例2依據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),認(rèn)為“X與Y有關(guān)系”,隨機(jī)變量χ2必須滿足(

)經(jīng)典例題【跟蹤訓(xùn)練】2

題型二

隨機(jī)變量χ2的意義

解:零假設(shè)為H0:療法與療效獨(dú)立,即兩種療法效果沒有差異.將所給數(shù)據(jù)進(jìn)行整理,得到兩種療法治療數(shù)據(jù)的列聯(lián)表,療法療效合計(jì)未治愈治愈甲155267乙66369合計(jì)21115136

不影響療法療效合計(jì)未治愈治愈甲155267乙66369合計(jì)21115136療法療效合計(jì)未治愈治愈乙66369甲155267合計(jì)21115136療法療效合計(jì)治愈未治愈甲521567乙63669合計(jì)11521136

解:零假設(shè)為H0:療法與療效獨(dú)立,即兩種療法效果沒有差異.將所給數(shù)據(jù)進(jìn)行整理,得到兩種療法治療數(shù)據(jù)的列聯(lián)表,療法療效合計(jì)未治愈治愈甲155267乙66369合計(jì)21115136

解:

因此可以推斷乙種療法的效果比甲種療法好。方法總結(jié)獨(dú)立性檢驗(yàn)的基本步驟:①提出零假設(shè)H0:X和Y相互獨(dú)立,并給出在問題中的解釋②根據(jù)抽樣數(shù)據(jù)整理出2x2列聯(lián)表③計(jì)算,并與臨界值Xα比較④結(jié)論:基于小概率值α的檢驗(yàn)規(guī)則:當(dāng)χ2≥Xα?xí)r,我們推斷H0不成立,認(rèn)為X與Y不獨(dú)立,該推斷犯錯(cuò)的概率不超過α當(dāng)χ2<Xα?xí)r,我們沒有充分證據(jù)推斷H0不成立,可以認(rèn)為X和Y獨(dú)立.沒關(guān)系,無差異小概率事件,不可能發(fā)生經(jīng)典例題【跟蹤訓(xùn)練】3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論