高中數(shù)學(xué) 獨(dú)立性檢驗(yàn) 課件_第1頁(yè)
高中數(shù)學(xué) 獨(dú)立性檢驗(yàn) 課件_第2頁(yè)
高中數(shù)學(xué) 獨(dú)立性檢驗(yàn) 課件_第3頁(yè)
高中數(shù)學(xué) 獨(dú)立性檢驗(yàn) 課件_第4頁(yè)
高中數(shù)學(xué) 獨(dú)立性檢驗(yàn) 課件_第5頁(yè)
已閱讀5頁(yè),還剩21頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、8.3.2獨(dú)立性檢驗(yàn)問(wèn)題引入22列聯(lián)表隨機(jī)事件頻率的穩(wěn)定性兩個(gè)分類變量是否有關(guān)聯(lián)用頻率推斷兩個(gè)分類變量是否獨(dú)立有什么缺點(diǎn)?頻率具有隨機(jī)性,與概率之間存在差異樣本容量較小時(shí),犯錯(cuò)誤的概率較大問(wèn)題回溯有沒(méi)有更合理的推斷方法,同時(shí)也希望對(duì)出現(xiàn)的錯(cuò)誤推斷的概率一定的控制或估算?A與B相互獨(dú)立(簡(jiǎn)稱為獨(dú)立)的充要條件是抽象簡(jiǎn)化列聯(lián)表X=0X=1Y=0X=0,Y=0X=1,Y=0Y=1X=0,Y=1X=1,Y=1x=1與y=1是否有關(guān)聯(lián)呢?前方高能如何判斷x=1與y=1是否有關(guān)聯(lián)呢?x=0與x=1對(duì)立, y=0與y=1對(duì)立原(零)假設(shè)!進(jìn)一步由條件概率獨(dú)立含義的全解X=0與Y=0獨(dú)立X=0與Y=1獨(dú)立X=

2、1與Y=0獨(dú)立X=1與Y=1獨(dú)立具體的列聯(lián)表頻數(shù)的期望值與實(shí)際值P(X=0)和P(Y=0)對(duì)應(yīng)的頻率的乘積X=0,Y=0發(fā)生的頻率的期望值兩者應(yīng)當(dāng)相差不大如何衡量差別呢原假設(shè)成立,下面四個(gè)量值不應(yīng)該太大是不是有點(diǎn)麻煩?構(gòu)造一個(gè)方便科學(xué)的統(tǒng)計(jì)量看起來(lái)好一點(diǎn)了卡方統(tǒng)計(jì)量卡方統(tǒng)計(jì)量有什么用呢? 統(tǒng)計(jì)學(xué)家建議,用卡方的大小作為判斷零假設(shè)是否成立的依據(jù),當(dāng)它比較大時(shí)推斷不成立,否則認(rèn)為成立。 那么,究竟大到什么程度,可以推斷不成立呢? 或者說(shuō),怎樣確定判斷卡方大小的標(biāo)準(zhǔn)呢?卡方統(tǒng)計(jì)量有什么用呢? 在假定的條件下,對(duì)于有放回簡(jiǎn)單隨機(jī)抽樣,當(dāng)樣本容量充分大時(shí),統(tǒng)計(jì)學(xué)家得到了卡方的近似分布。忽略卡方的實(shí)際分布

3、與該近似分布的誤差后,對(duì)于任何小概率值,可以找到相應(yīng)的正實(shí)數(shù),使得下面關(guān)系成立:臨界值基于小概率值的檢驗(yàn)規(guī)則(小概率值)臨界值表0.10.050.010.0050.001x2.7063.8416.6357.87910.828紙上得來(lái)終覺(jué)淺,絕知此事要躬行例2:為比較甲、乙兩所學(xué)校學(xué)生的數(shù)學(xué)水平,采用簡(jiǎn)單隨機(jī)抽樣的方法抽取88名學(xué)生,通過(guò)測(cè)驗(yàn)得到了如下數(shù)據(jù):甲校43名學(xué)生中有10名數(shù)學(xué)成績(jī)優(yōu)秀;乙校45名學(xué)生中有7名數(shù)學(xué)成績(jī)優(yōu)秀。依據(jù)=0.1的卡方獨(dú)立性檢驗(yàn),試分析兩校學(xué)生中數(shù)學(xué)成績(jī)優(yōu)秀率之間是否存在差異?具體的列聯(lián)表學(xué)校數(shù)學(xué)成績(jī)合計(jì)不優(yōu)秀(Y=0)優(yōu)秀(Y=1)甲校(X=0)331043乙校(

4、X=1)38745合計(jì)711788解:零假設(shè)H0:分類變量X與Y相互獨(dú)立,即兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率無(wú)差異根據(jù)表中的數(shù)據(jù),計(jì)算得到根據(jù)小概率值=0.1的卡方獨(dú)立性檢驗(yàn),沒(méi)有允分證據(jù)推斷H0不成立,因此可以認(rèn)為H0成立,即認(rèn)為兩校的數(shù)學(xué)成績(jī)優(yōu)秀率沒(méi)有差異思考:例1和例2都是基于同一組數(shù)據(jù)的分析,但卻得出了不同的結(jié)論,你能說(shuō)明其中的原因嗎? 例1事實(shí)上是根據(jù)兩個(gè)頻率的差異進(jìn)行推斷的,沒(méi)有考慮隨機(jī)性的影響。但事實(shí)上,即便兩個(gè)樣本來(lái)自同一個(gè)總體,也會(huì)因?yàn)殡S機(jī)性使得頻率產(chǎn)生差異,因此需要用概率的方法進(jìn)行推斷,由于樣本具有隨機(jī)性,依據(jù)頻率所作的推斷可能會(huì)犯錯(cuò)誤.例3: 為研究吸煙是否與肺癌有關(guān), 某腫瘤研

5、究所采取有放回簡(jiǎn)單隨機(jī)抽樣的方法, 調(diào)查了9965人, 得到成對(duì)樣本觀測(cè)數(shù)據(jù)的分類統(tǒng)計(jì)結(jié)果, 如下表所示. 依據(jù)小概率值=0.001的獨(dú)立性檢驗(yàn), 分析吸煙是否會(huì)增加患肺癌的風(fēng)險(xiǎn).吸煙肺癌合計(jì)非肺癌患者肺癌患者非吸煙者7775427817吸煙者2099492148合計(jì)9874919965解:零假設(shè)H0:吸煙與患肺癌之間無(wú)關(guān)聯(lián)根據(jù)小概率值=0.001的卡方獨(dú)立性檢驗(yàn),推斷H0不成立,因此可以吸煙與患肺癌之間有關(guān)聯(lián),此推斷犯錯(cuò)誤的概率不大于 0.001用頻率計(jì)算再次進(jìn)行比較:不吸煙者中患肺癌的頻率:吸煙者中患肺癌的頻率:其中兩者的比值為:在被調(diào)查者中, 吸煙者患肺癌的頻率是不吸煙者患肺癌的頻率的 4 倍以上總結(jié)獨(dú)立性檢驗(yàn)的步驟應(yīng)用獨(dú)立性檢驗(yàn)解決實(shí)際問(wèn)題主要環(huán)節(jié):(1) 提出零假設(shè)H0:X和Y相互獨(dú)立, 并給出在問(wèn)題中的解釋.(2) 根據(jù)抽樣數(shù)據(jù)整理出22列聯(lián)表, 計(jì)算2的值, 并與臨界值比較.(3) 根據(jù)檢驗(yàn)規(guī)則得出推斷結(jié)論.(4) 在 X和Y不獨(dú)立的情況下, 根據(jù)需要, 通過(guò)比較相應(yīng)的頻率, 分析 X和Y間的 影響規(guī)律.思考1:列聯(lián)表中,對(duì)換行或列的值,會(huì)影響卡方的取值

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論