版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
8.3.2獨立性檢驗(2)復(fù)習(xí)引入XY合計Y=0Y=1X=0aba+bX=1cdc+d合計a+cb+da+b+c+d例題例1:某兒童醫(yī)院用甲、乙兩種療法治療小兒消化不良.采用有放回簡單隨機(jī)抽樣的方法對治療情況進(jìn)行檢查,得到了如下數(shù)據(jù):抽到接受甲種療法的患兒67名,其中未治愈15名,治愈52名;抽到接受乙種療法的患兒69名,其中未治愈6名,治愈63名.試根據(jù)小概率值α=0.005的獨立性檢驗,分析乙種療法的效果是否比甲種療法好.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828解:零假設(shè)為H0:療法與療效獨立,即兩種療法效果沒有差異.將所給數(shù)據(jù)進(jìn)行整理,得到兩種療法治療數(shù)據(jù)的列聯(lián)表.課本132頁療法療效合計未治愈治愈甲155267乙66369合計21115136α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計算得到根據(jù)小概率值α=0.005的χ2獨立性檢驗,沒有充分證據(jù)推斷H0不成立,因此可以認(rèn)為H0成立,即認(rèn)為兩種療法效果沒有差異.為了研究每周累計戶外暴露時間是否足夠(單位:小時)與近視發(fā)病率的關(guān)系,對某中學(xué)一年級100名學(xué)生進(jìn)行不記名問卷調(diào)查,得到如下數(shù)據(jù):
近視不近視足夠的戶外暴露時間2035不足夠的戶外暴露時間3015α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828(1)用樣本估計總體思想估計該中學(xué)一年級學(xué)生的近視率;解:由題可知該中學(xué)一年級學(xué)生近視的人數(shù)為50,總數(shù)為100,利用樣本估計總體思想可知50該中學(xué)一年級學(xué)生的近視率為練習(xí)
近視不近視足夠的戶外暴露時間2035不足夠的戶外暴露時間3015α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828(2)能否在犯錯誤的概率不超過0.001的前提下認(rèn)為不足夠的戶外暴露時間與近視有關(guān)系?解:零假設(shè)為H0:不足夠的戶外暴露時間與近視相互獨立.由卡方計算公式,可得沒有充分證據(jù)推斷H0不成立,因此可以認(rèn)為H0成立,即不足夠的戶外暴露時間與近視沒有關(guān)系.(3)能否在犯錯誤的概率不超過0.01的前提下認(rèn)為不足夠的戶外暴露時間與近視有關(guān)系?在犯錯誤的概率不超過0.01的前提下可以推斷H0不成立,即認(rèn)為不足夠的戶外暴露時間與近視有關(guān)系.
近視不近視足夠的戶外暴露時間2035不足夠的戶外暴露時間3015α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828解:零假設(shè)為H0:不足夠的戶外暴露時間與近視相互獨立.反思?xì)w納
對犯錯誤概率的解釋在零假設(shè)H0成立的前提下,隨著小概率值α的逐漸減小,χ2統(tǒng)計量對應(yīng)的臨界值xα逐漸增大,則事件{χ2≥xα}越來越不容易發(fā)生,零假設(shè)越來越不容易被拒絕;隨著小概率值α的逐漸增大,χ2統(tǒng)計量對應(yīng)的臨界值xα逐漸減小,則事件{χ2≥xα}越來越容易發(fā)生,零假設(shè)越來越容易被拒絕.例如,對于例1中的數(shù)據(jù),經(jīng)計算得χ2≈4.881.(1)當(dāng)小概率值α=0.005時,x0.005=7.879,此時χ2≈4.881<7.879,則沒有充分理由拒絕零假設(shè).因此可以接受H0,即認(rèn)為兩種療法的效果沒有差異.(2)當(dāng)小概率值α=0.05時,x0.05=3.841,此時χ2≈4.881>3.841,則拒絕零假設(shè),即認(rèn)為兩種療法的效果有差異,該推斷犯錯誤的概率不超過0.05.(3)當(dāng)小概率值α=0.1時,x0.05=2.706,此時χ2≈4.881>2.706,則拒絕零假設(shè),即認(rèn)為兩種療法的效果有差異,該推斷犯錯誤的概率不超過0.1.觀察:在例1的2×2列聯(lián)表中,若對調(diào)兩種療法的位置或?qū)φ{(diào)兩種療效的位置,則卡方計算公式中a,b,c,d的賦值都會相應(yīng)地改變.這樣做會影響χ2取值的計算結(jié)果嗎?療法療效合計未治愈治愈甲155267乙66369合計21115136這說明,對調(diào)兩種療法的位置,不會影響χ2取值的計算結(jié)果,同理對調(diào)兩種療效的位置也不會影響結(jié)果.對調(diào)前療法療效合計未治愈治愈乙66369甲155267合計21115136對調(diào)后解:零假設(shè)為H0:吸煙與患肺癌之間無關(guān)聯(lián).例2:為研究吸煙是否與肺癌有關(guān),某腫瘤研究所采取有放回簡單隨機(jī)抽樣的方法,調(diào)查了9965人,得到成對樣本觀測數(shù)據(jù)的分類統(tǒng)計結(jié)果,如下表所示.依據(jù)小概率值α=0.001的獨立性檢驗,分析吸煙是否會增加患肺癌的風(fēng)險.吸煙肺癌合計非肺癌患者肺癌患者非吸煙者7775427817吸煙者2099492148合計9874919965α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828例題根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計算得到課本133頁吸煙肺癌合計非肺癌患者肺癌患者非吸煙者7775427817吸煙者2099492148合計9874919965α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828根據(jù)小概率值α=0.001的χ2獨立性檢驗,推斷H0不成立,即認(rèn)為吸煙與患肺癌有關(guān)聯(lián),此推斷犯錯誤的概率不大于0.001.根據(jù)列聯(lián)表中的數(shù)據(jù)計算,不吸煙者中不患肺癌和患肺癌的頻率
分別為吸煙者中不患肺癌和患肺癌的頻率分別為可見,在被調(diào)查者中,吸煙者患肺癌的頻率是不吸煙者患肺癌的頻率的4倍以上,于是,根據(jù)頻率穩(wěn)定于概率的原理,我們可以認(rèn)為吸煙者患肺癌的概率明顯大于不吸煙者患肺癌的概率,即吸煙更容易引發(fā)肺癌.吸煙肺癌合計非肺癌患者肺癌患者非吸煙者7775427817吸煙者2099492148合計9874919965應(yīng)用獨立性檢驗解決實際問題大致應(yīng)包括以下幾個主要環(huán)節(jié):(1)提出零假設(shè)H0:X和Y相互獨立,并給出在問題中的解釋.
(2)根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計算χ2的值,并與臨界值xα比較.
(3)根據(jù)檢驗規(guī)則得出推斷結(jié)論.
(4)在X和Y不獨立的情況下,根據(jù)需要,通過比較相應(yīng)的頻率,分析X和Y間的影響規(guī)律.注意,上述幾個環(huán)節(jié)的內(nèi)容可以根據(jù)不同情況進(jìn)行調(diào)整.例如,在有些時候,分類變量的抽樣數(shù)據(jù)列聯(lián)表是問題中給定的.反思?xì)w納思考:獨立性檢驗的思想類似于我們常用的反證法,你能指出二者之間的相同和不同之處嗎?簡單地說,反證法是在某種假設(shè)H0之下,推出一個矛盾結(jié)論,從而證明H0不成立;而獨立性檢驗是在零假設(shè)H0之下,如果出現(xiàn)一個與H0相矛盾的小概率事件,就推斷H0不成立,且該推斷犯錯誤的概率不大于這個小概率.另外,在全部邏輯推理正確的情況下,反證法不會犯錯誤,但獨立性檢驗會犯隨機(jī)性錯誤.獨立性檢驗的本質(zhì)是比較觀測值與期望值之間的差異,由χ2所代表的這種差異的大小是通過確定適當(dāng)?shù)男「怕手颠M(jìn)行判斷的.這是一種非常重要的推斷方法,不僅有相當(dāng)廣泛的應(yīng)用,也開啟了人類認(rèn)識世界的一種新的思維方式.課本134頁1.對于例1中的抽樣數(shù)據(jù),采用小概率值α=0.05的獨立性檢驗,分析乙種療法的效果是否比甲種療法好.解:根據(jù)題意,可得α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828根據(jù)小概率值α=0.05的χ2獨立性檢驗,推斷H0不成立,即認(rèn)為兩種療法的效果有差異,該推斷犯錯誤的概率不超過0.05.甲種療法未治愈和治愈的頻率分別是乙種療法未治愈和治愈的頻率分別是因此可以推斷乙種療法的效果比甲種療法好.練習(xí)課本134頁2.從某學(xué)校獲取了容量為400的有放回簡單隨機(jī)樣本,將所得數(shù)學(xué)和語文期末考試成績的樣本觀測數(shù)據(jù)整理如下:
依據(jù)α=0.05的獨立性檢驗,能否認(rèn)為數(shù)學(xué)成績與語文成績有關(guān)聯(lián)?數(shù)學(xué)成績語文成績合計不優(yōu)秀優(yōu)秀不優(yōu)秀21261273優(yōu)秀5473127合計266134400α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828解:零假設(shè)為H0:數(shù)學(xué)成績與語文成績獨立,即數(shù)學(xué)成績與語文成績沒有關(guān)聯(lián).根據(jù)列聯(lián)表中數(shù)據(jù),經(jīng)計算得到根據(jù)小概率值α=0.05的χ2獨立性檢驗,我們可以推斷H0不成立,即認(rèn)為數(shù)學(xué)成績與語文成績有關(guān)聯(lián),該推斷犯錯誤的概率不超過0.05.數(shù)學(xué)成績語文成績合計不優(yōu)秀優(yōu)秀不優(yōu)秀21261273優(yōu)秀5473127合計266134400α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828數(shù)學(xué)成績不優(yōu)秀的人中語文成績不優(yōu)秀和優(yōu)秀的頻率分別為數(shù)學(xué)成績優(yōu)秀的人中語文成績不優(yōu)秀和優(yōu)秀的頻率分別為由此可以看出,數(shù)學(xué)成績優(yōu)秀的人中語文成績優(yōu)秀的頻率明顯高于數(shù)學(xué)成績不優(yōu)秀的人中語文成績優(yōu)秀的頻率.根據(jù)頻率穩(wěn)定于概率的原理,我們可以推斷,數(shù)學(xué)成績優(yōu)秀的人其語文成績優(yōu)秀的概率較大.數(shù)學(xué)成績語文成績合計不優(yōu)秀優(yōu)秀不優(yōu)秀21261273優(yōu)秀5473127合計2661344001.某校為了研究“學(xué)生的性別”和“對待某一活動的態(tài)度”是否有關(guān),運用2×2列聯(lián)表進(jìn)行獨立性檢驗,經(jīng)計算χ2=7.069,則認(rèn)為“學(xué)生性別與支持某項活動有關(guān)系”的犯錯誤的概率不超過(
)A.0.1%B.1% C.99%D.99.9%解析:∵χ2=7.069>6.635=x0.01,∴認(rèn)為“學(xué)生性別與支持某項活動有關(guān)系”的犯錯誤的概率不超過1%.隨堂檢測2.在兩個學(xué)習(xí)基礎(chǔ)相當(dāng)?shù)陌嗉墝嵭心撤N教學(xué)措施的實驗,測試結(jié)果見下表,則___在犯錯誤的概率不超過0.005的前提下推斷實驗效果與教學(xué)措施有關(guān)(填“能”“不能”).班級成績合計優(yōu)、良、中差實驗班48250對比班381250合計8614100能3.世界杯期間,某一電視臺對年齡高于40歲和不高于40歲的人是否喜歡西班牙隊進(jìn)行調(diào)查,對高于40歲的調(diào)查了50人,不高于40歲的調(diào)查了50人,所得數(shù)據(jù)制成如下列聯(lián)表:
不喜歡西班牙隊喜歡西班牙隊合計高于40歲pq50不高于40歲153550合計ab100若工作人員從所有統(tǒng)計結(jié)果中任取一個,取到喜歡西班牙隊的人的概率為
,則在犯錯誤的概率不超過______的前提下認(rèn)為年齡與西班牙隊的被喜歡程度有關(guān).5%α0.150.100.050.0250.0100.0050.001xα2.0722.7063.8415.0246.6357.87910.828解析:設(shè)“從所有人中任意抽取一個,取到喜歡西班牙隊的人”為事件A,所以q=25,p=25,a=40,b=60.依據(jù)小概率值α=0.05的獨立性檢驗,認(rèn)為年齡與西班牙隊的被喜歡程度有關(guān),此推斷犯錯誤的概率不超過5%.4.某校對學(xué)生課外活動進(jìn)行調(diào)查,結(jié)果整理成下表,根據(jù)小概率值α=0.005的獨立性檢驗,能否認(rèn)為“喜歡體育還是文娛與性別有關(guān)系”?性別課外活動合計喜歡體育喜歡文娛男212344女62935合計275279解:零假設(shè)為H0:喜歡體育還是喜歡文娛與性別沒有關(guān)系.∵a=21,b=23,c=6,d=29,n=79,根據(jù)小概率值α=0.005的χ2獨立性檢驗,我們推斷H0不成立,即認(rèn)為喜歡體育還是喜歡文娛與性別有關(guān)系,此推斷犯錯誤的概率不大于0.005.5.某高校共有學(xué)生15000人,其中男生10500人,女生4500人.為調(diào)查該校學(xué)生每周平均體育運動時間的情況,采用分層隨機(jī)抽樣的方法,收集300位學(xué)生每周平均體育運動時間(單位:時)的樣本數(shù)據(jù).(1)應(yīng)收集多少位女生的樣本數(shù)據(jù)?(2)根據(jù)這300個樣本數(shù)據(jù),得到學(xué)生每周平均體育運動時間的頻率分布直方圖(如圖),其中樣本數(shù)據(jù)的分組區(qū)間為[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估計該校學(xué)生每周平均體育運動時
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度個人健康保險合同范本2篇
- 長沙南方職業(yè)學(xué)院《俄語基礎(chǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025年度智能倉儲物流設(shè)施建設(shè)合同范本3篇
- 2024物業(yè)權(quán)益讓與擔(dān)保合同 權(quán)益方與受讓方協(xié)議
- 思政教育團(tuán)隊建設(shè)與教師專業(yè)成長
- 二零二五版集成墻板家裝裝修環(huán)保評估合同范本3篇
- 2025年校園歷史文化宣傳欄制作與教育推廣合同3篇
- 二零二五年度建筑設(shè)計創(chuàng)意大賽參賽合同2篇
- 2025年新型農(nóng)業(yè)技術(shù)培訓(xùn)合同范本3篇
- 2025年度定制化鋁材加工與銷售一體化合同4篇
- 獵聘-2024高校畢業(yè)生就業(yè)數(shù)據(jù)報告
- 2024虛擬現(xiàn)實產(chǎn)業(yè)布局白皮書
- 車站值班員(中級)鐵路職業(yè)技能鑒定考試題及答案
- JTG∕T E61-2014 公路路面技術(shù)狀況自動化檢測規(guī)程
- 高中英語短語大全(打印版)
- 軟件研發(fā)安全管理制度
- 三位數(shù)除以兩位數(shù)-豎式運算300題
- 寺院消防安全培訓(xùn)課件
- 比摩阻-管徑-流量計算公式
- GB/T 42430-2023血液、尿液中乙醇、甲醇、正丙醇、丙酮、異丙醇和正丁醇檢驗
- 五年級數(shù)學(xué)應(yīng)用題100道
評論
0/150
提交評論