版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1.上節(jié)學習了回歸分析的基本方法.線性回歸模型y=bx+a+e不同于一次函數y=bx+a,含有__________,其中x為_________,y為__________.溫故夯基隨機誤差e解釋變量預報變量樣本點的中心殘差平方和1、兩個相關的概念對于性別變量,其取值為男和女兩種,這種變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量,它們的取值一定是離散的,而且不同的取值僅表示個體所屬的類別。(1)分類變量:
定量變量的取值一定是實數,它們的取值大小有特定的含義,不同取值之間的運算也有特定的含義。(2)定量變量:
例如身高、體重、考試成績等,張明的身高是180cm,李立的身高是175cm,說明張明比李立高180-175=5(cm)。本節(jié)研究的是兩個分類變量的獨立性檢驗問題。在日常生活中,我們常常關心分類變量的之間是否有關系獨立性檢驗二.問題:為了調查吸煙是否對肺癌有影響,某腫瘤研究所隨機地調查了9965人,得到如下結果(單位:人)2×2列聯表思考:根據以上表格。能否斷定吸煙對患肺癌有影響?判斷的標準是什么?
吸煙與不吸煙,患病的可能性的大小是否有差異?不患肺癌患肺癌總計不吸煙7775427817吸煙2099492148總計9874919965吸煙與患肺癌列聯表(列出兩個分類變量的頻數表):
吸煙與肺癌列聯表不患肺癌患肺癌總計不吸煙7775427817吸煙2099492148總計9874919965在不吸煙者中患肺癌的比重是
在吸煙者中患肺癌的比重是
0.54%2.28%根據統(tǒng)計分析的思想,用頻率估計概率可知,吸煙者和不吸煙者患肺癌的可能性存在差異,吸煙者患肺癌的可能性大方法1.用頻率估計概率方法2.通過圖形直觀判斷等高條形圖患肺癌比例不患肺癌比例由上述圖形顯然可以得到結論是:吸煙與患肺癌有關思考:這種判斷可靠嗎?你能有多大把握認為“患病與吸煙有關”呢?不患肺癌患肺癌總計不吸煙aba+b吸煙cdc+d總計a+cb+da+b+c+d假設吸煙與患肺癌沒有關系,那么吸煙者中不患肺癌的比例應該與不吸煙者中相應的比例差不多即k大小的標準是什么呢?獨立性檢驗首先,假設結論不成立,即
H:兩個分類變量沒有關系
(在這種假設下k應該很?。┢浯?,由觀測數據計算K的觀測值k,(如果k很大,則在一定可信程度上說明H
不成
立,即兩個分類變量之間有關系)最后,根據k的值判斷假設是否成立2卡方臨界值表:10.8287.8796.6355.0243.8412.7062.0721.3230.7080.445
k00.0010.0050.0100.0250.050.100.150.50.400.5010.8287.8796.6355.0243.8412.7062.0721.3230.7080.445k0.0010.0050.0100.0250.050.100.150.50.400.50(1)如果k>10.828,就有99.9%的把握認為“X與Y有關系”;(2)如果k>7.879,就有99.5%的把握認為“X與Y有關系”;(3)如果k>6.635,就有99%的把握認為“X與Y有關系”;(4)如果k>5.024,就有97.5%的把握認為“X與Y有關系”;(5)如果k>3.841,就有95%的把握認為“X與Y有關系”;(6)如果k>2.706,就有90%的把握認為“X與Y有關系”;(7)如果k<=2.706,就認為沒有充分的證據顯示
“X與Y有關系”.臨界表注:1)這種判斷可能會犯錯誤,但是犯錯誤的概率不會超過0.001,這是個小概率事件,即我們有99.9%的把握認為“吸
煙與患癌癥有關系”
2)利用隨機變量來判斷“兩個分類變量有關系”的方法稱為這兩個分類變量的獨立性檢驗。反證法原理與獨立性檢驗原理反證法原理:
在一個已知假設下,如果推出一個矛盾,就證明了這個假設不成立。獨立性檢驗原理:
在一個已知假設下,如果推出一個小概率事件發(fā)生,則推斷這個假設不成立的可能性很大。在判斷兩變量相關時,若K2的觀測值k=56.632,則P(K2≥6.635)≈0.01和P(K2≥10.828)≈0.001,哪種說法是正確的?提示:兩種說法均正確.P(K2≥6.635)≈0.01的含義是:在犯錯誤的概率不超過0.01的前提下,認為兩變量相關;而P(K2≥10.828)≈0.001的含義是:在犯錯誤的概率不超過0.001的前提下,認為兩變量相關.問題探究在吸煙與患肺病這兩個分類變量的計算中,下列說法正確的是()A、若K的觀測值為k=6.635,我們有99%的把握認為吸煙與患肺病有關系,那么在100個吸煙的人中必有99個患肺病B、從獨立性檢驗可知有99%的把握認為吸煙與患肺病有關系時,我們說某人吸煙,那么他有99%的可能患肺病C、若從統(tǒng)計量中求出有95%的把握認為吸煙與患肺病有關系,是指有5%的可能性使得推理出現錯誤D、以上三種說法都不對c在某醫(yī)院,因為患心臟病而住院的665名病人中,有214人禿頂,而另外772名不是因為患心臟病而住院的男性病人中有175人禿頂。利用圖形判斷禿頂與患心臟病是否有關系。能夠以99%的把握認為禿頂與患心臟病有關系嗎?為什么?例1患心臟病患其他病總計禿頂214175389不禿頂4515971048總計6657721437(1)等高條形圖從圖中可以看出,禿頂樣本中患心臟病的頻率明顯高于不禿頂樣本中患心臟病的頻率,因此可直觀地認為禿頂與患心臟病有關系。
因此,在犯錯誤的概率不超過0.010的前提下認為“禿頂與患心臟病有關”,即有99%的把握認為“禿頂與患心臟病有關”。(2)獨立性檢驗法患心臟病患其他病總計禿頂214175389不禿頂4515971048總計6657721437
獨立性檢驗的一般步驟:(1)根據樣本數據制成2×2列聯表;(2)根據公式K2=計算K2的值;(3)查表比較K2與臨界值的大小關系,作統(tǒng)計判斷.例2如果K2的觀測值k為8.654,可推斷“X與Y有關”犯錯誤的概率不超過______.[答案]
0.005[解析]
k=
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度生態(tài)住宅區(qū)物業(yè)托管與生態(tài)保護合同
- 二零二五年度車輛牌照借用及車輛年審服務合同
- 2025版酒店員工培訓與招聘承包合同3篇
- 二零二五年度農業(yè)耕地租賃與農業(yè)物聯網技術應用合同
- 2025年度離婚糾紛調解與執(zhí)行服務合同范本
- 2025年度離婚案件律師代理服務專項合同3篇
- 二零二五年度農業(yè)國際合作項目合同2篇
- 寧波2025年度商品房買賣合同維修基金使用范本4篇
- 2025年度墓地陵園消防安全管理與培訓合同2篇
- 2025年度綠色能源產業(yè)購并重組股權交易合同
- 藥娘激素方案
- 提高靜脈留置使用率品管圈課件
- GB/T 10739-2023紙、紙板和紙漿試樣處理和試驗的標準大氣條件
- 《心態(tài)與思維模式》課件
- C語言程序設計(慕課版 第2版)PPT完整全套教學課件
- 行業(yè)會計比較(第三版)PPT完整全套教學課件
- 值機業(yè)務與行李運輸實務(第3版)高職PPT完整全套教學課件
- 高考英語語法填空專項訓練(含解析)
- 危險化學品企業(yè)安全生產標準化課件
- 《美的歷程》導讀課件
- 心電圖 (史上最完美)課件
評論
0/150
提交評論