




已閱讀5頁,還剩67頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第三章 統(tǒng)計(jì)案例 章末高效整合 知能整合提升 1 兩個(gè)基本思想 1 回歸分析的基本思想回歸分析包括線性回歸分析和非線性回歸分析兩種 而非線性回歸分析往往可以通過變量代換轉(zhuǎn)化為線性回歸分析 因此 回歸分析的思想主要是指線性回歸分析的思想 注意理解以下幾點(diǎn) 確定線性相關(guān)關(guān)系線性相關(guān)關(guān)系有兩層含義 一是具有相關(guān)關(guān)系 如廣告費(fèi)用與銷售量的關(guān)系等在一定條件下具有相關(guān)關(guān)系 而氣球的體積與半徑的關(guān)系是函數(shù)關(guān)系 而不是相關(guān)關(guān)系 二是具有線性相關(guān)關(guān)系 判斷是否線性相關(guān)的依據(jù)是觀察樣本點(diǎn)的散點(diǎn)圖 引起預(yù)報(bào)誤差的因素對于線性回歸模型y bx a e 引起預(yù)報(bào)變量y的誤差的因素有兩個(gè) 一個(gè)是解釋變量x 另一個(gè)是隨機(jī)誤差e 回歸方程的預(yù)報(bào)精度判斷回歸方程的預(yù)報(bào)精度是通過計(jì)算殘差平方和來進(jìn)行的 殘差平方和越小 方程的預(yù)報(bào)精度越高 簡單來說 線性回歸分析就是通過建立回歸直線方程對變量進(jìn)行預(yù)報(bào) 用回歸方程預(yù)報(bào)時(shí) 需對函數(shù)值明確理解 它表示當(dāng)x取值時(shí) 真實(shí)值在函數(shù)值附近或平均值在函數(shù)值附近 不能認(rèn)為就是真實(shí)值 回歸模型的擬合效果判斷回歸模型的擬合效果的過程也叫殘差分析 殘差分析的方法有兩種 一是通過殘差圖直觀判斷 二是通過計(jì)算相關(guān)指數(shù)r2的大小判斷 2 獨(dú)立性檢驗(yàn)的基本思想獨(dú)立性檢驗(yàn)的基本思想類似于反證法 要確認(rèn)兩個(gè)分類變量有關(guān)系的可信程度 先假設(shè)兩個(gè)分類變量沒有關(guān)系 再計(jì)算隨機(jī)變量k2的觀測值 最后由k2的觀測值很大在一定程度上說明兩個(gè)分類變量有關(guān)系 進(jìn)行獨(dú)立性檢驗(yàn)要注意理解以下三個(gè)問題 獨(dú)立性檢驗(yàn)適用于兩個(gè)分類變量 兩個(gè)分類變量是否有關(guān)系的直觀判斷 一是根據(jù)2 2列聯(lián)表計(jì)算 ad bc 值越大關(guān)系越強(qiáng) 二是觀察等高條形圖 兩個(gè)深色條的高度相差越大關(guān)系越強(qiáng) 獨(dú)立性檢驗(yàn)是對兩個(gè)分類變量有關(guān)系的可信程度的判斷 而不是對其是否有關(guān)系的判斷 獨(dú)立性檢驗(yàn)的結(jié)論只能是有多大的把握確認(rèn)兩個(gè)分類變量有關(guān)系 而不能是兩個(gè)分類變量一定有關(guān)系或沒有關(guān)系 2 兩個(gè)重要參數(shù) 1 相關(guān)指數(shù)r2相關(guān)指數(shù)r2是用來刻畫回歸模型的回歸效果的 其值越接近1 殘差平方和越小 模型的擬合效果越好 2 隨機(jī)變量k2隨機(jī)變量k2是用來判斷兩個(gè)分類變量在多大程度上相關(guān)的變量 獨(dú)立性檢驗(yàn)即計(jì)算k2的觀測值 并與教材中所給表格中的數(shù)值進(jìn)行比較 從而得到兩個(gè)分類變量在多大程度上相關(guān) 3 兩種重要圖形 1 散點(diǎn)圖散點(diǎn)圖是進(jìn)行線性回歸分析的主要手段 其作用如下 一是判斷兩個(gè)變量是否具有線性相關(guān)關(guān)系 如果樣本點(diǎn)呈條狀分布 則可以斷定兩個(gè)變量有較好的線性相關(guān)關(guān)系 二是判斷樣本中是否存在異常 2 殘差圖殘差圖可以用來判斷模型的擬合效果 其作用如下 一是判斷模型的精度 殘差點(diǎn)所分布的帶狀區(qū)域越窄 說明模型的擬合精度越高 回歸方程的預(yù)報(bào)精度越高 二是確認(rèn)樣本點(diǎn)在采集中是否有人為的錯(cuò)誤 熱點(diǎn)考點(diǎn)例析 線性回歸分析的應(yīng)用 點(diǎn)撥 回歸分析的基本步驟為 1 確定研究對象 明確哪個(gè)變量是解釋變量 哪個(gè)變量是預(yù)報(bào)變量 2 畫出確定好的解釋變量和預(yù)報(bào)變量的散點(diǎn)圖 觀察它們之間的關(guān)系 3 由經(jīng)驗(yàn)確定回歸方程的類型 4 按一定規(guī)則估計(jì)回歸方程中的參數(shù) 5 得檢查回歸模型的擬合程度 如分析殘差圖 求相關(guān)指數(shù)r2等 一個(gè)車間為了規(guī)定工時(shí)定額 需確定加工零件所花費(fèi)的時(shí)間 為此進(jìn)行了10次試驗(yàn) 測得的數(shù)據(jù)如下表 1 畫出散點(diǎn)圖 并初步判斷是否線性相關(guān) 2 若線性相關(guān) 求回歸直線方程 3 求出相關(guān)指數(shù) 4 作出殘差圖 5 進(jìn)行殘差分析 6 試制訂加工200個(gè)零件的用時(shí)規(guī)定 思維點(diǎn)擊 明確各相關(guān)概念 求出回歸直線方程是解題關(guān)鍵 注意正確使用公式和準(zhǔn)確計(jì)算 1 散點(diǎn)圖如圖所示 由圖可知 x y線性相關(guān) 將數(shù)據(jù)代入相應(yīng)公式可得數(shù)據(jù)表 3 利用所求回歸方程求出下列數(shù)據(jù) 1 為了研究3月下旬的平均氣溫 x 與4月20日前棉花害蟲化蛹高峰日 y 的關(guān)系 某地區(qū)觀察了2007年至2011年的情況 得到下面數(shù)據(jù) 點(diǎn)撥 非線性回歸問題的處理技巧一般地 有些非線性回歸模型通過變換可以轉(zhuǎn)化為線性回歸模型 即借助于線性回歸模型研究呈非線性回歸關(guān)系的兩個(gè)變量之間的關(guān)系 1 如果散點(diǎn)圖中的點(diǎn)分布在一個(gè)直線狀帶形區(qū)域 可以選用線性回歸模型來建模 2 如果散點(diǎn)圖中的點(diǎn)的分布在一個(gè)曲線狀帶形區(qū)域 要先對變量作適當(dāng)?shù)淖儞Q 再利用線性回歸模型來建模 非線性回歸問題 2 電容器充電后 電壓達(dá)到100v 然后開始放電 由經(jīng)驗(yàn)知道 此后電壓u隨時(shí)間t變化的規(guī)律公式u aebt b 0 表示 觀測得時(shí)間t s 時(shí)的電壓u v 如下表所示 試求電壓u對時(shí)間t的回歸方程 解析 對u aebt兩邊取自然對數(shù)得lnu lna bt 令y lnu a lna 即y bt a 由所給數(shù)據(jù)可得 其散點(diǎn)圖為 點(diǎn)撥 1 獨(dú)立性檢驗(yàn)的一般步驟 1 提出假設(shè)h0 和 沒有關(guān)系 2 根據(jù)2 2列聯(lián)表計(jì)算k2的觀測值 3 根據(jù)k2的觀測值與臨界值的大小關(guān)系作統(tǒng)計(jì)推斷 獨(dú)立性檢驗(yàn) 2 可以用反證法的原理來解釋獨(dú)立性檢驗(yàn)原理 從上述對比中可以看出 假設(shè)檢驗(yàn)的原理和反證法原理類似 不同之處 一是獨(dú)立性檢驗(yàn)中用有利于h0的小概率事件的發(fā)生代替了反證法中的矛盾 二是獨(dú)立性檢驗(yàn)中接受原假設(shè)的結(jié)論相當(dāng)于反證法中沒有找到矛盾 把獨(dú)立性檢驗(yàn)的基本思想具體化到獨(dú)立性檢驗(yàn)中 就可以通過隨機(jī)變量k2的值的大小來研究兩個(gè)分類變量是否有相關(guān)關(guān)系 調(diào)查某醫(yī)院某段時(shí)間內(nèi)嬰兒出生的時(shí)間與性別的關(guān)系 得到下面的數(shù)據(jù)表 試問嬰兒的性別與出生的時(shí)間是否有關(guān)系 思維點(diǎn)擊 根據(jù)列聯(lián)表 將相應(yīng)數(shù)據(jù)代入公式求k2 3 為了探究患慢性氣管炎是否與吸煙有關(guān) 調(diào)查了339名50歲以上的人 調(diào)查如下表所示 試問 50歲以上的人患慢性氣管炎與吸煙習(xí)慣是否有關(guān)系 解析 5是斜率的估計(jì)值 說明x每增加一個(gè)單位 y平均減少5個(gè)單位 答案 b 4 若由一個(gè)2 2列聯(lián)表中的數(shù)據(jù)計(jì)算得k2 6 630 則判斷 這兩個(gè)分類變量有關(guān)系 時(shí) 犯錯(cuò)誤的最大概率是 a 0 025b 0 01c 0 005d 0 001解析 p k2 5 024 0 025 又k2 6 630 5 024 犯錯(cuò)誤的最大概率為0 025 答案 a 5 若由一個(gè)2 2列聯(lián)表中的數(shù)據(jù)計(jì)算得k2 4 073 那么在犯錯(cuò)誤的概率不超過 的前提下認(rèn)為兩變量有關(guān)系 已知p k2 3 841 0 05 p k2 5 024 0 025 解析 查表可知k2的觀測值k 4 073 3 841 因此在犯錯(cuò)誤的概率不超過5 的前提下認(rèn)為兩變量有關(guān)系 答案 5 7 某產(chǎn)品的廣告費(fèi)支出x與銷售額y 單位 百萬元 之間有如下對應(yīng)數(shù)據(jù) 請畫出散點(diǎn)圖并用散點(diǎn)圖粗略地判斷x y是否線性相關(guān) 解析 散點(diǎn)圖如圖 從散點(diǎn)圖可以看出散點(diǎn)呈條狀分布 所以x y具有較強(qiáng)的線性相關(guān)關(guān)系 8 某研究者欲考察某一高考試題的得分情況是否與性別有關(guān)系 統(tǒng)計(jì)結(jié)果如下 及格的人中男生有290人 女生有100人 不及格的人中男生有160人 女生有350人 試根據(jù)這些數(shù)據(jù)判斷這一高考試題的得分情況與性別是否有關(guān)系 解析 根據(jù)題中數(shù)據(jù)得如下列聯(lián)表 其中一定不正確的結(jié)論的序號是 a b c d 解析 中y與x負(fù)相關(guān)而斜率為正 不正確 中y與x正相關(guān)而斜率為負(fù) 不正確 答案 d 3 2014 全國卷 某地區(qū)2007年至2013年農(nóng)村居民家庭人均純收入y 單位 千元 的數(shù)據(jù)如下表 1 求y關(guān)于t的線性回歸方程 2 利用 1 中的回歸方程 分析2007年至2013年該地區(qū)農(nóng)村居民家庭人均純收入的變化情況 并預(yù)測該地區(qū)2015年農(nóng)村居民家庭人均純收入 4 2014 安徽卷 某高校共有學(xué)生15000人 其中男生10500人 女生4500人 為調(diào)查該校學(xué)生每周平均體育運(yùn)動時(shí)間的情況 采用分層抽樣的方法 收集300位學(xué)生每周平均體育運(yùn)動時(shí)間的樣本數(shù)據(jù) 單位 小時(shí) 1 應(yīng)收集多少位女生的樣本數(shù)據(jù) 2 根據(jù)這300個(gè)樣本數(shù)據(jù) 得到學(xué)生每周平均體育運(yùn)動時(shí)間的頻率分布直方圖 如圖所示 其中樣本數(shù)據(jù)的分組區(qū)間為 0 2 2 4 4 6 6 8 8 10 10 12 估計(jì)該校學(xué)生每周平均體育運(yùn)動時(shí)間超過4小時(shí)的概率 3 在樣本數(shù)據(jù)中 有60位女生的每周平均體育運(yùn)動時(shí)間超過4小時(shí) 請完成每周平均體育運(yùn)動時(shí)間與性
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 化工園區(qū)工業(yè)固廢填埋場項(xiàng)目實(shí)施方案(模板)
- 供水管網(wǎng)升級改造工程可行性研究報(bào)告(僅供參考)
- 初中生交通安全教育
- 唯美美術(shù)教育課件
- 行為規(guī)范教育主題班會
- 電子科技大學(xué)中山學(xué)院《新聞傳播學(xué)類專業(yè)導(dǎo)論》2023-2024學(xué)年第二學(xué)期期末試卷
- 天津天獅學(xué)院《獸醫(yī)病理解剖學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 南華大學(xué)船山學(xué)院《互換性與測量基礎(chǔ)》2023-2024學(xué)年第二學(xué)期期末試卷
- 清遠(yuǎn)職業(yè)技術(shù)學(xué)院《主任級管理的藝術(shù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 重慶城市科技學(xué)院《園林工程(園林水景工程)》2023-2024學(xué)年第二學(xué)期期末試卷
- 2024年小學(xué)生航空航天知識競賽題庫附答案 (共150題)
- 大學(xué)物理波動光學(xué)復(fù)習(xí)課件講義
- 教育系統(tǒng)后備干部考試題庫及答案
- DB36T 1899-2023 水運(yùn)工程大臨建設(shè)指南
- 護(hù)理文獻(xiàn)分享匯報(bào)
- 機(jī)械制造行業(yè)質(zhì)量控制制度
- 國際交流項(xiàng)目意識形態(tài)工作方案
- 《冠心病》課件(完整版)
- 醫(yī)療風(fēng)險(xiǎn)免責(zé)協(xié)議書
- 1.6醫(yī)學(xué)影像科-重點(diǎn)???實(shí)施方案
- 2024年委托招商代理合同范本(三篇)
評論
0/150
提交評論