




已閱讀5頁(yè),還剩22頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1 1回歸分析的基本思想及其初步應(yīng)用 二 高中數(shù)學(xué)選修1 2 比 數(shù)學(xué)3 中 回歸 增加的內(nèi)容 數(shù)學(xué) 統(tǒng)計(jì)畫散點(diǎn)圖了解最小二乘法的思想求回歸直線方程y bx a用回歸直線方程解決應(yīng)用問(wèn)題 選修 統(tǒng)計(jì)案例引入線性回歸模型y bx a e了解模型中隨機(jī)誤差項(xiàng)e產(chǎn)生的原因了解相關(guān)指數(shù)r2和模型擬合的效果之間的關(guān)系了解殘差圖的作用利用線性回歸模型解決一類非線性回歸問(wèn)題正確理解分析方法與結(jié)果 回歸分析的內(nèi)容與步驟 統(tǒng)計(jì)檢驗(yàn)通過(guò)后 最后是利用回歸模型 根據(jù)自變量去估計(jì) 預(yù)測(cè)因變量 回歸分析通過(guò)一個(gè)變量或一些變量的變化解釋另一變量的變化 其主要內(nèi)容和步驟是 首先根據(jù)理論和對(duì)問(wèn)題的分析判斷 將變量分為自變量和因變量 其次 設(shè)法找出合適的數(shù)學(xué)方程式 即回歸模型 描述變量間的關(guān)系 由于涉及到的變量具有不確定性 接著還要對(duì)回歸模型進(jìn)行統(tǒng)計(jì)檢驗(yàn) 例1從某大學(xué)中隨機(jī)選取8名女大學(xué)生 其身高和體重?cái)?shù)據(jù)如表1 1所示 求根據(jù)一名女大學(xué)生的身高預(yù)報(bào)她的體重的回歸方程 并預(yù)報(bào)一名身高為172cm的女大學(xué)生的體重 案例1 女大學(xué)生的身高與體重 解 1 選取身高為自變量x 體重為因變量y 作散點(diǎn)圖 2 由散點(diǎn)圖知道身高和體重有比較好的線性相關(guān)關(guān)系 因此可以用線性回歸方程刻畫它們之間的關(guān)系 分析 由于問(wèn)題中要求根據(jù)身高預(yù)報(bào)體重 因此選取身高為自變量 體重為因變量 2 回歸方程 1 散點(diǎn)圖 本例中 r 0 798 0 75 這表明體重與身高有很強(qiáng)的線性相關(guān)關(guān)系 從而也表明我們建立的回歸模型是有意義的 探究 身高為172cm的女大學(xué)生的體重一定是60 316kg嗎 如果不是 你能解析一下原因嗎 答 身高為172cm的女大學(xué)生的體重不一定是60 316kg 但一般可以認(rèn)為她的體重接近于60 316kg 即 用這個(gè)回歸方程不能給出每個(gè)身高為172cm的女大學(xué)生的體重的預(yù)測(cè)值 只能給出她們平均體重的值 例1從某大學(xué)中隨機(jī)選取8名女大學(xué)生 其身高和體重?cái)?shù)據(jù)如表1 1所示 求根據(jù)一名女大學(xué)生的身高預(yù)報(bào)她的體重的回歸方程 并預(yù)報(bào)一名身高為172cm的女大學(xué)生的體重 案例1 女大學(xué)生的身高與體重 解 1 選取身高為自變量x 體重為因變量y 作散點(diǎn)圖 2 由散點(diǎn)圖知道身高和體重有比較好的線性相關(guān)關(guān)系 因此可以用線性回歸方程刻畫它們之間的關(guān)系 3 從散點(diǎn)圖還看到 樣本點(diǎn)散布在某一條直線的附近 而不是在一條直線上 所以不能用一次函數(shù)y bx a描述它們關(guān)系 我們可以用下面的線性回歸模型來(lái)表示 y bx a e 3 其中a和b為模型的未知參數(shù) e稱為隨機(jī)誤差 另一方面 由于公式 1 和 2 中和為截距和斜率的估計(jì)值 它們與真實(shí)值a和b之間也存在誤差 這種誤差是引起預(yù)報(bào)值與真實(shí)值y之間誤差的另一個(gè)原因 思考 產(chǎn)生隨機(jī)誤差項(xiàng)e的原因是什么 隨機(jī)誤差e的來(lái)源 可以推廣到一般 1 忽略了其它因素的影響 影響身高y的因素不只是體重x 可能還包括遺傳基因 飲食習(xí)慣 生長(zhǎng)環(huán)境等因素 2 用線性回歸模型近似真實(shí)模型所引起的誤差 3 身高y的觀測(cè)誤差 以上三項(xiàng)誤差越小 說(shuō)明我們的回歸模型的擬合效果越好 函數(shù)模型與回歸模型之間的差別 函數(shù)模型 回歸模型 可以提供選擇模型的準(zhǔn)則 函數(shù)模型與回歸模型之間的差別 函數(shù)模型 回歸模型 線性回歸模型y bx a e增加了隨機(jī)誤差項(xiàng)e 因變量y的值由自變量x和隨機(jī)誤差項(xiàng)e共同確定 即自變量x只能解析部分y的變化 在統(tǒng)計(jì)中 我們也把自變量x稱為解析變量 因變量y稱為預(yù)報(bào)變量 所以 對(duì)于身高為172cm的女大學(xué)生 由回歸方程可以預(yù)報(bào)其體重為 思考 如何刻畫預(yù)報(bào)變量 體重 的變化 這個(gè)變化在多大程度上與解析變量 身高 有關(guān) 在多大程度上與隨機(jī)誤差有關(guān) 假設(shè)身高和隨機(jī)誤差的不同不會(huì)對(duì)體重產(chǎn)生任何影響 那么所有人的體重將相同 在體重不受任何變量影響的假設(shè)下 設(shè)8名女大學(xué)生的體重都是她們的平均值 即8個(gè)人的體重都為54 5kg 在散點(diǎn)圖中 所有的點(diǎn)應(yīng)該落在同一條水平直線上 但是觀測(cè)到的數(shù)據(jù)并非如此 這就意味著預(yù)報(bào)變量 體重 的值受解析變量 身高 或隨機(jī)誤差的影響 對(duì)回歸模型進(jìn)行統(tǒng)計(jì)檢驗(yàn) 例如 編號(hào)為6的女大學(xué)生的體重并沒(méi)有落在水平直線上 她的體重為61kg 解析變量 身高 和隨機(jī)誤差共同把這名學(xué)生的體重從54 5kg 推 到了61kg 相差6 5kg 所以6 5kg是解析變量和隨機(jī)誤差的組合效應(yīng) 編號(hào)為3的女大學(xué)生的體重并也沒(méi)有落在水平直線上 她的體重為50kg 解析變量 身高 和隨機(jī)誤差共同把這名學(xué)生的體重從50kg 推 到了54 5kg 相差 4 5kg 這時(shí)解析變量和隨機(jī)誤差的組合效應(yīng)為 4 5kg 用這種方法可以對(duì)所有預(yù)報(bào)變量計(jì)算組合效應(yīng) 在例1中 總偏差平方和為354 那么 在這個(gè)總的效應(yīng) 總偏差平方和 中 有多少來(lái)自于解析變量 身高 有多少來(lái)自于隨機(jī)誤差 假設(shè)隨機(jī)誤差對(duì)體重沒(méi)有影響 也就是說(shuō) 體重僅受身高的影響 那么散點(diǎn)圖中所有的點(diǎn)將完全落在回歸直線上 但是 在圖中 數(shù)據(jù)點(diǎn)并沒(méi)有完全落在回歸直線上 這些點(diǎn)散布在回歸直線附近 所以一定是隨機(jī)誤差把這些點(diǎn)從回歸直線上 推 開了 在例1中 殘差平方和約為128 361 例如 編號(hào)為6的女大學(xué)生 計(jì)算隨機(jī)誤差的效應(yīng) 殘差 為 即 由于解析變量和隨機(jī)誤差的總效應(yīng) 總偏差平方和 為354 而隨機(jī)誤差的效應(yīng)為128 361 所以解析變量的效應(yīng)為 解析變量和隨機(jī)誤差的總效應(yīng) 總偏差平方和 解析變量的效應(yīng) 回歸平方和 隨機(jī)誤差的效應(yīng) 殘差平方和 離差平方和的分解 三個(gè)平方和的意義 總偏差平方和 sst 反映因變量的n個(gè)觀察值與其均值的總離差回歸平方和 ssr 反映自變量x的變化對(duì)因變量y取值變化的影響 或者說(shuō) 是由于x與y之間的線性關(guān)系引起的y的取值變化 也稱為可解釋的平方和殘差平方和 sse 反映除x以外的其他因素對(duì)y取值的影響 也稱為不可解釋的平方和或剩余平方和 樣本決定系數(shù) 判定系數(shù)r2 1 回歸平方和占總離差平方和的比例 反映回歸直線的擬合程度取值范圍在 0 1 之間r2 1 說(shuō)明回歸方程擬合的越好 r2 0 說(shuō)明回歸方程擬合的越差判定系數(shù)等于相關(guān)系數(shù)的平方 即r2 r 2 顯然 r2的值越大 說(shuō)明殘差平方和越小 也就是說(shuō)模型擬合效果越好 在線性回歸模型中 r2表示解析變量對(duì)預(yù)報(bào)變量變化的貢獻(xiàn)率 r2越接近1 表示回歸的效果越好 因?yàn)閞2越接近1 表示解析變量和預(yù)報(bào)變量的線性相關(guān)性越強(qiáng) 如果某組數(shù)據(jù)可能采取幾種不同回歸方程進(jìn)行回歸分析 則可以通過(guò)比較r2的值來(lái)做出選擇 即選取r2較大的模型作為這組數(shù)據(jù)的模型 總的來(lái)說(shuō) 相關(guān)指數(shù)r2是度量模型擬合效果的一種指標(biāo) 在線性模型中 它代表自變量刻畫預(yù)報(bào)變量的能力 從表3 1中可以看出 解析變量對(duì)總效應(yīng)約貢獻(xiàn)了64 即r20 64 可以敘述為 身高解析了64 的體重變化 而隨機(jī)誤差貢獻(xiàn)了剩余的36 所以 身高對(duì)體重的效應(yīng)比隨機(jī)誤差的效應(yīng)大得多 表3 2列出了女大學(xué)生身高和體重的原始數(shù)據(jù)以及相應(yīng)的殘差數(shù)據(jù) 在研究?jī)蓚€(gè)變量間的關(guān)系時(shí) 首先要根據(jù)散點(diǎn)圖來(lái)粗略判斷它們是否線性相關(guān) 是否可以用回歸模型來(lái)擬合數(shù)據(jù) 殘差分析與殘差圖的定義 然后 我們可以通過(guò)殘差來(lái)判斷模型擬合的效果 判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù) 這方面的分析工作稱為殘差分析 我們可以利用圖形來(lái)分析殘差特性 作圖時(shí)縱坐標(biāo)為殘差 橫坐標(biāo)可以選為樣本編號(hào) 或身高數(shù)據(jù) 或體重估計(jì)值等 這樣作出的圖形稱為殘差圖 殘差圖的制作及作用 坐標(biāo)縱軸為殘差變量 橫軸可以有不同的選擇 若模型選擇的正確 殘差圖中的點(diǎn)應(yīng)該分布在以橫軸為心的帶形區(qū)域 對(duì)于遠(yuǎn)離橫軸的點(diǎn) 要特別注意 身高與體重殘差圖 幾點(diǎn)說(shuō)明 第一個(gè)樣本點(diǎn)和第6個(gè)樣本點(diǎn)的殘差比較大 需要確認(rèn)在采集過(guò)程中是否有人為的錯(cuò)誤 如果數(shù)據(jù)采集有錯(cuò)誤 就予以糾正 然后再重新利用線性回歸模型擬合數(shù)據(jù) 如果數(shù)據(jù)采集沒(méi)有錯(cuò)誤 則需要尋找其他的原因 另外 殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中 說(shuō)明選用的模型計(jì)較合適 這樣的帶狀區(qū)域的寬度越窄 說(shuō)明模型擬合精度越高 回歸方程的預(yù)報(bào)精度越高 例2 在一段時(shí)間內(nèi) 某中商品的價(jià)格x元和需求量y件之間的一組數(shù)據(jù)為 求出y對(duì)的回歸直線方程 并說(shuō)明擬合效果的好壞 解 例2 在一段時(shí)間內(nèi) 某中商品的價(jià)格x元和需求量y件之間的一組數(shù)據(jù)為 求出y對(duì)的回歸直線方程 并說(shuō)明擬合效果的好壞 列出殘差表為 0 994 因而 擬合效果較好 0 0 3 0 4 0 1 0 2 4 6 2 6 0 4 2 4 4 4 這些問(wèn)題也使用于其他問(wèn)題 涉及到統(tǒng)計(jì)的一些思想 模型適用的總體 模型的時(shí)間性 樣本的取值范圍對(duì)模型的影響 模型預(yù)報(bào)結(jié)果的正確理解 小結(jié) 一般地 建立回歸模型的基本步驟為 1 確定研究對(duì)象 明確哪個(gè)變量是解析變量 哪個(gè)變量是預(yù)報(bào)變量 2 畫出確定好的解析變量和預(yù)報(bào)變量的散點(diǎn)圖 觀察它們之間的關(guān)系 如是否存在線性關(guān)系等 3 由經(jīng)驗(yàn)確定回歸方程的類型 如我們觀察到數(shù)據(jù)呈線性關(guān)系 則選用線性回歸方程y bx a 4 按一定規(guī)則估計(jì)回歸方程中的參數(shù) 如最小二乘法 5 得出結(jié)果后分析殘差圖是否有異常 個(gè)別數(shù)據(jù)對(duì)應(yīng)殘差過(guò)大 或殘差呈現(xiàn)不隨機(jī)的規(guī)律性 等等 過(guò)存在異常 則檢查數(shù)據(jù)是否有誤 或模型是否合適等 什么是回歸分析 內(nèi)容 從一組樣本數(shù)據(jù)出發(fā) 確定變量之間的數(shù)學(xué)關(guān)系式對(duì)這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn) 并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著 哪些不顯著利用所求的關(guān)系式 根據(jù)一個(gè)或幾個(gè)變量的取值來(lái)預(yù)測(cè)或控制另一個(gè)特定變量的取值 并給出這種預(yù)測(cè)或
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- (高清版)DB54∕T 0465-2025 黑斑原鮡人工繁殖技術(shù)規(guī)范
- 5.3 搜索引擎營(yíng)銷
- 2025年廣東省普通高中學(xué)業(yè)水平合格性考試模擬(三)歷史試題(含答案)
- 小鹿活動(dòng)策劃方案
- 工會(huì)秋季活動(dòng)方案
- 少兒過(guò)年活動(dòng)策劃方案
- 巾幗示范小菜園活動(dòng)方案
- 小學(xué)組隊(duì)跳繩活動(dòng)方案
- 小班皮影活動(dòng)方案
- 工會(huì)活動(dòng)釣螃蟹活動(dòng)方案
- 工程預(yù)算審核報(bào)告回復(fù)函
- 醫(yī)藥行業(yè)銷售流程與培訓(xùn)手冊(cè)
- 陪診師考試知識(shí)點(diǎn)提煉與答案解析
- 產(chǎn)后護(hù)理檔案表
- 深信服aES產(chǎn)品技術(shù)白皮書-V1.5
- 低壓電氣基礎(chǔ)知識(shí)培訓(xùn)電工-電氣工程師
- 現(xiàn)代環(huán)境生物技術(shù)課件
- 《民法典》合同編實(shí)務(wù)解讀
- 營(yíng)銷策劃 -阿那亞品牌手冊(cè)
- 導(dǎo)管相關(guān)感染預(yù)防及控制
- 企業(yè)消防安全培訓(xùn)課件
評(píng)論
0/150
提交評(píng)論