數學實驗第四版 教案-教學設計 7-回歸分析 實驗7.1-7.2 一元回歸分析、多元回歸分析_第1頁
數學實驗第四版 教案-教學設計 7-回歸分析 實驗7.1-7.2 一元回歸分析、多元回歸分析_第2頁
數學實驗第四版 教案-教學設計 7-回歸分析 實驗7.1-7.2 一元回歸分析、多元回歸分析_第3頁
數學實驗第四版 教案-教學設計 7-回歸分析 實驗7.1-7.2 一元回歸分析、多元回歸分析_第4頁
數學實驗第四版 教案-教學設計 7-回歸分析 實驗7.1-7.2 一元回歸分析、多元回歸分析_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

PAGE5PAGE授課題目(教學章、節(jié)或主題)7.1一元回歸分析需用學時2學時教學目標(知識、能力、素養(yǎng))1、掌握一元回歸分析的基本原理和回歸方程顯著性檢驗的方法及預測方法;2、了解MATLAB中回歸分析函數的用法和幫助系統(tǒng)等;3、學會應用MATLAB軟件進行一元回歸分析和建模的方法;4、培養(yǎng)學生借助計算機初步建立用回歸模型解決實際問題的能力。重點難點重點:1、MATLAB回歸分析函數的用法;2、回歸分析建模方法。難點:回歸分析中檢驗課程思政元素1.通過回歸分析發(fā)展史的了解,引導學生樹立追求科學、精益求精的工匠精神;2.通過對回歸建模中各類案例的講解讓學生知道數學的重要性,激發(fā)學習動力。教學內容及過程一、一元線性回歸分析1.數學模型稱之為一元線性回歸模型.其中自變量x是可以控制的非隨機變量,稱為回歸變量,兩個未知參數a,b稱為回歸系數,y稱為響應變量或因變量.由于是隨機誤差,根據中心極限定理,通常假定,是未知參數.因變量y的數學期望稱為回歸方程,它是一條直線,稱為回歸直線.一元線性回歸模型用到了以下假定:(1)因變量y與自變量x有線性關系;(2)隨機誤差項,不同的x對應誤差獨立.獨立性意味著一個特定的x對應的誤差與其他的x對應的誤差不相關;方差相同意味著對于所有的x,y的方差都是,該值越小,意味著y的觀測值越靠近回歸直線.2.回歸系數的估計使用最廣泛的是最小二乘方法可求得參數估計值:.由此得到(樣本的)一元線性回歸方程.注意,這里得到的回歸方程,是由本次實驗數據估計出來的,故也稱為經驗回歸方程.該方程的直線稱為回歸直線.代入觀測值,得到的值稱回歸預測值,它實際是E(y)預測值.3.回歸方程統(tǒng)計檢驗擬合優(yōu)度檢驗該檢驗是檢驗樣本觀測點與回歸直線的接近程度,擬合程度越高說明回歸方程對樣本的代表程度越高.回歸平方和在偏差平方和中所占的比重,記為()稱為決定系數.用的大小來說明模型的擬合優(yōu)度.它測度了回歸直線對觀測數據的擬合程度.越大說明回歸平方和所占的比例越大,說明回歸直線與各觀測點越接近,用x的變化來解釋y的變差的部分就越多,回歸直線的擬合程度就越高。反之擬合程度就越差.在一元回歸分析中相關系數就是決定系數的算術平方根.(2)回歸方程的顯著性檢驗當時,稱回歸方程高度顯著;當時,稱回歸方程顯著;當時,稱回歸方程不顯著.在一元回歸分析中,自變量只有一個,回歸方程的顯著性檢驗與回歸系數的顯著性檢驗是等價的.4.利用回歸方程進行預測把自變量的每一個給定值代入回歸方程,就可以求得一個對應的回歸預測值,稱為模型的點估計值.利用方程對預測目標進行區(qū)間估計.對給定的置信度,其預測區(qū)間為:二、回歸分析的MATLAB函數介紹按照軟件版本,分為兩類:1各個版本都有的函數,2是較新版本才有函數。1.regress(y,x,alpha)、rcoplot(r,rint)2.fitlm(x,y,model)、plotDiagnostics、plotResiduals、predict三、應用案例例1設x為該時期的家庭人均收入,y為該時期內平均每十戶擁有照相機的數量.統(tǒng)計數據見表7.1.試分析擁有相機數量y與家庭收入x的關系,并求出關系式.表7.1家庭人均收入與需要照相機數的關系家庭人均收入(百元)1.51.82.43.03.53.94.44.85.0有照相機(臺/十戶)2.83.75.06.38.810.511.011.613.2詳見課件。四、一元非線性回歸分析1.可化為線性的非線性。常見的可化為一元線性回歸的非線性(即曲線型)問題,主要有以下幾種情形:雙曲線型。(2)冪函數型(3)指數函數()型對數函數型S曲線型2.相關函數介紹函數nlinfit(x,y,’model’beta0)nlintool(x,y,’model’,beta0,alpha)nlpredci(‘model’,x,beta,r,J)nlparci(beta,r,J)fitnlm(x,y,fun,beta0)plotDiagnostics(mdl,plottype)plotResiduals(mdl,plottype)predict(mdl,Xnew)3.應用案例例2在彩色顯影中,根據經驗,形成燃料光學密度y與析出銀的光學密度x由公式表示,測得實驗數據如下:表7.3光學密度與析出銀的光學密度實驗數據xi0.050.060.070.100.140.200.250.310.380.430.47yi0.100.140.230.370.590.791.001.121.191.251.29求y關于x的回歸方程.詳見課件。討論、思考、作業(yè)1.案例討論下表為1980~1991年間以1987年不變價計算的美國個人消費支出Y與國內生產支出X數據(單位:10億美元)表7.4年份YX年份YX19802447.13776.319862969.14404.519812476.93843.119873052.24539.919822503.73760.319883162.44718.619832619.43906.619893223.34838.019842746.14148.519903260.44877.519852865.84279.819913240.84821.0(1)在直角坐標系下,作X與Y的散點圖,并判斷Y與X是否存在線性相關關系;(2)試求Y與X的一元線性回歸方程;(3)對所得回歸方程作顯著性檢驗(=0.05);(4)若國內生產支出為x0=4500,試求對應的消費支出y0的點預測和包含概率為的95%區(qū)間預測.要求:用兩類函數分別求解上述問題。參考資料(含參考書、文獻等):《數學實驗》,蕭樹鐵主編高等教育出版社《數學實驗》,李尚志主編高等教育出版社教學過程設計:復習0分鐘,授新課85分鐘,安排討論5分鐘,布置作業(yè)0分鐘授課類型:√理論課討論課實驗課練習課其他教學方式:√講授討論指導其他教學資源:√課件√在線課程動畫其他授課題目(教學章、節(jié)或主題)7.2多元回歸分析需用學時2學時教學目標(知識、能力、素養(yǎng))1、掌握多元回歸分析的基本理論和建模方法;2、學會應用MATLAB軟件進行多元回歸分析和逐步回歸;3、培養(yǎng)學生借助計算機初步建立用回歸模型解決實際問題的能力和素養(yǎng)。重點難點重點:1、MATLAB回歸分析中的檢驗方法、逐步回歸;2、回歸建模中變量檢驗和模型診斷。難點:回歸分析中檢驗和模型診斷課程思政元素1.通過回歸分析發(fā)展史的了解,引導學生樹立追求科學、精益求精的工匠精神;2.通過對回歸建模中的各類案例的講解讓學生知道數學的重要性,激發(fā)學習動力。教學內容及過程一、多元線性回歸分析的基本理論1.假設關注對象y與m個影響因素之間有以下線性關系(7.3)(),稱(7.3)為多元線性回歸模型,其中y稱為因變量(響應變量),稱為回歸變量,是未知的待定系數,稱為回歸系數.是隨機誤差,一般假設,是未知參數.更一般地有,(7.4)其中是已知的函數,因為y對它們是線性的,故也稱為(廣義)多元線性回歸模型.(7.4)式經過變量代換可化為(7.3).多元線性回歸分析的主要任務是:用試驗值(樣本觀測值)對待定系數做出估計;對建立的回歸方程和每個回歸變量進行顯著性檢驗;給定回歸變量數據后,利用回歸方程對y作預測.2.回歸系數的估計為了估計回歸系數,做了n組實驗得到數據代入多元線性回歸模型得到矩陣形式為其中,,,矩陣X為已知的樣本數據矩陣,稱為資料矩陣;B為未知的列向量(回歸系數);服從獨立的同分布,即應用最小二乘法估計可得到回歸系數的估計值,設為.因此可得(樣本)多元線性回歸方程:.代入一組觀測值,通過回歸方程可計算出,稱之為回歸預測值.3.回歸方程統(tǒng)計檢驗(1)回歸方程的擬合優(yōu)度(檢驗)在這里被稱為復相關系數或全相關系數,即多重判定系數的算術平方根.復相關系數用來解釋這一組影響因素與y的線性相關程度,用來評價模型的有效性.值越接近1,說明因變量y與回歸變量之間的函數關系越密切;反之,則說明因變量y與回歸變量之間的函數關系不密切或不存在線性函數關系.通常R大于0.8(或0.9)才認為相關關系成立.多重判定系數R2在多元線性回歸分析是度量多元回歸方程擬合程度的一個統(tǒng)計量,反映了在因變量y的變差中被估計的回歸方程所解釋的比例.使用時需要注意的是,如果增減變量的個數,前后模型對比時,一般使用調整的多重判定系數判定擬合優(yōu)度.調整的多重判定系數公式是.此外,剩余標準差(RMSE)表示觀測值偏離回歸直線的平均誤差,利用它也可以判斷回歸方程擬合的效果.顯然,s越接近0,說明回歸預測值與原始數據擬合的越好.(2)回歸方程的線性顯著性檢驗(檢驗)檢驗是定量地檢驗因變量與回歸變量之間是否顯著地有線性關系.構造統(tǒng)計量為:.F服從第一自由度為m,第二自由度為n-m-1的F分布,給定顯著水平,查F分布表得.如果,則認為因變量與全體回歸變量之間顯著地有線性關系,可以利用所建立的多元線性回歸方程進行預測;否則認為因變量與全體回歸變量之間不存在顯著的線性關系.常通過概率F的統(tǒng)計值對應的概率P<來說明因變量y與全體回歸變量之間的線性相關性顯著.注意,這里是指因變量y與至少一個回歸變量有顯著的線性關系,而不是與每一個回歸變量都有顯著的線性關系.當時,稱回歸方程高度顯著;當時,稱回歸方程顯著;當時,稱回歸方程不顯著.4.回歸系數的顯著性檢驗方法如下:如果某個回歸系數的置信區(qū)間包含0點,則說明該回歸變量對因變量的影響不顯著.若存在不顯著的回歸變量,剔除后,再進行其余變量的回歸,直至余下的變量全部顯著為止.如果同時有多個回歸變量沒有通過檢驗,剔除的原則是,先剔除t值最小的那個自變變量,一次只能剔除同一個,剔除一次重新回歸計算一次.這里要注意的是,剔除一個變量時,不能完全根據統(tǒng)計的數量指標決定,還要考慮它對所研究問題的實際影響再最終確定其去留.殘差分析與模型診斷觀測值與回歸值之差稱為殘差.在回歸模型定義中,假設隨機誤差,如果殘差不服從正態(tài)分布,則說明建立回歸模型不夠好,需要進一步改進模型.對于通過檢驗的模型,殘差圖中置信區(qū)間不經過0直線的殘差所對應的個別數據,可從原數據中刪除后再重新進行回歸,這一點有時候很重要,直接影響到模型的結構,如例5中建立的模型.在多元線性回歸模型中,一些回歸變量之間彼此相關時,則稱回歸模型中存在多重共線性.如果出現下列情況,暗示存在多重共線性:模型中各對自變量之間顯著相關.F檢驗通過時,幾乎所有的回歸系數檢驗通不過.回歸系數的正負與實際預期相反.最后提醒一下,在建立多元線性回歸模型時,不要試圖引入更多的自變量,除非必要。特別是社會科學研究中,很多數據是非實驗數據,質量不好,即使結果不滿意,也不一定是模型不合適.建立的模型只有經得起實踐的檢驗才是好模型.用回歸方程預測當我們獲得顯著的回歸方程,就可以運用該回歸方程進行分析預測了.給出自變量的一組觀測值,代入回歸方程即可得到的回歸預測值.給定置信度,我們還可以得y的的預測區(qū)間(置信區(qū)間).二、應用案例例3某公司調查某種商品的兩種廣告費用1和廣告費用2對該產品銷售量的影響,得到如下數據,試建立線性回歸模型并進行檢驗,診斷是否有異常點.表7.8數據表銷量Y9690959295959494廣告費1(x1)1.52.01.52.53.32.34.22.5廣告費2(x2)5.02.04.02.53.03.52.53.0詳見課件。三、逐步線性回歸分析1.逐步回歸的原理建立的回歸方程即使通過了回歸方程的顯著性檢驗,回歸方程是不是“最優(yōu)”的方程呢?實際問題中由于對因變量y的影響的因素較多,有的回歸變量對因變量的影響并不顯著,且多個回歸變量之間可能存在相互依賴性,相互影響,這就給回歸系數的估計帶來不可靠的解釋.為了得到“最優(yōu)”的回歸模型,我們要保留對因變量影響大的變量,剔除對因變量影響小的變量.這里最有效的方法是逐步回歸法:(1)從一個自變量開始,根據對因變量y的影響程度,從大到小地依次逐個引入回歸方程.但當引入的自變量由于后面的自變量的引入而變得不明顯時,要將其除掉.(2)每引入或剔除一個自變量,都要對y進行一次檢驗,以確保每次引入新變量前回歸方程中只包含對y作用顯著的變量.(3)這個過程反復進行,直至沒有顯著影響變量引入,也沒有不顯著影響變量剔除為止.引入或剔除變量是由一定數學依據這里就不一一列舉了.我們可以通過觀察調整后的決定系數R2、F統(tǒng)計量和剩余標準差(RMSE)、回歸系數的區(qū)間的變化來判斷該判定變量對模型的影響的顯著性.可用剩余標準差(RMSE)最小作為衡量變量選擇的一個數量標準.逐步回歸的MATLAB函數stepwise命令使用說明:stepwise(x,y,inmodel,alpha)(1)x是自變量數據矩陣,y是因變量數據矩陣;alpha是顯著性水平(缺省時為0.05).(2)inmode是自變量初始集合的指標(數據矩陣的X哪些列進入初始集合),給出初始模型中包括的變量的子集,如取第2、3個變量時inmodel為[2,3](缺省時設定為全部自變量),alpha缺省為0.05.此外,Matlab2023還提供了如下逐步回歸命令:stepwiselm(x,y,modelspec)這里x和y的意義同stepwise,modelspec用來提供模型的類別,詳見軟件幫助.值得注意的是,軟件建立的“最優(yōu)”模型只是統(tǒng)計意義上的,不一定是因果事實.模型的檢驗和改進還要結合所研究問題的專業(yè)知識來決定.應用案例例5表中數據是某建筑公司去年20個地區(qū)是銷售量(Y千元),推銷開支、實際帳目數、同類商品競爭數和地區(qū)潛力分別是影響建筑材料銷售量的因素,試分析哪些是主要的影響因素,并建立該因素的線性回歸模型.數據表7.10(見課件)操作詳

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論