數學建模多元線性回歸分析-副本.ppt_第1頁
數學建模多元線性回歸分析-副本.ppt_第2頁
數學建模多元線性回歸分析-副本.ppt_第3頁
數學建模多元線性回歸分析-副本.ppt_第4頁
數學建模多元線性回歸分析-副本.ppt_第5頁
已閱讀5頁,還剩45頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

多元線性回歸分析,(Multiple Linear Regression),Multiple linear regression Choice of independent variable Application,Content,講述內容 第一節(jié) 多元線性回歸 第二節(jié) 自變量選擇方法 第三節(jié) 多元線性回歸的應用 及其注意事項,目的:作出以多個自變量估計應變量的多元線性回歸方程。 資料:應變量為定量指標;自變量全部或大部分為定量指標,若有少量定性或等級指標需作轉換。 用途:解釋和預報。 意義:由于事物間的聯系常常是多方面的,一個應變量的變化可能受到其它多個自變量的影響,如糖尿病人的血糖變化可能受胰島素、糖化血紅蛋白、血清總膽固醇、甘油三脂等多種生化指標的影響。,第一節(jié) 多元線性回歸,變量:應變量 1 個,自變量m 個,共 m+1 個。 樣本含量:n 數據格式見表15-1 回歸模型一般形式:,一、多元線性回歸模型,表15-1 多元回歸分析數據格式,條件,一般步驟,建立回歸方程,(2)檢驗并評價回歸方程 及各自變量的作用大小,二、多元線性回歸方程的建立,例15-1 27名糖尿病人的血清總膽固醇、甘油三脂、空腹胰島素、糖化血紅蛋白、空腹血糖的測量值列于表15-2中,試建立血糖與其它幾項指標關系的多元線性回歸方程。,表15-2 27名糖尿病人的血糖及有關變量的測量結果,求偏導數,原 理 最小二乘法,三、假設檢驗及其評價,1. 方差分析法:,(一)對回歸方程,表15-4 例15-1的方差分析表,表15-3 多元線性回歸方差分析表,2. 決定系數R 2:,3.復相關系數,(二)對各自變量 指明方程中的每一個自變量對Y的影響(即方差分析和決定系數檢驗整體)。,1. 偏回歸平方和,表15-5 對例15-1數據作回歸分析的部分中間結果,各自變量的偏回歸平方和可以通過擬合包含不同自變量的回歸方程計算得到,表15-5給出了例15-1數據分析的部分中間結果。,結 果,2. t 檢驗法 是一種與偏回歸平方和檢驗完全等價的一種方法。計算公式為,結 果,結 論,3標準化回歸系數 變量標準化是將原始數據減去相應變量的均數,然后再除以該變量的標準差。,計算得到的回歸方程稱作標準化回歸方程,相應的回歸系數即為標準化回歸系數。,注意: 一般回歸系數有單位,用來解釋各自變量對應變量的影響,表示在其它自變量保持不變時, 增加或減少一個單位時Y的平均變化量 。不能用各 來比較各 對 的影響大小。 標準化回歸系數無單位,用來比較各自變量對應變量的影響大小, 越大, 對 的影響越大。,結 論,第二節(jié) 自變量選擇方法,目的:使得預報和(或)解釋效果好,一、全局擇優(yōu)法,目的:預報效果好 意義:對自變量各種不同的組合所建立 的回歸方程進行比較 擇優(yōu)。 選擇方法:,例15-2 用全局擇優(yōu)法對例15-1數據的自變量進行選擇。,二、逐步選擇法,1.,1.前進法,回歸方程中的自變量從無到有、從少到多逐個引入回歸方程。此法已基本淘汰。 2. 后退法,先將全部自變量選入方程,然后逐步剔除無統(tǒng)計學意義的自變量。 剔除自變量的方法是在方程中選一個偏回歸平方和最小的變量,作F檢驗決定它是否剔除,若無統(tǒng)計學意義則將其剔除,然后對剩余的自變量建立新的回歸方程。重復這一過程,直至方程中所有的自變量都不能剔除為止。理論上最好,建議使用采用此法。 3.逐步回歸法,逐步回歸法是在前述兩種方法的基礎上,進行雙向篩選的一種方法。該方法本質上是前進法。,表15-7 逐步回歸過程,表15-8 例15-3方差分析表,“最優(yōu)”回歸方程為,結果表明:血糖的變化與甘油三脂、胰島素和糖化血紅蛋白有線性回歸關系,其中與胰島素負相關。由標準化回歸系數看出,糖化血紅蛋白對空腹血糖的影響最大。,表15-9 例15-3的回歸系數的估計及檢驗結果,第三節(jié),多元線性回歸的應用及注意事項,一、多元線性回歸的應用,1. 影響因素分析,例如影響高血壓的因素可能有年齡、飲食習慣、吸煙狀況、工作緊張度和家族史等,在影響高血壓的眾多可疑因素中,需要研究哪些因素有影響,哪些因素影響較大。,在臨床試驗中,則可能由于種種原因難以保證各組的指標基線相同,如在年齡、病情等指標不一致出現混雜的情況下,如何對不同的治療方法進行比較等。 這些問題都可以利用回歸分析來處理??刂苹祀s因素(confounding factor)的一個簡單辦法就是將其引入回歸方程中,與其他主要變量一起進行分析,2. 估計與預測,如由兒童的心臟橫徑、心臟縱徑和心臟寬徑估計心臟的表面積;由胎兒的孕齡、頭頸、胸徑和腹徑預測出生兒體重等。,3. 統(tǒng)計控制 逆估計。,例如采用射頻治療儀治療腦腫瘤,腦皮質的毀損半徑與射頻溫度及照射時間有線性回歸關系,建立回歸方程后可以按預先給定的腦皮質毀損半徑,確定最佳控制射頻溫度和照射時間。,二、多元線性回歸應用的注意事項,1指標的數量化,分2類,可用一個(0,1)變量。如性別,分k類,k-1個(0,1)變量,如血型。,數據格式回歸方程,建立回歸方程,b1 :相當A 型相對于O 型的差別 b2 :相當B 型相對于O 型的差別 b3 :相當AB 型相對于O 型的差別,(3)等級 定量。 一般是將等級從弱到強轉換為 (或 )如文化程度分為小學、中學、大學、 大學以上四個等級。Y為經濟收入。,解釋:b(b1)反映X(X1) 增加1個單位, 增加b個單位(如:500元)。 表示中學文化較小學收入多500, 大學較中學多500,余類推。,2樣本含量: n =(510)m。 3關于逐步回歸: 對逐步回歸得到的結果不要盲目的信任,所謂的“最優(yōu)”回歸方程并不一定是最好的,沒有選入方程的變量也未必沒有統(tǒng)計學意義。例如,例15-3中若將選入標準和剔除標準定為 和 選入的變量是 , 而不是 , 結果發(fā)生了改變。 不同回歸方程適應于不同用途,依專業(yè)知識定。,4. 多重共線性 即指一些自變量之間存在較強的線性關系。如高血壓與年齡、吸煙年限、飲白酒年限等,這些自變量通常是高度相關的,有可能使通過最小二乘法建立回歸方程失效,引起下列一些不良后果: (1)參數估計值的標準誤變得很大,從而t值變得很小。 (2)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論