偏最小二乘回歸方法_第1頁
偏最小二乘回歸方法_第2頁
偏最小二乘回歸方法_第3頁
偏最小二乘回歸方法_第4頁
偏最小二乘回歸方法_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、偏最小二乘回歸方法,講演人:,簡言之,偏最小二乘回歸是一種集多元線性回歸分析、典型相關(guān)分析和主成分分析的基本功能為一體的新型多元統(tǒng)計分析方法。,此方法的優(yōu)點:,(1)能在自變量存在嚴(yán)重多重相關(guān)性的條件下進(jìn)行回歸建模;,(2)允許在樣本點個數(shù)少于自變量個數(shù)的條件下進(jìn)行回歸建模;,此方法的優(yōu)點:,(3)偏最小二乘回歸在最終模型中將包含原有的所有自變量,易于辨識系統(tǒng)信息與噪聲,而且其自變量的回歸系數(shù)也將更容易解釋。,此方法的優(yōu)點:,(4)偏最小二乘回歸方法與其他的建模方法相比,具有計算簡單、預(yù)測精度高,易于定性解釋的優(yōu)點。,多因變量偏最小二乘算法推導(dǎo),首先將數(shù)據(jù)做標(biāo)準(zhǔn)化處理。,原自變量數(shù)據(jù)表,經(jīng)標(biāo)準(zhǔn)

2、化后的數(shù)據(jù)矩陣記為,原因變量數(shù)據(jù)表,經(jīng)標(biāo)準(zhǔn)化后的數(shù)據(jù)矩陣記,多因變量偏最小二乘算法推導(dǎo),第一步:記 是 的第一個成分, , 是 的第一個軸,它是一個單位向量,即有 。 記 是 的第一個成分 , 是 的第一個軸,它是一個單位 向量,即 。,多因變量偏最小二乘算法推導(dǎo),如果要使 , 能很好的代表 與 中的數(shù)據(jù)變異信息,根據(jù)主成分分析原理,應(yīng)該有 , 。,多因變量偏最小二乘算法推導(dǎo),另一方面,由于回歸建模的需要,又要求 對 有最大的解釋能力,由典型相關(guān)分析的思路,與 的相關(guān)度應(yīng)達(dá)到最大值,即,多因變量偏最小二乘算法推導(dǎo),因此,綜合起來,在偏最小二乘回歸中,我們要求 與 的協(xié)方差達(dá)到最大,即,多因變量

3、偏最小二乘算法推導(dǎo),正規(guī)的數(shù)學(xué)表述應(yīng)該是求解下列優(yōu)化問題,即,多因變量偏最小二乘算法推導(dǎo),采用拉格朗日算法,記,對 分別求關(guān)于 , ,和 的偏導(dǎo)數(shù),并令之為零,有,多因變量偏最小二乘算法推導(dǎo),(1)式,(2)式,(3)式,(4)式,多因變量偏最小二乘算法推導(dǎo),由上述四個式子可以推出,記 ,所以 正是優(yōu)化問題的目標(biāo)函數(shù)值。,多因變量偏最小二乘算法推導(dǎo),把(1)和(2)式寫成,將(6)代入(5),有,(5)式,(6)式,(7)式,多因變量偏最小二乘算法推導(dǎo),同理,可得,易知, 是矩陣 的特征向量,對應(yīng)的特征值為 。 是目標(biāo)函數(shù),它要求取最大值。,所以, 是對應(yīng)于矩陣 的最大特征值的單位特征向量。,

4、多因變量偏最小二乘算法推導(dǎo),易知, 是對應(yīng)于矩陣 的最大特征值 的單位特征向量。,求得軸 和 后,即可得到成分 , 。然后,分別求 和 對 與 的三個回歸方程,多因變量偏最小二乘算法推導(dǎo),其中,多因變量偏最小二乘算法推導(dǎo),而 , , 分別是三個回歸方程的殘差矩陣。,多因變量偏最小二乘算法推導(dǎo),第二步:用殘差矩陣 和 取代 和 。然后,求第二個軸 和 以及第二個成分 , ,有,多因變量偏最小二乘算法推導(dǎo),是對應(yīng)于矩陣 的最大特征值 的特征向量; 是對應(yīng)于矩陣 的最大特征值 的特征向量。,多因變量偏最小二乘算法推導(dǎo),計算回歸系數(shù),因此,有回歸方程,(8)式,多因變量偏最小二乘算法推導(dǎo),如此計算下去

5、,如果的 秩是 ,則會有,由于 均可以表示成 的線性組合。,多因變量偏最小二乘算法推導(dǎo),因此,(8)式還可以還原成 關(guān)于 的回歸方程形式,即,是殘差矩陣 的第 列。,偏最小二乘回歸的簡化算法,(1)求矩陣 最大特征值所對應(yīng)的單位特征向量 ,求成分 ,得,其中,偏最小二乘回歸的簡化算法,(2)求矩陣 最大特征值所對應(yīng)的單位特征向量 ,求成分 ,得,其中,偏最小二乘回歸的簡化算法,至第h步,求成分 , 是 矩陣最大特征值所對應(yīng)的特征向量。,如果根據(jù)交叉有效性,確定共抽取h個主成分 可以得到一個滿意的預(yù)測模型。,偏最小二乘回歸的簡化算法,則求 在 上的普通最小二乘回歸方程為,其中,交叉有效性具體的步驟:,記 為原始數(shù)據(jù), 是在偏最小二乘回歸過程中提取的成分, 是使用全部樣本點并取h 個成分回歸建模后,第 個樣本點的擬合值, 是在建模時刪除樣本點 ,,交叉有效性具體的步驟:,取 h 個成分回歸建模后,再用此模,型計算的 的擬合值,記,交叉有效性具體的步驟:,當(dāng) 即 時,引進(jìn)新的成分 會對模型的預(yù)測能力有明顯的改善作用。,典型相關(guān)分析中的精度分析,在偏最小二乘回歸計算過程中,所提取的自變量成分 ,盡可能多地代表 中的變異信息。,對某自變量 的解釋能力為,典型相關(guān)分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論