非參數(shù)回歸的介紹知識(shí)講解_第1頁(yè)
非參數(shù)回歸的介紹知識(shí)講解_第2頁(yè)
非參數(shù)回歸的介紹知識(shí)講解_第3頁(yè)
非參數(shù)回歸的介紹知識(shí)講解_第4頁(yè)
非參數(shù)回歸的介紹知識(shí)講解_第5頁(yè)
已閱讀5頁(yè),還剩55頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

參數(shù)回歸(huíguī)與非參數(shù)回歸(huíguī)的優(yōu)缺點(diǎn)比較:參數(shù)(cānshù)回歸:非參數(shù)(cānshù)回歸:優(yōu)點(diǎn):(1).模型形式簡(jiǎn)單明確,僅由一些參數(shù)表達(dá)(2).在經(jīng)濟(jì)中,模型的參數(shù)具有一般都具有明確的經(jīng)濟(jì)含義(3).當(dāng)模型參數(shù)假設(shè)成立,統(tǒng)計(jì)推斷的精度較高,能經(jīng)受實(shí)際檢驗(yàn)(4).模型能夠進(jìn)行外推運(yùn)算(5).模型可以用于小樣本的統(tǒng)計(jì)推斷缺點(diǎn):(1).回歸函數(shù)的形式預(yù)先假定(2).模型限制較多:一般要求樣本滿足某種分布要求,隨機(jī)誤差滿足

正態(tài)假設(shè),解釋變量間獨(dú)立,解釋變量與隨機(jī)誤差不相關(guān),等(3)需要對(duì)模型的參數(shù)進(jìn)行嚴(yán)格的檢驗(yàn)推斷,步驟較多(4).模型泛化能力弱,缺乏穩(wěn)健性,當(dāng)模型假設(shè)不成立,擬合效果

不好,需要修正或者甚至更換模型優(yōu)點(diǎn);(1)回歸函數(shù)形式自由,受約束少,對(duì)數(shù)據(jù)的分布一般不做任何要求(2)適應(yīng)能力強(qiáng),穩(wěn)健性高,回歸模型完全由數(shù)據(jù)驅(qū)動(dòng)(3)模型的精度高;(4)對(duì)于非線性、非齊次問(wèn)題,有非常好的效果缺點(diǎn):(1)不能進(jìn)行外推運(yùn)算,(2)估計(jì)的收斂速度慢(3)一般只有在大樣本的情況下才能得到很好的效果,

而小樣本的效果較差(4)高維詛咒,光滑參數(shù)的選取一般較復(fù)雜1第一頁(yè),共60頁(yè)。非參數(shù)(cānshù)回歸方法樣條光滑(guānghuá)正交回歸(huíguī)核回歸:N-W估計(jì)、P-C估計(jì)、G-M估計(jì)局部多項(xiàng)式回歸:線性、多項(xiàng)式光滑樣條:光滑樣條、B樣條近鄰回歸:k-NN、k近鄰核、對(duì)稱近鄰正交級(jí)數(shù)光滑穩(wěn)健回歸:LOWESS、L光滑、R光滑、M光滑局部回歸Fourier級(jí)數(shù)光滑wavelet光滑處理高維的非參數(shù)方法:多元局部回歸、薄片樣條、

可加模型、投影尋蹤、

回歸樹(shù)、張量積,等2第二頁(yè),共60頁(yè)。核函數(shù)(hánshù)K:函數(shù)(hánshù)K(.)滿足:常見(jiàn)(chánɡjiàn)的核函數(shù):Boxcar核:Gaussian核:Epanechnikov核:tricube核:為示性函數(shù)(hánshù)3第三頁(yè),共60頁(yè)?;貧w(huíguī)模型:(1)模型為隨機(jī)(suíjī)設(shè)計(jì)模型,樣本觀測(cè)(Xi,Yi)~iid(2)模型(móxíng)為固定設(shè)計(jì)模型(móxíng)Xi為R中n個(gè)試驗(yàn)點(diǎn)列,i=1,2,…,nYi為固定Xi的n次獨(dú)立觀測(cè),i=1,2,…,nm(x)為為一未知函數(shù),用一些方法來(lái)擬合定義:線性光滑器(linearsmoother)4第四頁(yè),共60頁(yè)。光滑參數(shù)(cānshù)的選取風(fēng)險(xiǎn)(fēngxiǎn)(均方誤差)(meansquarederror,MSE)理想的情況是希望選擇合適的光滑參數(shù)(cānshù)h,使得通過(guò)樣本數(shù)據(jù)擬合的回歸曲線能夠最好的逼近真實(shí)的回歸曲線(即達(dá)到風(fēng)險(xiǎn)最小),這里真實(shí)回歸函數(shù)m(x)一般是未知的。可能會(huì)想到用平均殘差平方和來(lái)估計(jì)風(fēng)險(xiǎn)R(h)但是這并不是一個(gè)好的估計(jì),會(huì)導(dǎo)致過(guò)擬合(欠光滑),原因在于兩次利用了數(shù)據(jù),一次估計(jì)函數(shù),一次估計(jì)風(fēng)險(xiǎn)。我們選擇的函數(shù)估計(jì)就是使得殘差平方和達(dá)到最小,因此它傾向于低估了風(fēng)險(xiǎn)。是

的估計(jì),h是光滑參數(shù),稱為帶寬或窗寬5第五頁(yè),共60頁(yè)。光滑(guānghuá)參數(shù)的選取缺一交叉驗(yàn)證(yànzhèng)方法(leave-one-outcrossvalidation,CV)這里是略去第i個(gè)數(shù)據(jù)點(diǎn)后得到(dédào)的函數(shù)估計(jì)交叉驗(yàn)證的直觀意義:因此:6第六頁(yè),共60頁(yè)。光滑(guānghuá)參數(shù)的選取定理:若那么缺一交叉(jiāochā)驗(yàn)證得分

能夠?qū)懗桑哼@里是光滑(guānghuá)矩陣L的第i個(gè)對(duì)角線元素廣義交叉驗(yàn)證(generalizedcross-validation,GCV)其中:為有效自由度7第七頁(yè),共60頁(yè)。光滑參數(shù)(cānshù)的選取其他(qítā)標(biāo)準(zhǔn)(1)直接插入法(DirectPlug-In,DPI)相關(guān)文獻(xiàn)可以(kěyǐ)參考:

WolfgangH?rdle(1994),AppliedNonparametricRegression,BerlinJeffreyD.Hart(1997),NonparametricSmoothingandLack-of-FitTests,SpringerSeriesinStatistics李竹渝、魯萬(wàn)波、龔金國(guó)(2007),經(jīng)濟(jì)、金融計(jì)量學(xué)中的非參數(shù)估計(jì)技術(shù),科學(xué)出版社,北京

吳喜之譯(2008),現(xiàn)代非參數(shù)統(tǒng)計(jì),科學(xué)出版社,北京

(2)罰函數(shù)法(penalizingfunction)(3)單邊交叉驗(yàn)證(OneSidedCrossValidation,OSCV)(4)拇指規(guī)則(RuleOfThumb)8第八頁(yè),共60頁(yè)。1.核回歸(huíguī)(核光滑)N-W估計(jì)是一種(yīzhǒnɡ)簡(jiǎn)單的加權(quán)平均估計(jì),可以寫(xiě)成線性光滑器:局部(júbù)回歸由Nadaraya(1964)和Watson(1964)分別提出,(1)N-W估計(jì)形式:其中:,為核函數(shù),為帶寬或窗寬9第九頁(yè),共60頁(yè)。局部(júbù)回歸(2)P-C-估計(jì)(gūjì)由PriestleyandChao(1972)提出(tíchū),形式:寫(xiě)成線性光滑器的形式:在隨機(jī)設(shè)計(jì)模型下,P-C估計(jì)可由x的密度估計(jì):推導(dǎo)出來(lái),相關(guān)文獻(xiàn)可參考h?rdle(1994)和李竹渝等(2007)10第十頁(yè),共60頁(yè)。局部(júbù)回歸(3)G-M估計(jì)(gūjì)由GasserandMüller(1979)提出(tíchū),形式如下:其中寫(xiě)成線性光滑器的形式:G-M估計(jì)是卷積形式的估計(jì),P-C估計(jì)可看成G-M估計(jì)的近似:當(dāng)K連續(xù)11第十一頁(yè),共60頁(yè)。局部(júbù)回歸核估計(jì)存在邊界效應(yīng)(xiàoyìng),邊界點(diǎn)的估計(jì)偏差較大,以N-W估計(jì)為例,如下圖12第十二頁(yè),共60頁(yè)。局部(júbù)回歸一般(yībān),核函數(shù)的選取并不是很重要,重要的是帶寬的選取13第十三頁(yè),共60頁(yè)。局部(júbù)回歸一般,核函數(shù)(hánshù)的選取并不是很重要,重要的是帶寬的選取14第十四頁(yè),共60頁(yè)。局部(júbù)回歸一般(yībān),核函數(shù)的選取并不是很重要,重要的是帶寬的選取可以(kěyǐ)看到:擬合曲線的光滑度受到光滑參數(shù)h變化的影響15第十五頁(yè),共60頁(yè)。局部(júbù)回歸核估計(jì)(gūjì)的漸近方差核漸近偏差核估計(jì)漸近偏差漸近方差N-W估計(jì)

G-M估計(jì)

其中,h為光滑(guānghuá)參數(shù),f為X的密度函數(shù),且16第十六頁(yè),共60頁(yè)。局部(júbù)回歸2.局部(júbù)多項(xiàng)式光滑多項(xiàng)式的回歸(huíguī)模型其中可由最小二乘法估計(jì),即局部多項(xiàng)式回歸:對(duì)m(x)在u處進(jìn)行p階泰勒展開(kāi),略去p階高階無(wú)窮小量,得到m(x)在u處的一個(gè)p階多項(xiàng)式近似,即此時(shí),x應(yīng)該靠近u,且17第十七頁(yè),共60頁(yè)。局部(júbù)回歸通過(guò)最小二乘來(lái)估計(jì)(gūjì)系數(shù)注意:是在x的一個(gè)鄰域(línyù)內(nèi)進(jìn)行多項(xiàng)式估計(jì),因此,最小二乘應(yīng)該與x的鄰域(línyù)有關(guān)局部加權(quán)平方和:使上述問(wèn)題最小化,可以得到系數(shù)的局部多項(xiàng)式的最小二乘估計(jì)可以很容易得到,取p=0時(shí)為局部常數(shù)估計(jì),即N-W核估計(jì)取p=1,為局部線性估計(jì)18第十八頁(yè),共60頁(yè)。局部(júbù)回歸寫(xiě)成矩陣(jǔzhèn)形式:使上式最小化,可以得到系數(shù)(xìshù)的估計(jì)其中19第十九頁(yè),共60頁(yè)。局部(júbù)回歸得到(dédào)加權(quán)最小二乘估計(jì)當(dāng)p=1時(shí)(局部線性估計(jì)(gūjì))的漸近偏差和漸近方差其中可以看到局部線性回歸的漸近方差和N-W估計(jì)相同,而漸近偏差卻比N-W回歸小,說(shuō)明局部線性多項(xiàng)式可以減少邊界效應(yīng),局部線性估計(jì)由于N-W估計(jì)20第二十頁(yè),共60頁(yè)。局部(júbù)回歸局部多項(xiàng)式光滑可以很好的減少(jiǎnshǎo)邊界效應(yīng)21第二十一頁(yè),共60頁(yè)。局部(júbù)回歸檢驗(yàn)函數(shù)(hánshù)(Doppler函數(shù)(hánshù))22第二十二頁(yè),共60頁(yè)。局部(júbù)回歸使用(shǐyòng)GCV選取最優(yōu)帶寬h=0.017,權(quán)函數(shù)為tricube核函數(shù)23第二十三頁(yè),共60頁(yè)。局部(júbù)回歸使用(shǐyòng)GCV選取最優(yōu)帶寬h=0.017,權(quán)函數(shù)為tricube核函數(shù)24第二十四頁(yè),共60頁(yè)。局部(júbù)回歸3.近鄰(jìnlín)光滑(1)k-NN回歸(huíguī)(k-nearestneighborregression)其中={i:xi是離x最近的k個(gè)觀測(cè)值之一}K-NN估計(jì)的漸近偏差和漸近方差:對(duì)于隨機(jī)設(shè)計(jì)模型,近鄰估計(jì)寫(xiě)成線性光滑器的形式權(quán)函數(shù):25第二十五頁(yè),共60頁(yè)。局部(júbù)回歸(1)k-NN回歸(huíguī)(k-nearestneighborregression)26第二十六頁(yè),共60頁(yè)。局部(júbù)回歸(1)k-NN回歸(huíguī)(k-nearestneighborregression)27第二十七頁(yè),共60頁(yè)。局部(júbù)回歸(2)k-近鄰(jìnlín)核回歸K近鄰(jìnlín)核估計(jì)的權(quán)重其中R為xi中離x最近的第k個(gè)距離,K為核函數(shù)漸近偏差和漸近方差:28第二十八頁(yè),共60頁(yè)。局部(júbù)回歸(2)k-近鄰(jìnlín)核回歸29第二十九頁(yè),共60頁(yè)。局部(júbù)回歸(2)k-近鄰(jìnlín)核回歸30第三十頁(yè),共60頁(yè)。局部(júbù)回歸(3)對(duì)稱(duìchèn)化近鄰回歸(SymmetrizedNearestNeighborEstimate)Yang(1981),Stute(1984)研究(yánjiū)了這種估計(jì)其中權(quán)重寫(xiě)成線性光滑器這里的k(h)相當(dāng)于nh,可以看出實(shí)質(zhì)上相當(dāng)于nh個(gè)Yi值加權(quán)平均31第三十一頁(yè),共60頁(yè)。局部(júbù)回歸4.穩(wěn)健(wěnjiàn)光滑(1)局部(júbù)加權(quán)描點(diǎn)光滑(LocallyWeightedScatterplotSmoothing,LOWESS)Step1:在x的鄰域內(nèi),用一個(gè)多項(xiàng)式進(jìn)行擬合,求出系數(shù){βj}其中Wki(x)為k-NN權(quán)Step2:根據(jù)殘差計(jì)算尺度估計(jì),定義穩(wěn)健權(quán)重Step3:用新的權(quán)重

重復(fù)Step1、Step2,直到第N次結(jié)束32第三十二頁(yè),共60頁(yè)。(1)局部(júbù)加權(quán)描點(diǎn)光滑(LOWESS)局部(júbù)回歸33第三十三頁(yè),共60頁(yè)。(1)局部(júbù)加權(quán)描點(diǎn)光滑(LOWESS)局部(júbù)回歸34第三十四頁(yè),共60頁(yè)。局部(júbù)回歸(2)L-光滑(guānghuá)條件(tiáojiàn)L函數(shù)其中

為條件分位數(shù)函數(shù)特別:a)當(dāng)

時(shí)b)當(dāng)

時(shí),為中位數(shù)光滑其中={i:xi是離x最近的k個(gè)觀測(cè)值之一}35第三十五頁(yè),共60頁(yè)。局部(júbù)回歸(2)L-光滑(guānghuá)對(duì)于條件(tiáojiàn)L函數(shù)其中用

來(lái)估計(jì)F(y|x)得到L-估計(jì)36第三十六頁(yè),共60頁(yè)。局部(júbù)回歸(3)M-光滑(guānghuá)(局部)最小二乘方法得到的光滑(guānghuá)估計(jì)是通過(guò)考慮損失函數(shù)為二次函數(shù)得到的,現(xiàn)在考慮損失函數(shù)c較大時(shí),為普通的二次損失函數(shù),c較小(≈1倍或2倍觀測(cè)誤差的標(biāo)準(zhǔn)差)可以獲得更多的穩(wěn)健性37第三十七頁(yè),共60頁(yè)。局部(júbù)回歸M-樣條(Cox,1983)核M-光滑(guānghuá)(kernelM-smoother)(Hubber,1979;Silverman,1985)38第三十八頁(yè),共60頁(yè)。局部(júbù)回歸(3)R-光滑(guānghuá)定義(dìngyì)得分函數(shù)其中J是定義在(0,1)上的非減函數(shù),滿足J(1-s)=J(s)用來(lái)估計(jì)F(y|x),則

應(yīng)該粗略地接近0對(duì)于

,則ChengandCheng(1986)提出的R-估計(jì):39第三十九頁(yè),共60頁(yè)。樣條回歸設(shè)m(x)在[a,b]連續(xù)(liánxù)可微,且二階導(dǎo)數(shù)平方可積考查(kǎochá)形式其中(qízhōng)為粗糙懲罰1.光滑樣條40第四十頁(yè),共60頁(yè)。樣條回歸定義(dìngyì)一組樣條基函數(shù):注意,這里(zhèlǐ)樣條基函數(shù)可以是其他樣條基如:B樣條基(吳喜之譯(2008))樣條41第四十一頁(yè),共60頁(yè)。樣條回歸將前面(qiánmian)的優(yōu)化問(wèn)題寫(xiě)成矩陣形式:其中(qízhōng)上述(shàngshù)問(wèn)題的最優(yōu)解其中42第四十二頁(yè),共60頁(yè)。樣條回歸下面(xiàmian)的圖利用的是B樣條基函數(shù),43第四十三頁(yè),共60頁(yè)。樣條回歸下面的圖利用(lìyòng)的是B樣條基函數(shù),44第四十四頁(yè),共60頁(yè)。樣條回歸下面的圖利用(lìyòng)的是B樣條基函數(shù),45第四十五頁(yè),共60頁(yè)。正交光滑(guānghuá)1.正交多項(xiàng)式回歸(huíguī)回歸(huíguī)函數(shù)其中是正交基函數(shù),如Laguerre,Legendre正交多項(xiàng)式正交基滿足系數(shù)系數(shù)估計(jì)如46第四十六頁(yè),共60頁(yè)。正交光滑(guānghuá)回歸函數(shù)(hánshù)估計(jì)寫(xiě)成線性光滑(guānghuá)器:47第四十七頁(yè),共60頁(yè)。Legendre正交多項(xiàng)式正交光滑(guānghuá)48第四十八頁(yè),共60頁(yè)。正交光滑(guānghuá)2.Fourier級(jí)數(shù)(jíshù)光滑在實(shí)際中,將無(wú)窮用有限值r替換,r稱為截?cái)帱c(diǎn),相當(dāng)于光滑(guānghuá)參數(shù)是正交cosine基空間系數(shù)系數(shù)的估計(jì)其中49第四十九頁(yè),共60頁(yè)。正交光滑(guānghuá)m(x)的估計(jì)(gūjì)將代入,得其中(qízhōng)可以看到上面的估計(jì)與G-M估計(jì)有相同的表達(dá)形式,都為卷積形式,只是核函數(shù)不相同50第五十頁(yè),共60頁(yè)。正交光滑(guānghuá)另外一種(yīzhǒnɡ)的Fourier估計(jì)一般(yībān)要求:同樣可以寫(xiě)成卷積形式:其中關(guān)于權(quán)函數(shù)選取可以是滿足前面條件任意的權(quán)函數(shù)51第五

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論