版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第六章時(shí)間序列的平滑6.1 引論上一章我們引進(jìn)非參數(shù)函數(shù)估計(jì)的基本概念,現(xiàn)在將它應(yīng)用到時(shí)間序列別的重要平滑問(wèn)題上對(duì)估計(jì)慢變化時(shí)間趨勢(shì),平滑技術(shù)是有用的圖示工具,它產(chǎn)生了時(shí)域平滑(§6.2).對(duì)將來(lái)事件和與之相聯(lián)系的現(xiàn)在與過(guò)去變量之間的關(guān)系的非參數(shù)統(tǒng)計(jì)推斷導(dǎo)致了§6.3的狀態(tài)域平滑.§4引入的樣條方法是對(duì)§6.3引入的局部多項(xiàng)式方法的有用替代.這此方法能夠容易地推廣到時(shí)間序列的條件方差(波動(dòng)性)的估計(jì),甚至整個(gè)條件分布的估計(jì),參閱§6.5.6.2 時(shí)域平滑6.2.1趨勢(shì)和季節(jié)分量分析時(shí)間序列的第一步是畫(huà)數(shù)據(jù)圖.這種方法使得人們可以從視覺(jué)上檢查一個(gè)
2、時(shí)間序列是否像一個(gè)平穩(wěn)隨機(jī)過(guò)程.如果觀(guān)察到趨勢(shì)或季節(jié)分量,在分析時(shí)間序列之前通常要將它們分離開(kāi)來(lái).假定時(shí)間序列Yt能夠分解成Y=ft+st+X,(6.1)其中ft表示慢變函數(shù),稱(chēng)為“趨勢(shì)分量”,st是周期函數(shù),稱(chēng)為“季節(jié)分量”,Xt是隨機(jī)分量,它Box-Cox變換.這類(lèi)(6.2)被假定是零均值的平穩(wěn)序列.在使用這種分解之前,可以先用方差穩(wěn)定變換或g(x)川1噸),幕變換有如下以參數(shù)為指標(biāo)的形式或具有在=0點(diǎn)處連續(xù)的變換形式g(u)=(u九-1".這類(lèi)變換由Box和Cox(1964)給出.注意,由在幕變換中數(shù)據(jù)必須是非負(fù)的,因此,在使用幕變換之前,可能必須先實(shí)施平移變換.我們的目的是估
3、計(jì)和提取確定性分量ft和色.我們希望殘差分量Xt是平穩(wěn)的,且能夠用線(xiàn)性和非線(xiàn)性技術(shù)做進(jìn)一步的分析.通過(guò)推廣Box和Jenkins(1970)而發(fā)展的一個(gè)替代方法是對(duì)時(shí)間序列Y重復(fù)應(yīng)用差分算子,直到被差分的序列表現(xiàn)為平穩(wěn)為止.這時(shí),被差分的序列可以進(jìn)一步平衡時(shí)間序列技術(shù)來(lái)處理.作為說(shuō)明Box和Jenkins方法的一個(gè)例子,我們先取S&P500指數(shù)的對(duì)數(shù)變換,然后計(jì)算一階差分.圖6.1給出了這個(gè)預(yù)處理序列.所得序列基本上是該指數(shù)中變化的每日價(jià)格的百分比.除了幾個(gè)異常值(即1987年10月19日20.47%的市場(chǎng)崩盤(pán),金融市場(chǎng)稱(chēng)之為“黑色星期一”)夕卜,這個(gè)序列顯示出平穩(wěn)性.這個(gè)變換與金融工
4、程中常用資產(chǎn)定價(jià)的幾何布朗運(yùn)動(dòng)模型的離散化有關(guān).圖6.11972年1月3日至1999年12月31日(上圖)和1999年1月4日至1999年12月31日(下圖)S&P500指數(shù)對(duì)數(shù)變換的差分我們首先把注意力集中在沒(méi)有季節(jié)分量的情形,即Y=ftXt,EXt=0.(6.3)然后,我們?cè)僭?#167;6.3.8中估計(jì)趨勢(shì)和季節(jié)分量歡迎共閱歡迎共閱622滑動(dòng)平均平均是最常用的消除隨機(jī)噪聲的技術(shù).假定趨勢(shì)是慢變化的,使得其能夠在大小為h的局部時(shí)間窗中用常數(shù)來(lái)逼近,即Yt.iftXt卅-吃ih(6.4)這時(shí)ft能夠用該窗周?chē)木植科骄鶃?lái)估計(jì):hft=(2h1廣丫i,(6.5)隨著中心t的改變,局部窗
5、也在移動(dòng).例如,在圖6.2中,t=50處h=20所得的估計(jì)是落在第一個(gè)窗內(nèi)的那些數(shù)據(jù)的平均.窗的中心移動(dòng)到新的點(diǎn)處以構(gòu)成在這些點(diǎn)處的估計(jì)隨著局部窗從左向右滑動(dòng),它的軌跡就是所得的滑動(dòng)平均曲線(xiàn)這是滑動(dòng)平均平滑的最簡(jiǎn)單的例子它常常被用來(lái)驗(yàn)證時(shí)間序列的趨勢(shì)圖6.2描繪的是從1999年1月4日到1999年12月1日S&P500指數(shù)一個(gè)月和兩個(gè)月的滑動(dòng)平均圖6.21999年1月4日至12月31日S&P500指數(shù)和它的21個(gè)交易日(粗線(xiàn))和41個(gè)交易日(虛線(xiàn))的滑動(dòng)平均在邊界處,滑動(dòng)平均估計(jì)的習(xí)慣做法是忽略超出觀(guān)察時(shí)間范圍的那些數(shù)據(jù)例如,f2是用數(shù)據(jù)Y1J|,Y2h的平均所得的簡(jiǎn)單估計(jì)(時(shí)
6、間點(diǎn)2右邊的數(shù)據(jù)比左邊更多).這種不對(duì)稱(chēng)平均可能會(huì)產(chǎn)生邊界偏倚當(dāng)邊界處趨勢(shì)陡峭且?guī)捰执髸r(shí),這種邊界效應(yīng)更為明顯正如圖6.2所示那樣,在右邊界處的滑動(dòng)平均低估了趨勢(shì)該問(wèn)題能夠通過(guò)使用局部線(xiàn)性平滑(參見(jiàn)§6.2.6)或別的邊界改善方法,比如,邊界核方法(Gasse和Muller1979;Muller1993)和數(shù)據(jù)削尖方法(Choi,Hall和Bousson2000)來(lái)減弱.滑動(dòng)平均數(shù)列(6.5)利用了時(shí)間t周?chē)鷥蛇叺臄?shù)據(jù).這樣它還依賴(lài)于時(shí)間t之后的數(shù)據(jù).為便于預(yù)報(bào),單變滑動(dòng)平均數(shù)列*h1ft=h為Y(6.6)也常被用來(lái)驗(yàn)證時(shí)間趨勢(shì).數(shù)列僅用直到時(shí)間t-1的過(guò)去的數(shù)據(jù).6.2.3 核平
7、滑.這允許對(duì)所給時(shí)間點(diǎn)附近的數(shù)據(jù)給予較大滑動(dòng)平均估計(jì)的一個(gè)改善方法是引進(jìn)一個(gè)加權(quán)設(shè)計(jì)的權(quán)數(shù).這也就得到了核回歸估計(jì),定義為壬kL0(6.7)這個(gè)估計(jì)還被稱(chēng)為Nadaraya-Watson估計(jì).參閱Nadaraya(1964)和Watson(1964).當(dāng)我們使用均勻核K(u)=0.5l(|u#1)時(shí),上述核估計(jì)就變成滑動(dòng)平均估計(jì)(6.5).當(dāng)核函數(shù)有有界支撐-1,1時(shí),核回歸估計(jì)就是一個(gè)局部(2h1)數(shù)據(jù)的加權(quán)平均.當(dāng)核K(t)是模在零點(diǎn)的單峰函數(shù)時(shí),t。附近的數(shù)據(jù)點(diǎn)獲得更多的權(quán).一般地,核函數(shù)不要求有一個(gè)有界的支撐,只要它薄尾的(如它是一個(gè)有二階矩的密度函數(shù)).K的非負(fù)性要求還能被減弱.帶寬
8、h也不必是整數(shù).注意,在高斯核定義中的標(biāo)準(zhǔn)化常數(shù)和核的對(duì)稱(chēng)Beta族只是用來(lái)保證函數(shù)K是一個(gè)概率密度函數(shù).在核回歸估計(jì)中它們并不起作用.在計(jì)算時(shí),我們常常標(biāo)準(zhǔn)化各種核函數(shù)使得它們?nèi)鐖D5.2那樣有相同的最大值1.由于這種標(biāo)準(zhǔn)化,(6.7)可以直觀(guān)地理解為盯/(t-tj/h數(shù)據(jù)點(diǎn)的有效平均.當(dāng)核函數(shù)有在(-:,0)中的支撐時(shí)(這樣的核還可看作是單邊核),核回歸估計(jì)所使用的數(shù)據(jù)僅到時(shí)間to-1.這是單邊滑動(dòng)平均(6.6)的推廣.如同在核密度估計(jì)中那樣,在核回歸估計(jì)中帶寬h是一個(gè)重要參數(shù).如同在圖6.2中所顯示的那樣,大的帶寬h產(chǎn)生過(guò)度平滑的估計(jì),遺漏趨勢(shì)和所估計(jì)的峰和谷的度量上的一些可能的細(xì)節(jié).特別
9、地,當(dāng)使用大的帶寬時(shí),估計(jì)可能產(chǎn)生大的偏差.當(dāng)使用小的帶寬時(shí),僅有幾個(gè)局部的數(shù)據(jù)被使用,降低了估計(jì)的方差,卻導(dǎo)致所得估計(jì)是一條波動(dòng)的曲線(xiàn).例如,用帶寬h=0,滑動(dòng)平均估計(jì)(6.5)簡(jiǎn)單地復(fù)制原始數(shù)據(jù).為了得到滿(mǎn)意的結(jié)果需要反復(fù)嘗試和修正.帶寬的數(shù)據(jù)驅(qū)動(dòng)選擇能夠幫助我們確定所要的平滑度.正如在§.2.9所看到的那樣,漸近方差本質(zhì)上依賴(lài)于所研究的過(guò)程的相關(guān)結(jié)構(gòu).因此,針對(duì)獨(dú)立數(shù)據(jù)的由數(shù)據(jù)驅(qū)動(dòng)選擇的帶寬在時(shí)域平滑中效果不佳.實(shí)際上,Altman(1990),Chu和Marron(1991a)以及Hart(1991)指出,對(duì)相依數(shù)據(jù),通常的留一在外(leave-one-ou)交叉核實(shí)方法效果
10、不好.這些作者提出了幾個(gè)修正的方法.對(duì)帶寬選擇的嵌入方法由Ray和Tsay(1997,以及Beran和Feng(2000)提出.以上考慮能夠通過(guò)計(jì)算核回歸估計(jì)的偏倚和方差得到理解.經(jīng)過(guò)直接計(jì)算,在模型(6.3,下,核估計(jì)得偏倚為粘(ft-ft°)K(J)Ef,t0二h_豈K(:t0)h它不依賴(lài)于誤差過(guò)程.它實(shí)際上是一個(gè)逼近誤差.當(dāng)帶寬取得小時(shí),逼近誤差ft-札小,從而偏倚也小.另一方面,當(dāng)h取得大時(shí),大多數(shù)逼近誤差ft-ft0是大的歸因于t和t0間的距離是大的,因此,偏倚可能是大的.這個(gè)線(xiàn)性估計(jì)的方差還能夠被計(jì)算.令x(t)是過(guò)程X(t)的自協(xié)方差函數(shù),則TTVar(ft0)=瓦瓦?
11、x(|ij|)WiWj.(6.8)該方差依賴(lài)于自相關(guān)函數(shù).進(jìn)一步簡(jiǎn)化需要漸近分析.我們將在§.2.9中討論.在那里我們將看到當(dāng)k:時(shí)方差x(k)的漸近行為.但我們現(xiàn)在可以指出,當(dāng)帶寬小時(shí),核平滑的方差增大,這歸因于在局部領(lǐng)域中數(shù)據(jù)點(diǎn)數(shù)太小的緣故6.2.4 核平滑的變種核平滑有許多變種.(6.7)中的分母對(duì)相對(duì)于t求導(dǎo)數(shù)和數(shù)學(xué)上的分析是不方便的.代替用核函數(shù)的高度作為權(quán),我們還可用核函數(shù)下方的面積作為權(quán).由于核函數(shù)下方的總面積是1,分母不需要.這就是隱含在Gasser-Miller估計(jì)中的基本思想.在現(xiàn)在的框架下,令st=(2t1)/2(t=1,T-1),其中s0-和可.Gasse和M
12、uller(1979)提出了以下的估計(jì):Tstft。八.sKh(u-t°)duY.t#J由于總的權(quán)T§oOsKh(u-t°)duKh(u-t°)du=1,t#s丄一所以沒(méi)有分母.Gasser-Miller估計(jì)是對(duì)Priestley和Chao(1972)早期版本的一種修正.Priestley和Chao(1972,給出的估計(jì)定義為ft。八Kh(t-t°)Y.t=1這個(gè)估計(jì)簡(jiǎn)單地去掉了Nadaraya-Watson估計(jì)的分母.通過(guò)積分和變量變換逼近黎曼和,對(duì)適當(dāng)選擇的h,我們得到總的權(quán)TT(T_to)/hKh(t-t。):-jKh(t-t°
13、)du(tK(u)du,如果t°不太接近邊界,且h相對(duì)于T小,并使得(t°-1)/h和仃-t°)/h大,則上述積分近似地等同于"K(u)d1.事實(shí)上,只要K的支撐限制在區(qū)間_(t°-1)/h,(T-t°)/h內(nèi),等式就精確地成立.換句話(huà),對(duì)不在邊界區(qū)域的點(diǎn)t°,總的權(quán)近似于1.以上觀(guān)點(diǎn)依賴(lài)于設(shè)計(jì)點(diǎn)為等間隔的.事實(shí)上,Priestley和Chao估計(jì)僅能用于等間隔情形.它不能用于§6.3所討論的狀態(tài)域平滑.6.2.5 濾波核回歸是用于工程的卷積濾波的一種特殊形式.一般地,一個(gè)長(zhǎng)度為2h1的線(xiàn)性濾波定義為hft八wYt
14、.i.(6.9)當(dāng)K有支撐-1,1時(shí),核回歸對(duì)應(yīng)Wi二K(i/h)£iK(j/h).濾波能夠被設(shè)計(jì)為擁有各種性質(zhì).例如,它能夠被設(shè)計(jì)成可以去掉高頻信號(hào)(低通濾波),或低頻信號(hào)(高通濾波)或超出某個(gè)頻率范圍的信號(hào)(帶通濾波);見(jiàn)§33.核平滑是一種低通濾波.線(xiàn)性濾波變換可以用遞推方式來(lái)定義.例如,單邊滑動(dòng)平均ft可以對(duì)某個(gè)b:1,利用下式來(lái)定義ft=bYt+(1b)f.,t=2,川,T,這等價(jià)于用Y,川,Y的如下的加權(quán)滑動(dòng)平均:ftwbY+b(1b)Yt+lil+b(1b)5(1b)Y.由于權(quán)以指數(shù)速度快速衰減,以上濾波實(shí)際上僅用了時(shí)刻t附近的局部數(shù)據(jù).平滑的有效性依賴(lài)于參數(shù)
15、b.這種方法稱(chēng)為指數(shù)平滑.指數(shù)平滑是用1/h-b的Kh(x)="I(x一0)的一種特殊的核平滑.這是一種單邊平滑.它僅使用直到現(xiàn)大時(shí)刻t的數(shù)據(jù).關(guān)于這方面內(nèi)容的進(jìn)一步討論可參見(jiàn)Gijbels、Pope和Wand(1999).I'6.2.6 局部線(xiàn)性平滑局部常數(shù)逼近(6.4)能夠通過(guò)使用局部線(xiàn)性逼近來(lái)改善.我們把趨勢(shì)fi通過(guò)如下線(xiàn)性函數(shù)局部地近似為i的函數(shù)Y嚴(yán)ft+ft(i-t)+Xi,|it戶(hù)h.這樣,ft就近似地看做上述局部線(xiàn)性模型的截距.可見(jiàn)圖6.3中時(shí)刻t二200處的圖示.窗內(nèi)的數(shù)據(jù)用一個(gè)線(xiàn)性回歸來(lái)擬合.對(duì)局部窗附件的數(shù)據(jù)用最小二乘方法,我們通過(guò)相對(duì)于a和b極小化下式可
16、得到局部截距的估計(jì)T'Y-a-b(i-t)2Kh(i-t).i=1這里引進(jìn)核權(quán)是為了減少距離給定時(shí)間點(diǎn)t較遠(yuǎn)的數(shù)據(jù)的貢獻(xiàn).令at和bt是最小二乘解.這里用下標(biāo)t是為了表示所得的解依賴(lài)于給定的時(shí)間點(diǎn)t.這時(shí),ft用局部截距at來(lái)估計(jì),它有如下的精確表歡迎共閱示TTft=a=遲WtjYj/送wti,Wti,=Kh(it)Sy,住)(it)S,(6.1°)i4y其中Sy,j(t)=f4Kh(t)(t)j.當(dāng)t從1取到T時(shí)就得到整個(gè)趨勢(shì)函數(shù)這樣,局部線(xiàn)性平滑實(shí)際上是一種移動(dòng)線(xiàn)性回歸方法.正如圖6.3所示那樣,在t=80處的估計(jì)由一個(gè)新的局部最小二乘問(wèn)題得到.在每個(gè)數(shù)據(jù)窗中擬合的直線(xiàn)用
17、實(shí)線(xiàn)表示.估計(jì)的局部截距的值位于虛垂直線(xiàn)和局部直線(xiàn)的交叉處.局部斜率是時(shí)間趨勢(shì)導(dǎo)數(shù)的估計(jì)此外,這些局部窗還可以互相重疊(見(jiàn)圖6.2).S-Plus函數(shù)“l(fā)ls.s”已寫(xiě)成程序差可用于計(jì)算圖6.3中的平滑曲線(xiàn).這個(gè)S-Plus函數(shù)能夠從本書(shū)的網(wǎng)址獲得.圖6.3使用Epanechnikov核和帶寬h=20所得的1999年1月4日至1999年12月31日S&P500指數(shù)局部線(xiàn)性擬合.在每個(gè)窗中的虛拋物線(xiàn)表示每個(gè)局部數(shù)據(jù)點(diǎn)所得的權(quán)局部線(xiàn)性平滑能夠很容易地堆廣到局部多項(xiàng)式平滑.局部多項(xiàng)式擬合和它的應(yīng)用的全面介紹可參閱Fan和Gijbels(1996).局部多項(xiàng)式擬合的優(yōu)點(diǎn)總結(jié)在§33中
18、.注意,(6.11)中的權(quán)w滿(mǎn)足T'Wt,i(it)=S,1(t)S,2(t卜S,2(t)S,1(t0.(6.11)i4這就蘊(yùn)涵了如果趨勢(shì)是線(xiàn)性的,ft,則局部線(xiàn)性平滑是無(wú)偏的:TTEft=送wt,i(ai+P)/wt=at+P.換句話(huà),無(wú)論趨勢(shì)函數(shù)多以陡峭,只估計(jì)線(xiàn)性趨勢(shì)時(shí),局部線(xiàn)性平滑就是無(wú)偏的.這對(duì)在內(nèi)部以及邊界處的點(diǎn)t的同樣成立.也就是說(shuō)對(duì)于估計(jì)陡峭趨勢(shì),局部線(xiàn)性估計(jì)將有小的偏倚.另一方面,因?yàn)轭?lèi)似于(6.11)的方程即便是近似地也都不成立,因此,對(duì)估計(jì)邊界區(qū)域附近的點(diǎn)估計(jì)陡峭趨勢(shì),核平滑將有較大的偏差.6.2.7 其他的平滑方法核局部線(xiàn)性平滑有許多別的方法.例如,Gasser
19、和Muller(1979)使用了不同于核和局部線(xiàn)性平滑的權(quán)形式,Jones(1997)介紹了局部線(xiàn)性平滑的各種形式.Fan和Gijbels(1996)給出了各種平滑技術(shù)的概述,包括樣本和正交級(jí)數(shù)方法.核回歸和局部多項(xiàng)式建模是基于在許多格子點(diǎn)上的局部近似.諸如樣條這樣的全局逼近方法還能夠用于對(duì)時(shí)間域的平滑.這些思想將在關(guān)于狀態(tài)域平滑的§.4中介紹.對(duì)諸如時(shí)域平滑這樣的等間隔設(shè)計(jì),正交級(jí)數(shù)方法也非常容易使用.其基本思想是先用正交矩陣對(duì)數(shù)據(jù)進(jìn)行變換,然后,在高頻點(diǎn)向零點(diǎn)有選擇地調(diào)整系數(shù)(或向零點(diǎn)收縮它們).平滑估計(jì)能夠通過(guò)tapered系數(shù)的逆變換來(lái)獲得.常用的正交變換包括傅里葉變換和小波
20、變換.它們的統(tǒng)計(jì)應(yīng)用可參閱Ogden(1997)、Efromovich(1999)和Vidakovic(1999)等近期出版的專(zhuān)著.6.2.8 季節(jié)分量修正有許多實(shí)用的修正季節(jié)分量的方法.在此我們概要地介紹一個(gè)方法以說(shuō)明其基本大意.假定(6.1)中的季節(jié)分量的周期是p,即psjp=Sk,72=0.(6.12)k#后一個(gè)約束是一個(gè)可識(shí)別條件.若此約束不成立時(shí),只要加一個(gè)常數(shù)到趨勢(shì)分量ft,并在季節(jié)分量歡迎共閱修正中減去相同的常數(shù).歸因于約束(6.12),當(dāng)p是一個(gè)奇數(shù)時(shí),趨勢(shì)能夠方便地用具有h=(p一1)/2的滑動(dòng)平均(6.5)來(lái)估計(jì).在(6.5)中季節(jié)分量平均掉,因而對(duì)趨勢(shì)估計(jì)沒(méi)有貢獻(xiàn).當(dāng)周期
21、p是偶數(shù)時(shí),用如下稍加修改的形式估計(jì)趨勢(shì)ft-(0.5Yt_d'/IJ|l'dd'O.5d)/p,d=p/2.季節(jié)分量能夠按如下步驟來(lái)估計(jì).就一個(gè)例子來(lái)說(shuō),我們假定要處理的月度數(shù)據(jù),且周期P=12.在3月的季節(jié)分量的值能用在3月所得一切觀(guān)測(cè)值的移去趨勢(shì)分量后的平均來(lái)很好地近似.這就得到估計(jì)*(T_dJs)/pSk二、(%jp-fkjp)/(T-d-k)/p-(d-k)/p1,j£d_k)/p1其中a表示a的整數(shù)部分,d二p/2.在上述求和中對(duì)上下限所作的限制是為了保證數(shù)據(jù)不要太接近邊界使得在趨勢(shì)估計(jì)中邊界影響達(dá)到最小.這種初步估計(jì)可能不能精確地滿(mǎn)足約束(6.1
22、2).但這能夠容易地通過(guò)用下式估計(jì)季節(jié)分量Sk來(lái)作修正Sk=Skd八S,k=11,p.iA以上方法還被用于沒(méi)有趨勢(shì)分量ft的情形.在這種情形,不需要移去趨勢(shì),即令ft二0.6.2.9 理論概況*問(wèn)題(6.3)的理論表述應(yīng)該得到注意.一個(gè)簡(jiǎn)單的方式是把所得的時(shí)間序列Yt看作是來(lái)自如下連續(xù)過(guò)程的離散化樣本路徑這種表述常常被用在金融時(shí)間序列建模中.時(shí)間單位通常取年,每星期數(shù)據(jù)被看作是以:=1/52的速度抽自連續(xù)過(guò)程.對(duì)金融中的期權(quán)定價(jià)和風(fēng)險(xiǎn)管理,這種表述是非常有效的.然而,在時(shí)域平滑方面,這種述有一些缺點(diǎn).首先,為了能夠相容地估計(jì)f(t),我們需要在給定的時(shí)間t。的周?chē)么笮閔>0的窗局部化
23、數(shù)據(jù).但是,只要過(guò)程X(t)是連續(xù)的,所有的局部數(shù)據(jù)Y(t):rto_h都是高度相關(guān)的,且當(dāng)h>0時(shí),相關(guān)系數(shù)趨于1.這就蘊(yùn)涵了局部數(shù)據(jù)變化不大,因而也就不需要局部平滑.正如在圖6.2中所看到的那樣,局部數(shù)據(jù)變化很大,局部平滑就能改善趨勢(shì)估計(jì).這樣,以上表述從理論的觀(guān)點(diǎn)來(lái)看似乎是病態(tài)的.其次,在以上的表述下,趨勢(shì)f(t)和隨機(jī)誤差X(t)有相似的光滑度(兩者都是連續(xù)的).因此,在Y(t)中沒(méi)有希望將隨機(jī)部分與趨勢(shì)部分分離開(kāi)來(lái).I'一個(gè)代替的表述是推廣等間隔設(shè)計(jì)的非線(xiàn)性回歸模型到時(shí)間序列框架.假定所得到的時(shí)間序列是來(lái)自模型Y=g(t/T)+Xt,t=1,T,(6.13)其中g(shù)是平滑
24、時(shí)間趨勢(shì)函數(shù),Xt是隨機(jī)過(guò)程,EXt=0.在這種表述下,我們現(xiàn)在能夠利用平滑技術(shù)從隨機(jī)噪聲中分離出平滑趨勢(shì).一個(gè)小的缺點(diǎn)是平滑趨勢(shì)f(t)二g(t/T)依賴(lài)于觀(guān)測(cè)數(shù)量T.這個(gè)問(wèn)題早就出現(xiàn)在具有固定設(shè)計(jì)的非參數(shù)回歸文獻(xiàn)中.實(shí)際上它不是一個(gè)嚴(yán)重問(wèn)題.漸近理論畢竟只是一個(gè)工具,為我們理解理論性質(zhì)提供簡(jiǎn)化的結(jié)構(gòu).用g(t/T)建模趨勢(shì)是捕捉趨勢(shì)比噪聲變化更慢這一特征的簡(jiǎn)單的技術(shù)手段.在以上兩種表述之間選擇哪一個(gè)依賴(lài)于所研究的問(wèn)題.在縱向數(shù)據(jù)和泛函數(shù)據(jù)分析中,Hart和Wehrly(1986)以及Silverman(1996)基本上是用前一種表述:人們通過(guò)模型Y(t)二f(t)X(t)觀(guān)測(cè)到大量獨(dú)立序列
25、.這種表述對(duì)他們的問(wèn)題是適合的.對(duì)時(shí)域平滑,模型(6.13)常被假定.例如見(jiàn)Hall和Hart(1990),Robinson(1997),以及Johnstone和Silverman(1997).這就保證了能捕捉到時(shí)間趨勢(shì)比隨機(jī)噪聲更光滑這一特征.進(jìn)一步,它也保證了能相容地估計(jì)時(shí)間趨勢(shì).由公式(6.13)能夠獲得核和局部線(xiàn)性平滑的漸近性質(zhì).估計(jì)g的偏倚與具有均勻設(shè)計(jì)的獨(dú)立樣本情形是相同的.核和局部線(xiàn)性平滑的方差經(jīng)繁瑣的計(jì)算也可得到.它們依賴(lài)于噪聲過(guò)程XJ的協(xié)方差結(jié)構(gòu).一般地,我們假定Xt的自方差函數(shù)滿(mǎn)足x(k)二Cov(Xt,Xtk)Cxk=,k::,(6.14)其中:0,Cx是常數(shù).在2.5.
26、2中定義的分式ARIMA過(guò)程就滿(mǎn)足(6.14).我們將估計(jì)(6.10)重寫(xiě)為g(t/T).對(duì)任何u=t/T(0,1),使用EY=g(i/T)和(6.11),我們得到偏倚MWru,ig(i/Tg(ug(u)(i/u)Eg(u)-g(u)二t(6.15)-iWru注意,這個(gè)偏倚不依賴(lài)于誤差過(guò)程X(t).它完全是局部線(xiàn)性擬合的近似誤差.為理論敘述的簡(jiǎn)單,我們假定K有有界支撐.這個(gè)假定可以冗長(zhǎng)的敘述為代價(jià)而得到減弱.特別地,可以使用像高斯核這樣的輕尾核.由j表示vjK(v)dv.*-jod在下面的定理中我們總結(jié)了漸近偏倚和方差,定理的證明放在§6.6.1.注意,由于時(shí)間單位的尺度,h/T和用
27、在一般的非參數(shù)回歸中的帶寬是相同的.I定理6.1假定K有有界支撐,滿(mǎn)足(K)d和S(K)=0,且當(dāng)h/T>0時(shí),帶寬h>:.(a) 如果g()存在,且在點(diǎn)u處連續(xù),則Eg(u)-g(u)J2(K)g(x)(x/T)3o(h/T)2.2(b) 如果自方差函數(shù)滿(mǎn)足(6.14),我們有©xJjK(x)K(y)|xyldxdyh勺0vot<1,Varg(u)才2Cx|K|2h'log(h),«=1,(6.16)復(fù)?x(j)|K|;h二«>1.定理6.1表明,過(guò)程Xt的協(xié)方差結(jié)構(gòu)對(duì)漸近方差有強(qiáng)烈的影響.反過(guò)來(lái)這也影響到漸近最優(yōu)帶寬,并解釋了為
28、什么獨(dú)立數(shù)據(jù)的數(shù)據(jù)驅(qū)動(dòng)帶寬選擇不能直接應(yīng)用到相依數(shù)據(jù)對(duì)核估計(jì)的類(lèi)似于定理6.1的結(jié)果由Hall和Hart(1990)證明.最近,這些結(jié)果被Beran和Feng(2000)用不同于§61給出的方法推廣到局部多項(xiàng)式擬合.他們還證明了對(duì)anti-persistent過(guò)程,漸近方差具有階h"d.局部線(xiàn)性估計(jì)的漸近正態(tài)性也可以被建立.如果誤差過(guò)程Xt是高斯的,則它的加權(quán)平均估計(jì)(6.10)還是高斯的.這樣,局部線(xiàn)性估計(jì)的漸近正態(tài)性直接由定理6.1得到.此外,在正態(tài)假定下,Cs?rg?和Mielniczuk(1995)建立了類(lèi)似于定理5.4的最大偏差的漸近分布.然而,對(duì)Xt的正態(tài)假定并
29、不是本質(zhì)的.正如在Robinson(1997)中所證明的那樣,這個(gè)條件可以去掉.我們?cè)诖烁乓財(cái)⑹鲇糜诒菊碌募夹g(shù).令訃是相對(duì)于它自身二域的鞅差序列,即假定Xt是一雙邊無(wú)窮階滑動(dòng)平均過(guò)程:歡迎共閱歡迎共閱且;2是一致可積的,并滿(mǎn)足分式ARIMA過(guò)程滿(mǎn)足這三個(gè)假定.考慮加權(quán)和T°°T)缶='WtXt='''WT,tat,y丿它是鞅差序列的和.由鞅的性質(zhì),2QOfQ0=Var(SJ=瓦lZWp®,jJ假定這個(gè)方差存在.下面的定理由Robinson(1997)給出.類(lèi)似的結(jié)果還可在Ibragimov和Linnik(1971)中發(fā)現(xiàn).定理6.
30、2在上面所述的條件下,倘若=o(Var(Sr)/2),則有/2DVar(St)StN(0,1).對(duì)于局部線(xiàn)性估計(jì)(6.10),易見(jiàn)這時(shí)漸近正態(tài)性變?yōu)轵?yàn)證定理6.2中所敘述的條件.我們略去細(xì)節(jié)6.3 狀態(tài)域平滑6.3.1 非參數(shù)自回歸狀態(tài)域平滑與非參數(shù)預(yù)報(bào)密切相關(guān).考慮一個(gè)平穩(wěn)時(shí)間序列Xt.為了簡(jiǎn)單起見(jiàn),我們考慮僅基于變量Xti的預(yù)報(bào).基于Xt二x的Xt的最優(yōu)預(yù)報(bào)是給定Xt二x時(shí),Xt的條件期望m(x)=E(Xt|Xx),它在所有的預(yù)報(bào)函數(shù)g中極小化MSEEXt-g(Xt)2.這個(gè)函數(shù)還稱(chēng)為階為1的自回歸函數(shù).當(dāng)Xt是零均值平穩(wěn)高斯過(guò)程時(shí),這個(gè)條件均值是線(xiàn)性函數(shù)m(x)二ax,條件方差是常數(shù).這
31、就得到一個(gè)AR(1)模型Xt仔“勺.一般地,函數(shù)m(x)不必是線(xiàn)性的,條件方差也不必是常數(shù).然而,總是能夠以如下方式表示數(shù)據(jù)Xt=m(XP(X£t,(6.17)其中二2(x)二Var(Xt|Xt=x).這里,.的條件均值為零,條件方差為1,即卩E(,|Xt4)=0,Var(;t|Xt:)=1.非參數(shù)平滑技術(shù)還能夠用于包括自回歸函數(shù)的估計(jì)以外的領(lǐng)域.考慮一個(gè)雙變量序列(Xt,Yt):t=1,T,它可以被看作是來(lái)自平穩(wěn)過(guò)程的一個(gè)實(shí)現(xiàn).我們的興趣是估計(jì)回歸函數(shù)m(x)二E(YjXt=x).為便于對(duì)問(wèn)題的理解,我們記Yt=m(Xt)+Xt)習(xí),(6.18)其中二2(x)二Var(Y|Xt=x
32、),丫滿(mǎn)足E(;t|Xt)=0,Var(;t|Xt)=1.顯然,這個(gè)結(jié)構(gòu)包括通過(guò)取Y=Xt斗而把估計(jì)的自回歸函數(shù)作為一個(gè)特定的例子.下面是三個(gè)有用的例子例6.1考慮平穩(wěn)時(shí)間序列Zt.對(duì)給定的k,我們?nèi)t=(Zt)k,Xt二Ztj.則目標(biāo)函數(shù)變?yōu)閙k(x)=E(Z;|Zt廠(chǎng)x).條件方差可以通過(guò)用m2(x)mi(x)2來(lái)估計(jì).特別地,當(dāng)m(x)小得如例1.1中所給的利率差分?jǐn)?shù)據(jù),m2(x)基本上就如同條件方差.換句話(huà),對(duì)下面圖6.4中所給的數(shù)據(jù),均值回歸函數(shù)是波動(dòng)函數(shù)的平方二(x)Var(Xt|Xt=x).這就是由Stanton(1997)以及Fan和Yao(1998)所給出的波動(dòng)估計(jì)的基礎(chǔ).
33、圖6.4對(duì)12個(gè)月國(guó)庫(kù)券回報(bào)用局部線(xiàn)性擬合估計(jì)條件方差.(a)具有Epanechnikov核和帶寬索h=3.06的局部線(xiàn)性擬合的圖示;(b)估計(jì)條件標(biāo)準(zhǔn)差用局部線(xiàn)性擬合(實(shí)曲線(xiàn)),F(xiàn)an和Yao(1998)的基于殘差的方法(短虛曲線(xiàn))和具有:.=0.143和7=1.324的參數(shù)模型;(x)=,x:(長(zhǎng)虛曲線(xiàn))例6.2再考慮平穩(wěn)時(shí)間序列Zt.我們?nèi)t二I(a:乙乞b),它是區(qū)間(a,b上的示性函數(shù),XtZt.則目標(biāo)函數(shù)變?yōu)閙(x)二P(a:Zt_b|Zt=x).特別地,如果a=,我們就得到條件分布估計(jì).進(jìn)一步,如果a=y-和b=y,則當(dāng)取值小時(shí),m(x)/(2、J基本上就如同給定Ztx時(shí)乙的條
34、件密度.這個(gè)條件密度函數(shù)對(duì)了解給定Zt二x時(shí)乙分布的全貌是非常有用的.特別地,自回歸函數(shù)是這個(gè)分布的中心,波動(dòng)函數(shù)是這個(gè)分布的擴(kuò)展.這個(gè)思想形成了Fan、Yao和Tong(1996)估計(jì)條件密度(§6.5)和與它們相關(guān)的泛函(§0.3),以及Hall,Wolff和Yao(1999)估計(jì)條件分布函數(shù)(§0.3),Polonik和Yao(2000)估計(jì)最小量預(yù)報(bào)區(qū)域(§0.4)等所用方法的起源.例6.3對(duì)給定的時(shí)間序列Zt,多步預(yù)報(bào)能夠通過(guò)令Y=Zt七和Xt=Zt來(lái)完成,其中d是預(yù)報(bào)步長(zhǎng)數(shù).對(duì)這種情形,我們用非參數(shù)方法,基于變量乙來(lái)估計(jì)最優(yōu)d步預(yù)報(bào)m(x)=
35、E(Zt-d|乙=x),下面的圖6.6畫(huà)出了山貓數(shù)據(jù)的一步和兩步預(yù)報(bào).把這個(gè)方法和例6.1和例6.2中的技術(shù)結(jié)合起來(lái),我們能夠估計(jì)多步預(yù)報(bào)的條件方差和條件密度.I,1 -|./-6.3.2局部多項(xiàng)式擬合I'局部多項(xiàng)式擬合是一個(gè)用途廣泛的非參數(shù)技術(shù).它擁有多種好的統(tǒng)計(jì)性質(zhì).關(guān)于這些內(nèi)容可參閱Fan和Gijbels(1996).令m(v)(x)是定義在(6.18)中的回歸函數(shù)v階導(dǎo)數(shù).局部多項(xiàng)式技術(shù)可非常方便地用來(lái)估計(jì)m(v)(x),包括回歸函數(shù)本身m(x)二m(0)(x).由于回歸函數(shù)的形式?jīng)]有被指定,因而距離X。遠(yuǎn)的數(shù)據(jù)點(diǎn)對(duì)m(x0)提供了很少的信息.因此,我們只能使用X。附近的局部數(shù)
36、據(jù)點(diǎn).假定m(x)在X。點(diǎn)處有(P1)階導(dǎo)數(shù).由泰勒展開(kāi),對(duì)局部鄰域的X,我們有IIIm一(x-x°)PO(x-x°)P1.(6.19)P!在統(tǒng)計(jì)建模方面,對(duì)X0周?chē)木植奎c(diǎn),我們建模m(x)為P_m(x)八:j(xx).(6.20)j=0參數(shù)j依賴(lài)于X。,故稱(chēng)之為局部參數(shù)顯然,局部參數(shù)、二m(v)(X0)/v!.用局部數(shù)據(jù)擬合局部模型(6.20)可極小化Tp'YXt-x°)j2Kh(Xt-X。),(6.21)yj=0其中h是控制局部鄰域大小的帶寬.作為一個(gè)說(shuō)明的例子,我們?nèi)t=(Xt-Xy)2,其中Xt是12個(gè)月國(guó)庫(kù)券回報(bào).帶寬為h=3.06,它是由預(yù)
37、漸近代入法(見(jiàn)§635)用C-程序“l(fā)ls.c”計(jì)算得到的.在xo=12點(diǎn)處(百分?jǐn)?shù)),線(xiàn)段(p=1)用來(lái)擬合在陰影區(qū)域x0_h中的局部數(shù)據(jù),在此對(duì)每個(gè)數(shù)據(jù),權(quán)用虛曲線(xiàn)(對(duì)應(yīng)于Epanechnikov核)表示在X0點(diǎn)處局部截距p是擬合的線(xiàn)段和垂直線(xiàn)段間的交點(diǎn).這就構(gòu)成了在點(diǎn)x°=12處的回歸函數(shù)(v=0)的估計(jì).沿著水平軸滑動(dòng)這個(gè)窗,我們就獲得在區(qū)間3,14上要估計(jì)的曲線(xiàn).條件標(biāo)準(zhǔn)差被展示在圖6.4(b)中.基于殘差來(lái)估計(jì)條件方差的方法由Fan和Yao(1998)提出,其計(jì)算通過(guò)C程序“autovar.C'來(lái)實(shí)現(xiàn)(還可見(jiàn)§m(x)=:x:常被用來(lái)對(duì)生產(chǎn)率動(dòng)
38、態(tài)的波動(dòng)進(jìn)行建模,它用長(zhǎng)的虛曲線(xiàn)表示.正如人們所看到的那樣,在參數(shù)和非參數(shù)方法之間還存在本質(zhì)差異,這對(duì)參數(shù)擬合是否合適提出了疑問(wèn)選擇帶寬預(yù)漸近代入方法由Fan和Gijbels(1995)提出,見(jiàn)§用j=0,HI,p,表示最小二乘問(wèn)題(6.21)的解.m(X。)的局部多項(xiàng)式估計(jì)是(V)mv(x0)=v!:v(v=0,1川1,p).這里,我們不用記號(hào)m(x°)是為了避免由估計(jì)回歸m(x0)的v階導(dǎo)函數(shù)所帶來(lái)的混淆.事實(shí)上,導(dǎo)數(shù)m(x)是用局部斜率來(lái)估計(jì),而不是用估計(jì)的回歸函數(shù)的導(dǎo)數(shù)來(lái)估當(dāng)p=0,局部多項(xiàng)式擬合退化為該回歸估計(jì)m(x)二入YgXt-x)T©(Xt-x)它
39、還被稱(chēng)為Nadaraya-Watson估計(jì).因此,從局部逼近的觀(guān)點(diǎn)來(lái)看,核回歸估計(jì)是基于局部常數(shù)逼近的.見(jiàn)(6.19).使用矩陣記號(hào)來(lái)表示局部多項(xiàng)式回歸更為方便.用X表示相應(yīng)于(6.21)的設(shè)計(jì)矩陣:(X1-X0)III(X1-x)p'X=+1-FhFjj丨J(XtX°)III(Xt-X°)卩且令'Y、r0y=+417J®丿則加權(quán)最小二乘問(wèn)題(6.21)能夠?qū)憺閙in(y-XJTW(y-XJ,(6.22)其中=(S,lHp)T,W是對(duì)角矩陣,它的第i個(gè)元素為Kh(Xi-x°).解向量為匕-(XTWX)*XTWy.(6.23)為了實(shí)現(xiàn)局部多
40、項(xiàng)式估計(jì),我們需要選擇階p,帶寬h和核K.當(dāng)然,這些參數(shù)相互關(guān)聯(lián).當(dāng)h:時(shí),局部多項(xiàng)式擬合就變成全局多項(xiàng)式擬合,階p決定模型的復(fù)雜性.與參數(shù)模型不同,局部多項(xiàng)式擬合的復(fù)雜性主要是由帶寬來(lái)控制.因此,p通常是較小的,故而選擇p的問(wèn)題就變得不重要了.如果目的是估計(jì)m(v),則當(dāng)p-v是奇數(shù),局部多項(xiàng)式擬合自動(dòng)修正邊界偏倚.進(jìn)一步,當(dāng)P-V是奇數(shù),與p-1階擬合(則P-V1是偶數(shù))相比較,p階擬合包含了一個(gè)多余參數(shù),但沒(méi)有增加估計(jì)m(v)的方差.不過(guò)這個(gè)多余參數(shù)創(chuàng)造了一個(gè)降低偏倚的機(jī)會(huì),特別是在邊界區(qū)域.見(jiàn)Fan(1992)、Fan和Gijbels(1992)、Hastie和Loader(1993)
41、、Ruppert和Wand(1994).因?yàn)檫@些理由,奇數(shù)階擬合(選擇p使和p-v是奇數(shù))比偶數(shù)階擬合(選擇p-1使得p-v是偶數(shù))更好.基于理論和實(shí)際的考慮,在Fan和Gijbels(1996)中推薦階p二v1.如果主要目的是估計(jì)回歸函數(shù),我們使用局部線(xiàn)性擬合,如果目標(biāo)函數(shù)是一階導(dǎo)數(shù),我們就使用局部平方擬合,等等.另一方面,帶寬h的選擇在多項(xiàng)式擬合中起著重要作用.太大的帶寬引起過(guò)度平滑,產(chǎn)生過(guò)大的建模偏倚,而太小的帶寬會(huì)導(dǎo)致不足平滑,獲得受干擾的估計(jì).帶寬可由使用者通過(guò)目測(cè)檢查所得到的估計(jì)曲線(xiàn)來(lái)主觀(guān)選擇,或由數(shù)據(jù)通過(guò)極小化的估計(jì)理論風(fēng)險(xiǎn)來(lái)自動(dòng)選擇(見(jiàn)6.3.5).由于估計(jì)基于局部回歸(6.2
42、1),我們有理由要求一個(gè)非負(fù)權(quán)函數(shù)K.Fan,Gasser,Gijbels,Brockman和Engel(1995)已證明,對(duì)所有p的選擇和v,最優(yōu)權(quán)函數(shù)是K(z)=2(1_z2)+,它被稱(chēng)為Epanechnikov核.這樣,它是4一個(gè)萬(wàn)能的加權(quán)方式,并對(duì)比較其他核提供了一個(gè)有用的基準(zhǔn).正如在5.5所證明的那樣,對(duì)實(shí)際中使用的p和v,其他核具有幾乎相同的有效性.因此,核函數(shù)的選擇并不是至關(guān)重要的.將局部多項(xiàng)式估計(jì)與其他估計(jì)進(jìn)行比較,包括Nadaraya-Watson估計(jì)、Gasser和Muller估計(jì)和Priestley和Chao估計(jì).實(shí)際上,由Fan(1993a)可知,局部線(xiàn)性擬合在所有線(xiàn)性
43、估計(jì)中是漸近最小最大的,而在所有可能的估計(jì)中幾乎是最小最大的.這種最小最大性質(zhì)由Fan,Gasse,Gijbels,Brockmann和Engel(1995)推廣到更一般的局部多項(xiàng)式擬合.6.3.3 局部多項(xiàng)式估計(jì)的性質(zhì)k整個(gè)這一節(jié)中,我們假定(X1,YJ川,(Xt,Y7)是平穩(wěn)序列.令Fi是有隨機(jī)變量(Xj,Yj),仁j<k生成的事件的二域.令(k)和邇)是它們相應(yīng)的和匸混合系數(shù).用ev1表示單位向量,其(v1)位置的元素為1.令T和=送心伙-x°)(Xt-x°)i(6.24)和St=XtWX是(p1)(p1)矩陣,它位于(i,j)的元素是Si2.首先,我們?nèi)菀鬃C明
44、估計(jì)能夠?qū)憺镻eTZW:Y,(6.25)yIh丿其中有效核W;是核K和一個(gè)多項(xiàng)式函數(shù)的乘積,其定義如下W:(t)=eS1,th,川,(th)pTK(t)/h.(6.26)以上表達(dá)式顯示除了“核”W:依賴(lài)于設(shè)計(jì)點(diǎn)X川,Xt和位置X。外,估計(jì)看起來(lái)就像傳統(tǒng)的核估計(jì).這就解釋了為什么局部多項(xiàng)式擬合能夠自動(dòng)地適應(yīng)各種設(shè)計(jì)框架和邊界估計(jì).圖6.5給出了局部常數(shù)擬合(p0)的有效核函數(shù)和對(duì)Epanechnikov核K在點(diǎn)x。=0.05和x。=0.5處的局部線(xiàn)性擬合(p=1).它們滿(mǎn)足如下矩性質(zhì).圖6.5對(duì)局部常數(shù)擬合(p=0)和具有核K為Epanechnikov核的局部線(xiàn)性擬合(p=1)在內(nèi)點(diǎn)x0=0.5
45、處(權(quán)由表示)和邊界點(diǎn)X0=0.05(權(quán)由表示)分配給局部數(shù)據(jù)點(diǎn)的有效權(quán).水平實(shí)線(xiàn)和虛線(xiàn)分別是真實(shí)函數(shù)和估計(jì)的函數(shù)在點(diǎn)X0=0.05和x0=0.5的高度.它們的差是在這兩個(gè)點(diǎn)處的偏倚.(a)Nadaraya-Watson估計(jì);(b)局部線(xiàn)性擬合.為清楚起見(jiàn),數(shù)據(jù)(?)不包含噪聲命題6.1有效權(quán)W;滿(mǎn)足如下有限矩性質(zhì):0<y,q<p,其中如果V=q,則v,q=0,否則為1.證明由ST的定義=q1STsQqi=y.q從而得到所要的結(jié)論作為命題6.1的結(jié)果,當(dāng)真實(shí)的回歸函數(shù)m(x)是階為p的多項(xiàng)式時(shí),的局部多項(xiàng)式估計(jì)的無(wú)偏倚的為了獲得更多有關(guān)有效核的知識(shí),我們提供它的漸近形式我們首先引進(jìn)
46、一些記號(hào)令S是(p1)(p1)矩陣,它的第(i,j)元素為叫心,其中j=:ujK(u)du.定義等價(jià)核如下p*t1pTvll仏二巳禹(1,t,|(,tp)K(t)YSt)K(t),(6.27)0其中Svl是SA的(V+1,l+1)元素.命題6.2在定理5.5的條件下,如果X的邊緣密度f(wàn)在點(diǎn)xo處有連續(xù)的導(dǎo)數(shù),貝U在對(duì)Xo引a,b和t一致地有T1*321Kv(t)1Op(aJ,Thf(X。)其中aT-h(logT/Th)1/2.對(duì)高階核而言,等價(jià)核滿(mǎn)足如下矩條件:'q*.uKv(u)du二'v,q0豈V,q空p.-O證明注意到ST,j/(Thj)基本上和具有誘導(dǎo)核K*(x)=xj
47、K(x)的核密度估計(jì)是相同的.因此,由定理5.5,對(duì)x0a,b一致地有(Thj)ST,j=f(xo)氣+Op(qJ,(6.28)把(6.28)代入St的每一個(gè)元素就立即得到111THStH=f(Xo)S1+Opt),或等價(jià)地有St=Tf(Xo)HSH1+Op(aT),其中H二diag(1,hl(,hp),因此,把這個(gè)式子代入WTv的定義,我們得到1W:(t)=”卄一嘉S(1,t|,tp)TK(t)1+op(aj.Thf(xo)這就證明了第一個(gè)結(jié)果.第二個(gè)結(jié)果用與命題6.1相同的證明可得.由(6.25)和命題6.2,有vK;Yt1Op(aJ.(6.29)Thf(xo)td.h因此,使用局部多項(xiàng)式
48、估計(jì)就像使用具有已知設(shè)計(jì)密度f(wàn)的核回歸估計(jì)一樣.這就解釋了為什么局部多項(xiàng)式擬合適應(yīng)于多種設(shè)計(jì)密度.反過(guò)來(lái),核回歸估計(jì)在f的導(dǎo)數(shù)偏大的區(qū)域有大的偏倚,即它不能適應(yīng)高偏斜設(shè)計(jì).為了搞清楚這一點(diǎn),想象真實(shí)的回歸函數(shù)在這樣的區(qū)域內(nèi)有大的斜率.對(duì)給定的xo,由于設(shè)計(jì)密度的導(dǎo)數(shù)是大的,故而在xo的一邊比另一邊有更多的點(diǎn).當(dāng)使用局部平均時(shí),由于局部數(shù)據(jù)呈現(xiàn)對(duì)稱(chēng)狀態(tài),故Nadaraya-Watson古計(jì)向著有更多局部數(shù)據(jù)點(diǎn)的那一邊產(chǎn)生偏倚.由于局部數(shù)據(jù)多是非對(duì)稱(chēng)的,故而這個(gè)問(wèn)題在邊界區(qū)域更顯著,見(jiàn)圖6.5.另一方面,如果需要,局部多項(xiàng)式擬合造出非對(duì)稱(chēng)權(quán)以補(bǔ)償這類(lèi)設(shè)計(jì)偏倚(圖6.5(b).因此,它適合于各種設(shè)計(jì)
49、密度和邊界區(qū)域.我們現(xiàn)在給出局部多項(xiàng)式估計(jì)的漸近偏倚和方差表達(dá)式.對(duì)獨(dú)立數(shù)據(jù),我們通過(guò)在設(shè)計(jì)矩陣X上加條件來(lái)獲得偏倚和方差表達(dá)式.然而,對(duì)諸如在例6.1-6.3中所給出的時(shí)間序列,加在X上的條件將意味著幾乎是加在整個(gè)序列上.因此,我們用漸近正態(tài)性而不是用條件期望來(lái)導(dǎo)出漸近偏倚和方差.正如在§.3所解釋的那樣,狀態(tài)局部化減弱了局部數(shù)據(jù)的相依結(jié)構(gòu).因此,人們期望對(duì)獨(dú)立數(shù)據(jù)的結(jié)果對(duì)具有某種混合條件的平穩(wěn)序列依然成立.混合條件和窗的大小是有關(guān)系的.這點(diǎn)的嚴(yán)格敘述由在S.6.2中的條件1(iv)給出.下面屬于Masry和Fan(1997)的定理的證明將在§定理6.3在§6.
50、6.2的條件1下,如果h=O(T1/(2p®),且m(p1()在點(diǎn)x處是連續(xù)的,則當(dāng)T>:時(shí),D>N0,;2(x)SSS/f(x),其中5(x)=(m(x),|山m(p)(x)/p!)T,S*是(p1)(p1)矩陣,它的第(i,j)vij-2二tij,K2(t)dt,cp是(p1)維向量,其第i個(gè)元素為Jp2_i.-cd注意,由等價(jià)核的定義易見(jiàn)和因此,定理6.1的直接推論是導(dǎo)數(shù)估計(jì)mv(x)是漸近正態(tài)的:dI(v!)%2(x)JK;2(t)dt.亠Ng卜元素是(6.30)當(dāng)v=0時(shí),(6.30)給出m(x)本身的漸近正態(tài)性.局部多項(xiàng)式估計(jì)的漸近偏倚和漸近方差被自然地定義為
51、AB(x)=tp*K;(t)dtv!m(x)hp4,(p+1)!22*2(v!)(x)(仏(t)dtAV(x)=存十一.Thf(x)(pi)(6.31)(6.32)f(x)j對(duì)給定的權(quán)函數(shù)w,理想的帶寬h應(yīng)極小化這就得到漸近最優(yōu)帶寬!Jb2(x)w(x)/f(x)dxhopt=Cv,p(K)LJm"pM(x)2w(x)dx1/(2p-3)|T-J/(2p3)*?(6.33)1/(2p3)其中Cv,p(K)二(p+1)!2(2v+1)(K:2(t)dt2(p+1-v)JtpS;2(t)dt2_然而,由于這種理想帶寬依賴(lài)于未知函數(shù),故它不是直接可用的.我們將在§6.3.5中提出
52、方法來(lái)估計(jì)它.正如在上一節(jié)所敘述的那樣,當(dāng)p-v是奇數(shù)時(shí),局部多項(xiàng)式擬合自動(dòng)地適應(yīng)邊界區(qū)域.為了說(shuō)明這一點(diǎn),我們沿用Gasser和Muller(1979)的公式表示.假定Xt有有界支撐,記為0,1.則當(dāng)核K有有界支撐0,1時(shí),x=ch(0:1)是右邊界點(diǎn).我們現(xiàn)在考慮mv(x)在邊界點(diǎn)x=ch處的行為.為此,令4j,c=JjK(u)du,vj,c=fjjK2(u)du.在定義S,S*和cp中,我們用和,c,vj,c分別代替Jj和vj,這就得到了Sc,Sc和cp,c.類(lèi)似地,在邊歡迎共閱界定義等價(jià)核為則我們有下列結(jié)果,它的證明非常類(lèi)似于定理6.3的證明.定理6.4假定§6.6.2中條件
53、1成立,且f(0)0.如果h=O(T1/(2p"),m(p'1)和二2f在點(diǎn)0處是右連續(xù)的,則當(dāng)T>:,D21*1>N0,匚(0)ScSeSc1/f(0),其中'o(O)=(m(O),|H,m(p)(O)/p!)T.作為定理6.4的推論,在邊界點(diǎn)x=ch處,我們有如下漸近偏倚和方差:和(v!)2<t2(o+)jK;c(t)dtAV(x)二-CTh2v41f(0+)Ruppert將它們與(6.31)和(6.32)相比較.注意,當(dāng)K是對(duì)稱(chēng)的且p-v是偶數(shù)時(shí),可以證明(和Wand1994)(6.31)中的系數(shù)是零.在此,偏倚在內(nèi)點(diǎn)比在邊界點(diǎn)有較小的階.這就
54、是所謂的邊界效應(yīng).當(dāng)p-v是奇數(shù)時(shí),偏倚在內(nèi)點(diǎn)和邊界點(diǎn)具有相同的階.實(shí)際上,它們?cè)赾1點(diǎn)處甚至是連續(xù)的,該點(diǎn)是內(nèi)點(diǎn)和邊界點(diǎn)之間的界.因此,當(dāng)p-v是奇數(shù)時(shí),局部多項(xiàng)式擬合并沒(méi)有產(chǎn)生額外的邊界偏倚.假定p-v奇數(shù),且K是對(duì)稱(chēng)的.可以證明,對(duì)階p-1和階p的局部多項(xiàng)式擬合有相同的漸近方差(參閱Fan和Gijbels,1996的§.3).但后者有更多的參數(shù)以減少建模偏倚,特別是在邊界區(qū)域.這就是我們推薦適用奇數(shù)階擬合的理論背景.這真是一個(gè)奇妙的世界!下面引理對(duì)導(dǎo)出局部多項(xiàng)式估計(jì)是非常有用的.它是Mack和Silverman(1982)的結(jié)果的推廣.引理6.1令(Xi"),(XYt
55、)是平穩(wěn)序列,滿(mǎn)足混合條件|(l)Fcl,其中c0和一:512.進(jìn)一步假定對(duì)某個(gè)s2和區(qū)間a,b,有E|Y|s且supf|y|sf(x,y)dyv30,X哥a,b'其中f表示(X,Y)的聯(lián)保密度.此外,我們假定§6.6.2中條件1(ii)和(iii)成立.令K為具有界支撐的有界函數(shù),滿(mǎn)足Lipschitz條件.則倘若h>0,且對(duì)某個(gè):.0,丁丄乂卄:和T(P*5)(s丄審申2舟/4人申2二/40我們有tsup|T八Kh(Xt-x)Y-EKh(Xt-x)Y|=OpTh/log(T)/2.X電a,bt=1注意,由于才仏丄巾:,當(dāng)混合系數(shù)指數(shù)衰減,則引理6.1的最后一個(gè)條件自
56、動(dòng)成立.一般地,當(dāng)相當(dāng)大時(shí),上述引理中的最后一個(gè)條件成立.我們現(xiàn)在敘述和證明局部多項(xiàng)式估計(jì)結(jié)果的一致收斂性.定理6.5假定引理6.1的條件成立,設(shè)計(jì)密度f(wàn)在a,b上是一致連續(xù)的,且infxamf(x)0.則=0Th/log(1W卅.在定理6.5中取第(v1)元素,我們有=0pTiiv4i/logT)/2特別地,局部多項(xiàng)式估計(jì)有如下的一致收斂性:sup|m(x)-m(x)|=0Php1-Th/log(1/h),/2.xa,b6.3.4 標(biāo)準(zhǔn)誤差和估計(jì)偏度局部多項(xiàng)式估計(jì)的標(biāo)準(zhǔn)誤差對(duì)構(gòu)造置信區(qū)間是有用的.為了導(dǎo)出它們,我們暫時(shí)假定(Xi,Y)歡迎共閱是來(lái)自某總體的獨(dú)立樣本則由(6.23)有Var:|
57、X)=(XTWX尸XTWVar(y|X)WX(XTWX)J.注意,Var(Y|XJ'(Xi).由于所有運(yùn)算都是對(duì)Xx。局部地進(jìn)行,故而上述條件方差幾乎是常數(shù)二2(Xo).使用這種局部同方差性,我們有222Var(y|X)=diag(<i(XJ,川衛(wèi)(X.)"(x°)ln.當(dāng)然,這個(gè)近似僅對(duì)那些XiXo成立,但是,那些點(diǎn)實(shí)際是用于計(jì)算方差的數(shù)據(jù)點(diǎn).由此,我們有Var:|X):-2(x0)(XTWX)JXTW2X(XTWX尸.2*2條件方差(Xo)可以用一個(gè)先導(dǎo)帶寬h和平方殘差(Xt,;t)通過(guò)平滑來(lái)估計(jì),其中:t二Y-m(Xt).這就得到協(xié)方差矩陣的一個(gè)估計(jì)(6.34)1(x0c-2(x)(XTWX)XTW2X(XTWX)'這是在Fan和Gijbels(1995)中提出的估計(jì)條件方差的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度廚具品牌戰(zhàn)略規(guī)劃與執(zhí)行合同4篇
- 二零二五版貨車(chē)司機(jī)勞動(dòng)合同爭(zhēng)議解決途徑范本3篇
- 二零二四年度知識(shí)產(chǎn)權(quán)質(zhì)押擔(dān)保合同3篇
- 2025年度跨境電商基地土地租賃及廠(chǎng)房購(gòu)置合同4篇
- 2025委托書(shū) 拆遷委托合同
- 2025愛(ài)分期合同最終版
- 二零二五年度跨境電子商務(wù)WTO協(xié)定執(zhí)行與保障措施合同3篇
- 二零二五版搬運(yùn)企業(yè)節(jié)能減排合同范本3篇
- 2025年度木材加工設(shè)備租賃及維護(hù)服務(wù)合同范本4篇
- 2025版民爆物品裝卸作業(yè)環(huán)境保護(hù)合同4篇
- 【探跡科技】2024知識(shí)產(chǎn)權(quán)行業(yè)發(fā)展趨勢(shì)報(bào)告-從工業(yè)轟鳴到數(shù)智浪潮知識(shí)產(chǎn)權(quán)成為競(jìng)爭(zhēng)市場(chǎng)的“矛與盾”
- 《中國(guó)政法大學(xué)》課件
- GB/T 35270-2024嬰幼兒背帶(袋)
- 遼寧省沈陽(yáng)名校2025屆高三第一次模擬考試英語(yǔ)試卷含解析
- 2024-2025學(xué)年高二上學(xué)期期末數(shù)學(xué)試卷(新題型:19題)(基礎(chǔ)篇)(含答案)
- 2022版藝術(shù)新課標(biāo)解讀心得(課件)小學(xué)美術(shù)
- Profinet(S523-FANUC)發(fā)那科通訊設(shè)置
- 醫(yī)學(xué)教程 常見(jiàn)化療藥物歸納
- 統(tǒng)編版九年級(jí)歷史下冊(cè)第一單元教案教學(xué)設(shè)計(jì)
- GB/T 25000.51-2016系統(tǒng)與軟件工程系統(tǒng)與軟件質(zhì)量要求和評(píng)價(jià)(SQuaRE)第51部分:就緒可用軟件產(chǎn)品(RUSP)的質(zhì)量要求和測(cè)試細(xì)則
- 外科學(xué)試題庫(kù)及答案(共1000題)
評(píng)論
0/150
提交評(píng)論