第二章時間序列預處理1_第1頁
第二章時間序列預處理1_第2頁
第二章時間序列預處理1_第3頁
第二章時間序列預處理1_第4頁
第二章時間序列預處理1_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

內容回顧:時間序列定義、特點和分類時間序列分析主要研究方法時間序列分析統(tǒng)計軟件1時間序列之概念(1)從統(tǒng)計意義上,將某一指標在不同時間上的不同數(shù)值,按照時間的先后次序排列而成的數(shù)列。各種偶然因素的影響,表現(xiàn)出某種隨機性,存在統(tǒng)計上的依賴關系。(2)從系統(tǒng)意義上,某一系統(tǒng)在不同時間(地點,條件等)的響應。(3)從數(shù)學意義上,對某一過程中的某一個變量或一組變量X(t)進行觀察測量,在一系列時刻t1t2t3等得到的離散有序數(shù)集合X(t1),X(t2),稱為離散時間序列。2第二章時間序列的預處理3本章結構時間序列的建立(補充)平穩(wěn)性檢驗純隨機性檢驗4補充:時間序列的建立要分析時間序列,就必須建立一個時間序列。一般來說,研究者是運用記錄儀或通過觀察測量來獲得所研究系統(tǒng)的真實有限的數(shù)據(jù)集合。有時也可以直接用二手資料。但是,不論是通過哪一種途徑獲得的時間序列,在進行分析處理前,必須對所依據(jù)的資料進行認真地檢查、整理,有時還需要進行適當?shù)念A處理。我們把獲取時間序列以及對其進行檢查、整理和預處理等工作,稱為時間序列的建立。5一、時間序列數(shù)據(jù)的采集1采樣:按照一定的時間間隔對所研究系統(tǒng)的響應進行記錄和觀察。2采樣間隔(時間頻率):記錄和觀察的時間間隔。一般采樣是等間隔的,比如年、月、日等。時間的頻率。3采樣原則:關鍵采樣間隔的選擇,希望所采到的樣本沒有信息損失,也沒有信息冗余。6(一)離群點(outier):指在一個時間序列里,遠離序列一般水平的極端大值和極端小值。也稱奇異值或者野值。

(二)離群點產生的原因1、采樣中的誤差。2、被研究現(xiàn)象本身由于受各種偶然非正常的因素影響而引起的。

(三)離群點的主要影響1、影響模型的擬合精度,甚至得到虛假信息;被認為是一個“壞值”。2、同時可以提供重要信息。如關于系統(tǒng)穩(wěn)定性和靈敏性等信息。二、離群點(outiler)的檢驗與處理7(四)離群點的分類

8(四)離群點的分類9(五)離群點的檢驗

1、確定離群點范圍,如果某一時刻數(shù)值超出該范圍,則說明該點是離群點。2、對數(shù)據(jù)進行模型分析,然后根據(jù)擬合模型后的殘差序列計算特定的統(tǒng)計量,測出離群點及其類型,并用相應的模型修正?!丛诮y(tǒng)計分析中如何識別極端值〉

《江蘇統(tǒng)計》1999、11郭莉

1、四分展步法2、3法3、莖葉圖法10三、缺損值(Missingvalue)的補足

缺損值:在采集時間序列時,由于種種原因,引起在某些觀測點上未能記錄下來觀測值。缺損值的影響:破壞了系統(tǒng)運行的連續(xù)性,違背了時間序列“順序的重要性”的原則。方法:增長量推算法、發(fā)展速度推算法比例推算法、平滑法、插值估算法

11在SPSS中,缺失值填充方法:1、seriesmean全體序列的均數(shù),默認值2、meanofnearbypoints相鄰若干點的均數(shù)3、medianofnearbypoints:相鄰若干點的中位數(shù)4、linearinterpolation:線性內插,缺失值相鄰兩點的均數(shù),但缺失值在序列的最前/最后,則無法被填充。5、lineartrendatpoint.該點的線性趨勢,將記錄號作為自變量,序列值作為應變量回歸,求得該點的估計值。12最后對序列中的每一個數(shù)據(jù)的指標口徑、計算范圍、計算方法、計量單位等進行認真檢查,對經(jīng)濟時間序列來說,還必須檢查計算價格等方面是否一致。13四時間序列建立的實例1確定時間序列的時間間隔2確定指標計算范圍3確定計算方法4確定指標口徑5檢查數(shù)據(jù)6調整數(shù)據(jù)14時間序列的預處理時間序列平穩(wěn)性檢驗平穩(wěn)性時間序列非平穩(wěn)性時間序列純隨機性檢驗白噪聲序列(純隨機序列)平穩(wěn)非白噪聲序列無規(guī)律可循,分析結束ARMA模型1.確定性分析2.隨機性分析(ARIMA模型)152.1平穩(wěn)性檢驗

特征統(tǒng)計量平穩(wěn)時間序列的定義平穩(wěn)時間序列的統(tǒng)計性質平穩(wěn)時間序列的意義平穩(wěn)性的檢驗

16概率分布概率分布的意義隨機變量族的統(tǒng)計特性完全由它們的聯(lián)合分布函數(shù)或聯(lián)合密度函數(shù)決定。

時間序列概率分布族的定義實際應用的局限性17特征統(tǒng)計量均值

方差自協(xié)方差自相關系數(shù)18平穩(wěn)時間序列的定義嚴平穩(wěn)嚴平穩(wěn)是一種條件比較苛刻的平穩(wěn)性定義,它認為只有當序列所有的統(tǒng)計性質都不會隨著時間的推移而發(fā)生變化時,該序列才能被認為平穩(wěn)。寬平穩(wěn)寬平穩(wěn)是使用序列的特征統(tǒng)計量來定義的一種平穩(wěn)性。它認為序列的統(tǒng)計性質主要由它的低階矩決定,所以只要保證序列低階矩平穩(wěn)(二階),就能保證序列的主要性質近似穩(wěn)定。

19平穩(wěn)時間序列的統(tǒng)計定義

滿足如下條件的序列稱為嚴平穩(wěn)序列滿足如下條件的序列稱為寬平穩(wěn)序列20嚴平穩(wěn)與寬平穩(wěn)的關系一般關系嚴平穩(wěn)條件比寬平穩(wěn)條件苛刻,通常情況下,嚴平穩(wěn)(低階矩存在)能推出寬平穩(wěn)成立,而寬平穩(wěn)序列不能反推嚴平穩(wěn)成立特例不存在低階矩的嚴平穩(wěn)序列不滿足寬平穩(wěn)條件,例如服從柯西分布的嚴平穩(wěn)序列就不是寬平穩(wěn)序列當序列服從多元正態(tài)分布時,寬平穩(wěn)可以推出嚴平穩(wěn)21(1)嚴平穩(wěn)不一定寬平穩(wěn)。(2)寬平穩(wěn)不一定嚴平穩(wěn)。(3)嚴平穩(wěn)+二階矩存在=>寬平穩(wěn)。但反過來一般不成立。(4)對于正態(tài)過程來說,有嚴平穩(wěn)<=>寬平穩(wěn)22平穩(wěn)時間序列的統(tǒng)計性質

常數(shù)均值

自協(xié)方差函數(shù)和自相關函數(shù)只依賴于時間的平移長度而與時間的起止點無關

延遲k自協(xié)方差函數(shù)

延遲k自相關系數(shù)23自相關系數(shù)的性質規(guī)范性

對稱性

非負定性

非唯一性

24平穩(wěn)時間序列的意義

時間序列數(shù)據(jù)結構的特殊性可列多個隨機變量,而每個變量只有一個樣本觀察值平穩(wěn)性的重大意義極大地減少了隨機變量的個數(shù),并增加了待估變量的樣本容量極大地簡化了時序分析的難度,同時也提高了對特征統(tǒng)計量的估計精度25平穩(wěn)性檢驗方法(1)通過時間序列的趨勢圖來判斷(2)通過自相關函數(shù)(ACF)判斷特征根檢驗法單位根檢驗法非參數(shù)檢驗法圖檢驗方法返回本節(jié)首頁下一頁上一頁26圖檢驗(特點)這種方法是通過觀察時間序列的趨勢圖和自相關圖來判斷時間序列是否存在趨勢性或周期性。優(yōu)點:簡便、直觀。對于那些明顯為非平穩(wěn)的時間序列,可以采用這種方法。缺點:對于一般的時間序列是否平穩(wěn),不易用這種方法判斷出來。27(1)時序圖檢驗(判斷準則)根據(jù)平穩(wěn)時間序列均值、方差為常數(shù)的性質,平穩(wěn)序列的時序圖應該顯示出該序列始終在一個常數(shù)值附近隨機波動,而且波動的范圍有界、無明顯趨勢及無周期特征28(2)自相關圖檢驗(判斷準則)平穩(wěn)序列通常具有短期相關性。該性質用自相關系數(shù)來描述就是隨著延遲期數(shù)的增加,平穩(wěn)序列的自相關系數(shù)會很快地衰減向零。若時間序列的自相關函數(shù)在k>3時都落入置信區(qū)間,且逐漸趨于零,則該時間序列具有平穩(wěn)性;若時間序列的自相關函數(shù)更多地落在置信區(qū)間外面,則該時間序列就不具有平穩(wěn)性。29若序列無趨勢,但是具有季節(jié)性,那末對于按月采集的數(shù)據(jù),時滯12,24,36……的自相關系數(shù)達到最大(如果數(shù)據(jù)是按季度采集,則最大自相關系數(shù)出現(xiàn)在4,8,12,……),并且隨著時滯的增加變得較小。30若序列是有趨勢的,且具有季節(jié)性,其自相關函數(shù)特性類似于有趨勢序列,但它們是擺動的,對于按月數(shù)據(jù),在時滯12,24,36,……等處具有峰態(tài);如果時間序列數(shù)據(jù)是按季節(jié)的,則峰出現(xiàn)在時滯4,8,12,……等處。31例題例2.1檢驗1964年——1999年中國紗年產量序列的平穩(wěn)性例2.2檢驗1962年1月——1975年12月平均每頭奶牛月產奶量序列的平穩(wěn)性例2.3檢驗1949年——1998年北京市每年最高氣溫序列的平穩(wěn)性32例2.1時序圖33例2.1自相關圖34例2.2時序圖35例2.2自相關圖36例2.3時序圖37例2.3自相關圖382.2純隨機性檢驗

純隨機序列的定義純隨機性的性質純隨機性檢驗39純隨機序列的定義純隨機序列也稱為白噪聲序列,它滿足如下兩條性質

40標準正態(tài)白噪聲序列時序圖

41白噪聲序列的性質

純隨機性

各序列值之間沒有任何相關關系,即為“沒有記憶”的序列

意義:純隨機性是判斷相關信息是否提取充分的一個判別標準方差齊性

序列中每個變量的方差都相等根據(jù)馬爾可夫定理,只有方差齊性假定成立時,用最小二乘法得到的未知參數(shù)估計值才是準確的、有效的42純隨機性檢驗

檢驗原理假設條件檢驗統(tǒng)計量

判別原則43Barlett定理

如果一個時間序列是純隨機的,得到一個觀察期數(shù)為的觀察序列,那么該序列的延遲非零期的樣本自相關系數(shù)將近似服從均值為零,方差為序列觀察期數(shù)倒數(shù)的正態(tài)分布44假設條件原假設:延遲期數(shù)小于或等于期的序列值之間相互獨立備擇假設:延遲期數(shù)小于或等于期的序列值之間有相關性

45檢驗統(tǒng)計量Q統(tǒng)計量:適合于大樣本情況LB統(tǒng)計量:46判別原則拒絕原假設當檢驗統(tǒng)計量大于分位點,或該統(tǒng)計量的P值小于時,則可以以的置信水平拒絕原假設,認為該序列為非白噪聲序列接受原假設當檢驗統(tǒng)計量小于分位點,或該統(tǒng)計量的P值大于時,則認為在的置信水平下無法拒絕原假設,即不能顯著拒絕序列為純隨機序列的假定

47例2.4:

標準正態(tài)白噪聲序列純隨機性檢驗樣本自相關圖48檢驗結果延遲統(tǒng)計量檢驗統(tǒng)計量值P值延遲6期2.360.8838延遲12期5.3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論