第二十二章 常用統(tǒng)計(jì)預(yù)測方法(3)—ARIMA_第1頁
第二十二章 常用統(tǒng)計(jì)預(yù)測方法(3)—ARIMA_第2頁
第二十二章 常用統(tǒng)計(jì)預(yù)測方法(3)—ARIMA_第3頁
第二十二章 常用統(tǒng)計(jì)預(yù)測方法(3)—ARIMA_第4頁
第二十二章 常用統(tǒng)計(jì)預(yù)測方法(3)—ARIMA_第5頁
已閱讀5頁,還剩39頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、2022-4-91第三節(jié) ARIMA預(yù)測方法陳炳為2022-4-922022-4-93傳統(tǒng)的時(shí)間序列分析的應(yīng)用, 主要是確定性的時(shí)間序列分析方法, 包括指數(shù)平滑法、滑動平均法、時(shí)間序列的分解等等, 這些方法的應(yīng)用有一個(gè)前提條件: 時(shí)間序列的隨機(jī)性部分相對來說并不顯著。事實(shí)上, 這一條件在大多數(shù)情況下都是不成立的。因?yàn)? 隨著社會的發(fā)展, 許多不確定性因素的影響越來越大, 必須引起人們的重視。2022-4-941970 年, Box 和Jenkins 提出了以隨機(jī)理論為基礎(chǔ)的時(shí)間序列分析方法, 使時(shí)間序列分析理論上升到一個(gè)新的高度, 預(yù)測的精確度大大提高。其基本模型有三種: 自回歸(AR) 模型

2、; 滑動平均(MA) 模型自回歸滑動平均(AR IMA) 模型。2022-4-95兩個(gè)問題:(1)分析時(shí)間序列的隨機(jī)性、平穩(wěn)性和季節(jié)性;(2)在對時(shí)間序列分析的基礎(chǔ)上,選擇適當(dāng)?shù)哪P瓦M(jìn)行預(yù)測 (AR(p),MA(q),ARIMA(p, d,q)。2022-4-961 ARIMA預(yù)測數(shù)學(xué)模型 自回歸滑動平均混合模型(autoregressive integrated moving average) ARIMA(p,d,q)其中:p為自回歸的階數(shù);d為差分階數(shù);q為滑動平均階數(shù)。2022-4-97ARIMA模型可分為:(1)自回歸模型(AR),即ARIMA(p,0,0);(2)滑動平均模型(MA)

3、,即ARIMA(0,0,q);(3)自回歸滑動平均混合模型(ARIMA(p,d,q)。2022-4-98 ARIMA方法依據(jù)的基本思想:將預(yù)測對象隨時(shí)間推移而形成的時(shí)間序列視為一個(gè)隨機(jī)序列,即除去個(gè)別偶然原因引起的觀測值外,時(shí)間序列是一組依賴于時(shí)間t的隨機(jī)變量。這組隨機(jī)變量所具有的依存關(guān)系或自相關(guān)性表征了預(yù)測對象發(fā)展的延續(xù)性,而這種自相關(guān)性一旦被相應(yīng)的數(shù)學(xué)模型描述出來,就可以從時(shí)間序列的過去及現(xiàn)在的值預(yù)測未來值。2022-4-99運(yùn)用ARIMA方法的前提條件:作為預(yù)測對象的時(shí)間序列是一零均值的平穩(wěn)時(shí)間序列。平穩(wěn)隨機(jī)序列的統(tǒng)計(jì)特性不隨時(shí)間的推移而變化。直觀的看,平穩(wěn)隨機(jī)序列的折線圖無明顯的上升或

4、下降趨勢。(如圖2210)2022-4-910 對非零均值的非平穩(wěn)的時(shí)間序列,若用ARIMA預(yù)測方法,需先對時(shí)間序列進(jìn)行零均值化和差分平穩(wěn)化處理. 零均值化:對均數(shù)不為零的序列每一項(xiàng)都減去該序列的平均數(shù),構(gòu)成一個(gè)均值為零的新的時(shí)間序列。 如例222:可取YYXtt2200Y2022-4-911 差分平穩(wěn)化處理 (I)對均值為零的非平穩(wěn)時(shí)間序列進(jìn)行差分,使之成為平穩(wěn)時(shí)間序列。一般情況下,非平穩(wěn)序列經(jīng)過一階差分或二階差分都可以平穩(wěn)化。如:有線性增長趨勢的時(shí)間序列可用一階差分;若為二次增長可用二階差分。)2() 1(121tXXXtXXXtttttt2022-4-912月份7171717171717

5診人數(shù)(千)7006005004003002001000例22-3某醫(yī)院從1990年1月2001年12月的門診量數(shù)據(jù)(P336)門診情況的序列圖2022-4-913月份5915915915915915918006004002000-200-400門診人數(shù)(千)均零法一階差分門診、均零、一階差分法的序列圖2022-4-914171717171717171717171717月 份-2000200400600DIFF(PEOPLE,1)DIFF(people,2)門 診 人 數(shù) ( 千 )門診、一階差分法、二階差分的序列圖2022-4-915具體計(jì)算:2022-4-916自回

6、歸模型(AR)經(jīng)典統(tǒng)計(jì)中的回歸模型:表示因變量對于自變量依賴(相關(guān))關(guān)系。等式右側(cè)將隨機(jī)變量 分解成兩部分,一部分是自變量 它們代表某些已知的可變化因素;另一部分是殘差量 ,它是由一些不可捉摸的因素及測量誤差產(chǎn)生。通常假定 為正態(tài)零均值獨(dú)立序列。ttrrtttXXXY2211tYtt2022-4-917 將經(jīng)典統(tǒng)計(jì)回歸模型推廣,得到一類新的線性模型稱為自回歸模型??捎脕砻枋瞿承r(shí)間序列。特別是當(dāng)時(shí)間序列難于和其它因素建立聯(lián)系時(shí),用自回歸模型建模更顯重要。Yt代表在t時(shí)的觀察值,et代表誤差或偏差,表示不能用模型說明的隨機(jī)因素。tptptttYYYY22112022-4-918此模型和經(jīng)典統(tǒng)計(jì)回

7、歸模型的本質(zhì)區(qū)別:在經(jīng)典統(tǒng)計(jì)回歸模型中 是已知的可變化因素。自變量間的關(guān)系是相互獨(dú)立的。在自回歸模型中 同屬于一個(gè)序列,它們彼此之間不是獨(dú)立的,而是有一定的相互依賴關(guān)系。pttttYYYY,21和),(21trttXXX2022-4-919一階自回歸模型上面 的模型稱為p階自回歸模型。當(dāng)p1時(shí)是一階自回歸模型。意義: Yt變量受Yt-1的影響。tttYY112022-4-920例如:考慮一個(gè)阻尼單擺。以Yt表示 t時(shí)刻的最大擺幅,由于阻尼的作用,Yt與Yt-1之間具有關(guān)系式:式中的 代表阻尼系數(shù)。 表示第t個(gè)擺動周期中單擺還受到外加的力所額外加的擺幅。tttYY111t2022-4-921滑動

8、平均(MA)模型式中 是時(shí)間序列在 t時(shí)刻的觀察值;q是滑動平均的階數(shù); 是時(shí)間序列模型在t時(shí)刻的誤差或偏差。在滑動平均的過程中,每一個(gè)值是由當(dāng)前干擾以及前一個(gè)或多個(gè)干擾的均值決定的?;瑒悠骄碾A確定了有多少個(gè)前干擾被用于平均。qtqttttY2211tYt2022-4-922三、自回歸滑動平均混合(ARIMA)模型將自回歸模型和滑動平均模型組合,便構(gòu)成自回歸滑動平均混合(ARIMA)模型qtqtttptptttXXXX221122112022-4-923應(yīng)用ARIMA方法預(yù)測分為三個(gè)階段:1.模型的識別:利用自相關(guān)分析和偏相關(guān)分析等方法,分析時(shí)間序列的隨機(jī)性、平穩(wěn)性及季節(jié)性,并選定一個(gè)特定的

9、模型以擬合所分析的時(shí)間序列。 2022-4-9242 模型中參數(shù)的估計(jì)和模型的檢驗(yàn):用時(shí)間序列的數(shù)據(jù),估計(jì)模型的參數(shù),并進(jìn)行檢驗(yàn),以判定該模型是否恰當(dāng)。3 預(yù)測應(yīng)用:用選定的模型對將來某個(gè)時(shí)刻的數(shù)值作出預(yù)測。2022-4-925ARIMA的計(jì)算步驟1、識別 必須確定三個(gè)整數(shù)p,d,q,另外還須確定是否具有周期性。首先應(yīng)從散點(diǎn)圖判別時(shí)間序列是否平穩(wěn)。從上面差分之后的圖可見: 進(jìn)行一階差分I(1)=ARIMA(1)之后,其隨機(jī)性較好。故d=1。 I(2)=ARIMA(2) d通常取為0或1,一般不超過2。 如圖22-10 d=02022-4-926p的確定:AR(p)=ARIMA(p,0,0)。其

10、意義為在自回歸序列中,每個(gè)值都是前一個(gè)值或多個(gè)值的線性組合。AR(1)代表每個(gè)值對前值的依賴程序。對于非周期的時(shí)間序列,P值的決定可取決于PACF。若Lag滯后項(xiàng)開始急劇減小,則通常令p=Lag。否則是拖尾的,其p=0。如:圖22-12,P=0。2022-4-927 q值的確定: 滑動平均MA(q),每一項(xiàng)是由當(dāng)前干擾以及前或一個(gè)或前多個(gè)干擾的均值決定的。 MA(q)= ARIMA(0,0,q)對于非周期的時(shí)間序列,q值的決定可取決于ACF。若在Lag滯后項(xiàng)開始急劇減小,則通常令q=Lag。否則是拖尾的,其q=0。如:圖22-12,由于在滯后1處顯示了一個(gè)負(fù)的低谷,其后幾個(gè)值與其相差較大。故q

11、=1。2022-4-9282、估計(jì) 給出模型后ARIMA(0,1,1),計(jì)算模型的參數(shù),并獲得 擬合值或預(yù)測值(FIT_1) 、殘差(ERR_1)、其可信限(LCL_1,UCL_1)及標(biāo)準(zhǔn)誤(SEP_1)。 結(jié)果表22-7,模型中MA1=0.78105,表示序列中的每個(gè)值等于當(dāng)前的隨機(jī)干擾減去前一個(gè)隨機(jī)干擾的0.78倍。2022-4-9293 診斷可從兩個(gè)方面考慮:(1)殘差的ACF和PACF不應(yīng)與0有顯著的差異。 ACF、PACF高階相關(guān)相關(guān)可能偶爾會超過95%的可信區(qū)間,但如一或二階很大,那么模型就是錯(cuò)誤的。2022-4-930 (2)殘差應(yīng)是隨機(jī)的,即是白噪聲(white noise)。

12、可用Box-Ljung Q統(tǒng)計(jì)量。應(yīng)在大約有1/4的滯后項(xiàng)中考察Q值(但滯后項(xiàng)不能多于50)。Q統(tǒng)計(jì)量應(yīng)沒有統(tǒng)計(jì)學(xué)意義。 (3)考察AIC和SBC 考慮多個(gè)模型,如AIC與SBC均小,說明這個(gè)模型較好。AIC適用于自回歸模型,SBC適用于更通用的模型。2022-4-931(4)控制圖的建立 可在同一個(gè)序列圖中,作出其實(shí)測值、95%的可信限上、下界及預(yù)測值。 圖22-14。2022-4-932季節(jié)性ARIMA模型(seasonal ARIMA)。JAN 1990MAY 1990SEP 1990JAN 1991MAY 1991SEP 1991JAN 1992MAY 1992SEP 1992JAN

13、1993MAY 1993SEP 1993JAN 1994MAY 1994SEP 1994JAN 1995MAY 1995SEP 1995JAN 1996MAY 1996SEP 1996JAN 1997MAY 1997SEP 1997JAN 1998MAY 1998SEP 1998JAN 1999MAY 1999SEP 1999JAN 2000MAY 2000SEP 2000JAN 2001MAY 2001SEP 2001Date100200300400500600700門診人數(shù)(千)2022-4-933ARIMA(0,1,1)12 代表12為周期。1 季節(jié)性后移算子 B(backfit)代表時(shí)

14、間序列后移一時(shí)間點(diǎn)考察。B2代表往后移動兩個(gè)單位。對于周期為12的觀察值,則為B12季節(jié)性ARIMA(0,0,1)12 Zt=(1-B12)etARIMA(0,1,1)12 (1-B12)Zt=(1-B12)et2022-4-9342 識別季節(jié)模型的一些問題 (1) 序列的長度要較長。如至少應(yīng)有7或8個(gè)季節(jié)周期的數(shù)據(jù)。 (2)季節(jié)性與非季節(jié)性的混合 若ACF或PACF或兩者在季節(jié)周期的整數(shù)倍時(shí)點(diǎn)處都顯示了特別 值,說明存在季節(jié)過程。 2022-4-935135791113151719212325272931333537394143454749Lag Number-1.0-0.50.00.51.

15、0ACFCoefficientUpper Confidence Limitelement_simpleline_2135791113151719212325272931333537394143454749Lag Number-1.0-0.50.00.51.0Partial ACFCoefficientUpper Confidence LimitLower Confidence Limit門 診 人 數(shù) ( 千 )(1)ACF圖和PACF圖2022-4-9361次差分后的序列圖FEB 1990JUN 1990OCT 1990FEB 1991JUN 1991OCT 1991FEB 1992JUN

16、1992OCT 1992FEB 1993JUN 1993OCT 1993FEB 1994JUN 1994OCT 1994FEB 1995JUN 1995OCT 1995FEB 1996JUN 1996OCT 1996FEB 1997JUN 1997OCT 1997FEB 1998JUN 1998OCT 1998FEB 1999JUN 1999OCT 1999FEB 2000JUN 2000OCT 2000FEB 2001JUN 2001OCT 2001Date-100-50050100門診人數(shù)(千)Transforms: difference(1)2022-4-937(2)季節(jié)模型的識別1次差

17、分存在問題(1) 仍存在季節(jié)性問題,仍有上升的趨勢,可考慮用季節(jié)性差分。(2) 方差非齊,可考慮用對數(shù)變換。2022-4-938季節(jié)性差分中 D=1。 季節(jié)性差分可平滑急劇的季節(jié)波動。左圖為一次性季節(jié)差分后的序列圖。JAN 1991JUN 1991NOV 1991APR 1992SEP 1992FEB 1993JUL 1993DEC 1993MAY 1994OCT 1994MAR 1995AUG 1995JAN 1996JUN 1996NOV 1996APR 1997SEP 1997FEB 1998JUL 1998DEC 1998MAY 1999OCT 1999MAR 2000AUG 2000

18、JAN 2001JUN 2001NOV 2001APR 2002SEP 2002FEB 2003JUL 2003DEC 2003Date-600-400-2000門診人數(shù)(千)Transforms: seasonal difference(1, period 12)2022-4-939135791113151719212325272931333537394143454749Lag Number-1.0-0.50.00.51.0Partial ACFCoefficientUpper Confidence LimitLower Confidence Limit門 診 人 數(shù) ( 千 )135791113151719212325272931333537394143454749Lag Number-1.0-0.50.00.51.0ACFCoefficientUpper Confidence LimitLower Confidence Limit門 診 人 數(shù) ( 千 )對數(shù)變換,1次季節(jié)性差分2022-4-940 在時(shí)點(diǎn)12時(shí)出現(xiàn)一個(gè)單一的低谷,故Q=1。即考慮季節(jié)性模型為ARIMA(0,1,1)。 (3) 從殘差中識別非季節(jié)性模型: 若季節(jié)性模型的識別是正確的,真實(shí)值

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論