數(shù)據(jù)挖掘?qū)嶒瀳蟾?參考)_第1頁
數(shù)據(jù)挖掘?qū)嶒瀳蟾?參考)_第2頁
數(shù)據(jù)挖掘?qū)嶒瀳蟾?參考)_第3頁
數(shù)據(jù)挖掘?qū)嶒瀳蟾?參考)_第4頁
數(shù)據(jù)挖掘?qū)嶒瀳蟾?參考)_第5頁
免費預覽已結束,剩余5頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、時間序列的模型法和數(shù)據(jù)挖掘兩種方法比較分析研究實驗目的 : 通過實驗能對時間序列的模型法和數(shù)據(jù)挖掘兩種方法的原理和優(yōu)缺點有更清楚 的認識和比較 .實驗內(nèi)容 :(ARIMA) 和時序模,并對兩種方法的趨勢和預測結果進行比較并選用1952-2006年的中國GDP分別對之用自回歸移動平均模型 型的數(shù)據(jù)挖掘方法進行分析和預測 給出解釋 .實驗數(shù)據(jù) :本文研究選用 1952-2006 年的中國GDP,其資料如下日期國內(nèi)生產(chǎn)總值 (億元 )日期國內(nèi)生產(chǎn)總值 (億元 )2006-12-312094071997-12-31747722005-12-311830851996-12-312004-12-31136

2、5151995-12-312003-12-311994-12-312002-12-311993-12-312001-12-311992-12-312000-12-31894041991-12-311999-12-31820541990-12-311998-12-31795531989-12-311988-12-311969-12-311987-12-311968-12-311986-12-311967-12-311985-12-311966-12-3118681984-12-3171711965-12-311983-12-311964-12-3114541982-12-311963-12-31

3、1981-12-311962-12-311980-12-311961-12-3112201979-12-311960-12-3114571978-12-311959-12-3114391977-12-311958-12-3113071976-12-311957-12-3110681975-12-311956-12-3110281974-12-311955-12-319101973-12-311954-12-318591972-12-311953-12-318241971-12-311952-12-316791970-12-31表一國內(nèi)生產(chǎn)總值(GDP)是指一個國家或地區(qū)所有常住單位在一定時期內(nèi)

4、生產(chǎn)活動的最終成果。這個指標把國民經(jīng)濟全部活動的產(chǎn)出成果概括在一個極為簡明的統(tǒng)計數(shù)字之中為評價和衡 量國家經(jīng)濟狀況、 經(jīng)濟增長趨勢及社會財富的經(jīng)濟表現(xiàn)提供了一個最為綜合的尺度,可以說,對其進行的分析預測具有重要的理論它是影響經(jīng)濟生活乃至社會生活的最重要的經(jīng)濟指標。 與現(xiàn)實意義。實驗步驟:1.選用1952年到2001年這50個數(shù)據(jù)參與自回歸移動平均模型(ARIMA)建模(所用的工具是Eviews).根據(jù)博克斯-詹金斯提出的建模思想,具體步驟為:(1)對原序列進行平穩(wěn)性檢驗。在以年份為橫軸,以山東省GDP為縱軸的坐標系中作曲線圖如圖1所示。圖一從圖1中可以看出全國的 GDP不具有明顯的周期變化和季

5、節(jié)波動,但呈現(xiàn)出明顯的增長趨 勢,他的相關系數(shù)和偏相關系數(shù)如圖二所示Cate: 02/24108 Tim: 15.15Sample' 1952 2U01Ircludpd chspivatiori5' EQAuTocorrelaiion Farrial Correlation AC FAC Q-5tat Prab10.8970 897佗653O.ODC120 794-0 0527e.7beO.OJL130 632- 04B1D3.29D.ra14fl陽4-n 037nmn1匚0 4750 073135.b0O.OJL1£J 3630 oeo143.63O.OJC170

6、275D 009140.21O.OJL1&J 20.10 044150.76O.OJCh9J.15D0 029152.21O.OJC1IDQ.1D9 13152.36.1110.07S0 016153 37O.OJL120 0170 031153.62O.ODC130.0130 041153.S4O.OJC14-0.00/0 025153.64D.LI3C1IE-n n?Rnonn1刊finomahIEO.O-IB0 005153 76D.03C117-0.0530 009154.0ED.03CIB-0.07/0 006154 650.03C19-0.033Dld15521D.03C2

7、C-0.09D0 0221GC.0GO.OJC21-0.109心024isr 120.03D22-3 119<1021158 4D.ma230.12B 018160.000.03C124-0.13B016161.050.03C圖二從圖二中可以看到,他的自相關系數(shù)是拖尾的,而偏相關系數(shù)是截尾的。 對樣本數(shù)據(jù)用 ADF進行單位根檢驗的到結果如圖三Auglllente d Dickey-Fill ler Unit Root Test on GD P-3 5713-2.9223-2.5990ADF Test Statistic 0.394E271 % Critical Value*5% Crit

8、ical Value10% Critical Value*f7lacKinnon critical values for rejection of hypothesis of 對 unit root.圖三這里ADF值大于三個不同檢驗水平下的臨界值,故而可以判斷出,我國GDP序列是非平穩(wěn)的。這就需要對 GDP序列進行差分以使序列變得平穩(wěn)。由圖一可以看出,GDP序列明顯帶有指數(shù)性質(zhì),因此現(xiàn)對該序列進行對數(shù)變換在eviews中輸入genr Ingdp=1 n(gdp)生成新的序列Ingdp,并對新序列進行平穩(wěn)性檢驗。 Lngdp的相關系數(shù)和偏相關系數(shù)如圖四所示,CorFfDate? 03/24/00

9、 Time: 22:35Sample: 1952 2001Ireluded obseryations: 50AC PAC Q-Stat ProbAutocorrelation Partial Correlaitior2345G1y0 12 317181920212223240.939 0.939.eZB -0 0350.815 -0 0490.749 *0 054O.E03 0410.G15 0550.550 017.439 43.00S.431 -0 0140.373 -.0430.315 0.0390.2e0 0.0310.206 -0 0270.166 -0 0190.110 *0.00

10、60.054 0430.01G -.046-0.022 0.001-0.056 O.OD5-0.006 -0 023-0.119 -.035-0.149 0.0310.176心*0.204 *0 02546 797 80.532125.23156 94 103 38206.23 22452239.30 251. oe 2bO.aQ 256.7G271.31 274 30 276.05 27E.95277.26 277 3G277.32 277.59276.26 275.54 231.61 234.67 206.950.0000.0000.0000.0000.0000.0000.0000.000

11、Q.OOO0.0000 0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.000圖四 對Ingdp用ADF進行單位根檢驗的結果如圖五Augmented Dickey-Fuller Unit ftaat Tesl on LNGDP-35713-2.92262.5990ADF Test Statistic 1.2510231% Critical Value*5% Critical Value10% Critical Value*MacKinnori critical vaibes for rejeciion of hy

12、pothesis of a unit root.圖五這里Ingdp的ADF變成了,依然大于三種不同檢驗水平下的臨界值。從中可以看出,對GDP序列進行對數(shù)處理后,序列Ingdp序列依然不平穩(wěn)。需要再對Ingdp序列進行差分處理。在eviews中輸入genr dingdp=d(lngdp)生成新序列dingdp。并對dingdp進行平穩(wěn)性分析。其自 相關系數(shù)和偏自相關系數(shù)如圖六所示CorrelDte: 0224/08 Time; 23:04Sample, W52 2001Included ahservations: 49Autocorrelation Partial Correlaticn11I

13、a11 1 »1 l11=11 111 口111:1;口 Q1:111 '1(t11« n1>11111:PAjCProb1D.57B0.57617 2730.00020.183*0.22219.066.0003 -0.049-0.07319.1950 0004D.D030.17319 1950 001.加a0.21321 e田 0010.316o.oes27.449.0000.2900.0£432.4610 0000.034-0.11932 B030 000D.C050.1D132 890.000IDD.C340.04033.963.000110.

14、018-0.17532.9840.00112 -0.C21-ojse33.0130.001130.020OJ46310420.002140.0190.06933.0670 003150.C370.01533.1650 00416 -0 C35-0.22333 7140.00517 0.1470.01935.394.00618 -0.177-0.00537.915 00419 -0.117-0.01039.0430 00420 -0 C9B021539 0410.005圖六其ADF檢驗如圖六IAijginetited Diekey-FiiIler Unit Rodt T&st on DL

15、NGDPADF Test Statistic *3.0633911% Critical Value*5% Critical Value10% Critical Value 通過計算能夠描述序列特征的一些統(tǒng)計量(如自相關系數(shù)或非自相關系數(shù)),來確定ARMA模型的結束P和q,并初始計算時選擇盡可能少的參數(shù)。從dingdp序列的自相關系數(shù)和偏自相關系數(shù)圖中可以看出,該序列可以用ARMA模型來表示,且由于自相關系數(shù)與偏自相關系數(shù)都是一階截尾的,故取P=1,q=1,采用ARIMA( 1,1)模型。eviews第三步,估計模型的未知參數(shù),并檢驗參數(shù)的顯著性,以及模型本身的合理性。在中輸入is dingdp

16、 c AR(1) MA(1)得到結構如圖七所示Dependent Variable: DLMGDPMethod: Least SquaresMt老股也憂 Time; 23-.ASarTiple(adjiJ$bd): 1954 2006Included otiservalions: 53 after adjusting endpointsCarvertnce achieved after 41 heraitionsBackcasl: 1953Va riableCoefficientStd. Error t-SlatiticProib.C0.102604O.D2O23e5.077943O.DDOO

17、AR(1)0.3502530.2114321.69U130.0954MA1)0.3236530.2253711.437023CM 569R-squared0.358230Mean dependent 憾r0.1D4488lAdjueted R-squared0.332650S D depGrdent var0.0874&6£ E of regression0.071457Akaike info criterion-2.384510Ejiti squared res id. 265303Schwarz criterion-2 272934Log likelihood66.109

18、52F- statislic13.95476Durbin-Watsoin stat1.067674Prob(F-sf atislic)0.000015Inverted AR Roat&JEInverted MA Roots*32圖七從圖中可以看出,估計出的方程模型C值,AR(1)值的可信度較高,而MA(1)的估計值可信度相對低一些??傮w方程具有很高的可信度。對模型進行殘差序列分析得到如圖八所示Corrtbrotn of REEIDDala. O2/25A0 Time: 10 49Sample; 1 £522000InduJec otsewiiore; 53Autccorrsl

19、sijonPartial CrrbtionAC PACProb11 1I '1 nia?T n.Q27 n ings 11111 12 n IB? OOM n 2m RFH1匚1'匚13 -0.2Q1 -0.205 2.6062 匚MfS11114 -0J13 -0.D04 2.6t52 匚一旳卻1I 13 >5 0.355 0 117 3.D525 C.BS213 >1 >El 0.11G 0.073 3.8396 C.B521 > i7 0.195 0.163 G.3CME C.5CS1111S' 0二迪 0.020 G.307 C.E131

20、 i1119 -O.:I41 -0.034 G.4tGC O.EeG1j 1口'lU U.113 0.1% 7農(nóng)囲b 上i1 111 11 1 unn D.a33 7 4101 7fc41 1112 -0 032 0.12S 7 4912 C S;41j 1k:113 0.394 0.139 0.1204 Q.S;5111114 -0.321 -C.O39 0.16OE 0加13 11I 115 0.125 0.D62 9.3590 O.OS-匚1匚11G -0.132 -0.11G 10.731 Q.SZG111 117 0.330 -C.oei 10.302 CuSE?1 C1&#

21、187; 1rs' -o.iie -CLOGS iuip c.sei11k119 -0.313 -0.Q3G 11.934 C.GES111JU U.JiS -0.Q23 12.1 椚 L.yil111 121 -UIO4J 41.10b 12.30/ U y3111 1*1 >22 0.040 0.049 12.4579"123 -O.TO -0.020 12.937 匚9幻'd »匸124 *0.1DI -0.131 13.9(53 匚9跖圖八Q值的概率。因 模型均值及自相關系最右側(cè)Probe列中的數(shù)字表示相應自由度條件下卡方統(tǒng)計量取值大于相應 為這一列概率值都大于,說明模型的隨機誤差序列是一個白噪聲序列。1年的數(shù)據(jù)),得到趨勢圖.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論