房地產(chǎn)價(jià)格指數(shù)的R語(yǔ)言_第1頁(yè)
房地產(chǎn)價(jià)格指數(shù)的R語(yǔ)言_第2頁(yè)
房地產(chǎn)價(jià)格指數(shù)的R語(yǔ)言_第3頁(yè)
房地產(chǎn)價(jià)格指數(shù)的R語(yǔ)言_第4頁(yè)
房地產(chǎn)價(jià)格指數(shù)的R語(yǔ)言_第5頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

..XX理工大學(xué)課程考核論文課程名稱(chēng):應(yīng)用時(shí)間序列分析論文題目:房地產(chǎn)銷(xiāo)售價(jià)格指數(shù)的時(shí)間序列分析指導(dǎo)謝建春__張春雷學(xué)號(hào):成績(jī):任課教師評(píng)語(yǔ):簽名:年月日前言近十年來(lái),國(guó)內(nèi)的房地產(chǎn)業(yè)發(fā)展迅速,開(kāi)發(fā)的面積和規(guī)模也越來(lái)越大。大多數(shù)國(guó)人對(duì)房地產(chǎn)這個(gè)話(huà)題的熱情是經(jīng)久不衰,房地產(chǎn)業(yè)內(nèi)任何重大的政策和舉措都對(duì)普通老百姓的生活產(chǎn)生深刻的影響。本文選擇的比較對(duì)象是一篇關(guān)于1998年初-20XX底的房地產(chǎn)銷(xiāo)售價(jià)格指數(shù)的時(shí)間序列論文。原作者使用的是SAS軟件,而我將使用R語(yǔ)言軟件對(duì)數(shù)據(jù)進(jìn)行觀察研究并預(yù)測(cè)其走勢(shì)。通過(guò)兩者的過(guò)程及結(jié)果,比較其優(yōu)劣。目錄時(shí)間序列概述……………………41、概念………………………42、定義………………………43、主要分析方法……………44、研究意義…………………4二、時(shí)間序列的預(yù)處理………………51、平穩(wěn)性……………………52、純隨機(jī)性…………………5三、時(shí)間序列分析的主要方法及模型………………61、平穩(wěn)時(shí)間序列分析的模型………………62、非平穩(wěn)序列分析…………63、非平穩(wěn)序列的模型………7四、實(shí)例分析…………91、平穩(wěn)性檢驗(yàn)………………92、擬合及殘差白噪聲檢驗(yàn)………………113、預(yù)測(cè)效果及比對(duì)………13完整的程序…………16參考文獻(xiàn)……………16一、時(shí)間序列概述概念所謂時(shí)間序列就是按照時(shí)間的順序記錄的一列有序數(shù)據(jù)。對(duì)時(shí)間序列進(jìn)行觀察、研究,找尋它變化發(fā)展的規(guī)律,預(yù)測(cè)它將來(lái)的走勢(shì)就是時(shí)間序列分析時(shí)間序列分析有著非常廣泛的應(yīng)用領(lǐng)域。定義在統(tǒng)計(jì)研究中,常用按時(shí)間序列排列的一組隨機(jī)變量…,,…來(lái)表示一個(gè)隨機(jī)事件的時(shí)間序列,簡(jiǎn)記為或。主要分析方法時(shí)間序列分析方法主要有描述性時(shí)序分析和統(tǒng)計(jì)時(shí)序分析。描述性時(shí)序分析主要通過(guò)直觀數(shù)據(jù)比較或繪圖測(cè)繪,統(tǒng)計(jì)時(shí)序分析主要有頻域分析方法以及時(shí)域分析方法。常用的是時(shí)域分析法,時(shí)域分析法的基本思想是源于事件的發(fā)展通常具有一定的慣性,這種慣性用統(tǒng)計(jì)語(yǔ)言來(lái)描述就是序列值之間存在一定的相關(guān)關(guān)系,而這種關(guān)系具有某種統(tǒng)計(jì)規(guī)律。我們分析的重點(diǎn)就是找尋這種規(guī)律,選取合適的數(shù)學(xué)模型擬合,進(jìn)而預(yù)測(cè)該事件發(fā)展走向。研究意義事件序列分析具有現(xiàn)實(shí)意義,在金融經(jīng)濟(jì)、氣象水文、信號(hào)處理、機(jī)械振動(dòng)等眾多領(lǐng)域具有廣泛的應(yīng)用。二、時(shí)間序列的預(yù)處理通常得到一個(gè)觀察值序列后首先要對(duì)其進(jìn)行平穩(wěn)性以及純隨機(jī)性進(jìn)行檢驗(yàn)。根據(jù)檢驗(yàn)結(jié)果的不同我們有不同的處理方法。平穩(wěn)性時(shí)間序列的平穩(wěn)性分為嚴(yán)平穩(wěn)與寬平穩(wěn)<1>嚴(yán)平穩(wěn)定義設(shè)一時(shí)間序列。對(duì)任意整數(shù),任取,對(duì)任意整數(shù),有,則稱(chēng)序列為嚴(yán)穩(wěn)序列。其中為分布函數(shù)。<2>寬平穩(wěn)定義如果滿(mǎn)足:①任取,有;②任取,有,為常數(shù);③任取,且,有;則稱(chēng)為寬平穩(wěn)序列。其中表示與的自相關(guān)系數(shù)。<3>平穩(wěn)性的檢驗(yàn)平穩(wěn)性檢驗(yàn)主要有時(shí)序圖檢驗(yàn)以及自相關(guān)圖檢驗(yàn)。純隨機(jī)性純隨機(jī)性定義如果時(shí)間序列滿(mǎn)足以下性質(zhì):任取,有,為常數(shù);任取,有則稱(chēng)序列為純隨機(jī)序列,也稱(chēng)為白噪聲<whitenoise>序列。純隨機(jī)性檢驗(yàn)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量,主要是Q統(tǒng)計(jì)量以及LB統(tǒng)計(jì)量。三、時(shí)間序列分析的主要方法及模型平穩(wěn)時(shí)間序列分析的模型AR模型<autoregressionmodel>具有如下結(jié)構(gòu)的模型稱(chēng)為p階自回歸模型,記為AR<p>:MA模型<movingaverage>具有如下結(jié)構(gòu)的模型稱(chēng)為q階移動(dòng)平均模型,記為MA<q>:<3>ARMA模型<autoregressionmovingaverage>具有如下結(jié)構(gòu)的模型稱(chēng)為自回歸移動(dòng)平均模型,記為ARMA<p,q>:若,該模型稱(chēng)為中心化ARMA<p,q>模型。非平穩(wěn)序列分析事實(shí)上在自然界中絕大部分序列都是非平穩(wěn)的,因而對(duì)非平穩(wěn)序列的分析更普遍更重要。對(duì)非平穩(wěn)時(shí)間序列的分析法通常分為確定性時(shí)序分析和隨機(jī)時(shí)序分析。這里簡(jiǎn)要介紹常用確定性時(shí)序分析方法。趨勢(shì)分析有些時(shí)間序列具有非常顯著的趨勢(shì),我們分析的目的就是要找到序列中的這種趨勢(shì),并利用這種趨勢(shì)對(duì)序列對(duì)序列的發(fā)展做出合理的預(yù)測(cè)。季節(jié)效應(yīng)分析在日常生活中我們可以看到許多有季節(jié)效應(yīng)的時(shí)間序列,如四季氣溫等等。凡是呈現(xiàn)出固定的周期性變化的時(shí)間,我們都稱(chēng)其有季節(jié)效應(yīng)。綜合分析既有趨勢(shì)起伏變動(dòng)又有季節(jié)效應(yīng)的復(fù)雜序列的分析方法,常用模型有:加法模型乘積模型混合模型a.b.式中,代表序列的長(zhǎng)期趨勢(shì)波動(dòng);代表序列的季節(jié)性〔周期性變化;代表隨機(jī)波動(dòng)。非平穩(wěn)序列的模型事實(shí)上,許多非平穩(wěn)序列差分后會(huì)顯示出平穩(wěn)序列的性質(zhì),稱(chēng)之為差分平穩(wěn)序列。對(duì)差分平穩(wěn)序列可以用ARIMA模型擬合。具有如下結(jié)構(gòu)的模型稱(chēng)為求和自回歸移動(dòng)平均<autoregressiveintegratedmovingaverage>模型,簡(jiǎn)記為ARIMA<p,d,q>模型:式中:;,為平穩(wěn)可逆ARMA<p,q>模型的自回歸系數(shù)多項(xiàng)式;,為平穩(wěn)可逆ARMA<p,q>模型的移動(dòng)平滑系數(shù)多項(xiàng)式;{}為零均值白噪聲序列。由上式可知ARIMA模型的實(shí)質(zhì)就是差分運(yùn)算與ARMA模型的組合。當(dāng)序列具有非常顯著的確定性趨勢(shì)或季節(jié)效應(yīng)時(shí),人們會(huì)懷念確定性因素分解方法對(duì)各種確定性效應(yīng)的解釋,但又因?yàn)樗鼘?duì)殘差信息的浪費(fèi)而不敢輕易使用。為了解決這個(gè)問(wèn)題人們構(gòu)造了殘差自回歸<auto-regressive>模型。Auto-Regressive模型的構(gòu)造思想是首先通過(guò)確定性因素分解方法提取序列中主要的確定性信息:;式中,為趨勢(shì)效應(yīng)擬合,為季節(jié)效應(yīng)擬合??紤]到因素分解方法對(duì)確定性信息的提取可能不夠充分,因而需要進(jìn)一步檢驗(yàn)殘差序列的相關(guān)性。如果檢驗(yàn)結(jié)果顯示殘差序列自相關(guān)性不顯著,說(shuō)明確定性回歸模型對(duì)信息提取比較充分,可以停止分析。如果檢驗(yàn)結(jié)果顯示殘差序列自相關(guān)性顯著,這時(shí)可以考慮對(duì)殘差擬合自回歸模型,進(jìn)一步提取相關(guān)信息:這樣構(gòu)造的模型:稱(chēng)為殘差自回歸模型。四、實(shí)例數(shù)據(jù)為1998年3月-20XX12月的房地產(chǎn)銷(xiāo)售價(jià)格指數(shù)。在實(shí)例分析過(guò)程中,我會(huì)加入原論文的結(jié)果〔用紅色字體顯示,與之進(jìn)行比較分析。1、平穩(wěn)性檢驗(yàn)首先我們要判斷序列是否平穩(wěn),主要通過(guò)時(shí)序圖和單位根兩個(gè)方法進(jìn)行驗(yàn)證。如果不平穩(wěn),就進(jìn)行差分運(yùn)算,直至結(jié)果平穩(wěn)。原數(shù)據(jù)的時(shí)序圖、自相關(guān)圖、偏自相關(guān)圖〔如下:圖1原數(shù)據(jù)的時(shí)序圖、自相關(guān)圖、偏自相關(guān)圖通過(guò)觀察時(shí)序圖,序列有遞增趨勢(shì),所以我們基本可以判斷該序列非平穩(wěn)。原論文對(duì)序列的平穩(wěn)性檢驗(yàn)如下:兩者結(jié)論一致,因此做出差分的決定。差分后的序列圖如下:圖2一階差分后的時(shí)序圖、自相關(guān)圖、偏自相關(guān)圖直觀判別:通過(guò)觀察一階差分后的時(shí)序圖,可以初步判斷已經(jīng)平穩(wěn),而且數(shù)值在-4到4之間,比較對(duì)稱(chēng)。理論判別:使用單位根檢驗(yàn)對(duì)一階差分后的的序列進(jìn)行驗(yàn)證。結(jié)果如下:AugmentedDickey-FullerTestdata:dDickey-Fuller=-4.8375,Lagorder=3,p-value=0.01alternativehypothesis:stationaryWarningmessage:Inadf.test<d>:p-valuesmallerthanprintedp-value從上可以看出,p值等于0.01,遠(yuǎn)遠(yuǎn)小于0.05,因此拒絕原假設(shè)。因此從序列圖和單位根兩個(gè)方面都可以認(rèn)定一階差分后的序列基本平穩(wěn)。原論文的一階差分結(jié)果如下:時(shí)序圖和自相關(guān)圖顯示序列平穩(wěn)。目前為止,R語(yǔ)言和SAS軟件對(duì)序列的平穩(wěn)性檢驗(yàn)完全一致。2、擬合及殘差白噪聲檢驗(yàn)首先,在前面的過(guò)程中,我們確定了ARIMA模型的d取值為1。接下來(lái),我們考慮樣本的容量,p和q分別取0到3并依次驗(yàn)證,取AIC值最小者。PQAIC01170.1602163.2903165.2810166.6511168.612165.2713163.6520168.4821169.4322151.9723153.6330157.1231155.5332157.5233159.45從上面的表格可以看出,當(dāng)p取2,q取2的時(shí)候,AIC函數(shù)的值最小。利用Box-pierce方法對(duì)殘差進(jìn)行白噪聲檢驗(yàn),結(jié)果如下:圖3殘差的時(shí)序圖Box-Piercetestdata:rX-squared=0.0013,df=1,p-value=0.9715從P值可以看出,遠(yuǎn)遠(yuǎn)大于0.05,因此接受原假設(shè),模型檢驗(yàn)合格。模型最終定為ARIMA〔2,1,2。擬合函數(shù)為:xt=2.263xt-1-2.192xt-2+0.929xt-3+εt-0.0748εt-1-1.9252εt-2+εt-3原論文的擬合結(jié)果為:殘差白噪聲檢驗(yàn)顯示差分后序列蘊(yùn)含著很強(qiáng)的相關(guān)信息,不能視為白噪聲序列。需要進(jìn)一步擬合ARIMA模型,觀察自相關(guān)圖和偏自相關(guān)圖,可初步確定P=3,Q=5觀察擬合效果。擬合效果不佳,部分值的P值過(guò)大,不顯著,去掉結(jié)果不顯著的參數(shù)項(xiàng),考慮疏系數(shù)模型p=<1,3>q=<1,5>。參數(shù)顯著性檢驗(yàn)顯示兩個(gè)參數(shù)均顯著。我將原論文的結(jié)果ARIMA〔3,1,5代入進(jìn)去,發(fā)現(xiàn)AIC值為156.35。殘差檢驗(yàn)P值為0.9583。兩者存在一些差別。3、預(yù)測(cè)及比對(duì)圖4qq圖從qq圖的效果可以看出,二者還是比較吻合的,但是右側(cè)頭部和左側(cè)尾部偏離期望的正態(tài)分布。圖5擬合效果圖黑色是觀測(cè)數(shù)據(jù)圖,紅色是根據(jù)擬合的模型得出的預(yù)測(cè)圖,兩者趨勢(shì)基本吻合,在部分區(qū)域略有偏差。我們可以認(rèn)為,總體上還是能夠反映序列的變化并進(jìn)行適當(dāng)預(yù)測(cè)的。對(duì)未來(lái)五期的預(yù)測(cè)結(jié)果如下:$predTimeSeries:Start=49End=53Frequency=1[1]107.8934109.1713109.2693109.3310109.3356$seTimeSeries:Start=49End=53Frequency=1[1]1.2808792.3561723.4928214.3606195.097315原論文的擬合模型為疏系數(shù)模型p=<1,3>q=<1,5>。擬合及預(yù)測(cè)的結(jié)果如下:擬合效果圖顯示擬合效果良好。R語(yǔ)言結(jié)果原論文結(jié)果107.8934109.8092109.1713111.6537109.2683111.3785109.3310109.9109109.3356108.1931兩個(gè)預(yù)測(cè)結(jié)果進(jìn)行比較,略有差距,其中的原因可能是擬合的問(wèn)題,也可能是軟件的差異。另外我將原模型的ARIMA〔3,1,5運(yùn)行以后,結(jié)果如下:$predTimeSeries:Start=49End=53Frequency=1[1]108.5229108.7080106.3036103.3478101.4853$seTimeSeries:Start=49End=53Frequency=1[1]1.0002761.6288752.3582442.9072993.279682結(jié)果表明,差異更大。完整的程序如下:library<tseries>price<-read.table<'D:\\1.txt'>par<mfrow=c<2,2>>;plot.ts<price>;acf<price>;pacf<price>d=diff<ts<price>>par<mfrow=c<2,2>>;plot.ts<d>;acf<d>;pacf<d>adf.test<d>nihe=arima<price,order=c<2,1,2>,method="ML">niher=nihe$residualsplot.ts<r>Box.test<r>qqnorm<

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論