營銷數(shù)據(jù)分析-案例 第4章基于 ARIMA 模型的產(chǎn)品生命周期預測案例_第1頁
營銷數(shù)據(jù)分析-案例 第4章基于 ARIMA 模型的產(chǎn)品生命周期預測案例_第2頁
營銷數(shù)據(jù)分析-案例 第4章基于 ARIMA 模型的產(chǎn)品生命周期預測案例_第3頁
營銷數(shù)據(jù)分析-案例 第4章基于 ARIMA 模型的產(chǎn)品生命周期預測案例_第4頁
營銷數(shù)據(jù)分析-案例 第4章基于 ARIMA 模型的產(chǎn)品生命周期預測案例_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第4章基于ARIMA模型的產(chǎn)品生命周期預測案例基于ARIMA模型的空氣質(zhì)量AQI時間序列分析背景:隨著全球氣候的變暖,空氣質(zhì)量每天發(fā)生變化,而人們的生活質(zhì)量和空氣質(zhì)量息息相關。如下表1所示,空氣質(zhì)量和空氣的成分有很大的關系,為此文中選擇某城市一年內(nèi)的空氣指數(shù)數(shù)據(jù)進行分析。數(shù)據(jù)基本描述對數(shù)據(jù)進行基本統(tǒng)計,得到時序數(shù)值共365個,AQI的基本數(shù)值情況如下表1所示,通過查詢空氣質(zhì)量指數(shù)得到AQI空氣質(zhì)量指數(shù)取值范圍及其相應內(nèi)別,如下表2所示:由表1中最大AQI數(shù)值為299,得知空氣質(zhì)量最大為重度污染。中位數(shù)值為97,屬于空氣質(zhì)量良好,平均空氣質(zhì)量為107,屬于輕度污染,故初步看該城市空氣質(zhì)量效果較好。而不同時間段下的空氣質(zhì)量也可能不同,為此根據(jù)中國的季度時間劃分:春季,為3,4,5月;夏季,為6,7,8月;秋季,為9,10,11月;冬季,為12,1,2月。對時間數(shù)據(jù)進行劃分,得到不同季節(jié)的空氣質(zhì)量變化如下圖所示:從箱線圖可以看出,AQI指數(shù)在200以上的主要集中在冬季和春季,整體空氣質(zhì)量指數(shù)值集中在200以下,極個別異常AQI數(shù)值超出200以上,初步可說明該城市的空氣質(zhì)量整體情況較好。為進一步探究對空氣質(zhì)量指數(shù)和時間的變化,故建立時間序列ARMA模型。ARMA模型2.1ARMA模型概述ARMA模全稱為自回歸移動平均模型(Auto-regressiveMovingAverageModel,簡稱ARMA)是研究時間序列的重要方法。其在時序數(shù)據(jù)分析過程中既考慮了數(shù)據(jù)在時間序列上的依存性,又考慮了隨機波動的干擾性,對對應時序的發(fā)生變量運行短期趨勢的預測準確率較高,是近年應用比較廣泛的方法之一。ARMA模型是由美國統(tǒng)計學家G.E.P.Box和G.M.Jenkins在20世紀70年代提出的著名時序分析模型,即自回歸移動平均模型。ARMA模型有自回歸模型AR(q)、移動平均模型MR(q)、自回歸移動平均模型ARMA(p,q)3種基本類型。其中ARMA(p,q)自回歸移動平均模型,模型可表示為:其中,為自回歸模型的階數(shù),為移動平均模型的介數(shù);表示時間序列在時刻的值;為自回歸系數(shù);表示移動平均系數(shù);表示時間序列在時期的誤差或偏差。2.2ARMA模型建模流程首先用ARMA模型預測要求序列必須是平穩(wěn)的,也就是說,在研究的時間范圍內(nèi)研究對象受到的影響因素必須基本相同。若所給的序列并非穩(wěn)定序列,則必須對所給的序列做預處理,使其平穩(wěn)化,然后用ARMA模型建模。建模的基本步驟如下:(1)求出該觀察值序列的樣本自相關系數(shù)(ACF)和樣本偏相關(PACF)的值。(2)根據(jù)樣本自相關系數(shù)和偏自相關系數(shù)的性質(zhì)選擇適當?shù)哪P瓦M行擬合。(3)估計模型中未知參數(shù)的值。(4)檢驗模型的有效性。如果擬合模型通不過檢驗,轉向步驟(2),重新選擇模型再擬合。(5)模型優(yōu)化。如果擬合模型通過檢驗,仍然轉向步驟(2),充分考慮各種可能,建立多個擬合模型,從所有通過檢驗的擬合模型中選擇最優(yōu)模型。(6)利用擬合模型,預測序列的將來走勢。3.AQI時間序列模型的建立3.1數(shù)據(jù)的預處理本文選取了1年AQI數(shù)據(jù)作為時間序列觀察值。對此時間序列做時序圖如圖1所示:在發(fā)現(xiàn)經(jīng)AQI數(shù)據(jù)的序列具有波動性,而我們的目的主要是利用ARMA模型對其周期成分進行分析,因此需要對此類的數(shù)據(jù)先進行消除趨勢性的處理,然后從圖(1)可以觀察得出,序列大致趨于平穩(wěn)。為了進一步檢驗序列是否真正平穩(wěn),在此使用R語言統(tǒng)計軟件對已轉換進行平穩(wěn)性檢驗。對時間序列的平穩(wěn)性有兩種檢驗方法,一種是根據(jù)時序圖和自相關圖顯示的特征作出判斷的圖檢驗方法;一種是構造檢驗統(tǒng)計量進行假設檢驗的方法。目前最常用的平穩(wěn)性統(tǒng)計檢驗方法是單位根檢驗(unitroottest)。使用單位根檢驗法對變換數(shù)據(jù)進行檢驗得出檢驗結果如表1所示:由時間序列的時序圖可以發(fā)現(xiàn)AQI隨時間的增長是呈上下波動趨勢。因此,對原始序列不需作對數(shù)變換和差分,直接對數(shù)據(jù)進行檢驗即可。并作出單位根檢驗如下表1所示:表1AQI數(shù)據(jù)單位根檢驗3.2模型的識別與選擇計算出樣本自相關系數(shù)和偏相關系數(shù)的值之后,我們主要是根據(jù)它們表現(xiàn)出來的性質(zhì),選擇適當?shù)腁RMA模型擬合觀察值序列。這個過程實際上就是要根據(jù)樣本自相關系數(shù)和偏相關系數(shù)的性質(zhì)估計自相關階數(shù)和移動平均階數(shù),因此模型的識別過程也成為定階過程。一般ARMA模型定階的基本原則如表2示:表2ARMA(p,q)模型選擇原則ACFPACF模型定階拖尾p階截尾AR§模型q階截尾拖尾MA(q)模型拖尾拖尾ARMA(p,q)模型對AQI數(shù)據(jù)進行分析,可得樣本自相關系數(shù)和偏相關系數(shù)圖如圖2所示:圖2序列自相關系數(shù)與偏相關系數(shù)圖

由上圖可以看出AQI序列拖尾不明顯,為此分別對時序值數(shù)據(jù)進行一階差分和取對數(shù)觀察數(shù)據(jù)的正態(tài)性檢驗如下圖所示:通過對AQI序列進行處理后,發(fā)現(xiàn)對AQI數(shù)值進行取對數(shù)后,數(shù)據(jù)趨勢刻畫成一條直線較為明顯。故AR模型的數(shù)據(jù)可選擇對AQI數(shù)據(jù)取對數(shù)后建立自回歸模型。模型序號對應模型no-zeromean1ARIMA(2,0,2)226.05052ARIMA(0,0,0)291.45643ARIMA(1,0,0)282.75974ARIMA(0,0,1)270.9726ARIMA(1,0,2)225.5003自相關系數(shù)和偏相關系數(shù)圖的分析觀察,可以知道模型大致可選取兩種模型。第一種,自相關系數(shù)為拖尾,而偏相關系數(shù)為一階截尾。此時選取模型可以為ARIMA(1,0,0)模型。第二種,自相關二階截尾,而偏相關系數(shù)為一階截尾。此時選取模型可以為ARIMA(1,0,2)模型。3.3參數(shù)估計選擇擬合好后的模型之后,下一步就是要利用序列的觀察值確定該模型的口徑,即估計模型中未知參數(shù)的值。對于一個非中心化ARMA(p,q)模型,有式中,~該模型共含個未知參數(shù):。對于未知參數(shù)的估計方法有三種:矩估計﹑極大似然估計和最小二乘估計。其中使用最小二乘估計法對序列進行參數(shù)估計。在ARMA(p,q)模型場合,記殘差項為:~殘差平方和為:~是殘差平方和達到最小的那組參數(shù)值即為的最小估計值。使用程序操作可得序列參數(shù)估計最佳值如下:AIC=214.87AICc=214.98BIC=230.463.4參數(shù)的顯著性檢驗參數(shù)的顯著性檢驗就是要檢驗每一個未知參數(shù)是否顯著非零。這個檢驗的目的是為了是使模型最精簡。如果某個參數(shù)不顯著,即表示該參數(shù)所對應的那個自變量對因變量的影響不明顯,該自變量就可以從擬合模型中刪除。最終模型將由一系列參數(shù)顯著非零的自變量表示。由模型參數(shù)估計與檢驗結果,可以觀察到t統(tǒng)計量值的值均小于0.05。表明模型參數(shù)顯著。4.結論時間序列分析的ARMA模型預測問題,實質(zhì)上是通過對時間變化過程的分析研究,找出其發(fā)展變化的量變規(guī)律性,用以預測未來的空氣質(zhì)量。預測時不必考慮其他因素的影響,僅從序列自身出發(fā),建立相應的模型進行預測,這就從根本上避免了尋找主要因素及識別主要因素和次要因素的困難;和回歸分析相比,可以避免了尋找因果模型中對隨機擾動項的限定條件在經(jīng)濟實踐中難以滿足的矛盾。實際上這也是ARMA模型預測與其他預測方法相比的優(yōu)越性所在。但由于空氣質(zhì)量受到人為、工業(yè)等不確定性因素影響,僅只能通過部分數(shù)據(jù)進行分析,分析具有一定的局限性。本文運用時間序列的分析方法,對空氣質(zhì)量進行分析。將ARIMA(1,0,0)模型對該序列進行擬合,最終得出空氣質(zhì)量的變化規(guī)律,總體而言空氣質(zhì)量較好。數(shù)據(jù)加載與準備install.packages("tseries")install.packages("forecast")install.packages("decompose")library(tseries)library(forecast)data<-read.csv("time.csv")str(data)描述統(tǒng)計分析summary(data$AQI)#查看數(shù)據(jù)趨勢boxplot(AQI~season,data,col=c(1,2,3,4),border=c("darkgray","purple"),ylab="AQI指數(shù)")tsdisplay(data$AQI)#得到acf和pacfr<-diff(log(data$AQI))#取對數(shù)后差分tsdisplay(r)正態(tài)性檢驗par(mfrow=c(2,2))qqnorm(data$AQI,ylab="原始AQI數(shù)值")qqnorm(r,ylab="取對數(shù)后的AQI數(shù)值")qqnorm(data_d1,ylab="一階差分AQI數(shù)值")acf/pacf檢驗和單位根檢驗Box.test(data$AQI,lag=52,type="Ljung-Box")#數(shù)據(jù)白噪聲檢驗,通過Box-Ljung檢驗,則說明時間序列模型可以用來對數(shù)據(jù)進行預測par(mfrow=c(2,1))acf(data$AQI)acf(r)pacf(data$

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論