信息分析與預測時間序列_第1頁
信息分析與預測時間序列_第2頁
信息分析與預測時間序列_第3頁
信息分析與預測時間序列_第4頁
信息分析與預測時間序列_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

信息分析與預測時間序列第1頁,共64頁,2023年,2月20日,星期日時間序列分析法第2頁,共64頁,2023年,2月20日,星期日10概述

所謂時間序列(timeseries),就是具有均勻時間間隔的各種社會、自然現(xiàn)象的數(shù)量指標依時間次序排列起來的統(tǒng)計數(shù)據(jù)。時間序列分析法是通過對歷史數(shù)據(jù)變化的分析,來評價事物的現(xiàn)狀和估計事物的未來變化。這種方法在科學決策、R&D和市場開拓活動中的許多場合有廣泛的應用,如市場行情分析、產(chǎn)品銷售預測等。第3頁,共64頁,2023年,2月20日,星期日10概述

從回歸分析法的角度看,時間序列分析法實際上是一種特殊的回歸分析法,因為此時不再考慮事物之間的因果關系或其他相關關系,而僅考慮研究對象與時間之間的相關關系,即將時間作為自變量來看待。第4頁,共64頁,2023年,2月20日,星期日10概述

為了保證時間序列分析的準確性,時間序列數(shù)據(jù)的編制應該遵循以下一些原則:時間序列中的各項數(shù)據(jù)所代表的時期長短(或間隔時間)應該一致且連續(xù)。時間序列中的各項數(shù)據(jù)所代表的質(zhì)的內(nèi)容應該前后一致。統(tǒng)計指標數(shù)據(jù)的計量單位應該一致。第5頁,共64頁,2023年,2月20日,星期日10概述時間序列數(shù)據(jù)隨時間推移而變動包括四種類型:傾向變動/趨勢變動(trendvariation)即在整個預測內(nèi)研究對象呈現(xiàn)出漸增或漸減的總傾向。周期變動(cyclicalvariation)即以某一時間間隔為周期的周期性變動,如危機和復蘇的交替。季節(jié)變動(seasonalvariation)。即以一年為周期的周期變動,如服裝行業(yè)銷售額的季節(jié)性波動。不規(guī)則變動/隨機變動(irregular/randomvariation)是指除以上三種變動之外的變動。第6頁,共64頁,2023年,2月20日,星期日第7頁,共64頁,2023年,2月20日,星期日10概述

傾向線的擬合方法,實質(zhì)上是一種時間序列回歸分析法,它是通過數(shù)學模型的建立和求解來進行分析的。這種方法的優(yōu)點是精確度比較高。傾向線的逐步修正方法則是與傾向線擬合方法性質(zhì)完全不同的另一種方法。它是通過時間序列數(shù)據(jù)的平滑來進行分析的。所謂“平滑”,就是將原始時間序列數(shù)據(jù)不規(guī)則的,有突變的軌跡大致地修勻,形成平滑的傾向線,以把握事物的發(fā)展趨勢。第8頁,共64頁,2023年,2月20日,星期日10概述

需要說明的是,人們研究的事物往往受到諸多因素的復雜影響,而在傾向變動預測中,我們都只考慮其中的時間因素,即把事物的特征值僅僅作為時間的函數(shù)來表現(xiàn),求出函數(shù)表達式,并在假定這種函數(shù)關系在要預測的期間內(nèi)無結構性突變的情況下,預測其未來值。因此在所研究事物的客觀環(huán)境(條件)發(fā)生突變的情況下,切不可機械地套用時間序列分析方法,而應該對研究對象進行全面的條件和環(huán)境分析,才能得出比較符合事物發(fā)展的客觀預測結果。第9頁,共64頁,2023年,2月20日,星期日10.1多項式曲線法

當進行時間序列分析時,應先將研究對象的動態(tài)數(shù)據(jù)與所對應的時間序列反映到直角坐標系中,得到一散點圖,然后對散點圖進行分析。當可用時間t的k次多項式曲線(multinomialcurve)較好地擬合散點時,我們就可以用時間t的k次多項式來描述時間序列數(shù)據(jù),并據(jù)以推測研究對象的未來狀況。第10頁,共64頁,2023年,2月20日,星期日10.1.1一次曲線(直線)

當時間序列數(shù)據(jù)的散點圖可以用直線擬合時,則可用直線回歸方程來描述研究對象y與時間t的關系,并可據(jù)此預測研究對象的未來情況?;貧w系數(shù)a,b可根據(jù)最小二乘法求得第11頁,共64頁,2023年,2月20日,星期日10.1.1一次曲線

經(jīng)過轉換第12頁,共64頁,2023年,2月20日,星期日10.1.1一次曲線

當時間點為連續(xù)等間隔時,若把原點取在時間序列的中間,即在數(shù)據(jù)項數(shù)為奇數(shù)(N=2n+1)時,取ti的系列為:-n,-(n-1),…,-2,-1,0,1,2,…,(n-1),n在數(shù)據(jù)項數(shù)為偶數(shù)(N=2n)時,取ti的系列為:-(2n-1),-(2n-3),…,-3,-1,1,3,…,(2n-3),(2n-1)第13頁,共64頁,2023年,2月20日,星期日10.1.1一次曲線則在此兩種情況下都有因此有第14頁,共64頁,2023年,2月20日,星期日10.1.1一次曲線例:江蘇省1985年到2002年專利申請量的數(shù)據(jù)如下:第15頁,共64頁,2023年,2月20日,星期日10.1.1一次曲線第16頁,共64頁,2023年,2月20日,星期日第17頁,共64頁,2023年,2月20日,星期日10.1.1一次曲線所以得到直線回歸方程為y=7370.5+593.2t第18頁,共64頁,2023年,2月20日,星期日10.1.1一次曲線

預測2010年專利申請量,對于2010年ti=23,可得預測值為第19頁,共64頁,2023年,2月20日,星期日10.1.1一次曲線

為了衡量所得的回歸方程與實際值的偏離程度,引入不一致系數(shù)u。不一致系數(shù)u值越小,說明所得的擬合曲線(回歸方程)與實際值傾向線的偏差越小,即擬合得越好。第20頁,共64頁,2023年,2月20日,星期日10.1.1一次曲線第21頁,共64頁,2023年,2月20日,星期日10.1.2二次曲線

在時間序列數(shù)據(jù)yi散點圖的傾向線呈二次多項式曲線時,可以用二次多項式去描述它,其一般表達式為:第22頁,共64頁,2023年,2月20日,星期日第23頁,共64頁,2023年,2月20日,星期日10.1.3三次曲線

在時間序列數(shù)據(jù)yi散點圖的傾向線呈三次多項式曲線時,可以用三次多項式去描述它,其一般表達式為:

第24頁,共64頁,2023年,2月20日,星期日10.2.3三次曲線第25頁,共64頁,2023年,2月20日,星期日10.3指數(shù)曲線法

研究對象呈現(xiàn)指數(shù)增長是時間序列數(shù)據(jù)分析中比較常見的一種形式,特別是研究對象在初期發(fā)展階段其時間序列數(shù)據(jù)的傾向線往往呈指數(shù)曲線(exponenialcurve)上升的趨勢。如我國網(wǎng)絡用戶數(shù)量增長曲線就是呈指數(shù)曲線形式。第26頁,共64頁,2023年,2月20日,星期日10.3.1一次指數(shù)曲線法

在時間序列數(shù)據(jù)散點圖的傾向線大致是一次指數(shù)曲線時可用一次指數(shù)曲線去擬合它。第27頁,共64頁,2023年,2月20日,星期日10.3.1一次指數(shù)曲線法一次指數(shù)曲線的一般形式為第28頁,共64頁,2023年,2月20日,星期日10.3.1一次指數(shù)曲線法

兩邊取對數(shù),有第29頁,共64頁,2023年,2月20日,星期日10.3.1一次指數(shù)曲線法

即將指數(shù)曲線化成了直線。下面我們來求回歸系數(shù)a和b。直線式的剩余平方和為第30頁,共64頁,2023年,2月20日,星期日10.3.1一次指數(shù)曲線法根據(jù)微積分的極值原理,有第31頁,共64頁,2023年,2月20日,星期日10.3.1一次指數(shù)曲線法解此聯(lián)立方程,可以得到第32頁,共64頁,2023年,2月20日,星期日10.3.1一次指數(shù)曲線法第33頁,共64頁,2023年,2月20日,星期日10.3.1一次指數(shù)曲線法

由此即可得到a和b。對于時間t的原點設在時間序列中間的情況,有第34頁,共64頁,2023年,2月20日,星期日10.3.1一次指數(shù)曲線法

例:某市1998-2003年的燈具商品銷售量分別為8.7,10.6,13.3,16.5,20.6,26.0萬架,用一次指數(shù)曲線法預測2004年銷售量。第35頁,共64頁,2023年,2月20日,星期日10.3.1一次指數(shù)曲線法第36頁,共64頁,2023年,2月20日,星期日10.3.1一次指數(shù)曲線法根據(jù)表中的數(shù)據(jù),求得所以,指數(shù)曲線回歸方程為

第37頁,共64頁,2023年,2月20日,星期日10.3.1一次指數(shù)曲線法不一致系數(shù)為:第38頁,共64頁,2023年,2月20日,星期日10.3.1一次指數(shù)曲線法當t=7時,可預測2004年的銷售量為32.07萬架。第39頁,共64頁,2023年,2月20日,星期日移動平均法第40頁,共64頁,2023年,2月20日,星期日10.4.1概述

傾向線的逐步修正方法是通過時間序列數(shù)據(jù)平滑來進行分析的。最簡單的平滑方法就是取時間序列數(shù)據(jù)的算術平均值,它能有效地排除隨機變動的影響。例如,時間序列數(shù)據(jù)為,對應于時間t=1,2,…,N,其算術平均值為第41頁,共64頁,2023年,2月20日,星期日10.4.1概述t---------時間下標變量,表示時期序號N--------時間序列的時期個數(shù),也即時間序列數(shù)據(jù)個數(shù)第42頁,共64頁,2023年,2月20日,星期日10.4.1概述

不過,使用算術平均值作為時間序列數(shù)據(jù)平滑的數(shù)學模型和它的預測值,雖然能夠排除隨機變動,但它有著嚴重的缺點;它只能反映時間序列數(shù)據(jù)的一般情況(平均水平),而不能反映出數(shù)據(jù)中的高值和低值,更不能反映時間序列數(shù)據(jù)的演變過程和發(fā)展趨勢,掩蓋了它的可能存在的傾向變動;它對時間序列的近期數(shù)據(jù)和早期數(shù)據(jù)同樣看待,缺乏對當前數(shù)據(jù)變動的適應能力。第43頁,共64頁,2023年,2月20日,星期日10.4.1概述

對算術平均法的改進,最初得到的是一種分段平均法,分段平均法是按時期序號將時間序列數(shù)據(jù)分成都含有n個時期的段,再取各段數(shù)據(jù)平均值。例如,將江蘇省專利申請量18年來的數(shù)據(jù)劃分為各包含6年的3段,分別求出各段平均值。第44頁,共64頁,2023年,2月20日,星期日10.4.1概述

分段平均法能夠反映出研究對象的總的變化趨勢和各時期大致變化幅度,并且通過取平均值可以減弱隨機因素的影響。但是,這樣的分段平均使得數(shù)據(jù)點大為減少,只為原來數(shù)據(jù)點的1/n,使各段平均值呈階梯狀,不能連續(xù)反映變量的變化過程;而且,當時期總數(shù)不為n的整數(shù)倍時不便分段。第45頁,共64頁,2023年,2月20日,星期日10.4.2一次移動平均

對分段平均法改進得到移動平均法(moving-averagemethod),又稱為滑動平均法,移動平均法是利用平均過程所具有的平滑作用,從時間序列數(shù)據(jù)中去除局部的不規(guī)則性,排除隨機影響,從而找出時間序列數(shù)據(jù)變動趨勢的方法。它對時間序列數(shù)據(jù)分段求出算術平均值,但這時的分段平均并不是截然分開的段進行,而是按根據(jù)時期的順序不斷移動得到的段進行,即它的平均值的計算區(qū)段部分的重疊和逐漸移動,因而能夠在一定程度上客觀地描述實際的時間序列數(shù)據(jù)及其變化趨勢。第46頁,共64頁,2023年,2月20日,星期日10.4.2一次移動平均

一次移動平均值的計算公式為

-----為第t時期及其以前(n-1)各時期的數(shù)據(jù)的移動平均值t------時期序號yt------第t時期變量的數(shù)值n------每段跨越的時期個數(shù),即所包含的數(shù)據(jù)個數(shù)第47頁,共64頁,2023年,2月20日,星期日10.4.2一次移動平均

也可以用遞推公式表示:

如果時間序列數(shù)據(jù)很長,n的取值又較大,用遞推公式可以大大減少計算量。同時,當獲得新數(shù)據(jù)時,無需像回歸分析那樣重新估算方程,而可以根據(jù)先期計算出來的移動平均值,很容易求出新的移動平均值。第48頁,共64頁,2023年,2月20日,星期日1985-2002年江蘇省專利申請量移動平均法預測數(shù)據(jù)表第49頁,共64頁,2023年,2月20日,星期日10.4.2一次移動平均

合理地選擇每段時期個數(shù)n是用好移動平均法的關鍵。在n取較大值時,移動平均值對于隨機影響的敏感性弱些,平滑作用強,但適應新數(shù)據(jù)水平的時間要長些,容易落后于可能的發(fā)展趨勢;而當n取較小值時,移動平均值對于隨機影響的敏感性較強,平滑作用差,適應數(shù)據(jù)新水平的時間短,因而容易對隨機干擾反映過度靈敏而造成錯覺。一般可以根據(jù)實際時間序列數(shù)據(jù)的特征和經(jīng)驗選擇參數(shù)n。第50頁,共64頁,2023年,2月20日,星期日10.4.2一次移動平均第51頁,共64頁,2023年,2月20日,星期日10.4.3二次移動平均

----為第t時期的一次移動平均值-----為第t時期的二次移動平均值第52頁,共64頁,2023年,2月20日,星期日第53頁,共64頁,2023年,2月20日,星期日10.4.3二次移動平均一次移動平均只適用于平滑時間序列數(shù)據(jù),而不適用于有線性變動趨勢的時間序列數(shù)據(jù)預測。這是因為一次移動平均值是每時間段的平均值,當為線性增長趨勢時,必然小于值;反之,當為線性下降趨勢時,必然大于值。

第54頁,共64頁,2023年,2月20日,星期日10.4.3二次移動平均

同理,二次移動平均是在一次移動平均值的基礎上進行的,二次移動平均也與一次移動平均數(shù)序列存在滯后偏差。因此和只能用于簡易預測。為了改善預測效果,我們可以利用和求出平滑系數(shù),建立線性移動平均模型進行預測。第55頁,共64頁,2023年,2月20日,星期日10.4.3二次移動平均

線性移動平均模型的一般形式為:t---時期的序號l---由當前時期t到需要預測的時期之間的時期個數(shù)yt+l---第(t+l)時期的預測值;bt----斜率,即單位時期的變化量at----截距,即當前時期t的數(shù)據(jù)水平,at=yt第56頁,共64頁,2023年,2月20日,星期日10.4.3二次移動平均

對于線性時間序列數(shù)據(jù),每一時期的增量總是相同的,即在一次移動平均中有一次移動平均值比原時間序列數(shù)據(jù)滯后(n-1)/2個時

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論