




已閱讀5頁,還剩227頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
中南大學數學科學與計算技術學院,統(tǒng)計預測方法及預測模型,第十章統(tǒng)計預測方法及預測模型,10.1統(tǒng)計預測的基本問題,10.1.2統(tǒng)計預測方法的分類及其選擇,10.1.3統(tǒng)計預測的原則和步驟,10.1.1統(tǒng)計預測的概念和作用,10.1.1統(tǒng)計預測的概念和作用,(一)統(tǒng)計預測的概念概念:預測就是根據過去和現在估計未來,預測未來。統(tǒng)計預測屬于預測方法研究范疇,即如何利用科學的統(tǒng)計方法對事物的未來發(fā)展進行定量推測.例1下表是我國1952年到1983年社會商品零售總額(按當年價格計算),分析預測我國社會商品零售總額。,實際資料是預測的依據;理論是預測的基礎;數學模型是預測的手段。,統(tǒng)計預測的三個要素:,統(tǒng)計預測方法是一種具有通用性的方法。,(二)統(tǒng)計預測的作用,在市場經濟條件下,預測的作用是通過各個企業(yè)或行業(yè)內部的行動計劃和決策來實現的;統(tǒng)計預測作用的大小取決于預測結果所產生的效益的多少。,影響預測作用大小的因素主要有:,預測費用的高低;預測方法的難易程度;預測結果的精確程度。,10.1.2統(tǒng)計預測方法的分類和選擇,統(tǒng)計預測方法可歸納分為定性預測方法和定量預測方法兩類,其中定量預測法又可大致分為趨勢外推預測法、時間序列預測法和回歸預測法,;按預測時間長短分為近期預測、短期預測、中期預測和長期預測;按預測是否重復分為一次性預測和反復預測。,(一)統(tǒng)計預測方法的分類,(三)定量預測,定量預測的概念:定量預測也稱統(tǒng)計預測,它是根據已掌握的比較完備的歷史統(tǒng)計數據,運用一定的數學方法進行科學的加工整理,借以揭示有關變量之間的規(guī)律性聯(lián)系,用于預測和推測未來發(fā)展變化情況的一類預測方法,(二)統(tǒng)計預測方法的選擇,在統(tǒng)計預測中的定量預測要使用模型外推法,使用這種方法有以下兩條重要的原則:連貫原則,是指事物的發(fā)展是按一定規(guī)律進行的,在其發(fā)展過程中,這種規(guī)律貫徹始終,不應受到破壞,它的未來發(fā)展與其過去和現在的發(fā)展沒有什么根本的不同;類推原則,是指事物必須有某種結構,其升降起伏變動不是雜亂無章的,而是有章可循的。事物變動的這種結構性可用數學方法加以模擬,根據所測定的模型,類比現在,預測未來。,10.1.3統(tǒng)計預測的原則和步驟,(一)統(tǒng)計預測的原則,(二)統(tǒng)計預測的步驟,10.2趨勢外推法,10.2.1趨勢外推法概述10.2.2多項式曲線趨勢外推法10.2.3指數曲線趨勢外推法10.2.4生長曲線趨勢外推法10.2.5曲線擬合優(yōu)度分析,.,16,趨勢外推法的基本思想,某些客觀事物的發(fā)展變化相對于時間推移,常表現出一定的規(guī)律性:如:經濟現象(指標)隨著時間的推移呈現某種上升或下降趨勢,這時,若作為預測對象的該經濟現象(指標)變化又沒有明顯的季節(jié)性波動跡象,理論上就可以找到一條合適的函數曲線反映其變化趨勢。可建其變化趨勢模型(曲線方程):當有理由相信這種趨勢可能會延伸到未來時,對于未來時點的某個值(經濟指標未來值)就可由上述變化趨勢模型(直線方程)給出。這就是趨勢外推的基本思想。趨勢外推的條件有:變化趨勢的時間穩(wěn)定性、曲線方程存在。,.,17,.,18,某商場某種商品過去9個月的銷量數據,某商場過去9年市場需求量統(tǒng)計數據,10.2.1趨勢外推法概述,一、趨勢外推法概念和假定條件趨勢外推法概念:當預測對象依時間變化呈現某種上升或下降趨勢,沒有明顯的季節(jié)波動,且能找到一個合適的函數曲線反映這種變化趨勢時,就可以用趨勢外推法進行預測。運用趨勢外推法進行預測是基于兩個基本假設:一是決定過去預測對象發(fā)展的因素,在很大程度上仍將決定其未來的發(fā)展;二是預測對象發(fā)展過程一般是漸進變化,而不是跳躍式變化。趨勢外推法的突出特點是選用一定的數學模型來擬合預測變量的變動趨勢,并進而用模型進行預測。,二、趨勢外推法經常選用的數學模型根據預測變量變動趨勢是否為線性,又分為線性趨勢外推法和曲線趨勢外推法。(一)線性模型(二)曲線模型1.多項式曲線模型2.簡單指數曲線模型3.修正指數曲線模型4.生長曲線模型(龔珀資曲線模型)一般形式:,.,21,(一)直線趨勢外推法,適用條件:時間序列數據(觀察值)呈直線上升或下降的情形。該預測變量的長期趨勢可以用關于時間的直線描述,通過該直線趨勢的向外延伸(外推),估計其預測值。兩種處理方式:擬合直線方程與加權擬合直線方程,.,22,?,?,.,23,?,A擬合直線方程法,使用最小二乘法擬合直線,.,24,概念:離差與離差平方,e,e,最小,擬合程度最好,最小二乘法原理,.,25,最小二乘法原理,本質:使歷史數據到擬合直線上的離差平方和最小,從而求得模型參數的方法。演進:法國數學家勒讓德于1806年首次發(fā)表最小二乘理論。事實上,德國的高斯于1794年已經應用這一理論推算了谷神星的軌道,但直至1809年才正式發(fā)表。應用:最小二乘法也是數理統(tǒng)計中一種常用的方法,在工業(yè)技術和其他科學研究中有廣泛應用。運算過程:,.,26,.,27,x=12345678910111213,代入相應的x,得出預測值y,.,28,.,29,.,30,對于時間序列,xt的取值為1到n,即自變量xt的取值等于其下標t。采用正負對稱編號法可簡化計算。特別,當n為奇數時,取其中位數的編號為0,可使,.,31,擬合直線方程法的特點,擬合直線方程的一階差分為常數(一階導數為常數),只適用于時間序列呈直線上升(或下降)趨勢變化。對時間序列數據,不論其遠近都一律同等看待。用最小二乘原理擬合的直線方程消除了不規(guī)則因素的影響,使趨勢值都落在擬合的直線上?;具^程如下圖:,.,32,擬合直線方程法預測步驟圖,開始,.,33,在擬合直線方程時,按照時間先后,本著重今輕遠的原則,對離差平方和進行賦權,然后再按最小二乘原理,使離差平方和達到最小,求出加權擬合直線方程。由近及遠的離差平方和的權重分別為其中,說明對最近期數據賦予最大權重為1,而后有近及遠,按比例遞減。各期權重衰減的速度取決于的取值。,B:加權擬合直線方程法基本思想,衰減速度越慢,衰減速度越快,?,.,34,加權擬合直線方程法的過程與模型,.,35,?,?,加權擬合直線方程法的過程與模型,.,36,.,37,.,38,預測模型為:,.,39,.,40,使用加權擬合直線方程法解題結論分析,由于時間序列線性趨勢比較明顯,又由于加權系數較大(0.8),使得,加權與不加權擬合結果相近。加權的重近輕遠原則,使其預測結果更接近于實際觀察值。,.,41,擬合直線方程法的特殊運用,在現實生活中,我們常常會遇到比線性(直線)發(fā)展趨勢更為復雜的問題。例子:,.,42,某商品過去九年的市場總需求量,.,43,又例2:某公司19912003年銷售額(單位:萬元),.,44,擬合直線方程的特殊運用-非線性問題的線性化,上述特別的變化趨勢在實際生活中,常常會遇到比線性發(fā)展趨勢更為復雜的描述問題。但在某些情況下,我們可以通過適當的變量變換,將變量間的關系式化為線性的形式。如:在滿足的變量關系中,a、b,均為與t無關的未知參數,只要令,即可將其化為線性形式關系:,.,45,變換,變換,常用轉換模型(3-1),.,46,常用轉換模型(3-2),對于上式兩邊取對數:,令:,則有:,.,47,常用轉換模型(3-3),運用擬合直線方程法,可求得:,進一步用正負編號法,.,48,例子:某公司19932005年產品的銷售額如下表,試預測2006年的產品銷售額。(非線性變化趨勢),.,49,設:該趨勢的曲線模型為:,.,50,設:該趨勢線的模型為:,.,51,預測2006年的銷售額:,(二)指數曲線預測模型:一般形式:修正的指數曲線預測模型:對數曲線預測模型:生長曲線趨勢外推法:皮爾曲線預測模型:,三、趨勢模型的選擇圖形識別法:這種方法是通過繪制散點圖來進行的,即將時間序列的數據繪制成以時間t為橫軸,時序觀察值為縱軸的圖形,觀察并將其變化曲線與各類函數曲線模型的圖形進行比較,以便選擇較為合適的模型。差分法:利用差分法把數據修勻,使非平穩(wěn)序列達到平穩(wěn)序列。一階向后差分可以表示為:二階向后差分可以表示為:,差分法識別標準:,10.2.2多項式曲線趨勢外推法,背景:當變量之間的關系由于受到眾多因素的影響,其變動趨勢并非總是一條直線方程形式,而往往會呈現出不同形態(tài)的曲線變動趨勢。并且這種變動趨勢曲線方程(模型)也很難化為線性形式。曲線趨勢外推法根據時間序數據資料的散點圖走向趨勢,選擇恰當的曲線方程,利用最小二乘法或擬合法(三點法、三和法)等來確定待定的參數,建立曲線預測模型,并用它進行預測的方法。,.,56,一、二次多項式曲線模型及其應用二次多項式曲線預測模型為:設有一組統(tǒng)計數據,令即:解這個三元一次方程就可求得參數。,例1下表是我國1952年到1983年社會商品零售總額(按當年價格計算),分析預測我國社會商品零售總額。,(1)對數據畫折線圖分析,以社會商品零售總額為y軸,年份為x軸。,(2)從圖形可以看出大致的曲線增長模式,較符合的模型有二次曲線和指數曲線模型。但無法確定哪一個模型能更好地擬合該曲線,則我們將分別對該兩種模型進行參數擬合。適用的二次曲線模型為:適用的指數曲線模型為:,(3)進行二次曲線擬合。首先產生序列,然后運用普通最小二乘法對模型各參數進行估計。得到估計模型為:其中調整的,則方程通過顯著性檢驗,擬合效果很好。標準誤差為151.7。,(4)進行指數曲線模型擬合。對模型:兩邊取對數:產生序列,之后進行普通最小二乘估計該模型。最終得到估計模型為:,其中調整的,則方程通過顯著性檢驗,擬合效果很好。標準誤差為:175.37。(5)通過以上兩次模型的擬合分析,我們發(fā)現采用二次曲線模型擬合的效果更好。因此,運用方程:進行預測將會取得較好的效果。,二、三次多項式曲線預測模型及其應用,三次多項式曲線預測模型為:設有一組統(tǒng)計數據,令即:解這個四元一次方程就可求得參數。,10.2.3指數曲線趨勢外推法,一、指數曲線模型及其應用指數曲線預測模型為:對函數模型做線性變換得:令,則這樣,就把指數曲線模型轉化為直線模型了。二、修正指數曲線模型及其應用修正指數曲線預測模型為:,10.2.4生長曲線趨勢外推法,一、龔珀茲曲線模型及其應用龔珀茲曲線預測模型為:對函數模型做線性變換得:龔珀茲曲線對應于不同的lga與b的不同取值范圍而具有間斷點。曲線形式如下圖所示。,(1)lga00b001,k,漸進線(k)意味著市場對某類產品的需求從最低水平k迅速上升。,二、皮爾曲線模型及其應用皮爾曲線預測模型為:,10.2.5曲線擬合優(yōu)度分析,一、曲線的擬合優(yōu)度分析如前所述,實際的預測對象往往無法通過圖形直觀確認某種模型,而是與幾種模型接近。這時,一般先初選幾個模型,待對模型的擬合優(yōu)度分析后再確定究竟用哪一種模型。擬合優(yōu)度指標:評判擬合優(yōu)度的好壞一般使用樣本可決系數或標準誤差來作為擬合效好壞的指標:,10.3時間序列的確定性因素分析,確定性因素分解趨勢分析季節(jié)效應分析綜合分析,10.3.1確定性因素分解,傳統(tǒng)的因素分解長期趨勢(T)循環(huán)波動(C)季節(jié)性變化(S)隨機波動(I),現在的因素分解長期趨勢波動(T)季節(jié)性變化(S)隨機波動(I),分解的模型加法模型:乘法模型:混合模型:,確定性時序分析的目的,克服其它因素的影響,單純測度出某一個確定性因素對序列的影響推斷出各種確定性因素彼此之間的相互作用關系及它們對序列的綜合影響,10.3.2趨勢分析,目的有些時間序列具有非常顯著的趨勢,我們分析的目的就是要找到序列中的這種趨勢,并利用這種趨勢對序列的發(fā)展作出合理的預測常用方法趨勢擬合法平滑法,趨勢擬合法,趨勢擬合法就是把時間作為自變量,相應的序列觀察值作為因變量,建立序列值隨時間變化的回歸模型的方法分類線性擬合非線性擬合,線性擬合,使用場合長期趨勢呈現出線形特征模型結構,例10.3.1:擬合澳大利亞政府19811990年每季度的消費支出序列,模型參數估計方法最小二乘估計參數估計值,擬合效果圖,非線性擬合,使用場合長期趨勢呈現出非線形特征參數估計指導思想能轉換成線性模型的都轉換成線性模型,用線性最小二乘法進行參數估計實在不能轉換成線性的,就用迭代法進行參數估計,常用非線性模型,例10.3.2:對上海證券交易所每月末上證指數序列進行模型擬合,非線性擬合,模型變換參數估計方法線性最小二乘估計擬合模型口徑,擬合效果圖,平滑法,平滑法是進行趨勢分析和預測時常用的一種方法。它是利用修勻技術,削弱短期隨機波動對序列的影響,使序列平滑化,從而顯示出長期趨勢變化的規(guī)律常用平滑方法移動平均法指數平滑法,移動平均法,基本思想假定在一個比較短的時間間隔里,序列值之間的差異主要是由隨機波動造成的。根據這種假定,我們可以用一定時間間隔內的平均值作為某一期的估計值分類n期中心移動平均n期移動平均,n期中心移動平均,5期中心移動平均,n期移動平均,5期移動平均,移動平均期數確定的原則,事件的發(fā)展有無周期性以周期長度作為移動平均的間隔長度,以消除周期效應的影響對趨勢平滑的要求移動平均的期數越多,擬合趨勢越平滑對趨勢,為反映近期變化敏感程度,要求移動平均的期數越少,擬合趨勢越敏感,移動平均預測,例10.3.3,某一觀察值序列最后4期的觀察值為:5,5.5,5.8,6.2(1)使用4期移動平均法預測。(2)求在二期預測值中前面的系數等于多少?,解,(1)(2)在二期預測值中前面的系數等于,.,95,例現有某商場16月份的銷售額資料如下表所示,試用N=5來進行移動平均,并預測7月和8月的銷售額。,月份123456,銷售額(萬元)333435373840,.,96,移動平均法方法簡單,但它一般只對發(fā)展變化比較平坦,增長趨勢不明顯,并且與以往遠時期的狀況聯(lián)系不多的時序有效。,指數平滑法,指數平滑方法的基本思想在實際生活中,我們會發(fā)現對大多數隨機事件而言,一般都是近期的結果對現在的影響會大些,遠期的結果對現在的影響會小些。為了更好地反映這種影響作用,我們將考慮到時間間隔對事件發(fā)展的影響,各期權重隨時間間隔的增大而呈指數衰減。這就是指數平滑法的基本思想分類簡單指數平滑Holt兩參數指數平滑,.,98,一次指數平滑法為平滑系數,St(1)為t時刻的一次指數平滑值。,指數平滑法,只能預測一期,不能預測多期。,.,99,二次指數平滑法,預測公式t為預測起點,T為預測步長。,7.3.2平滑預測法指數平滑法,.,100,三次指數平滑,預測公式,7.3.2平滑預測法指數平滑法,初始值的確定平滑系數的選擇:如對初始值有疑問,準確性差,宜取較大值,以體現近期數據作用,降低初值影響;如外部環(huán)境變化較快,則數據可能變化較大,值宜取大一些,以跟蹤過程變化(如取0.30.5);如原始資料較缺乏,或歷史資料的參考價值小,值宜取大一些;如時序雖然具有不規(guī)則變動,但長期趨勢較穩(wěn)定(如接近某一穩(wěn)定常數)或變化甚小,值應較?。?.050.2)。,.,102,值的最后確定,一般是選擇不同的,通過對預測結果的評價來實現的。評價原則:(1)對不同的計算平均絕對誤差選擇MAE最小的值。(2)歷史數據檢驗。即對每個,用離現時較遠的歷史數據建立預測模型,去“預測”離現時較近的歷史數據(事后預測),看符合程度如何?從中選取一個符合得好的。(3)對不同所得模型的預測結果,專家評估。根據經驗,一般取=0.010.3,.,103,初始值S0(1)確定:(1)當時序原始數據樣本較多,值較大時,可取S0(1)=x1,S0(2)=S0(1),S0(3)=S0(2)。(2)當數據點不夠多,初始值對預測精度影響較大時,可取開始幾個觀測值的算術平均值作為S0(1)。例10.3.4已知某城市公共交通過去20日的實際客運量的統(tǒng)計數據如下表所示,當取=0.3時,試計算一次、二次指數平滑值,并預測今后第10日時的客運量。,.,104,周期數客運量xtSt(1)St(2)t(日)(萬人次)(=0.3)(=0.3),012345.17181920,505247515969767580,505050.649.5249.9649.6764.2367.7669.9372.95,505050.1849.9849.9849.8859.2861.7964.2366.85,.,105,解:,.,106,.,107,滯后偏差,數據點連線,一次平滑,二次平滑,10,20,20,40,60,80,Xt(萬人次),t(日),.,108,假定目前處在周期20,對周期30進行預測,.,109,平滑系數的物理意義:描述對過程變化的反應速度:越大(接近1),表示重視近期數據的作用,對過程變化反應越快;也描述預測系統(tǒng)對隨機誤差的修勻能力:越?。ń咏?),表示重視離現時更遠的歷史數據的作用,修勻(濾波)能力越強,但對過程變化的反映越遲鈍。,Holt兩參數指數平滑,使用場合適用于對含有線性趨勢的序列進行修勻構造思想假定序列有一個比較固定的線性趨勢兩參數修勻,初始值的確定,平滑序列的初始值趨勢序列的初始值,Holt兩參數指數平滑預測,期預測值,例10.3.5,對北京市19782000年報紙發(fā)行量序列進行Holt兩參數指數平滑。指定,例10.3.5平滑效果圖,.,115,10.3.3季節(jié)效應分析,例10.3.6以北京市1995年2000年月平均氣溫序列為例,介紹季節(jié)效應分析的基本思想和具體操作步驟。,時序圖,季節(jié)指數,季節(jié)指數的概念所謂季節(jié)指數就是用簡單平均法計算的周期內各時期季節(jié)性影響的相對數季節(jié)模型,季節(jié)指數的計算,計算周期內各期平均數計算總平均數計算季節(jié)指數,季節(jié)指數的理解,季節(jié)指數反映了該季度與總平均值之間的一種比較穩(wěn)定的關系如果這個比值大于1,就說明該季度的值常常會高于總平均值如果這個比值小于1,就說明該季度的值常常低于總平均值如果序列的季節(jié)指數都近似等于1,那就說明該序列沒有明顯的季節(jié)效應,例10.3.6季節(jié)指數的計算,例10.3.6季節(jié)指數圖,.,121,例如,某公司從1996年到2001年,每一年各季度的紡織品銷售量見下表。,.,122,季節(jié)預測法的具體步驟如下:1.收集歷年按季度記錄的歷史統(tǒng)計資料;2.計算出n年各相同季度的平均值(A);3.計算出n年每一個季度的平均值(B);4.計算季節(jié)指數(C),即用各季度的平均值除以所有季度的平均值:式中C=A/BC季節(jié)指數。5.利用季節(jié)指數(C),對預測值進行修正:Yt=(a+bT)Ci,.,123,5.利用季節(jié)指數(C),對預測值進行修正:Yt=(a+bT)Ci式中Ci第i季度的季節(jié)指數(i=1,2,3,4);Yt第t季度的銷售量;a待定系數;b待定系數;T預測期季度數,,.,124,預測過程如下:1.六年各相同季節(jié)的平均銷售量(Ai)A1=19706262(單位)同理A2=180,A3138.3,A4=180(單位)2.六年所有季度的平均銷售量(B)(單位)M6年銷售量總和,.,125,3.各季節(jié)銷售指數(Ci)C1=262191.38同理C20.95,C30.73,C40.954.修正2002年各季度預測值(1)建立時間序列線性回歸預測模型由上表可得知各有關數據,利用公式,(1),(2),y_t=190+1.90T式中T=-23,-21,-1,1,3,23,.,126,(2)修正2002年各季度預測值第一季度預測值=(190+1.9025)1.38328(單位)第二季度預測值=(190+1.9027)0.95229(單位)第三季度預測值=(190+1.9029)0.73179(單位)第三季度預測值=(190+1.9031)0.95236(單位),.,127,注意:如果n為奇數,例如n=9,則T=-4,-3,-2,1,0,1,2,3,4.季節(jié)銷售指數也可以按月計算。先列出各個年度每個月份的銷售量,見下表。計算過程如下:A=各月合計值年數A1=176/3=58.7(單位)A2=189/3=63(單位)。A12=195/3=65(單位),.,128,.,129,2.計算所有月份的月平均值銷售量(B)B=所有月份的合計值年數12B=197631254.9(單位)3.求各月份季節(jié)銷售指數(C)Ci=A/B,.,在本例中,由公式(1)(2)得a=54.9,b=0.13,從而yt=(54.9+0.13T)Ci,.,130,若預測2002年1月份和8月份的銷售量,計算如下:2002年1月和8月份的銷售額分別為y19=(54.9+0.1337)1.0763.89y26=(54.9+0.1351)0.6238.15,.,131,例某公司從1996年到2001年,每一年各季度的紡織品銷售量見下表。預測2010年各季度紡織品的銷售量。(單位:件),.,132,預測過程如下,1.六年各相同季節(jié)的平均銷售量(Ai)A1=19706262(單位)同理A2=180,A3138.3,A4=180(單位)2.六年所有季度的平均銷售量(B)M6年銷售量總和BM/(4*6)4560/24190(單位)3.各季節(jié)銷售指數(Ci=Ai/B)C1262191.38同理C20.95,C30.73,C40.954.修正2010年各季度預測值Yt=(a+b*T)Ci,.,133,(1)建立時間序列方程式Yab*T由上表可得知各有關數據,利用公式ayt/n4560/24=190byt*T/T2=8760/46001.9y=190+1.90T式中T=-23,-21,-1,1,3,23(2)修正2010年各季度預測值第一季度預測值=(190+1.9025)1.38328(單位)第二季度預測值=(190+1.9027)0.95229(單位)第三季度預測值=(190+1.9029)0.73179(單位)第三季度預測值=(190+1.9031)0.95236(單位),10.3.4綜合分析,常用綜合分析模型加法模型乘法模型混合模型,例10.3.7對1993年2000年中國社會消費品零售總額序列(數據見附錄1.11)進行確定性時序分析。,(1)繪制時序圖,(2)選擇擬合模型,長期遞增趨勢和以年為固定周期的季節(jié)波動同時作用于該序列,因而嘗試使用混合模型(b)擬合該序列的發(fā)展,(3)計算季節(jié)指數,季節(jié)指數圖,季節(jié)調整后的序列圖,(4)擬合長期趨勢,(5)殘差檢驗,(6)短期預測,.,143,混合模型,對于既含有線性趨勢成分又含有季節(jié)成分的時間序列,須對其成分進行分解,這種分解建立在以下乘法模型的基礎上:其中,Tt表示趨勢成分,St表示季節(jié)成分,It表示不規(guī)則成分。由于不規(guī)則成分的不可預測,因此預測值就可表示為趨勢成分和季節(jié)成分的乘積。,.,144,建立季節(jié)指數模型的一般步驟如下:第一步,計算每一季(每季度,每月等等)的季節(jié)指數St。第二步,用時間序列的每一個觀測值除以適當的季節(jié)指數,消除季節(jié)影響。第三步,為消除了季節(jié)影響的時間序列建立適當的趨勢模型并用這個模型進行預測。第四步,用預測值乘以季節(jié)指數,計算出最終的帶季節(jié)影響的預測值。,.,145,例某工廠過去4年的電視機銷量如表4-2所示:表4-2四年內每季度的電視機銷量這些數據有明顯的季節(jié)性波動,試在Excel工作表中建立一個季節(jié)指數模型來預測第5年每個季度的電視機銷量。,.,146,.,147,10.4回歸預測法,回歸(regression)這一術語來自英國人FrancisGalton和他的朋友KarlPearson對父親身高與兒子身高之間關系的研究。他們發(fā)現父親與兒子的身高有著顯著的正相關關系,并且身高的變化不是兩級分化而是“趨同”?;貧w是研究某一變量與其它一個或是多個變量之間的關系。回歸的方法目前在經濟學與管理學中有著越來越廣泛的運用,而計量經濟學也是經濟學中一個重要的分支,或者說是經濟學與管理學研究的重要方法。是一門很深的學問。市場蘊含著紛繁復雜的各種變量,而各種變量之間卻又有著某種依存關系。回歸的目的就是要推定一個變量對另一個變量所具有的因果效應。比如,在分析消費需求時,我們想知道商品價格變化對其需求量的影響,只要保持其他因素(收入、其他商品價格、個人偏好等)都不變,這時價格變化與需求量之間就存在一種因果關系。在經濟預測中,人們把預測對象當作因變量,把那些與預測對象有關的因素當作自變量,收集自變量的充分數據,應用相關理論知識,建立回歸方程,并進行預測比如,我們要預測某地區(qū)工業(yè)增加值,就可以利用C-D生產函數建立回歸模型,這時因變量就是工業(yè)增加值,自變量有資本投入、勞動投入、技術進步的因素等。,比如,夏天飲料的需求量與兒童溺水數量之間存在高度的相關關系,但是根據常識我們可以判斷兩者之間并沒有因果關系。但是我們如果掌握了充分的數據,還是可以作出相關的預測。在經濟預測中,人們把預測對象當作因變量,把那些與預測對象有關的因素當作自變量,收集自變量的充分數據,應用相關分析和回歸分析求得回歸方程,并利用回歸方程進行預測?;貧w預測法中的自變量,與時間序列預測法中的自變量不相同。后者的自變量是時間本身,而前者的自變量不是時間本身,而是其他的變量?;貧w預測法中的自變量與因變量之間,有的屬于因果關系,有的屑于伴隨關系。不能認為只有因果關系才能進行回歸預測,實際上伴隨關系也是一種相關關系,只要收集大量的足夠的資料,也可以用回歸預測法進行預測。在回歸預測法中,自變量不是隨機的或者是給定的,這與相關分析中自變量有所區(qū)別。相關分析中的自變量是隨機的。,.,149,回歸分析預測法是預測學的基本方法,它是在分析因變量與自變量之間的相互關系,建立變量間的數量關系近似表達的函數方程,并進行參數估計和顯著性檢驗以后,運用回歸方程式預測因變量數值變化的方法回歸分析預測法的具體步驟1)確定預測目標和影響因素2)進行相關分析3)建立回歸預測模型4)回歸預測模型的檢驗5)進行實際預測具體來說:1)憑借研究者的理論和經驗確定分析對象之間的相關關系,確定因變量。2)篩選自變量。分析各自變量與因變量之間的相關關系,觀察其相關關系的表現形式及密切程度。選用那些與因變量關系最為密切的自變量。在用多元回歸預測時,還要分析各自變量之間的相關關系,選用那些關系不密切的自變量。如有兩個自變量相互關系很密切,則應舍棄其中的一個。3)確定回歸方程式。根據理論分析和相關分析,確定用怎樣的回歸模型來進行分析,這也是回歸分析的關鍵和難度所在。4)相關檢驗。對回歸方程估計結果進行相關系數、顯著性、t檢驗等等,確定回歸模型的適用性。5)預測。,.,150,運用回歸法進行定量預測,必須有以下三個條件:1)預測對象與影響因素之間必須存在因果關系;2)過去和現在的數據規(guī)律,能夠反映未來;3)數據的分布確有線性趨勢,可采用線性解;如不是線性趨勢,則可用非線性解。回歸預測法的種類1)一元回歸預測(古典線型回歸)。一元回歸預測就是用相關分析法分析一個自變量和一個因變量之間的相關關系,并進行預測。例如,從居民貨幣收入預測某種耐用消費品的銷售量;從工人勞動生產率預測利潤額;從施肥量預測農作物的產量。2)多元回歸預測。多元回歸預測就是分析因變量與若干個自變量的相關關系,建立多元回歸方程,從若干自變量的變化去預測因變量的變化程度和未來的數量狀況。例如,從施肥量、氣溫、降雨量去預測某種農作物的收獲率;從商業(yè)企業(yè)的職工勞動生產率和流通費率去預測利潤率等等。3)自回歸預測。自回歸預測就是用一個時間數列的因變量數列與向過去推移若干時期的一個或幾個自變量數列進行預測。例如對按月編制的時間數列,用今年112月的數列作為因變量數列,用以前某月至某月的數列作為自變量數列,計算其相關系數,建立回歸方程進行預測。還可分為線性回歸方程預測和非線性回歸方程預測兩種。,a.影響GDP增長的因素有哪些(投資、消費、出口、貨幣供應量等)?b.GDP與各種因素關系的性質是什么?(增、減)c.各影響因素與GDP的具體的數量關系?d.所作數量分析結果的可靠性如何?e.今后的發(fā)展趨勢怎么樣?,例1:研究中國的GDP增長,10.4.1實例引入,例2:中國家庭汽車市場,a:汽車市場狀況如何(銷售量)b:影響汽車銷售量的主要因素是什么(收入、價格、道路狀況等)?c:各種因素對汽車銷售量影響的性質怎樣(正、負、無)?d:各種因素影響汽車銷量的具體數量程度?e:以上分析所得結論是否可靠?f:今后發(fā)展的趨勢怎樣?,以上問題的共性,提出所研究的問題分析影響因素(根據經濟理論、實際經驗)分析各種因素與所研究的現象的相互關系(需要科學的數量分析方法)分析所研究的現象與各種影響因素的數量關系(需要運用統(tǒng)計方法)分析和檢驗所得數量結論的可靠性;測算所研究經濟問題的發(fā)展趨勢(預測未來),一、變量:在不同時間、空間有不同狀況,取不同數值的因素稱為變量。其分類為:,1、被解釋變量(因變量),變量、參數、數據,2、解釋變量(自變量),3、滯后變量,被解釋變量(因變量):模型中要分析研究的變量,解釋變量(自變量):說明因變量變動原因的變量,例:收入決定模型(其中:消費支出C、投資I、進口IM、稅收T、收入Y、政府支出G、出口E),其中:消費支出C、投資I、進口IM、稅收T、收入Y是被解釋(內生)變量政府支出G、出口E、是解釋變量(通過計劃、預算來確定),(有兩個滯后變量,作用視同解釋變量),二、數據,1、時間序列數據:按照時間先后順序排列的統(tǒng)計數據(例:時期、時點指標),3、混合數據:既有時間序列數據,又有截面數據(例:居民收支調查中收集的對各個固定調查戶在不同時期的調查數據)。,2、截面數據:是在同一時間,不同空間的某個指標組成的數列(如:工業(yè)普查數據、人口普查數據、家計調查數據等)。,4、虛擬變量數據:僅取0和1兩個變量值的,模型建立步驟,可以運用計量方法研究這類問題,一般分為四個步驟:4.1模型設定4.2估計參數4.3模型檢驗4.4模型應用,研究過程,有關理論,實踐活動,搜集統(tǒng)計數據,設定計量模型,參數估計,模型檢驗,預測,政策評價,模型修訂,結構分析,符合,不符合,是否符合標準,模型應用,10.4.2模型設定,4.1.1經濟模型:模型:對經濟現象或過程的一種數學模擬。設定(Specification):把所研究的經濟變量之間的關系用適當的數學關系式表達出來。(例:消費函數y=a+bx),4.1.2構成計量經濟模型的要素(例:消費函數y=a+bx+u)*經濟變量(y,x)*經濟參數(a,b,待估計)*隨機擾動項u模型構成要素之說明(例:消費函數y=a+bx+u)*經濟變量(y,x):不同時間、不同空間的表現不同,取值不同,可以觀測。*經濟參數(a,b):比較穩(wěn)定的因素,決定經濟的特征。參數是計量經濟模型中表現經濟變量相互依存程度的因素,是一個相對穩(wěn)定的量,4.1.3設定模型的要求,要有科學的理論依據;選擇適當的數學形式(單方程還是多方程,線性還是非線性的選擇。方程應是有解的,形式盡可能簡單);模型要兼顧真實性和實用性;包含隨機擾動項;方程中的變量要具有可觀測性;,10.4.3建模步驟,經濟理論或假說的陳述;建立數學(數理經濟)模型;建立統(tǒng)計或計量經濟模型;收集處理數據;模型的參數估計;檢驗來自模型的假說現實意義檢驗;檢驗模型的正確性模型的假設檢驗;模型的運用預測、結構分析、政策模擬等,10.4.4估計參數,一般地,參數是未知的,不可直接觀測。參數要通過樣本數據,選擇適當的方法加以估計。(如何通過樣本數據估計參數是計量經濟學的核心內容)參數估計值:所估計的參數的具體數值參數估計式:用未知的樣本數據表示的待估計參數表達式。參數估計的常用方法:普通最小二乘法(OLS),極大似然估計法(ML)等。,10.4.5模型檢驗,檢驗是對模型和所估計的參數加以評定,判斷在經濟理論上是否有意義,在統(tǒng)計上是否顯著。為什么要進行檢驗?理論依據可能不充分;統(tǒng)計數據或其他信息可能不可靠樣本可能較小,結論只是抽樣的某種偶然結果??赡苓`反計量經濟估計的基本假定。模型的檢驗方式*理論意義,現實意義檢驗:是否與理論、現實相符;*統(tǒng)計推斷檢驗:檢驗參數值是否為抽樣的偶然結果;*計量檢驗:是否符合基本假定;*預測檢驗:將模型預測結果與現象運行的實際對比。,10.4.6模型應用,結構分析:分析變量之間的數量比例關系,如邊際分析、彈性分析(變化率之比)、乘數分析(變化量之比)、比較靜力學分析預測:包含動態(tài)預測和空間預測。(對非穩(wěn)定發(fā)展的過程無能為力,滯后于理論和現實的模型在應用中也會遇到障礙。)政策評價:用模型對政策方案作模擬測算,對政策方案作評價。模型形式a線性模型b非線性模型:雙對數模型、半對數模型、倒數模型非線性模型一般都要轉化為線性模型來估計。,1、線性模型(對變量、參數),2、非線性模型(被解釋與解釋變量之間、被解釋變量與參數之間),例如:,(1、2可線性化),(1)多項式函數,常見的可線性化模型:,(2)雙對數方程,基本形式(冪函數):,雙對數方程的斜率參數可以衡量因變量Y關于解釋變量X的彈性(表示:當X每變動1%時,因變量Y平均變動的百分比)。事實上,有,(3)半對數方程,在第一個方程中斜率參數等于Y的相對變動與X絕對變動之比。模型叫增長模型,它可以描述某種經濟現象隨著時間變化而變動的趨勢。第二個半對數方程的斜率系數表示當自變量發(fā)生一個單位的相對變動時,引起的因變量Y的平均絕對變動。,(4)倒數變換模型,基本形式:注:,Y隨著X增大而非線性地增大,最終接近一條直線,Y隨著X的增加而非線性地減少。重要特點:被解釋變量Y存在極限。例:若Y為平均成本,X為產量,則平均成本Y隨著產量增加而不斷下降,但它決不可能等于或小于。,.,170,10.4.7回歸實例,一元線型回歸分析,一元線型回歸(古典線型回歸)預測是指成對的兩個變量數據分布大體上呈直線趨勢時,運用合適的參數估計方法,求出一元線性回歸模型,然后根據自變量與因變量之間的關系,預測因變量的趨勢。很多社會經濟現象之間都存在一一對應的相關關系,因此,一元線性回歸預測有很廣泛的應用。比如,家庭的消費支出與家庭收入之間存在很強的相關關系,甚至是一種線型關系。,.,171,線性回歸模型及其假定一般地,一元線型回歸模型具有如下形式:yi=+xi+i,i=1,n,其中y是因變量或稱為被解釋變量,x是自變量或稱為解釋變量,i標志n個樣本觀測值中的一個。構成古典線性回歸模型的一組基本假設為:1.函數形式:yi=+xi+i,i=1,n,2.干擾項的零均值:對所有i,有:Ei=0。3.同方差性:對所有i,有:Vari=2,且是一個常數。4.無自相關:對所有ij,則Covi,j=0。5.回歸量和干擾項的非相關:對所有i和j有Covxi,j=0。6.正態(tài)性:對所有i,i滿足正態(tài)分布N(0,2)。,.,172,用最小二乘法(OLS)進行參數估計得到的估計表達式為:在估計了參數之后,就可以得到一元線型方程,這樣帶入自變量x的值,就可以進行對因變量y的預測。,.,173,在預測之前,還需要對估計結果作假設檢驗:1、R檢驗相關系數R:衡量自變量與因變量關系密切程度的指標,表示自變量解釋了因變量變動的百分比??梢娤嚓P系數R取值于01之間。一般在實際預測時,|R|0.7就認為因變量與自變量高度相關,x是y的主要影響因素;0.3|R|0.7,認為相關;|R|,,說明廣告費支出與商品銷售額線性關系顯著。這與決定系數,檢驗結論一致。,百萬元。,即:2002年的商品銷售額可望達到49.595百萬元。,.,183,4)進行預測。(1)點預測。2002年的廣告費支出預計為35萬元。,萬元代入回歸方程:,(2)區(qū)間預測。計算估計標準誤差,,df=8,查t分布表,得,即:2002年的商品銷售額可望達到49.595百萬元。,.,184,因為,當廣告費支出達到,萬元時,商品銷售額的預測區(qū)間為:,即:若以95%的把握程度預測,當廣告費支出達到35萬元時,商品的銷售額在45.864-53.326百萬元之間。,現實生活中引起被解釋變量變化的因素并非僅只一個解釋變量,可能有很多個解釋變量。例如,產出往往受各種投入要素資本、勞動、技術等的影響;銷售額往往受價格和公司對廣告費的投入的影響等。所以多元線性模型解釋變量個數2更為常見,二、多元線性回歸模型及其假定條件,模型的建立,在實際問題中,有時一個變量受到一個或多個解釋變量影響。這時就需要建立多元回歸模型進行研究。假定變量yt與k個變量xjt,j=1,k1,存在線性關系。多元線性回歸模型表示為:,其中yt是被解釋變量(因變量),xjt是解釋變量(自變量),ut是隨機誤差項,i,i=0,1,k-1是回歸參數(通常未知)。這說明xjt,j=1,k,是yt的重要解釋變量。ut代表眾多影響yt變化的微小因素。,當給定一個容量為的樣本,樣本觀測值為得,當給定一個容量為,得:,為保證用OLS法得到最優(yōu)估計量,該回歸模型應滿足如下假定條件。假定隨機誤差項向量u是非自相關的,同方差的。其中每一項都滿足均值為零,方差為,相同且為有限值,即且,假定解釋變量與誤差項相互獨立,即,假定解釋變量之間線性無關。,其中表示矩陣的秩。,假定解釋變量是非隨機的,且當時,多元線性回歸模型的參數估計,1.普通最小二乘法(OLS)最小二乘法(OLS)的原理是通過求殘差(誤差項的估計值)平方和最小確定回歸參數估計值。這是求極值問題。用Q表示殘差平方和,求其最小值條件下的回歸參數的估計值。,得到下列方程組,求參數估計值的實質是求一個k+1元方程組,(2)正規(guī)方程,最小二乘法的矩陣表示,(3)正規(guī)方程的結構,被解釋變量觀測值nx1解釋變量觀測值(含虛擬變量nx(k+1))設計矩陣(實對稱(k+1)x(k+1)矩陣)正規(guī)方程右端(k+1)x1回歸系數矩陣(k+1)x1高斯乘數矩陣,設計矩陣的逆殘差向量(nx1)被解釋變量的擬合(預測)向量nx1,(4)最小二乘估計量的性質,線性(估計量都是被解釋變量觀測值的線性組合)無偏性(估計量的數學期望=被估計的真值)有效性(估計量的方差是所有線性無偏估計中最小的),因為X的元素是非隨機的,(XX)-1X是一個常數矩陣,由上式知是Y的線性組合,為線性估計量,具有線性特性。2)無偏特性,1)線性,3)有效性,具有最小方差特性。,(5)隨機誤差項的方差的估計量,若已知,則定義則上式寫為矩陣M有如下性質:,存在為階的滿秩陣因此,必須有,此為最小樣本容量,滿足基本要求的樣本容量。一般經驗認為:n30或者n3(k+1)才能滿足模型估計的基本要求。n3(k+1)時,t分布才穩(wěn)定,檢驗才較為有效,(6)樣本容量問題,樣本是一個重要的實際問題,模型依賴于實際樣本。獲取樣本需要成本,企圖通過樣本容量的確定減輕收集數據的困難。最小樣本容量:滿足基本要求的樣本容量,回歸分析是要通過樣本所估計的參數來代替總體的真實參數,或者說是用樣本回歸線代替總體回歸。盡管從統(tǒng)計性質上已知,如果有足夠多的重復抽樣,參數的估計值的期望(均值)就等于其總體的參數真值,但在一次抽樣中,估計值不一定就等于該真值。那么,在一次抽樣中,參數的估計值與真值的差異有多大,是否顯著,這就需要進一步進行統(tǒng)計檢驗。主要包括擬合優(yōu)度檢驗、變量的顯著性檢驗及模型整體的顯著性檢驗。,多元線性回歸模型的統(tǒng)計檢驗,(1)擬合優(yōu)度檢驗,總離差平方和的分解,,,,,注意英文縮小的含義TSS:TotalSquareSum/總離差平方和RSS:RegressionSquareSum/回歸平方和ResidualSquareSum/殘差平方和ESS:ErrorSquareSum/誤差平方和(殘差平方和)ExplainSquareSum/解釋平方和(回歸平方和)平方和分解的意義TSS=RSS+ESS被解釋變量Y總的變動(差異)=解釋變量X引起的變動(差異)+除X以外的因素引起的變動(差異)如果X引起的變動在Y的總變動中占很大比例,那么X很好地解釋了Y;否則,X不能很好地解釋Y。,(2)樣本可決系數,樣本可決系數是擬合優(yōu)度評價的最重要指標,殘差的標準差也能作為擬合優(yōu)度評價的參考指標樣本可決系數(ThecoefficientofDetermination)R2隨機項的方差2的最小二乘估計量,相關系數計算方法與樣本決定系數一樣含義有所不同:樣本可決系數是判斷回歸方程與樣本觀測值擬合優(yōu)度的一個數量指標,隱含的前提條件是X和Y具有因果關系相關系數是判斷兩個隨機變量線性相關的密切程度,不考慮因果關系。調整的可決系數(adjustedcoefficientofdetemination),增加解釋變量時,很可能增加R2,容易引起錯覺,認為只要在回歸模型中增加解釋變量就可以了,因此考慮對R2進行修正思考:調整的可決系數能否為負?如果為負,說明什么問題?注意TSS、ESS、RSS的自由度:TSS(離差平方和):n-1;RSS(殘差平方和):n-k-1;ESS(回歸平方和):k。,(3)赤池信息準則和施瓦茨準則,為了比較所含解釋變量個數不同的多元回歸模型的擬合優(yōu)度,常用的標準還有赤池信息準則和施瓦茨準則赤池信息準則的定義為:,施瓦茨準則的定義為:,上面的兩個準則均要求僅當所增加的解釋變量能夠減少AIC和SC的值時,才允許在模型中增加該解釋變量,(4)方程整體線性的顯著性檢驗(F檢驗),檢驗估計的回歸方程作為一個整體的統(tǒng)計顯
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 車輛分期賠償合同協(xié)議
- 輕微受傷賠償協(xié)議書模板
- 國內過橋資金借款合同
- 個人長期租車合同
- 人力資源管理理論實踐試題庫
- 車飾合作協(xié)議書范本
- 溢價入股協(xié)議書
- 煙酒補償協(xié)議書
- 簽訂合同授權的委托書
- 基于物聯(lián)網技術的智能家居設備通信協(xié)議說明
- 礦山地質災害危險性評估要點
- 泰勒斯威夫特英文介紹演示文稿
- 超星爾雅學習通《帶您走進西藏》章節(jié)測試答案
- 施工監(jiān)理投標報價單
- 陽江海上風電項目建議書
- 大學本科畢業(yè)設計畢業(yè)論文-網上藥店管理系統(tǒng)的設計與實現
- DBJ∕T 13-264-2017 福建省石砌體結構加固技術規(guī)程
- 洞口縣黃橋鎮(zhèn)污水處理廠入河排污口設置論證報告
- T∕CGMA 081001-2018 整體式高速齒輪傳動裝置通用技術規(guī)范
- 核事故現場處置中的洗消問題
- FeNO測定及應用
評論
0/150
提交評論