統(tǒng)計預(yù)測方法及預(yù)測模型.ppt_第1頁
統(tǒng)計預(yù)測方法及預(yù)測模型.ppt_第2頁
統(tǒng)計預(yù)測方法及預(yù)測模型.ppt_第3頁
統(tǒng)計預(yù)測方法及預(yù)測模型.ppt_第4頁
統(tǒng)計預(yù)測方法及預(yù)測模型.ppt_第5頁
已閱讀5頁,還剩227頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

中南大學(xué)數(shù)學(xué)科學(xué)與計算技術(shù)學(xué)院 統(tǒng)計預(yù)測方法及預(yù)測模型 第十章統(tǒng)計預(yù)測方法及預(yù)測模型 10 1統(tǒng)計預(yù)測的基本問題 10 1 2統(tǒng)計預(yù)測方法的分類及其選擇 10 1 3統(tǒng)計預(yù)測的原則和步驟 10 1 1統(tǒng)計預(yù)測的概念和作用 10 1 1統(tǒng)計預(yù)測的概念和作用 一 統(tǒng)計預(yù)測的概念概念 預(yù)測就是根據(jù)過去和現(xiàn)在估計未來 預(yù)測未來 統(tǒng)計預(yù)測屬于預(yù)測方法研究范疇 即如何利用科學(xué)的統(tǒng)計方法對事物的未來發(fā)展進行定量推測 例1下表是我國1952年到1983年社會商品零售總額 按當(dāng)年價格計算 分析預(yù)測我國社會商品零售總額 實際資料是預(yù)測的依據(jù) 理論是預(yù)測的基礎(chǔ) 數(shù)學(xué)模型是預(yù)測的手段 統(tǒng)計預(yù)測的三個要素 統(tǒng)計預(yù)測方法是一種具有通用性的方法 二 統(tǒng)計預(yù)測的作用 在市場經(jīng)濟條件下 預(yù)測的作用是通過各個企業(yè)或行業(yè)內(nèi)部的行動計劃和決策來實現(xiàn)的 統(tǒng)計預(yù)測作用的大小取決于預(yù)測結(jié)果所產(chǎn)生的效益的多少 影響預(yù)測作用大小的因素主要有 預(yù)測費用的高低 預(yù)測方法的難易程度 預(yù)測結(jié)果的精確程度 10 1 2統(tǒng)計預(yù)測方法的分類和選擇 統(tǒng)計預(yù)測方法可歸納分為定性預(yù)測方法和定量預(yù)測方法兩類 其中定量預(yù)測法又可大致分為趨勢外推預(yù)測法 時間序列預(yù)測法和回歸預(yù)測法 按預(yù)測時間長短分為近期預(yù)測 短期預(yù)測 中期預(yù)測和長期預(yù)測 按預(yù)測是否重復(fù)分為一次性預(yù)測和反復(fù)預(yù)測 一 統(tǒng)計預(yù)測方法的分類 三 定量預(yù)測 定量預(yù)測的概念 定量預(yù)測也稱統(tǒng)計預(yù)測 它是根據(jù)已掌握的比較完備的歷史統(tǒng)計數(shù)據(jù) 運用一定的數(shù)學(xué)方法進行科學(xué)的加工整理 借以揭示有關(guān)變量之間的規(guī)律性聯(lián)系 用于預(yù)測和推測未來發(fā)展變化情況的一類預(yù)測方法 二 統(tǒng)計預(yù)測方法的選擇 在統(tǒng)計預(yù)測中的定量預(yù)測要使用模型外推法 使用這種方法有以下兩條重要的原則 連貫原則 是指事物的發(fā)展是按一定規(guī)律進行的 在其發(fā)展過程中 這種規(guī)律貫徹始終 不應(yīng)受到破壞 它的未來發(fā)展與其過去和現(xiàn)在的發(fā)展沒有什么根本的不同 類推原則 是指事物必須有某種結(jié)構(gòu) 其升降起伏變動不是雜亂無章的 而是有章可循的 事物變動的這種結(jié)構(gòu)性可用數(shù)學(xué)方法加以模擬 根據(jù)所測定的模型 類比現(xiàn)在 預(yù)測未來 10 1 3統(tǒng)計預(yù)測的原則和步驟 一 統(tǒng)計預(yù)測的原則 二 統(tǒng)計預(yù)測的步驟 10 2趨勢外推法 10 2 1趨勢外推法概述10 2 2多項式曲線趨勢外推法10 2 3指數(shù)曲線趨勢外推法10 2 4生長曲線趨勢外推法10 2 5曲線擬合優(yōu)度分析 趨勢外推法的基本思想 某些客觀事物的發(fā)展變化相對于時間推移 常表現(xiàn)出一定的規(guī)律性 如 經(jīng)濟現(xiàn)象 指標(biāo) 隨著時間的推移呈現(xiàn)某種上升或下降趨勢 這時 若作為預(yù)測對象的該經(jīng)濟現(xiàn)象 指標(biāo) 變化又沒有明顯的季節(jié)性波動跡象 理論上就可以找到一條合適的函數(shù)曲線反映其變化趨勢 可建其變化趨勢模型 曲線方程 當(dāng)有理由相信這種趨勢可能會延伸到未來時 對于未來時點的某個 值 經(jīng)濟指標(biāo)未來值 就可由上述變化趨勢模型 直線方程 給出 這就是趨勢外推的基本思想 趨勢外推的條件有 變化趨勢的時間穩(wěn)定性 曲線方程存在 某商場某種商品過去9個月的銷量數(shù)據(jù) 某商場過去9年市場需求量統(tǒng)計數(shù)據(jù) 10 2 1趨勢外推法概述 一 趨勢外推法概念和假定條件趨勢外推法概念 當(dāng)預(yù)測對象依時間變化呈現(xiàn)某種上升或下降趨勢 沒有明顯的季節(jié)波動 且能找到一個合適的函數(shù)曲線反映這種變化趨勢時 就可以用趨勢外推法進行預(yù)測 運用趨勢外推法進行預(yù)測是基于兩個基本假設(shè) 一是決定過去預(yù)測對象發(fā)展的因素 在很大程度上仍將決定其未來的發(fā)展 二是預(yù)測對象發(fā)展過程一般是漸進變化 而不是跳躍式變化 趨勢外推法的突出特點是選用一定的數(shù)學(xué)模型來擬合預(yù)測變量的變動趨勢 并進而用模型進行預(yù)測 二 趨勢外推法經(jīng)常選用的數(shù)學(xué)模型根據(jù)預(yù)測變量變動趨勢是否為線性 又分為線性趨勢外推法和曲線趨勢外推法 一 線性模型 二 曲線模型1 多項式曲線模型2 簡單指數(shù)曲線模型3 修正指數(shù)曲線模型4 生長曲線模型 龔珀資曲線模型 一般形式 一 直線趨勢外推法 適用條件 時間序列數(shù)據(jù) 觀察值 呈直線上升或下降的情形 該預(yù)測變量的長期趨勢可以用關(guān)于時間的直線描述 通過該直線趨勢的向外延伸 外推 估計其預(yù)測值 兩種處理方式 擬合直線方程與加權(quán)擬合直線方程 A擬合直線方程法 使用最小二乘法擬合直線 概念 離差與離差平方 e e 最小 擬合程度最好 最小二乘法原理 最小二乘法原理 本質(zhì) 使歷史數(shù)據(jù)到擬合直線上的離差平方和最小 從而求得模型參數(shù)的方法 演進 法國數(shù)學(xué)家勒讓德于1806年首次發(fā)表最小二乘理論 事實上 德國的高斯于1794年已經(jīng)應(yīng)用這一理論推算了谷神星的軌道 但直至1809年才正式發(fā)表 應(yīng)用 最小二乘法也是數(shù)理統(tǒng)計中一種常用的方法 在工業(yè)技術(shù)和其他科學(xué)研究中有廣泛應(yīng)用 運算過程 x 12345678910111213 代入相應(yīng)的x 得出預(yù)測值y 對于時間序列 xt的取值為1到n 即自變量xt的取值等于其下標(biāo)t 采用正負對稱編號法可簡化計算 特別 當(dāng)n為奇數(shù)時 取其中位數(shù)的編號為0 可使 擬合直線方程法的特點 擬合直線方程的一階差分為常數(shù) 一階導(dǎo)數(shù)為常數(shù) 只適用于時間序列呈直線上升 或下降 趨勢變化 對時間序列數(shù)據(jù) 不論其遠近都一律同等看待 用最小二乘原理擬合的直線方程消除了不規(guī)則因素的影響 使趨勢值都落在擬合的直線上 基本過程如下圖 擬合直線方程法預(yù)測步驟圖 開始 在擬合直線方程時 按照時間先后 本著重今輕遠的原則 對離差平方和進行賦權(quán) 然后再按最小二乘原理 使離差平方和達到最小 求出加權(quán)擬合直線方程 由近及遠的離差平方和的權(quán)重分別為其中 說明對最近期數(shù)據(jù)賦予最大權(quán)重為1 而后有近及遠 按比例遞減 各期權(quán)重衰減的速度取決于的取值 B 加權(quán)擬合直線方程法基本思想 衰減速度越慢 衰減速度越快 加權(quán)擬合直線方程法的過程與模型 加權(quán)擬合直線方程法的過程與模型 預(yù)測模型為 使用加權(quán)擬合直線方程法解題結(jié)論分析 由于時間序列線性趨勢比較明顯 又由于加權(quán)系數(shù)較大 0 8 使得 加權(quán)與不加權(quán)擬合結(jié)果相近 加權(quán)的重近輕遠原則 使其預(yù)測結(jié)果更接近于實際觀察值 擬合直線方程法的特殊運用 在現(xiàn)實生活中 我們常常會遇到比線性 直線 發(fā)展趨勢更為復(fù)雜的問題 例子 某商品過去九年的市場總需求量 又例2 某公司1991 2003年銷售額 單位 萬元 擬合直線方程的特殊運用 非線性問題的線性化 上述特別的變化趨勢在實際生活中 常常會遇到比線性發(fā)展趨勢更為復(fù)雜的描述問題 但在某些情況下 我們可以通過適當(dāng)?shù)淖兞孔儞Q 將變量間的關(guān)系式化為線性的形式 如 在滿足的變量關(guān)系中 a b 均為與t無關(guān)的未知參數(shù) 只要令 即可將其化為線性形式關(guān)系 變換 變換 常用轉(zhuǎn)換模型 3 1 常用轉(zhuǎn)換模型 3 2 對于上式兩邊取對數(shù) 令 則有 常用轉(zhuǎn)換模型 3 3 運用擬合直線方程法 可求得 進一步用正負編號法 例子 某公司1993 2005年產(chǎn)品的銷售額如下表 試預(yù)測2006年的產(chǎn)品銷售額 非線性變化趨勢 設(shè) 該趨勢的曲線模型為 設(shè) 該趨勢線的模型為 預(yù)測2006年的銷售額 二 指數(shù)曲線預(yù)測模型 一般形式 修正的指數(shù)曲線預(yù)測模型 對數(shù)曲線預(yù)測模型 生長曲線趨勢外推法 皮爾曲線預(yù)測模型 三 趨勢模型的選擇圖形識別法 這種方法是通過繪制散點圖來進行的 即將時間序列的數(shù)據(jù)繪制成以時間t為橫軸 時序觀察值為縱軸的圖形 觀察并將其變化曲線與各類函數(shù)曲線模型的圖形進行比較 以便選擇較為合適的模型 差分法 利用差分法把數(shù)據(jù)修勻 使非平穩(wěn)序列達到平穩(wěn)序列 一階向后差分可以表示為 二階向后差分可以表示為 差分法識別標(biāo)準(zhǔn) 10 2 2多項式曲線趨勢外推法 背景 當(dāng)變量之間的關(guān)系由于受到眾多因素的影響 其變動趨勢并非總是一條直線方程形式 而往往會呈現(xiàn)出不同形態(tài)的曲線變動趨勢 并且這種變動趨勢曲線方程 模型 也很難化為線性形式 曲線趨勢外推法根據(jù)時間序數(shù)據(jù)資料的散點圖走向趨勢 選擇恰當(dāng)?shù)那€方程 利用最小二乘法或擬合法 三點法 三和法 等來確定待定的參數(shù) 建立曲線預(yù)測模型 并用它進行預(yù)測的方法 一 二次多項式曲線模型及其應(yīng)用二次多項式曲線預(yù)測模型為 設(shè)有一組統(tǒng)計數(shù)據(jù) 令即 解這個三元一次方程就可求得參數(shù) 例1下表是我國1952年到1983年社會商品零售總額 按當(dāng)年價格計算 分析預(yù)測我國社會商品零售總額 1 對數(shù)據(jù)畫折線圖分析 以社會商品零售總額為y軸 年份為x軸 2 從圖形可以看出大致的曲線增長模式 較符合的模型有二次曲線和指數(shù)曲線模型 但無法確定哪一個模型能更好地擬合該曲線 則我們將分別對該兩種模型進行參數(shù)擬合 適用的二次曲線模型為 適用的指數(shù)曲線模型為 3 進行二次曲線擬合 首先產(chǎn)生序列 然后運用普通最小二乘法對模型各參數(shù)進行估計 得到估計模型為 其中調(diào)整的 則方程通過顯著性檢驗 擬合效果很好 標(biāo)準(zhǔn)誤差為151 7 4 進行指數(shù)曲線模型擬合 對模型 兩邊取對數(shù) 產(chǎn)生序列 之后進行普通最小二乘估計該模型 最終得到估計模型為 其中調(diào)整的 則方程通過顯著性檢驗 擬合效果很好 標(biāo)準(zhǔn)誤差為 175 37 5 通過以上兩次模型的擬合分析 我們發(fā)現(xiàn)采用二次曲線模型擬合的效果更好 因此 運用方程 進行預(yù)測將會取得較好的效果 二 三次多項式曲線預(yù)測模型及其應(yīng)用 三次多項式曲線預(yù)測模型為 設(shè)有一組統(tǒng)計數(shù)據(jù) 令即 解這個四元一次方程就可求得參數(shù) 10 2 3指數(shù)曲線趨勢外推法 一 指數(shù)曲線模型及其應(yīng)用指數(shù)曲線預(yù)測模型為 對函數(shù)模型做線性變換得 令 則這樣 就把指數(shù)曲線模型轉(zhuǎn)化為直線模型了 二 修正指數(shù)曲線模型及其應(yīng)用修正指數(shù)曲線預(yù)測模型為 10 2 4生長曲線趨勢外推法 一 龔珀茲曲線模型及其應(yīng)用龔珀茲曲線預(yù)測模型為 對函數(shù)模型做線性變換得 龔珀茲曲線對應(yīng)于不同的lga與b的不同取值范圍而具有間斷點 曲線形式如下圖所示 1 lga 00 b 1 k 漸進線 k 意味著市場對某類產(chǎn)品的需求已逐漸接近飽和狀態(tài) 2 lga1 k 漸進線 k 意味著市場對某類產(chǎn)品的需求已由飽和狀態(tài)開始下降 3 lga 00 b 1 k 漸進線 k 意味著市場對某類產(chǎn)品的需求下降迅速 已接近最低水平k 4 lga 0b 1 k 漸進線 k 意味著市場對某類產(chǎn)品的需求從最低水平k迅速上升 二 皮爾曲線模型及其應(yīng)用皮爾曲線預(yù)測模型為 10 2 5曲線擬合優(yōu)度分析 一 曲線的擬合優(yōu)度分析如前所述 實際的預(yù)測對象往往無法通過圖形直觀確認某種模型 而是與幾種模型接近 這時 一般先初選幾個模型 待對模型的擬合優(yōu)度分析后再確定究竟用哪一種模型 擬合優(yōu)度指標(biāo) 評判擬合優(yōu)度的好壞一般使用樣本可決系數(shù)或標(biāo)準(zhǔn)誤差來作為擬合效好壞的指標(biāo) 10 3時間序列的確定性因素分析 確定性因素分解趨勢分析季節(jié)效應(yīng)分析綜合分析 10 3 1確定性因素分解 傳統(tǒng)的因素分解長期趨勢 T 循環(huán)波動 C 季節(jié)性變化 S 隨機波動 I 現(xiàn)在的因素分解長期趨勢波動 T 季節(jié)性變化 S 隨機波動 I 分解的模型加法模型 乘法模型 混合模型 確定性時序分析的目的 克服其它因素的影響 單純測度出某一個確定性因素對序列的影響推斷出各種確定性因素彼此之間的相互作用關(guān)系及它們對序列的綜合影響 10 3 2趨勢分析 目的有些時間序列具有非常顯著的趨勢 我們分析的目的就是要找到序列中的這種趨勢 并利用這種趨勢對序列的發(fā)展作出合理的預(yù)測常用方法趨勢擬合法平滑法 趨勢擬合法 趨勢擬合法就是把時間作為自變量 相應(yīng)的序列觀察值作為因變量 建立序列值隨時間變化的回歸模型的方法分類線性擬合非線性擬合 線性擬合 使用場合長期趨勢呈現(xiàn)出線形特征模型結(jié)構(gòu) 例10 3 1 擬合澳大利亞政府1981 1990年每季度的消費支出序列 模型參數(shù)估計方法最小二乘估計參數(shù)估計值 擬合效果圖 非線性擬合 使用場合長期趨勢呈現(xiàn)出非線形特征參數(shù)估計指導(dǎo)思想能轉(zhuǎn)換成線性模型的都轉(zhuǎn)換成線性模型 用線性最小二乘法進行參數(shù)估計實在不能轉(zhuǎn)換成線性的 就用迭代法進行參數(shù)估計 常用非線性模型 例10 3 2 對上海證券交易所每月末上證指數(shù)序列進行模型擬合 非線性擬合 模型變換參數(shù)估計方法線性最小二乘估計擬合模型口徑 擬合效果圖 平滑法 平滑法是進行趨勢分析和預(yù)測時常用的一種方法 它是利用修勻技術(shù) 削弱短期隨機波動對序列的影響 使序列平滑化 從而顯示出長期趨勢變化的規(guī)律常用平滑方法移動平均法指數(shù)平滑法 移動平均法 基本思想假定在一個比較短的時間間隔里 序列值之間的差異主要是由隨機波動造成的 根據(jù)這種假定 我們可以用一定時間間隔內(nèi)的平均值作為某一期的估計值分類n期中心移動平均n期移動平均 n期中心移動平均 5期中心移動平均 n期移動平均 5期移動平均 移動平均期數(shù)確定的原則 事件的發(fā)展有無周期性以周期長度作為移動平均的間隔長度 以消除周期效應(yīng)的影響對趨勢平滑的要求移動平均的期數(shù)越多 擬合趨勢越平滑對趨勢 為反映近期變化敏感程度 要求移動平均的期數(shù)越少 擬合趨勢越敏感 移動平均預(yù)測 例10 3 3 某一觀察值序列最后4期的觀察值為 5 5 5 5 8 6 2 1 使用4期移動平均法預(yù)測 2 求在二期預(yù)測值中前面的系數(shù)等于多少 解 1 2 在二期預(yù)測值中前面的系數(shù)等于 例 現(xiàn)有某商場1 6月份的銷售額資料如下表所示 試用N 5來進行移動平均 并預(yù)測7月和8月的銷售額 月份123456 銷售額 萬元 333435373840 移動平均法方法簡單 但它一般只對發(fā)展變化比較平坦 增長趨勢不明顯 并且與以往遠時期的狀況聯(lián)系不多的時序有效 指數(shù)平滑法 指數(shù)平滑方法的基本思想在實際生活中 我們會發(fā)現(xiàn)對大多數(shù)隨機事件而言 一般都是近期的結(jié)果對現(xiàn)在的影響會大些 遠期的結(jié)果對現(xiàn)在的影響會小些 為了更好地反映這種影響作用 我們將考慮到時間間隔對事件發(fā)展的影響 各期權(quán)重隨時間間隔的增大而呈指數(shù)衰減 這就是指數(shù)平滑法的基本思想分類簡單指數(shù)平滑Holt兩參數(shù)指數(shù)平滑 一次指數(shù)平滑法 為平滑系數(shù) St 1 為t時刻的一次指數(shù)平滑值 指數(shù)平滑法 只能預(yù)測一期 不能預(yù)測多期 二次指數(shù)平滑法 預(yù)測公式t為預(yù)測起點 T為預(yù)測步長 7 3 2平滑預(yù)測法 指數(shù)平滑法 三次指數(shù)平滑 預(yù)測公式 7 3 2平滑預(yù)測法 指數(shù)平滑法 初始值的確定平滑系數(shù) 的選擇 如對初始值有疑問 準(zhǔn)確性差 宜取較大值 以體現(xiàn)近期數(shù)據(jù)作用 降低初值影響 如外部環(huán)境變化較快 則數(shù)據(jù)可能變化較大 值宜取大一些 以跟蹤過程變化 如取0 3 0 5 如原始資料較缺乏 或歷史資料的參考價值小 值宜取大一些 如時序雖然具有不規(guī)則變動 但長期趨勢較穩(wěn)定 如接近某一穩(wěn)定常數(shù) 或變化甚小 值應(yīng)較小 0 05 0 2 值的最后確定 一般是選擇不同的 通過對預(yù)測結(jié)果的評價來實現(xiàn)的 評價原則 1 對不同的 計算平均絕對誤差選擇MAE最小的 值 2 歷史數(shù)據(jù)檢驗 即對每個 用離現(xiàn)時較遠的歷史數(shù)據(jù)建立預(yù)測模型 去 預(yù)測 離現(xiàn)時較近的歷史數(shù)據(jù) 事后預(yù)測 看符合程度如何 從中選取一個符合得好的 3 對不同 所得模型的預(yù)測結(jié)果 專家評估 根據(jù)經(jīng)驗 一般取 0 01 0 3 初始值S0 1 確定 1 當(dāng)時序原始數(shù)據(jù)樣本較多 值較大時 可取S0 1 x1 S0 2 S0 1 S0 3 S0 2 2 當(dāng)數(shù)據(jù)點不夠多 初始值對預(yù)測精度影響較大時 可取開始幾個觀測值的算術(shù)平均值作為S0 1 例10 3 4已知某城市公共交通過去20日的實際客運量的統(tǒng)計數(shù)據(jù)如下表所示 當(dāng)取 0 3時 試計算一次 二次指數(shù)平滑值 并預(yù)測今后第10日時的客運量 周期數(shù)客運量xtSt 1 St 2 t 日 萬人次 0 3 0 3 012345 17181920 5052475159 69767580 505050 649 5249 9649 67 64 2367 7669 9372 95 505050 1849 9849 9849 88 59 2861 7964 2366 85 解 滯后偏差 數(shù)據(jù)點連線 一次平滑 二次平滑 10 20 20 40 60 80 Xt 萬人次 t 日 假定目前處在周期20 對周期30進行預(yù)測 平滑系數(shù) 的物理意義 描述對過程變化的反應(yīng)速度 越大 接近1 表示重視近期數(shù)據(jù)的作用 對過程變化反應(yīng)越快 也描述預(yù)測系統(tǒng)對隨機誤差的修勻能力 越小 接近0 表示重視離現(xiàn)時更遠的歷史數(shù)據(jù)的作用 修勻 濾波 能力越強 但對過程變化的反映越遲鈍 Holt兩參數(shù)指數(shù)平滑 使用場合適用于對含有線性趨勢的序列進行修勻構(gòu)造思想假定序列有一個比較固定的線性趨勢兩參數(shù)修勻 初始值的確定 平滑序列的初始值趨勢序列的初始值 Holt兩參數(shù)指數(shù)平滑預(yù)測 期預(yù)測值 例10 3 5 對北京市1978 2000年報紙發(fā)行量序列進行Holt兩參數(shù)指數(shù)平滑 指定 例10 3 5平滑效果圖 10 3 3季節(jié)效應(yīng)分析 例10 3 6以北京市1995年 2000年月平均氣溫序列為例 介紹季節(jié)效應(yīng)分析的基本思想和具體操作步驟 時序圖 季節(jié)指數(shù) 季節(jié)指數(shù)的概念所謂季節(jié)指數(shù)就是用簡單平均法計算的周期內(nèi)各時期季節(jié)性影響的相對數(shù)季節(jié)模型 季節(jié)指數(shù)的計算 計算周期內(nèi)各期平均數(shù)計算總平均數(shù)計算季節(jié)指數(shù) 季節(jié)指數(shù)的理解 季節(jié)指數(shù)反映了該季度與總平均值之間的一種比較穩(wěn)定的關(guān)系如果這個比值大于1 就說明該季度的值常常會高于總平均值如果這個比值小于1 就說明該季度的值常常低于總平均值如果序列的季節(jié)指數(shù)都近似等于1 那就說明該序列沒有明顯的季節(jié)效應(yīng) 例10 3 6季節(jié)指數(shù)的計算 例10 3 6季節(jié)指數(shù)圖 例如 某公司從1996年到2001年 每一年各季度的紡織品銷售量見下表 季節(jié)預(yù)測法的具體步驟如下 1 收集歷年按季度記錄的歷史統(tǒng)計資料 2 計算出n年各相同季度的平均值 A 3 計算出n年每一個季度的平均值 B 4 計算季節(jié)指數(shù) C 即用各季度的平均值除以所有季度的平均值 式中C A BC 季節(jié)指數(shù) 5 利用季節(jié)指數(shù) C 對預(yù)測值進行修正 Yt a bT Ci 5 利用季節(jié)指數(shù) C 對預(yù)測值進行修正 Yt a bT Ci式中Ci 第i季度的季節(jié)指數(shù) i 1 2 3 4 Yt 第t季度的銷售量 a 待定系數(shù) b 待定系數(shù) T 預(yù)測期季度數(shù) 預(yù)測過程如下 1 六年各相同季節(jié)的平均銷售量 Ai A1 1970 6 262 單位 同理A2 180 A3 138 3 A4 180 單位 2 六年所有季度的平均銷售量 B 單位 M 6年銷售量總和 3 各季節(jié)銷售指數(shù) Ci C1 262 19 1 38同理C2 0 95 C3 0 73 C4 0 954 修正2002年各季度預(yù)測值 1 建立時間序列線性回歸預(yù)測模型由上表可得知各有關(guān)數(shù)據(jù) 利用公式 1 2 y t 190 1 90T式中T 23 21 1 1 3 23 2 修正2002年各季度預(yù)測值第一季度預(yù)測值 190 1 90 25 1 38 328 單位 第二季度預(yù)測值 190 1 90 27 0 95 229 單位 第三季度預(yù)測值 190 1 90 29 0 73 179 單位 第三季度預(yù)測值 190 1 90 31 0 95 236 單位 注意 如果n為奇數(shù) 例如n 9 則T 4 3 2 1 0 1 2 3 4 季節(jié)銷售指數(shù)也可以按月計算 先列出各個年度每個月份的銷售量 見下表 計算過程如下 A 各月合計值 年數(shù)A1 176 3 58 7 單位 A2 189 3 63 單位 A12 195 3 65 單位 2 計算所有月份的月平均值銷售量 B B 所有月份的合計值 年數(shù) 12B 1976 3 12 54 9 單位 3 求各月份季節(jié)銷售指數(shù) C Ci A B 在本例中 由公式 1 2 得a 54 9 b 0 13 從而yt 54 9 0 13T Ci 若預(yù)測2002年1月份和8月份的銷售量 計算如下 2002年1月和8月份的銷售額分別為y19 54 9 0 13 37 1 07 63 89y26 54 9 0 13 51 0 62 38 15 例某公司從1996年到2001年 每一年各季度的紡織品銷售量見下表 預(yù)測2010年各季度紡織品的銷售量 單位 件 預(yù)測過程如下 1 六年各相同季節(jié)的平均銷售量 Ai A1 1970 6 262 單位 同理A2 180 A3 138 3 A4 180 單位 2 六年所有季度的平均銷售量 B M 6年銷售量總和B M 4 6 4560 24 190 單位 3 各季節(jié)銷售指數(shù) Ci Ai B C1 262 19 1 38同理C2 0 95 C3 0 73 C4 0 954 修正2010年各季度預(yù)測值Yt a b T Ci 1 建立時間序列方程式Y(jié) a b T由上表可得知各有關(guān)數(shù)據(jù) 利用公式a yt n 4560 24 190b yt T T2 8760 4600 1 9y 190 1 90T式中T 23 21 1 1 3 23 2 修正2010年各季度預(yù)測值第一季度預(yù)測值 190 1 90 25 1 38 328 單位 第二季度預(yù)測值 190 1 90 27 0 95 229 單位 第三季度預(yù)測值 190 1 90 29 0 73 179 單位 第三季度預(yù)測值 190 1 90 31 0 95 236 單位 10 3 4綜合分析 常用綜合分析模型加法模型乘法模型混合模型 例10 3 7對1993年 2000年中國社會消費品零售總額序列 數(shù)據(jù)見附錄1 11 進行確定性時序分析 1 繪制時序圖 2 選擇擬合模型 長期遞增趨勢和以年為固定周期的季節(jié)波動同時作用于該序列 因而嘗試使用混合模型 b 擬合該序列的發(fā)展 3 計算季節(jié)指數(shù) 季節(jié)指數(shù)圖 季節(jié)調(diào)整后的序列圖 4 擬合長期趨勢 5 殘差檢驗 6 短期預(yù)測 混合模型 對于既含有線性趨勢成分又含有季節(jié)成分的時間序列 須對其成分進行分解 這種分解建立在以下乘法模型的基礎(chǔ)上 其中 Tt表示趨勢成分 St表示季節(jié)成分 It表示不規(guī)則成分 由于不規(guī)則成分的不可預(yù)測 因此預(yù)測值就可表示為趨勢成分和季節(jié)成分的乘積 建立季節(jié)指數(shù)模型的一般步驟如下 第一步 計算每一季 每季度 每月等等 的季節(jié)指數(shù)St 第二步 用時間序列的每一個觀測值除以適當(dāng)?shù)募竟?jié)指數(shù) 消除季節(jié)影響 第三步 為消除了季節(jié)影響的時間序列建立適當(dāng)?shù)内厔菽P筒⒂眠@個模型進行預(yù)測 第四步 用預(yù)測值乘以季節(jié)指數(shù) 計算出最終的帶季節(jié)影響的預(yù)測值 例某工廠過去4年的電視機銷量如表4 2所示 表4 2四年內(nèi)每季度的電視機銷量這些數(shù)據(jù)有明顯的季節(jié)性波動 試在Excel工作表中建立一個季節(jié)指數(shù)模型來預(yù)測第5年每個季度的電視機銷量 10 4回歸預(yù)測法 回歸 regression 這一術(shù)語來自英國人FrancisGalton和他的朋友KarlPearson對父親身高與兒子身高之間關(guān)系的研究 他們發(fā)現(xiàn)父親與兒子的身高有著顯著的正相關(guān)關(guān)系 并且身高的變化不是兩級分化而是 趨同 回歸是研究某一變量與其它一個或是多個變量之間的關(guān)系 回歸的方法目前在經(jīng)濟學(xué)與管理學(xué)中有著越來越廣泛的運用 而計量經(jīng)濟學(xué)也是經(jīng)濟學(xué)中一個重要的分支 或者說是經(jīng)濟學(xué)與管理學(xué)研究的重要方法 是一門很深的學(xué)問 市場蘊含著紛繁復(fù)雜的各種變量 而各種變量之間卻又有著某種依存關(guān)系 回歸的目的就是要推定一個變量對另一個變量所具有的因果效應(yīng) 比如 在分析消費需求時 我們想知道商品價格變化對其需求量的影響 只要保持其他因素 收入 其他商品價格 個人偏好等 都不變 這時價格變化與需求量之間就存在一種因果關(guān)系 在經(jīng)濟預(yù)測中 人們把預(yù)測對象當(dāng)作因變量 把那些與預(yù)測對象有關(guān)的因素當(dāng)作自變量 收集自變量的充分數(shù)據(jù) 應(yīng)用相關(guān)理論知識 建立回歸方程 并進行預(yù)測比如 我們要預(yù)測某地區(qū)工業(yè)增加值 就可以利用C D生產(chǎn)函數(shù)建立回歸模型 這時因變量就是工業(yè)增加值 自變量有資本投入 勞動投入 技術(shù)進步的因素等 比如 夏天飲料的需求量與兒童溺水?dāng)?shù)量之間存在高度的相關(guān)關(guān)系 但是根據(jù)常識我們可以判斷兩者之間并沒有因果關(guān)系 但是我們?nèi)绻莆樟顺浞值臄?shù)據(jù) 還是可以作出相關(guān)的預(yù)測 在經(jīng)濟預(yù)測中 人們把預(yù)測對象當(dāng)作因變量 把那些與預(yù)測對象有關(guān)的因素當(dāng)作自變量 收集自變量的充分數(shù)據(jù) 應(yīng)用相關(guān)分析和回歸分析求得回歸方程 并利用回歸方程進行預(yù)測 回歸預(yù)測法中的自變量 與時間序列預(yù)測法中的自變量不相同 后者的自變量是時間本身 而前者的自變量不是時間本身 而是其他的變量 回歸預(yù)測法中的自變量與因變量之間 有的屬于因果關(guān)系 有的屑于伴隨關(guān)系 不能認為只有因果關(guān)系才能進行回歸預(yù)測 實際上伴隨關(guān)系也是一種相關(guān)關(guān)系 只要收集大量的足夠的資料 也可以用回歸預(yù)測法進行預(yù)測 在回歸預(yù)測法中 自變量不是隨機的或者是給定的 這與相關(guān)分析中自變量有所區(qū)別 相關(guān)分析中的自變量是隨機的 回歸分析預(yù)測法是預(yù)測學(xué)的基本方法 它是在分析因變量與自變量之間的相互關(guān)系 建立變量間的數(shù)量關(guān)系近似表達的函數(shù)方程 并進行參數(shù)估計和顯著性檢驗以后 運用回歸方程式預(yù)測因變量數(shù)值變化的方法回歸分析預(yù)測法的具體步驟1 確定預(yù)測目標(biāo)和影響因素2 進行相關(guān)分析3 建立回歸預(yù)測模型4 回歸預(yù)測模型的檢驗5 進行實際預(yù)測具體來說 1 憑借研究者的理論和經(jīng)驗確定分析對象之間的相關(guān)關(guān)系 確定因變量 2 篩選自變量 分析各自變量與因變量之間的相關(guān)關(guān)系 觀察其相關(guān)關(guān)系的表現(xiàn)形式及密切程度 選用那些與因變量關(guān)系最為密切的自變量 在用多元回歸預(yù)測時 還要分析各自變量之間的相關(guān)關(guān)系 選用那些關(guān)系不密切的自變量 如有兩個自變量相互關(guān)系很密切 則應(yīng)舍棄其中的一個 3 確定回歸方程式 根據(jù)理論分析和相關(guān)分析 確定用怎樣的回歸模型來進行分析 這也是回歸分析的關(guān)鍵和難度所在 4 相關(guān)檢驗 對回歸方程估計結(jié)果進行相關(guān)系數(shù) 顯著性 t檢驗等等 確定回歸模型的適用性 5 預(yù)測 運用回歸法進行定量預(yù)測 必須有以下三個條件 1 預(yù)測對象與影響因素之間必須存在因果關(guān)系 2 過去和現(xiàn)在的數(shù)據(jù)規(guī)律 能夠反映未來 3 數(shù)據(jù)的分布確有線性趨勢 可采用線性解 如不是線性趨勢 則可用非線性解 回歸預(yù)測法的種類1 一元回歸預(yù)測 古典線型回歸 一元回歸預(yù)測就是用相關(guān)分析法分析一個自變量和一個因變量之間的相關(guān)關(guān)系 并進行預(yù)測 例如 從居民貨幣收入預(yù)測某種耐用消費品的銷售量 從工人勞動生產(chǎn)率預(yù)測利潤額 從施肥量預(yù)測農(nóng)作物的產(chǎn)量 2 多元回歸預(yù)測 多元回歸預(yù)測就是分析因變量與若干個自變量的相關(guān)關(guān)系 建立多元回歸方程 從若干自變量的變化去預(yù)測因變量的變化程度和未來的數(shù)量狀況 例如 從施肥量 氣溫 降雨量去預(yù)測某種農(nóng)作物的收獲率 從商業(yè)企業(yè)的職工勞動生產(chǎn)率和流通費率去預(yù)測利潤率等等 3 自回歸預(yù)測 自回歸預(yù)測就是用一個時間數(shù)列的因變量數(shù)列與向過去推移若干時期的一個或幾個自變量數(shù)列進行預(yù)測 例如對按月編制的時間數(shù)列 用今年1 12月的數(shù)列作為因變量數(shù)列 用以前某月至某月的數(shù)列作為自變量數(shù)列 計算其相關(guān)系數(shù) 建立回歸方程進行預(yù)測 還可分為線性回歸方程預(yù)測和非線性回歸方程預(yù)測兩種 a 影響GDP增長的因素有哪些 投資 消費 出口 貨幣供應(yīng)量等 b GDP與各種因素關(guān)系的性質(zhì)是什么 增 減 c 各影響因素與GDP的具體的數(shù)量關(guān)系 d 所作數(shù)量分析結(jié)果的可靠性如何 e 今后的發(fā)展趨勢怎么樣 例1 研究中國的GDP增長 10 4 1實例引入 例2 中國家庭汽車市場 a 汽車市場狀況如何 銷售量 b 影響汽車銷售量的主要因素是什么 收入 價格 道路狀況等 c 各種因素對汽車銷售量影響的性質(zhì)怎樣 正 負 無 d 各種因素影響汽車銷量的具體數(shù)量程度 e 以上分析所得結(jié)論是否可靠 f 今后發(fā)展的趨勢怎樣 以上問題的共性 提出所研究的問題分析影響因素 根據(jù)經(jīng)濟理論 實際經(jīng)驗 分析各種因素與所研究的現(xiàn)象的相互關(guān)系 需要科學(xué)的數(shù)量分析方法 分析所研究的現(xiàn)象與各種影響因素的數(shù)量關(guān)系 需要運用統(tǒng)計方法 分析和檢驗所得數(shù)量結(jié)論的可靠性 測算所研究經(jīng)濟問題的發(fā)展趨勢 預(yù)測未來 一 變量 在不同時間 空間有不同狀況 取不同數(shù)值的因素稱為變量 其分類為 1 被解釋變量 因變量 變量 參數(shù) 數(shù)據(jù) 2 解釋變量 自變量 3 滯后變量 被解釋變量 因變量 模型中要分析研究的變量 解釋變量 自變量 說明因變量變動原因的變量 例 收入決定模型 其中 消費支出C 投資I 進口IM 稅收T 收入Y 政府支出G 出口E 其中 消費支出C 投資I 進口IM 稅收T 收入Y是被解釋 內(nèi)生 變量政府支出G 出口E 是解釋變量 通過計劃 預(yù)算來確定 有兩個滯后變量 作用視同解釋變量 二 數(shù)據(jù) 1 時間序列數(shù)據(jù) 按照時間先后順序排列的統(tǒng)計數(shù)據(jù) 例 時期 時點指標(biāo) 3 混合數(shù)據(jù) 既有時間序列數(shù)據(jù) 又有截面數(shù)據(jù) 例 居民收支調(diào)查中收集的對各個固定調(diào)查戶在不同時期的調(diào)查數(shù)據(jù) 2 截面數(shù)據(jù) 是在同一時間 不同空間的某個指標(biāo)組成的數(shù)列 如 工業(yè)普查數(shù)據(jù) 人口普查數(shù)據(jù) 家計調(diào)查數(shù)據(jù)等 4 虛擬變量數(shù)據(jù) 僅取0和1兩個變量值的 模型建立步驟 可以運用計量方法研究這類問題 一般分為四個步驟 4 1模型設(shè)定4 2估計參數(shù)4 3模型檢驗4 4模型應(yīng)用 研究過程 有關(guān)理論 實踐活動 搜集統(tǒng)計數(shù)據(jù) 設(shè)定計量模型 參數(shù)估計 模型檢驗 預(yù)測 政策評價 模型修訂 結(jié)構(gòu)分析 符合 不符合 是否符合標(biāo)準(zhǔn) 模型應(yīng)用 10 4 2模型設(shè)定 4 1 1經(jīng)濟模型 模型 對經(jīng)濟現(xiàn)象或過程的一種數(shù)學(xué)模擬 設(shè)定 Specification 把所研究的經(jīng)濟變量之間的關(guān)系用適當(dāng)?shù)臄?shù)學(xué)關(guān)系式表達出來 例 消費函數(shù)y a bx 4 1 2構(gòu)成計量經(jīng)濟模型的要素 例 消費函數(shù)y a bx u 經(jīng)濟變量 y x 經(jīng)濟參數(shù) a b 待估計 隨機擾動項u模型構(gòu)成要素之說明 例 消費函數(shù)y a bx u 經(jīng)濟變量 y x 不同時間 不同空間的表現(xiàn)不同 取值不同 可以觀測 經(jīng)濟參數(shù) a b 比較穩(wěn)定的因素 決定經(jīng)濟的特征 參數(shù)是計量經(jīng)濟模型中表現(xiàn)經(jīng)濟變量相互依存程度的因素 是一個相對穩(wěn)定的量 4 1 3設(shè)定模型的要求 要有科學(xué)的理論依據(jù) 選擇適當(dāng)?shù)臄?shù)學(xué)形式 單方程還是多方程 線性還是非線性的選擇 方程應(yīng)是有解的 形式盡可能簡單 模型要兼顧真實性和實用性 包含隨機擾動項 方程中的變量要具有可觀測性 10 4 3建模步驟 經(jīng)濟理論或假說的陳述 建立數(shù)學(xué) 數(shù)理經(jīng)濟 模型 建立統(tǒng)計或計量經(jīng)濟模型 收集處理數(shù)據(jù) 模型的參數(shù)估計 檢驗來自模型的假說 現(xiàn)實意義檢驗 檢驗?zāi)P偷恼_性 模型的假設(shè)檢驗 模型的運用 預(yù)測 結(jié)構(gòu)分析 政策模擬等 10 4 4估計參數(shù) 一般地 參數(shù)是未知的 不可直接觀測 參數(shù)要通過樣本數(shù)據(jù) 選擇適當(dāng)?shù)姆椒右怨烙?如何通過樣本數(shù)據(jù)估計參數(shù)是計量經(jīng)濟學(xué)的核心內(nèi)容 參數(shù)估計值 所估計的參數(shù)的具體數(shù)值參數(shù)估計式 用未知的樣本數(shù)據(jù)表示的待估計參數(shù)表達式 參數(shù)估計的常用方法 普通最小二乘法 OLS 極大似然估計法 ML 等 10 4 5模型檢驗 檢驗是對模型和所估計的參數(shù)加以評定 判斷在經(jīng)濟理論上是否有意義 在統(tǒng)計上是否顯著 為什么要進行檢驗 理論依據(jù)可能不充分 統(tǒng)計數(shù)據(jù)或其他信息可能不可靠樣本可能較小 結(jié)論只是抽樣的某種偶然結(jié)果 可能違反計量經(jīng)濟估計的基本假定 模型的檢驗方式 理論意義 現(xiàn)實意義檢驗 是否與理論 現(xiàn)實相符 統(tǒng)計推斷檢驗 檢驗參數(shù)值是否為抽樣的偶然結(jié)果 計量檢驗 是否符合基本假定 預(yù)測檢驗 將模型預(yù)測結(jié)果與現(xiàn)象運行的實際對比 10 4 6模型應(yīng)用 結(jié)構(gòu)分析 分析變量之間的數(shù)量比例關(guān)系 如邊際分析 彈性分析 變化率之比 乘數(shù)分析 變化量之比 比較靜力學(xué)分析預(yù)測 包含動態(tài)預(yù)測和空間預(yù)測 對非穩(wěn)定發(fā)展的過程無能為力 滯后于理論和現(xiàn)實的模型在應(yīng)用中也會遇到障礙 政策評價 用模型對政策方案作模擬測算 對政策方案作評價 模型形式a 線性模型b 非線性模型 雙對數(shù)模型 半對數(shù)模型 倒數(shù)模型非線性模型一般都要轉(zhuǎn)化為線性模型來估計 1 線性模型 對變量 參數(shù) 2 非線性模型 被解釋與解釋變量之間 被解釋變量與參數(shù)之間 例如 1 2可線性化 1 多項式函數(shù) 常見的可線性化模型 2 雙對數(shù)方程 基本形式 冪函數(shù) 雙對數(shù)方程的斜率參數(shù)可以衡量因變量Y關(guān)于解釋變量X的彈性 表示 當(dāng)X每變動1 時 因變量Y平均變動的百分比 事實上 有 3 半對數(shù)方程 在第一個方程中斜率參數(shù)等于Y的相對變動與X絕對變動之比 模型叫增長模型 它可以描述某種經(jīng)濟現(xiàn)象隨著時間變化而變動的趨勢 第二個半對數(shù)方程的斜率系數(shù)表示當(dāng)自變量發(fā)生一個單位的相對變動時 引起的因變量Y的平均絕對變動 4 倒數(shù)變換模型 基本形式 注 Y隨著X增大而非線性地增大 最終接近一條直線 Y隨著X的增加而非線性地減少 重要特點 被解釋變量Y存在極限 例 若Y為平均成本 X為產(chǎn)量 則平均成本Y隨著產(chǎn)量增加而不斷下降 但它決不可能等于或小于 10 4 7回歸實例 一元線型回歸分析 一元線型回歸 古典線型回歸 預(yù)測是指成對的兩個變量數(shù)據(jù)分布大體上呈直線趨勢時 運用合適的參數(shù)估計方法 求出一元線性回歸模型 然后根據(jù)自變量與因變量之間的關(guān)系 預(yù)測因變量的趨勢 很多社會經(jīng)濟現(xiàn)象之間都存在一一對應(yīng)的相關(guān)關(guān)系 因此 一元線性回歸預(yù)測有很廣泛的應(yīng)用 比如 家庭的消費支出與家庭收入之間存在很強的相關(guān)關(guān)系 甚至是一種線型關(guān)系 線性回歸模型及其假定一般地 一元線型回歸模型具有如下形式 yi xi i i 1 n 其中y是因變量或稱為被解釋變量 x是自變量或稱為解釋變量 i標(biāo)志n個樣本觀測值中的一個 構(gòu)成古典線性回歸模型的一組基本假設(shè)為 1 函數(shù)形式 yi xi i i 1 n 2 干擾項的零均值 對所有i 有 E i 0 3 同方差性 對所有i 有 Var i 2 且是一個常數(shù) 4 無自相關(guān) 對所有i j 則Cov i j 0 5 回歸量和干擾項的非相關(guān) 對所有i和j有Cov xi j 0 6 正態(tài)性 對所有i i滿足正態(tài)分布N 0 2 用最小二乘法 OLS 進行參數(shù)估計得到的估計表達式為 在估計了參數(shù)之后 就可以得到一元線型方程 這樣帶入自變量x的值 就可以進行對因變量y的預(yù)測 在預(yù)測之前 還需要對估計結(jié)果作假設(shè)檢驗 1 R檢驗相關(guān)系數(shù)R 衡量自變量與因變量關(guān)系密切程度的指標(biāo) 表示自變量解釋了因變量變動的百分比 可見相關(guān)系數(shù)R取值于0 1之間 一般在實際預(yù)測時 R 0 7就認為因變量與自變量高度相關(guān) x是y的主要影響因素 0 3 R 0 7 認為相關(guān) R 0 3 弱相關(guān) 不能認為x是y的主要影響因素 如果要用一元線型回歸方程來預(yù)測 一般要求R要大于0 7 2 t檢驗T檢驗是用來檢驗一元線型回歸模型是否成立的一種方法 通過構(gòu)造統(tǒng)計量T 并給定一定的顯著性水平 可以計算 通過查表 如果 則可以認為回歸模型顯著 否則回歸模型不成立 比如 在95 顯著程度下 并且n很大時 后者為1 96 3 F檢驗通過構(gòu)造統(tǒng)計量F 并給定一定的顯著水平 計算統(tǒng)計量F 查F分布表 可得如果 則一元線型回歸模型成立 否則線型回歸不顯著 一元線型回歸預(yù)測 用回歸方程計算出來的預(yù)測值 是一個具體的數(shù) 稱為點預(yù)測 點預(yù)測值是一個平均數(shù) 實際值可能高于或低于它 還必須用一定的機率保證其置信區(qū)間的范圍 也就是區(qū)間估計 為了計算置信區(qū)間 就要計算預(yù)測值的標(biāo)準(zhǔn)誤差 其計算公式如下 根據(jù)概率論證明 在數(shù)據(jù)較多時置信區(qū)間為 置信度為68 3 兩個S為95 45 三個S為99 7 擴大置信區(qū)間 可以增加預(yù)測的可靠程度 但如果置信區(qū)間很寬 就會使預(yù)測結(jié)果沒有多大意義 根據(jù)經(jīng)驗 企業(yè)的商品銷售額同廣告費支出之間具有相關(guān)關(guān)系 某企業(yè)1990年至1999年的商品銷售額和廣告費支出的資料如表12 1所示 某企業(yè)商品銷售額與廣告費支出表 廣告費支出 萬元 商品銷售額 百萬元 資料來源 徐國強著 管理統(tǒng)計學(xué) 上海財經(jīng)大學(xué)出版社1998 預(yù)測該企業(yè)2002年的廣告費支出為35萬元 要求在95 的概率下預(yù)測該年的商品銷售額 分析提示 1 進行相關(guān)分析 在坐標(biāo)系上將廣告費支出和商品銷售額的數(shù)據(jù)標(biāo)出 形成散點圖 可以發(fā)現(xiàn)呈現(xiàn)直線趨勢 從而判定二者呈一元回歸 2 建立回歸方程 回歸方程為 關(guān)鍵是求參數(shù)a b的值 根據(jù)表12 1計算的有關(guān)數(shù)據(jù) 利用最小平方法可以求出 所求回歸方程是 3 進行檢驗 1 相關(guān)系數(shù) 取顯著性水平 0 05 df n 2 8 查相關(guān)系數(shù)臨界值表得 因為 說明廣告費支出與商品銷售額存在很強的正相關(guān)關(guān)系 2 決定系數(shù) 檢驗和F檢驗 決定系數(shù)檢驗和F檢驗都是用來檢驗回歸方程線性關(guān)系的顯著性 二者在檢驗原理上大體相同 均借助了方差分析 其中 總變差 剩余變差 回歸變差 決定系數(shù) 利用回歸變差 點變差 總變差的比重說明回歸直線的代表性 若這個比例越大 則說明x與y之間關(guān)系越密切 回歸直線代表性越好 一般地 的取值在0 1之間 F檢驗法將自變量作為一個整體來檢驗與因變量之間的線性關(guān)系是否顯著 其計算為 取顯著性水平 0 05 df1 1 df2 n 2 8 查F分布表得 因為F 說明廣告費支出與商品銷售額線性關(guān)系顯著 這與決定系數(shù) 檢驗結(jié)論一致 百萬元 即 2002年的商品銷售額可望達到49 595百萬元 4 進行預(yù)測 1 點預(yù)測 2002年的廣告費支出預(yù)計為35萬元 萬元代入回歸方程 2 區(qū)間預(yù)測 計算估計標(biāo)準(zhǔn)誤差 df 8 查t分布表 得 即 2002年的商品銷售額可望達到49 595百萬元 因為 當(dāng)廣告費支出達到 萬元時 商品銷售額的預(yù)測區(qū)間為 即 若以95 的把握程度預(yù)測 當(dāng)廣告費支出達到35萬元時 商品的銷售額在45 864 53 326百萬元之間 現(xiàn)實生活中引起被解釋變量變化的因素并非僅只一個解釋變量 可能有很多個解釋變量 例如 產(chǎn)出往往受各種投入要素 資本 勞動 技術(shù)等的影響 銷售額往往受價格和公司對廣告費的投入的影響等 所以多元線性模型 解釋變量個數(shù) 2更為常見 二 多元線性回歸模型及其假定條件 模型的建立 在實際問題中 有時一個變量受到一個或多個解釋變量影響 這時就需要建立多元回歸模型進行研究 假定變量yt與k個變量xjt j 1 k 1 存在線性關(guān)系 多元線性回歸模型表示為 其中yt是被解釋變量 因變量 xjt是解釋變量 自變量 ut是隨機誤差項 i i 0 1 k 1是回歸參數(shù) 通常未知 這說明xjt j 1 k 是yt的重要解釋變量 ut代表眾多影響yt變化的微小因素 當(dāng)給定一個容量為的樣本 樣本觀測值為得 當(dāng)給定一個容量為 得 為保證用OLS法得到最優(yōu)估計量 該回歸模型應(yīng)滿足如下假定條件 假定 隨機誤差項向量u是非自相關(guān)的 同方差的 其中每一項都滿足均值為零 方差為 相同且為有限值 即且 假定 解釋變量與誤差項相互獨立 即 假定 解釋變量之間線性無關(guān) 其中表示矩陣的秩 假定 解釋變量是非隨機的 且當(dāng)時 多元線性回歸模型的參數(shù)估計 1 普通最小二乘法 OLS 最小二乘法 OLS 的原理是通過求殘差 誤差項的估計值 平方和最小確定回歸參數(shù)估計值 這是求極值問題 用Q表示殘差平方和 求其最小值條件下的回歸參數(shù)的估計值 得到下列方程組 求參數(shù)估計值的實質(zhì)是求一個k 1元方程組 2 正規(guī)方程 最小二乘法的矩陣表示 3 正規(guī)方程的結(jié)構(gòu) 被解釋變量觀測值nx1 解釋變量觀測值 含虛擬變量nx k 1 設(shè)計矩陣 實對稱 k 1 x k 1 矩陣 正規(guī)方程右端 k 1 x1 回歸系數(shù)矩陣 k 1 x1 高斯乘數(shù)矩陣 設(shè)計矩陣的逆 殘差向量 nx1 被解釋變量的擬合 預(yù)測 向量nx1 4 最小二乘估計量的性質(zhì) 線性 估計量都是被解釋變量觀測值的線性組合 無偏性 估計量的數(shù)學(xué)期望 被估計的真值 有效性 估計量的方差是所有線性無偏估計中最小的 因為X的元素是非隨機的 X X 1X是一個常數(shù)矩陣 由上式知是Y的線性組合 為線性估計量 具有線性特性 2 無偏特性 1 線性 3 有效性 具有最小方差特性 5 隨機誤差項的方差的估計量 若已知 則定義則上式寫為矩陣M有如下性質(zhì) 存在 為階的滿秩陣因此 必須有 此為最小樣本容量 滿足基本要求的樣本容量 一般經(jīng)驗認為 n 30或者n 3 k 1 才能滿足模型估計的基本要求 n 3 k 1 時 t分布才穩(wěn)定 檢驗才較為有效 6 樣本容量問題 樣本是一個重要的實際問題 模型依賴于實際樣本 獲取樣本需要成本 企圖通過樣本容量的確定減輕收集數(shù)據(jù)的困難 最小樣本容量 滿足基本要求的樣本容量 回歸分析是要通過樣本所估計的參數(shù)來代替總體的真實參數(shù) 或者說是用樣本回歸線代替總體回歸 盡管從統(tǒng)計性質(zhì)上已知 如果有足夠多的重復(fù)抽樣 參數(shù)的估計值的期望 均值 就等于其總體的參數(shù)真值 但在一次抽樣中 估計值不一定就等于該真值 那么 在一次抽樣中 參數(shù)的估計值與真值的差異有多大 是否顯著 這就需要進一步進行統(tǒng)計檢驗 主要包括擬合優(yōu)度檢驗 變量的顯著性檢驗及模型整體的顯著性檢驗 多元線性回歸模型的統(tǒng)計檢驗 1 擬合優(yōu)度檢驗 總離差平方和的分解 注意英文縮小的含義TSS TotalSquareSum 總離差平方和RSS RegressionSquareSum 回歸平方和ResidualSquareSum 殘差平方和ESS ErrorSquareSum 誤差平方和 殘差平方和 ExplainSquareSum 解釋平方和 回歸平方和 平方和分解的意義TSS RSS ESS被解釋變量Y總的變動 差異 解釋變量X引起的變動 差異 除X以外的因素引起的變動 差異 如果X引起的變動在Y的總變動中占很大比例 那么X很好地解釋了Y 否則 X不能很好地解釋Y 2 樣本可決系數(shù) 樣本可決系數(shù)是擬合優(yōu)度評價的最重要指標(biāo) 殘差的標(biāo)準(zhǔn)差也能作為擬合優(yōu)度評價的參考指標(biāo)樣本可決系數(shù) ThecoefficientofDetermination R2隨機項 的方差 2的最小二乘估計量 相關(guān)系數(shù)計算方法與樣本決定系數(shù)一樣含義有所不同 樣本可決系數(shù)是判斷回歸方程與樣本觀測值擬合優(yōu)度的一個數(shù)量指標(biāo) 隱含的前提條件是X和Y具有因果關(guān)系相關(guān)系數(shù)是判斷兩個隨機變量線性相關(guān)的密切程度 不考慮因果關(guān)系 調(diào)整的可決系數(shù) adjustedcoefficientofdetemination 增加解釋變量時 很可能增加R2 容易引起錯覺 認為只要在回歸模型中增加解釋變量就可以了 因此考慮對R2進行修正思考 調(diào)整的可決系數(shù)能否為負 如果為負 說明什么問題 注意TSS ESS RSS的自由度 TSS 離差平方和 n 1 RSS 殘差平方和 n k 1 ESS

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論