預(yù)測模型數(shù)據(jù)處理方法PPT_第1頁
預(yù)測模型數(shù)據(jù)處理方法PPT_第2頁
預(yù)測模型數(shù)據(jù)處理方法PPT_第3頁
預(yù)測模型數(shù)據(jù)處理方法PPT_第4頁
預(yù)測模型數(shù)據(jù)處理方法PPT_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、關(guān)于預(yù)測模型數(shù)據(jù)處理方法第一張,PPT共三十頁,創(chuàng)作于2022年6月 最近幾年,在全國大學(xué)生數(shù)學(xué)建模競賽常常出現(xiàn)預(yù)測模型或是與預(yù)測有關(guān)的題目,例如疾病的傳播,雨量的預(yù)報(bào),人口的預(yù)測等。什么是預(yù)測模型?如何預(yù)測?有那些方法?對此下面作些介紹。 預(yù)測的目的在于認(rèn)識自然和社會發(fā)展規(guī)律,以及在不同歷史條件下各種規(guī)律的相互作用,揭示事物發(fā)展的方向和趨勢,分析事物發(fā)展的途徑和條件,使人們盡早地預(yù)知未來的狀況和將要發(fā)生的事情,并能動(dòng)地控制其發(fā)展,使其為人類和社會進(jìn)步服務(wù)。 第二張,PPT共三十頁,創(chuàng)作于2022年6月一 預(yù)測的前期準(zhǔn)備工作 為保證預(yù)測結(jié)果的精確度,預(yù)測之前必須做一系列的準(zhǔn)備工作: (一)數(shù)據(jù)

2、的準(zhǔn)備: 數(shù)據(jù)的收集和整理;數(shù)據(jù)的分析和處理;數(shù)據(jù)的內(nèi)涵及數(shù)量; 第三張,PPT共三十頁,創(chuàng)作于2022年6月數(shù)據(jù)處理的原則 準(zhǔn)確,處理后的數(shù)據(jù)能正確反映事物發(fā)展的未來趨勢和狀況;及時(shí),數(shù)據(jù)的處理要及時(shí); 適用,處理的數(shù)據(jù)能滿足建模的需要; 經(jīng)濟(jì),要盡量減少數(shù)據(jù)處理的費(fèi)用,以降低預(yù)測成本; 一致,處理的數(shù)據(jù)在整個(gè)比較性。使用期間內(nèi)必須是一致的,具有可比較性 第四張,PPT共三十頁,創(chuàng)作于2022年6月數(shù)據(jù)處理的方法 (1)判別法 通過對歷史數(shù)據(jù)的判斷,選擇其中可代表整個(gè)預(yù)測過程中很可能發(fā)生的模式的數(shù)據(jù)作為建模數(shù)據(jù)(2)剔除法 如果數(shù)據(jù)量比較大,且非必須具備連續(xù)的數(shù)據(jù)量,這時(shí)可剔除數(shù)據(jù)中受隨機(jī)干

3、擾的異常值;(3)平均值法 在數(shù)據(jù)比較少或需要連續(xù)數(shù)據(jù)時(shí),則可采取平均值法對數(shù)據(jù)進(jìn)行處理。 第五張,PPT共三十頁,創(chuàng)作于2022年6月(4)拉平法 由于條件發(fā)生變化,常常使一些厲史數(shù)據(jù)不能反映現(xiàn)時(shí)的情況,例如,大型鋼鐵廠、化肥廠、或油氣田的建成投產(chǎn)或開發(fā),可以使產(chǎn)量猛增,這時(shí)歷史數(shù)據(jù)將發(fā)生突變,出現(xiàn)一個(gè)轉(zhuǎn)折,如用這類數(shù)據(jù)建模,則需要處理。這時(shí)拉平法是一種較好的方法。它的原理是對轉(zhuǎn)折點(diǎn)前的數(shù)據(jù)加一個(gè)適當(dāng)?shù)牧恐?,使其與折點(diǎn)后的數(shù)據(jù)走向一致。(5)比例法 銷售條件與環(huán)境的變化常常會引起一個(gè)企業(yè)產(chǎn)品市場銷售比例的改變。當(dāng)比例變化較大時(shí),說明銷售條件與環(huán)境對銷售的影響己超過其他因素對銷第六張,PPT共

4、三十頁,創(chuàng)作于2022年6月售的影響,也說明以前的銷售統(tǒng)計(jì)數(shù)據(jù)所體現(xiàn)出的銷售發(fā)展規(guī)律不再適用之于目前的情況了。如果仍然利用這些數(shù)據(jù)建立預(yù)測模型,將無法體現(xiàn)銷售條件和環(huán)境變化后的銷售量變化的規(guī)律,用這樣的模型進(jìn)行預(yù)測,將會造成較大的誤差。因此,如果還想利用這些數(shù)據(jù)建立模型,進(jìn)行預(yù)測,就應(yīng)該把它們處理成能體現(xiàn)條件與環(huán)境發(fā)生變化之后的情況的數(shù)據(jù)。對于這類數(shù)據(jù),比例法就是一種比較有效的處理方法。 (6)移動(dòng)平均和指數(shù)平滑法如果原始數(shù)據(jù)總體走向具有一定規(guī)律性,但因受隨第七張,PPT共三十頁,創(chuàng)作于2022年6月機(jī)因素干擾,數(shù)據(jù)離散度很大,采用平均值法也難以處理。這時(shí)可采用一次、二次、甚至三次移動(dòng)平均和指

5、數(shù)平滑對數(shù)據(jù)進(jìn)行平滑,用平滑的數(shù)據(jù)建模。在分解預(yù)測時(shí),為處理季節(jié)數(shù)據(jù),則必須采用高次冪的移動(dòng)平均法,對數(shù)據(jù)平滑。(7)差分法 有些模型,例如鮑克斯-詹金斯模型只能處理平穩(wěn)數(shù)據(jù),如果原始數(shù)據(jù)為非平穩(wěn)數(shù)據(jù),則需釆取差分處理。差分有三種主要類型:前向差分、后向差分、中心差分。第八張,PPT共三十頁,創(chuàng)作于2022年6月前向差分:在處理時(shí)間數(shù)列時(shí),一階前向差分定義為一階前向差分是當(dāng)時(shí)間由t變到t+1時(shí), 的改變量。二階前向差分定義為后向差分:在處理時(shí)間數(shù)列時(shí),一階后向差分定義為一階后向差分是當(dāng)時(shí)間由t遞推到t-1時(shí), 的改變量。二階后向差分定義為第九張,PPT共三十頁,創(chuàng)作于2022年6月中心差分:在

6、處理時(shí)間數(shù)列時(shí),一階中心差分定義為二階中心差分為 在處理時(shí)間數(shù)列時(shí),主要應(yīng)用后向差分。一次多項(xiàng)式數(shù)據(jù)通過一階差分就可轉(zhuǎn)換為平穩(wěn)數(shù)據(jù),二次多項(xiàng)式和三次多項(xiàng)式數(shù)據(jù)分別通過二階和三階差分可轉(zhuǎn)換為平穩(wěn)數(shù)據(jù),而三次以上的高次多項(xiàng)式在應(yīng)用中很少采用。第十張,PPT共三十頁,創(chuàng)作于2022年6月二 預(yù)測的數(shù)學(xué)準(zhǔn)備 在預(yù)測過程中需要很多數(shù)學(xué)知識,主要有微分方程、概率與數(shù)理統(tǒng)計(jì)、線性規(guī)劃和非線性規(guī)劃等等。但使用最多的是統(tǒng)計(jì)學(xué)的相關(guān)知識:常用的統(tǒng)計(jì)量、參數(shù)的估算、假設(shè)檢驗(yàn)、區(qū)間估計(jì)等。這些我們就不做介紹了。第十一張,PPT共三十頁,創(chuàng)作于2022年6月定量預(yù)測法 時(shí)間序列模型 時(shí)間序列模型主要研究事物的自身發(fā)展規(guī)

7、律,借以預(yù)測事物的未來趨勢。主要方法有移動(dòng)平均、指數(shù)平滑、分解預(yù)測、鮑克斯詹金斯模型、多變量模型以及類推法等。 特點(diǎn)和應(yīng)用范圍 時(shí)間序列一般指一組按時(shí)間順序排列的數(shù)據(jù),展示了研究對象在一定時(shí)期的發(fā)生變化過程。時(shí)間序列模型,就是根據(jù)預(yù)測對象時(shí)間變化特征,研究事物自身的發(fā)展規(guī)律,探討未來發(fā)展趨勢,是一種重要的定量預(yù)測方法,包括多種模型,主要適用于經(jīng)濟(jì)預(yù)測、商業(yè)預(yù)測、需求預(yù)測、庫存預(yù)測等,預(yù)測期限主要為中、短期,不適用于有拐點(diǎn)的長期預(yù)測。第十二張,PPT共三十頁,創(chuàng)作于2022年6月(一)移動(dòng)平均值模型移動(dòng)平均法是一種最簡單的適應(yīng)模型,是在算術(shù)平均的基礎(chǔ)上發(fā)展起來的一種預(yù)測方法。算術(shù)平均雖能代表一組

8、數(shù)據(jù)的平均水平,但它不能反映數(shù)據(jù)的變化趨勢,而原始數(shù)據(jù)雖然存在某種趨勢,但數(shù)據(jù)可能是零散的或雜亂無章的,無法直接加以分析。移動(dòng)平均法克服了上述弱點(diǎn),其基本方法是,選一個(gè)固定的周期N,對數(shù)據(jù)進(jìn)行平均,每遞推一個(gè)周期就加上后一個(gè)數(shù)據(jù),舍去初始數(shù)據(jù),依次類推,直至把數(shù)據(jù)處理完畢。 第十三張,PPT共三十頁,創(chuàng)作于2022年6月以N=5為例: 表示第五、第六個(gè)周期的一次移動(dòng)平均值,依次類推。若移動(dòng)平均的周期為N,則可得到計(jì)算移動(dòng)平均值的一般公式:其中,表示第t期的一次移動(dòng)平均值第十四張,PPT共三十頁,創(chuàng)作于2022年6月 可見,移動(dòng)平均法實(shí)際上是對于某一期數(shù)據(jù),取前N個(gè)數(shù)據(jù)進(jìn)行平均,N個(gè)數(shù)權(quán)數(shù)相同,

9、而其它數(shù)據(jù)的權(quán)這樣,經(jīng)過移動(dòng)平均,將消除數(shù)據(jù)列中異常的因素,對數(shù)據(jù)進(jìn)行修勻。一般情況下,如果數(shù)據(jù)沒有明顯的周期變化和趨勢變化,可用第t期的一次移動(dòng)平均值作為t+1期的預(yù)測值,即其一般公式為第十五張,PPT共三十頁,創(chuàng)作于2022年6月 表1中的的第一列和第二列,即是原始數(shù)據(jù)與一次移動(dòng)平均值的對比。始取N=3的3期移動(dòng)平均,則第三期數(shù)據(jù)的移動(dòng)值為5766.33,是l由(560057965930)/3得到的。如用于預(yù)測,它可以作為第4期的預(yù)測值。在一次移動(dòng)平均值的基礎(chǔ)上,應(yīng)用移動(dòng)平均的原理,還可以進(jìn)行二次甚至多次的移動(dòng)平均,二次移動(dòng)平均,就是以一項(xiàng)移動(dòng)平均值為原始數(shù)據(jù),再進(jìn)行一次移動(dòng)平均,如以N=

10、5為例:其公式為其公式為式中:表示第9期的二次移動(dòng)平均值, 第十六張,PPT共三十頁,創(chuàng)作于2022年6月其一般公式為 二次移動(dòng)平均使原始數(shù)據(jù)得到了進(jìn)一步修勻,使其顯現(xiàn)線性趨勢。表1中的第三列數(shù)據(jù)為N=3的二次移動(dòng)平均值。 第十七張,PPT共三十頁,創(chuàng)作于2022年6月移動(dòng)平均值 表(1) 第十八張,PPT共三十頁,創(chuàng)作于2022年6月式中:-預(yù)測超前期數(shù)通過查表(多項(xiàng)式模型參數(shù)估算公式)可知: 對于上表中的數(shù)據(jù),如以11期數(shù)據(jù)預(yù)測12期值,當(dāng)取N=3時(shí),則有: 在二次移動(dòng)平均值的基礎(chǔ)上,可建立線性模型: 第十九張,PPT共三十頁,創(chuàng)作于2022年6月預(yù)測方程為 第二十張,PPT共三十頁,創(chuàng)作

11、于2022年6月 使用移動(dòng)平均法,最重要的是移動(dòng)周期N的選擇。因?yàn)槭街校?移動(dòng)平均值方差 原始數(shù)據(jù)點(diǎn)方差N 數(shù)據(jù)點(diǎn)數(shù) 也就是說,移動(dòng)平均修勻后的方差,隨著N的加大而減少。也就是N越大,對原始數(shù)據(jù)修勻能力越強(qiáng)。下表數(shù)據(jù)可清楚反映這一規(guī)律。第二十一張,PPT共三十頁,創(chuàng)作于2022年6月(某日用品電器銷售額的移動(dòng)平均預(yù)測)表(2) 第二十二張,PPT共三十頁,創(chuàng)作于2022年6月 然而修勻能力與對外界變化的反映速度是互相矛盾的,兩者不能兼得。因此,對于N值一般應(yīng)視具體情況,采用折衷辦法確定。根據(jù)過程的實(shí)際發(fā)展趨勢,N值大體有如下四種選擇方法:(1)水平式 也就是趨勢保持不變,移動(dòng)平均值是無編差的,

12、M值與N值無關(guān)。(2)脈沖式 趨勢僅在某一段時(shí)間突然增加或減少,隨后又保持不變,N取得越大,M的誤差越小,因此N應(yīng)取得較大些。 (3)階梯式 趨勢僅在開始一段時(shí)間保持不變,然后增加或減少到一個(gè)新的水平后又保持不變,N取得越小,M的誤差越小,因此N應(yīng)取得較小。第二十三張,PPT共三十頁,創(chuàng)作于2022年6月(4)斜坡式 趨勢周期的遞增或遞減,M總是比實(shí)際趨向落后,因此N應(yīng)取得越小越好。 一般情況下,如欲加大原始數(shù)據(jù)的修句力度,則N宜取大些,如果希望加大對外界變化的反映力度,刨N宜取小些。N的取值范圍一般為320。例 我國19801990年工業(yè)勞動(dòng)人數(shù)見表,用二次移動(dòng)平均數(shù)法預(yù)測19911994年

13、的勞動(dòng)人數(shù)。19801990年我國工業(yè)勞動(dòng)人數(shù)(萬人)(表3)第二十四張,PPT共三十頁,創(chuàng)作于2022年6月 首先,選擇移動(dòng)平均周期N。本例中數(shù)據(jù)趨勢較明顯,呈直線趨勢,為盡量反映近期變化動(dòng)向,可取N=3。利用移動(dòng)平均公式,首先計(jì)算一次移動(dòng)平均數(shù): 第二十五張,PPT共三十頁,創(chuàng)作于2022年6月在此基礎(chǔ)上再計(jì)算二次移動(dòng)平均數(shù): 計(jì)算結(jié)果見(表)。根據(jù)表(3)的數(shù)據(jù)可建立線性趨勢模型: 第二十六張,PPT共三十頁,創(chuàng)作于2022年6月前已計(jì)算得: 則: 由此得19911994年勞動(dòng)人數(shù)分別為8338.7,8638.2,8937.7,和9236.2萬人。第二十七張,PPT共三十頁,創(chuàng)作于2022年6月(二) 指數(shù)平滑模型 在時(shí)間序列預(yù)測過程中,一般來說歷史數(shù)據(jù)對未來發(fā)展的影響是不等價(jià)的,數(shù)據(jù)由近及遠(yuǎn)對未來的影響

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論