版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
Chapter5信息分析方法(二)傳統(tǒng)的預測方法主要是統(tǒng)計預測方法,對歷史數(shù)據(jù)通過經(jīng)濟模型、回歸分析和時間序列等方法預測未來的趨勢。在擁有大量歷史數(shù)據(jù),而且關(guān)鍵變量間的關(guān)系在未來保持不變時,統(tǒng)計預測方法比較有效。但在動蕩多變和錯綜復雜的環(huán)境下,統(tǒng)計預測方法因其基于關(guān)鍵變量間的歷史聯(lián)系的假設(shè)跟實際情況不符而很難奏效。而情景分析法則通過對未來詳細地、嚴密地推理和描述來構(gòu)想未來各種可能的方案,從而能夠較好的輔助決策。2025/1/625.1情景分析法5.1.1情景分析法概述情景(Scenario)一詞有概要、劇本、劇情、情節(jié)或情況等意思。關(guān)于情景的定義,聯(lián)合國環(huán)境規(guī)劃署、千年生態(tài)評估項目等國際組織和機構(gòu)以及國內(nèi)外研究人員給出了數(shù)十種不盡相同的表述。具有以下幾個典型特點:情景是關(guān)于將來的;情景是描述性的;情景提供了一個可選擇的、多樣化的未來;情景分析需要系統(tǒng)性的過程。情景是一種基于對高驅(qū)動力和高不確定性因素的假設(shè),通過系統(tǒng)性的分析,對未來做出可選擇的、多樣化的描述。情景并不是預測將來會怎么樣,而是描繪將來將如何展開;情景是探討未來的可能性,而不是討論未來應(yīng)該怎么樣(婁偉,2012)。2025/1/632025/1/642025/1/651972年,殼牌石油(SHELL)公司規(guī)劃人員PierreWack領(lǐng)導了一個名為“團體規(guī)劃”(GroupPlanning)的研究小組,運用情景分析法分析了中東局勢,得出將爆發(fā)石油危機的結(jié)論。殼牌公司據(jù)此調(diào)整了企業(yè)戰(zhàn)略,及時、成功地應(yīng)對了70年代石油危機。70年代中后期,得到迅速發(fā)展和廣泛運用,出現(xiàn)了多種不同的模式及知名研究報告羅馬俱樂部(ClubofRome)的《增長的極限》(TheLimitstoGrowth)和《人類的轉(zhuǎn)折點》(MankindattheTurningPoint)此后,情景分析經(jīng)歷了兩次飛躍20世紀80年代后期,情景分析的進步隨著復雜性理論的興起而升級。20世紀90年代,情景分析者把規(guī)劃的焦點集中在組織學習上,情景分析隨著組織學習理論的興起而得到進一步完善。2025/1/66情景分析的學派直覺邏輯學派(Intuitivelogicsschool)主要依靠利益相關(guān)者及專家的直覺構(gòu)建情景。當然,也可以同多種模型相結(jié)合,以提升情景分析的科學性。代表性的直覺邏輯情景分析主要有斯坦福研究院(SRI)、全球商業(yè)網(wǎng)(GlobalBusinessNetwork),以及殼牌石油(Shell)公司等機構(gòu)發(fā)展的方法。2025/1/67概率修正趨勢學派(Probabilisticmodifiedtrendsschool)需要借助決策樹、蒙特卡羅模擬、貝葉斯決策理論、馬爾科夫決策分析等方法。該學派又分為趨勢影響分析和交叉影響分析趨勢影響分析(TrendImpactAnalysis,TIA)是一種實用有效的預測方法,它是為了彌補趨勢外推法的不足而發(fā)展起來的。一般認為,這種方法的出現(xiàn)同位于美國康涅狄格州的未來集團(FuturesGroup)密不可分。交叉影響分析(Cross-impactanalysis,CIA)又稱交叉影響模型、交叉概率法。從1968年Gordon提出基于蒙特卡羅仿真模擬的交叉影響分析模式后,先后出現(xiàn)了用于預見事件發(fā)生概率、用于預見事件發(fā)展趨勢和用于選取關(guān)鍵事件等三種具有不同功能的模式。2025/1/68遠景學派(La
Prospective)所謂遠景,主要是指戰(zhàn)略情景構(gòu)建遠景學派由法國哲學家GastonBerger最早發(fā)展此后,20世紀70年代以來,MichelGodet開發(fā)的以MICMAC和MACTOR等為代表的一系列情景分析工具得到了廣泛的應(yīng)用,從而成為遠景學派的代表。MICMAC通過變換代表了事件之間相互影響的交叉影響矩陣,進而發(fā)現(xiàn)隱藏在事件之間直接影響之下的間接影響。MACTOR則專注于定量與定性結(jié)合的角色戰(zhàn)略分析。2025/1/69
直覺邏輯學派遠景學派概率修正趨勢學派情景目的戰(zhàn)略決策、組織學習支持政策制定、戰(zhàn)略決策以及具體行動規(guī)劃外推預測和政策評估情景表述描述性或規(guī)范性通常是描述性的,也可以是規(guī)范性的描述性的情景范圍范圍可寬可窄,從全球、區(qū)域、國家,到一家企業(yè)通常范圍較窄,但在一定范圍內(nèi)要廣泛考慮各要素范圍較窄,并依據(jù)特定事件的發(fā)展趨勢關(guān)注其未來可能動向和影響時間跨度變化:3-20年變化:3-20年變化:3-20年方法論過程導向:歸納或演繹,基本上是主觀的,依賴有約束的直覺進行定性分析結(jié)果導向:有指導的和客觀的。定量化(有一些主觀性),依賴復雜的計算機和數(shù)學模型結(jié)果進行計算結(jié)果導向:有指導的和客觀的。定量化(有一些主觀性),依賴復雜的計算機和數(shù)學模型進行外推模擬常用工具通用的:頭腦風暴,STEEP分析,聚類分析.矩陣,系統(tǒng)動力學和利益相關(guān)者分析專有的:結(jié)構(gòu)和角色扮演分析,形態(tài)分析,德爾菲法,以及MICMAC、MACTOR等趨勢影響分析和交叉影響分析,蒙特卡羅模擬情景出發(fā)點特定的管理決策,普遍關(guān)注的議題或領(lǐng)域關(guān)注具體現(xiàn)象決策/問題的,針對詳細的、可靠的時間序列數(shù)據(jù)進行決策2025/1/6102025/1/611
直覺邏輯學派遠景學派概率修正趨勢學派識別/選擇關(guān)鍵驅(qū)動力直覺:頭腦風暴技術(shù),STEEP要素分析,同不尋常人物進行討論、研究利用角色分析進行討論,利用先進的計算機工具進行全面的結(jié)構(gòu)分析利用歷史時間序列數(shù)據(jù)的擬合曲線識別發(fā)展趨勢,使用專家判斷創(chuàng)建可能的高度影響不確定未來的事件數(shù)據(jù)庫建立情景框架界定情景邏輯作為主題或原則(常常以矩陣形式)基于關(guān)鍵變量,利用矩陣等手段創(chuàng)建可能的假定基于關(guān)鍵指標的預測,利用蒙特卡羅模擬構(gòu)建不確定包情景輸出定性的:基于圖標、有限的量化分析,構(gòu)建若干個平行的情景故事。啟示、戰(zhàn)略選擇、早期預警越來越多地成為情景輸出內(nèi)容定性的和定量的:基于綜合分析可能的行動及其后果,構(gòu)建多個可供選擇的情景定量的:基準情景,加上上下調(diào)整的時間序列預測。可以被簡短的情景故事所美化情景概率變化不,所有的方案必須具有同樣的可能是的,變量發(fā)展的概率取決于參與者的認知未來事件的發(fā)生概率受制于各類前提條件生成情景數(shù)量一般2~4個多個依賴模擬的數(shù)量,通常3~6個情景評價標準連貫性,綜合性,內(nèi)部一致性,新穎性,結(jié)構(gòu)分析和邏輯基礎(chǔ)的嚴謹性。所有的情景同等重要連貫性,綜合性,內(nèi)部一致性,嚴謹?shù)慕Y(jié)構(gòu)。以數(shù)據(jù)分析為基礎(chǔ),合理的,并且可重復合理的,并且可重復2025/1/612組織錯誤(Organizationalerrors)直到情景大部分或者全部建立以后,才把關(guān)鍵決定制定者包括在內(nèi);采用那些只反映了很少多樣性的條件;抵制或禁止組織外在個體的參與;不包括那些對確定競爭者知之甚少的個體(不管這些個體是處于組織內(nèi)還是組織外);在情景構(gòu)建和分析中拒絕使用外部專家;設(shè)定不切實際的截止日期或者里程碑,導致情景結(jié)果變得搖搖欲墜。情景分析的局限性過程復雜。情景分析法在一定程度上依賴于管理者的直覺,而缺乏程序化模式,操作起來比較困難。而且環(huán)境中一些極其重要的變化往往逐漸演變,不易察覺。近期效果不顯著。運用情景分析法進行預測一般需要高層管理者投入大量寶貴的時間,而且使用者常常經(jīng)過幾年時間才能對情景分析法有深入的理解和信任。2025/1/6135.1.2情景分析的一般操作步驟關(guān)于情景分析法的操作步驟,目前存在一些不同的版本。這些版本雖然表述不同,但大多具有類似的步驟,并有一個顯著的共同點,就是對情景關(guān)鍵因素的分析,并一致認為這一步驟是否完善將導致對最后各個情景預測的可信性與準確性。2025/1/614提出者操作步驟Gilbert提出的10個步驟提出規(guī)劃的前提假設(shè);定義時間軸和決策空間;回顧歷史;確定普通和相矛盾的假設(shè);為結(jié)構(gòu)變量決定連接到多樣性的指示;為填充決策空間而構(gòu)建情景草案;為所有的競爭者草擬策略;將策略映射到情景;使替代的策略有效;選擇或者適應(yīng)最好的策略。Fink提出的5個階段情景準備;情景域分析;情景預測;情景發(fā)展;情景傳遞。斯坦福研究院擬定的
6項步驟明確決策焦點;識別關(guān)鍵因素;分析外在驅(qū)動力量;選擇不確定的軸向;發(fā)展情景邏輯;分析情景的內(nèi)容。國際能源署(InternationalEnergyAgency,IEA)情景構(gòu)建方案得到了較為廣泛的應(yīng)用,可以作為一般性模板予以參考。并不是每次情景分析都需要所有步驟,具體要根據(jù)分析的對象,以及資料的多少來決定分析的步驟及方法。2025/1/6152025/1/6162025/1/617篩選關(guān)鍵的不確定性思考每個驅(qū)動力的不確定性程度及其程度的大小,以及對未來可能的影響方式會產(chǎn)生怎樣的變化;思考每個驅(qū)動力對未來的可能影響(或重要性)及其影響的大??;識別具有最大影響和最大不確定性的指標(通常為2~3個指標)。構(gòu)建情景框架2025/1/618兩個最關(guān)鍵的不確定性(CU1和CU2)及其未來不同的發(fā)展趨勢詳述情景現(xiàn)狀與趨勢。就現(xiàn)狀所代表的未來情景的特征展開討論。預期結(jié)果。就情景的預期結(jié)果展開討論。一旦關(guān)鍵的不確定性被解決了,那時世界將會是什么樣子。添加細節(jié)和內(nèi)容,以豐富情景的預期結(jié)果,并創(chuàng)建一個綜合的、首尾呼應(yīng)的情景。思考每個主題和驅(qū)動力,并提供具體內(nèi)容。思考哪些方面將變得更好或更糟。思考有哪些挑戰(zhàn)已經(jīng)解決,又有哪些挑戰(zhàn)依然懸而未決。時間軸。運用現(xiàn)狀、預期結(jié)果和時間表。為每個情景命名。2025/1/619定量分析通過定量信息來加強情景的定性描述。其預期產(chǎn)出是“具體的、有科學說服力的定量信息”。確定定量分析方法、收集所需數(shù)據(jù)及其相互關(guān)系、運用工具和模型產(chǎn)出定量估計。2025/1/620聯(lián)合國環(huán)境規(guī)劃署出版的全球環(huán)境展望(GlobalEnvironmentOutlook,GEO)系列報告3中通過應(yīng)用PoleStar軟件來對兩個情景進行定量分析。盡管PoleStar為備選情景在組織經(jīng)濟、資源和環(huán)境信息等方面提供了一個靈活簡單的核算框架,但情景作者仍認為,定量分析需要更多環(huán)境影響方面的信息來加以補充。因此,其它模型(即RIVM的IMAGE模型、CSER的WaterGAP模型以及NIES的AIM模型)也被引入情景過程,以使不同區(qū)域之間和定性描述上的數(shù)據(jù)變得更為連貫,從而統(tǒng)一模型的輸入數(shù)據(jù)(例如,人均GDP增長率)。2025/1/6212025/1/6222025/1/6232025/1/624牛長振.2012.國際關(guān)系中的情景分析.國際政治科學,(3):61~83在這種情況下,南非各利益集團于1991-1992年在南非開普敦市蒙特佛利國際會議中心召開了蒙特佛利會議(MontFleurConference),以探討國家變革。該會議的主要目的是探討南非未來10年可能的發(fā)展狀況。會議總召集人,南非西開普敦大學(UniversityoftheWesternCape)教授皮爾特·拉諾斯(PieterLeRoux)邀請了22位在南非較具影響力、來自不同利益團體的人物。包括左翼政治激進分子、非國大官員、主流經(jīng)濟學家、工會代表、資深學者和開明的白人企業(yè)家等。會議要求與會者遵循兩大規(guī)則:一是自由暢談南非未來如何發(fā)展,不要去管自己或自己的利益團體是否喜歡;二是認真傾聽“異見”、反省深思,不允許在討論時說“這個情景不可能發(fā)生”或“我不想讓這種情景出現(xiàn)”之類的話,而只允許提出“為什么這種情況會發(fā)生”或“接下來會發(fā)生什么事情”等之類的問題。2025/1/625蒙特佛利會議總共召開了四次1991年9月,開發(fā)出30種情景,后經(jīng)過整合縮減為9種。之后,會議成員分為四個小組,從社會、政治、經(jīng)濟和國際四個層面,為這9種情景增添內(nèi)容。1991年11月,選出了4種最能反映真實情況的情景。1992年3月,確定了這4種情景的最終方案。1992年8月,向各利益集團進行了匯報。2025/1/6262025/1/6272025/1/6282025/1/629如果書刊經(jīng)銷商想對某一專著銷售量進行預測,該如何做呢?某個經(jīng)銷商選擇了若干書店經(jīng)理、書評家、讀者、編審、銷售代表和海外公司經(jīng)理組成專家小組。將該專著和一些相應(yīng)的背景材料發(fā)給各位專家,要求各自給出專著最低銷售量、最可能銷售量和最高銷售量三個數(shù)字,同時說明自己作出判斷的主要理由。將專家們的意見收集起來,歸納整理后返回給各位專家,然后要求專家們參考他人的意見對自己的預測重新考慮。專家們完成第一次預測并得到第一次預測的匯總結(jié)果以后,除了書店經(jīng)理B,其他專家在第二次預測中都做了不同程度的修正。重復進行,在第三次預測中,大多數(shù)專家又一次修改了自己的看法。第四次預測時,所有專家都不再修改自己的意見。因此,專家意見收集過程在第四次以后停止。取小組平均數(shù),最終結(jié)果為最低銷售量26萬冊、最高銷售量60萬冊、可能銷售量46萬冊。2025/1/6305.2德爾菲法2025/1/631德爾菲法依據(jù)系統(tǒng)的程序,采用匿名發(fā)表意見的方式,通過多輪次調(diào)查專家對問卷所提問題的看法,經(jīng)過反復征詢、歸納、修改,最后匯總成專家基本一致的看法,作為預測的結(jié)果。信息的收集與反饋在這個雙向交流中是非常重要的。盡量避免信息的失真,保障信息的準確性是德爾菲法實施的初衷。匿名性、反饋性和統(tǒng)計性是德爾菲法的特點。德爾菲方法隱含了這樣一個前提,即建立在滿足一致性條件的專家群體意見的統(tǒng)計結(jié)果才是有意義的,所以它通過“專家意見形成——統(tǒng)計反饋——意見調(diào)整”這樣一個多次與專家交互交流的循環(huán)過程,使分散的意見逐次收斂在協(xié)調(diào)一致的結(jié)果上,充分發(fā)揮了信息反饋和信息控制的作用。“團體沉思”指在團體從眾的壓力下,會阻礙一些不尋常、少數(shù)或少見的觀點;“團體偏移”則指團體在討論各種替代方案時,會使最后的決定比他們最初所持有的主張更為夸大或更為保守。2025/1/6322025/1/6332025/1/6342025/1/6352025/1/6365.2.3德爾菲法的關(guān)鍵問題專家組的形成專家篩選一般應(yīng)注意:對專家自身的要求、專家樣本結(jié)構(gòu)的代表性以及專家的人數(shù)。國外有資料認為,在一定領(lǐng)域連續(xù)工作10年以上的有關(guān)人士都可稱為專家??梢越⒁粋€完備的評價專家?guī)?,包括專家基本信息(姓名、年齡、學歷、學位、研究方向、特長、從事工作等)和專家特殊信息(代表性研究成果、承擔課題情況、獲獎情況等)。一般可按本領(lǐng)域?qū)<摇⑾嚓P(guān)領(lǐng)域?qū)<?、管理專家各占一定的比例來選擇。同時,專家的學派、單位、地區(qū)、經(jīng)歷、年齡結(jié)構(gòu)等在選擇時都要注意代表性。
德爾菲法選擇專家的人數(shù)依課題性質(zhì)和規(guī)模而定,一般的人數(shù)范圍是10-20人,某些涉及面寬的重大課題,專家人數(shù)有時可以超過100人。2025/1/637調(diào)查表的設(shè)計調(diào)查表的設(shè)計沒有固定的格式,它因研究課題的不同而不同。一般,一份完整的德爾菲法調(diào)查表,應(yīng)包括提問主體和附件兩部分。提問主體即具體的調(diào)查內(nèi)容;附件常包括調(diào)查的目的意義、具體要求、背景材料、專家回執(zhí)等。應(yīng)根據(jù)課題的性質(zhì)、內(nèi)容、要求來設(shè)計調(diào)查表的格式、項目、問題和表達方式,而且隨著課題研究的進程,在原先一輪調(diào)查表和專家意見的基礎(chǔ)上,設(shè)計新的一輪調(diào)查表,直至完成本課題的研究。與一般的社會調(diào)查表相類似,要求陳述要清楚、用詞要準確、避免組合事件,力求簡明。此外,為了便于對專家意見的統(tǒng)計處理,調(diào)查表的設(shè)計應(yīng)盡可能地采用表格化、符號化、數(shù)字化,有利于將一般定性問題用定量化方法處理,并以定量結(jié)果表述。2025/1/638數(shù)據(jù)處理和表達描述性統(tǒng)計中的大多數(shù)內(nèi)容都可以應(yīng)用在德爾菲法的數(shù)據(jù)處理和表達中。德爾菲方法中主要使用的一些參數(shù):積極系數(shù)。調(diào)查表的回收率,表明專家對該項目關(guān)心程度,通常要達到50%以上。權(quán)威系數(shù)(Cr)。用以反映專家對某咨詢問題的權(quán)威程度,一般由專家對指標做出判斷的依據(jù)(Ca)和專家對指標的熟悉程度(Cs)兩個部分構(gòu)成,即Cr=(Ca+Cs)/2。一般認為權(quán)威系數(shù)大于0.7較好。2025/1/639專家對指標做出判斷的依據(jù)賦值(分)可以從理論分析層面進行判斷0.8-1按照實踐經(jīng)驗判斷0.6-0.8按照國內(nèi)外同行的了解0.4-0.6按照直覺0.2-0.4專家對指標熟悉程度賦值很熟悉1熟悉0.8比較熟悉0.6一般熟悉0.4不太熟悉0.2不熟悉0專家意見的集中程度。一般用各指標評分均數(shù)和滿分比來表示。滿分比指認為該指標非常重要的專家占專家總數(shù)的百分比。評分均數(shù)和滿分比越大說明專家意見集中,該咨詢問題重要。協(xié)調(diào)程度。由b個專家對k個觀察對象或觀察指標進行評分,檢驗b個評判員的評價結(jié)果是否具有一致性,可以使用KendallsW來進行衡量,
Kendalls
W
是Friedman統(tǒng)計量的標準化形式,可解釋為協(xié)調(diào)系數(shù),是評分者之間一致程度的測量,其范圍從0(完全不一致)到1(完全一致)。使用SPSS進行計算時,可以依次選擇:Analyze—NonparametricTests--KRelatedSamples,打開TestsforSeveralRelatedSamples對話框,在TestVaribles中選入相應(yīng)變量,同時選定KendallsW復選框。變異系數(shù)。說明專家對某一咨詢問題認識的波動程度。變異系數(shù)越小,專家一致程度越高。標準差除以平均值即為變異系數(shù)的值。2025/1/6402025/1/6412025/1/6422025/1/643第二輪問卷調(diào)查及其統(tǒng)計結(jié)果鑒于一些專家在開放式問卷中列出的領(lǐng)域與封閉式問卷中列出的領(lǐng)域有較多重復或高度相關(guān),故將兩份問卷列出的領(lǐng)域加以合并,對個別領(lǐng)域的名稱做了小的調(diào)整。對于認可度較低的領(lǐng)域:“信息網(wǎng)格與內(nèi)容網(wǎng)格”和“小世界現(xiàn)象(六度分隔)”,在第二輪問卷設(shè)計中不再列入。由此形成第二輪問卷,其中被調(diào)查的有30個領(lǐng)域。請專家對所列每個領(lǐng)域?qū)儆谇閳髮W研究前沿的程度予以評分,分值為0-100,分值愈高表示該領(lǐng)域?qū)儆谇閳髮W研究前沿的程度愈高。同時,還請專家對“判斷依據(jù)”和“對該領(lǐng)域的熟悉程度”兩個欄目進行打勾選擇?!芭袛嘁罁?jù)”欄列出5個選擇項:“理論分析”、“工作經(jīng)驗”、“參考國內(nèi)著作”、“參考國外著作”、“直覺”。“熟悉程度”欄目列出4個選擇項:“最熟悉”、“相當熟悉”、“一般”、“不太熟悉”。2025/1/6442025/1/6452025/1/646三輪問卷調(diào)查數(shù)據(jù)的綜合比較分析第二輪平均分與第三輪平均分呈現(xiàn)出很強的正相關(guān)關(guān)系;第二輪平均分與第三輪等級和呈現(xiàn)出很強的負相關(guān)關(guān)系;而第二輪加權(quán)平均分與第三輪的平均分表現(xiàn)出較強的正相關(guān);第二輪加權(quán)平均分與第三輪的等級和表現(xiàn)出較強的負相關(guān)。這些統(tǒng)計數(shù)據(jù)表明,第二輪的調(diào)查結(jié)果與第三輪的調(diào)查結(jié)果呈現(xiàn)出高度相關(guān)的關(guān)系,在解釋和判定情報學前沿領(lǐng)域上有著很強的一致性。結(jié)論23個領(lǐng)域的變異系數(shù)相對來說都較低,只有2個領(lǐng)域變異系數(shù)在0.3以上,表明就問卷中每一個情報學前沿領(lǐng)域而言,專家意見的協(xié)調(diào)程度較高,意見較為一致。各領(lǐng)域滿分頻率均普遍偏低,這表明我國情報學界對篩選出來的這23領(lǐng)域是否屬于前沿領(lǐng)域,肯定度還不夠高,需要進一步對這23個領(lǐng)域做調(diào)查和論證。2025/1/647在現(xiàn)實生活中,我們面臨的預測問題往往影響因素眾多、相互作用復雜,很難直接找到描述系統(tǒng)發(fā)展變化規(guī)律的函數(shù),使用其他的預測方法有時難以得到滿意的結(jié)果。人工神經(jīng)網(wǎng)絡(luò)的出現(xiàn),為解決這一類問題提供了有力工具。人工神經(jīng)網(wǎng)絡(luò)對人腦神經(jīng)系統(tǒng)進行仿生,從而具有感知學習和推理的能力,非常適合模擬復雜的非線性系統(tǒng)。2025/1/6485.3人工神經(jīng)網(wǎng)絡(luò)5.3.1人工神經(jīng)網(wǎng)絡(luò)概述生物神經(jīng)元人類大腦皮層包含約1011-1012個神經(jīng)元,神經(jīng)元由細胞及其發(fā)出的許多突起構(gòu)成。細胞體內(nèi)有細胞核,突起的作用是傳遞信息。輸入信號的若干個突起稱為“樹突”或“晶枝”(dendrite),輸出端的突起只有一個稱為“軸突”(axon)。樹突是細胞體的延伸部,它由細胞體發(fā)出后逐漸變細,全長各部位都可與其它神經(jīng)元的軸突末稍相互聯(lián)系,形成所謂“突觸”(synapse)。在突觸處兩神經(jīng)元并未連通,它只是發(fā)生信息傳遞功能的結(jié)合部。每個神經(jīng)元的突觸數(shù)目不同,最高可達105個,各神經(jīng)元之間的連接強度和極性不同,并且都可調(diào)整,基于這一特性,人腦具有存儲信息的功能。2025/1/649人工神經(jīng)網(wǎng)絡(luò)的基本原理1943年,神經(jīng)生物學家McCullochW.S.和青年數(shù)學家PittsW.A.合作,提出了第一個人工神經(jīng)元模型,并在此基礎(chǔ)上抽象出神經(jīng)元的數(shù)理模型。第一家神經(jīng)計算機公司的創(chuàng)立者與領(lǐng)導人RobertHecht-Neilsen認為人工神經(jīng)網(wǎng)絡(luò)是一個并行、分布處理結(jié)構(gòu),它由處理單元及稱為聯(lián)接的無向信號通道互連而成。處理單元(ProcessingElement)具有局部內(nèi)存,可完成局部操作。每個處理單元有單一的輸出聯(lián)接,這個輸出可根據(jù)需要被分支成希望個數(shù)的并行聯(lián)接,這些并行聯(lián)接輸出相同的信號,即相應(yīng)處理單元的信號,信號大小不因分支多少而變化。處理單元的輸出信號可以是任何需要的數(shù)學模型,每個處理單元中進行的操作必須是完全局部的。也就是說,它必須僅僅依賴于經(jīng)過輸入聯(lián)接到達處理單元的所有輸入信號的當前值和存儲在處理單元局部內(nèi)存中的值。2025/1/650該定義主要強調(diào)了四個方面的內(nèi)容:并行、分布處理結(jié)構(gòu);一個處理單元(人工神經(jīng)元,ArtificialNeuron)的輸出可以被任意分支,且大小不變;輸出信號可以是任意的數(shù)學模型;處理單元完全的局部操作。神經(jīng)元是構(gòu)成神經(jīng)網(wǎng)絡(luò)的最基本單元(構(gòu)件)。因此,要想構(gòu)造一個人工神經(jīng)網(wǎng)絡(luò)系統(tǒng),首要任務(wù)是構(gòu)造人工神經(jīng)元模型。2025/1/651MeCulloch-Pitts模型1943年W.McCulloch和W.Pitts合作提出對于第j個神經(jīng)元,接受多個其它神經(jīng)元的輸入xi。Wij為突觸強度,既第i個神經(jīng)元對第j個神經(jīng)元作用的加權(quán)利用某種運算把輸入信號的作用結(jié)合起來,給出它們的總效果,稱為“凈輸入”,以Netj或Ij表示。凈輸入表達式有多種類型,其中,最簡單的一種形式是線性加權(quán)求和,即:此作用引起神經(jīng)元j的狀態(tài)變化,而神經(jīng)元j的輸出yj是其當前狀態(tài)的函數(shù)2025/1/652M-P模型的數(shù)學表達式為:θj為閾值,sgn是符號函數(shù),當凈輸入超過閾值,yj取+1輸出,反之為-1輸出。如果考慮輸出與輸入的延時作用,表達式可修正為2025/1/6535.3.2人工神經(jīng)網(wǎng)絡(luò)的基本要素Rumellhart、McClell和Hinton等曾經(jīng)提出了著名的的PDP(ParallelDistributedProcessing)框架,認為人工神經(jīng)網(wǎng)絡(luò)由八個方面的要素組成:一組處理單元、處理單元的激活狀態(tài)、每個處理單元的輸出函數(shù)、處理單元之間的聯(lián)接模式、傳遞規(guī)則、把處理單元的輸入及當前狀態(tài)結(jié)合起來產(chǎn)生激活值的激活規(guī)則、通過經(jīng)驗修改聯(lián)接強度的學習規(guī)則以及系統(tǒng)運行的環(huán)境(樣本集合)?;疽氐牟煌M合構(gòu)成了各種各樣的神經(jīng)網(wǎng)絡(luò),目前已產(chǎn)生了上百種模型。實踐中常用的基本神經(jīng)網(wǎng)絡(luò)模型主要有:感知器神經(jīng)網(wǎng)絡(luò)、線性神經(jīng)網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)、徑向基神經(jīng)網(wǎng)絡(luò)、自組織神經(jīng)網(wǎng)絡(luò)和帶有反饋功能的Elman網(wǎng)絡(luò)和Hopfield網(wǎng)絡(luò)等。下面我們從人工神經(jīng)網(wǎng)絡(luò)設(shè)計的角度選擇其中主要的三個部分予以介紹。2025/1/654神經(jīng)元功能函數(shù)神經(jīng)元在輸入信號作用下產(chǎn)生輸出信號的規(guī)律由神經(jīng)元功能函數(shù)(fActivationFunction)給出,也稱激活函數(shù),或稱轉(zhuǎn)移函數(shù)。f函數(shù)形式多樣,利用它們的不同特性可以構(gòu)成功能各異的神經(jīng)網(wǎng)絡(luò)。例如,線性函數(shù)、非線性斜面函數(shù)、階躍函數(shù)、S型函數(shù)、硬限幅函數(shù)、競爭函數(shù)等。2025/1/655神經(jīng)元之間的聯(lián)接形式網(wǎng)絡(luò)中的神經(jīng)元分成不同的組(塊)進行組織的。在拓撲表示中,不同的塊可以被放入不同層。層次(又稱為“級”)的劃分,導致了神經(jīng)元之間三種不同的互聯(lián)模式。層內(nèi)聯(lián)接是本層內(nèi)的神經(jīng)元到本層內(nèi)的神經(jīng)元之間的聯(lián)接,可用來加強和完成層內(nèi)神經(jīng)元之間的競爭:當需要組內(nèi)加強時,這種聯(lián)接的聯(lián)接權(quán)取正值;在需要實現(xiàn)組內(nèi)競爭時,這種聯(lián)接權(quán)取負值。循環(huán)聯(lián)接循環(huán)聯(lián)接在這里特指神經(jīng)元到自身的聯(lián)接,用于不斷加強自身的激活值,使本次的輸出與上次的輸出相關(guān),是一種特殊的反饋信號。2025/1/656層間聯(lián)接層間聯(lián)接指不同層中的神經(jīng)元之間的聯(lián)接。這種聯(lián)接用來實現(xiàn)層間的信號傳遞。在復雜的網(wǎng)絡(luò)中,層間的信號傳遞既可以是向前的(前饋信號),又可以是向后的(反饋信號)。一般地,前饋信號只被允許在網(wǎng)絡(luò)中向一個方向傳送;反饋信號的傳送則可以自由一些,它甚至被允許在網(wǎng)絡(luò)中循環(huán)傳送。在反饋方式中,一個輸入信號通過網(wǎng)絡(luò)變換后,產(chǎn)生一個輸出,然后該輸出又被反饋到輸入端,對應(yīng)于這個“新的”輸入,網(wǎng)絡(luò)又產(chǎn)生一個新的輸出,這個輸出又被再次反饋到輸入端,如此重復下去。隨著這種循環(huán)的進行,在某一時刻,若輸入和輸出不再發(fā)生變化,那么表示網(wǎng)絡(luò)穩(wěn)定了下來,此時的輸出將是網(wǎng)絡(luò)能夠給出的最為理想的輸出。2025/1/657人工神經(jīng)網(wǎng)絡(luò)的學習神經(jīng)網(wǎng)絡(luò)的學習就是對它的訓練過程。即將由樣本向量構(gòu)成的樣本集合(樣本集、訓練集)輸入人工神經(jīng)網(wǎng)絡(luò)模型,按照一定方式調(diào)整神經(jīng)元間聯(lián)接權(quán)重,使網(wǎng)絡(luò)能將樣本集的內(nèi)涵以聯(lián)接權(quán)重矩陣的方式存儲,從而在網(wǎng)絡(luò)接受輸入時,給出適當?shù)妮敵?。四十年代末,D.O.Hebb提出Hebb規(guī)則。以此為基礎(chǔ),出現(xiàn)了多種形式的學習算法Hebb規(guī)則中,學習信號簡單地等于神經(jīng)元的輸出:權(quán)向量的調(diào)整公式為:2025/1/658權(quán)值調(diào)整量與輸入輸出的乘積成正比。顯然,經(jīng)常出現(xiàn)的輸入模式將對權(quán)向量有較大的影響。這種情況下,Hebb學習規(guī)則需預先設(shè)置權(quán)飽和值,以防止輸入和輸出正負始終一致時出現(xiàn)權(quán)值無約束增長。Hebb學習規(guī)則代表一種純前饋﹑無導師學習。2025/1/6592025/1/660基于人工神經(jīng)網(wǎng)絡(luò)的房價預測為了對某區(qū)域的房價進行預測,統(tǒng)計了506個房屋的相關(guān)信息,包括房屋價格和每個房屋的13個屬性,這些屬性對房屋的價格產(chǎn)生影響。打開MATLAB提供的人工神經(jīng)網(wǎng)絡(luò)圖形界面(啟動MATLAB,在命令行輸入nnstart)2025/1/661選擇曲線擬合,打開曲線擬合對話框?qū)⒉捎脙蓪忧梆伨W(wǎng)絡(luò)模型(two-layerfeed-forwardnetwork)構(gòu)建神經(jīng)網(wǎng)絡(luò),選用sigmoid函數(shù)作為激活函數(shù),網(wǎng)絡(luò)訓練算法為Levenberg-Marquardt反向傳播算法(Levenberg-Marquardtbackpropagationalgorithm)。如果沒有足夠的運算空間,將改用尺度化共軛梯度反向傳播算法(scaledconjugategradientbackpropagation)。2025/1/662選擇數(shù)據(jù)進入數(shù)據(jù)選擇窗口,指定輸入數(shù)據(jù)(input)和目標數(shù)據(jù)(targets)。在這個例子中,前者是506個房屋的13個屬性構(gòu)成的13*506的矩陣,后者則為506個房屋的價格,為1*506的矩陣。可以直接讀取保持在excel中的數(shù)據(jù),但需要注意的是,讀入的數(shù)據(jù)都被命名為data,需要及時改名(例如可命名為house_input,house_target),否則后面讀入的文件會把上一個data里存的內(nèi)容覆蓋掉。本例采用Matlab自帶的樣本數(shù)據(jù)集,點擊“LoadSampleDataSet”,選擇其中的HousePricing即可載入。2025/1/663指定訓練集、驗證集和測試集進入驗證和測試窗口(ValidationandTestDatawindow),輸入數(shù)據(jù)被隨機分成訓練集、驗證集和測試集。一般默認為訓練集占70%,驗證集和測試集分別為15%。當然也可以根據(jù)需要予以調(diào)整。2025/1/664指定網(wǎng)絡(luò)結(jié)構(gòu)進入網(wǎng)絡(luò)結(jié)構(gòu)窗口,指定隱藏層神經(jīng)元的個數(shù),系統(tǒng)默認為10,如果運行結(jié)果不理想,可以返回進行調(diào)整。2025/1/665訓練神經(jīng)網(wǎng)絡(luò)點擊訓練按鈕,開始訓練神經(jīng)網(wǎng)絡(luò)。在較新的MATLAB版本中(例如MATLAB2015),還可以在這個窗口指定訓練算法。對于大多數(shù)問題,可以采用Levenberg-Marquardt算法如果數(shù)據(jù)集較小噪音較大,可以考慮貝葉斯正則化算法(BayesianRegularization)如數(shù)據(jù)集很大,則可使用標度共軛梯度算法(ScaledConjugateGradient)。2025/1/666訓練結(jié)果如連續(xù)6次迭代都沒能降低驗證誤差,訓練就會自動結(jié)束(validationstop),并顯示結(jié)果主窗口。在這個窗口中,可以查看訓練用時,訓練性能等信息。系統(tǒng)默認使用均方差衡量訓練性能。在這個例子中,訓練在迭代了20次后結(jié)束,用時1秒(這個時間會因為機器配置等原因有所不同)。2025/1/6672025/1/668結(jié)果保存與使用如果對訓練結(jié)果比較滿意,則進入保存窗口,輸出訓練好的網(wǎng)絡(luò)以及相關(guān)的數(shù)據(jù)。甚至可以生成腳本和simulink模塊,以供進一步的使用。需要注意的是,選中保存所有值(saveallselectedvaluesabovetoMATLABstructnamed)選項并不寫為外部文件,在關(guān)閉程序并重啟后結(jié)果即不可見。使用save命令則可以保存為外部文件以備下次調(diào)用,例如:在MATLAB命令行輸入:savemynet1。但必須先選中對net的保存,并執(zhí)行保存結(jié)果(SaveResults)選項,注意不能同時選保存所有值選項(saveallselectedvaluesabovetoMATLABstructnamed)。2025/1/669保存以后的神經(jīng)網(wǎng)絡(luò)訓練結(jié)果可以在以后進行調(diào)用,并使用新的input數(shù)據(jù)集來求得相應(yīng)的output數(shù)據(jù)集。具體可以通過下列MATLAB命令來實現(xiàn)。>>savemynet1>>loadmynet1>>myinput=xlsread('House_input.xlsx');>>myoutput=net(myinput)其中,第三行命令后面加“;”號,表示不在屏幕上顯示結(jié)果;數(shù)據(jù)集的名字中不可以使用用中劃線,但可以用下劃線;一般情況下,MATLAB禁止在bin文件夾下保存結(jié)果。此外,使用新的數(shù)據(jù)集來進行預測時,存在excel表格中的行表示屬性,列表示實例,與SPSS中的數(shù)據(jù)相反。2025/1/670回歸分析就是用數(shù)學表達式來描述相關(guān)變量之間的關(guān)系,對未來進行預測的一種數(shù)學方法。主要解決以下兩個問題:確定幾個變量之間是否存在相關(guān)關(guān)系,如果存在,分析研究一個或幾個變量的變動對另一個變量變動的影響程度,找出他們之間適當?shù)臄?shù)學表達式;用自變量的已知值去推測因變量的值或范圍,且要估計這種預測可以達到何種精確度。2025/1/6715.4回歸分析法5.4.1簡單線性回歸模型構(gòu)建實際模型必然包括能夠反映隨機性的方法,隨機性是真實世界中的各種過程的一部分。這樣的模型稱為概率模型(probabilisticmodel)。為了建立概率模型,可以從與我們想建立的模型關(guān)系較為接近的確定性模型開始。然后增加一個隨機項,以衡量確定性成分的誤差。一階線性回歸模型:y=β0+β1x+
ε(其中,y=因變量;x=自變量;β0=截距;β1=斜率;ε=誤差變量)估計系數(shù)——最小二乘法根據(jù)觀測得到的自變量和因變量之間的一組對應(yīng)關(guān)系,找出一個給定類型的函數(shù)y=f(x),使得它在各個觀測點處所取值與觀測值在某種尺度下最接近,即在各點處的總的偏差(變差、誤差)平方和(SSE)達到最小。2025/1/672誤差變量誤差變量的概率分布必須滿足下面四個條件:回歸診斷(regressiondiagnostics)2025/1/673評估模型如果擬合程度低,就應(yīng)該放棄線性模型而采用其他的模型。斜率的t檢驗:假設(shè)變量間沒有線性關(guān)系,即斜率為0。零假設(shè)為斜率等于0;備擇假設(shè)為斜率不等于0;檢驗統(tǒng)計量為t:
(其中,Sb1是b1的標準偏差)判定系數(shù):在許多情況下,衡量線性關(guān)系的強弱也很有用,特別是在比較不同模型的時候。具有這個作用的統(tǒng)計量是判定系數(shù),用R2表示。2025/1/674簡單線性回歸的應(yīng)用模型通過評價為我們接受以后,就可以用它來預測和估計因變量的值。給出一個x的值,帶入回歸方程得到的對應(yīng)的y值稱為點預測。點預測本身并不能說明這個值與真實值的接近程度。為此,需要計算特定y值預測區(qū)間的置信區(qū)間估計:其中,xg為給定的x值,且有時需要預測給定x條件下y期望值的置信區(qū)間估計:2025/1/6755.4.2多元線性回歸回歸模型與必要條件
(應(yīng)符合的必要條件與單元線性回歸一樣)估計系數(shù)與評價模型估計系數(shù)的方法:最小二乘法2025/1/676系數(shù)的檢驗:假設(shè)變量間沒有線性關(guān)系(其中,i=1,2,……,k)R2和調(diào)整后的R2調(diào)整后的R2也叫做調(diào)整自由度的判定系數(shù)。它考慮了樣本變量和自變量的個數(shù)。如果自變量的個數(shù)相對于樣本容量來說較大,那么未調(diào)整的R2可能會高的沒有實際意義。2025/1/677檢驗模型的有效性H1:至少有一個βi不等于0如果原假設(shè)為真,自變量中沒有一個與因變量相關(guān),模型無效。如果備擇假設(shè)為真,即至少有一個βi不等于零,那么模型還是有一定的效果。檢驗統(tǒng)計量:2025/1/678回歸診斷同簡單線性回歸一樣,需要計算殘差,并繪制殘差的直方圖,檢驗誤差變量是否服從正態(tài)分布繪制殘差與y的預測值的散點圖,檢驗誤差變量的方差是否為常數(shù);如出現(xiàn)非正態(tài)性或異方差性,可對因變量予以變換,例如對數(shù)變換、倒數(shù)變換等繪制殘差與時間的關(guān)系圖,檢驗誤差項是否獨立(時間序列數(shù)據(jù))多元線性回歸特殊的問題:多元共線性,又稱為共線性或組間相關(guān)。是自變量之間相關(guān)的一種情況。多元共線性會產(chǎn)生兩個不利的影響:估計回歸系數(shù)時將產(chǎn)生較大的抽樣誤差會影響系數(shù)的t檢驗,使依據(jù)t檢驗做出的是否線性相關(guān)的推斷發(fā)生錯誤慶幸的是,多元共線性不會影響F檢驗。2025/1/6792025/1/680調(diào)用SPSS主菜單的Analyze—〉Regression—〉Linear命令,打開對話框,指定因變量(客戶壽命Longevit)和自變量(客戶的祖父、客戶的祖母、客戶的父親、客戶的母親去世時的年齡),以及回歸方式:逐步回歸。2025/1/681在Statistics欄中,選擇Estimates以輸出回歸系數(shù)B的估計值、t統(tǒng)計量等;選擇Durbin-Watson進行DW檢驗;選擇Modelfit輸出擬合優(yōu)度,F(xiàn)統(tǒng)計量值等。2025/1/682在Plots欄中選擇Histogram繪制標準化殘差的直方圖;選擇Normalprobabilityplot繪制標準化殘差分布與正態(tài)概率比較圖;繪制殘差與y的預測值的散點圖,檢驗誤差變量的方差是否為常數(shù)。2025/1/683提交運行,并在輸出窗口中查看結(jié)果系統(tǒng)在進行逐步回歸過程中產(chǎn)生了兩個回歸模型,模型1先將與因變量(客戶壽命Longevit)線性關(guān)系最密切的自變量MOTHER引入模型,建立它們之間的一元線性回歸模型。而后再逐步引入其他變量,模型2表明又將自變量FATHER引入,建立了二元線性回歸模型??梢?,客戶祖父母的壽命對客戶壽命的影響相對較小?;貧w模型概述表中給出了兩個模型各自的R2和調(diào)整后的R2。第一個模型中客戶壽命中有49.3%的變異可以用客戶母親壽命的變異來解釋。第二個模型中客戶母親壽命和客戶父親壽命的變異可以解釋客戶壽命中73.1%的變異。兩個模型都通過了F檢驗。此外,F(xiàn)統(tǒng)計量的值較大,t統(tǒng)計量的值也通過了檢驗,不存在嚴重的多元共線性問題。2025/1/6842025/1/685回歸殘差的直方圖與圖上的正態(tài)分布曲線相比較,可以認為殘差基本服從正態(tài)分布。2025/1/686觀測量累計概率圖:縱坐標為期望累計概率分布,橫坐標為觀測量累計概率分布,圖中的斜線對應(yīng)著一個均值為0的正態(tài)分布。如果散點密切地散布在這條斜線附近,說明殘差服從正態(tài)分布。如果偏離這條線太遠,應(yīng)該懷疑殘差的正態(tài)性。2025/1/687殘差與y的預測值的散點圖用以檢驗誤差變量的方差是否為常數(shù),隨著的變化,殘差無明顯變化,因此誤差變量的方差為常數(shù),不具有異方差性。進行預測
在原始數(shù)據(jù)中回歸模型的自變量下方輸入給定的值,相應(yīng)的因變量將產(chǎn)生缺失值;選擇主菜單Analyze—〉Regression—〉Linear,打開LinearRegression對話框。指定自變量和因變量;單擊Save按鈕,選擇PredictedValues欄中的Unstandardized,保存非標準化預測值在一個新變量中;選擇PredictionIntervals欄中的Mean和Individual,并在ConfidenceInterval框中輸入置信度,保存所輸入的置信度條件下y期望值和特定y值預測區(qū)間的上下;提交運行,除了輸出回歸分析結(jié)果外,還將在數(shù)據(jù)文件中生成pre_1、lmci_1、umci_1、lici_1和uici_1等變量。其中,pre_1保存點預測值,lmci_1和umci_1分別保存y期望值預測區(qū)間的下限和上限,lici_1和uici_1分別保存特定y值預測區(qū)間的下限和上限。2025/1/6885.4.3非線性回歸非線性回歸(NonlinearRegressionAnalysis)是尋求因變量與一組自變量之間的非線性相關(guān)模型的統(tǒng)計分析方法。如不能確定一個適當?shù)哪P?,可借助曲線估計過程預先分析,或借助散點圖,直觀觀察變量的變化,將有助于確定一個合用的函數(shù)關(guān)系。在一般統(tǒng)計軟件中,會提供常用的非線性回歸模型,供使用者參考。2025/1/689練習:某研究機構(gòu)為研究兒童的智力狀況,調(diào)查了16所小學的平均語言測試得分(y)與家庭社會經(jīng)濟狀況綜合指標(x1)、教師語言測試得分(x2)及母親教育水平(x3)的數(shù)據(jù),試進行多元回歸分析(linearregression2.sav)。旅游業(yè)的經(jīng)營易受季節(jié)的影響,某旅游勝地的一家旅館記錄了最近5年每個季度的入住率。旅館經(jīng)理關(guān)心下列問題:五年來,這家旅館的入住率是否呈現(xiàn)上升或下降趨勢?下一年,每個季度的入住率分別是多少?對于這樣的問題,時間序列分析是很好的解決方法。2025/1/6905.5時間序列分析5.5.1時間序列的概念及構(gòu)成因素時間序列(timeseries)數(shù)據(jù)按照一定的先后順序(例如時間)建立起來的同一變量的一組數(shù)列或一組觀察數(shù)據(jù)就是時間序列數(shù)據(jù)??梢允菚r間順序,也可以是具有各種不同意義的單調(diào)遞增的量,如溫度或速度。時間序列只強調(diào)順序的重要性,而并非強調(diào)必須以時間順序排列。序列中的數(shù)據(jù)或數(shù)據(jù)點的位置依賴于“時間”,即數(shù)據(jù)的取值依賴于“時間”的變化,但不一定是“時間”t的嚴格函數(shù);每一時刻上的取值或數(shù)據(jù)點的位置具有隨機性,不可能完全準確地用歷史值預測;前后時刻(不一定是相鄰時刻)的數(shù)值或數(shù)據(jù)點的位置有一定的相關(guān)性,這種相關(guān)性就是系統(tǒng)的動態(tài)規(guī)律性;時間序列往往呈現(xiàn)某種趨勢性或出現(xiàn)周期性變化的現(xiàn)象。2025/1/691大量事實表明,一個時間序列往往是以下幾類因素(或成分)的疊加或耦合長期趨勢運動(Tt
)。指時間序列的長期發(fā)展趨勢。循環(huán)運動(Ct
)。也稱循環(huán)變差,指時間序列圍繞趨勢線或趨勢曲線的長期振動或擺動。通常是指周期為一年以上,由非季節(jié)因素引起的漲落起伏波形相似的變動。季節(jié)運動(St)。或稱季節(jié)變差,指一年或更短的時間之內(nèi),由于受某種固定周期性因素(如自然、生產(chǎn)、消費等季節(jié)性因素)的影響而呈現(xiàn)出有規(guī)律的周期性波動。隨機波動(Rt)。隨機波動是指由于大量的隨機因素產(chǎn)生的宏觀影響。隨機波動往往掩蓋了其他相對比較容易預測的時間序列成分因子。根據(jù)中心極限定理,通常認為隨機變動近似服從正態(tài)分布。2025/1/692時間序列分析每一個時間序列都包含了產(chǎn)生該序列的系統(tǒng)歷史行為的全部信息。時間序列分析就是一種根據(jù)動態(tài)數(shù)據(jù)揭示系統(tǒng)動態(tài)結(jié)構(gòu)和規(guī)律的統(tǒng)計方法。其基本思想是根據(jù)系統(tǒng)的有限長度的運行記錄(觀察數(shù)據(jù)),發(fā)現(xiàn)其中蘊含的規(guī)律,建立能夠比較精確地反映時間序列中所包含的動態(tài)依存關(guān)系的數(shù)學模型,從而預測出未來的時間序列變量值。2025/1/6935.5.2時間序列數(shù)據(jù)的預處理缺失值替換轉(zhuǎn)換(transform)
缺失值替換(replacemissingvalues)定義時間變量數(shù)據(jù)(Data)
定義日期(DefineDates)2025/1/694時間序列.sav;移動平均.sav2025/1/695指數(shù)平滑(exponentialsmoothing)移動平均法存在兩個缺陷:第一,沒法計算原始時間序列首尾部分時刻對應(yīng)的值,有的時候,這些值的缺失會損失重要信息;第二,忽略了時間序列前面時期的信息,主要依據(jù)最近的幾個值得出新的序列。為了解決這些問題,可以使用指數(shù)平滑。指數(shù)平滑最早是由在1958年左右提出來的。它最初只應(yīng)用于無趨勢、非季節(jié)作為基本形式的時間序列的分析,后經(jīng)Brown、Winter等統(tǒng)計學家的深入研究和發(fā)展。使指數(shù)平滑涉及的數(shù)據(jù)內(nèi)部構(gòu)成更豐富,相應(yīng)的數(shù)據(jù)處理方法也更多,指數(shù)平滑法的估計是非線性的,其目標是使預測值和實測值間的均方差(MSE)最小。常用的指數(shù)平滑模型主要有簡單指數(shù)平滑、Holt指數(shù)平滑、Winters指數(shù)平滑等。它們在趨勢和季節(jié)構(gòu)成方面是不同的,根據(jù)對趨勢和季節(jié)的不同假設(shè),予以選用。2025/1/696這里只具體介紹簡單指數(shù)平滑:它改變了移動平均用來預測的n個過去觀測值中每一個權(quán)數(shù)都相等而早于(t-n-1)期的觀測值的權(quán)數(shù)等于零的缺陷,最近的觀測值要比早期的觀測值影響更大,在預測時應(yīng)賦予更大的權(quán)數(shù)的思想。其中,
為第t個時期簡單指數(shù)平滑后的時間序列
為第t個時期的時間序列
為平滑系數(shù),
較小的平滑系數(shù)將產(chǎn)生較大的平滑度,但是多大的平滑系數(shù)是合適的呢?可根據(jù)輸出結(jié)果中誤差平方和(SSE)的大小來判斷。誤差平方和越小,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度綠色建材采購與施工一體化服務(wù)合同4篇
- 2025年度美容院消防安全管理服務(wù)合同4篇
- 2025年老舊小區(qū)改造工程服務(wù)合同
- 二零二五年度離婚前財產(chǎn)分割專項合同4篇
- 二零二五年度古建筑泥工修繕工程承包合同8篇
- 2025年個人房產(chǎn)抵押貸款合同范本2篇
- 2025年度農(nóng)藥產(chǎn)品安全評價與風險評估合同
- 2025年度個人名下房產(chǎn)出售合同范本2篇
- 課題申報參考:民國時期華東地區(qū)傳統(tǒng)體育史料搜集與輯錄研究
- 課題申報參考:面向能源結(jié)構(gòu)轉(zhuǎn)型的摻氫天然氣負荷預測及其儲能布局優(yōu)化研究
- 2024年全國職業(yè)院校技能大賽高職組(研學旅行賽項)考試題庫(含答案)
- 2025年溫州市城發(fā)集團招聘筆試參考題庫含答案解析
- 2025年中小學春節(jié)安全教育主題班會課件
- 2025版高考物理復習知識清單
- 除數(shù)是兩位數(shù)的除法練習題(84道)
- 2025年度安全檢查計劃
- 2024年度工作總結(jié)與計劃標準版本(2篇)
- 全球半導體測試探針行業(yè)市場研究報告2024
- 反走私課件完整版本
- 2024年注冊計量師-一級注冊計量師考試近5年真題附答案
- 四年級下冊數(shù)學知識點總結(jié)
評論
0/150
提交評論