![選擇最大信息預(yù)報因子_第1頁](http://file4.renrendoc.com/view/4093909fca53f68efe051ed78268e060/4093909fca53f68efe051ed78268e0601.gif)
![選擇最大信息預(yù)報因子_第2頁](http://file4.renrendoc.com/view/4093909fca53f68efe051ed78268e060/4093909fca53f68efe051ed78268e0602.gif)
![選擇最大信息預(yù)報因子_第3頁](http://file4.renrendoc.com/view/4093909fca53f68efe051ed78268e060/4093909fca53f68efe051ed78268e0603.gif)
![選擇最大信息預(yù)報因子_第4頁](http://file4.renrendoc.com/view/4093909fca53f68efe051ed78268e060/4093909fca53f68efe051ed78268e0604.gif)
![選擇最大信息預(yù)報因子_第5頁](http://file4.renrendoc.com/view/4093909fca53f68efe051ed78268e060/4093909fca53f68efe051ed78268e0605.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第二章選擇最大信息的預(yù)報因子
1.概率、條件概率以及預(yù)報指標(biāo)2.天氣預(yù)報指標(biāo)的統(tǒng)計檢驗3.定量數(shù)據(jù)時的指標(biāo)4.高相關(guān)變量間的相關(guān)系數(shù)及其檢驗第1頁/共77頁第一頁,共78頁。早在天氣圖出現(xiàn)之前,民間就已經(jīng)廣泛流傳著有關(guān)天氣的諺語。因為天氣與人類的生活是密切相關(guān)的。諺語所反映的就是前期的征兆與后期天氣的統(tǒng)計關(guān)聯(lián)性。朝霞不出門,暮霞行千里。(《田家五行》論霞)早上太陽在東方,如有紅霞,多在天頂或西方,這就是說,天頂或西方有低云出現(xiàn)。(在中高緯)天氣變化總是自西而東的,這種低云必定是慢慢向本地接近,可見雨天即將到來;反之,晚上太陽在西方,如有紅霞,多在天頂和東方,那末,這種成霞的低云,將繼續(xù)向東去,離本地漸遠(yuǎn),如有雨下,也下不到本地,所以天氣是晴朗的。
第2頁/共77頁第二頁,共78頁。朝霞不出門暮霞行千里第3頁/共77頁第三頁,共78頁。四季東風(fēng)有雨下,只怕東風(fēng)刮不大。天上鉤鉤云,地上雨淋淋。大霧不過三,過三陰雨天。降水過程有共同性,也有特殊性,單一預(yù)報指標(biāo)必然管不住所有的降水過程。選擇最大信息的預(yù)報指標(biāo)(因子)可以減少天氣預(yù)報的漏報率和空報率。第4頁/共77頁第四頁,共78頁。第一節(jié)概率和條件概率以及預(yù)報指標(biāo)一、概率1.事件:自然界中的一切現(xiàn)象。2.頻率:衡量事件出現(xiàn)可能性大小的數(shù)量指標(biāo)。n次觀測次數(shù)中,事件A出現(xiàn)m次,則事件A的頻率為:第5頁/共77頁第五頁,共78頁。3.概率:觀測次數(shù)n足夠大,P(A)穩(wěn)定接近某個常數(shù),這就是事件A的概率。概率是事件的總體特征(頻率的理論值),頻率是事件的樣本值(概率的估計值)。第6頁/共77頁第六頁,共78頁。二、條件概率和天氣預(yù)報指標(biāo)1.概念在事件B已經(jīng)發(fā)生的條件下計算事件A的概率,稱為事件A在事件B已出現(xiàn)條件下的條件概率,記為P(A/B)。若事件A、B同時出現(xiàn)的概率為P(AB),則有:條件概率是統(tǒng)計預(yù)報的基礎(chǔ)。統(tǒng)計天氣預(yù)報中,往往將A取為所要預(yù)報的具體內(nèi)容,而將B取為事件A以前τ時刻(τ預(yù)報時效)的某個前期氣象條件。第7頁/共77頁第七頁,共78頁。舉例:事件A:長江中下游當(dāng)年6月平均降水小于250mm;事件B:長江中下游當(dāng)年1月平均降水小于22mm;統(tǒng)計1885-1980年共96年資料得:P(A)=69/96=0.72P(A/B)=13/14=0.93則:若長江中下游地區(qū)觀測到1月份平均降水小于22mm時,可預(yù)報當(dāng)年6月份降水小于250mm。
預(yù)報時效為5個月。第8頁/共77頁第八頁,共78頁。2.天氣預(yù)報指標(biāo)必須滿足兩個經(jīng)驗性的條件(1)P(A/B)>>P(A)或者P(A/B)<<P(A)
A、B之間有比較可靠聯(lián)系(2)P(A/B)----1或P(A/B)----0
預(yù)報指標(biāo)有一定準(zhǔn)確率第9頁/共77頁第九頁,共78頁。3.事件的獨立性如果事件B的出現(xiàn)與否不影響事件A出現(xiàn)的概率,則稱事件A對于事件B是獨立的,滿足:
P(A)=P(A/B)
或者
P(AB)=P(A)×P(B)注意:要圓滿地回答A和B是否相互獨立的問題,應(yīng)知道計算頻率時所用的觀測資料的次數(shù),使用統(tǒng)計檢驗理論。第10頁/共77頁第十頁,共78頁。問題:求n次獨立試驗中,事件A出現(xiàn)m次的概率?第二節(jié)天氣預(yù)報指標(biāo)的統(tǒng)計檢驗1.二項分布(1)二分類預(yù)報:只預(yù)報事件A出現(xiàn)或者不出現(xiàn)(),又稱為正反預(yù)報。設(shè)第11頁/共77頁第十一頁,共78頁。。第12頁/共77頁第十二頁,共78頁。(2)符合二項分布的三個條件:第一:每次試驗只有兩個結(jié)果;第二:試驗條件不變,每次試驗均有
P(A)=p,
;第三:試驗的獨立性。第13頁/共77頁第十三頁,共78頁。2、二項分布在天氣預(yù)報中的應(yīng)用(1)計算天氣現(xiàn)象出現(xiàn)的概率,特別是小概率事件。第14頁/共77頁第十四頁,共78頁。第15頁/共77頁第十五頁,共78頁。2、二項分布在天氣預(yù)報中的應(yīng)用(2)天氣預(yù)報指標(biāo)的檢驗
用二項分布檢驗天氣預(yù)報指標(biāo),是檢驗?zāi)骋粭l件概率所指示的事件是屬于偶然性還是具有規(guī)律性的一種方法。某事件A出現(xiàn)的概率是p,而在條件B時,事件A出現(xiàn)的頻率是m/n,則:當(dāng)Q值小于0.05或0.01時,事件發(fā)生的偶然性極小,指標(biāo)可用。當(dāng)Q值大于某上限值時,偶然性過大,指標(biāo)不可用.第16頁/共77頁第十六頁,共78頁。
當(dāng)Q值小于0.05或0.01時,A事件在n次試驗中出現(xiàn)m次的事件是小概率事件,在一次試驗中不可能出現(xiàn),但在條件B影響下發(fā)生了,說明B起的作用。小概率事件:概率很接近于0(即在大量重復(fù)試驗中出現(xiàn)的頻率非常低)的事件。一般多采用0.01~0.05兩個值,即事件發(fā)生的概率在0.01以下或0.05以下的事件稱為小概率事件,這兩個值稱為小概率標(biāo)準(zhǔn)。
第17頁/共77頁第十七頁,共78頁?!靶「怕适录蓖ǔV赴l(fā)生的概率小于5%的事件,認(rèn)為在一次試驗中該事件是幾乎不可能發(fā)生的。這種認(rèn)識是進(jìn)行假設(shè)檢驗推斷的出發(fā)點。需要注意兩點:(1)這里的“幾乎不可能發(fā)生”是針對“一次試驗”來說的,因為試驗次數(shù)多了,該事件當(dāng)然是很可能發(fā)生的;(2)當(dāng)我們運用“小概率事件幾乎不可能發(fā)生的原理”進(jìn)行推斷時,我們也有5%的犯錯誤的可能。第18頁/共77頁第十八頁,共78頁。假設(shè)檢驗的基本思想:就是小概率反證法思想。即先提出假設(shè),設(shè)H0為一原假設(shè),H1為一與其對立的備擇假設(shè)(對立假設(shè)),構(gòu)造一個隨機事件A,當(dāng)原假設(shè)成立時,隨機事件A以很小的概率發(fā)生該事件稱為小概率事件。一般來說,在一次試驗中小概率事件不應(yīng)發(fā)生,若發(fā)生了,則否定原假設(shè)H0,接受與其對立的備擇假設(shè)H1。
第19頁/共77頁第十九頁,共78頁。天氣預(yù)報指標(biāo)的檢驗實際上是反面來檢驗該預(yù)報指標(biāo)的可靠程度,歷史擬合的準(zhǔn)確率從正面說明該指標(biāo)的可靠程度。第20頁/共77頁第二十頁,共78頁。第三節(jié)定量數(shù)據(jù)時的指標(biāo)狀態(tài)要素:可以用條件概率選擇預(yù)報因子并且用二項分布檢驗預(yù)報因子的可靠程度。定量數(shù)據(jù)要素:主要用相關(guān)系數(shù)選擇預(yù)報因子或因子集,并用t檢驗方法檢驗其可靠性。第21頁/共77頁第二十一頁,共78頁。自然界中各現(xiàn)象間存在普遍的關(guān)系。可分為兩種:確定性關(guān)系:數(shù)學(xué)上的函數(shù)關(guān)系非確定性關(guān)系:統(tǒng)計上的相關(guān)關(guān)系相關(guān)系數(shù):度量各變量(各要素)間相關(guān)程度的量。第22頁/共77頁第二十二頁,共78頁。本節(jié)主要內(nèi)容簡單相關(guān)系數(shù)相關(guān)系數(shù)的檢驗-t檢驗自相關(guān)系數(shù)落后交叉相關(guān)系數(shù)復(fù)相關(guān)和偏相關(guān)系數(shù)第23頁/共77頁第二十三頁,共78頁。一、簡單相關(guān)系數(shù)(Pearson
相關(guān))卡爾·皮爾遜(KarlPearson,1857.3.27-1936.4.27),生于倫敦,英國數(shù)學(xué)家、哲學(xué)家,現(xiàn)代統(tǒng)計學(xué)的創(chuàng)始人之一。被尊稱為統(tǒng)計學(xué)之父。
第24頁/共77頁第二十四頁,共78頁。1.概念
描述兩個變量線性相關(guān)的統(tǒng)計量,一般簡稱為相關(guān)系數(shù)或者點相關(guān)系數(shù),用r表示。它也做為兩總體相關(guān)系數(shù)ρ的估計。第25頁/共77頁第二十五頁,共78頁。2.表達(dá)式設(shè)有兩個變量x,y,觀測值分別為:相關(guān)系數(shù)的幾種表示方式:第26頁/共77頁第二十六頁,共78頁。(1)原始資料:第27頁/共77頁第二十七頁,共78頁。(2)距平序列(均值為0):第28頁/共77頁第二十八頁,共78頁。(3)標(biāo)準(zhǔn)化序列:標(biāo)準(zhǔn)化后資料均值為0,均方差為1.相關(guān)系數(shù)就是標(biāo)準(zhǔn)化變量的協(xié)方差第29頁/共77頁第二十九頁,共78頁。3.相關(guān)系數(shù)的校正根據(jù)統(tǒng)計學(xué)中大樣本定理,樣本量大于30才有統(tǒng)計意義。當(dāng)樣本量較小時,計算所得相關(guān)系數(shù)可能會離總體相關(guān)系數(shù)甚遠(yuǎn)。這時,可以用計算無偏相關(guān)系數(shù)加以校正。第30頁/共77頁第三十頁,共78頁。4.幾點重要理解(1)(2)r的絕對值越大,表示變量之間關(guān)系越密切。當(dāng)r>0,表明兩變量呈正相關(guān),越接近1.0,正相關(guān)越顯著;當(dāng)r<0,表明兩變量呈負(fù)相關(guān),越接近-1.0,負(fù)相關(guān)越顯著;當(dāng)r=0,則表示兩變量相互獨立。(3)相關(guān)系數(shù)的值與樣本量n有關(guān),計算出的相關(guān)系數(shù)是否顯著,需要經(jīng)過顯著性檢驗。第31頁/共77頁第三十一頁,共78頁。第32頁/共77頁第三十二頁,共78頁。二、相關(guān)系數(shù)的檢驗-t檢驗樣本相關(guān)是否意味著總體就相關(guān)?
需相關(guān)系數(shù)統(tǒng)計檢驗正態(tài)總體的相關(guān)檢驗實質(zhì)上是兩個變量間或不同時刻間觀測數(shù)據(jù)的獨立性檢驗。就是檢驗總體相關(guān)系數(shù)ρ=0的假設(shè)是否顯著。在假設(shè)ρ=0成立條件下,樣本相關(guān)系數(shù)r檢驗的統(tǒng)計量符合自由度n-2的t分布。所以,可以用t分布檢驗法來檢驗。第33頁/共77頁第三十三頁,共78頁。1、統(tǒng)計檢驗的一般流程:(1)明確要檢驗的問題,提出統(tǒng)計假設(shè);(2)確定信度范圍α;(3)針對研究問題,選取一個適當(dāng)?shù)慕y(tǒng)計量;(4)根據(jù)觀測樣本計算有關(guān)統(tǒng)計量;(5)對給定的α,從表上查對應(yīng)的數(shù)值,即確定出臨界值;(6)比較統(tǒng)計量計算值與臨界值,判斷是否顯著。第34頁/共77頁第三十四頁,共78頁。(1)假設(shè)ρ=0成立,它服從自由度為n-2的t
分布。(2)給定信度范圍α(0.05或0.01)(3)計算統(tǒng)計量t:(4)由給定的信度范圍α及自由度為n-2,查t分布表,得到臨界值tα(5)比較t
與tα,否定ρ=0,總體相關(guān)。接受ρ=0,總體非相關(guān)。2、相關(guān)系數(shù)t檢驗的步驟:第35頁/共77頁第三十五頁,共78頁。何為“自由度”?在統(tǒng)計模型中,自由度指樣本中可以自由變動的變量的個數(shù),當(dāng)有約束條件時,自由度減少。自由度=樣本個數(shù)-樣本數(shù)據(jù)受約束條件的個數(shù),即df=n-k(df:自由度,n:樣本個數(shù),k:約束條件個數(shù))。例如,一組數(shù)據(jù),平均數(shù)一定,則這組數(shù)據(jù)有n-1個數(shù)據(jù)可以自由變化;若一組數(shù)據(jù)平均數(shù)一定,標(biāo)準(zhǔn)差也一定,則有n-2個數(shù)據(jù)可以自由變化。
第36頁/共77頁第三十六頁,共78頁。單側(cè)第37頁/共77頁第三十七頁,共78頁。舉例:第38頁/共77頁第三十八頁,共78頁。單側(cè)第39頁/共77頁第三十九頁,共78頁。第40頁/共77頁第四十頁,共78頁。3、相關(guān)系數(shù)表
為了檢驗方便,可以構(gòu)造不同自由度,不同顯著性水平的相關(guān)系數(shù)檢驗表。實際應(yīng)用中,自由度已知,給定信度范圍,就可直接查表對相關(guān)系數(shù)進(jìn)行顯著性檢驗。第41頁/共77頁第四十一頁,共78頁。臨界相關(guān)系數(shù)rc:rc表示在給定信度α和樣本數(shù)n
的條件下,相關(guān)系數(shù)r的臨界值。由此可以制備檢驗相關(guān)系數(shù)r
的臨界值表。一般rc隨自由度增大而減小。第42頁/共77頁第四十二頁,共78頁。第43頁/共77頁第四十三頁,共78頁。第44頁/共77頁第四十四頁,共78頁。第45頁/共77頁第四十五頁,共78頁。第46頁/共77頁第四十六頁,共78頁。西北地區(qū)地面感熱計算所用98站分布第47頁/共77頁第四十七頁,共78頁。
西北地區(qū)東部夏季感熱與全國634站同期降水的相關(guān)(紫色和深藍(lán)色區(qū)域為通過95%信度水平檢驗的區(qū)域,rα=0.396)第48頁/共77頁第四十八頁,共78頁。西北地區(qū)東部汛期降水190站分布第49頁/共77頁第四十九頁,共78頁。不同時段西北地區(qū)東部地表感熱與其汛期(5-9月)降水的關(guān)系第50頁/共77頁第五十頁,共78頁。西北地區(qū)東部地面感熱異常偏強年19821991199720002005異常偏弱年19841985198819922002-σσ合成分析第51頁/共77頁第五十一頁,共78頁。1、自協(xié)方差與自相關(guān)系數(shù)時間序列xi
(i=1,2,···n),其時間間隔τ的自協(xié)方差為:三、自相關(guān)系數(shù)衡量某一氣象要素不同時刻之間關(guān)系密切程度的量。樣本平均值第52頁/共77頁第五十二頁,共78頁。自相關(guān)系數(shù)是描述某一變量不同時刻之間相關(guān)的統(tǒng)計量。將滯后長度為τ的自相關(guān)系數(shù)記為r(τ)。若τ為正整數(shù),r(τ)稱為滯后(落后)自相關(guān)系數(shù);若τ為負(fù)整數(shù),r(τ)
稱為超前相關(guān)系數(shù)。樣本標(biāo)準(zhǔn)差相對概念第53頁/共77頁第五十三頁,共78頁。1212第54頁/共77頁第五十四頁,共78頁。第55頁/共77頁第五十五頁,共78頁。自相關(guān)系數(shù)TheautocorrelationfunctionofthefirstPCofmonthly,year-roundNorthAtlanticSSTanomalies.theblacklineisinstantaneouscorrelations(value=1.0)2002,vol(15):2233-2256第56頁/共77頁第五十六頁,共78頁。當(dāng)樣本量足夠大時,對滯后長度為τ的自相關(guān)系數(shù)的顯著性檢驗,可通過統(tǒng)計量:2、自相關(guān)系數(shù)的檢驗-u檢驗進(jìn)行檢驗,上式遵循N(0,1)的正態(tài)分布。通過檢驗可以判斷氣候變量是否具有持續(xù)性。也可用t檢驗第57頁/共77頁第五十七頁,共78頁。信度uα第58頁/共77頁第五十八頁,共78頁。信度uα第59頁/共77頁第五十九頁,共78頁。四、落后交叉相關(guān)系數(shù)1、落后交叉協(xié)方差與相關(guān)系數(shù)自協(xié)方差與自相關(guān)系數(shù)是衡量一個變量時間序列前后變化的,如何考慮兩個變量不同時刻之間的相關(guān)密切關(guān)系?----落后交叉協(xié)方差與落后交叉相關(guān)系數(shù)第60頁/共77頁第六十頁,共78頁。相應(yīng)的落后交叉相關(guān)系數(shù)為:2、表達(dá)式設(shè)xi和yi(i=1,2,…,n),分別為兩個時間序列,則對時間間隔τ的落后交叉協(xié)方差為:第61頁/共77頁第六十一頁,共78頁。3、舉例北京12月氣溫與落后1年的1月氣溫的交叉相關(guān)系數(shù)計算如下:1212第62頁/共77頁第六十二頁,共78頁。五、復(fù)相關(guān)和偏相關(guān)系數(shù)1、復(fù)相關(guān)系數(shù)反映預(yù)報因子集的優(yōu)劣程度的數(shù)量指標(biāo)。m個預(yù)報因子和預(yù)報對象y的單相關(guān)矩陣R表示為:
第63頁/共77頁第六十三頁,共78頁。m個因子與y的復(fù)相關(guān)系數(shù)表示為:第64頁/共77頁第六十四頁,共78頁。m=2時復(fù)相關(guān)系數(shù)計算公式為:m個因子與y的復(fù)相關(guān)系數(shù)最大,表示這m個因子線性組合后與y的關(guān)系最密切。復(fù)相關(guān)系數(shù)規(guī)定取正值。第65頁/共77頁第六十五頁,共78頁。m個預(yù)報因子與y有相關(guān)關(guān)系,則:x1與y的偏相關(guān)系數(shù):x2與y的偏相關(guān)系數(shù):2、偏相關(guān)系數(shù)當(dāng)存在三個以上變量互相影響時(如考慮y和x1、x2之間的關(guān)系),需要考慮消除了x1(x2)影響后,x2(x1)與y的相關(guān)關(guān)系,這時候的相關(guān)系數(shù)稱為偏相關(guān)系數(shù),記為:第66頁/共77頁第六十六頁,共78頁。偏相關(guān)系數(shù)計算公式:當(dāng)m=2時:第67頁/共77頁第六十七頁,共78頁。第68頁/共77頁第六十八頁,共78頁。第69頁/共77頁第六十九頁,共78頁。第四節(jié)高相關(guān)變量間的相關(guān)系數(shù)及其檢驗(1)非高自相關(guān)變量----兩變量無持續(xù)性相關(guān)系數(shù)t檢驗的自由度n-2
(2)高自相關(guān)變量----兩變量本身有強持續(xù)性或高自相關(guān)。相關(guān)系數(shù)t檢驗的自由度需用有效自由度n/T第70頁/共77頁第七十頁,共78頁。有效自由度計算公式:τ通常取到n/2
*
表示標(biāo)準(zhǔn)化值第71頁/共77頁第七十一頁,共78頁。Rxy(0.05)=0.344Rxy(0.01)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 個人房屋租賃給企業(yè)合同范例
- 兩子女離婚財產(chǎn)分割合同范本
- 2025屆畢業(yè)生就業(yè)實習(xí)合同協(xié)議
- 個人委托代理合同書樣本
- 個人一手房居住權(quán)轉(zhuǎn)讓合同
- 事業(yè)單位租車業(yè)務(wù)合同書
- 中外合資經(jīng)營合同(教育、培訓(xùn))創(chuàng)新發(fā)展報告
- 個人信托貸款合同模板
- 中小企業(yè)勞動合同簽訂與解除攻略
- 個人融資擔(dān)保合同范本
- 二零二五版電商企業(yè)兼職財務(wù)顧問雇用協(xié)議3篇
- 課題申報參考:流視角下社區(qū)生活圈的適老化評價與空間優(yōu)化研究-以沈陽市為例
- 《openEuler操作系統(tǒng)》考試復(fù)習(xí)題庫(含答案)
- T-CISA 402-2024 涂鍍產(chǎn)品 切口腐蝕試驗方法
- 后勤安全生產(chǎn)
- 項目重點難點分析及解決措施
- 挑戰(zhàn)杯-申報書范本
- 北師大版五年級上冊數(shù)學(xué)期末測試卷及答案共5套
- 電子商務(wù)視覺設(shè)計(第2版)完整全套教學(xué)課件
- 2024-2025學(xué)年人教版生物八年級上冊期末綜合測試卷
- 2025年九省聯(lián)考新高考 語文試卷(含答案解析)
評論
0/150
提交評論