分布函數(shù)的計(jì)算PPT課件_第1頁(yè)
分布函數(shù)的計(jì)算PPT課件_第2頁(yè)
分布函數(shù)的計(jì)算PPT課件_第3頁(yè)
分布函數(shù)的計(jì)算PPT課件_第4頁(yè)
分布函數(shù)的計(jì)算PPT課件_第5頁(yè)
已閱讀5頁(yè),還剩84頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 分布函數(shù)的計(jì)算在整個(gè)信息統(tǒng)計(jì)分析應(yīng)用中起著基礎(chǔ)性的作用,當(dāng)我們建立了某個(gè)統(tǒng)計(jì)模型后,會(huì)產(chǎn)生很多的統(tǒng)計(jì)量,用它們對(duì)某個(gè)假設(shè)進(jìn)行檢驗(yàn)。這時(shí)必須知道這些統(tǒng)計(jì)量的分布,某一點(diǎn)的概率、某概率的分位點(diǎn)。在學(xué)習(xí)概率論時(shí)我們已經(jīng)知道用查表的方法進(jìn)行計(jì)算。本章介紹分布函數(shù)的計(jì)算方法,以及如何用MATLAB的統(tǒng)計(jì)工具箱計(jì)算各種分布的概率與分位點(diǎn)的計(jì)算。 第1頁(yè)/共89頁(yè)1、密度函數(shù)和分布函數(shù) 密度函數(shù)和分布函數(shù)是反映隨機(jī)變量的總體規(guī)律的函數(shù),當(dāng)一個(gè)變量X在沒(méi)有抽樣之前不知會(huì)有什么結(jié)果,但結(jié)果的范圍是知道的,這樣的變量稱為隨機(jī)變量。隨機(jī)變量可以分為:(1)連續(xù)型隨機(jī)變量(2)離散型隨機(jī)變量(1)連續(xù)型隨機(jī)變量隨機(jī)

2、變量的結(jié)果空間是實(shí)數(shù),例如服從(0,1)上的均勻分布隨機(jī)數(shù)、人體身高隨機(jī)數(shù)等。例3.1.1 續(xù)型隨機(jī)變量的例子: 大學(xué)生男性身高X、隨機(jī)抽一個(gè)大學(xué)生量其身高得隨機(jī)變量的一個(gè)實(shí)現(xiàn),例如x=1.75米。則X是一個(gè)連續(xù)型的隨機(jī)變量。這種隨機(jī)變量服從正態(tài)分布。正態(tài)分布是統(tǒng)計(jì)分析中極其重要的分布。第2頁(yè)/共89頁(yè)(2)離散型隨機(jī)變量 當(dāng)一個(gè)隨機(jī)變量X的結(jié)果空間有有限個(gè)元素或可列個(gè)元素時(shí),稱該隨機(jī)變量為離散型隨機(jī)變量。例3.1.2 離散型隨機(jī)變量的例 設(shè)某汽車站7點(diǎn)到7點(diǎn)05分等車的人數(shù)為一變量X,顯然X可取值0,1,2,3,。則X是一個(gè)離散型的隨機(jī)變量。事實(shí)上這種隨機(jī)變量稱為服從泊松分布規(guī)律的隨機(jī)變量。

3、 投一硬幣,正面為1,反面為0。記該隨機(jī)變量為X,則其結(jié)果空間為0,1。也是一個(gè)離散隨機(jī)變量。(一)密度函數(shù)和分布律 隨機(jī)變量X在沒(méi)有發(fā)生時(shí)我們不知到,也不能預(yù)測(cè)其結(jié)果,看似隨機(jī)變量沒(méi)有規(guī)律。但是我們進(jìn)行大量抽樣或?qū)嶒?yàn)時(shí),卻可以看見明顯的規(guī)律。第3頁(yè)/共89頁(yè)例3.1.3: 對(duì)男性大學(xué)生隨機(jī)抽檢,共抽400名大學(xué)生測(cè)量其身高。將身高區(qū)間(1.50, 2.1)分劃分成若干段,計(jì)算每段學(xué)生身高的數(shù)量,并作直方圖。% 第三章,例3.1.3R = normrnd(1.7,0.1,400,1); % 產(chǎn)生正態(tài)分布的隨機(jī)數(shù)histfit(R,12) % 作直方圖并建立擬合曲線第4頁(yè)/共89頁(yè)從例3.1.3

4、可以看出,大學(xué)生身高的一些特點(diǎn)。1)首先身高在平均值附近的人數(shù)特別多。2)從直方圖中我們可以看出身高的趨勢(shì)具有對(duì)稱性。3)離平均值越遠(yuǎn)數(shù)量越少。 這是典型的正態(tài)分布的特點(diǎn)??梢韵胂螽?dāng)我們抽樣量增大應(yīng)該有一個(gè)理論函數(shù)作為極限。 密度函數(shù)(inv)稱這個(gè)理論函數(shù)為連續(xù)型隨機(jī)變量的密度函數(shù),上圖中的紅線所顯示的就是密度函數(shù)的圖形。在MATLAB這密度函數(shù)用inv來(lái)表示。正態(tài)分布的密度函數(shù) p 表達(dá)式為: 22221)( xexp第5頁(yè)/共89頁(yè)其中參數(shù): :為平均值。是隨機(jī)變量中心趨勢(shì)的描述。 exxpx!)|(:為標(biāo)準(zhǔn)差。是隨機(jī)變量離散程度的描述。 分布律(inv)對(duì)于離散型隨機(jī)變量,分布律相當(dāng)于

5、連續(xù)型隨機(jī)變量的密度函數(shù)。例3.1.4:作泊松分布隨機(jī)變量的分布律圖形。這里 為參數(shù),表示隨機(jī)變量的平均值和方差。 第6頁(yè)/共89頁(yè)設(shè)平均值為5,算出0到10的分布律X=0:10;Y = poissinv(X,5); % 計(jì)算泊松分布每點(diǎn)的概率stem(X,Y) % 作分布律圖形第7頁(yè)/共89頁(yè)(二)分布函數(shù)cdf 分布函數(shù)是對(duì)密度函數(shù)進(jìn)行積分,其表達(dá)式為: xdxxpxXPxF)()()(1)(0 xF分布函數(shù)函數(shù)具有以下性質(zhì):)()(2121xFxFxx 1)對(duì)任意x有2)單調(diào)不降, 利用分布函數(shù)我們可以計(jì)算隨機(jī)變量X落在某一范圍的概率,或者說(shuō)我們掌握了該隨機(jī)變量的規(guī)律了。連續(xù)型 niii

6、xpxXPxF0)()()(離散型第8頁(yè)/共89頁(yè) 例3.1.5:分別作出連續(xù)型和離散型隨機(jī)變量的inv和cdf(1)設(shè)男性大學(xué)生的身高X的平均值為1.7米,標(biāo)準(zhǔn)差為0.1米。作密度函數(shù)和分布函數(shù)。利用MATLAB中的正態(tài)分布norminv和normcdf命令進(jìn)行計(jì)算X=linspace(1.4,2.1,100);P = normcdf(X,1.7,0.1); p = norminv(X,1.7,0.1);subplot(1,2,1),plot(X,p),title(身高密度函數(shù))subplot(1,2,2),plot(X,P),title(身高分布函數(shù))第9頁(yè)/共89頁(yè)(2)設(shè)X服從均值為5

7、的泊松分布,作分布律和分布函數(shù)圖形。X=0:10;Y = poissinv(X,5);Y1= poisscdf(X,5)subplot(1,2,1),stem(X,Y),title(泊松分布律)subplot(1,2,2),stairs(X,Y1),title(泊松分布函數(shù))第10頁(yè)/共89頁(yè)(三)下側(cè)概率、上側(cè)概率和分位點(diǎn) 下側(cè)概率的定義: xdxxpxXPxF)()()(上側(cè)概率的定義: xdxxpxXPxF)()()(1第11頁(yè)/共89頁(yè) 利用分布函數(shù)我們可以計(jì)算隨機(jī)變量X落在某一范圍的概率,或者說(shuō)我們掌握了該隨機(jī)變量的規(guī)律了。例如隨機(jī)變量X小于分位點(diǎn)的概率即下側(cè)概率,大于分位點(diǎn)的概率即

8、上側(cè)概率。而隨機(jī)變量落入x1和x2之間的概率可用以下公式計(jì)算。)()()(1221xFxFxXxP 第12頁(yè)/共89頁(yè)例3.1.6:男性大學(xué)生身高X的平均值為1.7米,標(biāo)準(zhǔn)差為0.1米。1)計(jì)算身高小于1.8米大于1.6米發(fā)生的概率,即隨機(jī)變量X落入?yún)^(qū)間(1.6, 1.8)的概率。2)求下側(cè)概率為0.95的分位點(diǎn)。解:本題利用分布函數(shù)進(jìn)行計(jì)算 P(1.6X1.8)=F(1.8)-F(1.6)% 例 3.1.6 計(jì)算身高小于1.8米大于1.6米發(fā)生的概率P = normcdf(1.8,1.7,0.1)- normcdf(1.6,1.7,0.1)計(jì)算結(jié)果為:P=0.6827X = norminv(

9、0.95,1.70,0.1) % 計(jì)算下側(cè)概率的分位點(diǎn)計(jì)算結(jié)果為:X=1.8645,即有95%的人身高在1.86以下。第13頁(yè)/共89頁(yè)例3.1.7:設(shè)某車站7:00到7:05分等車人數(shù)為服從泊松分布的隨機(jī)變量X,均值為5。求1)人數(shù)小于等于12發(fā)生的概率。2)人數(shù)大于等于8發(fā)生的概率。3)計(jì)算上側(cè)概率為0.05的分位點(diǎn)。解:本題利用分布函數(shù)進(jìn)行計(jì)算!5)12()12(1215ieXPFii 1)小于12的計(jì)算公式為:P = poisscdf(12,5) % 小于12的概率計(jì)算結(jié)果為:P=0.9982)大于8的計(jì)算公式為:1-F(8)P = poisscdf(12,5) % 小于12的概率第1

10、4頁(yè)/共89頁(yè)3) 按題義命令為:按題義命令為:x=poissinv(0.95,5)計(jì)算結(jié)果為:x=9第15頁(yè)/共89頁(yè)(一)積分計(jì)算的一般方法分布函數(shù)的一般形式為:xdxxfxF)()(問(wèn)題實(shí)際歸為求積分, 當(dāng)密度函數(shù)非常復(fù)雜或用解析方法不能積分時(shí),我們常常使用數(shù)值積分的方法來(lái)處理。 (3.2.1)badxxf)(2、分布函數(shù)的一般計(jì)算方法第16頁(yè)/共89頁(yè)其基本思想是,用簡(jiǎn)單函數(shù)來(lái)代替復(fù)雜的被積函數(shù)。例如在被積函數(shù)的定義域內(nèi)選一系列的點(diǎn)。nxxx,10)(,),(),(10nxfxfxf然后求在該點(diǎn)處的函數(shù)值定義插值多項(xiàng)式如下: niiinxfxlxL0)()()((3.1.2)其中)()

11、()()(11ininixxxxxl第17頁(yè)/共89頁(yè))()()(101nnxxxxxxx這里)()()()(110niiiiiiinxxxxxxxxx)(xLn稱為拉格朗日插值多項(xiàng)式,其具有以下性質(zhì):1)。2) 在上點(diǎn)與點(diǎn)之間為線性函數(shù)。nixfxLiin, 2 , 1 , 0)()( 顯然有以下關(guān)系式成立:)()()(xRxLxfnn(3.1.3)(xRn其中是誤差函數(shù)。 第18頁(yè)/共89頁(yè)可以證明,當(dāng) )(xf有n+1階有界導(dǎo)數(shù)時(shí), ),()()!1()()()1(1bafnxxRnnn (3.1.4)0)()1( xfn當(dāng)時(shí),即當(dāng))(xf是不高于 n 階的多項(xiàng)式時(shí),有)()(xLxfn

12、 對(duì)(3.1.3)兩邊積分,我們有 banibabaniidttRdttlxfdttf0)()()()(3.1.5)0)( xRn第19頁(yè)/共89頁(yè)從而我們可以得到積分的一般近似公式 : niiibaxfAdttf0)()( 3.1.7)其中, baiidttlA)(3.1.7)稱為NewtonCotes型積分公式,而Ai 為Cotes系數(shù),其誤差為 bandttRE)(這樣我們就將一個(gè)復(fù)雜的積分問(wèn)題,近似地用代數(shù)和的形式來(lái)代替了。關(guān)于計(jì)算的精度我們可以通過(guò) E 來(lái)估計(jì)。目前一些數(shù)學(xué)軟件如Mathematica等,可以方便地獲取Cotes系數(shù), 第20頁(yè)/共89頁(yè)x0 x1x2x3x4f(x2

13、)f(x4)紅色折線為拉格朗日插值多項(xiàng)式第21頁(yè)/共89頁(yè)l l 代數(shù)精度概念 定義 3.1.1 若某個(gè)求積公式對(duì)于小于等于n 的多項(xiàng)式均能準(zhǔn)確地成立,但對(duì)n+1次多項(xiàng)式則不能。則稱該求積公式具有n次代數(shù)精度。例3.1.1 梯形求積公式 )()()()(2)(1100 xfAxfAbfafabdttfba 當(dāng) 時(shí),左邊=右邊。準(zhǔn)確地成立。 1)( xfxxf )(當(dāng)時(shí),也準(zhǔn)確成立。 baabbaabbfafababtdt2)(2)()(2,22222第22頁(yè)/共89頁(yè)當(dāng)時(shí) baabdtt33323)(23322abbaab ,而所以梯形求積公式具有一次代數(shù)精度。例3.1.2 利用梯形、拋物線及

14、NewtonCotes求積公式(n=7)計(jì)算解:(1)梯形求積公式Cotes系數(shù)為1/2,1/2,dxx 150。4267767. 0)15 . 0(22/1150 dxx。abh 2)(xxf 第23頁(yè)/共89頁(yè)(2)拋物線求積公式Cotes系數(shù)為1/6,4/6,1/6430934. 0)175. 045 . 0(62/1150 dxx。(3)取7個(gè)點(diǎn)Cotes系數(shù)為41/840,9/35,9/280,34/105,9/280,9/35,/41/840430964. 015 . 0 dxx第24頁(yè)/共89頁(yè)復(fù)合求積公式對(duì)于一個(gè)求積公式,我們要求它們的算法穩(wěn)定并收斂,但不幸的是 NewtonC

15、otes 求積公式并不穩(wěn)定,在某些情況下計(jì)算不收斂。例3.1.3 討論函數(shù) 在區(qū)間-1,1,用Cotes系數(shù)計(jì)算的收斂問(wèn)題。)251(1)(2xxf 11254936. 0)251(1dxx如用 Newton-Cotes 求積公式,則在該區(qū)間不收斂。請(qǐng)見以下結(jié)果 n=1時(shí) NC=0.07692 n=2時(shí) NC=1.35897n=10時(shí) NC=0.93466 n=40時(shí) NC=-4912.42第25頁(yè)/共89頁(yè)顯然 NewtonCotes 求積公式有致命的弱點(diǎn)。 為改善求積公式,我們使用復(fù)合求積公式。其基本思想是把積分區(qū)間分成若干小區(qū)間,每個(gè)小區(qū)間中用次數(shù)不高的插值多項(xiàng)式近似逼近。1)復(fù)合梯形求

16、積公式對(duì)區(qū)間a, bn等份,基點(diǎn)對(duì)每個(gè)小區(qū)間用梯形求積公式,則nabhniihaxi/ )(, 2 , 1 , 0, banixxniiiiiiixfxfxxdxxfdxxfI1010111)()(2)()()( 11)(2)()(2ninTihafbfafh第26頁(yè)/共89頁(yè) Tn 稱為復(fù)合梯形公式。為便于按迭代計(jì)算,在原有的分劃基礎(chǔ)上把區(qū)間分為 2n 等分,每個(gè)小區(qū)使用梯形公式,則有)(212nnnHTT ninhiafhH1)12(這里2)復(fù)合拋物線求積公式復(fù)合拋物線求積公式具有比復(fù)合梯形求積公式更快的收斂速度。拋物線公式用到了區(qū)間的中點(diǎn),所以對(duì)區(qū)間a, b進(jìn)行劃分時(shí)應(yīng)該分成偶數(shù)個(gè)小區(qū)間

17、。第27頁(yè)/共89頁(yè)令n=2m,m為正整數(shù),在每個(gè)小區(qū)間 上用拋物線公式 2,22iixx nabhxfxfxfhdxxfixxiiii ),()(4)2(62)(21222222 bamixxmiiiiiixfxfxfhdxxfdxxfI1121222222)()(4)(3)()(從而nmimiiiSxfxfbfafh 111212)(2)(4)()(3第28頁(yè)/共89頁(yè)3) 步長(zhǎng)的自動(dòng)選擇與停止準(zhǔn)則 在實(shí)際計(jì)算中,往往是先給出誤差精度,在保證精度的前提下,沒(méi)有必要將區(qū)間無(wú)限的分下去。假設(shè)給出的誤差精度為 ,若0 nnTT2則對(duì)區(qū)間劃分到 2n 等分即告停止。 例3.1.3 對(duì)于誤差為0.0

18、00001,我們來(lái)看用復(fù)合梯形積分公式和復(fù)合拋物線求積公式計(jì)算結(jié)果 112)251 (1dxx第29頁(yè)/共89頁(yè)復(fù)合梯形求積公式的結(jié)果 結(jié)果為:n = 12 t = 0.5496878 eps = 0.0004596結(jié)果為:n = 24 t = 0.54927516 eps = 0.0004126結(jié)果為:n = 48 t = 0.54933891 eps = 0.0000638結(jié)果為:n = 96 t = 0.54935496 eps = 0.0001604結(jié)果為:n = 192 t = 0.54936892 eps = 4.01210-6結(jié)果為:n = 384 t = 0.54935997

19、eps = 1.003210 -6結(jié)果為:n = 768 t = 0.54936022 eps = 2.50810-7復(fù)合拋物線求積公式的結(jié)果 結(jié)果為:n = 12 t = 0.54036028 eps = 0.1036734結(jié)果為:n = 24 t = 0.54913762 eps = 0.0087778結(jié)果為:n = 48 t = 0.549360162 eps = 0.0002225結(jié)果為:n = 96 t = 0.54936031 eps = 1.42910-7第30頁(yè)/共89頁(yè)l高斯(Gauss)型求積公式我們已經(jīng)知道用NowtonCotes系數(shù)來(lái)進(jìn)行近似積分,其一般公式為: nii

20、ibaxfAdttf0)()( baiidttlA)(其基點(diǎn) 是等距離的,且代數(shù)精度最多僅為n+1,并且對(duì)于某些積分步收斂。能否通過(guò)改變基點(diǎn)的距離來(lái)提高計(jì)算的精度和穩(wěn)定性呢?回答是肯定的。定義3.1.2 如果區(qū)間a,b的一組基點(diǎn) 能夠使得插值求積公式具有2n+1次代數(shù)精度,則稱其為高斯型插值求積公式,其基點(diǎn)稱為高斯點(diǎn),而系數(shù)Ai則稱為高斯系數(shù)。 nxxx,10 nxxx,10第31頁(yè)/共89頁(yè)高斯點(diǎn)與正交多項(xiàng)式的關(guān)系定理3.1.3 是區(qū)間 a,b 上的高斯點(diǎn)的充分必要條件為多項(xiàng)式 是區(qū)間 a,b 上的 n+1 次正交多項(xiàng)式。例3.1.6 我們?nèi)匀粊?lái)看前面的例子,對(duì)積分nxxx,10)()()(

21、101nnxxxxxxxw 112)251(1dxx 利用高斯插值公式進(jìn)行近似計(jì)算。解:這里我們?nèi)?5個(gè)高斯點(diǎn)進(jìn)行計(jì)算,其結(jié)果為 I = 0.549362第32頁(yè)/共89頁(yè)3 3、標(biāo)準(zhǔn)正態(tài)分布的數(shù)值計(jì)算 任何正態(tài)分布的隨機(jī)變量 X 通過(guò)標(biāo)準(zhǔn)化即 U =(X)/S其中 =E(X) S=V(X)從而得到一個(gè)標(biāo)準(zhǔn)正態(tài)分布隨機(jī)變量U。因此我們僅考慮標(biāo)準(zhǔn)正態(tài)分布函數(shù)的計(jì)算,隨機(jī)變量U以2221)1 , 0 ,(ueuf 第33頁(yè)/共89頁(yè)為 u 的概率密度函數(shù),記為UN(0,1)。對(duì)于標(biāo)準(zhǔn)正態(tài)分布隨機(jī)變量U有E(U)= 0V(U)= 1(一) 標(biāo)準(zhǔn)正態(tài)分布與誤差函數(shù) 標(biāo)準(zhǔn)正態(tài)分布的下側(cè)概率(即分布函數(shù))

22、為 utdteu2221)( 上側(cè)概率為 utdteua2221)(1 第34頁(yè)/共89頁(yè)上側(cè)概率分位點(diǎn)標(biāo)準(zhǔn)正態(tài)分布的上側(cè)概率與分位點(diǎn):第35頁(yè)/共89頁(yè)用于計(jì)算上側(cè)概率的誤差函數(shù),定義為: xduueXErf0222)( (0 X x) 5 . 0)X2( 2)X(Erf通過(guò)變換有 )0()2|(1 5 . 0)()0()2(1 5 . 0)(uuErfuuuErfu則分布函數(shù)的計(jì)算公式為:第36頁(yè)/共89頁(yè)(二)標(biāo)準(zhǔn)正態(tài)分布函數(shù)的數(shù)值計(jì)算 計(jì)算標(biāo)準(zhǔn)正態(tài)分布函數(shù)的近似公式很多,在此僅舉一例。 )0() |1(2/1)()0()1(2/11)(441441uuauuuauiiiiii其中 a1

23、=0.196854 a2=0.115194 a3=0.000344 a4=0.019527其最大絕對(duì)誤差是2.5104,這是一個(gè)簡(jiǎn)單實(shí)用的近似公式,在精度要求不高時(shí)用起來(lái)很方便。 第37頁(yè)/共89頁(yè)其中的一種近似公式為 115 . 05 . 005 . 00時(shí)時(shí)當(dāng)當(dāng)時(shí)時(shí)當(dāng)當(dāng)時(shí)時(shí)當(dāng)當(dāng)uuu 31201iiiiiiydycyu 這里第38頁(yè)/共89頁(yè)其中c0=2.515517 d1=1.432788c1=0.802853 d2=0.189269c2=0.010328 d3=0.001308 上述近似公式的最大絕對(duì)誤差為0.00044。其它隨機(jī)變量的分布函數(shù)也是按照某種近似公式計(jì)算的。第39頁(yè)/共8

24、9頁(yè)5、統(tǒng)計(jì)工具箱的各種分布計(jì)算(一)各種分布的概率計(jì)算MATLAB給出了各種分布的隨機(jī)數(shù)的計(jì)算,部分列表如下:命令命令含義含義chi2cdf(X,V)卡方分布,卡方分布,v是自由度是自由度 fcdf(X,V1,V2)F分布,分布,v1,v2,為自由度,為自由度expcdf(X, MU)指數(shù)分布,指數(shù)分布,MU為參數(shù)為參數(shù) poisscdf(X,LMD)泊松分布,泊松分布,LMD為參數(shù)為參數(shù)normcdf(X,MU,SIGMA)正態(tài)分布正態(tài)分布tcdf(X,V)學(xué)生分布,學(xué)生分布,v是自由度是自由度 unifcdf(X,A,B)區(qū)間區(qū)間A,B上的均勻分布上的均勻分布第40頁(yè)/共89頁(yè)命令命令含

25、義含義chi2pdf(X,V)卡方分布,卡方分布,v是自由度是自由度 fpdf (X,V1,V2)F分布,分布,v1,v2,為自由度,為自由度exppdf (X, MU)指數(shù)分布,指數(shù)分布,MU為參數(shù)為參數(shù) poisspdf (X,LMD)泊松分布,泊松分布,LMD為參數(shù)為參數(shù)normpdf (X,MU,SIGMA)正態(tài)分布正態(tài)分布tpdf (X,V)學(xué)生分布,學(xué)生分布,v是自由度是自由度 unifpdf (X,A,B)區(qū)間區(qū)間A,B上的均勻分布上的均勻分布部分隨機(jī)變量的密度函數(shù)pdf第41頁(yè)/共89頁(yè)部分隨機(jī)變量的分位點(diǎn)計(jì)算inv命令命令含義含義chi2inv(P,V)卡方分布,卡方分布,v

26、是自由度是自由度 finv(P,V1,V2)F分布,分布,v1,v2,為自由度,為自由度expinv(P, MU)指數(shù)分布,指數(shù)分布,MU為參數(shù)為參數(shù) poissinv(P,LMD)泊松分布,泊松分布,LMD為參數(shù)為參數(shù)norminv(P,MU,SIGMA)正態(tài)分布正態(tài)分布tinv(P,V)學(xué)生分布,學(xué)生分布,v是自由度是自由度 unifinv(P,A,B)區(qū)間區(qū)間A,B上的均勻分布上的均勻分布第42頁(yè)/共89頁(yè)(二)分布函數(shù)各種計(jì)算命令的命名規(guī)則分布計(jì)算命令分為三部分,即分布名、計(jì)算名和參數(shù)。例如:分布名計(jì)算名norm inv (a1,a2,ak) 參數(shù)部分例如:計(jì)算正態(tài)分布的分位點(diǎn)命令語(yǔ)法

27、為:X = norminv(P,MU,SIGMA)這里:P:給定的正態(tài)分布下側(cè)概率 MU:為均值 SIGMA:為方差第43頁(yè)/共89頁(yè)(三)卡方分布 :如果隨機(jī)變量X的密度函數(shù)為:2 )2/(2)(22/2/ )2(vexxpvxv 則稱隨機(jī)變量X服從自由度為v的卡方分布,卡方分布在統(tǒng)計(jì)推斷中具有十分重要的作用,特別是在分布的擬合優(yōu)度檢驗(yàn)時(shí)。例3.5.1 關(guān)于卡方分布和正態(tài)分布的關(guān)系(1) 作出自由度為4的卡方分布的密度和分布圖形x=linspace(0,20,100);p=chi2inv(x,4);P=chi2cdf(x,4);subplot(1,2,1),plot(x,p),title(c

28、hi2inv)subplot(1,2,2),plot(x,P),title(chi2cdf)第44頁(yè)/共89頁(yè)從密度圖中可以看出卡方隨機(jī)變量X的取值均大于0,自由度v就是該隨機(jī)變量的均值,方差為2v。第45頁(yè)/共89頁(yè)(2)產(chǎn)生1000個(gè)自由度為4的卡方隨機(jī)數(shù),并估計(jì)均值和方差。R=chi2rnd(4,1,1000); % 產(chǎn)生自由度為4的卡方分布隨機(jī)數(shù)ER=mean(R) % 估計(jì)1000個(gè)樣本的均值Var=var(R) % 估計(jì)1000個(gè)樣本的方差結(jié)果為:ER = 4.0362Var = 8.2509而理論值為:均值即為自由度v,方差為2v。(3)設(shè)X為服從標(biāo)準(zhǔn)正態(tài)分布隨機(jī)數(shù)。問(wèn)統(tǒng)計(jì)量KA

29、服從何分布?24232221XXXXKA 解題思路:對(duì)統(tǒng)計(jì)量KA抽1000次樣,每次計(jì)算是抽4個(gè)標(biāo)準(zhǔn)正態(tài)分布隨機(jī)數(shù),并按上面的公式計(jì)算出一個(gè)統(tǒng)計(jì)量的值。對(duì)1000個(gè)樣本作直方圖,看其趨勢(shì)。再調(diào)用分布檢驗(yàn)命令來(lái)確定屬于那一分布。第46頁(yè)/共89頁(yè)% 對(duì)(3)進(jìn)行實(shí)驗(yàn)for i=1:1000 R=normrnd(0,1,4,1); KA(i)=R*R;End % 以上抽1000個(gè)按公式計(jì)算的樣本hist(KA,20) % 調(diào)用直方圖命令作圖kstest(KA, KA chi2cdf(KA, 4) %檢驗(yàn)數(shù)據(jù)是否來(lái)自卡方分布ans = 0接受原假設(shè)來(lái)自自由度為4的卡方分布。第47頁(yè)/共89頁(yè)(4)計(jì)

30、算卡方下側(cè)概率為0.05和0.95的分位點(diǎn)。q1=chi2inv(0.05,4)q2=chi2inv(0.95,4)計(jì)算結(jié)果為:q1 = 0.7107q2 = 9.4877第48頁(yè)/共89頁(yè)(四)F分布 :如果隨機(jī)變量X的密度函數(shù)為: 2/212/21121121)2/2()2/1(2/21)(vvvvxvvxvvvvvvxp 例3.5.2 作出第一自由度為7,第二自由度為4的F分布的密度和分布圖形x=linspace(0,20,100);v1=7;v2=4P=fcdf(x,v1,v2);p=fpdf(x,v1,v2);subplot(1,2,1),plot(x,p),title(fpdf)s

31、ubplot(1,2,2),plot(x,P),title(fcdf)第49頁(yè)/共89頁(yè)第50頁(yè)/共89頁(yè)(五)隨機(jī)變量的數(shù)字特征計(jì)算 Descriptive Statistics命令命令含義含義mean(X)求樣本的平均值求樣本的平均值median(X)求樣本的中位數(shù)求樣本的中位數(shù)var(X)求樣本的方差求樣本的方差std(X)求樣本的標(biāo)準(zhǔn)差求樣本的標(biāo)準(zhǔn)差skewness(X)求樣本的偏度求樣本的偏度kurtosis(X)求樣本的峰度求樣本的峰度corrcoef(X)求多變量樣本的相關(guān)系數(shù)求多變量樣本的相關(guān)系數(shù)隨機(jī)變量X的數(shù)字特征,也是隨機(jī)變量性質(zhì)的一種描述。它們反映了諸如隨機(jī)變量的中心趨勢(shì)

32、(如均值、中位數(shù)、模等),和離差程度(如方差、標(biāo)準(zhǔn)差、極差等),還描述隨機(jī)變量的分布特性(如偏度和峰度等) 第51頁(yè)/共89頁(yè)(1) (1) 樣本均值的計(jì)算meanmean計(jì)算公式為: niiXnm11 中心趨勢(shì)度量的數(shù)字特征設(shè)一組樣本為:X X1 1,X X2 2,X Xn n(2) (2) 樣本的50%50%中位數(shù)計(jì)算median計(jì)算公式為:,|Xmedian )()2()1(n/2nXXX (3) (3) 樣本的幾何均值計(jì)算geomean計(jì)算公式為:nninXGOEM/11 第52頁(yè)/共89頁(yè)(1) (1) 樣本方差的計(jì)算varvar計(jì)算公式為: 2111var niiXXn 離散程度度

33、量的數(shù)字特征設(shè)一組樣本為:X X1 1,X X2 2,X Xn n(2) (2) 樣本的標(biāo)準(zhǔn)差的計(jì)算stdstd計(jì)算公式為: 2111 niiXXnstd(3) (3) 樣本的極差rangerange計(jì)算公式為:),min(),max(2121nnXXXXXXrang 第53頁(yè)/共89頁(yè)例3.5.3 計(jì)算200個(gè)服從正態(tài)分布的樣本的方差、標(biāo)準(zhǔn)差和極差。X=normrnd(0,1,1,200)VAR=var(X)STD=std(X)RANG=range(X)計(jì)算結(jié)果為:VAR = 0.9519STD = 0.9757RANG = 4.8217第54頁(yè)/共89頁(yè)描述該樣本分布形態(tài)的數(shù)字特征統(tǒng)計(jì)量有

34、(1) (1) 樣本偏度的計(jì)算skewness計(jì)算公式為: 311skewness niiXXn第55頁(yè)/共89頁(yè)(2) (2) 樣本峰度的計(jì)算kurtosis計(jì)算公式為: 411kurtosis niiXXn第56頁(yè)/共89頁(yè)(1) (1) 樣本矩陣協(xié)方差的計(jì)算covcov計(jì)算公式為:XXCOV 多變量之間相關(guān)程度的度量(2) (2) 樣本矩陣的相關(guān)系數(shù)計(jì)算corrcoef計(jì)算公式為:jjiiijijcccr nmnnmmxxxxxxxxxX212222111211設(shè)二維數(shù)據(jù)為第57頁(yè)/共89頁(yè)例3.5.4 計(jì)算64矩陣的協(xié)方差陣和相關(guān)矩陣。X=rand(6,4)C=cov(X)R=corr

35、coef(X)計(jì)算結(jié)果為:X = 0.1389 0.0153 0.8462 0.6813 0.2028 0.7468 0.5252 0.3795 0.1987 0.4451 0.2026 0.8318 0.6038 0.9318 0.6721 0.5028 0.2722 0.4660 0.8381 0.7095 0.1988 0.4186 0.0196 0.4289第58頁(yè)/共89頁(yè)C = 0.0287 0.0401 0.0133 -0.0065 0.0401 0.0986 -0.0088 -0.0276 0.0133 -0.0088 0.1164 0.0115 -0.0065 -0.0276

36、 0.0115 0.0318R = 1.0000 0.7553 0.2306 -0.2149 0.7553 1.0000 -0.0818 -0.4932 0.2306 -0.0818 1.0000 0.1884 -0.2149 -0.4932 0.1884 1.0000第59頁(yè)/共89頁(yè)5、統(tǒng)計(jì)推斷基本原理 有了隨機(jī)變量分布的概念以后,我們就可以利用隨機(jī)變量或者構(gòu)造出的統(tǒng)計(jì)量的分布特性來(lái)進(jìn)行假設(shè)檢驗(yàn)了。統(tǒng)計(jì)推斷或稱假設(shè)檢驗(yàn)是統(tǒng)計(jì)方法中最為重要的手段之一,可以應(yīng)用于參數(shù)統(tǒng)計(jì)推斷,非參數(shù)統(tǒng)計(jì)推斷等領(lǐng)域。在統(tǒng)計(jì)分析的各種模型中,最后判別模型的好壞,我們都要在一定的假設(shè)下構(gòu)造各種統(tǒng)計(jì)量然后進(jìn)行統(tǒng)計(jì)推斷

37、。在各類商用統(tǒng)計(jì)軟件中都輸出各種統(tǒng)計(jì)量的推斷結(jié)果,因此只有掌握了推斷的結(jié)果才能很好地使用商用統(tǒng)計(jì)軟件。第60頁(yè)/共89頁(yè)(一)實(shí)際統(tǒng)計(jì)推斷原理:小概率事件實(shí)際不可能發(fā)生。即事件發(fā)生可能性很小時(shí),實(shí)際上我們認(rèn)為不可能發(fā)生。例如:1)設(shè)姚明在罰球線投籃進(jìn)與不進(jìn)是一隨機(jī)變量X,進(jìn)的可能性是95%,不進(jìn)的可能性是5%。則在一次投籃時(shí)不進(jìn)這一事件是一個(gè)小概率事件,則我們認(rèn)為他投籃不會(huì)不進(jìn)。2)設(shè)每個(gè)人上街發(fā)生交通事故的可能性為0.01%,這是一個(gè)小概率事件。但實(shí)際我們認(rèn)為不可能發(fā)生,周末我們照樣逛街購(gòu)物。事實(shí)上我們并不知道,姚明的命中率。我們是用統(tǒng)計(jì)推斷的方法來(lái)決定的。按以下步驟進(jìn)行推斷:1)H0:進(jìn)球

38、的概率為95%2)對(duì)X進(jìn)行抽樣,即觀測(cè)投籃結(jié)果。3)如果進(jìn)了接受原假設(shè)H0,進(jìn)球的概率為95%。如果沒(méi)有進(jìn),按小概率事件實(shí)際不可能發(fā)生原理,認(rèn)為不進(jìn)球不是小概率事件。因此推翻原假設(shè)。第61頁(yè)/共89頁(yè)例3.4.1 中國(guó)大學(xué)生男性身高的平均值是1.70米嗎?對(duì)某大學(xué)男生抽20個(gè)樣,數(shù)據(jù)為:1.66 1.53 1.71 1.73 1.59 1.82 1.82 1.69 1.73 1.66 1.53 1.71 1.73 1.59 1.82 1.82 1.69 1.73 1.72 1.68 1.77 1.641 1.92 1.69 1.71 1.80 1.71 1.72 1.68 1.77 1.641

39、 1.92 1.69 1.71 1.80 1.71 1.69 1.621.69 1.62答:現(xiàn)在進(jìn)行統(tǒng)計(jì)推斷程序: 201201,20/1 . 0iiXXXT這里這里 1)H0:假定中國(guó)男性大學(xué)生身高為1.70米2)計(jì)算統(tǒng)計(jì)量按假定該統(tǒng)計(jì)量服從均值為1.70,標(biāo)準(zhǔn)差為 的T分布20/1 . 03)按顯著性水平為 計(jì)算該統(tǒng)計(jì)量的拒絕域05. 0 05. 020/1 . 070. 1 XP第62頁(yè)/共89頁(yè)R=1.66 1.53 1.71 1.73 1.59 1.82 1.82 1.69 1.73 1.72. 1.68 1.77 1.641 1.92 1.69 1.71 1.80 1.71 1.6

40、9 1.62ex=mean(R) % 計(jì)算平均值h,p,ci = ttest(R,1.70) % 進(jìn)行均值檢驗(yàn) 結(jié)果為:ex = 1.7116 % 平均值落在接受域1.6706,1.7525 h = 0 % 這個(gè)結(jié)果表示接受原假設(shè),1表示拒絕p = 0.5615 % 概率大于0.025,表示落在接受域ci = 1.6706 1.7525 % 該結(jié)果是接受域?qū)ζ骄颠M(jìn)行T檢驗(yàn)命令的語(yǔ)法:h = ttest(x,m) h = ttest(x,m,alpha)h = ttest(x,m,alpha,tail)h,p,ci = ttest(.)這里 x: 表示樣本 m:在0假設(shè)下的平均值 alpha:

41、顯著性水平 h: 0接受,1拒絕。 p: 計(jì)算出的概率 ci:平均值的置信區(qū)間。第63頁(yè)/共89頁(yè)接受域拒絕域統(tǒng)計(jì)量計(jì)算結(jié)果顯著性水平0.05下第64頁(yè)/共89頁(yè)(二)統(tǒng)計(jì)推斷中的一些術(shù)語(yǔ)置信水平:拒絕域的概率。 置信區(qū)間 :接受域 1顯然接受域和置信水平有關(guān), 越小則接受域越大,反之奕然! H0:0假設(shè),或稱初始假設(shè),如:H0:x=1.70H1:備擇假設(shè),1)雙側(cè)假設(shè) 2)右側(cè)假設(shè) 3)左側(cè)假設(shè)70. 1 x70. 1 x70. 1 x前面,例3.1.4就是備擇假設(shè)是雙側(cè)的情況,對(duì)同樣的問(wèn)題進(jìn)行右側(cè)和左側(cè)檢驗(yàn),作為習(xí)題進(jìn)行計(jì)算和推斷。第65頁(yè)/共89頁(yè)(三)統(tǒng)計(jì)推斷分類 統(tǒng)計(jì)推斷方法可以分為

42、三類,參數(shù)統(tǒng)計(jì)推斷、分布的擬合優(yōu)度統(tǒng)計(jì)推斷和非參數(shù)統(tǒng)計(jì)推斷。當(dāng)已知分布的情況下,對(duì)分布的各種參數(shù)進(jìn)行推斷稱為參數(shù)統(tǒng)計(jì)推斷。對(duì)樣本服從某種分布進(jìn)行假設(shè),并進(jìn)行檢驗(yàn)稱分布進(jìn)行分布的擬合優(yōu)度統(tǒng)計(jì)推斷。當(dāng)對(duì)某個(gè)參數(shù)進(jìn)行統(tǒng)計(jì)推斷而事先不知其分布時(shí)稱為非參數(shù)統(tǒng)計(jì)推斷。(1)參數(shù)的統(tǒng)計(jì)推斷)參數(shù)的統(tǒng)計(jì)推斷 一個(gè)服從某種分布的隨機(jī)數(shù),其參數(shù)是多種多樣的。例如均值、方差、偏度、峰度、最大值和最小值等等。在大樣本的情況下,根據(jù)中心極限定理我們可以統(tǒng)一構(gòu)造標(biāo)準(zhǔn)正態(tài)分布統(tǒng)計(jì)量進(jìn)行統(tǒng)計(jì)推斷,在下一章中將詳細(xì)介紹這種構(gòu)造方法。 第66頁(yè)/共89頁(yè)MATLAB提供的T檢驗(yàn)和Z檢驗(yàn)。命令見下表【例3.5.1】設(shè)有兩組樣本X,

43、Y。假定來(lái)自正態(tài)分布,標(biāo)準(zhǔn)差未知,抽檢驗(yàn)它們的均值是否一樣。產(chǎn)生X為均值為0,標(biāo)準(zhǔn)差為1的30個(gè)樣本和Y均值為0.5,標(biāo)準(zhǔn)差為1的40個(gè)樣本。我們可以構(gòu)造一個(gè)T-統(tǒng)計(jì)量nmsYXT11第67頁(yè)/共89頁(yè)命令語(yǔ)法為:h,significance,ci,stats = ttest2(x,y,alpha,tail)這里:alpha:輸入變量,給定的顯著性水平,如果沒(méi)有這一項(xiàng),內(nèi)定alpha=0.05。tail: 輸入變量,假設(shè)類型。當(dāng): tail=both,為雙尾檢驗(yàn),即備擇假設(shè)。當(dāng)沒(méi)有tail項(xiàng)時(shí)系統(tǒng)內(nèi)定此選擇tail=right,為右單尾檢驗(yàn),即備擇假設(shè)。tail=left,為左單尾檢驗(yàn),即備擇

44、假設(shè)。h:輸出變量,統(tǒng)計(jì)推斷最后結(jié)果,h=0接受原假設(shè),h=1拒絕原假設(shè)。Significance:輸出變量,統(tǒng)計(jì)量的拒絕域概率。ci:計(jì)算出統(tǒng)計(jì)量的上下限。stats:有關(guān)的其他統(tǒng)計(jì)量。第68頁(yè)/共89頁(yè)我們的程序如下:% 產(chǎn)生X均值為0,標(biāo)準(zhǔn)差為1的30個(gè)樣本,% 產(chǎn)生Y均值為0.5,標(biāo)準(zhǔn)差為1的40個(gè)樣本,檢驗(yàn)均值。X = normrnd(0,1,30,1);Y = normrnd(0.5,1,40,1);h,significance,ci = ttest2(X,Y)計(jì)算結(jié)果為:h = 1significance = 8.9577e-005ci = -1.4686 -0.5173結(jié)果告訴

45、我們拒絕原假設(shè),即來(lái)自均值不同的正態(tài)分布。對(duì)服從其他分布的隨機(jī)數(shù),進(jìn)行參數(shù)檢驗(yàn)時(shí),在大樣本的情況下,利用中心極限定理我們可以構(gòu)造一個(gè)服從標(biāo)準(zhǔn)正態(tài)分布的統(tǒng)計(jì)量進(jìn)行檢驗(yàn)。第69頁(yè)/共89頁(yè)(2)分布的擬合優(yōu)度檢驗(yàn))分布的擬合優(yōu)度檢驗(yàn) 一組樣本我們關(guān)心的是它們來(lái)自那一種分布,這時(shí)首先假定是服從某一分布,然后用樣本構(gòu)造其分布特性,并和假設(shè)的理論分布擬合的好壞進(jìn)行檢驗(yàn),這就是分布的擬合優(yōu)度檢驗(yàn)。描述隨機(jī)變量的分布特性有兩種方法,一是隨機(jī)變量的分布函數(shù),另一個(gè)是隨機(jī)變量的密度函數(shù),我們可以分別構(gòu)造不同的統(tǒng)計(jì)量進(jìn)行檢驗(yàn)??茽柲裰Z夫-斯米爾諾夫檢驗(yàn)Kolmogorov-Smirnov test 這是一個(gè)著名

46、的檢驗(yàn)方法,可對(duì)服從任何分布的隨機(jī)數(shù)進(jìn)行分布的擬合優(yōu)度檢驗(yàn)。設(shè)樣本的經(jīng)驗(yàn)分布函數(shù)為 ,樣本的理論分布為F(x)。我們可以構(gòu)造K-S統(tǒng)計(jì)量 nXXX,21)(xFn第70頁(yè)/共89頁(yè)顯然D0越小表示經(jīng)驗(yàn)分布和理論分布擬合的較好,利用D0很我們可以構(gòu)造Kolmogorov-Smirnov統(tǒng)計(jì)量KS,KS大則表示經(jīng)驗(yàn)分布和理論分布相差很遠(yuǎn),即樣本不是來(lái)自原假設(shè)的理論分布,示意見圖。 xFxFDnxsup0第71頁(yè)/共89頁(yè)【例3.5.1】對(duì)一組來(lái)自由度為5的卡方分布隨機(jī)數(shù)進(jìn)行分布的擬合優(yōu)度檢驗(yàn),用同樣的數(shù)據(jù)進(jìn)行參數(shù)為5的指數(shù)分布檢驗(yàn)。利用科爾莫格諾夫-斯米爾諾夫檢驗(yàn)命令kstest,其語(yǔ)法為:H =

47、 kstest(X) % 進(jìn)行正態(tài)分布檢驗(yàn)H = kstest(X,cdf) % 進(jìn)行給定分布函數(shù)cdf的擬合優(yōu)度檢驗(yàn)H = kstest(X,cdf,alpha,tail) % 進(jìn)行給定顯著性水平、分布cdf及備擇假設(shè)的擬合優(yōu)度檢驗(yàn)H,P,KSSTAT,CV = kstest(X,cdf,alpha,tail) % 同上,并多輸出拒絕域概率,KS統(tǒng)計(jì)量等這里:X:為原始數(shù)據(jù),注意為列向量。cdf:原假設(shè)的分布。H:檢驗(yàn)結(jié)果,H=0接受樣本來(lái)自假設(shè)的分布,H=1拒絕原假設(shè)。P:KS統(tǒng)計(jì)量的上側(cè)概率。KSSTAT:計(jì)算出的格諾夫-斯米爾諾夫統(tǒng)計(jì)量的值。第72頁(yè)/共89頁(yè)程序如下:% 例3.5.1

48、,抽200個(gè)服從自由度為5的卡方分布,檢驗(yàn):% 1)是否服從自由度為5的卡方分布% 2)是否服從參數(shù)為5的指數(shù)分布x = chi2rnd(5, 200, 1); % 抽200個(gè)自由度為5的卡方分布h1=kstest(x, x chi2cdf(x, 5) % 卡方檢驗(yàn)h2=kstest(x, x expcdf(x, 5) % 指數(shù)分布檢驗(yàn)最后的結(jié)果為:h1=0 接受原假設(shè),樣本來(lái)自自由度為5的卡方分布。h2=1 拒絕原假設(shè),樣本不是來(lái)自參數(shù)為5的指數(shù)分布。第73頁(yè)/共89頁(yè)) 1(2n統(tǒng)計(jì)量檢驗(yàn)隨機(jī)數(shù)的密度函數(shù)擬合優(yōu)度檢驗(yàn) 將樣本 定義域分為k個(gè)相等的區(qū)間,記i區(qū)間的觀測(cè)頻數(shù)為ni(i=1,,k

49、),若隨機(jī)變量X落于第i區(qū)間的概率為Pi,則得理論頻數(shù)mi= N Pi,由ni,mi構(gòu)造統(tǒng)計(jì)量。nXXX,2112kkiiiimnm12)(=漸近服從自由度為k-1的卡方分布,簡(jiǎn)記為 。一般要求樣本數(shù)N30。 12k第74頁(yè)/共89頁(yè)【例3.5.3】對(duì)參數(shù)為4的指數(shù)分布抽200個(gè)樣,假設(shè)樣本來(lái)自參數(shù)為4的指數(shù)密度函數(shù),構(gòu)造自由度為7卡方統(tǒng)計(jì)量進(jìn)行假設(shè)檢驗(yàn)。思路,將隨機(jī)數(shù)的定義域分為8個(gè)等區(qū)間,計(jì)算落入每個(gè)區(qū)間的頻數(shù)ni(i=1,,8),再根據(jù)落入每個(gè)區(qū)間的理論概率計(jì)算出理論頻數(shù)m i= N Pi,(i=1,,8),按公式(3.6.2)計(jì)算出自由度為7的卡方分布統(tǒng)計(jì)量,判斷該統(tǒng)計(jì)量是否落入拒絕域

50、,最終判斷檢驗(yàn)結(jié)果。% 例3.6.5 抽標(biāo)準(zhǔn)正態(tài)分布機(jī)數(shù)200個(gè),對(duì)密度函數(shù)進(jìn)行統(tǒng)計(jì)推斷X = normrnd(0,1,200,1) % 抽200個(gè)正態(tài)分布隨機(jī)數(shù)histfit(X,8); % 作示意圖% 構(gòu)造卡方統(tǒng)計(jì)量k=8;kk=linspace(-3,3,k+1); % 對(duì)區(qū)間分成8個(gè)等區(qū)間P=normcdf(kk,0,1); % 計(jì)算每個(gè)區(qū)間的概率n=(P(2:k+1)-P(1:k)*200 % 計(jì)算每個(gè)區(qū)間的理論頻數(shù)m=hist(X,k) % 計(jì)算每個(gè)區(qū)間的觀測(cè)頻數(shù)kf_7 = sum(n-m).2)./m) % 計(jì)算卡方統(tǒng)計(jì)量第75頁(yè)/共89頁(yè)% 進(jìn)行統(tǒng)計(jì)推斷chi2_p=chi2

51、cdf(kf_8,k-1) % 計(jì)算下側(cè)概率 if chi2_p0.95chi2_str=接受;else chi2_str=拒絕;endchi2_str結(jié)果為接受原假設(shè)第76頁(yè)/共89頁(yè)我們計(jì)算出的理論頻率與樣本頻率見表3-6-3表3-6-3 理論頻率與樣本頻率計(jì)算結(jié)果自由度為7的卡方統(tǒng)計(jì)量結(jié)果為:kf_7 = 9.8806最后的檢驗(yàn)結(jié)果為接受原假設(shè),樣本來(lái)自標(biāo)準(zhǔn)正態(tài)密度函數(shù)。第77頁(yè)/共89頁(yè)6 6、非參數(shù)統(tǒng)計(jì)推斷 在參數(shù)統(tǒng)計(jì)推斷中,我們是在知道樣本服從某分布的前提下進(jìn)行的,例如在知道總體為正態(tài)分布的情況下,構(gòu)造T統(tǒng)計(jì)量具有良好的估計(jì)性質(zhì)。高但在很多實(shí)際問(wèn)題中我們得到的樣本并不知道其分布特性

52、,而是只利用樣本本身進(jìn)行統(tǒng)計(jì)推斷,這樣的參數(shù)推斷稱為非參數(shù)統(tǒng)計(jì)推斷。由于非參數(shù)統(tǒng)計(jì)推斷不需要預(yù)先知道樣本的分布,雖不能達(dá)到最優(yōu)的統(tǒng)計(jì)性質(zhì),方法卻具有簡(jiǎn)單、穩(wěn)定的特點(diǎn),因此廣泛使用于生物、化學(xué)、醫(yī)學(xué)和社會(huì)科學(xué)各領(lǐng)域。MATLAB提供的非參數(shù)檢驗(yàn)命令見表3-6-1第78頁(yè)/共89頁(yè)(1)兩種處理方法好壞比較的兩種處理方法好壞比較的Wilcoxon秩和檢驗(yàn)秩和檢驗(yàn)秩的定義為:設(shè)有兩種樣本,秩的定義為:設(shè)有兩種樣本, , ,1,21nxxx2,21nyyy將它們放在一起進(jìn)行排序,得由小到大的順序序列: (3.6.1)如果xi位于數(shù)據(jù)(3.6.1)的第五個(gè)位置,則稱它的秩為5,這樣數(shù)據(jù),中的每一個(gè)元素都

53、對(duì)應(yīng)一個(gè)秩。秩和的定義為:將第一組數(shù)據(jù)的每個(gè)元素的秩相加得R1,將第二組數(shù)據(jù)每個(gè)元素的秩相加得R2,R1和R2就分別是各組的秩和,顯然它們是統(tǒng)計(jì)量。如果兩組數(shù)據(jù)來(lái)自一個(gè)總體,那么我們計(jì)算出的秩和統(tǒng)計(jì)量和就不應(yīng)該相差太大。我們可以構(gòu)造統(tǒng)計(jì)量T。 21,21nnzzz212121210),min(),min(n ,0nnRRnnnnRTn第79頁(yè)/共89頁(yè)T 與平均秩和應(yīng)相差不大,在大樣本的情況下根據(jù)中心極限定理可以構(gòu)造標(biāo)準(zhǔn)正態(tài)分布統(tǒng)計(jì)量。 12/2/2121210nnnnnnnTUWilcoxon秩和檢驗(yàn)H0:設(shè)兩獨(dú)立樣本來(lái)自等中位數(shù)的分布。H1:中位數(shù)不同。根據(jù)上面計(jì)算出的統(tǒng)計(jì)量就可以進(jìn)行統(tǒng)計(jì)推斷了。第80頁(yè)/共89頁(yè)【例3.6.1】某運(yùn)動(dòng)隊(duì)引進(jìn)新的訓(xùn)練方法,從隊(duì)中抽一批隊(duì)員用新方法訓(xùn)練,留一批使用老方法。一個(gè)月后進(jìn)行測(cè)試,問(wèn)兩方法訓(xùn)練結(jié)果有無(wú)明顯區(qū)別,見表3-6-1% 例3.6.6 兩組運(yùn)動(dòng)成績(jī)樣本的wilcoxon 檢驗(yàn)X=41 38 35 45 32;Y=56 49 60 43 39 58;p,h = ranksum(X,Y)計(jì)算結(jié)果為:p = 0.0303h = 1拒絕原假設(shè),即新方法與老方法訓(xùn)練出的結(jié)果有明顯的差別的。第81頁(yè)/共89頁(yè)(2) Wilcoxon符號(hào)秩

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論