版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、偽均勻隨機數(shù)的計算機檢驗摘要現(xiàn)代社會中,計算機能力的提高使得隨機數(shù)發(fā)生器在眾多領(lǐng)域中有了較為廣泛的應(yīng)用, 如蒙特卡羅方法,統(tǒng)計抽樣技術(shù)和密碼學(xué)等。同時關(guān)于隨機數(shù)發(fā)生器也產(chǎn)生了很多的理論 和方法,本文將簡單介紹一些常見的偽均勻隨機數(shù)發(fā)生器:線性同余發(fā)生器( LCG方法) 和反饋位移寄存器法(FSR方法)。然后對偽均勻隨機數(shù)序列進行統(tǒng)計檢驗。主要檢驗方法 有參數(shù)檢驗(包括均值、方差或各階距)、均勻性檢驗(包括卡方、柯氏和序列檢驗)、獨 立性檢驗(包括相關(guān)系數(shù)、列聯(lián)表和游程檢驗)。最后,本文將利用Matlab生成一列隨機 數(shù),并運用SPSSB計軟件對此列隨機數(shù)的統(tǒng)計特性擇其適合的方法進行檢驗。關(guān)鍵詞
2、:偽隨機數(shù);隨機數(shù)發(fā)生器;統(tǒng)計檢驗;SPSSB計分析I / 24AbstractIn modern society, the improvement of computer capabilities make random number generator widely used in many areas, such as the Monte Carlo method, statistical sampling techniques and cryptography. At the same time there are a lot of theories and methods on th
3、e random number generator, I will introduce some of the common random number generators briefly in this article: linear congruential generator (LCG method) and feedback shift register method (FSR method) . Then I will do statistical tests with the sequence of random numbers . Main methods are: param
4、eter test (involving the mean, variance, or the order from) ,the test of homogeneity (involving Chi-square, Coriolis and sequence test), test for independence (involving the correlation coefficient, contingency table and the runs test. Finally ,this paper will use the Matlab generate a sequence of r
5、andom numbers, use SPSS and select the appropriate test methods to test statistical properties of the sequence of random numbers.Key words: random number, random number generator, statistical test,SPSS statistical analysisII / 24目錄 TOC o 1-5 h z HYPERLINK l bookmark2 o Current Document 摘要 IAbstract
6、II HYPERLINK l bookmark6 o Current Document 一、引言 1 HYPERLINK l bookmark8 o Current Document 1基本概念和定理 4 HYPERLINK l bookmark10 o Current Document 2偽隨機數(shù) 5 HYPERLINK l bookmark12 o Current Document 二、產(chǎn)生隨機數(shù)的一般方法 3 HYPERLINK l bookmark14 o Current Document 取中法 3平方取中法 3 HYPERLINK l bookmark16 o Current Do
7、cument 乘積取中法 6 HYPERLINK l bookmark18 o Current Document 同余發(fā)生器 7 HYPERLINK l bookmark20 o Current Document 混合同余法 4乘同余法 7加同余3 7 HYPERLINK l bookmark22 o Current Document 反饋位移寄存器法 8 HYPERLINK l bookmark24 o Current Document 三、偽均勻隨機數(shù)的統(tǒng)計檢驗 6 HYPERLINK l bookmark26 o Current Document 檢驗步驟 6 HYPERLINK l b
8、ookmark28 o Current Document 檢驗統(tǒng)計量 6 HYPERLINK l bookmark30 o Current Document 統(tǒng)計檢驗方法 7參數(shù)檢驗 7 HYPERLINK l bookmark32 o Current Document 均勻性檢驗 8 HYPERLINK l bookmark34 o Current Document 獨立性檢驗 10 HYPERLINK l bookmark36 o Current Document 其他經(jīng)驗檢驗 12 HYPERLINK l bookmark38 o Current Document 四、實例分析 13 H
9、YPERLINK l bookmark40 o Current Document 數(shù)據(jù)產(chǎn)生及錄入 13 HYPERLINK l bookmark42 o Current Document 參數(shù)檢驗-單樣本t檢驗 13 HYPERLINK l bookmark44 o Current Document 均勻性檢驗-卡方檢驗 14 HYPERLINK l bookmark46 o Current Document 獨立性檢驗 16 HYPERLINK l bookmark48 o Current Document 本章小結(jié) 18 HYPERLINK l bookmark50 o Current D
10、ocument 五、結(jié)論 19參考文獻 20附錄 213 / 24一、引言在科學(xué)研究和工程設(shè)計中廣泛應(yīng)用到計算機模擬方法,從而常常需要產(chǎn)生大 量的具有特定統(tǒng)計性質(zhì)的隨機數(shù)。這種隨機數(shù)通常是由計算機以某種數(shù)學(xué)方法產(chǎn) 生,他們實質(zhì)上是完全確定的,但可以滿足一定的統(tǒng)計特征,故也稱為偽隨機數(shù)。 而如何產(chǎn)生達到統(tǒng)計要求的隨機數(shù), 則有不同的方法:硬件方法和軟件方法。硬 件方法可以在計算機上附上一個硬件設(shè)備或者采用移位寄存器來產(chǎn)生偽隨機數(shù); 軟件方法一般都采用數(shù)學(xué)公式法。至今關(guān)于隨機數(shù)發(fā)生器有很多的理論和方法,其中除了傳統(tǒng)的Fibonacci法、平方取中法、線性同余法、位移寄存器法和組合方法外,最近還有非
11、線性同余法、 取小數(shù)法、進位加和錯位減法、廣義反饋位移寄存器法等等。盡管這個領(lǐng)域己經(jīng) 有很多的理論研究,但是仍存在很多的實際問題,甚至最近提出的隨機數(shù)發(fā)生器 也有一些缺點。近年來在計算機中,比較廣泛使用的方法就是同余法,而在高級程序設(shè)計語 言中常采用線性同余法。每次生成的偽隨機數(shù)需要滿足獨立的條件及給定分布函 數(shù)的要求,但高級程序設(shè)計語言中提供的庫函數(shù)產(chǎn)生的偽隨機數(shù)都是滿足一定條 件的均勻分布隨機數(shù),且在同一次程序運行中,每次產(chǎn)生的偽隨機數(shù)是完全相同 的。通過在微機上對用乘同余法和混合同余法產(chǎn)生的隨機數(shù)進行大量的試驗, 發(fā)現(xiàn)通過適當(dāng)選擇算法中的各常量,用這兩種方法產(chǎn)生的隨機數(shù),其分布特性一般容
12、易通過統(tǒng)計撿驗。用隨機模擬方法解決實際問題時,首先要清楚隨機數(shù)的產(chǎn)生方法,或者說是 隨機變量的抽樣方法。1基本概念和定理定義1:設(shè)隨機變量 F(x),則稱隨機變量 隨機抽樣序列i為分布F(x) 的隨機數(shù)。若N , 2 ,則稱來自 的隨機抽樣序列1, 2,為正態(tài)分布隨機數(shù);若 服從指數(shù)分布,則稱1, 2,為指數(shù)分布的隨機數(shù);若 a, b區(qū)間均勻分布,則稱1, 2,為a, b區(qū)間上的均勻分布隨機數(shù)。4 / 24定理1設(shè)F(x)是連續(xù)且嚴格單調(diào)上升的分布函數(shù),它的反函數(shù)存在,且記為F 1(x)即 FF 1(x) x。若隨機變量 的分布函數(shù)為F(x),則F - U (0,1) o若隨機變量RU(0,1
13、),則F 1(R)的分布函數(shù)為F(x)0推論 已知 G(x),設(shè)F(x)是一個分布函數(shù),且反函數(shù) F 1(x)存在,則F 1(G() F(x)。定理2:設(shè)Xi服從二點分布i 1,2,,相互獨立,且PXi 0PXi 1 0%+a+ +&2220.X1X2Xk(用二進制表示)則 U(0,1)定義2:(準均勻分布)設(shè)離散隨機變量的概率密度為:則稱*為準均勻分布,且E12k 10,12,2k1)1一,Var 2k1 21k 012 212偽隨機數(shù)顯然,用計算機只能產(chǎn)生準均勻隨機分布數(shù),但是當(dāng)k很大時,*和均勻隨機變量的統(tǒng)計性質(zhì)差異很小,可以把準均勻隨機數(shù)做偽均勻隨機數(shù)。5 / 24二、產(chǎn)生隨機數(shù)的一般
14、方法取中法平方取中法平方取中法又稱自然取中法,首先由 Von NeumanT 1940年提出,止匕法開 始取一個2 s位十進制整數(shù)作為種子,將其平方得到的一個4s位數(shù)(不足4s位 的高位補0),然后取該4s位中間2s位作為下一種子數(shù),并對此數(shù)進行規(guī)格化 (化成小于1的2 s位的實數(shù)值),依上述過程類推便得到一維隨機數(shù)列。其一般的遞推公式是:wn 1 w:的中間2 s位數(shù)字;按此公式依次得到一列數(shù)據(jù),然后把這列數(shù)據(jù)的每一個元素都除以102s,可得到0,1區(qū)間上均勻分布的隨機數(shù)列 “,出,Un 。乘積取中法乘積取中法是通過平方取中法改進得到的一種產(chǎn)生隨機數(shù)的方法,其一般遞推公式為:Xn 1 xnx
15、n 110s (mod102s)Xn 1Rn1102s式中:Xn 1第n+1個十進制的正整數(shù);Rn 1 第n+1個偽隨機數(shù)。此方法雖然簡單,但均勻性不好,且序列很快趨于零,其長度難以確定,故目前已很少使用6 / 24同余發(fā)生器該發(fā)生方法是目前應(yīng)用最廣泛的方法之一,通常我們把它簡稱為LCG(Linear Congruence GenerateT方法,它是由 Lehmer在1951年提出的。止匕方法是利用數(shù)論中的同余運算來產(chǎn)生隨機數(shù)的,故稱之為同余發(fā)生器。LCG方法的一般遞推公式為:xn axn 1 c mod MrntM n n 1,2,其中初值為Xo , M為模數(shù),a為乘子(乘數(shù)),c為增量(
16、加數(shù)),且Xn , M ,a , c均為非負整數(shù)。顯然由上式得到的 Xn (n=1,2,)滿足:0 Xn M。從而rn 0,1。當(dāng)然,遞推公式中的參數(shù) a, c, Xo, M的選擇十分關(guān)鍵。否則,進行了一定次數(shù)的迭代之后會出現(xiàn)短周期的重復(fù)現(xiàn)象,因而我們應(yīng)慎重選取。當(dāng)參數(shù)a, c選擇不同時,對應(yīng)的方法會有稍稍的不同,具體的討論如下:混合同余法當(dāng)上面的式中參數(shù)c0, a 1時,則稱之為混合同余法,或者稱為混合式 LCG。乘同余法當(dāng) 式中c=0時的LCG方法稱為乘同余法,或是積式發(fā)生器。具體表示式Xn aXn 1 mod M如下: X /,初值為X0。rn %,n 12加同余法當(dāng) 式中c 0, a
17、1時,稱之為加同余法。具體表示式為:XnrnXn 1 c mod MXn/ n 1 2M n ,初值為X07 / 24雖說此方法可于以達到最大的周期 M ,而且計算機實現(xiàn)比較方便。但是和上面的混合同余法、乘同余法對比,驗證得出:該方法得到的隨機數(shù)列性質(zhì)相對 較差。所以,一般常用的是混合同余法和乘同余法反饋位移寄存器法隨著LCG方法的應(yīng)用,人們漸漸發(fā)現(xiàn)其缺陷并開始尋找新的隨機數(shù)發(fā)生 方法。因此,通過大家的努力,在 1965年以Tausworthe的相關(guān)論文為基礎(chǔ), 出現(xiàn)了幾種比較好的隨機數(shù)發(fā)生器。它的主要原理是通過對寄存器進行位移,直接在存儲單元中形成隨機數(shù)。我們稱這種方法為反饋位移寄存器法(
18、Feedback Shift Register Methods),簡稱之為 FSR方法。其線性遞推公式為:XiCpXx p Cp 的 p 1C1xx1(mod2)i 0,1,2,其中p為給定正整數(shù),cp 1 , ci 0或1 1,2, , p 1為給定的常數(shù) 1971年,Toot hill、Robinson和 Adams又給出了 FSR的另一遞推公式:i0,12Xo 1xi 1 xx (mod(xn xm 1)其中xj是次數(shù)小于n的且系數(shù)為0或1的多項式。而且n m 0為正整數(shù)。8 / 24三、偽均勻隨機數(shù)的統(tǒng)計檢驗偽均勻隨機數(shù)的有效性在于它們與真正的 0,1區(qū)間上均勻隨機數(shù)的性質(zhì)是 否有顯著
19、差異。這是一個重要的問題。因為二者若有顯著差異,這時以這種隨機 數(shù)發(fā)生器產(chǎn)生的隨機數(shù)為基礎(chǔ)的隨機變量所得到的樣本就不能夠反映該隨機變 量的性質(zhì),從而無法得到可靠的隨機模擬結(jié)果。因此隨機數(shù)發(fā)生器的檢驗是一項 很重要的工作。一般情況下,會有兩種不同的檢驗方法:經(jīng)驗檢驗和理論檢驗。經(jīng)驗檢驗是 一種統(tǒng)計檢驗,它是以發(fā)生器產(chǎn)生的均勻隨機數(shù)序列ri為基礎(chǔ)的,根據(jù)0,1區(qū)間上均勻總體簡單隨機樣本ui的性質(zhì),如特征向量、均勻性、隨機性等,研究 我們產(chǎn)生的隨機序列ri的相應(yīng)性質(zhì),進行比較、借鑒、視其差異是否顯著決定 取舍。理論檢驗從統(tǒng)計意義上說并不是一種檢驗,它用一種綜合的方法來評估發(fā) 生器的參數(shù)值,而根本不必
20、產(chǎn)生任何隨機數(shù)序列ri ,即它只是一種理論上的研究。由于理論檢驗方法需要專門學(xué)科的知識,數(shù)學(xué)上又相當(dāng)難,我們這里只討論 經(jīng)驗檢驗的幾種方法,通常稱為統(tǒng)計檢驗。檢驗步驟首先假設(shè)總體具有某種統(tǒng)計特性,然后由樣本值檢驗這個假設(shè)是否可信, 此 法又稱假設(shè)檢驗,具體步驟如下:提出假設(shè)H0 :總體分布為U (0,1);選取適當(dāng)白統(tǒng)計量T T(X1, ,Xn),其中X1, ,Xn是樣本,并求出T在Ho成 立時的分布;9 / 24給定顯著水平 ,確定檢驗方法,即給出否定域 w:w使得PT X1, Xn W由觀測值(樣本值)計算T值;做統(tǒng)計判斷,當(dāng)T W時否定Ho;當(dāng)T W時,Ho相容。檢驗統(tǒng)計量 根據(jù)中心極限
21、定理得到近似正態(tài)分布統(tǒng)計量設(shè)1, 2, , n是相互獨立同F(xiàn)(x)分布,且E( i), Var( i)2 ,記一 二1 n i ,則u(Mn以n (0,1)為極限分布。n i i2統(tǒng)計量將總體 的簡單子樣1,2, , n按一定規(guī)則分為互不相交的 m個組,記第i組的觀測頻數(shù)為ni(i 1,2, , m),若隨機變量 屬于第i組的概率為R ,記 理論頻數(shù)i npi ,由ni構(gòu)造統(tǒng)計量V m (n二漸進服從 2(f),其中 i 1if m l 1, l是附加在概率分布p上獨立約束條件的個數(shù)(即確定概率R時 利用樣本估計總體參數(shù)的個數(shù)),當(dāng)f 30時,U V2V J2 f 1N (0,1)。3.3統(tǒng)計
22、檢驗方法參數(shù)檢驗均勻隨機數(shù)的參數(shù)檢驗是檢驗由某個發(fā)生器產(chǎn)生的隨機數(shù)序列rj的均值、方差和各階矩陣等與均勻分布的理論值是否有顯著差異。1c 1 .若隨機變量 RU(0,1),則 E(R) -,Var(R) , E(R2)-,若 RE, R12310 / 24是均勻總體R的簡單隨機樣本,即Ri,R2, ,Rn相互獨立同U (0,1)分布,記n n n12122R - R , R R , s一(Ri則有:E(R)2E(R )E(s2)12,Var(R)12-,Var(R )12-,Var(s2)12445n :1180n設(shè)1,2,3是某個發(fā)生器產(chǎn)生的隨機數(shù),首先對特征量作統(tǒng)計檢驗。在 hn i in
23、 i i是均勻總體的簡單隨機樣本的假設(shè)下,統(tǒng)計量U1 r, E(r)1)Var(r)2.45n -2 1(r -)23U312Var(s2)日麗(s2 12)漸進服從N(0,1)。給定顯著性水平后,查標準正態(tài)數(shù)值表得:?P Ui|,(UiN(0,1),否定域 Wi Ui (i 1,2,3)。由隨機數(shù)序列rj計算Ui,U2,U3的值,若Ui,則認為產(chǎn)生的隨機數(shù)序列的特征向量與均勻 總體的特征量沒有顯著差異;否則,由于0的特征量與均勻總體的特征量有顯 著差異,故不能認為是均勻總體的簡單樣本我們用SPSS故參數(shù)檢驗時用單樣本t檢驗。單樣本t檢驗的目的是利用來 自某總體的樣本數(shù)據(jù),推斷該樣本的均值是否
24、與指定的檢驗值之間存在顯著差異。 它是對總體均值的假設(shè)檢驗。單樣本 t檢驗的原假設(shè)H。為:總體均值與檢驗值 之間不存在顯著差異,表述為 H。:0,為總體均值,為檢驗值。對單個總體均值的推斷是建立在單個樣本均值基礎(chǔ)上的, 也就是希望利用樣本均值去 估計總體均值。構(gòu)造t檢驗統(tǒng)計量為:t其中S2為樣本方差。式中,S2 n t統(tǒng)計量服從n-1個自由度的t分布。SPSS等自動計算出t統(tǒng)計量的觀測值和對11/24應(yīng)的概率P-值。給定顯著性水平,與檢驗統(tǒng)計量的概率P-值比較。若概率P-值小于顯著性水平,則應(yīng)拒絕原假設(shè),認為總體均值與檢驗值之間存在顯著差 異;反之,則不應(yīng)拒絕原假設(shè),認為總體均值與檢驗值之間無
25、顯著差異。3.3.2均勻性檢驗隨機數(shù)的均勻檢驗又稱為頻率檢驗,它用來檢驗由某個發(fā)生器產(chǎn)生的隨機數(shù) 序列ri是否均勻的分布在0,1區(qū)間上。也就是檢驗經(jīng)驗頻率與理論頻率的差異 是否顯著。2檢驗卡方檢驗基本思想的理論依據(jù)是:如果從一個隨機變量R中隨機抽取若干個觀察樣本,這些觀察樣本落在R的m個互不相交的子集中的觀察頻數(shù)服從一個 多項分布,這個多項分布在 m趨向于無窮時近似服從卡方分布。設(shè)1,/2,,rn使待檢驗的一組隨機數(shù),假設(shè) H。:1,2,,rn為均勻總體的簡 單樣本。i 1 i將0,1)區(qū)間分為m個小區(qū)間,以,)(i 1,2, ,m)表示第i個小區(qū)間, m m設(shè)rj (j 1,2, ,n)落入
26、第i個小區(qū)間的數(shù)目為ni (i 1,2, ,m)。1根據(jù)均勻性假設(shè),口落入每個小區(qū)間的概率為 ,,第i個小區(qū)間的理論頻 mm (n.)2 m數(shù) i -(i 1,2, ,m),統(tǒng)計量 V(nL m (ni -)2 漸進服從mi 1 in i 1 m2(m 1),給定顯著性水平,查2分布表得臨界值后,即可對經(jīng)驗頻率與理論頻率的差異作顯著性檢驗。若2的概率P-值小于顯著性水平,則應(yīng)拒絕原 假設(shè),認為樣本來自的總體分布與期望分布或某一理論分布存在顯著差異;反之,則不能拒絕原假設(shè),可以認為樣本來自的總體分布與期望分布或某一理論分布不 存在顯著差異。K-S檢驗(柯氏檢驗)K-S (柯爾莫哥洛夫-斯米爾諾夫
27、)檢驗的原假設(shè)是:樣本來自的總體與指12 / 24定的理論分布無顯著差異。其基本思路是:首先,在原假設(shè)成立的前提下,計算 各樣本觀測值在理論分布中出現(xiàn)的累計概率值F(x);其次,計算各樣本觀測值的實際累計概率值S(x);計算實際累計概率值與理論累計概率值的差 D(x);最 后,計算差值序列中最大絕對差值,即D max S Xi F Xi 。 D統(tǒng)計量也稱為 K-S統(tǒng)計量。在小樣本下,原假設(shè)成立時,D統(tǒng)計量服從柯氏分布。在大樣本下,原假 設(shè)成立時,而D近似服從K(x)分布:當(dāng)D小于0時,K(x)為0;當(dāng)D大于0時,K(x)=1 exp 2 j2x2若D統(tǒng)計量的概率P-值小于顯著性水平,則應(yīng)拒絕原
28、假設(shè),認為樣本來自的總體分布與給定的分布存在顯著差異;反之,則不能拒絕原假設(shè),可以認為樣本來自的總體分布與給定的分布不存在顯著差異。序列檢驗(Serial test)序列檢驗實際上是用于多維分布的均勻性檢驗,它也間接地檢驗序列的獨 立性。已知隨機數(shù)序列rj (i 1,2, ,2n),將容量為2n的隨機數(shù)一次配對為:V1(1,2)”2(LL), ,Vn (占 1,加)如果0是均勻隨機數(shù)序列,那么他們應(yīng)該構(gòu)成平面上正方形內(nèi)的二維均勻隨機向量的樣本。將單位正方形分成k2個等面積的小正方形,nj表示vi(t 1,2, ,n)落入第(i, j)個小正方形的頻數(shù);理論頻數(shù)j 三。則檢驗統(tǒng)k一k2 k k計
29、量V (nj 鳥)2在分為均勻分布的獨立抽樣序列成歷史漸進的服n i 1 j 1 k從 2(k2 1)。以上二維的序列檢驗可以推廣到三維、四維直至一般的d維。即對依次用不相交的d階組合(d tuptes):13 / 24V2 (rd i,rd 2,乙),Vk (r(k i)d i, r(k i)d 2, rkd),它們應(yīng)該是在單位d維超立方體0,id中均勻分布的獨立隨機樣本。把0,i 區(qū)間分為m個相等的小區(qū)間,相應(yīng)地把單位 d維超立方體分成md個小立方體, 用*表示vj落入第(ji, j2, ,jd)個超立方體的個數(shù)。統(tǒng)計量d m mV -(njij2 jd 口)2漸進服從2(md i)(n
30、)。這種d維均勻分布n ji i jd im的檢驗(序列檢驗)間接地檢驗了 rj的獨立性。3.3.3獨立性檢驗獨立性檢驗主要檢驗隨機數(shù)序列ri, r2, , rn之間的統(tǒng)計相關(guān)性是否顯著。它通常包括以下幾種檢驗方法:相關(guān)系數(shù)檢驗兩個隨機變量的相關(guān)系數(shù)反映它們之間線性相關(guān)程度,若兩個隨機變量獨立,則它們的相關(guān)系數(shù)必為零(反之不一定),故可以利用相關(guān)系數(shù)檢驗隨機數(shù)的獨 立性。設(shè)ri,乙 3是待檢驗的一組隨機數(shù),原假設(shè) H。:相關(guān)系數(shù)00考慮樣i n j(ri r)(n j r)本的j階自相關(guān)系數(shù) (j) -一= (j i,2, , m)i (ri ;)2 n i i相關(guān)系數(shù)范圍為:i i,當(dāng)| |
31、 0.3時,表示變量的線性相關(guān)性較弱。SPSS將自動計算自相關(guān)系數(shù)及標準誤差,概率 P-值,若檢驗統(tǒng)計量的概率P-i4 / 24值小于給定的顯著性水平,應(yīng)拒絕原假設(shè),認為變量存在線性相關(guān)性;若相反,則不應(yīng)拒絕原假設(shè),認為變量間不存在線性相關(guān)性。當(dāng)n j充分大,且0成立時,Uj(j)vn漸進服從N(0,1)分布(j1,2, ,m:在實際檢驗中,常取m1020)。利用統(tǒng)計量Uj可以進行相關(guān)性檢驗相關(guān)系數(shù)檢驗另外,1,2, ,%的j階自相關(guān)系數(shù)(j)還可以定義為:1 n (rr)(kr)(j 12 , m)其中,k(i j)mod n ,1 n -(rir)2。n i 1記Cj1 n一 rn n i
32、 1c 一 1(C r ) (Cj 4s212可以證明:E(Cj)113Var(Cj),這時檢驗假設(shè)H。:4J 144nE( j) 0可以用檢驗假設(shè)H 0:E(Cj)1一一,-來代替。統(tǒng)計檢驗量為:T4Cji 4N (0,1)利用統(tǒng)計量T13144n可進行相關(guān)性檢驗。列聯(lián)表檢驗在平面上,將單位正方形分成m2個相等的小正 方形,把n個隨機數(shù)。上,按先后順序兩兩分組,例如取:(1,e) , (2 e),,(rn e,rn ),(rn e1,r1) ,, (r n,re )其中,e為大于1的正數(shù)。記這些數(shù)對落入第(i, j)個小正方形內(nèi)的數(shù)目為15 / 24nj (i, j 1, m)令:ninj
33、, nj njj 1i 1用pj表示落入第(i,j)個小正方形內(nèi)的概率。當(dāng)獨立性假設(shè)成立時,PijPi?Pj (i,j1,2, m)其中,Pi?表示隨機數(shù)落入第i列的概率,P?j表小落入第j行的概率用最大似然法可得:Pi?ni?一,P?jn?jn檢驗統(tǒng)計量m (njn Pi? P?j)(njni? n?j 2n )n nj 1 n Pi? P?ji i j iA?n?jnmni 1m n21漸進服從1 ni?n?j2 / 2(ml 1),其中l(wèi)是用樣本來估計 Pi?和p?j的個數(shù),故l 2m 2 ,所以V - 2(m 1)2)。3.3.4其他經(jīng)驗檢驗如最值檢驗,最值檢驗主要是檢驗偽均勻隨機數(shù)序
34、列的最大值和最小值。16 / 24四、實例分析本文利用 Matlab中的Rand函數(shù)來產(chǎn)生隨機數(shù)序列并運用作者學(xué)過的 SPSS統(tǒng)計軟件對隨機數(shù)序列做統(tǒng)計檢驗。數(shù)據(jù)產(chǎn)生及錄入打開 Matlab ,在工作窗口輸入指令:shuju=1*rand (1000,1 )+0,點擊“Enter 即得到1000個數(shù)據(jù)。而由于SPSS無法直接讀取MATLAB data file格式的數(shù) 據(jù),因此我們先將產(chǎn)生的隨機數(shù)導(dǎo)入一個電子表格中,命名為“ shuju”這樣, SPSS就可以直接讀取了,步驟為:選擇菜單File - Open-【Data,選 擇數(shù)據(jù)文件的類型“ .xls”,并輸入文件名“ shuju”,出現(xiàn)下
35、圖:我們默認將Excel工作表中的全部數(shù)據(jù)讀入,直接點擊“ ok”。得到界面如下:17 / 24參數(shù)檢驗-單樣本t檢驗單樣本t檢驗在本例中的原假設(shè)H??梢员硎鰹椋?0.5。操作步驟:選擇菜單【Analyze】-Compare Means - One-samples T Test出現(xiàn)如下圖所示的窗口:將數(shù)據(jù)選擇到【Test Variable (s),并將Test Value 中的0改為0.5 ,點擊“ok”,得到以下結(jié)果:One-Saimple StatistucshMeanStd. Deviation5td. ErrorMeanVI1000,51722&0.009023818 / 24One-
36、Sample TetTest Value - 0.5tdr期(2-tailedMtidn DffTererice05% Confidnca Interval of the Diff&rerceLowerUpperVI1.9C9999,057.0172260-O0 04797.0349357由第一張表可知:Matlab產(chǎn)生的1000個01之間的隨機數(shù)的均值是 0.51723 ,標準差是0.28536 ,均值標準誤差是0.09024。從第二張表我們看到 這組數(shù)的t統(tǒng)計量的觀測值是1.909,自由度為999, t統(tǒng)計量的雙尾概率P值 是0.057 ,顯然P a (a=0.05),則不應(yīng)拒絕原假設(shè),即
37、認為總體均值與檢驗值 之間無顯著差異:樣本均值與檢驗值的差是0.01723 (它除以均值標準誤差0.09024后得到t統(tǒng)計量的觀測值),最后兩列是總體均值與原假設(shè)值差的95%的置信區(qū)間為(-0.00048 , 0.03494 ),由此計算出總體均值的95%的置信區(qū)間 為(0.49952 , 0.53494 ),這表示我們有95%的把握認為總體均值在 0.499520.53494之間,0.5包含在這個區(qū)間內(nèi),這也證明了總體均值與檢驗值之間無顯著差異。均勻性檢驗-卡方檢驗本例中卡方檢驗的原假設(shè)Ho可以表述為:樣本數(shù)據(jù)的分布與(0,1 )上的均 勻分布無顯著差異。但在做卡方檢驗之前,需要將數(shù)據(jù)分組。
38、我們將這1000個數(shù)據(jù)分為十組,即各組為:00.10000、0.100010.20000、0.200010.30000 、0.900011。操作步驟如下:選擇菜單【Tansform】-【Recode】-Into DifferentVariables 】,選擇分組變量到【Numeric Variable-Output 框中,在【OutputVariable 框中的Name后輸入存放分組結(jié)果的變量名,并按“ change ”確 認。也可在【Lable】后輸入相應(yīng)的變量名標簽,再按“ Old and New values ”19 / 24按鈕進行分組區(qū)間的定義。如下圖:然后進行卡方檢驗。操作步驟如下
39、:選擇菜單Analyze - NonparametricTests - Chi-Square ,出現(xiàn)如下窗口:選擇待檢驗白變量到【Test Variable List 框中。在【Expected Values )框中給出理論值,我們默認為“ All categories equal ”(即表示所有子集的頻數(shù)都相等)。得到下表:Observed NEipeaed iResMuiil.QiJ歟ICO t-12.065100,015. D3.00生300.04.0日.口 J10 OJO6.05.Q01C3IC 0.05.0b.DD115100.0Ib.D7.001C4100.046.D01CG1CQ
40、.03.0。由。98100.0-2.010.00109IC 0.09.QTotal10C0分組后數(shù)據(jù)分蛆后數(shù)據(jù)Chi-Squares7.&60df9Asyrnp. 5ig.569Test Statisticsa. 0 cells (.0%) have expected frequencies less than5. The rninrnum expected celfreauencY b 100.0-第一個表的第二列是指每組的頻數(shù), 第三列是理論頻數(shù),第四列是實際頻數(shù)與理20 / 24論頻數(shù)的差;第二個表是計算的卡方統(tǒng)計量以及對應(yīng)的概率P-值,若選擇的顯著水平a是0.05,由于概率P-值大于a,表示實際分布
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 新人教版七年級數(shù)學(xué)上冊 3.3 《解一元一次方程》聽評課記錄1
- 人教版歷史七年級上冊第14課《溝通中外文明的“絲綢之路”》聽課評課記錄
- 現(xiàn)場電力服務(wù)合同(2篇)
- 生活設(shè)施租賃協(xié)議書(2篇)
- 新版湘教版秋八年級數(shù)學(xué)上冊第二章三角形課題已知邊角作三角形聽評課記錄
- 新版華東師大版八年級數(shù)學(xué)下冊《18.2平行四邊形的判定》聽評課記錄
- 湘教版數(shù)學(xué)八年級下冊4.3《一次函數(shù)的圖象》聽評課記錄1
- 魯人版道德與法治七年級下冊13.3《正視壓力 輕松前行》聽課評課記錄
- 2022年新課標八年級上冊歷史第3課太平天國運動聽課評課記錄
- 人教版九年級數(shù)學(xué)上冊22.2.1《二次函數(shù)與一元二次方程》聽評課記錄
- 裝修工程延期協(xié)議
- 《梅大高速茶陽路段“5·1”塌方災(zāi)害調(diào)查評估報告》專題警示學(xué)習(xí)
- 2024年09月北京中信銀行北京分行社會招考(917)筆試歷年參考題庫附帶答案詳解
- 《大健康解讀》課件
- 2025年度交通運輸規(guī)劃外聘專家咨詢協(xié)議3篇
- 2024年04月北京中信銀行北京分行社會招考(429)筆試歷年參考題庫附帶答案詳解
- 專項債券培訓(xùn)課件
- 《會務(wù)的組織和管理》課件
- 2024年公司領(lǐng)導(dǎo)在新年動員會上的講話樣本(3篇)
- 《倒虹吸管安全評價導(dǎo)則》
- 2025年中國濕度傳感器行業(yè)深度分析、投資前景、趨勢預(yù)測報告(智研咨詢)
評論
0/150
提交評論