版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
實驗九數(shù)據(jù)統(tǒng)計的有關(guān)計算數(shù)理統(tǒng)計研究的對象是受隨機因素影響的數(shù)據(jù),數(shù)理統(tǒng)計是以概率論為基礎(chǔ)的一門應用學科。數(shù)據(jù)樣本少則幾個,多則成千上萬,人們希望能用少數(shù)幾個包含其最多相關(guān)信息的數(shù)值來體現(xiàn)數(shù)據(jù)樣本總體的規(guī)律。描述性統(tǒng)計就是搜集、整理、加工和分析統(tǒng)計數(shù)據(jù),使之系統(tǒng)化、條理化,以顯示出數(shù)據(jù)資料的趨勢、特征和數(shù)量關(guān)系。它是統(tǒng)計推斷的基礎(chǔ),實用性較強,在統(tǒng)計工作中經(jīng)常使用。面對一批數(shù)據(jù)如何進行描述與分析,需要掌握參數(shù)估計和假設(shè)檢驗這兩個數(shù)理統(tǒng)計的最基本方法。1統(tǒng)計的基本概念1.1總體和樣本總體是人們研究對象的全體,又稱母體,如工廠一天生產(chǎn)的全部產(chǎn)品(按合格品及廢品分類),學校全體學生的身高??傮w中的每一個基本單位稱為個體,個體的特征用一個變量(如^)來表示,如一件產(chǎn)品是合格品記X=0,是廢品記X=1;一個身高170(cm)的學生記x=170。從總體中隨機產(chǎn)生的若干個個體的集合稱為樣本,或子樣,如〃件產(chǎn)品,100名學生的身高,或者一根軸直徑的10次測量。實際上這就是從總體中隨機取得的一批數(shù)據(jù),不妨記作氣,七'七,n稱為樣本容量。簡單地說,統(tǒng)計的任務是由樣本推斷總體。1.2頻數(shù)表和直方圖一組數(shù)據(jù)(樣本)往往是雜亂無章的,作出它的頻數(shù)表和直方圖,可以看作是對這組數(shù)據(jù)的一個初步整理和直觀描述。將數(shù)據(jù)的取值范圍劃分為若干個區(qū)間,然后統(tǒng)計這組數(shù)據(jù)在每個區(qū)間中出現(xiàn)的次數(shù),稱為頻數(shù),由此得到一個頻數(shù)表。以數(shù)據(jù)的取值為橫坐標,頻數(shù)為縱坐標,畫出一個階梯形的圖,稱為直方圖或頻數(shù)分布圖。若樣本容量不大,能夠手工作出頻數(shù)表和直方圖,當樣本容量較大時則可以借助Matlab這樣的軟件了。讓我們以下面的例子為例,介紹頻數(shù)表和直方圖的作法。例1學生的身高和體重學校隨機抽取100名學生,測量他們的身高和體重,所得數(shù)據(jù)如表身高體重身高體重身高體重身高體重身高體重17275169551696417165167471716216867165521696216865166621686516459170581656416055175671737417264168571555717664172691695817657173581685016952167721705716655161491735717576158511706316963173611645916562167531716116670166631725317360178641635716954169661786017766170561675416958173731705816065179621725016347173671655817663162521656617259177661826917575170601706216963186771746616350172591766016676167631725717758177671697216650182631766817256173591746417159175681655616965168621776418470166491717117059(=1\*romani)數(shù)據(jù)輸入數(shù)據(jù)輸入通常有兩種方法,一種是在交互環(huán)境中直接輸入,如果在統(tǒng)計中數(shù)據(jù)量比較大,這樣作不太方便;另一種辦法是先把數(shù)據(jù)寫入一個純文本數(shù)據(jù)文件data.txt中,格式如例1的表格,有20行、10列,數(shù)據(jù)列之間用空格鍵或Tab鍵分割,該數(shù)據(jù)文件data.txt存放在matlab\work子目錄下,在Matlab中用load命令讀入數(shù)據(jù),具體作法是:loaddata.txt這樣在內(nèi)存中建立了一個變量data,它是一個包含有2010個數(shù)據(jù)的矩陣。為了得到我們需要的100個身高和體重各為一列的矩陣,應做如下的改變:high=data(:,1:2:9);high=high(:)weight=data(:,2:2:10);weight=weight(:)(=2\*romanii)作頻數(shù)表及直方圖用hist命令實現(xiàn),其用法是:[N,X]=hist(Y,M)數(shù)組(行、列均可)Y的頻數(shù)表。它將區(qū)間[min(Y),max(Y)]等分為M份(缺省時M設(shè)定為10),N返回M個小區(qū)間的頻數(shù),X返回M個小區(qū)間的中點。hist(Y,M)數(shù)組Y的直方圖。對于例1的數(shù)據(jù),編寫程序如下:loaddata.txt;high=data(:,1:2:9);high=high(:);weight=data(:,2:2:10);weight=weight(:);[n1,x1]=hist(high)[n2,x2]=hist(weight)subplot(1,2,1)hist(high)subplot(1,2,2)hist(weight)計算結(jié)果略,直方圖如下圖所示:
150 160 170 180 19040 50 60 70 80150 160 170 180 19040 50 60 70 80從直方圖上可以看出,身高的分布大致呈中間高、兩端低的鐘形;而體重則看不出什么規(guī)律。要想從數(shù)值上給出更確切的描述,需要進一步研究反映數(shù)據(jù)特征的所謂“統(tǒng)計量”。直方圖所展示的身高的分布形狀可看作正態(tài)分布,當然也可以用這組數(shù)據(jù)對分布作假設(shè)檢驗。1.3統(tǒng)計量假設(shè)看一個容量為n的樣本(朗一組數(shù)據(jù))記作x=(x"氣,…,x)需要對它進行一假設(shè)有1容量為的樣本(即組數(shù)據(jù)),記IF 12n,需要對匕進行定的加工,才能提出有用的信息,用作對總體(分布)參數(shù)的估計和檢驗。統(tǒng)計量就是加工出來的、反映樣本數(shù)量特征的函數(shù),它不含任何未知量。下面我們介紹幾種常用的統(tǒng)計量。(=1\*romani)表示位置的統(tǒng)計量一算術(shù)平均值和中位數(shù)算術(shù)平均值(簡稱均值)描述數(shù)據(jù)取值的平均位置,記作亍,_ 1寸x-Ex(2)((2)(1)i=1中位數(shù)是將數(shù)據(jù)由小到大排序后位于中間位置的那個數(shù)值。Matlab中mean(x)返回x的均值,median(x)返回中位數(shù)。(=2\*romanii)表示變異程度的統(tǒng)計量一標準差、方差和極差標準差S定義為E(X-x)2n-1ii=1它是各個數(shù)據(jù)與均值偏離程度的度量,這種偏離不妨稱為變異。方差是標準差的平方技。■^辛BX(X,X,..?,X)陋旦估旦,1、估丹半極差是12n的最大值與最小值之差。Matlab中std(x)返回x的標準差,var(x)返回方差,range(x)返回極差。你可能注意到標準差s的定義(2)中,對n個(Xi—x)的平方求和,卻被(n-1)除,這是出于無偏估計的要求。若需要改為被n除,Matlab可用std(x,1)和var(x,1)來實現(xiàn)。(=3\*romaniii)中心矩、表示分布形狀的統(tǒng)計量一偏度和峰度隨機變量X的〃階中心矩為E(X—EX)'。
隨機變量x的偏度和峰度指的是x的標準化變量(*—E"DD的三階中心矩和四階中心矩:—J「D-e(D)tL或-e(d)*IV廣EI^JD(x^Jl=(D(D)'、4)、4)4](D(D)》偏度反映分布的對稱性,Vi>0稱為右偏態(tài),此時數(shù)據(jù)位于均值右邊的比位于左邊的多;Vi<0稱為左偏態(tài),情況相反;而〃i接近0則可認為分布是對稱的。峰度是分布形狀的另一種度量,正態(tài)分布的峰度為3,若〃2比3大得多,表示分布有沉重的尾巴,說明樣本中含有較多遠離均值的數(shù)據(jù),因而峰度可以用作衡量偏離正態(tài)分布的尺度之一。Matlab中moment(x,order)返回x的order階中心矩,order為中心矩的階數(shù)。skewness(x)返回x的偏度,kurtosis(x)返回峰度。在以上用Matlab計算各個統(tǒng)計量的命令中,若x為矩陣,則作用于x的列,返回一個行向量。對例1給出的學生身高和體重,用Matlab計算這些統(tǒng)計量,程序如下:clcloaddata.txt;high=data(:,1:2:9);high=high(:);weight=data(:,2:2:10);weight=weight(:);shuju=[highweight];jun_zhi=mean([highweight])zhong_wei_shu=median(shuju)biao_zhun_cha=std(shuju)ji_cha=range(shuju)pian_du=skewness(shuju)feng_du=kurtosis(shuju)統(tǒng)計量中最重要、最常用的是均值和標準差,由于樣本是隨機變量,它們作為樣本的函數(shù)自然也是隨機變量,當用它們?nèi)ネ茢嗫傮w時,有多大的可靠性就與統(tǒng)計量的概率分布有關(guān),因此我們需要知道幾個重要分布的簡單性質(zhì)。1.4統(tǒng)計中幾個重要的概率分布1.4.1分布函數(shù)、密度函數(shù)和分位數(shù)隨機變量的特性完全由它的(概率)分布函數(shù)或(概率)密度函數(shù)來描述。設(shè)有隨機變量X,其分布函數(shù)定義為XJD的概率,即F(D)=P{X-D}。若X是連續(xù)型隨機變量,則其密度函數(shù)p(D)與F(D)的關(guān)系為F(x)=jxp(x)dx—8 .分位數(shù)是下面常用的一個概念,其定義為:對于0〈aV1,使某分布函數(shù)F(x)=□的X,成為這個分布的a分位數(shù),記作"a。我們前面畫過的直方圖是頻數(shù)分布圖,頻數(shù)除以樣本容量",稱為頻率,n充分大時頻率是概率的近似,因此直方圖可以看作密度函數(shù)圖形的(離散化)近似。1.4.2統(tǒng)計中幾個重要的概率分布(=1\*romani)正態(tài)分布正態(tài)分布隨機變量X的密度函數(shù)曲線呈中間高兩邊低、對稱的鐘形,期望(均值)EX=R,方差DX,記作X~N(口q2)/稱均方差或標準差,當四=°,"=1時稱為標準正態(tài)分布,記作X~N(°,1)。正態(tài)分布完全由均值H和方差"2決定,它的偏度為0,峰度為3。正態(tài)分布可以說是最常見的(連續(xù)型)概率分布,成批生產(chǎn)時零件的尺寸,射擊中彈著點的位置,儀器反復量測的結(jié)果,自然界中一種生物的數(shù)量特征等,多數(shù)情況下都服從正態(tài)分布,這不僅是觀察和經(jīng)驗的總結(jié),而且有著深刻的理論依據(jù),即在大量相互獨立的、作用差不多大的隨機因素影響下形成的隨機變量,其極限分布為正態(tài)分布。鑒于正態(tài)分布的隨機變量在實際生活中如此地常見,記住下面3個數(shù)字是有用的:68%的數(shù)值落在距均值左右1個標準差的范圍內(nèi),即P{^—"<X<日+b}=0.68;95%的數(shù)值落在距均值左右2個標準差的范圍內(nèi),即尸{日一2"<X<日+2"}=0.95;99.7%的數(shù)值落在距均值左右3個標準差的范圍內(nèi),即尸山一3"<X<日+3"}=0.997.(=2\*romanii)*2分布(Chisquare)若X1,X2,,X為相互獨立的、服從標準正態(tài)分布N(0,1)的隨機變量,則它們的平方Y(jié)=/X2和頃’服從*2分布,記作Y~*2(n),n稱自由度,它的期望EY=n,方差DY=2n。(=3\*romaniii)'分布若X~N(0,1),Y~*2(n),且相互獨立,則vY/n服從t分布,記作b~t(n),n稱自由度。t分布又稱學生氏(Student)分布。t分布的密度函數(shù)曲線和N(0,1)曲線形狀相似。理論上nT8時,T~'(n)TN(0,1),實際上當n>30時它與N(0,1)就相差無幾了。(=4\*romaniv)F分布F="若X?X2(ni),Y-X2(n2),且相互獨立,則 Y/n2服從F分布,記作F~F(n,n) (n,n'等、1 2, 1 2稱口田度。1.4.3Matlab統(tǒng)計工具箱(Toolbox'Stats)1中的概率分布Matlab統(tǒng)計工具箱中有20種概率分布,這里只對上面所述4種分布列出命令的字符:norm正態(tài)分布;chi2X之分布;t'分布 fF分布工具箱對每一種分布都提供5類函數(shù),其命令的字符是:pdf概率密度;cdf分布函數(shù);inv分布函數(shù)的反函數(shù);stat均值與方差;rnd隨機數(shù)生成當需要一種分布的某一類函數(shù)時,將以上所列的分布命令字符與函數(shù)命令字符接起來,并輸入自變量(可以是標量、數(shù)組或矩陣)和參數(shù)就行了,如:p=normpdf(x,mu,sigma)均值mu、標準差sigma的正態(tài)分布在*的密度函數(shù)(mu=0,sigma=1時可缺省)。p=tcdf(x,n)'分布(自由度n)在x的分布函數(shù)。x=chi2inv(p,n)X2分布(自由度n)使分布函數(shù)F(x)=p的x(即p分位數(shù))。[m,v]=fstat(n1,n2)F分布(自由度n1,n2)的均值m和方差v。幾個分布的密度函數(shù)圖形就可以用這些命令作出,如:x=6:0.01:6y=normpdf(x)z=normpdf(x,0,2)plot(x,y,x,z),gtext('N(0,1)'),gtext('N(0,2八2)')分布函數(shù)的反函數(shù)的意義從下例看出:x=chi2inv(0.9,10)x=15.9872如果反過來計算,則P=chi2cdf(15.9872,10)P=0.90001.5正態(tài)總體統(tǒng)計量的分布用樣本來推斷總體,需要知道樣本統(tǒng)計量的分布,而樣本又是一組與總體同分布的隨機變量,所以樣本統(tǒng)計量的分布依賴于總體的分布。當總體服從一般的分布時,求某個樣本統(tǒng)計量的分布是很困難的,只有在總體服從正態(tài)分布時,一些重要的樣本統(tǒng)計量(均值、標準差)的分布才有便于使用的結(jié)果。另一方面,現(xiàn)實生活中需要進行統(tǒng)計推斷的總體,多數(shù)可以認為服從(或近似服從)正態(tài)分布,所以統(tǒng)計中人們在正態(tài)總體的假定下研究統(tǒng)計量的分布,是必要的與合理的。
X~^N(ILA,b2)X,X,,x日n S設(shè)總體 '),12 n為一谷量n的樣本,其均值X和標準差S由式(1)、(2)確定,則用X和s構(gòu)造的下面幾個分布在統(tǒng)計中是非常有用的。x?N(A,胃) ?N(0,1)n或b/*n(n-1)s2?12(n-1).b2二?t(n-1)s/5(3)(4)(5)確定的均值X'、和標準差I(lǐng)'S2,則(七叩-(y-叩?n(0,1)Jb2/n+b2/n(x-叩-(y-七)?(3)(4)(5)確定的均值X'、和標準差I(lǐng)'S2,則(七叩-(y-叩?n(0,1)Jb2/n+b2/n(x-叩-(y-七)?t(n*n-2)^s2/n+s2/n1 2s2其中(n—1)s2+(n—1)s2
―1 1 2 3-n+n—2s2/b2s2/b2?F(n1-1,n2-1)(6)(7)(8)對于(7)式,假定b1=b2,但它們未知,于是用’代替。在下面的統(tǒng)計推斷中我們要反復用到這些分布。2參數(shù)估計利用樣本對總體進行統(tǒng)計推斷的一類問題是參數(shù)估計,即假定已知總體的分布,通常是X?N(A,b2),估計參數(shù)的分布,如A,b2。參數(shù)估計分點估計和區(qū)間估計兩種。2.1點估計點估計是用樣本統(tǒng)計量確定總體參數(shù)的一個數(shù)值。評價估計優(yōu)劣的標準有無偏性、最小方差性、有效性等,估計的方法有矩法、極大似然法等。最常用的是對總體均值A(chǔ)和b2方差(或標準差b)作點估計。讓我們暫時拋開評價標準,當從一個樣本按照式(1)、(2)算出樣本均值X和方差s2后,對A和b2(或b)個自然、合理的點估計顯然是(在字母上加”表示它的估計值)
R=R=Xb2=S2 b=S,,(9)2.2區(qū)間估計點估計雖然給出了待估參數(shù)的一個數(shù)值,卻沒有告訴我們這個估計值的精度和可信程度。一般地,總體的待估參數(shù)記作0(如p,b2),由樣本算出的0的估計量記作0,人們常希望給出一個區(qū)間[常希望給出一個區(qū)間[01,62],使0以一定的概率落在此區(qū)間內(nèi)。若有P{0P{0<0<0}=1—a120<a<1(10)E>t[^^.0] I—-*>、—f0.0八r.i-Cf,、t,,,,—I~*rm-Ti-i,,,,rn1—fV-f-r.、r,,,,inn*>-t、則L1,2」稱為的直信區(qū)間,1,2分別稱為直信下限和直信上限,1頃稱為直信概率或置信水平,a稱為顯著性水平。給出的置信水平為】—a的置信區(qū)間[01,02],稱為0的區(qū)間估計。置信區(qū)間越小,估計的精度越高;置信水平越大,估計的可信程度越高。但是這兩個指標顯然是矛盾的,通常是在一定的置信水平下使置信區(qū)間盡量小。通俗地說,區(qū)間估計給出了點估計的誤差范圍。2.3參數(shù)估計的Matlab實現(xiàn)Matlab統(tǒng)計工具箱中,有專門計算總體均值、標準差的點估計和區(qū)間估計的函數(shù)。對于正態(tài)總體,命令是[mu,sigma,muci,sigmaci]=normfit(x,alpha)其中X為樣本(數(shù)組或矩陣),alpha為顯著性水平a(alpha缺省時設(shè)定為0.05),返回總體均值^和標準差b的點估計mu和sigma,及總體均值R和標準差Q的區(qū)間估計muci和sigmaci。當x為矩陣時返回行向量。Matlab統(tǒng)計工具箱中還提供了一些具有特定分布總體的區(qū)間估計的命令,如expfit,poissfit,gamfit,你可以從這些字頭猜出它們用于哪個分布,具體用法參見幫助系統(tǒng)。3假設(shè)檢驗統(tǒng)計推斷的另一類重要問題是假設(shè)檢驗問題。在總體的分布函數(shù)完全未知或只知其形式但不知其參數(shù)的情況,為了推斷總體的某些性質(zhì),提出某些關(guān)于總體的假設(shè)。例如,提出總體服從泊松分布的假設(shè),又如對于正態(tài)總體提出數(shù)學期望等于"0的假設(shè)等。假設(shè)檢驗就是根據(jù)樣本對所提出的假設(shè)做出判斷:是接受還是拒絕。這就是所謂的假設(shè)檢驗問題。3.1單個總體N(呻2)均值R的檢驗原假設(shè)(或零假設(shè))為:H0:p=p0。備選假設(shè)有三種可能:H:^袂H:p>pH:p<pb2已知,關(guān)于^的檢驗(u檢驗)在Matlab中u檢驗法由函數(shù)ztest來實現(xiàn),命令為[h,p,ci]=ztest(x,mu,sigma,alpha,tail)其中輸入?yún)?shù)X是樣本,mu是H0中的四0,sigma是總體標準差Q,alpha是顯著性水平a(alpha缺省時設(shè)定為0.05),tail是對備選假設(shè)H1的選擇:H1為*'*°時用tail=0(可缺?。?;H1為*>*0時用tail=1;H1為*<*0時用tail=-1。輸出參數(shù)h=0表示接受Ho,h=1表示拒絕H0,p表示在假設(shè)H0下樣本均值出現(xiàn)的概率,p越小H0越值得懷疑,ci是*0的置信區(qū)間。例3某車間用一臺包裝機包裝糖果。包得的袋裝糖重是一個隨機變量,它服從正態(tài)分布。當機器正常時,其均值為0.5公斤,標準差為0.015公斤。某日開工后為檢驗包裝機是否正常,隨機地抽取它所包裝的糖9袋,稱得凈重為(公斤):0.497 0.506 0.518 0.524 0.498 0.5110.5200.5150.512問機器是否正常?解總體^已知,*~N(*°0152),*未知。于是提出假設(shè)H0:*=*0=°?5和H:*。0.5Matlab實現(xiàn)如下:x=[0.497 0.506 0.518 0.524 0.49...0.511 0.520 0.515 0.512];[h,p,ci]=ztest(x,0.5,0.015)求得h=1,p=0.0248,說明在0.05的水平下,可拒絕原假設(shè),即認為這天包裝機工作不正常。G2未知,關(guān)于*的檢驗('檢驗)在Matlab中*檢驗法由函數(shù)ttest來實現(xiàn),命令為[h,p,ci]=ttest(x,mu,alpha,tail)例4某種電子元件的壽命*(以小時計)服從正態(tài)分布,*,C2均未知.現(xiàn)得16只元件的壽命如下:159 280 101 212 224 379 179 264222 362 168 250 149 260 485 170問是否有理由認為元件的平均壽命大于225(小時)?解按題意需檢驗H:*<*=225,H:*>225取a=0.05。Matlab實現(xiàn)如下:x=[159 280 101 212 224 379 179 264...222 362 168 250 149 260 485 170];[h,p,ci]=ttest(x,225,0.05,1)求得h=0,p=0.2570,說明在顯著水平為0.05的情況下,不能拒絕原假設(shè),認為元件
的平均壽命不大于225小時。3.2兩個正態(tài)總體均值差的檢驗('檢驗)還可以用*檢驗法檢驗具有相同方差的2個正態(tài)總體均值差的假設(shè)。在Matlab中由函數(shù)ttest2實現(xiàn),命令為:[h,p,ci]=ttest2(x,y,alpha,tail)與上面的ttest相比,不同處只在于輸入的是兩個樣本x,y(長度不一定相同),而不是一個樣本和它的總體均值;tail的用法與ttest相似,可參看幫助系統(tǒng)。例5在平爐上進行一項試驗以確定改變操作方法的建議是否會增加鋼的得率,試驗是在同一平爐上進行的。每煉一爐鋼時除操作方法外,其它條件都可能做到相同。先用標準方法煉一爐,然后用建議的新方法煉一爐,以后交換進行,各煉了10爐,其得率分別為1°標準方法 78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.6 76.7 77.32°新方法 79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2 82.1'FL、~V~rr*人I-It-t->—- v,_L,、, i—r 八rt,[ 人-w/J..N( LA ,b2)HrtN( LA ,b2) LA , LA ,b2it-.-I—dz設(shè)這兩個樣本相互獨立且分別來自正態(tài)總體V1,'和V2, ,「2,均未知,問建議的新方法能否提高得率?(取以=0.05。)解(=1\*romani)需要檢驗假設(shè)H:A-A=0H:A-a<0TOC\o"1-5"\h\z0 1 2 , 1 1 2(=2\*romanii)Matlab實現(xiàn)77.3];82.1];77.3];82.1];y=[79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2[h,p,ci]=ttest2(x,y,0.05,-1)求得h=1,p=2.2126X10-4表明在以=0.05的顯著水平下,可以拒絕原假設(shè),即認為建議的新操作方法較原方法優(yōu)。3.3分布擬合檢驗在實際問題中,有時不能預知總體服從什么類型的分布,這時就需要根據(jù)樣本來檢驗關(guān)于分布的假設(shè)。下面介紹Z2檢驗法和專用于檢驗分布是否為正態(tài)的“偏峰、峰度檢驗法”。*2檢驗法氣:總體%的分布函數(shù)為F(X),H1:總體x的分布函數(shù)不是F(x).在用下述*2檢驗法檢驗假設(shè)H0時,若在假設(shè)H0下F(X)的形式已知,但其參數(shù)值未知,這時需要先用極大似然估計法估計參數(shù),然后作檢驗。*2檢驗法的基本思想如下:將隨機試驗可能結(jié)果的全體Q分為k個互不相容的事件A,A,A,…,A(F=d1氣=①,,主j」,j= ,k h12 3k i=1 。于是在假設(shè)0卜,我們可
― A\ △A/A\ . . A r/-以計算p—P(A)(或p—P(A))i-1,2,k在n次試驗中事件A出現(xiàn)的頻率fn以計算I I(或I I), 。在次試驗中,事I十I出現(xiàn)的頻率I與Pi(Pi)往往有差異,但一般來說,若H0為真,且試驗的次數(shù)又甚多時,則這種差異不應該很大?;谶@種想法,皮爾遜使用Z2=Z( 竺)2i=1 nPir2k(fi~npi)2Z2=Z( 竺)2i=1 nPii=1 nPi(11)1J(11)H作為檢驗假設(shè)"0的統(tǒng)計量。并證明了以下定理。定理若n充分大,則當H0為真時(不論H0中的分布屬什么分布),統(tǒng)計量(11)總是近似地服從自由度為k-r-1的Z2分布,其中r是被估計的參數(shù)的個數(shù)。于是,若在假設(shè)H0下算得(11)有Z2>Z2(k-r-1),在顯著性水平口下拒絕H0,否則就接受。注意:在使用Z2檢驗法時,要求樣本容量n不小于50,以及每個nPi都不小于5,而且理i最好是在5以上。否則應適當?shù)睾喜i,以滿足這個要求。例6下面列出了84個伊特拉斯坎(Etruscan)人男子的頭顱的最大寬度(mm),試檢驗這些數(shù)據(jù)是否來自正態(tài)總體(取以=0.1)。141148132138154142150146155158150140147148144150149145149158143141144144126140144142141140145135147146141136140146142137148154137139143140131143141149148135148152143144141143147146150132142142143153149146149138142149142137134144146147140142140137152145解編寫Matlab程序如下:clcx=[141148 132 138154142150 146 155 15.150140147148144150149145149 15...143141144144126140144142141 14...145135147146141136140146142 13...148154137139143140131143141 14...
14813514815214314414114314714...15013214214214315314914614913...14214914213713414414614714014...140137152145];%求數(shù)據(jù)中的最小數(shù)和最大數(shù)%畫直方圖min(x),max(x)hist(x,8)fi=[length(find(x<135)),...length(find(x>=135&x<138)),length(find(x>=138&x<142)),length(find(x>=142&x<146)),length(find(x>=146&x<150)),length(find(x>=150&x<154)),length(find(x>=154))]mu=mean(x),sigma=std(x)fendian=[135,138,142,146,150,154]p0=normcdf(fendian,mu,sigma)p1=diff(p0)p=[p0(1),p1,1-p0(6)]chi=(fi-84*p).八%求數(shù)據(jù)中的最小數(shù)和最大數(shù)%畫直方圖min(x),max(x)hist(x,8)fi=[length(find(x<135)),...length(find(x>=135&x<138)),length(find(x>=138&x<142)),length(find(x>=142&x<146)),length(find(x>=146&x<150)),length(find(x>=150&x<154)),length(find(x>=154))]mu=mean(x),sigma=std(x)fendian=[135,138,142,146,150,154]p0=normcdf(fendian,mu,sigma)p1=diff(p0)p=[p0(1),p1,1-p0(6)]chi=(fi-84*p).八2./(84*p)chisum=sum(chi)xa=chi2inv(0.9,4)珞區(qū)間上出現(xiàn)的頻數(shù)%均值和標準差%區(qū)間的分點汾點處分布函數(shù)的值%中間各區(qū)間的概率%所有區(qū)間的概率%皮爾遜統(tǒng)計量的值%chi2分布的0.9分位數(shù)求得皮爾遜統(tǒng)計量chisum=1.9723, 0.1 )^0.1 . ,故在水平0.1下接受H0,即認為數(shù)據(jù)來自正態(tài)分布總體。3.3.2偏度、峰度檢驗(留作習題1)3.4其它非參數(shù)檢驗Matlab還提供了一些非參數(shù)方法。Wilcoxon秩和檢驗在Matlab中,秩和檢驗由函數(shù)ranksum實現(xiàn)。命令為:[p,h]=ranksum(x,y,alpha)其中x,y可為不等長向量,alpha為給定的顯著水平,它必須為0和1之間的數(shù)量。p返回產(chǎn)生兩獨立樣本的總體是否相同的顯著性概率,h返回假設(shè)檢驗的結(jié)果。如果x和y的總體差別不顯著,則h為零;如果x和y的總體差別顯著,則h為1。如果p接近于零,則可對原假設(shè)質(zhì)疑。例7某商店為了確定向公司A或公司B購買某種產(chǎn)品,將4B公司以往各次進貨的次品率進行比較,數(shù)據(jù)如下所示,設(shè)兩樣本獨立。問兩公司的商品的質(zhì)量有無顯
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度產(chǎn)業(yè)園租賃及產(chǎn)業(yè)孵化基地建設(shè)合同4篇
- 2025年度拆除工程風險評估分包合同示范文本4篇
- 2025年LED路燈節(jié)能升級項目購銷及維護合同3篇
- 2025年度商業(yè)街租賃合同標準范本4篇
- 2025年度彩鋼房拆除與裝配式建筑推廣合同范本3篇
- 2025年度廠房建設(shè)項目環(huán)境影響評價合同范本4篇
- 2024版招商引資居間合同協(xié)議書范本
- 2025年度電子游戲角色插畫開發(fā)合同4篇
- 2025年度生物醫(yī)藥產(chǎn)業(yè)項目合作協(xié)議范本4篇
- 資產(chǎn)評估服務房屋征收項目測繪實施方案
- 2025年經(jīng)濟形勢會議講話報告
- 北師大版小學三年級上冊數(shù)學第五單元《周長》測試卷(含答案)
- 國家安全責任制落實情況報告3篇
- 2024年度順豐快遞冷鏈物流服務合同3篇
- 六年級下冊【默寫表】(牛津上海版、深圳版)(漢譯英)
- 合同簽訂培訓
- 電工基礎(chǔ)知識培訓課程
- 鐵路基礎(chǔ)知識題庫單選題100道及答案解析
- 金融AI:顛覆與重塑-深化理解AI在金融行業(yè)的實踐與挑戰(zhàn)
- 住宅樓安全性檢測鑒定方案
評論
0/150
提交評論