




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
在初等統(tǒng)計學(xué)中,最基本的概念是什么?如:總體,樣本,隨機變量,分布,估計和假設(shè)檢驗等.其很大一部分內(nèi)容是和正態(tài)理論相關(guān)的。在那里,總體的分布形式或分布族往往是給定的或者是假定了的,所不知道的僅僅是一些參數(shù)的值或他們的范圍。(主要工作是什么?)
第一章緒論
§1.1非參數(shù)統(tǒng)計然而,在實際生活中,那種對總體的分布的假定并不是能隨便做出的。數(shù)據(jù)并不是來自所假定分布的總體;或者,數(shù)據(jù)根本不是來自一個總體;還有可能,數(shù)據(jù)因為種種原因被嚴重污染。這樣,在假定總體分布的情況下進行推斷的做法就可能產(chǎn)生錯誤的結(jié)論。于是,人們希望在不假定總體分布的情況下,盡量從數(shù)據(jù)本身來獲得所需要的信息。這就是非參數(shù)統(tǒng)計的宗旨。因為非參數(shù)統(tǒng)計方法不利用關(guān)于總體分布的知識,所以,就是在對于總體分布的任何知識都沒有的情況下,它也能很容易而又很可靠地獲得結(jié)論。這時,非參數(shù)方法往往優(yōu)于參數(shù)方法。在不知總體分布的情況下如何利用數(shù)據(jù)所包含的信息呢?一組數(shù)據(jù)的最基本的信息就是次序。如果可以把數(shù)據(jù)點按大小次序排隊,每一個具體數(shù)目都有它的在整個數(shù)據(jù)中(從最小的數(shù)起)的位置或次序,稱為該數(shù)據(jù)的秩(rank)。數(shù)據(jù)有多少個觀察值,就有多少個秩。在一定的假定下,這些秩和它們的統(tǒng)計量的分布是求得出來的,而且和原來的總體分布無關(guān)。這樣就可以進行所需要的統(tǒng)計推斷。注意:非參數(shù)統(tǒng)計的名字中的“非參數(shù)(nonparametric)”意味著其方法不涉及描述總體分布的有關(guān)參數(shù);它被稱為和分布無關(guān)(distribution—free),是因為其推斷方法和總體分布無關(guān);不應(yīng)理解為與所有分布(例如有關(guān)秩的分布)無關(guān).什么是非參數(shù)統(tǒng)計?不假定總體分布的具體形式,從數(shù)據(jù)本身獲得所需要的信息,通過推斷方法得到相關(guān)結(jié)論的一種分析方法。一個典型的參數(shù)檢驗過程1.總體參數(shù)Example:PopulationMean2.假定數(shù)據(jù)的形態(tài)為
WholeNumbersorFractions
Example:HeightinInches(72,60.5,54.7)3.有很強的假定Example:正態(tài)分布,F(xiàn)分布4.例子:ZTest,tTest,2Test一個例子:對兩組學(xué)生進行語法測試,如何比較兩組學(xué)生的成績是否存在差異?甲乙25302934242513322430323744332284731403033351821352822原始數(shù)據(jù)秩2530293424251332243032379.514.012.021.07.59.52.017.57.514.017.524.04433228473140303335182135282226.019.55.51.027.016.025.014.019.522.53.04.022.511.05.5非參數(shù)檢驗過程1.不涉及總體的分布Example:ProbabilityDistributions,Independence2.數(shù)據(jù)的形態(tài)各異定量數(shù)據(jù)定序數(shù)據(jù)Example:Good-Better-Best名義數(shù)據(jù)Example:Male-Female3.例子:WilcoxonRankSumTest/RunTestF,F,F,F,F,F,F,F,M,M,M,M,M,M,MF,M,F,M,F,M,F,M,F,M,F,M,F,M,F參數(shù)統(tǒng)計與非參數(shù)統(tǒng)計的比較問題:一種統(tǒng)計方法是否比其它方法更好,通常要從幾個方面來考慮。有效性或效率(efficiency)。在其他條件相同情況下,一種方法需要的樣本容量越小,則效率越高,通常用二者的樣本容量比值來度量相對效率。在假設(shè)檢驗中,樣本均值是檢驗總體均值的一個好的檢驗統(tǒng)計量,它對總體均值的不同十分敏感,但是的分布取決于總體的分布,而這通常是未知的。穩(wěn)健性(robust)。如果一種方法背后的某個假設(shè)條件不成立,但它還是近似有效的,則可認為這一方法對這一條件是穩(wěn)健的。通常來說,穩(wěn)健是指基于正態(tài)假設(shè)的方法(即使?jié)撛诘目傮w分布是非正態(tài)的)檢驗統(tǒng)計量也有近似相同的零分布。比如單樣本的t檢驗,當(dāng)樣本容量很大時,對于正態(tài)假設(shè)是穩(wěn)健的。沒有一個總體是精確的服從正態(tài)分布或其他已知分布,如果總體是近似正態(tài)分布的,那么基于正態(tài)分布來進行推斷是安全的,反之,我們就要考慮非參數(shù)方法。t檢驗這一方法是穩(wěn)健的,當(dāng)總體是非正態(tài)分布時,它是否象正態(tài)分布一樣有效?一種方法固然應(yīng)該是穩(wěn)健的,更應(yīng)該是有效的。相合性或漸進性(consistent),多數(shù)參數(shù)檢驗對于非正態(tài)分布條件是穩(wěn)健的,相合的,即隨著樣本容量的增加,方法將更為穩(wěn)健,對于無限樣本而言,方法是精確的且不依賴于總體分布。對總體假定較少,有廣泛的適用性,結(jié)果穩(wěn)定性較好。1.假定較少2.不需要對總體參數(shù)的假定3.與參數(shù)結(jié)果接近針對幾乎所有類型的數(shù)據(jù)形態(tài)。容易計算在計算機盛行之前就已經(jīng)發(fā)展起來。非參數(shù)檢驗的優(yōu)點1. 可能會浪費一些信息特別當(dāng)數(shù)據(jù)可以使用參數(shù)模型的時候。2. 大樣本手算相當(dāng)麻煩3. 一些表不易得到非參數(shù)檢驗的弱點因此我們實際上給出了一個沒有實際意義的結(jié)果:沒有一種方法是萬能的。本學(xué)期內(nèi)容結(jié)構(gòu)體系非參數(shù)統(tǒng)計的主要內(nèi)容內(nèi)容非參數(shù)檢驗相應(yīng)的參數(shù)檢驗獨立樣本中位數(shù)檢驗秩和檢驗獨立樣本t檢驗2配對樣本/單一樣本符號檢驗Wilcoxon
檢驗成對樣本t-檢驗>2獨立樣本Kruskal-Wallis檢驗單一因素ANOVA兩因素Friedman檢驗雙因素ANOVA相關(guān)性檢驗Spearman秩相關(guān)Pearson相關(guān)性檢驗分布的檢驗Kolmogorov-Smirnov§1.2順序統(tǒng)計量,秩和線性秩統(tǒng)計量
一、順序統(tǒng)計量因為非參數(shù)方法通常并不假定總體分布。因此,觀測值的順序及性質(zhì)則作為研究的對象。順序統(tǒng)計量:對于樣本X1,X2,X3,…,Xn,如果按照升冪排列,得到稱為第k個順序統(tǒng)計量。2、基于順序統(tǒng)計量的統(tǒng)計量中位數(shù)極差3、順序統(tǒng)計量分布函數(shù)設(shè)總體的分布函數(shù)F(X),則第r個順序統(tǒng)計量的分布函數(shù)為(4)順序統(tǒng)計量密度函數(shù)(如果分布密度存在)同樣我們可以得到順序統(tǒng)計量X(r)和X(s)的聯(lián)合密度函數(shù)為:特別地,極差的分布函數(shù)為:分位數(shù)對于離散數(shù)據(jù),給定n個值X1,…,Xn,則p分位數(shù)定義為為:定義(連續(xù)分布)二、秩統(tǒng)計量1、秩統(tǒng)計量設(shè)X1,X2,X3,…,Xn
來自總體的樣本,記Ri為樣本點Xi的秩,即樣本中小于或等于Xi的樣本點的個數(shù),即其中
例如:觀測值5.61.42.75.22.64.82.3秩7146352顯然,X(Ri)=X(i),記R=(R1,R2
,…,Rn),稱R為由樣本產(chǎn)生的統(tǒng)計量,也稱秩統(tǒng)計量注:有結(jié)點數(shù)據(jù)(重復(fù)數(shù)據(jù))的秩定義:設(shè)X1,X2,X3,…,Xn
來自總體的簡單隨機樣本,將數(shù)據(jù)排序后,相同的數(shù)據(jù)點形成一個結(jié),重復(fù)數(shù)據(jù)的個數(shù)為結(jié)長。此時秩定義為對應(yīng)秩(無重復(fù)數(shù)據(jù)時)的平均數(shù)。如:85,87,87,92,83,83,83,95,結(jié)為多少?結(jié)長為多少?對應(yīng)秩?答案:5個結(jié),結(jié)長為1,2,1,3,1,對應(yīng)秩為4,5.5,5.5,7,1,2,3,82、秩統(tǒng)計量的分布和數(shù)字特征●
的聯(lián)合分布為:
●
的概率分布為:
●
的數(shù)學(xué)期望:●
的方差:●
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 如何有效復(fù)習(xí)CPMM考試內(nèi)容試題及答案
- 2025年貴金屬釬、焊料項目發(fā)展計劃
- 2024年CPMM考試分析及試題答案
- 初三第一期數(shù)學(xué)試卷
- 重要物流質(zhì)量保證體系試題及答案
- 云南省玉溪市澄江縣一中2025屆高三下學(xué)期聯(lián)合考試化學(xué)試題含解析
- 2024年CPSM考試的職業(yè)認知與發(fā)展機遇試題及答案
- 江蘇省南京市南京師范大學(xué)附屬中學(xué)2025屆高考化學(xué)三模試卷含解析
- 2025屆西藏自治區(qū)林芝市高三第二次調(diào)研化學(xué)試卷含解析
- CPSM考試批判性思維訓(xùn)練與試題及答案
- 肉牛營養(yǎng)需要
- 廣西壯族自治區(qū)桂林市各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名明細居民村民委員會
- 腹部CT檢查技術(shù)ppt課件(PPT 18頁)
- 《醫(yī)藥代表拜訪技巧及區(qū)域管理》PPT課件
- 附表1哈爾濱市尚志市水庫工程劃界成果表
- 事件研究法PPT課件
- 《劉姥姥進大觀園》課本劇劇本3篇
- 監(jiān)理規(guī)劃細則審批表
- 國家開放大學(xué)《水利水電工程造價管理》形考任務(wù)1-4參考答案
- 礦泉水資源采礦許可證
- 焊接檢驗培訓(xùn)課件(PPT 61頁)
評論
0/150
提交評論