非參數(shù)統(tǒng)計(jì) 單一樣本的推斷問(wèn)題_第1頁(yè)
非參數(shù)統(tǒng)計(jì) 單一樣本的推斷問(wèn)題_第2頁(yè)
非參數(shù)統(tǒng)計(jì) 單一樣本的推斷問(wèn)題_第3頁(yè)
非參數(shù)統(tǒng)計(jì) 單一樣本的推斷問(wèn)題_第4頁(yè)
非參數(shù)統(tǒng)計(jì) 單一樣本的推斷問(wèn)題_第5頁(yè)
已閱讀5頁(yè),還剩43頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

胡雪梅QQ:182048520E-mail:huxuem@163.com

第三章

數(shù)學(xué)與統(tǒng)計(jì)學(xué)院?jiǎn)我粯颖镜耐茢鄦?wèn)題主要內(nèi)容第一節(jié)符號(hào)檢驗(yàn)和分位數(shù)推斷假設(shè)總體,是總體的中位數(shù),對(duì)于假設(shè)檢驗(yàn)問(wèn)題:是待檢驗(yàn)的中位數(shù)取值

定義:,則在零假設(shè)情況下,在顯著性水平為的拒絕域?yàn)槠渲衚是滿足上式最大的k值。

例3.1.假設(shè)某地16座預(yù)出售的樓盤(pán)均價(jià),單位(百元/平方米)如下表所示:

36323125283640324126353532873335

解一:用t檢驗(yàn)法用T統(tǒng)計(jì)量結(jié)論:不能拒絕H0。解二:用符號(hào)檢驗(yàn)法在顯著性水平0.05下,拒絕H0。符號(hào)檢驗(yàn)與t檢驗(yàn)得到了相反的結(jié)論,到底選擇哪一種結(jié)果呢?結(jié)論:符號(hào)檢驗(yàn)在總體分布未知的情況下優(yōu)于t檢驗(yàn)!補(bǔ)充:R中的t檢驗(yàn)法的用法t-test(x)X1,X2,…,Xn~N(a,σ2),H0:a=a0,H1:a≠a0補(bǔ)充:R中的t檢驗(yàn)法的用法例如,某食品廠用自動(dòng)裝罐機(jī)裝罐頭食品,每罐質(zhì)量為500g,現(xiàn)從每天生產(chǎn)的罐頭中隨機(jī)抽測(cè)9罐,其質(zhì)量分別為:510,505,498,503,492,502,497,506,495(單位:g)欲檢驗(yàn)H0:a=500,H1:a≠500>t.test(x-500)data:x-500t=0.46,df=8,p-value=0.6578alternativehypothesis:meanisnotequalto095percentconfidenceinterval:-3.5674715.345249sampleestimates:meanofx0.88888892)配對(duì)t檢驗(yàn)法

X1,X2,…,Xn~N(a1,σ12),Y1,Y2,…,Yn~N(a2,σ22),H0:a1=a2,H1:a1<a2補(bǔ)充:R中的t檢驗(yàn)法的用法例如,欲比較甲乙兩種輪胎的耐磨性,現(xiàn)抽取數(shù)據(jù)如下:甲:4900,5220,5500,6020,6340,7660,8650,4870乙:4930,4900,5140,5700,6110,6880,7930,5010欲檢驗(yàn)H0:a1=a2,H1:a1<a2>x<-c(4900,5220,5500,6020,6340,7660,8650,4870)>y<-c(4930,4900,5140,5700,6110,6880,7930,5010)>t.test(x,y,alternative=“l(fā)ess”,paired=T)補(bǔ)充:R中的t檢驗(yàn)法的用法Pairedt-Testdata:xandyt=2.8312,df=7,p-value=0.9873alternativehypothesis:meanofdifferencesislessthan095percentconfidenceinterval:NA534.1377sampleestimates:meanofx-y320接受H0,認(rèn)為兩種輪胎無(wú)顯著性差異.結(jié)果討論k是滿足式子的最大值

單邊符號(hào)檢驗(yàn)問(wèn)題[例]生產(chǎn)過(guò)程是否需要調(diào)整。某企業(yè)生產(chǎn)一種鋼管,規(guī)定長(zhǎng)度的中位數(shù)是l0米?,F(xiàn)隨機(jī)地:從正在生產(chǎn)的生產(chǎn)線上選取10根進(jìn)行測(cè)量,結(jié)果:

9.89.8,10.0,9.710.0,9.99.8分析:中位數(shù)是這個(gè)問(wèn)題中所關(guān)心的一個(gè)位置參數(shù)。若產(chǎn)品長(zhǎng)度真正的中位數(shù)大于或小于10米,則生產(chǎn)過(guò)程需要調(diào)整。這是一個(gè)雙側(cè)檢驗(yàn),應(yīng)建立假設(shè)大樣本結(jié)論當(dāng)n較大時(shí):當(dāng)n不夠大的時(shí)候可用修正公式進(jìn)行調(diào)整。雙邊:,p-值左側(cè):,p-值右側(cè):,p-值

例3.2設(shè)某化妝品廠商有A和B兩個(gè)品牌,為了解顧客對(duì)A品牌和B品牌在使用上的差異,將A品牌和B品牌同時(shí)交給45個(gè)顧客使用,一個(gè)月后得到如下數(shù)據(jù):喜歡A品牌的客戶人數(shù):22人喜歡B品牌的客戶人數(shù):18人不能區(qū)分的人數(shù):5人解:假設(shè)檢驗(yàn)問(wèn)題:由給定的數(shù)據(jù)知:運(yùn)用大樣本的性質(zhì),結(jié)論:不能拒絕零假設(shè)。符號(hào)檢驗(yàn)在配對(duì)樣本比較中的應(yīng)用

配對(duì)樣本(x1,y1),(x2,y2),…(xn,yn)

將記為“+”,記為“-”,記為“0”,記P+

為“+”比例,P-

為“-”比例,那么假設(shè)檢驗(yàn)問(wèn)題:可以用符號(hào)秩檢驗(yàn)。H0:P+=P-

H1:P+=P-例3.4如右表是某種商品在12家超市促銷活動(dòng)前后的銷售額對(duì)比表,用符號(hào)檢驗(yàn)分析促銷活動(dòng)的效果如何?連促銷前促銷后鎖銷售額銷售額符號(hào)店14240+25760-33838044947+56365-63639-74849-85850+947470105152-118372+122733-結(jié)論:不能拒絕零假設(shè)。

根據(jù)同樣原理,可以將中位數(shù)符號(hào)檢驗(yàn)推廣為任意分位點(diǎn)的符號(hào)檢驗(yàn)。例3.1.假設(shè)某地16座預(yù)出售的樓盤(pán)均價(jià),單位(百元/平方米)

36,32,31,25,28,36,40,32,41,26,35,35,32,87,33,35

36323125283640324126353532873335------0-+----+--S+=2,S-=13,Pbinom(15,0.75){min{S+,S-}<2}=0因此,拒絕H0。>binom.test(sum(x>40),length(x)-1,0.75) Exactbinomialtestdata:sum(x>40)outoflength(x)-1numberofsuccesses=2,n=15,p-value=9.23e-07alternativehypothesis:pisnotequalto0.75

R編程計(jì)算:95percentconfidenceinterval:0.016575910.40460270sampleestimates:probabilityofsuccess0.1333333Cox-Staut趨勢(shì)存在性檢驗(yàn)

檢驗(yàn)原理:設(shè)數(shù)據(jù)序列:,雙邊假設(shè)檢驗(yàn)問(wèn)題:令:取數(shù)對(duì),,為正的數(shù)目,為負(fù)的數(shù)目,當(dāng)正號(hào)或者負(fù)號(hào)太多的時(shí)候,認(rèn)為數(shù)據(jù)存在趨勢(shì)。在零假設(shè)情況下Di服從二項(xiàng)分布。從而轉(zhuǎn)化為符號(hào)檢驗(yàn)問(wèn)題。X1,X2,…,Xn例3.6某地區(qū)32年來(lái)的降雨量如下表問(wèn)(1):該地區(qū)前10年來(lái)降雨量是否有變化?(2):該地區(qū)32年來(lái)降雨量是否有變化?年份19711972197319741975197619771978降雨量206223235264229217188204年份19791980198119821983198419851986降雨量182230223227242238207208年份19871988198919901991199219931994降雨量216233233274234227221214年份19951996199719981999200020012002降雨量226228235237243240231210=5,結(jié)論:不能拒絕零假設(shè)。>x<-c(206,223,235,264,229)>y<-c(217,188,204,182,230)>binom.test(sum(x<y),length(x),0.5) Exactbinomialtestdata:sum(x<y)outoflength(x)numberofsuccesses=2,n=5,p-value=1alternativehypothesis:pisnotequalto0.5>x<-c(206,223,235,264,229,217,188,204,182,230,223,227,242,238,207,208)>y<-c(216,233,233,274,234,227,221,214,226,228,235,237,243,240,231,210)>binom.test(sum(x>y),length(x-y),0.5) Exactbinomialtestdata:sum(x>y)outoflength(x-y)numberofsuccesses=2,n=16,p-value=0.004181alternativehypothesis:pisnotequalto0.5結(jié)論:拒絕H0,認(rèn)為降雨量有明顯變化.>rain<-c(206,223,235,264,229,217,188,204,182,230,223,227,242,238,207,208,216,233,233,274,234,227,221,214,226,228,235,237,243,240,231,210)>year<-1971:2002>anova(lm(rain~(year)))AnalysisofVarianceTableResponse:rainTermsaddedsequentially(firsttolast)DfSumofSqMeanSqFValuePr(F)year1535.36535.36371.5792280.2185691Residuals3010170.11339.0035接受H0,認(rèn)為降雨量線性趨勢(shì)并不顯著.隨機(jī)游程檢驗(yàn)游程的概念一個(gè)總體,如按性別區(qū)分的人群,按產(chǎn)品是否有毛病區(qū)分的總體等等,隨機(jī)從中抽取一個(gè)樣本,樣本也可以分為兩類;類型I和類型E。若凡屬類型I的給以符號(hào)A,類型E的給以符號(hào)B,則當(dāng)樣本按某種順序排列(如按抽取時(shí)間先后排列)時(shí),一個(gè)或者一個(gè)以上相同符號(hào)連續(xù)出現(xiàn)的段,就被稱作游程,也就是說(shuō),游程是在一個(gè)兩種類型的符號(hào)的有序排列中,相同符號(hào)連續(xù)出現(xiàn)的段。例如,將某售票處排隊(duì)等候購(gòu)票的人按性別區(qū)分,男以A表示,女以B表示。按到來(lái)的時(shí)間先后觀察序列為:AABABB。在這個(gè)序列中,AA為一個(gè)游程,連續(xù)出現(xiàn)兩個(gè)A;B是一個(gè)游程,A也是一個(gè)游程,BB也是一個(gè)游程。于是,在這個(gè)序列中,A的游程有2個(gè),B的游程也有2個(gè),序列共有4個(gè)游程。每一個(gè)游程所包含的符號(hào)的個(gè)數(shù),稱為游程的長(zhǎng)度。如上面的序列中,有一個(gè)長(zhǎng)度為2的A游程、一個(gè)長(zhǎng)度為2的B游程,長(zhǎng)度為1的A游程、B游程也有1個(gè)。游程:01111為兩個(gè)游程游程長(zhǎng)度:一個(gè)游程中數(shù)據(jù)的個(gè)數(shù)一個(gè)序列里游程個(gè)數(shù)記為R.例3.7序列1100001110110000111100R=8,游程長(zhǎng)度分別為2,4,3,1,2,4,4,2極端情況:000001111111R=20101010101010R=2min(n0,n1)+1

所以,2≤R≤2min(n0,n1)+1極端情況都說(shuō)明數(shù)據(jù)不具有隨機(jī)性。R服從什么分布呢?

檢驗(yàn)原理和計(jì)算方法

設(shè)是由0或者1組成的序列,假設(shè)檢驗(yàn)問(wèn)題:

R為游程個(gè)數(shù),假設(shè)有個(gè)0,個(gè)1,,這時(shí)R取任何一個(gè)值的概率都是,R的條件分布

建立了抽樣分布之后,在零假設(shè)成立時(shí),可以計(jì)算或者的值,進(jìn)行檢驗(yàn)。

X1,X2,…,Xn小樣本的例子(p69例3.8)H0:樣本中的觀測(cè)是隨機(jī)產(chǎn)生的.Ha:樣本中的觀測(cè)是隨機(jī)產(chǎn)生的

=.05n1=18n2=8R=12由于7

R=1217,不能拒絕H0RunsTest:大樣本的例子經(jīng)驗(yàn)表明:如果n1或n2>20,R

的抽樣分布近似為正態(tài)RunsTest:大樣本例子(p70例3.10)H0:樣本中的觀測(cè)是隨機(jī)產(chǎn)生的.Ha:樣本中的觀測(cè)是隨機(jī)產(chǎn)生的

=.05n1=40n2=10如果-1.96

Z

1.96,不能拒絕H0否則拒絕H0.11

2

3

4

5

6

7

8

9

0

11NNNFNNNNNNNFNNFFNNNNNNFNNNNFNNNNN12

13FFFFNNNNNNNNNNNN

R=13RunsTest:大樣本例子-1.96

Z=-1.811.96,不能拒絕H0/web/packages/tseries/index.html>library(tseries)>run1=c(1,1,1,0,rep(1,7),0,1,1,0,0,rep(1,6),+0,rep(1,4),0,rep(1,5),rep(0,4),rep(1,13))>ff=as.factor(run1)>runs.test(ff)RunsTestdata:ffStandardNormal=-1.8074,p-value=0.0707alternativehypothesis:two.sidedWilcoxon符號(hào)秩檢驗(yàn)

基本概念及性質(zhì)

對(duì)稱分布的中心一定是中位數(shù),在對(duì)稱分布情況下,中位數(shù)不唯一,研究對(duì)稱中心比中位數(shù)更有意義。

例:下面的數(shù)據(jù)中,O是對(duì)稱中心嗎?0稱連續(xù)分布F(x)關(guān)于對(duì)稱,如果稱是分布的對(duì)稱中心。Wilcoxon符號(hào)秩檢驗(yàn)既考慮了Xi-M0的符號(hào),又考慮其大小。Wilcoxon符號(hào)秩檢驗(yàn)原理以及性質(zhì)

如果數(shù)據(jù)關(guān)于0點(diǎn)對(duì)稱,那么對(duì)稱中心兩側(cè)的數(shù)據(jù)疏密程度應(yīng)該一樣,取正值數(shù)據(jù)在絕對(duì)值樣本中的秩和與取負(fù)值在絕對(duì)值樣本中的秩和相近。用表示在絕對(duì)值樣本中的秩,Wilcoxon符號(hào)秩統(tǒng)計(jì)量定義為:

正等級(jí)的總和即正秩次總和

負(fù)等級(jí)的總和即負(fù)秩次總和Wilcoxon符號(hào)秩檢驗(yàn)原理以及性質(zhì)例3.11如果樣本值:9,13,-7,10,-18,4,計(jì)算符號(hào)秩統(tǒng)計(jì)量。X1X2X3X4X5X6913-710-184|X1||X2||X3||X4||X5||X6|R1+=3R2+=5R3+=2R4+=4R5+=6R6+=1Wilcoxon符號(hào)秩檢驗(yàn)步驟:3.令表示和對(duì)應(yīng)的的秩和,令表示和對(duì)應(yīng)的的秩和。

2.找出的秩,打結(jié)時(shí)取平均秩。1.計(jì)算4.雙邊檢驗(yàn),取,當(dāng)W很小時(shí)拒絕零假設(shè);對(duì),取;對(duì),取。

5.根據(jù)W的值查Wilcoxon符號(hào)秩檢驗(yàn)分布表。對(duì)n很大的時(shí)候,可以采用正態(tài)近似。

Wilcoxon符號(hào)秩統(tǒng)計(jì)量分布

在小樣本情況下可以計(jì)算Wilcoxon符號(hào)秩統(tǒng)計(jì)量的精確分布。在大樣本情況下可以使用正態(tài)近似:

計(jì)算出Z值以后,查正態(tài)分布表對(duì)應(yīng)的p-值,如果p-值很小,則拒絕零假設(shè)。

在小樣本情況下,用連續(xù)性修正公式:

例3.12

為了解垃圾郵件對(duì)大型公司決策層工作發(fā)影響程度,某網(wǎng)站收集了19家大型公司的CEO郵箱里每天收到的垃圾郵件數(shù),得到如下數(shù)據(jù):(單位:封)310350370377389400415425440295325296250340298365375360385問(wèn)收到垃圾郵件的數(shù)量的中心位置是否超出320封?使用Wilcoxon符號(hào)秩檢驗(yàn)法計(jì)算如下:例3.121030505769809510512025-++++++++-2710121416171819652470202245554065+--+-++++151534911813結(jié)論:不拒絕原假設(shè)。例3.12用R的內(nèi)置函數(shù)計(jì)算格式:wilcox.test(x,y,alternative="two.sided",mu=0,paired=F,exact=T,correct=T)alternative"two.sided“or"greater"or"less"

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論