R語(yǔ)言學(xué)習(xí)總結(jié)_第1頁(yè)
R語(yǔ)言學(xué)習(xí)總結(jié)_第2頁(yè)
R語(yǔ)言學(xué)習(xí)總結(jié)_第3頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、R語(yǔ)言學(xué)習(xí)匯總報(bào)告經(jīng)過(guò)接近一個(gè)學(xué)期的學(xué)習(xí),從對(duì) R語(yǔ)言的完全陌生,到現(xiàn)在對(duì)其有了一些粗淺的認(rèn)識(shí),其 中經(jīng)歷了遇到困難苦思冥想的艱辛,也有解決問(wèn)題以后豁然開朗的暢快。在學(xué)習(xí)的過(guò)程中,以 前掌握的數(shù)理基礎(chǔ)給我?guī)?lái)了不少便利,而認(rèn)真地態(tài)度和踏實(shí)的性格也使我獲益匪淺。在這個(gè)學(xué)期中,我學(xué)會(huì)了 R語(yǔ)言的基本操作和語(yǔ)法,以及針對(duì)具體的統(tǒng)計(jì)學(xué)問(wèn)題相應(yīng)的解 決方法。并按時(shí)完成老師布置的課后作業(yè),以達(dá)到學(xué)以致用的目的,也加強(qiáng)了對(duì)R語(yǔ)言操作的熟練度。一、初識(shí)R軟件R軟件是一套完整的數(shù)據(jù)處理、計(jì)算和制圖軟件系統(tǒng)。其功能包括:據(jù)存儲(chǔ)和處理,數(shù)組運(yùn)算,完整連貫的統(tǒng)計(jì)分析工具,優(yōu)秀的統(tǒng)計(jì)制圖功能已及簡(jiǎn)便而強(qiáng)大編程語(yǔ)言。接觸

2、R語(yǔ)言以后,我的第一感覺(jué)就是方便和強(qiáng)大。R語(yǔ)言中有非常多的函數(shù)和包,我們幾乎不用自己去編一些復(fù)雜的算法,而往往只需要短短幾行代碼就能解決很復(fù)雜的問(wèn)題,這給我 們的使用帶來(lái)了極大地方便。于此同時(shí),它又可操縱數(shù)據(jù)的輸入輸出,實(shí)習(xí)分支、循環(huán),使用 者可以自定義功能,這就意味著當(dāng)找不到合適的函數(shù)或包來(lái)解決所遇的問(wèn)題時(shí),我們又可以自 己編程去實(shí)現(xiàn)各種具體功能,這也正是 R語(yǔ)言的強(qiáng)大之處。二、學(xué)習(xí)心得在學(xué)習(xí)該書的過(guò)程中,我不僅加深了對(duì)統(tǒng)計(jì)學(xué)方法的理解,同時(shí)也掌握了R軟件的編程方法和基本技巧,了解了各種函數(shù)的意義和用法,并能把兩者結(jié)合起來(lái),解決實(shí)際中的統(tǒng)計(jì)問(wèn) 題。1、R語(yǔ)言的基本語(yǔ)法及技巧R語(yǔ)言不僅可以進(jìn)行

3、基礎(chǔ)的數(shù)字、字符以及向量的運(yùn)算,內(nèi)置了許多與向量運(yùn)算有關(guān)的函 數(shù)。而且還提供了十分靈活的訪問(wèn)向量元素和子集的功能。R語(yǔ)言中經(jīng)常出現(xiàn)數(shù)組,它可以看作是定義了維數(shù)(dim屬性)的向量。因此數(shù)組同樣可以進(jìn)行各種運(yùn)算,以及訪問(wèn)數(shù)組元素和 子集。二維數(shù)組(矩陣)是比較重要和特殊的一類數(shù)組,R可以對(duì)矩陣進(jìn)行內(nèi)積、外積、乘法、求解、奇異值分解及最小二乘擬合等運(yùn)算,以及進(jìn)行矩陣的合并、拉直等。apply()函數(shù)可以在對(duì)矩陣的一維或若干維進(jìn)行某種計(jì)算,例如apply(A,1,mean)表示對(duì)A按行求和。R語(yǔ)言允許將不同類型的元素放在一個(gè)集合中,這個(gè)集合叫做一個(gè)列表,列表元素總可以 用“列表名下標(biāo)”的格式引用。而

4、“列表名下標(biāo)”表示的是一個(gè)子列表,這是一個(gè)很容 易混淆的地方。R語(yǔ)言中非常重要的一種數(shù)據(jù)結(jié)構(gòu)是data.frame (數(shù)據(jù)框),它通常是矩陣形式的數(shù)據(jù),但每列可以是不同類型,數(shù)據(jù)框每列是一個(gè)變量,每行是一個(gè)觀測(cè),要注意的是每 一列必須有相同的長(zhǎng)度。數(shù)據(jù)框元素可以使用下標(biāo)或者下標(biāo)向量引用。用一個(gè)非常簡(jiǎn)單的例子來(lái)說(shuō)明向量、矩陣和數(shù)據(jù)框的簡(jiǎn)單運(yùn)用。輸入:A<-matrix(c(1:12),2,6,byrow=T) #A 為一個(gè) 2 行 6 列,按行排列的矩陣 X<- as.data.frame(A) # 把A轉(zhuǎn)化成數(shù)據(jù)框形式的XX1:2,seq(1,5,2) # 輸出 X 的第 1、2行

5、和 1、3、5列輸出:V1 V3 V51 1 3 52 7 9 11輸入:attach(X);Rv-V1/V5;R # 調(diào)用數(shù)據(jù)框X,計(jì)算并輸出V1和V5的比值輸出:1 0.2000000 0.6363636與此同時(shí)R語(yǔ)言中也提供了其它高級(jí)程序語(yǔ)言共有的分支、循環(huán)等程序控制結(jié)構(gòu)。比如 if/else 語(yǔ)句,for循環(huán)等。因此R語(yǔ)言也可以很容易的根據(jù)情況編寫自己所需要的函數(shù)。例:編寫一個(gè)R程序,輸入一個(gè)整數(shù)n,如果n小于等于0,中止運(yùn)算,并輸出:“要求輸 入一個(gè)正整數(shù)”。否則,如果 n是偶數(shù),則將n除2賦值給n。否則將3n+1賦給n。不斷循環(huán), 直到n=1停止,并輸出:“運(yùn)算成功”解:新建一個(gè)程

6、序腳本,名為chapter2.R ”,寫入代碼:fv-fu nctio n(n)if(n<=0) list("要求輸入一個(gè)正整數(shù)")elserepeatif(n=1) break #n=1時(shí)終止 else if(n/2=eger(n/2) n<-n/2 #n為偶數(shù)時(shí)除 2else n <-3* n+1list("運(yùn)算成功")在R窗口中輸入:Source( “chapter2.R ”);f(32)輸出:1"運(yùn)算成功"輸入:f(-5)輸出:1"要求輸入一個(gè)正整數(shù)"2、R在統(tǒng)計(jì)描述中的應(yīng)用數(shù)

7、據(jù)框操作(plyr包)輔助小函數(shù)1 splat 函數(shù):作用:把原函數(shù)中多個(gè)參數(shù)打包為一個(gè)list作為參數(shù),然后輸出新的函數(shù)。也就是說(shuō)本來(lái)某個(gè)函數(shù)需要輸入多個(gè)參數(shù),現(xiàn)在套上splat后,只要輸入一個(gè)參數(shù)list就可以了,不需要單獨(dú)地輸入?yún)?shù)。它的作用結(jié)果是把一個(gè)函數(shù)變成一個(gè)新函數(shù)。m*ply(a_matrix, FUN)的作用和 a*ply(a_matrix, 1, splat(FUN)樣例:(1)參數(shù)使用1 18.33333> splat(hp_per_cyl)(mtcars)1 18.33333 18.33333 23.25000 18.33333 21.87500 17.500003

8、0.62500 15.50000 23.7500010 20.50000 20.50000 22.50000 22.50000 22.50000 25.6250026.0 28.75000 16.5000019 13.00000 16.25000 24.25000 18.75000 18.75000 30.6250021.0 16.50000 22.7500028 28.25000 33.00000 29.16667 41.87500 27.25000等價(jià)于:> hp_per_cyl(mtcars$hp,mtcars$cyl)splat函數(shù)的優(yōu)點(diǎn)就是可以不用拆分字段,可以一起輸入作為參數(shù)

9、。(2) 與plyr函數(shù)合用:> fv-function(mpg,wt,.) data.frame(mw=mpg/wt)> ddply(mtcars,.(cyl),splat (f)2 each函數(shù)作用:把多個(gè)函數(shù)匯聚成一個(gè)函數(shù),當(dāng)使用這個(gè)函數(shù)時(shí),將分別作用多個(gè)函數(shù)。它的作用 結(jié)果是把一個(gè)函數(shù)變成一個(gè)新函數(shù)。不足:不能給作用的函數(shù)指定附加參數(shù),只能使用默認(rèn)參數(shù)。例:> funv-function(x) c(min=min( x),max=max(x),mea n=mea n( x)> fun (1:10)等價(jià)于:> f<-each( min, max,mea

10、 n)> f(1:10)3 colwise 函數(shù)colwise(.f un ,.cols,.)說(shuō)明:.fun :要轉(zhuǎn)化的函數(shù)。.cols是測(cè)試數(shù)據(jù)框的列是否應(yīng)包含的判別函數(shù)或者是要包含的列的名稱。catcolwise(.fun,.)與colwise 功能類似,只是對(duì)離散型變量有效numcolwise(.fun,.)與colwise 功能類似,只是對(duì)數(shù)值型變量有效作用:把作用于數(shù)據(jù)框行向量的函數(shù)(如mean, median等)轉(zhuǎn)化為作用于數(shù)據(jù)框列向量的函數(shù)。于plyr函數(shù)一起使用十分方便。作用結(jié)果生成一個(gè)新的函數(shù)。例:> nm iss in g<-f unction(x) su

11、m(is .n a(x)> colwise( nm iss in g)(baseball)> colwise( nm iss in g,.(sb,cs,so)(baseball)> ddply(baseball,.(year),colwise( nm iss in g,.(sb,cs,so)> nu mcolwise( nm iss in g)(baseball)等價(jià)于:colwise(nmissing,is.numeric)(baseball)> catcolwise( nmissi ng)(baseball)等價(jià)于:colwise(nmissing,is.di

12、screte)(baseball)4 failwith 函數(shù)failwith(default=NULL, f, quiet=FALSE) 作用:修正一個(gè)函數(shù),使得當(dāng)該函數(shù)出現(xiàn)錯(cuò)誤時(shí)返回一個(gè)設(shè)定的默認(rèn)值,默認(rèn)為空。作 用結(jié)果生成一個(gè)新的函數(shù)。> fv-function(x) if (x=1) stop("Error") else 1> f(1)Error in f(1) : Error> safef<-failwith(,f)> safef(1)Error in f(.) : ErrorNULL> safefv-failwith(12,f,

13、quiet=TRUE)> safef(1)1 125 summarise(函數(shù)summarise(.data,)作用:對(duì)數(shù)據(jù)框做統(tǒng)計(jì)匯總,為設(shè)定的統(tǒng)計(jì)方法或函數(shù) 例:>summarise(baseball,durati on=max(year)- min (year), nteams=le ngth(u nique(team) durati on n teams1 136132>head(ddply(baseball,"id",summarise,durati on=max(year)- mi n(year), nteams=le ngth(u nique

14、(team) id duratio n n teams1 aaro nha01 2232 abernte02 1773 adairje01 1244 adamsba012025 adamsbo031346 adcocjo01 165數(shù)據(jù)集變量操作1變量排序:arrange函數(shù)arran ge(df, .(var1), .(var2)作用:按照指定列排序。注意:使用arrange函數(shù)排完序后行名會(huì)丟失,需要用 cbind補(bǔ)回例:> arra nge(mtcars,cyl,disp)> cars<-cbi nd(vehicle=row. names(mtcars),mtcars)

15、> arran ge(cars,cyl,disp)先把行名作為一個(gè)新的列加到數(shù)據(jù)框再排序2更改變量名ren ame(x, replace, warn_missi ng=TRUE)作用:通過(guò)名字修改變量名字,不是根據(jù)它的位置例:"mpg"二"avgpg".cly = new )3取行或列的數(shù)據(jù)take(x, along, in dices, drop = FALSE)作用:在x中,按照某個(gè)維度取數(shù)。參數(shù)說(shuō)明:x為取數(shù)的源數(shù)據(jù),可以是array或者dataframeo along:維度。1表示行,2表示列,3表示數(shù)組快等等。 in dices:具體維度

16、所對(duì)應(yīng)的指。drop:是否整合例:> take(mtcars,2,1)-取第一列> take(mtcars,1,1)-取第一行數(shù)據(jù)集操作 1數(shù)據(jù)集鏈接1) match_df match_df(x, y, on=NULL)作用:;為原始的需要提取的數(shù)據(jù)框,y為條件數(shù)據(jù)框。on指定用來(lái)連接的變量,默認(rèn)為 兩個(gè)數(shù)據(jù)框中所有變量,可以為多個(gè)。通過(guò)on后面的字段,到x數(shù)據(jù)框取選取數(shù)據(jù),相當(dāng)于inner join,區(qū)別為:前者結(jié)果集是x的一個(gè)子集。inn er join包括兩個(gè)數(shù) 據(jù)框中所有字段。例:基礎(chǔ)數(shù)據(jù)> a<-c("a","b",&q

17、uot;c","d")> b<-c("aa","bb","aa","dd")> c<-c(1,2,3,4)> t1<-data.frame(a,b,c)> t2<-data.frame(a=c("a","c","e"),b=c("aa","ab","cd")> match_df(t1,t2,o n=c("

18、a","b")|a b c1 a aa 12) joinjoin(x, y, by=NULL, type=“l(fā)eft ” , match= “all ” )作用:連接兩個(gè)數(shù)據(jù)框參數(shù)說(shuō)明:x,y為數(shù)據(jù)框。by=為要連接的字段,type為連接類型:left、right、full。 match: all (所有匹配上的其他屬性值都帶上)、first (只帶上匹配上的第一個(gè)屬性值)> joi n(t1,t2,by="x2",type="i nner")> joi n(t1,t2,by="x2",typ

19、e="left")> joi n(t1,t2,by="x2",type="right")> tt1<-data.frame(x1=c(1,2,3,4),x2=c(5,6,7,8)> tt2<-data.frame(y 1= c(1,2,3,4)*10,x2=c(6,6,6,6)> joi n(tt1,tt2,by="x2",type="i nn er",match="all")x1 x2 y11 2 6 102 2 6 203 2 6 30

20、4 2 6 40> joi n(tt1,tt2,by="x2",type="i nn er",match="first") x2 x1 y12 6 2 102.1 6 2 102.2 6 2 102.3 6 2 10注意:merge和join相似,但是效率上join更優(yōu)。3) merge例:> x<-data.frame(a=c(1,2,4,5,6),x=c(9,12,14,21,8)> yv-data.frame(a=c(1,3,4,6),y=c(8,14,19,2),x=c(2,3,4,5)> mer

21、ge(x,y) -根據(jù)相同字段默認(rèn)內(nèi)連接> merge(x,y,all=TRUE)-> merge(x,y,all.x=TRUE)-> merge(x,y,all.y=TRUE)-> merge(x,y,by=c("a","x")-> merge(x,y,by.x="a",by.y="y")-根據(jù)相同字段全鏈接左連接右連接根據(jù)a和x兩個(gè)字段連接根據(jù)x表中a和y表中y連接數(shù)據(jù)統(tǒng)計(jì)1 *ply函數(shù)作用:拆分?jǐn)?shù)據(jù),應(yīng)用函數(shù),再組合函數(shù)作用后的數(shù)據(jù)輸入:array、dataframe list

22、輸出:array、dataframe list、discarededOutputInputArrayData frameListDiscardedArravwaaplyadplyalplya-piyData framedaplyddplydlplyd-PlyListlaplyldplynpiyi-piya*ply(.data, .marg in s, .f un,.progress = "non e")參數(shù)說(shuō)明:.data是要進(jìn)行處理的數(shù)組.margins是用哪種方式去切割數(shù)據(jù),取值為 1,2,c(1,2) .fun是對(duì)切割的數(shù)據(jù)指定一個(gè)函數(shù)進(jìn)行處理.progress決定是

23、否顯示及用哪種方式顯示進(jìn)度條> aaply(a,1,mea n,.progress=" non e")> aaply(a,1,mea n,.progress="text")-以文本形式展示進(jìn)度條> aaply(a,1,mea n,.progress="wi n") -wi ndows窗口展示進(jìn)度條d*ply(.data, .variables, .f un,.progress = "non e")參數(shù)說(shuō)明:.variables指定要按其分割的變量名稱>daply(data,.(age),.f

24、u n=amea n)>daply(data,.(sex),.fu n=amea n)>daply(data,.(age,sex),.fu n=amea n)>ddply(data,.(sex),.fu n=amea n)>dlply(data,.(sex),.fu n=amea n)l*ply(.data, .fu n,,.progress = "non e")說(shuō)明:列表類型的數(shù)據(jù)是最簡(jiǎn)單的數(shù)據(jù),因?yàn)樗呀?jīng)被分割成一個(gè)個(gè)了(也就是列表數(shù)據(jù) 的一個(gè)個(gè)元素),所以這類函數(shù)沒(méi)有參數(shù)用來(lái)描述是按什么進(jìn)行切分的。>llply(list,mea n)&g

25、t;laply(list,mea n)>ldply(list,mea n)m*ply(.data,.fu n=NULL,.i nform=FALSE,)說(shuō)明:把參數(shù)放到array或dataframe中整體輸入作為參數(shù),然后fun后面的函數(shù)運(yùn)用.data 中的相應(yīng)數(shù)值作為參數(shù)分別作用,得到dataframe ( mdply) , array (maply)或者list (mlply )。與 splat相似:m*ply(a_matrix, FUN)的作用和 a*ply(a_matrix, 1,splat(FUN)一樣。>data=data.frame( n=c(10,100,50),m

26、ea n=c(5,5,10),sd=c(1,2,1)> data> mlply(data,r norm)2觀測(cè)值出現(xiàn)個(gè)數(shù)(1) count 函數(shù):count(df ,vars=NULL, wt_var=NULL)參數(shù):df是要處理的數(shù)據(jù)框。vars是要進(jìn)行分組統(tǒng)計(jì)的變量。wt_var為權(quán)重。 注意:該函數(shù)的功能類似于table例:基礎(chǔ)數(shù)據(jù):>a=data.frame( names=c("a","b","c","d","a","a","a"

27、,"b","b","c"),wt =c(1,1,1,1,2,2,2,2,2,2)> coun t(a,vars=" names")-單變量分組> cou nt(a,vars=" names",wt_var="wt")-力卩上權(quán)重> coun t(a,c(" names","wt") -雙變量分組使用R軟件可以方便直觀的對(duì)數(shù)據(jù)進(jìn)行描述性分析。如使用均值、中位數(shù)、順序統(tǒng)計(jì)量等 度量位置。用方差、標(biāo)準(zhǔn)差、變異系數(shù)等度量分散程

28、度。以及用峰度系數(shù)、偏度系數(shù)度量分布 形狀。例如在窗口中輸入:x<-seq(1,589,3)len gth(x);mea n( x);var(x);sd(x);media n( x);100*sd(x)/mea n(x)1 197 # 長(zhǎng)度1 295 # 均值1 29254.5 # 方差1 171.0395 # 標(biāo)準(zhǔn)差1 295 #中位數(shù)1 57.97948 # 樣本標(biāo)準(zhǔn)差n<-le ngth(x);m<-mea n( x);s<-sd(x)n/(n-1)*( n-2)*sum(x-m)A3)/sA3;( n*( n+1)/( n-1)*( n-2)*( n-3)*su

29、m(x- m)A4)/sA4- (3*( n-1F2)/( n-2)* (n-3)1 0 #偏度系數(shù)1 -1.2 # 峰度系數(shù)R軟件可以檢驗(yàn)樣本是不是來(lái)自某種分布總體,以正態(tài)分布為例,我們可以通過(guò) shapiro.test() 函數(shù)提供W統(tǒng)計(jì)量和相應(yīng)的p值,并通過(guò)p值的大小判斷樣本是否來(lái)自正態(tài)分 布的總體。經(jīng)驗(yàn)分布的 K-S檢驗(yàn)方法的應(yīng)用范圍則更加廣泛,不僅可以判斷樣本是否來(lái)自正態(tài) 總體,也能判斷是否來(lái)自其它類型的分布總體。除此之外,R語(yǔ)言還有強(qiáng)大的畫圖功能,例如我們可以通過(guò)作直方圖、莖葉圖和總體分析 來(lái)描述數(shù)據(jù)的分布。R中的高水平作圖函數(shù)有:plot() 、pairs()、coplot()

30、、qqnorm()、hist()等等。當(dāng)高水平作圖函數(shù)并不能完全達(dá)到作圖的指標(biāo)時(shí),需要低水平的作圖函數(shù)予以補(bǔ) 充。低水平作圖函數(shù)有:points() 、lines() 、text() 、polygon()、legend()、title() 和axis()等。需要注意的是低水平作圖函數(shù)必須是在高水平作圖函數(shù)所繪圖形的基礎(chǔ)之上增加新 的圖形。hist()函數(shù)可以做出已知數(shù)據(jù)的直方圖,stem()函數(shù)可以作莖葉圖,boxplot()函數(shù)可用作 箱線圖,qqline()和qqmorm()可以做出正態(tài)QQ圖和相應(yīng)的直線。R語(yǔ)言同時(shí)還能對(duì)兩組數(shù)據(jù) 進(jìn)行相關(guān)性檢驗(yàn),cor.test() 函數(shù)提供了 Pear

31、son相關(guān)性檢驗(yàn),Spearman秩檢驗(yàn)和Kendall秩檢驗(yàn)。其原假設(shè)為兩組數(shù)據(jù)不相關(guān),通過(guò)p值的大小來(lái)判斷是否拒絕原假設(shè)。我們還能用stars()函數(shù)作出星圖,來(lái)表示多元數(shù)據(jù),以上用法都非常簡(jiǎn)單易用,這里就不再贅述。3、R語(yǔ)言在統(tǒng)計(jì)推斷中的應(yīng)用首先,R語(yǔ)言可以用來(lái)進(jìn)行參數(shù)估計(jì)。統(tǒng)計(jì)學(xué)中我們應(yīng)用矩估計(jì)和極大似然估計(jì)來(lái)進(jìn)行點(diǎn)估計(jì),矩估計(jì)是通過(guò)解正規(guī)方程組得到 參數(shù)估計(jì)的值。極大似然估計(jì)通過(guò)解極大似然函數(shù)的極值點(diǎn)得到參數(shù)估計(jì)的值。在R中我們可以使用Newton迭代法求解正規(guī)方程組,獲得矩估計(jì)。用optimize。函數(shù)求解極大似然函數(shù),獲得最大似然估計(jì)。由此可見,R語(yǔ)言能夠很方便的解決參數(shù)點(diǎn)估計(jì)問(wèn)

32、題。點(diǎn)估計(jì)給出未知參數(shù)的近似值以后,并不能知道這種估計(jì)的精確性如何,可信程度如何, 為了解決這些問(wèn)題,就需要用到區(qū)間估計(jì),在學(xué)習(xí)用R語(yǔ)言解決區(qū)間估計(jì)問(wèn)題的過(guò)程中,我最大的思想到就是R軟件中內(nèi)置的一些函數(shù)極大地方便了我們處理具體問(wèn)題。比如t.test() 函數(shù)。對(duì)單個(gè)正態(tài)總體,向量x包含了來(lái)自該總體的一個(gè)樣本,我們可以直接用t.test(x) 指令得到均值u的點(diǎn)估計(jì)和區(qū)間估計(jì)。對(duì)于兩個(gè)正態(tài)總體,向量y包含了來(lái)自第二個(gè)總體的一個(gè)樣本,我們可以用t.test(x,y) 來(lái)得到均值差u1-u2的點(diǎn)估計(jì)和區(qū)間估計(jì),其中當(dāng)兩個(gè)總體方差 相同時(shí),只需要加上var.equal=T (缺省值為 F,即默認(rèn)兩個(gè)總

33、體的方差是不同的)。同時(shí)t.test()函數(shù)不僅可以進(jìn)行雙側(cè)置信區(qū)間估計(jì),也能進(jìn)行單側(cè)置信區(qū)間估計(jì),只需要在括號(hào)內(nèi) 加上al= ” I”或者al= ” g”。當(dāng)數(shù)據(jù)不服從正態(tài)分布是,可以利用中心極限定理,取較大的 樣本量,構(gòu)造近似服從正態(tài)分布的統(tǒng)計(jì)量進(jìn)行估計(jì)。其次,R語(yǔ)言可以用來(lái)進(jìn)行假設(shè)檢驗(yàn)。假設(shè)檢驗(yàn)也是統(tǒng)計(jì)推斷中的一個(gè)重要的內(nèi)容,在統(tǒng)計(jì)學(xué)中,我們用搜索到的數(shù)據(jù)對(duì)某個(gè)事 先作出的統(tǒng)計(jì)假設(shè)按照某種設(shè)計(jì)好的方法進(jìn)行檢驗(yàn),來(lái)判斷此假設(shè)是否正確。也就是說(shuō)為了檢 驗(yàn)一個(gè)假設(shè)是否成立,先假定它是成立的,看看由此會(huì)導(dǎo)致什么結(jié)果。如果導(dǎo)致一個(gè)不合理的 現(xiàn)象出現(xiàn),就認(rèn)為原假設(shè)不正確,如果沒(méi)有導(dǎo)出不合理的現(xiàn)象,則

34、不能拒絕原假設(shè)。R軟件給出了參數(shù)假設(shè)檢驗(yàn)的方法。以正態(tài)總體為例,t.test() 函數(shù)也可以用來(lái)進(jìn)行單個(gè)或者兩個(gè)正態(tài)總體的均值的假設(shè)檢驗(yàn)。進(jìn)行單邊檢驗(yàn)時(shí)可以加入指令alternative(備擇假設(shè)),缺省時(shí)表示雙邊檢驗(yàn),less表示備擇假設(shè)為u<uO, greater則相反,用conf.level指定置信水平。X<-c(78.1,72.4,76.2,74.3,77.4,78.4,76.0,75.5,76.7,77.3)Yv-c(79.1,81.0,77.3,79.1,80.0,79.1,79.1,77.3,80.2,82.1) t.test(X,Y,var.equal=T,al=

35、” I ”)輸出:Two Sample t-testdata: X and Yt = -4.2957, df = 18, p-value = 0.0002176alter native hypothesis: true differe nce in mea ns is less tha n 095 perce nt con fide nce in terval:-In f -1.908255sample estimates:mean of x mean of y76.23 79.43結(jié)果中我們不僅能得到 X和丫的均值的點(diǎn)估計(jì)76.23和79.43、左側(cè)區(qū)間估計(jì)、同時(shí)也能通 過(guò)p值的大小判斷是否

36、接受原假設(shè),該例中p<0.05,認(rèn)為拒絕原假設(shè),即認(rèn)為兩總體方差不同。與均值假設(shè)檢驗(yàn)相類似。R語(yǔ)言中還可以用var.test() 函數(shù)進(jìn)行正態(tài)總體的方差假設(shè)檢驗(yàn)。而且 R語(yǔ)言不僅能就正 態(tài)總體進(jìn)行均值和方差檢驗(yàn),也能對(duì)其他總體分布進(jìn)行檢驗(yàn)。例如用bin om.test()進(jìn)行二項(xiàng)分布的檢驗(yàn)和估計(jì)。習(xí)題中檢驗(yàn)鐵劑和飲食兩種方法治療后患者病情表現(xiàn)有無(wú)差異:xv-c(113,120,138,120,100,118,138,123) yv-c(138,116,125,136,110,132,130,110) bi no m.test(sum(x<y),8)Exact bi no mial

37、testdata: sum(x < y) and 8nu mber of successes = 4, nu mber of trials = 8, p-value = 1alter native hypothesis: true probability of success is not equal to 0.595 perce nt con fide nce in terval:0.1570128 0.8429872sample estimates:probability of success 0.5由結(jié)果我們可以判斷兩種診斷方法無(wú)顯著差異(其中用到的統(tǒng)計(jì)學(xué)原理見下面的符號(hào)檢 驗(yàn))。參數(shù)假設(shè)檢驗(yàn)假定了總體分布的具體形式,但實(shí)際

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論