應用統(tǒng)計分析實驗軟件_第1頁
應用統(tǒng)計分析實驗軟件_第2頁
應用統(tǒng)計分析實驗軟件_第3頁
應用統(tǒng)計分析實驗軟件_第4頁
應用統(tǒng)計分析實驗軟件_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

應用統(tǒng)計分析實驗軟件第一頁,共五十四頁,2022年,8月28日SPSS:這是一個很受歡迎的統(tǒng)計軟件容易操作,輸出漂亮,功能齊全,價格合理。對于非統(tǒng)計工作者是很好的選擇。第二頁,共五十四頁,2022年,8月28日Excel:嚴格說來不是統(tǒng)計軟件,但作為數據表格軟件,必然有一定統(tǒng)計計算功能。多數裝Office時沒有裝數據分析的功能,畫圖功能都具備(雖然不好看)。對于簡單分析,Excel還算方便,但隨著問題的深入,就不那么“傻瓜”,需要很麻煩地使用函數,甚至根本沒有相應的方法了。第三頁,共五十四頁,2022年,8月28日SAS:這是功能非常齊全的軟件;美國政府政策傾斜(“權威性”)許多美國公司使用。價格不菲,每年交費.即使贈送,條件苛刻盡管現在已經盡量“傻瓜化”,仍然需要一定的訓練才可以進入。第四頁,共五十四頁,2022年,8月28日S-plus:這是統(tǒng)計學家喜愛的軟件。功能齊全,圖形漂亮有不斷加入的各個方向統(tǒng)計學家編寫的統(tǒng)計軟件包。也可以自己加入算法.強大而又方便的編程功能,使得研究人員可以編制自己的程序來實現自己的理論和方法。它也在進行“傻瓜化”以爭取顧客。但主要以其方便的編程為顧客所青睞。但是對于不會編程者,不那么“傻瓜”第五頁,共五十四頁,2022年,8月28日R軟件:免費的,志愿者管理的軟件。編程方便,語言靈活,圖形功能強大有不斷加入的各個方向統(tǒng)計學家編寫的統(tǒng)計軟件包。也可以自己加入自己算法的軟件包.這是發(fā)展最快的軟件,受到世界上統(tǒng)計師生的歡迎。是用戶量增加最快的統(tǒng)計軟件。對于一般非統(tǒng)計工作者來說,主要問題是它沒有“傻瓜化”。第六頁,共五十四頁,2022年,8月28日Minitab:這個軟件是很方便的功能強大而又齊全的軟件,也已經“傻瓜化”,在我國用的不如SPSS與SAS那么普遍。Eviews:這是一個主要處理回歸和時間序列的軟件。GAUSS:這是一個很好用的統(tǒng)計軟件,許多搞經濟的喜歡它。主要也是編程功能強大。目前在我國使用的人不多。MATLAB:這也是應用于各個領域的以編程為主的軟件,在工程上應用廣泛。但是統(tǒng)計方法不多。第七頁,共五十四頁,2022年,8月28日使用傻瓜軟件的問題…..無法任意取出計算過程中產生的任何中間結果;只能輸出軟件規(guī)定的輸出.無法在中間插入任何算法.無法實現軟件所沒有的計算.無法實現任何方法或計算方面的創(chuàng)新.是輸入輸出皆有限制的黑盒子.用語句的任何計算(即使1+1=2)都需類似八股文的“花架子”.第八頁,共五十四頁,2022年,8月28日搞統(tǒng)計是否不需要學習編程語言,可以不學習,如果你…搞純粹數學推導的,只搞“理論”,不面對數據,不用計算機覺得歲數太大,學不會“非傻瓜”的計算不想有創(chuàng)新,僅使用現成方法套用第九頁,共五十四頁,2022年,8月28日但如果你要創(chuàng)新…你需要反復試驗你的新方法需要用各種數據來檢驗你的新方法需要把你的方法和老方法進行比較需要介紹自己的新方法使用編程語言不可避免第十頁,共五十四頁,2022年,8月28日R軟件第十一頁,共五十四頁,2022年,8月28日R免費

資源公開(不是黑盒子,也不是吝嗇鬼)R可以在UNIX,Windows和Macintosh運行.R有優(yōu)秀的內在幫助系統(tǒng).R有優(yōu)秀的畫圖功能學生能夠輕松地轉到商業(yè)支持的S-Plus程序(如果需要使用商業(yè)軟件)R語言有一個強大的,容易學習的語法,有許多內在的統(tǒng)計函數.第十二頁,共五十四頁,2022年,8月28日通過用戶自編程序,R語言很容易延伸和擴大.它就是這樣成長的.R是計算機編程語言.類似于UNIX語言,C語言,Pascal,Gauss語言等.對于熟練的編程者,它將覺得該語言比其他語言更熟悉.而對計算機初學者,學習R語言使得學習下一步的其他編程不那么困難.那些傻瓜軟件(SAS,SPSS等)語言的語法則完全不同.第十三頁,共五十四頁,2022年,8月28日R的歷史S語言在1980年代后期在AT&T實驗室開發(fā).R項目由Auckland大學統(tǒng)計系的RobertGentleman和RossIhaka于1995年開始的.它很快得到廣泛用戶的歡迎.目前它是由R核心發(fā)展團隊維持;它是一個由志愿者組成的工作努力的國際團隊第十四頁,共五十四頁,2022年,8月28日下載R軟件學習網站第十五頁,共五十四頁,2022年,8月28日R軟件的使用基本語法向量、矩陣list與data.frame讀寫數據文件控制語句與自定義函數二.數據描述性分析1.分布2.統(tǒng)計量3.一維數據的統(tǒng)計圖形4.多維數據的圖形表示R軟件第十六頁,共五十四頁,2022年,8月28日三.回歸分析四.判別分析五.聚類分析六.主成分分析第十七頁,共五十四頁,2022年,8月28日基本語法1.變量使用即定義,變量名區(qū)分大小寫,可用中文命名變量賦值可采用4種形式:=,<-,->,assign()

變量類型自動由變量賦值確定。

#注釋符號,分號;語句連接符例子:

a=10a<-1010->aassign(“a”,10) A=10A<-1010->Aassgin(‘ab’,200)

中國=“中華人民共和國”#生成字符串變量

assign(“中國”,“中華人民共和國”)a=10;A=10;a;A第十八頁,共五十四頁,2022年,8月28日算術運算符:+,-,*,/,^(乘方),%%(模),%/%(整除)

3.常用的數學函數有:abs,sign,log,log2,

log10,sqrt,exp,sin,cos,tan,acos,asin,atan,cosh,sinh,tanh4.查看幫助,例如:help(round),?abs第十九頁,共五十四頁,2022年,8月28日向量、矩陣向量(一維數組,下標從1開始)

a=c(d1,d2,d3,…)

間隔為1的等差序列:a:b

指定間隔的等差序列:seq(from,to,by)

seq(length=,from=,by=)

重復函數:rep(vec,times)

rep(vec,times,len=,each=)

a=c(3,5,8,10)a=1:10;b=seq(1,10,2);c=rep(a,2,each=3)a=seq(-pi,pi,0.2)隨機向量rnorm(10)

#10個服從標準正態(tài)分布的隨機數第二十頁,共五十四頁,2022年,8月28日z=1:5z[7]=8;z[1]12345NA8

#缺失數據NAz[c(1,3,5)]=1:3;z[1]12243NA8z[is.na(z)]=0#函數is.na()判斷數據是否缺失,將其為真的賦為0

z[z<3]#z中小于3的元素z[(length(z)-1):length(z)]#最后二個元素.z[-c(1,3)]#去掉第1、3元素.第二十一頁,共五十四頁,2022年,8月28日x=rnorm(10)

sort(x)order(x)第二十二頁,共五十四頁,2022年,8月28日2.矩陣(二維數組)及多維數組

matrix(data=NA,nrow=1,ncol=1,byrow=FALSE,dimnames=NULL)byrow=TRUE以行序放置,(默認FALSW,以列序)array(data=NA,dim=c(),dimnames=)

a=c(1,2,3,4,5,6,7,8,9,10)b=matrix(data=a,nrow=5,ncol=2,byrow=TRUE)c=array(data=1:12,dim=c(2,3,2))第二十三頁,共五十四頁,2022年,8月28日3.向量和數組/矩陣的轉化只要定義向量的維數即可實現向量和數組轉化例如:c=1:12;

a=matrix(c,nrow=2,ncol=6)

dim(c)=c(3,4);

A=diag(c(1,4,5))#以向量為對角元生成對角矩陣

a=diag(A)#獲取矩陣的對角元b=as.vector(c)d=rbind(a,a)#行合并,要求列數相等e=cbind(a,a)#列合并,要求行數相等第二十四頁,共五十四頁,2022年,8月28日4.維數問題

dim()#獲得維數,返回向量

nrow(),ncol()#獲得行數和列數

rownames(),colnames()#訪問各維名稱第二十五頁,共五十四頁,2022年,8月28日x=matrix(rnorm(24),4,6)x[c(2,1),]#第2和第1行x[,c(1,3)]#第1和第3列x[2,1]#第[2,1]元素x[x[,1]>0,1]#第1列大于0的元素x[,-c(1,3)]#沒有第1、3列的x.x[-2,-c(1,3)]#沒有第2行、第1、3列的x.第二十六頁,共五十四頁,2022年,8月28日5.基本矩陣運算矩陣間四則運算:+,-,*,/分別是對應元素的四則運算向量矩陣間:向量按列匹配與矩陣運算例如:

A=matrix(1:6,nrow=3)B=matrix(10:15,nrow=3)C=c(100,200)則:A+BA*BA+C111710521012041319227010220515213690103206第二十七頁,共五十四頁,2022年,8月28日6.矩陣運算轉置t(mat)

行列式det(mat)

逆矩陣solve(mat)

特征eigen(mat)#返回列表(values,vectors)

乘法A%*%B

向量內積/外積x%*%y,x%o%y(笛卡爾積)

生成對角diag(Vec)取對角diag(mat)

奇異值分解svd(mat)mat=UDV’

得到列表(d,u,v)qr分解qr(mat)Choleski分解chol(mat)第二十八頁,共五十四頁,2022年,8月28日列表和數據框1.列表是一種特殊的對象集合,各元素類型任意生成:list(name1=value1,…,namen=valuen)訪問/修改:對象名[[下標]]或對象名$nameistu=list(age=10,name=“Tom”,interests=c(“swimming”,”drawing”))stu[[2]]stu$namestu$name=“john”

names(stu)#得到所有的變量名第二十九頁,共五十四頁,2022年,8月28日2.數據框是R的一種數據結構,以矩陣形式保存數據各列類型可以不同,每列為一變量,每行為樣品各列長度相等生成:data.frame()

stu=data.frame(name=c(“john”,”wuji”),age=c(30,32))

x=data.frame(matrix(1:6,nrow=2))

names(stu)#得到所有的變量名

rownames(stu)#得到行名

attach(x)#把數據框中的變量鏈接到內存中

第三十頁,共五十四頁,2022年,8月28日x=matrix(1:6,2,3)x=data.frame(x);xX1X2X311352246x$X2[1]34attributes(x)$names[1]“X1"“X2"“X3“$s[1]"1""2“$class[1]"data.frame"第三十一頁,共五十四頁,2022年,8月28日x=data.frame(id=101:120,score=round(rnorm(20,70,10)))x[seq(1,10,2),]x[order(x[[2]],decreasing=T),]x[x[[2]]<60,]第三十二頁,共五十四頁,2022年,8月28日數據格式及I/O讀表格形式文本文件read.table(file,header=FALSE,sep=““,…)header表示第一行是否有變量名,sep表示數據分割的字符

D1=read.table(“e:\\test1.txt”,header=TRUE)D2=read.table(“clipboard”)

第三十三頁,共五十四頁,2022年,8月28日3.計算的數據保存成文本文件或CSV文本文件

write.table(data,file=“”)#純文本格式

例:將數據D1寫入文件file_1.txtwrite.table(D1,file=“e:\\file_1.txt”)

第三十四頁,共五十四頁,2022年,8月28日1.分支結構單分支:if(條件)語句if(條件){復合語句;}

雙分支:if(條件)語句1else語句2

多分支:if()語句1elseif()語句2…elseif()語句nelse語句n+1switch:switch(表達式,list)

返回list中下標與表達式對應的值例子:x=1;if(x>0){a=10;b=10}else{a=20;b=20;}switch(x,1:5,100,20)#12345

這三個構成列表list,返回list[x]控制語句第三十五頁,共五十四頁,2022年,8月28日2.循環(huán)結構

for(nameinexpress)expr;#{expr_s}while(condition)expr;#{expr_s}

repeat{exprs;if(達到中止條件)break}

中止循環(huán)語句:break;

跳空循環(huán)語句:next;例子:完成1到100的求和運算

s1=0;j=1;k=1;s2=0;s3=0;for(iin1:100)s1=s1+i;#或者

while(j<=100){s2=s2+j;j=j+1;}#或者

repeat{s3=s3+k;k=k+1;if(k>100)break}第三十六頁,共五十四頁,2022年,8月28日

fun<-function(arg1,arg2,…){

注意:最后一句表達式的值為返回值}例子:完成一維向量均值運算mymeanmymean=function(x){sum=0;n=length(x)for(jin1:n)sum=sum+x[j]sum=sum/n}meanofx=mymean(1:100);meanofx自定義函數第三十七頁,共五十四頁,2022年,8月28日dnorm()#計算正態(tài)分布的密度函數pnorm()#計算正態(tài)分布的分布函數qnorm()#計算正態(tài)分布的分位數rnorm()#計算正態(tài)分布的隨機數其它分布的關鍵詞:unif,exp, chisq,t,f,binom, poisdexp(2,10)runif(10,0,10)和分布相關第三十八頁,共五十四頁,2022年,8月28日統(tǒng)計量mean(),median(),quantile(),var(),sd(),cor()sum(),max(),min()summary()table()#列聯(lián)表x=c(10,71:78,90)xm<-mean(x)c(xm,mean(x,trim=0.10))A=cbind(c(90,60,70),c(85,66,95))apply(A,1,mean)#對每一行取平均apply(A,2,mean)#對每一列取平均var(A)cor(A)第三十九頁,共五十四頁,2022年,8月28日數據的圖形表示x=seq(-10,10,2);y=rnorm(11)plot(x,y)

plot(x,y,main="散點圖",xlab="橫坐標x",ylab="縱坐標y")text(x,y,1:length(x),-1)#寫入點序號,第三個參數默認如此plot(x,y,type="o",col="red",pch=2,lty=3)1.散點圖plot(x,y,…)第四十頁,共五十四頁,2022年,8月28日type=“p”#散點圖,默認type=“l(fā)’#繪實線type=“o”#實線通過所有的點type=“n”#不畫點參數lty表示線的類型0=blank,1=solid(default),2=dashed,3=dotted,4=dotdash,5=longdash,6=twodash第四十一頁,共五十四頁,2022年,8月28日低水平作圖函數還有points()lines()ablines()text()legend()第四十二頁,共五十四頁,2022年,8月28日x=seq(-10,10,2);y=rnorm(11)par(mfrow=c(3,1))#準備畫3個圖plot(x,y)

plot(x,y,main="散點圖",xlab="橫坐標x",ylab="縱坐標y")text(x,y,1:length(x),-1)#寫入點序號plot(x,y,type="o",col="red",pch=2,lty=3)第四十三頁,共五十四頁,2022年,8月28日2.散點圖矩陣pairs(x,…)A=matrix(rnorm(12,70,20),nrow=4)pairs(A)第四十四頁,共五十四頁,2022年,8月28日3.多組散點圖matplot(x,y,…)x=seq(0,2*pi,0.2)matplot(x,cbind(sin(x),cos(x)),type=c(“o”,”o”),col=2:3)第四十五頁,共五十四頁,2022年,8月28日4.星座圖

5.臉譜圖library(aplpack)faces(x,nrow.plot,ncol.plot)stars(x,full=TRUE,draw.segments=FALSE)第四十六頁,共五十四頁,2022年,8月28日例1.在同一圖中繪制標準正態(tài)分布和自由度為5的t分布的概率密度圖.plot(x,dnorm(x),type="l",ylab="f(x)",main="概率密度圖")lines(x,dt(x,5),col="red",lty=2)legend(2,0.4,c('N(0,1)','t(5)'),lty=1:2,col=c("black","red"))matplot(x,cbind(dnorm(x),dt(x,5)),type="l",ylab="f(x)",main="概率密度圖")legend(2,0.4,c('N(0,1)','t(5)'),lty=1:2,col=1:2)第四十七頁,共五十四頁,2022年,8月28日lwl.andrews=function(X){t=seq(-pi,pi,0.2)n=nrow(X)f=matrix(0,nrow=length(t),ncol=n)for(iin1:n){f[,i]=X[i,1]/sqrt(2)for(jin2:ncol(X)){if(j%%2==0)f[,i]=f[,i]+X[i,j]*sin(j/2*t) else f[,i]=f[,i]+X[i,j]*cos(j%/%2*t)}}matplot(t,f,col=1:n,type="o",main="調和曲線圖")}例2:繪制調和曲線圖第四十八頁,共五十四頁,2022年,8月28日hist(x,freq)#直方圖,freq=counts,(默認)為頻數直方圖, freq=TRUE,為頻率直方圖,freq=FALSE,為密度直方圖boxplot(x)#箱線圖stem(x)#莖葉圖其它圖形

a=rnorm(100,70,10);hist(a)b=rbinom(100,5,0.5)nums=table(b)barplot(nums)pie()#餅狀圖barplot(x,beside=F)#柱狀圖第四十九頁,共五十四頁,2022年,8月28日例1:31省市地區(qū)的消費支出數據,進行如下統(tǒng)計1.計算各地區(qū)的人均消費支出總和,并畫出柱狀圖2.畫出前十個地區(qū)的關于衣著和居住兩項的復式柱狀圖。3.計算各消費類型的均值,并畫出餅狀圖和柱狀圖3.畫出各消費類型的箱線圖4.畫出各地區(qū)的雷達圖和臉譜圖barplot(apply(X,1,sum),col=rainbow(31),s=0.5)

pie(apply(X,2,mean))barplot(apply(X,2,mean),names=NA,legend=names(X),col=1:ncol(X))barplot(t(X[1:10,c(2,7)]),beside=T,legend=T)第五十頁,共五十四頁,2022年,8月28日實驗題求矩陣B的行列式、逆矩陣、特征根和特征向量及A’BA第五十一頁,共五十四頁,2022年,8月28日學號性別數學語文英語物理13001男8076819023002男5567796333003女2752534343004女6257666953005女9480767163006男9759617473007男7962788883008男7092788393009女67666555103010男97465575113011男8482889212

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論