![Lecture1 入門實例_第1頁](http://file4.renrendoc.com/view/f6037184b02cfcbb82224d84fedf89ff/f6037184b02cfcbb82224d84fedf89ff1.gif)
![Lecture1 入門實例_第2頁](http://file4.renrendoc.com/view/f6037184b02cfcbb82224d84fedf89ff/f6037184b02cfcbb82224d84fedf89ff2.gif)
![Lecture1 入門實例_第3頁](http://file4.renrendoc.com/view/f6037184b02cfcbb82224d84fedf89ff/f6037184b02cfcbb82224d84fedf89ff3.gif)
![Lecture1 入門實例_第4頁](http://file4.renrendoc.com/view/f6037184b02cfcbb82224d84fedf89ff/f6037184b02cfcbb82224d84fedf89ff4.gif)
![Lecture1 入門實例_第5頁](http://file4.renrendoc.com/view/f6037184b02cfcbb82224d84fedf89ff/f6037184b02cfcbb82224d84fedf89ff5.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、實驗目的實驗內(nèi)容初步學習如何應用R軟件解決統(tǒng)計問題1、R 簡介2、應用實例3、實驗作業(yè)入門實例1一、 R簡介為什么要學習R語言R的資源 資料與文獻 網(wǎng)站 統(tǒng)計分析軟件包S-Plus和R的初步比較 R的運行平臺 R_GUI R_Commander R_WinEdt R_ESS+XEmacs 2R的無私奉獻者Bill Venables Robert Gentleman Ross Ihaka 3R是一個開放(GPL)的統(tǒng)計編程環(huán)境一種語言,是語言(由AT&T Bell實驗室的Rick Becker, John Chambers,Allan Wilks開發(fā))的一種方言(dialect) 之一,另一則為
2、S-plus.一種軟件,是集統(tǒng)計分析與圖形直觀顯示于一體.R作為一個計劃(project),最早(1995年)是由Auckland大學統(tǒng)計系的Robert Gentleman和Ross Ihaka開始編制,目前由核心開發(fā)小組(R Development Core Team 以后用R DCT表示)維護,他們完全自愿、工作努力負責,并將全球優(yōu)秀的統(tǒng)計應用軟件打包提供給我們。我們可以通過計劃的網(wǎng)站()了解有關的最新信息和使用說明,得到最新版本的軟件和基于的應用統(tǒng)計軟件包. 為什么要學習語言4是完全免費的! 而S-Plus盡管是非常優(yōu)秀的統(tǒng)計分析軟件,可是你需要支付一筆$US .R可以在運行于UNIX
3、, Windows和Macintosh的操作系統(tǒng)上 .R嵌入了一個非常實用的幫助系統(tǒng).R具有很強的作圖能力.我們能將程序容易地移植到S-Plus程序中,反之的許多過程直接或稍作修改即可用于.通過語言的許多內(nèi)嵌統(tǒng)計函數(shù),很容易學習和掌握R語言的語法.我們可以編制自己的函數(shù)來擴展現(xiàn)有的語言(這就是為什么它在不斷升級完善!).5R主頁: CRAN (Comprehensive R Archive Network), CRAN的鏡像站點 UCLA提供的關于R與S-Plus的聯(lián)接,具有搜索功能 李東風主頁提供了的Windows版本 如果使用FTP軟件(如Cuteftp)則推薦使用(匿名訪問) 的網(wǎng)站資源
4、6CRAN提供了許多便于統(tǒng)計分析的宏包:stable - 穩(wěn)妥(分布)廣義回歸分析tseries 時間序列分析 VaR 風險值分析matrix 矩陣運算cinterface C與R的接口foreign 讀寫由S, Minitab, SAS, SPSS, Stata等軟件的數(shù)據(jù)normix 混合正態(tài)分布分析nortest 正態(tài)分布的Anderson-Darling檢驗MCMCpack 基于Gibbs抽樣的MCMC抽樣方法 fracdiff 分數(shù)差分模型的極大似然估計 還有很多統(tǒng)計分析軟件包7S-Plus與R初步比較 豐富的數(shù)據(jù)類型(向量、數(shù)組、列表、對象等)特別有利于實現(xiàn)新的統(tǒng)計算法。S語言是由
5、AT&T貝爾實驗室開發(fā)的一種用來進行數(shù)據(jù)探索、統(tǒng)計分析、作圖的解釋型語言。其交互式運行方式及強大的圖形及交互圖形功能使得我們可以方便的探索數(shù)據(jù)。目前S語言的實現(xiàn)版本主要是S-PLUS。它基于S語言,并由MathSoft公司的統(tǒng)計科學部進一步完善。8作為統(tǒng)計學家及一般研究人員的通用方法工具箱,S-PLUS強調(diào)圖形演示、探索性數(shù)據(jù)分析、統(tǒng)計方法、開發(fā)新統(tǒng)計工具的計算方法,以及可擴展性。S-PLUS可以直接用來進行標準的統(tǒng)計分析得到所需結(jié)果,但是它的主要的特點是它可以交互地從各個方面去發(fā)現(xiàn)數(shù)據(jù)中的信息,并可以很容易地實現(xiàn)一個新的統(tǒng)計方法。S-PLUS有微機版本和工作站版本,它是一個商業(yè)軟件。9Auc
6、kland大學的Robert Gentleman 和 Ross Ihaka 及其他志愿人員開發(fā)了一個R系統(tǒng),其語法形式與S語言基本相同,但實現(xiàn)不同,兩種語言的程序有一定的兼容性。R是一個GPL自由軟件,現(xiàn)在的版本是2.4.1版,它比S-PLUS 還少些功能,但已經(jīng)具有了很強的實用性。本課程中盡量介紹S-PLUS和R都能使用的功能,以R為主。下面我們用S統(tǒng)稱S-PLUS和R。 10R的運行平臺R_GUI啟動R,我們看到R GUI (graphic users interface)的主窗口, 它由三部分組成主菜單 工具條 R console (R的運行窗口)R console你的主要工作是在這里通
7、過發(fā)布命令來完成的,包括數(shù)據(jù)集的建立,數(shù)據(jù)的分析,作圖等.在這里你可以得到在線幫助help() 得到相應函數(shù)的幫助,例如help(plot)help.start() HTML格式的關于R的幫助文件demo() 得到R提供的幾個示例; demo(fm)q() 退出R11工具條介紹Source R codeLoad imageSave imageCopy and PasteStop current computationSource R code 執(zhí)行R文件(*.R或*.r)Save image 保存工作空間,文件名為*.RDataLoad image 打開已有的工作空間Stop current
8、computation 中止當前計算(由于超時等原因) (打開程序腳本) (載入映象) (保存映象) (打印) (中斷目前的計算) 12主菜單介紹(相應有中文對照)13S的基本界面是一個交互式命令窗口,命令提示符是一個大于號,命令的結(jié)果馬上顯示在命令下面。二、應用實例S命令主要有兩種形式:表達式或賦值運算(用 x11() 可以打開一個作圖窗口。然后,輸入以下語句: x1 x2 y plot(x2,y, type=l) plot(x2,y,type=“s”,main=“畫圖練習”,sub=“好好練, xlab=x軸,ylab=y軸)151617這些語句可以繪制正弦曲線圖。其中,“ x1 x y
9、plot(x,y, type=l) 1920簡單統(tǒng)計量sum, mean, var, sd, min, max, range, median, IQR(四分位間距)等為統(tǒng)計量,sort,order,rank與排序有關,其它還有ave,fivenum,mad,quantile,stem等。21下面我們看一看S的統(tǒng)計功能: marks mean(marks) sd(marks) median(marks) min(marks) max(marks) boxplot(marks) 22第一個語句輸入若干數(shù)據(jù)到一個向量,函數(shù)c()用來把數(shù)據(jù)組合為一個向量。后面用了幾個函數(shù)來計算數(shù)據(jù)的均值、標準差、中位
10、數(shù)、最小值、最大值。最后的函數(shù)繪制數(shù)據(jù)的盒形圖。例中sd()是R中才有的函數(shù),在S-PLUS中要用sqrt(var()來計算。在S命令方式中要顯示一個表達式的值只要鍵入它。23中位數(shù)(median)排序后處于中間位置上的值Me50%50%不受極端值的影響主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)各變量值與中位數(shù)的離差絕對值之和最小,即24四分位數(shù)(quartile)排序后處于25%和75%位置上的值不受極端值的影響主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)QLQMQU25%25%25%25%25四分位差(quartile deviation)對順序數(shù)據(jù)離散程度的測度也
11、稱為內(nèi)距或四分間距上四分位數(shù)與下四分位數(shù)之差 QD = QU QL反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響用于衡量中位數(shù)的代表性26未分組數(shù)據(jù)箱線圖(box plot)用于顯示未分組的原始數(shù)據(jù)的分布箱線圖由一組數(shù)據(jù)的5個特征值繪制而成,它由一個箱子和兩條線段組成其繪制方法是:首先找出一組數(shù)據(jù)的5個特征值,即最大值、最小值、中位數(shù)Me 和兩個四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個四分(位)數(shù)畫出箱子,再將兩個極值點與箱子相連接 27未分組數(shù)據(jù)單批數(shù)據(jù)箱線圖(箱線圖的構成)中位數(shù)4681012QUQLX最大值X最小值簡單箱線圖28可以把若干行命令保存在一個文本文件(比如E:/WO
12、RK/MYPROG.S)中,然后用source 函數(shù)來運行整個文件: source(E:/lian.R)注意字符串中的反斜杠。用sink()函數(shù)可以把以后的輸出從屏幕窗口轉(zhuǎn)向到一個外部文本文件,例如: sink(“E:/WORK/MYPROG.txt)要恢復輸出到屏幕窗口,使用: sink()在S中還可以用“?”號后面跟要查詢的函數(shù)來顯示幫助信息,例如: ?c ?=29例2:計算6, 4, 7, 8,10的均值和標準差,把若干行命令保存在一個文本文件(比如E:lian1.R)中,然后用source 函數(shù)來運行整個文件。a - c(10, 6, 4, 7, 8) b-mean(a) c ?fiv
13、enum fivenum(0:100) fivenum(1:100)fivenum(c(rnorm(100) fivenum(c(rnorm(100),-1:1/0)32實驗作業(yè)1、查詢stem的函數(shù)幫助信息,并用幫助文件中的案例進一步學習.繪制 12 12 11 10 9 10 12 的莖葉圖。2、繪制y=x3 +sin(x)*cos(x)的函數(shù)圖,并加注圖例“自變量X”、“函數(shù)Y”、“示意圖”.要求:需給出程序、結(jié)果,存成word文檔星期日前發(fā)送到 用戶名:ryy 密碼: ryy33一個R的演示會話見相應文件作為閱讀材料34附錄一 S常用函數(shù)參考 一、數(shù)據(jù)管理 vector:向量 nume
14、ric:數(shù)值型向量 logical:邏輯型向量 character;字符型向量 list:列表 data.frame:數(shù)據(jù)框 c:連接為向量或列表 length:求長度 subset:求子集 rep:重復 NA:缺失值 seq,from:to,sequence:等差序列 NULL:空對象 sort,order,unique,rev:排序 unlist:展平列表 attr,attributes:對象屬性 mode,typeof:對象存儲模式與類型 names:對象的名字屬性 35二、字符串處理 character:字符型向量 nchar:字符數(shù)substr:取子串 format,formatC:
15、把對象用格式轉(zhuǎn)換為字符串 paste,strsplit:連接或拆分 charmatch,pmatch:字符串匹配 grep,sub,gsub:模式匹配與替換 三、復數(shù) complex,Re,Im,Mod,Arg,Conj:復數(shù)函數(shù) 36四、因子 factor:因子 codes:因子的編碼 levels:因子的各水平的名字nlevels:因子的水平個數(shù) cut:把數(shù)值型對象分區(qū)間轉(zhuǎn)換為因子 table:交叉頻數(shù)表 split:按因子分組 aggregate:計算各數(shù)據(jù)子集的概括統(tǒng)計量 tapply:對“不規(guī)則”數(shù)組應用函數(shù) 37數(shù)學 一、計算 +, -, *, /, , %, %/%:四則運算
16、ceiling,floor,round,signif,trunc,zapsmall:舍入 max,min,pmax,pmin:最大最小值 range:最大值和最小值 sum,prod:向量元素和,積 cumsum,cumprod,cummax,cummin:累加、累乘 sort:排序 approx和approx fun:插值 diff:差分 sign:符號函數(shù) 38二、數(shù)學函數(shù)(I) abs,sqrt:絕對值,平方根 log, exp, log10, log2:對數(shù)與指數(shù)函數(shù) sin,cos,tan,asin,acos,atan:三角函數(shù) sinh,cosh,tanh,asinh,acosh:
17、雙曲函數(shù) beta,lbeta,gamma,lgamma,digamma,trigamma,tetragamma,pentagamma,choose ,lchoose:與貝塔函數(shù)、伽瑪函數(shù)、組合數(shù)有關的特殊函數(shù)39 fft,mvfft,convolve:富利葉變換及卷積 polyroot:多項式求根 poly:正交多項式 spline,splinefun:樣條差值 besselI,besselK,besselJ,besselY,gammaCody:Bessel函數(shù) deriv:簡單表達式的符號微分或算法微分 二、數(shù)學函數(shù)(II)40三、數(shù)組array:建立數(shù)組 matrix:生成矩陣 data
18、.matrix:把數(shù)據(jù)框轉(zhuǎn)換為數(shù)值型矩陣 lower.tri:矩陣的下三角部分 mat.or.vec:生成矩陣或向量 t:矩陣轉(zhuǎn)置 cbind:把列合并為矩陣 rbind:把行合并為矩陣 diag:矩陣對角元素向量或生成對角矩陣 aperm:數(shù)組轉(zhuǎn)置 nrow, ncol:計算數(shù)組的行數(shù)和列數(shù) dim:對象的維向量 dimnames:對象的維名 row/colnames:行名或列名 %*%:矩陣乘法 crossprod:矩陣交叉乘積(內(nèi)積)41三、數(shù)組crossprod:矩陣交叉乘積(內(nèi)積) outer:數(shù)組外積 kronecker:數(shù)組的Kronecker積 apply:對數(shù)組的某些維應用函
19、數(shù) tapply:對“不規(guī)則”數(shù)組應用函數(shù) sweep:計算數(shù)組的概括統(tǒng)計量 aggregate:計算數(shù)據(jù)子集的概括統(tǒng)計量 scale:矩陣標準化 matplot:對矩陣各列繪圖 cor:相關陣或協(xié)差陣 Contrast:對照矩陣 row:矩陣的行下標集 col:求列下標集 42四、線性代數(shù) solve:解線性方程組或求逆 eigen:矩陣的特征值分解 svd:矩陣的奇異值分解 backsolve:解上三角或下三角方程組 chol:Choleski分解 qr:矩陣的QR分解 chol2inv:由Choleski分解求逆 43五、邏輯運算 ,=,=,!=:比較運算符 !,&,&,|,|,xor(
20、):邏輯運算符 logical:生成邏輯向量 all,any:邏輯向量都為真或存在真 ifelse():二者擇一 match,%in%:查找 unique:找出互不相同的元素 which:找到真值下標集合 duplicated:找到重復元素 44六、優(yōu)化及求根optimize,uniroot,polyroot:一維優(yōu)化與求根程序設計 一、控制結(jié)構 if,else,ifelse,switch:分支 for,while,repeat,break,next:循環(huán) apply,lapply,sapply,tapply,sweep:替代循環(huán)的函數(shù)。 45二、函數(shù) function:函數(shù)定義 source
21、:調(diào)用文件call:函數(shù)調(diào)用 .C,.Fortran:調(diào)用C或者Fortran子程序的動態(tài)鏈接庫。 Recall:遞歸調(diào)用 browser,debug,trace,traceback:程序調(diào)試options:指定系統(tǒng)參數(shù) missing:判斷虛參是否有對應實參 nargs:參數(shù)個數(shù) stop:終止函數(shù)執(zhí)行 46二、函數(shù) on.exit:指定退出時執(zhí)行 eval,expression:表達式計算 system.time:表達式計算計時 invisible:使變量不顯示 menu:選擇菜單(字符列表菜單) 其它與函數(shù)有關的還有:delay,environment ,formals,interact
22、ive,is.finite,is.function,is.language,is.recursive ,match.arg,match.call,match.fun,model.extract,name,parse,substitute,sys.parent ,warning,machine。 47三、輸入輸出 cat,print:顯示對象sink:輸出轉(zhuǎn)向到指定文件 dump,save,dput,write:輸出對象scan,read.table,load,dget:讀入 48四、工作環(huán)境ls,objects:顯示對象列表 rm, remove:刪除對象 q,quit:退出系統(tǒng) .First,.Last:初始運行函數(shù)與退出運行函數(shù)。options:系統(tǒng)選項 ?,help,help.start,apropos:幫助功能 data:列出數(shù)據(jù)集 49統(tǒng)計計算 一、統(tǒng)計分布 每一種分布有四個函數(shù): ddensity(密度函數(shù)),p分布函數(shù), q分位數(shù)函數(shù),r隨機數(shù)函數(shù)。 比如,正
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度健身房教練團隊管理與培訓聘用合同
- 2025年度國際商務電子商務運營商務專業(yè)人員勞動合同范本
- 2025年度建筑勞務承包合同范本適用于綠色建筑設計施工一體化項目
- 2025年度國際貿(mào)易合同標的國際技術轉(zhuǎn)移與轉(zhuǎn)讓合同
- 2025年度房地產(chǎn)項目廉政合同實施細則
- 2025年度民宿消防安全自查與整改專項合同
- 2025年度工地材料供應鏈優(yōu)化與成本控制合同
- 2025年度季節(jié)性農(nóng)業(yè)農(nóng)產(chǎn)品包裝用工合同
- 2025年度大型公共建筑土方施工合同范本
- 2025年度別墅購房合同補充條款及附件格式
- 自卸車司機實操培訓考核表
- 教師個人基本信息登記表
- 中考現(xiàn)代文閱讀理解題精選及答案共20篇
- ESD測試作業(yè)指導書-防靜電手環(huán)
- 高頻變壓器的制作流程
- 春季開學安全第一課PPT、中小學開學第一課教育培訓主題班會PPT模板
- JJG30-2012通用卡尺檢定規(guī)程
- 部編版人教版二年級上冊語文教材分析
- 艾賓浩斯遺忘曲線復習方法表格模板100天
- APR版制作流程
- 《C++程序設計》完整教案
評論
0/150
提交評論