R語(yǔ)言樸素貝葉斯分類上機(jī)指導(dǎo)_第1頁(yè)
R語(yǔ)言樸素貝葉斯分類上機(jī)指導(dǎo)_第2頁(yè)
R語(yǔ)言樸素貝葉斯分類上機(jī)指導(dǎo)_第3頁(yè)
R語(yǔ)言樸素貝葉斯分類上機(jī)指導(dǎo)_第4頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、樸素貝葉斯分類上機(jī)指導(dǎo)一、實(shí)驗(yàn)?zāi)康模? 1 .掌握矩陣數(shù)據(jù)的輸入,輸出,以及矩陣和數(shù)據(jù)框數(shù)據(jù)的轉(zhuǎn)換,認(rèn)識(shí)一下listlist型數(shù)據(jù)。2 2 .理解并掌握樸素貝葉斯分類原理。3 3 .會(huì)使用 klaRklaR 包中的 NaiveBayesNaiveBayes 雨數(shù)實(shí)現(xiàn)貝葉斯分類算法。二、實(shí)驗(yàn)內(nèi)容:本實(shí)驗(yàn)利用樸素貝葉斯分類方法對(duì)課本 P144P144 頁(yè) playtennisplaytennis 數(shù)據(jù)集建立模型并預(yù)測(cè)。三、實(shí)驗(yàn)步驟:1 1.將課本 P144P144 頁(yè) playtennisplaytennis 數(shù)據(jù)以矩陣形式輸入,注意理解下面紅色代碼。data-matrix(c(sunny,hot

2、,high,weak,no,c(sunny,hot,high,weak,no,“sunny,hot,high,strong,no,sunny,hot,high,strong,no,“overcast,hot,high,weak,yes,rain,overcast,hot,high,weak,yes,rain,mild,high,weak,yes,rain,cool,normal,weak,yes,rain,cool,normamild,high,weak,yes,rain,cool,normal,weak,yes,rain,cool,normal,strong,no,l,strong,no,“

3、overcast,cool,normal,strong,yes,overcast,cool,normal,strong,yes,“sunny,mild,high,sunny,mild,high,weak,no,weak,no,“sunny,cool,normal,weak,yes,rain,mild,normal,weak,ysunny,cool,normal,weak,yes,rain,mild,normal,weak,yes,es,“sunny,mild,normal,strong,yes,sunny,mild,normal,strong,yes,“overcast,mild,high,s

4、trong,yeovercast,mild,high,strong,yes,s,“overcast,hot,normal,weak,yes,rain,mild,high,strong,no),byrovercast,hot,normal,weak,yes,rain,mild,high,strong,no),byrow=TRUE,dimnames=list(day=c(),condition=c(outlook,temperature,ow=TRUE,dimnames=list(day=c(),condition=c(outlook,temperature,“humidity,winhumidi

5、ty,wind,playtennis),nrow=14,ncol=5d,playtennis),nrow=14,ncol=5);# #上網(wǎng)查詢dimnamesdimnames的用法# #輸出一下datadata數(shù)據(jù):# # 將矩陣轉(zhuǎn)化成數(shù)據(jù)框# #data1write.table(data1,file=playtennis.txt,sep=)# # 可以重新讀入保存的 txttxt 文件data2-read.table(playtennis.txt,head=TRUE)2 2.理解并掌握樸素貝葉斯分類原理,讀懂下列代碼# 算出去玩與不玩的先驗(yàn)概率prior.yes-sum(data2,5=ye

6、s)/length(data2,5);prior.no-sum(data2,5=no)/length(data2,5);# 建立樸素貝葉斯分類函數(shù)bayespre-function(condition)post.yes-sum(data2,1=condition1)&(data2,5=yes)/sum(data2,5=yes)*sum(data2,2=condition2)&(data2,5=yes)/sum(data2,5=yes)*sum(data2,3=condition3)&(data2,5=yes)/sum(data2,5=yes)*sum(data2,4=c

7、ondition4)&(data2,5=yes)/sum(data2,5=yes)*prior.yes;post.no=post.no,yes,no);# 利用建立的樸素貝葉斯函數(shù)做預(yù)測(cè)bayespre(c(rain,hot,high,strong)$prob.yes10.005291005$prob.no10.02742857$prediction1 no#這些結(jié)果是多少?用函數(shù)bayespre()算一下,你能手動(dòng)算出來(lái)嗎?把你的算式寫出來(lái)bayespre(c(sunny,mild,normal,weak)bayespre(c(overcast,mild,normal,weak)ba

8、yespre(c(sunny,cool,high,strong)3使用 klaRklaR 包中的 NaiveBayes(NaiveBayes(璃數(shù)實(shí)現(xiàn)貝葉斯分類算法NaiveBayes()函數(shù)的語(yǔ)法和參數(shù)如下:NaiveBayes(formula,data,,subset,na.action=na.pass)NaiveBayes(x,grouping,prior,usekernel=FALSE,fL=0,)formulaformula指定參與模型計(jì)算的變量,以公式形式給出,類似于y=x1+x2+x3;datadata用于指定需要分析的數(shù)據(jù)對(duì)象;na.actionna.action指定缺失值的處

9、理方法,默認(rèn)情況下不將缺失值納入模型計(jì)算,也不會(huì)發(fā)生報(bào)錯(cuò)信息,當(dāng)設(shè)為“na.omit”時(shí)則會(huì)刪除含有缺失值的樣本;x x指定需要處理的數(shù)據(jù),可以是數(shù)據(jù)框形式,也可以是矩陣形式;groupinggrouping為每個(gè)觀測(cè)樣本指定所屬類別;priorprior可為各個(gè)類別指定先驗(yàn)概率,默認(rèn)情況下用各個(gè)類別的樣本比例作為先驗(yàn)概率;usekernelusekernel指定密度估計(jì)的方法(在無(wú)法判斷數(shù)據(jù)的分布時(shí),采用密度密度估計(jì)方法),默認(rèn)情況下使用標(biāo)準(zhǔn)的密度估計(jì),設(shè)為TRUE時(shí),則使用核密度估計(jì)方法;fLfL指定是否進(jìn)行拉普拉斯修正,默認(rèn)情況下不對(duì)數(shù)據(jù)進(jìn)行修正,當(dāng)數(shù)據(jù)量較小時(shí),可以設(shè)置該參數(shù)為1,即進(jìn)

10、行拉普拉斯修正。# 通過(guò)抽樣建立訓(xùn)練樣本和測(cè)試樣本index-sample(2,size=nrow(iris),replace=TRUE,prob=c(0.75,0.25)train-irisindex=1,test-irisindex=2,# 加載R包并使用樸素貝葉斯算法library(MASS)library(klaR)# 因子化train$Species-as.factor(train$Species)res2-NaiveBayes(Species.,data=train)pre-predict(res2,newdata=test,1:4)#生成實(shí)際與預(yù)判交叉表和預(yù)判精度table(te

11、st$Species,pre$class)1231 1000209230011sum(diag(table(test$Species,pre$class)/sum(table(test$Species,pre$class)0.9375讀懂上面的例子。仿照上面的例子使用 klaRklaR 包中的 NaiveBayes(NaiveBayes(眄數(shù)建立 playtennis.txtplaytennis.txt 貝葉斯分類模型,并預(yù)測(cè)上面的例子。c(rain,hot,high,strong)c(sunny,mild,normal,weak)c(overcast,mild,normal,weak)c(sunny,cool,high,strong)#將上面的情況建立dataframe作為測(cè)試題test-data.frame()test-rb

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論