《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》 課件6.1.1 樸素貝葉斯_第1頁
《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》 課件6.1.1 樸素貝葉斯_第2頁
《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》 課件6.1.1 樸素貝葉斯_第3頁
《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》 課件6.1.1 樸素貝葉斯_第4頁
《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》 課件6.1.1 樸素貝葉斯_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

構(gòu)建運(yùn)輸車輛安全駕駛行為分析模型運(yùn)輸車輛安全駕駛行為分析——樸素貝葉斯、K近鄰任務(wù)描述樸素貝葉斯法是基于貝葉斯定理與特征條件獨(dú)立假設(shè)的分類方法。對(duì)于運(yùn)輸企業(yè)來說,安全意識(shí)和責(zé)任感的重要性不言而喻,這是是企業(yè)長期發(fā)展和穩(wěn)定運(yùn)營的必要因素。構(gòu)建運(yùn)輸車輛安全駕駛行為分析模型能幫助企業(yè)更好地管理和監(jiān)控運(yùn)輸車輛的安全性能。在本任務(wù)中將使用高斯樸素貝葉斯和多項(xiàng)式分布樸素貝葉斯構(gòu)建運(yùn)輸車輛安全駕駛行為分析模型,探索、分析各車輛的駕駛行為。構(gòu)建運(yùn)輸車輛安全駕駛行為分析模型任務(wù)要求讀取并探索駕駛行為數(shù)據(jù)。處理駕駛行為數(shù)據(jù)。使用sklearn庫構(gòu)建樸素貝葉斯模型。利用Matplotlib庫對(duì)預(yù)測(cè)結(jié)果進(jìn)行可視化展示。使用準(zhǔn)確率、精確率、召回率、F1得分評(píng)估樸素貝葉斯模型。構(gòu)建運(yùn)輸車輛安全駕駛行為分析模型運(yùn)用Python構(gòu)建運(yùn)輸車輛安全駕駛行為分析模型需調(diào)用不同的庫高斯樸素貝葉斯多項(xiàng)式分布樸素貝葉斯樸素貝葉斯基本概念什么是樸素貝葉斯?構(gòu)建運(yùn)輸車輛安全駕駛行為分析模型樸素貝葉斯是分類器中最常用的一種生成式模型,其基于貝葉斯定理將聯(lián)合概率轉(zhuǎn)化為條件概率,利用特征條件及獨(dú)立假設(shè)簡化條件的概率進(jìn)行計(jì)算。樸素貝葉斯基本概念樸素貝葉斯算法流程構(gòu)建運(yùn)輸車輛安全駕駛行為分析模型計(jì)算先驗(yàn)概率,如果已經(jīng)給出先驗(yàn)概率,那么利用給出的先驗(yàn)概率。分別計(jì)算第

k個(gè)類別的第

i維特征的第

i個(gè)取值的條件概率。按照分類維度計(jì)算:分類概率×每個(gè)特征概率。確定待分類項(xiàng)所屬的類別。高斯樸素貝葉斯高斯樸素貝葉斯主要處理連續(xù)型變量的數(shù)據(jù),它的模型是假設(shè)每一個(gè)維度都符合高斯分布。使用sklearn庫中naive_bayes模塊的GaussianNB類可以構(gòu)建高斯樸素貝葉斯模型,其語法格式如下。構(gòu)建運(yùn)輸車輛安全駕駛行為分析模型參數(shù)名稱說明priors接收array。表示先驗(yàn)概率大小,若沒有給定,則模型根據(jù)樣本數(shù)據(jù)計(jì)算(利用極大似然法)。默認(rèn)為None。sklearn.naive_bayes.GaussianNB(priors=None)GaussianNB類常用的參數(shù)及其說明如下:樸素貝葉斯例題為了響應(yīng)共同富裕的主題,以幫助當(dāng)?shù)鼐用裉岣呤杖胨?,某地基層組織決定進(jìn)行人口普查,以便更好地了解當(dāng)?shù)鼐用竦氖杖肭闆r。現(xiàn)有某地的人口普查收入數(shù)據(jù),數(shù)據(jù)描述如下。構(gòu)建運(yùn)輸車輛安全駕駛行為分析模型性別當(dāng)?shù)鼐用裥詣e,取值為0、1。其中,0代表女性,1代表男性年齡當(dāng)?shù)鼐用衲挲g,取值為其自身年齡婚姻情況當(dāng)?shù)鼐用窕橐銮闆r,取值為0-3。其中,0代表已婚,1代表離異,2代表未婚,3代表喪偶家庭角色當(dāng)?shù)鼐用裨诩彝ブ兴缪莸慕巧?,取值?-5。其中,0代表妻子,1代表丈夫,2代表未婚,3代表離家,4代表孩子,5代表其他關(guān)系受教育程度當(dāng)?shù)鼐用袼邮艿慕逃潭龋≈禐?-8。其中,0代表初中,1代表中專,2代表高中,3代表職業(yè)學(xué)校,4代表大專,5代表大學(xué)未畢業(yè),6代表學(xué)士,7代表碩士,8代表博士特征名稱特征說明工作類型當(dāng)?shù)鼐用竦墓ぷ黝愋停≈禐?-5。其中,0代表私人,1代表自由職業(yè)非公司,2代表自由職業(yè)公司,3代表政府,4代表無薪,5代表無工作經(jīng)驗(yàn)每周工作時(shí)長(h)當(dāng)?shù)鼐用竦拿恐芄ぷ鲿r(shí)長,取值為其每周工作的小時(shí)數(shù)職業(yè)當(dāng)?shù)鼐用竦穆殬I(yè),取值為0-13。其中,0代表技術(shù)支持,1代表手工藝維修,2代表銷售,3代表執(zhí)行主管,4代表專業(yè)技術(shù),5代表勞工保潔,6代表機(jī)械操作,7代表管理文書,8代表農(nóng)業(yè)捕撈,9代表運(yùn)輸,10代表家政服務(wù),11代表保安,12代表軍人,13代表其他職業(yè)收入等級(jí)當(dāng)?shù)鼐用袼鶎偈杖氲燃?jí)類別,取值為0、1。其中,0代表收入小于等于5萬每年,1代表收入大于5萬每年樸素貝葉斯例題為了響應(yīng)共同富裕的主題,以幫助當(dāng)?shù)鼐用裉岣呤杖胨?,某地基層組織決定進(jìn)行人口普查,以便更好地了解當(dāng)?shù)鼐用竦氖杖肭闆r?,F(xiàn)有某地的人口普查收入數(shù)據(jù),數(shù)據(jù)描述如下。構(gòu)建運(yùn)輸車輛安全駕駛行為分析模型特征名稱特征說明例題分析構(gòu)建運(yùn)輸車輛安全駕駛行為分析模型導(dǎo)入庫讀取csv文件把特征集和標(biāo)簽集分開劃分訓(xùn)練集和測(cè)試集創(chuàng)建高斯樸素貝葉斯分類器訓(xùn)練模型預(yù)測(cè)測(cè)試集標(biāo)簽輸出用高斯樸素貝葉斯構(gòu)建人口普查收入分類模型主要由以下8個(gè)步驟實(shí)現(xiàn)。多項(xiàng)式分布樸素貝葉斯多項(xiàng)式分布樸素貝葉斯主要用于離散特征分類。使用sklearn庫中naive_bayes模塊的MultinomialNB類可以實(shí)現(xiàn)多項(xiàng)式分布樸素貝葉斯分類,其語法格式如下。MultinomialNB類常用的參數(shù)及其說明如下。構(gòu)建運(yùn)輸車輛安全駕駛行為分析模型參數(shù)名稱說明alpha接收float。表示添加拉普拉斯平滑參數(shù),可選項(xiàng)。默認(rèn)1.0fit_prior接收bool。表示是否學(xué)習(xí)先驗(yàn)概率,可選項(xiàng)。默認(rèn)Trueclass_prior接收floatarray。表示類先驗(yàn)概率。默認(rèn)為Nonesklearn.naive_bayes.MultinomialNB(alpha=1.0,fit_prior=True,class_prior=None)例題分析

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論