Python與機(jī)器學(xué)習(xí)(第2版)(微課版) 課件 項(xiàng)目04 性別與肥胖程度分類分析_第1頁(yè)
Python與機(jī)器學(xué)習(xí)(第2版)(微課版) 課件 項(xiàng)目04 性別與肥胖程度分類分析_第2頁(yè)
Python與機(jī)器學(xué)習(xí)(第2版)(微課版) 課件 項(xiàng)目04 性別與肥胖程度分類分析_第3頁(yè)
Python與機(jī)器學(xué)習(xí)(第2版)(微課版) 課件 項(xiàng)目04 性別與肥胖程度分類分析_第4頁(yè)
Python與機(jī)器學(xué)習(xí)(第2版)(微課版) 課件 項(xiàng)目04 性別與肥胖程度分類分析_第5頁(yè)
已閱讀5頁(yè),還剩84頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

項(xiàng)目背景|項(xiàng)目概述|學(xué)習(xí)目標(biāo)|任務(wù)實(shí)施步驟性別

分類分析【數(shù)據(jù)挖掘應(yīng)用】01101111011010111101010000101101010100111101背景先導(dǎo)項(xiàng)目概述項(xiàng)目學(xué)習(xí)目標(biāo)任務(wù)實(shí)施步驟01Background02BriefIntroduction03LearningObjectives04ImplementationSteps主要內(nèi)容性

別一個(gè)囊括了生物、社會(huì)、心理等學(xué)科的綜合概念生理性別:性別指基于人類的男性、女性等,動(dòng)物的雌、雄、雌雄同體等生物特征的解剖學(xué)上的身體差異社會(huì)性別:基于女性氣質(zhì)、男性氣質(zhì),或者非二元?dú)赓|(zhì)的性別角色劃分性別認(rèn)知0110111101101011110101111001001001011010101001001111010010110010111011010110100111101性別平等如何看待性別不平等、性別刻板印象和偏見(jiàn)帶來(lái)的負(fù)面影響以及如何建立基于性別平等的關(guān)系性別的社會(huì)屬性社會(huì)性別主要是指自身所在的生存環(huán)境對(duì)其性別的認(rèn)定,包括家人、朋友、周圍群體、社會(huì)機(jī)構(gòu)和法律機(jī)關(guān)的認(rèn)定等,是生物基本的社會(huì)屬性之一,主要體現(xiàn)在性別角色上,是一種文化構(gòu)成物,不僅因時(shí)間而異,而且因民族地域而異,是一種特定的社會(huì)構(gòu)成。性別不平等現(xiàn)象十分復(fù)雜,是滲透在社會(huì)文化生活的方方面面?!吨腥A人民共和國(guó)憲法》(2018修正)、《中華人民共和國(guó)民法典》(2020)、《中華人民共和國(guó)全國(guó)人民代表大會(huì)及地方各級(jí)人民代表大會(huì)選舉法》(2015修正)、《中華人民共和國(guó)婦女權(quán)益保障法》(2018修正)等都明確認(rèn)可了性別平等,禁止性別歧視。中國(guó)18-44歲男性平均身高為169.7厘米,體重為69.6公斤。男性

中國(guó)18-44歲女性平均身高為158厘米,體重為59公斤。女性中國(guó)性別數(shù)據(jù)性別上的生理差異項(xiàng)目總體要求

性別分類分析

本項(xiàng)目將基于“hw.csv”文件中的年齡、身高、體重和性別等數(shù)據(jù)做性別判定應(yīng)用,并進(jìn)一步完成肥胖程度分析。項(xiàng)目三維目標(biāo)掌握機(jī)器學(xué)習(xí)、監(jiān)督學(xué)習(xí)、分類的基本概念;

(阿里云大數(shù)據(jù)分析與應(yīng)用中級(jí)5.1.1、5.1.2)掌握邏輯回歸、樸素貝葉斯、決策樹(shù)、支持向量機(jī)等分類分析方法及相關(guān)參數(shù)的意義;

(大數(shù)據(jù)技術(shù)工程人員國(guó)家職業(yè)標(biāo)準(zhǔn)高級(jí)6.2.2)進(jìn)一步掌握數(shù)據(jù)分析與挖掘的流程,加深對(duì)模型建立與分析過(guò)程的理解;進(jìn)一步掌握數(shù)據(jù)分析與挖掘常用包的使用;掌握模型評(píng)估報(bào)告的生成方法并理解各具體指標(biāo)的含義。知識(shí)目標(biāo)能力目標(biāo)素質(zhì)目標(biāo)證崗項(xiàng)目三維目標(biāo)會(huì)使用sklearn中的算法LogisticRegression、GaussianNB、DecisionTreeClassifier、SVC等實(shí)現(xiàn)分類分析;

(阿里云大數(shù)據(jù)分析與應(yīng)用中級(jí)5.3.2)會(huì)調(diào)整分類模型的參數(shù)實(shí)現(xiàn)分類效果的優(yōu)化;

(大數(shù)據(jù)技術(shù)工程人員國(guó)家職業(yè)標(biāo)準(zhǔn)初級(jí)6.3.3)會(huì)使用散點(diǎn)圖、折線圖展現(xiàn)不同因素間的關(guān)系。知識(shí)目標(biāo)能力目標(biāo)素質(zhì)目標(biāo)崗證011011110110101111010111100100001011010101001111101項(xiàng)目三維目標(biāo)尊重兩性差異,結(jié)合“三觀”教育促進(jìn)學(xué)生自由、全面和諧發(fā)展;幫助兩性建立性別自信和完善人格,提供更寬廣的社會(huì)角色發(fā)展方向和職業(yè)規(guī)劃;引入行業(yè)名人事跡,通過(guò)榜樣力量激發(fā)科技報(bào)國(guó)之心。能力目標(biāo)素質(zhì)目標(biāo)知識(shí)目標(biāo)011011110110101111010111100100001011010101001111101性別分類分析任務(wù)流程數(shù)據(jù)獲取數(shù)據(jù)解析分類分析模型評(píng)估與應(yīng)用明確目標(biāo)基于采集的年齡、身高、體重和性別等數(shù)據(jù)做性別判定應(yīng)用,并進(jìn)一步完成肥胖程度分析。數(shù)據(jù)獲取數(shù)據(jù)解析分類分析模型評(píng)估與應(yīng)用明確目標(biāo)從本地文件hw.csv中讀取身高、體重等原始數(shù)據(jù)。性別分類分析任務(wù)流程數(shù)據(jù)獲取數(shù)據(jù)解析分類分析模型評(píng)估與應(yīng)用明確目標(biāo)1.標(biāo)簽映射:性別項(xiàng)F代表女,M代表男。為了分析數(shù)據(jù),需將兩者分別映射為1和0性別分類分析任務(wù)流程數(shù)據(jù)獲取數(shù)據(jù)解析分類分析模型評(píng)估與應(yīng)用明確目標(biāo)使用邏輯回歸實(shí)現(xiàn)性別分類使用樸素貝葉斯實(shí)現(xiàn)性別分類使用決策樹(shù)實(shí)現(xiàn)性別分類使用支持向量機(jī)實(shí)現(xiàn)性別分類使用支持向量機(jī)實(shí)現(xiàn)肥胖分類性別分類分析任務(wù)流程數(shù)據(jù)獲取數(shù)據(jù)解析分類分析模型評(píng)估與應(yīng)用明確目標(biāo)圖形化展示各模型的分類結(jié)果

評(píng)估不同算法的優(yōu)劣模型應(yīng)用性別分類分析任務(wù)流程還在等什么?馬上動(dòng)手實(shí)施性別分類分析項(xiàng)目吧~1.生理性別與社會(huì)性別2.經(jīng)典的機(jī)器學(xué)習(xí)分類算法3.性別分類流程小結(jié)邏輯回歸分類任務(wù)實(shí)施【數(shù)據(jù)挖掘應(yīng)用】課程性別分類分析會(huì)使用sklearn第三方包實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法應(yīng)用;會(huì)應(yīng)用邏輯回歸算法實(shí)現(xiàn)分類分析;會(huì)使用LogisticRegression()對(duì)性別進(jìn)行分類分析與預(yù)測(cè)應(yīng)用。能力目標(biāo)主要內(nèi)容任務(wù)工單引導(dǎo)問(wèn)題任務(wù)評(píng)價(jià)標(biāo)準(zhǔn)任務(wù)解決方案代碼解析使用邏輯回歸實(shí)現(xiàn)性別分類hw.csv教學(xué)難點(diǎn)任務(wù)工單項(xiàng)目中使用的hw.csv文件中的數(shù)據(jù),包含了性別、年齡、身高、體重等數(shù)據(jù)項(xiàng)。性別項(xiàng)的值為字符類型,其中F代表女,M代表男。為了分析數(shù)據(jù),我們需要將兩者分別映射為1和0,再進(jìn)行邏輯回歸分類。任務(wù)概述

任務(wù)描述:從本地文件(hw.csv)中獲取數(shù)據(jù)并邏輯回歸分類分析。010010011001101010100100110110100101110101000100001011011101001010101101010011010010數(shù)據(jù)源hw.csv顯示結(jié)果

任務(wù)要求任務(wù)概述(1)性別與人的哪些生理特征是密切相關(guān)的?(2)男和女的映射值會(huì)不會(huì)對(duì)訓(xùn)練結(jié)果造成影響?(3)邏輯回歸的原理是什么?主要應(yīng)用在哪些方面?(4)sklearn中是如何實(shí)現(xiàn)邏輯回歸算法的?寫(xiě)出關(guān)鍵函數(shù)與實(shí)現(xiàn)步驟。(5)模型的輸入與輸出分別是什么?”

問(wèn)題引導(dǎo):任務(wù)概述

任務(wù)評(píng)價(jià):任務(wù)概述評(píng)價(jià)內(nèi)容評(píng)價(jià)要點(diǎn)分值分?jǐn)?shù)評(píng)定自我評(píng)價(jià)1.任務(wù)實(shí)施數(shù)據(jù)準(zhǔn)備2分?jǐn)?shù)據(jù)正確讀取得1分,數(shù)據(jù)標(biāo)簽映射正確得1分

模型訓(xùn)練2分模型初始化正確得1分,模型訓(xùn)練順利執(zhí)行得1分

模型預(yù)測(cè)2分模型能應(yīng)用得1分,模型預(yù)測(cè)結(jié)果可展現(xiàn)得1分

2.效果評(píng)估模型可視化并評(píng)估效果3分能正確展現(xiàn)模型得2分,模型準(zhǔn)確率90%以上得1分

3.任務(wù)總結(jié)依據(jù)任務(wù)實(shí)施情況總結(jié)結(jié)論1分總結(jié)內(nèi)容切中本任務(wù)的重點(diǎn)要點(diǎn)得1分

合計(jì)10分

任務(wù)解決方案一、數(shù)據(jù)讀取#coding:utf-8importpandasaspddf=pd.read_csv('hw.csv',delimiter=',')df.head()任務(wù)解決方案二、數(shù)據(jù)預(yù)處理fromsklearnimportpreprocessing#類型轉(zhuǎn)換df['Weight']=df['Weight'].astype(float)df['Height']=df['Height'].astype(float)#對(duì)性別進(jìn)行數(shù)值化處理le=preprocessing.LabelEncoder()df['Gender_2']=le.fit_transform(df['Gender'])df.head()任務(wù)解決方案三、數(shù)據(jù)可視化分析importmatplotlib.pyplotaspltX=df[['Height','Weight']]Y=df[['Gender_2']]plt.figure()plt.scatter(

df[['Height']],df[['Weight']],c=Y,s=80,edgecolors='black',linewidths=1,

cmap=plt.cm.Paired)plt.title('性別判定(實(shí)際值)')plt.xlabel('身高/厘米')plt.ylabel('體重/千克')plt.show()任務(wù)解決方案四、模型訓(xùn)練fromsklearnimportlinear_model#初始化回歸模型classifier=linear_model.LogisticRegression(solver='liblinear',C=100)#擬合classifier.fit(X,Y.values.ravel())#給出預(yù)測(cè)結(jié)果output=classifier.predict(X)output=output.reshape(len(output),1)任務(wù)解決方案五、模型應(yīng)用結(jié)果展現(xiàn)plt.figure()plt.scatter(

df[['Height']],df[['Weight']],c=output,s=80,edgecolors='black',

linewidths=1,cmap=plt.cm.Paired)plt.title('性別判定(線性分類器,預(yù)測(cè)值)')plt.xlabel('身高')plt.ylabel('體重')plt.show()任務(wù)解決方案五、模型應(yīng)用結(jié)果展現(xiàn):進(jìn)階x_min,x_max=df[['Height']].values.min()-1.0,df[['Height']].values.max()+1.0y_min,y_max=df[['Weight']].values.min()-1.0,df[['Weight']].values.max()+1.0step_size=0.2x_values,y_values=np.meshgrid(np.arange(x_min,x_max,step_size),np.arange(y_min,y_max,step_size))mesh_output=classifier.predict(np.c_[x_values.ravel(),y_values.ravel()])mesh_output=mesh_output.reshape(x_values.shape)plt.pcolormesh(x_values,y_values,mesh_output,cmap=plt.cm.gray)plt.scatter(df[['Height']],df[['Weight']],c=Y,s=80,edgecolors='black',linewidths=1,cmap=plt.cm.Paired)小結(jié)1.如何使用sklearn第三方包實(shí)現(xiàn)分類分析?2.

如何調(diào)用LogisticRegression()實(shí)現(xiàn)性別分類分析?3.

如何對(duì)模型分類結(jié)果進(jìn)行可視化?不急后續(xù)會(huì)有詳細(xì)說(shuō)明與講解哦~樸素貝葉斯分類分析任務(wù)實(shí)施【數(shù)據(jù)挖掘應(yīng)用】課程性別分類分析熟練使用sklearn第三方包實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法應(yīng)用;會(huì)應(yīng)用樸素貝葉斯算法實(shí)現(xiàn)分類分析;會(huì)使用MultinomialNB()對(duì)性別進(jìn)行分類分析與預(yù)測(cè)應(yīng)用。能力目標(biāo)主要內(nèi)容任務(wù)工單引導(dǎo)問(wèn)題任務(wù)評(píng)價(jià)標(biāo)準(zhǔn)任務(wù)解決方案代碼解析使用樸素貝葉斯實(shí)現(xiàn)性別分類hw.csv教學(xué)難點(diǎn)任務(wù)工單樸素貝葉斯基于條件概率的思想,用來(lái)做分類決策?,F(xiàn)可基于前續(xù)任務(wù)(邏輯回歸)得到數(shù)據(jù),使用樸素貝葉斯實(shí)現(xiàn)性別判定,并區(qū)分兩個(gè)算法的異同。任務(wù)概述

任務(wù)描述:基于身高、體重?cái)?shù)據(jù)使用樸素貝葉斯實(shí)現(xiàn)分類分析。010010011001101010100100110110100101110101000100001011011101001010101101010011010010數(shù)據(jù)源hw.csv顯示結(jié)果

任務(wù)要求任務(wù)概述(1)樸素貝葉斯可以用來(lái)做性別判定嗎?試結(jié)合該應(yīng)用說(shuō)明其中的原理。(2)樸素貝葉斯在sklearn中是如何實(shí)現(xiàn)的?具體有哪些實(shí)現(xiàn)的類?(3)試比較不同樸素貝葉斯實(shí)現(xiàn)的異同?說(shuō)明GaussianNB()的適用范圍。(4)假設(shè)我們所使用的身高和體重?cái)?shù)據(jù)是不精確的,范圍小、刻度大?用哪種方法更合適?(5)如何比較兩種不同分類模型的優(yōu)劣?”

問(wèn)題引導(dǎo):任務(wù)概述

任務(wù)評(píng)價(jià):任務(wù)概述評(píng)價(jià)內(nèi)容評(píng)價(jià)要點(diǎn)分值分?jǐn)?shù)評(píng)定自我評(píng)價(jià)1.任務(wù)實(shí)施模型初始化3分包導(dǎo)入正確得1分,模型選用正確得1分,模型構(gòu)建正確得1分

模型訓(xùn)練1分模型訓(xùn)練順利執(zhí)行得1分

模型預(yù)測(cè)1分歷史數(shù)據(jù)及預(yù)測(cè)結(jié)果展現(xiàn)得1分

2.效果評(píng)估模型可視化并評(píng)估效果3分能正確展現(xiàn)模型得2分,模型準(zhǔn)確率90%以上得1分

3.任務(wù)總結(jié)依據(jù)任務(wù)實(shí)施情況總結(jié)結(jié)論2分總結(jié)內(nèi)容切中本任務(wù)的重點(diǎn)要點(diǎn)得1分,能有效比較方法異同得1分

合計(jì)10分

任務(wù)解決方案核心部分代碼:方案(1)fromsklearn.naive_bayesimportGaussianNB#建立樸素貝葉斯模型classifier=GaussianNB()#擬合classifier.fit(X,Y.values.ravel())#給出待預(yù)測(cè)的一個(gè)特征output=classifier.predict(X)output=output.reshape(len(output),1)任務(wù)解決方案核心部分代碼:方案(2)fromsklearn.naive_bayesimportMultinomialNB#建立模型

classifier=MultinomialNB()

#擬合

classifier.fit(X,Y.values.ravel())

#給出待預(yù)測(cè)的一個(gè)特征

output=classifier.predict(X)

output=output.reshape(len(output),1)小結(jié)1.如何使用sklearn第三方包實(shí)現(xiàn)分類分析?2.

如何調(diào)用GaussianNB()實(shí)現(xiàn)性別分類分析?3.

如何對(duì)模型分類結(jié)果進(jìn)行可視化?不急后續(xù)會(huì)有詳細(xì)說(shuō)明與講解哦~決策樹(shù)分類分析任務(wù)實(shí)施【數(shù)據(jù)挖掘應(yīng)用】課程性別分類分析熟練使用sklearn第三方包實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法應(yīng)用;會(huì)應(yīng)用決策樹(shù)算法實(shí)現(xiàn)分類分析;會(huì)使用DecisionTreeClassifier()對(duì)性別進(jìn)行分類分析與預(yù)測(cè)應(yīng)用。能力目標(biāo)主要內(nèi)容任務(wù)工單引導(dǎo)問(wèn)題任務(wù)評(píng)價(jià)標(biāo)準(zhǔn)任務(wù)解決方案代碼解析使用決策樹(shù)實(shí)現(xiàn)性別分類hw.csv教學(xué)難點(diǎn)任務(wù)工單決策樹(shù)能夠從一系列有特征有標(biāo)簽的數(shù)據(jù)中總結(jié)出決策規(guī)則,并用樹(shù)狀圖的結(jié)構(gòu)來(lái)呈現(xiàn)這些規(guī)則,以解決分類和回歸問(wèn)題。現(xiàn)基于前續(xù)任務(wù)得到數(shù)據(jù),使用決策樹(shù)算法實(shí)現(xiàn)性別判定,并區(qū)分三個(gè)算法的異同。任務(wù)概述

任務(wù)描述:基于身高、體重?cái)?shù)據(jù)使用決策樹(shù)實(shí)現(xiàn)分類分析。010010011001101010100100110110100101110101000100001011011101001010101101010011010010數(shù)據(jù)源hw.csv及前續(xù)結(jié)果顯示結(jié)果

任務(wù)要求任務(wù)概述(1)決策樹(shù)如何用來(lái)做性別判定?結(jié)合其中原理,試畫(huà)一種簡(jiǎn)單的決策樹(shù)結(jié)構(gòu)。(2)決策樹(shù)在sklearn中是如何實(shí)現(xiàn)分類的?與決策樹(shù)有關(guān)的模塊有哪些?(3)試比較不同決策樹(shù)實(shí)現(xiàn)方法的異同?說(shuō)明DecisionTreeClassifier的適用范圍。(4)DecisionTreeRegressor有何用處?可以解決什么問(wèn)題?(5)比較決策樹(shù)分類算法與前述兩種不同分類方法的優(yōu)劣,其優(yōu)勢(shì)體現(xiàn)在哪里?”

問(wèn)題引導(dǎo):任務(wù)概述

任務(wù)評(píng)價(jià):任務(wù)概述評(píng)價(jià)內(nèi)容評(píng)價(jià)要點(diǎn)分值分?jǐn)?shù)評(píng)定自我評(píng)價(jià)1.任務(wù)實(shí)施模型初始化3分導(dǎo)入正確得1分,模型選用正確得1分,模型構(gòu)建正確得1分

模型訓(xùn)練2分?jǐn)?shù)據(jù)有切分訓(xùn)練得1分模型訓(xùn)練順利執(zhí)行得1分

模型可視化1分模型可視化實(shí)現(xiàn)得1分

2.效果評(píng)估模型評(píng)估報(bào)告展現(xiàn)3分會(huì)得出模型評(píng)估報(bào)告得1分,能準(zhǔn)確解釋各個(gè)指標(biāo)的含義得1分,模型準(zhǔn)確率90%以上得1分

3.任務(wù)總結(jié)依據(jù)任務(wù)實(shí)施情況總結(jié)結(jié)論1分總結(jié)內(nèi)容切中本任務(wù)的重點(diǎn)要點(diǎn)得1分,能有效比較三種方法的異同得1分

合計(jì)10分

任務(wù)解決方案核心部分代碼:模型訓(xùn)練

fromsklearn.treeimportDecisionTreeClassifier#建立決策樹(shù)模型classifier=DecisionTreeClassifier()#數(shù)據(jù)訓(xùn)練classifier.fit(X,Y.values.ravel())任務(wù)解決方案核心部分代碼:模型評(píng)估fromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportclassification_report#切分?jǐn)?shù)據(jù)集x_train,x_test,y_train,y_test=train_test_split(X,Y,train_size=0.7,test_size=0.3)classifier=DecisionTreeClassifier()classifier.fit(x_train,y_train.values.ravel())y_predict=classifier.predict(x_test)print(classification_report(y_predict,y_test))小結(jié)1.如何使用sklearn第三方包實(shí)現(xiàn)分類分析?2.

如何調(diào)用DecisionTreeClassifier()實(shí)現(xiàn)性別分類分析?3.

如何對(duì)不同模型分類結(jié)果進(jìn)行評(píng)估?不急后續(xù)會(huì)有詳細(xì)說(shuō)明與講解哦~支持向量機(jī)分類分析任務(wù)實(shí)施【數(shù)據(jù)挖掘應(yīng)用】課程性別分類分析熟練使用sklearn第三方包實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法應(yīng)用;會(huì)應(yīng)用支持向量機(jī)算法實(shí)現(xiàn)分類分析;會(huì)使用SVC()對(duì)性別進(jìn)行分類分析與預(yù)測(cè)應(yīng)用。能力目標(biāo)主要內(nèi)容任務(wù)工單引導(dǎo)問(wèn)題任務(wù)評(píng)價(jià)標(biāo)準(zhǔn)任務(wù)解決方案代碼解析使用支持向量機(jī)實(shí)現(xiàn)性別分類hw.csv教學(xué)難點(diǎn)任務(wù)工單支持向量機(jī)是一類按監(jiān)督學(xué)習(xí)方式對(duì)數(shù)據(jù)進(jìn)行二元分類的廣義線性分類器,其決策邊界是對(duì)學(xué)習(xí)樣本求解的最大邊距超平面。現(xiàn)基于任務(wù)前續(xù)任務(wù)得到數(shù)據(jù)及分類結(jié)果,使用支持向量機(jī)算法實(shí)現(xiàn)性別判定,并區(qū)分四個(gè)算法的異同。任務(wù)概述

任務(wù)描述:基于身高、體重?cái)?shù)據(jù)使用支持向量機(jī)實(shí)現(xiàn)分類分析。010010011001101010100100110110100101110101000100001011011101001010101101010011010010數(shù)據(jù)源hw.csv及前續(xù)結(jié)果顯示結(jié)果

任務(wù)要求任務(wù)概述(1)支持向量機(jī)如何用來(lái)做性別判定?結(jié)合應(yīng)用,說(shuō)明其中的原理。(2)支持向量機(jī)在sklearn中是如何實(shí)現(xiàn)分類的?與支持向量機(jī)有關(guān)的模塊有哪些?(3)試比較不同支持向量機(jī)實(shí)現(xiàn)方法的異同?說(shuō)明SVC與SVR的不同。(4)SVR有何用處?可以解決什么問(wèn)題?(5)比較支持向量機(jī)分類算法與前述三種不同分類方法的優(yōu)劣,其優(yōu)勢(shì)體現(xiàn)在哪里?”

問(wèn)題引導(dǎo):任務(wù)概述

任務(wù)評(píng)價(jià):任務(wù)概述評(píng)價(jià)內(nèi)容評(píng)價(jià)要點(diǎn)分值分?jǐn)?shù)評(píng)定自我評(píng)價(jià)1.任務(wù)實(shí)施模型初始化4分導(dǎo)入正確得1分,模型選用正確得1分,模型構(gòu)建正確得1分,模型參數(shù)會(huì)修改得1分

模型訓(xùn)練1分模型型訓(xùn)練順利執(zhí)行得1分

模型可視化1分模型可視化實(shí)現(xiàn)得1分

2.效果評(píng)估模型評(píng)估報(bào)告展現(xiàn)2分能準(zhǔn)確解釋各個(gè)指標(biāo)的含義得1分,模型準(zhǔn)確率90%以上得1分

3.任務(wù)總結(jié)依據(jù)任務(wù)實(shí)施情況總結(jié)結(jié)論2分總結(jié)內(nèi)容切中本任務(wù)的重點(diǎn)要點(diǎn)得1分,能有效比較四種方法的異同得1分

合計(jì)10分

任務(wù)解決方案核心部分代碼:模型訓(xùn)練

fromsklearn.svmimportSVC#建立支持向量機(jī)線性分類器模型params={'kernel':'linear'}classifier=SVC(**params)#擬合X=df[['Height','Weight']]Y=df[['Gender']]classifier.fit(X,Y)任務(wù)解決方案核心部分代碼:模型評(píng)估#評(píng)估報(bào)告fromsklearn.metricsimportclassification_reportprint("\n"+"#"*30)print("\nClassifierperformanceontrainingdataset\n")print(classification_report(Y,classifier.predict(X)))print("#"*30+"\n")小結(jié)1.如何使用sklearn第三方包實(shí)現(xiàn)分類分析?2.

如何調(diào)用SVC()實(shí)現(xiàn)性別分類分析?3.

如何對(duì)不同分類模型進(jìn)行評(píng)估?不急后續(xù)會(huì)有詳細(xì)說(shuō)明與講解哦~支持向量機(jī)多分類分析任務(wù)實(shí)施【數(shù)據(jù)挖掘應(yīng)用】課程性別分類分析>>肥胖程度分類分析熟練使用sklearn第三方包實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法應(yīng)用;會(huì)使用支持向量機(jī)算法實(shí)現(xiàn)多分類分析;會(huì)使用SVC()對(duì)肥胖程度進(jìn)行分類分析與預(yù)測(cè)應(yīng)用。能力目標(biāo)主要內(nèi)容任務(wù)工單引導(dǎo)問(wèn)題任務(wù)評(píng)價(jià)標(biāo)準(zhǔn)任務(wù)解決方案代碼解析使用支持向量機(jī)肥胖分類分析教學(xué)難點(diǎn)肥胖不僅影響身材,還對(duì)身體健康有害,易誘發(fā)高血壓、高血脂、糖尿病、代謝綜合征及心腦血管等疾病。肥胖主要和身高、體重?cái)?shù)據(jù)有關(guān)?,F(xiàn)基于hw3.csv中的數(shù)據(jù),使用支持向量機(jī)算法實(shí)現(xiàn)肥胖程度的判定。任務(wù)概述

任務(wù)描述:基于身高與體重等數(shù)據(jù),使用支持向量機(jī)對(duì)不同人的肥胖程度進(jìn)行分類(4類)。010010011001101010100100110110100101110101000100001011011101001010101101010011010010hw3.csv任務(wù)工單數(shù)據(jù)源hw3.csv顯示結(jié)果

任務(wù)要求任務(wù)概述(1)支持向量機(jī)如何用來(lái)做多分類應(yīng)用?結(jié)合應(yīng)用,說(shuō)明其中的原理。(2)支持向量機(jī)在sklearn中是如何實(shí)現(xiàn)線性不可分的應(yīng)用?(3)試比較不同核函數(shù)的用途?多項(xiàng)式核函數(shù)主要應(yīng)用在什么情況?(4)本應(yīng)用問(wèn)題中,用哪一種核函數(shù)得到更多的準(zhǔn)確率?(5)樣本數(shù)據(jù)量對(duì)算法有何影響?本應(yīng)用中的樣本數(shù)據(jù)存在什么樣的問(wèn)題?”

問(wèn)題引導(dǎo):任務(wù)概述

任務(wù)評(píng)價(jià):任務(wù)概述評(píng)價(jià)內(nèi)容評(píng)價(jià)要點(diǎn)分值分?jǐn)?shù)評(píng)定自我評(píng)價(jià)1.任務(wù)實(shí)施數(shù)據(jù)準(zhǔn)備2分?jǐn)?shù)據(jù)正確讀取得1分,數(shù)據(jù)標(biāo)簽映射正確得1分

模型訓(xùn)練3分?jǐn)?shù)據(jù)集有切分得1分,模型核函數(shù)有設(shè)置得1分,模型訓(xùn)練順利執(zhí)行得1分

模型預(yù)測(cè)1分模型可應(yīng)用于預(yù)測(cè)得1分

2.效果評(píng)估模型可視化并評(píng)估效果3分能正確展現(xiàn)模型得1分,展示模型評(píng)估報(bào)告得1分,模型準(zhǔn)確率90%以上得1分

3.任務(wù)總結(jié)依據(jù)任務(wù)實(shí)施情況總結(jié)結(jié)論1分總結(jié)內(nèi)容切中本任務(wù)的重點(diǎn)要點(diǎn)得1分

合計(jì)10分

任務(wù)解決方案一、數(shù)據(jù)讀取#coding:utf-8importpandasaspddf=pd.read_csv('hw3.csv',delimiter=',')df.head()任務(wù)解決方案二、數(shù)據(jù)預(yù)處理fromsklearnimportpreprocessing#類型轉(zhuǎn)換df['Weight']=df['Weight'].astype(float)df['Height']=df['Height'].astype(float)#對(duì)肥胖程度的判定結(jié)果進(jìn)行數(shù)值化處理le=preprocessing.LabelEncoder()df['Class_2']=le.fit_transform(df['Class'])df.head()任務(wù)解決方案三、數(shù)據(jù)集切分與模型訓(xùn)練X=df[['Height','Weight']]Y=df[['Class_2']]x_train,x_test,y_train,y_test=train_test_split(X,Y,train_size=0.7,test_size=0.3)#建立支持向量機(jī)分類器模型params={'kernel':'linear'}classifier=SVC(**params)classifier.fit(x_train,y_train.values.ravel())任務(wù)解決方案四、模型評(píng)估#評(píng)估報(bào)告fromsklearn.metricsimportclassification_reportprint(classification_report(y_test,classifier.predict(x_test)))任務(wù)解決方案五、參數(shù)調(diào)整與優(yōu)化#

采用多項(xiàng)式核函數(shù)params={'kernel':'poly','degree':3}classifier=SVC(**params)classifier.fit(x_train,y_train.values.ravel())小結(jié)1.如何使用sklearn第三方包實(shí)現(xiàn)分類分析?2.

如何調(diào)用SVC()實(shí)現(xiàn)肥胖程度分類分析?3.

如何設(shè)置核函數(shù)并對(duì)不同模型分類結(jié)果進(jìn)行評(píng)估?不急后續(xù)會(huì)有詳細(xì)說(shuō)明與講解哦~項(xiàng)目背景|項(xiàng)目概述|學(xué)習(xí)目標(biāo)|任務(wù)實(shí)施步驟拓展實(shí)訓(xùn)利用身高、體重、性別數(shù)據(jù)實(shí)現(xiàn)肥胖判定【數(shù)據(jù)挖掘應(yīng)用】01101111011010111101010000101101010100111101

熟練使用read_csv()從本地CSV文件讀取數(shù)據(jù);

熟練使用Sklearn的preprocessing對(duì)數(shù)據(jù)進(jìn)行預(yù)處理;

熟練使用Sklearn分類算法對(duì)數(shù)據(jù)進(jìn)行分類分析與預(yù)測(cè);技能學(xué)習(xí)目標(biāo)熟練使用Matplotlib工具包展現(xiàn)分類分析結(jié)果。項(xiàng)目總體要求原始數(shù)據(jù)肥胖分類分析一、數(shù)據(jù)獲取#coding:utf-8importpandasaspddf=pd.read_csv('hws31.csv',delimiter=',')df.head()二、數(shù)據(jù)預(yù)處理歸一化處理數(shù)值化處理數(shù)據(jù)集切分三、模型訓(xùn)練邏輯回歸樸素貝葉斯決策樹(shù)支持向量機(jī)四、模型評(píng)估#模型評(píng)估報(bào)告

fromsklearn.metricsimportclassification_report

print(clas

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論