




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
機(jī)器學(xué)習(xí)實(shí)戰(zhàn)課件-Python實(shí)現(xiàn)CATALOGUE目錄機(jī)器學(xué)習(xí)概述Python語(yǔ)言基礎(chǔ)機(jī)器學(xué)習(xí)常用算法數(shù)據(jù)預(yù)處理與特征工程模型評(píng)估與優(yōu)化實(shí)戰(zhàn)案例:Python實(shí)現(xiàn)機(jī)器學(xué)習(xí)項(xiàng)目機(jī)器學(xué)習(xí)概述0103機(jī)器學(xué)習(xí)的核心是“學(xué)習(xí)”,即通過(guò)對(duì)知識(shí)庫(kù)的不斷學(xué)習(xí)和更新,提高模型的性能和準(zhǔn)確性。01機(jī)器學(xué)習(xí)是一種通過(guò)訓(xùn)練數(shù)據(jù)自動(dòng)發(fā)現(xiàn)規(guī)律,并應(yīng)用于新數(shù)據(jù)的算法和模型。02機(jī)器學(xué)習(xí)是人工智能的一個(gè)分支,旨在讓計(jì)算機(jī)具有類(lèi)似于人類(lèi)的學(xué)習(xí)能力。機(jī)器學(xué)習(xí)的定義監(jiān)督學(xué)習(xí)無(wú)監(jiān)督學(xué)習(xí)半監(jiān)督學(xué)習(xí)強(qiáng)化學(xué)習(xí)機(jī)器學(xué)習(xí)的分類(lèi)通過(guò)已知輸入和輸出數(shù)據(jù)進(jìn)行訓(xùn)練,以預(yù)測(cè)新數(shù)據(jù)的輸出。結(jié)合監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)的優(yōu)點(diǎn),利用部分有標(biāo)簽數(shù)據(jù)和大量無(wú)標(biāo)簽數(shù)據(jù)進(jìn)行訓(xùn)練。通過(guò)對(duì)無(wú)標(biāo)簽數(shù)據(jù)進(jìn)行學(xué)習(xí),發(fā)現(xiàn)數(shù)據(jù)中的內(nèi)在結(jié)構(gòu)和規(guī)律。通過(guò)智能體與環(huán)境進(jìn)行交互,并根據(jù)環(huán)境反饋調(diào)整行為策略,以達(dá)到最優(yōu)目標(biāo)。感知機(jī)算法的提出,奠定了機(jī)器學(xué)習(xí)的基礎(chǔ)。1950年代決策樹(shù)、K近鄰等算法的涌現(xiàn),推動(dòng)了機(jī)器學(xué)習(xí)的快速發(fā)展。1980年代支持向量機(jī)(SVM)的提出,在分類(lèi)和回歸問(wèn)題上取得了顯著成果。1990年代深度學(xué)習(xí)技術(shù)的崛起,以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的模型在圖像、語(yǔ)音、自然語(yǔ)言處理等領(lǐng)域取得了突破性進(jìn)展。2000年代至今機(jī)器學(xué)習(xí)的發(fā)展歷程Python語(yǔ)言基礎(chǔ)02Python是一種解釋型、面向?qū)ο蟆?dòng)態(tài)數(shù)據(jù)類(lèi)型的高級(jí)程序設(shè)計(jì)語(yǔ)言。Python語(yǔ)法簡(jiǎn)潔清晰,易讀性強(qiáng),讓開(kāi)發(fā)者可以用更少的代碼表達(dá)想法。Python擁有豐富和強(qiáng)大的庫(kù),常被昵稱(chēng)為“膠水語(yǔ)言”,能夠把用其他語(yǔ)言制作的各種模塊(尤其是C/C)很輕松地聯(lián)結(jié)在一起。Python語(yǔ)言簡(jiǎn)介Python數(shù)據(jù)類(lèi)型與運(yùn)算符01Python中的基本數(shù)據(jù)類(lèi)型包括:數(shù)字(整數(shù)、浮點(diǎn)數(shù))、字符串、布爾值等。02Python支持多種運(yùn)算符,如算術(shù)運(yùn)算符、比較運(yùn)算符、邏輯運(yùn)算符等。Python中的變量不需要聲明,可以直接賦值,且變量類(lèi)型可以隨時(shí)改變。03010203Python中的控制流語(yǔ)句包括條件語(yǔ)句(if-elif-else)、循環(huán)語(yǔ)句(for、while)等。通過(guò)控制流語(yǔ)句,可以實(shí)現(xiàn)程序的分支和循環(huán)邏輯,控制程序的執(zhí)行流程。Python中的縮進(jìn)非常重要,用于表示代碼塊的層次結(jié)構(gòu)。Python控制流語(yǔ)句123Python中可以使用def關(guān)鍵字定義函數(shù),實(shí)現(xiàn)代碼的重用和模塊化。函數(shù)可以接收參數(shù),并返回結(jié)果,使得代碼更加靈活和可維護(hù)。Python中的模塊是一個(gè)包含Python定義和語(yǔ)句的文件,通過(guò)導(dǎo)入模塊可以使用模塊中定義的函數(shù)、類(lèi)和變量等。Python函數(shù)與模塊機(jī)器學(xué)習(xí)常用算法03通過(guò)最小化預(yù)測(cè)值與真實(shí)值之間的均方誤差,求解最優(yōu)的模型參數(shù)。原理數(shù)據(jù)預(yù)處理、構(gòu)建模型、訓(xùn)練模型、評(píng)估模型。實(shí)現(xiàn)步驟簡(jiǎn)單易懂,計(jì)算量小,可解釋性強(qiáng)。優(yōu)點(diǎn)對(duì)非線性關(guān)系建模效果較差,對(duì)異常值和離群點(diǎn)敏感。缺點(diǎn)線性回歸算法通過(guò)sigmoid函數(shù)將線性回歸的預(yù)測(cè)值映射到[0,1]區(qū)間,表示樣本屬于正類(lèi)的概率。原理實(shí)現(xiàn)步驟優(yōu)點(diǎn)缺點(diǎn)數(shù)據(jù)預(yù)處理、構(gòu)建模型、訓(xùn)練模型、評(píng)估模型。適用于二分類(lèi)問(wèn)題,計(jì)算量相對(duì)較小,可解釋性強(qiáng)。對(duì)多分類(lèi)問(wèn)題處理不佳,容易欠擬合,對(duì)特征相關(guān)性敏感。邏輯回歸算法原理通過(guò)遞歸地選擇最優(yōu)特征進(jìn)行劃分,構(gòu)建一棵樹(shù)狀結(jié)構(gòu)的分類(lèi)器。實(shí)現(xiàn)步驟特征選擇、決策樹(shù)生成、決策樹(shù)剪枝。優(yōu)點(diǎn)易于理解和解釋?zhuān)軌蛱幚矸蔷€性關(guān)系,對(duì)特征缺失不敏感。缺點(diǎn)容易過(guò)擬合,對(duì)連續(xù)特征處理不佳,對(duì)樣本不均衡問(wèn)題敏感。決策樹(shù)算法1原理通過(guò)集成學(xué)習(xí)的思想,構(gòu)建多個(gè)決策樹(shù)并結(jié)合它們的預(yù)測(cè)結(jié)果進(jìn)行分類(lèi)或回歸。實(shí)現(xiàn)步驟構(gòu)建決策樹(shù)、隨機(jī)選擇特征、結(jié)合多個(gè)決策樹(shù)的預(yù)測(cè)結(jié)果。優(yōu)點(diǎn)具有較高的預(yù)測(cè)精度和穩(wěn)定性,能夠處理高維特征和大量數(shù)據(jù)。缺點(diǎn)計(jì)算量較大,對(duì)噪聲和異常值較為敏感。隨機(jī)森林算法原理數(shù)據(jù)預(yù)處理、選擇核函數(shù)、訓(xùn)練模型、評(píng)估模型。實(shí)現(xiàn)步驟優(yōu)點(diǎn)缺點(diǎn)01020403對(duì)大規(guī)模數(shù)據(jù)集訓(xùn)練時(shí)間較長(zhǎng),對(duì)參數(shù)和核函數(shù)選擇敏感。通過(guò)尋找一個(gè)超平面使得正負(fù)樣本間隔最大化進(jìn)行分類(lèi)。適用于高維特征和非線性關(guān)系建模,具有較好的泛化能力。支持向量機(jī)算法數(shù)據(jù)預(yù)處理與特征工程04缺失值處理刪除、填充(均值、中位數(shù)、眾數(shù)、插值等)異常值處理刪除、替換、分箱等數(shù)據(jù)類(lèi)型轉(zhuǎn)換連續(xù)型數(shù)據(jù)離散化、類(lèi)別型數(shù)據(jù)編碼(獨(dú)熱編碼、標(biāo)簽編碼等)文本數(shù)據(jù)清洗去除停用詞、詞干提取、詞性還原等數(shù)據(jù)清洗與轉(zhuǎn)換過(guò)濾法(卡方檢驗(yàn)、互信息法等)、嵌入法(L1正則化、隨機(jī)森林等)、包裝法(遞歸特征消除等)特征選擇方法主成分分析(PCA)、線性判別分析(LDA)、局部線性嵌入(LLE)等降維方法基于模型的特征重要性排序、PermutationImportance等特征重要性評(píng)估特征選擇與降維特征提取文本特征提?。═F-IDF、Word2Vec等)、圖像特征提?。–NN、SIFT等)自動(dòng)特征構(gòu)造使用遺傳算法、模擬退火等優(yōu)化算法自動(dòng)搜索和構(gòu)造有效特征特征構(gòu)造基于領(lǐng)域知識(shí)構(gòu)造新特征、特征交叉與組合等特征構(gòu)造與提取將數(shù)據(jù)轉(zhuǎn)換為均值為0,標(biāo)準(zhǔn)差為1的分布,常用方法如Z-Score標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化通過(guò)對(duì)數(shù)函數(shù)進(jìn)行數(shù)據(jù)變換,以穩(wěn)定方差或使數(shù)據(jù)更接近正態(tài)分布對(duì)數(shù)變換將數(shù)據(jù)縮放到[0,1]或[-1,1]的范圍內(nèi),常用方法如Min-Max歸一化歸一化通過(guò)參數(shù)化的方法實(shí)現(xiàn)數(shù)據(jù)分布的變換,使得變換后的數(shù)據(jù)更接近正態(tài)分布Box-Cox變換01030204數(shù)據(jù)標(biāo)準(zhǔn)化與歸一化模型評(píng)估與優(yōu)化050102準(zhǔn)確率(Accurac…分類(lèi)問(wèn)題中最常用的評(píng)估指標(biāo),表示模型預(yù)測(cè)正確的樣本占總樣本的比例。精確率(Precisi…針對(duì)某一類(lèi)別,模型預(yù)測(cè)為正且實(shí)際為正的樣本占模型預(yù)測(cè)為正的樣本的比例。召回率(Recall)針對(duì)某一類(lèi)別,模型預(yù)測(cè)為正且實(shí)際為正的樣本占實(shí)際為正的樣本的比例。F1值(F1Scor…精確率和召回率的調(diào)和平均值,用于綜合評(píng)估模型的性能。AUC(AreaUn…ROC曲線下的面積,用于評(píng)估模型在不同閾值下的性能表現(xiàn)。030405模型評(píng)估指標(biāo)留出法(Hold-out)將數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集,用訓(xùn)練集訓(xùn)練模型,用測(cè)試集評(píng)估模型性能。交叉驗(yàn)證(CrossValidation)將數(shù)據(jù)集劃分為k個(gè)子集,每次使用k-1個(gè)子集作為訓(xùn)練集,剩余的一個(gè)子集作為測(cè)試集,重復(fù)k次取平均值作為評(píng)估結(jié)果。自助法(Bootstrapping)通過(guò)有放回抽樣生成多個(gè)訓(xùn)練集和測(cè)試集,分別用于訓(xùn)練模型和評(píng)估模型性能。模型選擇策略超參數(shù)調(diào)整與優(yōu)化利用貝葉斯定理和先驗(yàn)知識(shí)來(lái)指導(dǎo)超參數(shù)的搜索過(guò)程,提高搜索效率。貝葉斯優(yōu)化(BayesianOptimizatio…通過(guò)遍歷所有可能的超參數(shù)組合來(lái)尋找最優(yōu)的超參數(shù)配置。網(wǎng)格搜索(GridSearch)在超參數(shù)空間中隨機(jī)采樣一定數(shù)量的點(diǎn)進(jìn)行評(píng)估,以尋找較優(yōu)的超參數(shù)配置。隨機(jī)搜索(RandomSearch)Bagging通過(guò)自助采樣生成多個(gè)基模型,然后將它們的預(yù)測(cè)結(jié)果進(jìn)行平均或投票來(lái)得到最終的預(yù)測(cè)結(jié)果。Boosting通過(guò)迭代地訓(xùn)練基模型,每次根據(jù)前一個(gè)基模型的錯(cuò)誤率來(lái)調(diào)整樣本權(quán)重,使得后續(xù)基模型能夠更關(guān)注于之前錯(cuò)誤分類(lèi)的樣本。Stacking將多個(gè)基模型的預(yù)測(cè)結(jié)果作為輸入特征,再訓(xùn)練一個(gè)元模型來(lái)進(jìn)行最終的預(yù)測(cè)。模型融合與集成學(xué)習(xí)實(shí)戰(zhàn)案例:Python實(shí)現(xiàn)機(jī)器學(xué)習(xí)項(xiàng)目06模型評(píng)估使用均方誤差等指標(biāo)評(píng)估模型的預(yù)測(cè)性能。模型訓(xùn)練使用線性回歸、決策樹(shù)回歸等模型進(jìn)行訓(xùn)練。特征選擇選擇與房?jī)r(jià)相關(guān)的特征,如房屋面積、房間數(shù)、建造年份等。數(shù)據(jù)收集收集房屋價(jià)格、房屋面積、地理位置等相關(guān)數(shù)據(jù)。數(shù)據(jù)預(yù)處理對(duì)數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換和標(biāo)準(zhǔn)化等處理。案例一:房?jī)r(jià)預(yù)測(cè)模型文本預(yù)處理對(duì)文本進(jìn)行分詞、去除停用詞、詞干提取等處理。數(shù)據(jù)收集收集文本數(shù)據(jù)和對(duì)應(yīng)的標(biāo)簽,如新聞文章、電影評(píng)論等。特征提取使用詞袋模型、TF-IDF等方法提取文本特征。模型評(píng)估使用準(zhǔn)確率、召回率等指標(biāo)評(píng)估模型的分類(lèi)性能。模型訓(xùn)練使用樸素貝葉斯、邏輯回歸等模型進(jìn)行訓(xùn)練。案例二:文本分類(lèi)模型收集圖像數(shù)據(jù)和對(duì)應(yīng)的標(biāo)簽,如手寫(xiě)數(shù)字、人臉圖像等。數(shù)據(jù)收集使用準(zhǔn)確率等指標(biāo)評(píng)估模型的識(shí)別性能。模型評(píng)估對(duì)圖像進(jìn)行縮放、歸一化等處理。圖像預(yù)處理使用卷積神經(jīng)網(wǎng)絡(luò)等方法提取圖像特征。特征提取使用深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,如卷積神經(jīng)網(wǎng)絡(luò)(CNN)。模型訓(xùn)練0
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 湖北醫(yī)藥學(xué)院藥護(hù)學(xué)院《新媒體與文學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 2024-2025學(xué)年福建省龍巖高中高三5月教學(xué)質(zhì)量檢測(cè)試題語(yǔ)文試題(A卷)試題含解析
- 2025公司勞動(dòng)合同模板
- 2025屆廣西南寧市新民中學(xué)初三練習(xí)題四(山東卷)英語(yǔ)試題含答案
- 云南省屏邊縣第一中學(xué)2025年高三下學(xué)期期中質(zhì)量檢測(cè)試題語(yǔ)文試題含解析
- 山西師范大學(xué)現(xiàn)代文理學(xué)院《教學(xué)設(shè)計(jì)與評(píng)價(jià)》2023-2024學(xué)年第二學(xué)期期末試卷
- 泰山職業(yè)技術(shù)學(xué)院《詞匯學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 永平隧道施工方案
- 2025租賃合同的法律特征和種類(lèi)
- 2025企業(yè)咨詢(xún)服務(wù)合同(參考文本)
- 山東煙臺(tái)歷年中考語(yǔ)文文言文閱讀試題22篇(含答案與翻譯)(截至2023年)
- 入團(tuán)申請(qǐng)書(shū)紙
- (八省聯(lián)考)陜西省2025年高考綜合改革適應(yīng)性演練 生物試卷(含答案詳解)
- DG-TJ 08-2336-2020 綠道建設(shè)技術(shù)標(biāo)準(zhǔn)
- 新建農(nóng)副產(chǎn)品深加工項(xiàng)目立項(xiàng)申請(qǐng)報(bào)告
- 工商企業(yè)管理畢業(yè)論文范文 工商企業(yè)管理5000論文范文
- 國(guó)際金融學(xué)課件完整版
- 2024會(huì)計(jì)職業(yè)規(guī)劃
- 2024年(中級(jí))多媒體應(yīng)用設(shè)計(jì)師軟考試題庫(kù)大全(含真題等)
- 國(guó)家電網(wǎng)公司招聘高校畢業(yè)生應(yīng)聘登記表
- 公眾號(hào)轉(zhuǎn)移合同模板
評(píng)論
0/150
提交評(píng)論