《Python機(jī)器學(xué)習(xí)：原理與實(shí)踐(第2版)》課件薛薇 - 第1-3章機(jī)器學(xué)習(xí)概述-數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模

上傳人：y*** IP屬地：山東上傳時(shí)間：2023-12-06 格式：PPTX 頁(yè)數(shù)：62 大小：4.76MB 積分：20 舉報(bào) 版權(quán)申訴

《Python機(jī)器學(xué)習(xí)：原理與實(shí)踐(第2版)》課件薛薇 - 第1-3章機(jī)器學(xué)習(xí)概述-數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模_第2頁(yè)

《Python機(jī)器學(xué)習(xí)：原理與實(shí)踐(第2版)》課件薛薇 - 第1-3章機(jī)器學(xué)習(xí)概述-數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模_第3頁(yè)

《Python機(jī)器學(xué)習(xí)：原理與實(shí)踐(第2版)》課件薛薇 - 第1-3章機(jī)器學(xué)習(xí)概述-數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模_第4頁(yè)

《Python機(jī)器學(xué)習(xí)：原理與實(shí)踐(第2版)》課件薛薇 - 第1-3章機(jī)器學(xué)習(xí)概述-數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模_第5頁(yè)

已閱讀5頁(yè)，還剩57頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第1章機(jī)器學(xué)習(xí)概述機(jī)器學(xué)習(xí)的發(fā)展：人工智能中的機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)的核心：數(shù)據(jù)和數(shù)據(jù)建模符號(hào)主義人工智能：基于“一切都可規(guī)則化編碼”的基本信念：通過(guò)硬編碼，依指定規(guī)則自動(dòng)完成相應(yīng)的處理任務(wù)例:依據(jù)BMI判斷肥胖棋類對(duì)弈程序?qū)＜蚁到y(tǒng)（沒(méi)有常識(shí)的專家系統(tǒng)是沒(méi)有意義的)符號(hào)主義人工智能(弱人工智能)很難解決沒(méi)有明確規(guī)則定義的問(wèn)題(諸如語(yǔ)言翻譯、語(yǔ)音識(shí)別、圖像分類等)不能僅依據(jù)BMI對(duì)肥胖進(jìn)行判斷機(jī)器學(xué)習(xí)的發(fā)展：人工智能中的機(jī)器學(xué)習(xí)

誕生于20世紀(jì)50年代的人工智能（ArtificialIntelligence，AI），因旨在實(shí)現(xiàn)人腦部分思維的計(jì)算機(jī)模擬，完成人類智力任務(wù)的自動(dòng)化實(shí)現(xiàn)強(qiáng)人工智能：會(huì)聽(tīng)（語(yǔ)音識(shí)別和機(jī)器翻譯等）、會(huì)看（文字識(shí)別和圖像識(shí)別等）、會(huì)說(shuō)（語(yǔ)音合成和人機(jī)對(duì)話等）、會(huì)學(xué)習(xí)（知識(shí)表示和機(jī)器學(xué)習(xí)等）、會(huì)思考（邏輯推理和人機(jī)對(duì)弈）和會(huì)行動(dòng)（機(jī)器人和自動(dòng)駕駛等）的能力人工智能的研究經(jīng)歷了從符號(hào)主義人工智能（symbolicAI）、機(jī)器學(xué)習(xí)（MachineLearning）、深度學(xué)習(xí)（DeepLearning）的不同發(fā)展階段第1章機(jī)器學(xué)習(xí)概述機(jī)器學(xué)習(xí)的發(fā)展：人工智能中的機(jī)器學(xué)習(xí)

第1章機(jī)器學(xué)習(xí)概述人工智能的研究經(jīng)歷了從符號(hào)主義人工智能（symbolicAI），到機(jī)器學(xué)習(xí)（MachineLearning）到深度學(xué)習(xí)（DeepLearning）的不同發(fā)展階段。符號(hào)主義人工智能：基于“一切都可規(guī)則化編碼”的基本信念機(jī)器學(xué)習(xí)概念的提出源于“人工智能之父”阿蘭·圖靈的圖靈測(cè)試：“思考的機(jī)器”是可能的機(jī)器學(xué)習(xí)目的：教計(jì)算機(jī)借助某些算法完成任務(wù)相對(duì)于經(jīng)典的程序設(shè)計(jì)范式，機(jī)器學(xué)習(xí)是一種新的編程范式機(jī)器學(xué)習(xí)的核心：數(shù)據(jù)和數(shù)據(jù)建模

實(shí)現(xiàn)新的編程范式的核心任務(wù)發(fā)現(xiàn)隱藏在“數(shù)據(jù)”和“答案”中的“規(guī)則”理論可行性：1783年貝葉斯提出的貝葉斯定理存在一種能夠從歷史經(jīng)驗(yàn)，即數(shù)據(jù)集中的“數(shù)據(jù)”和“答案”中，學(xué)習(xí)兩者之間關(guān)聯(lián)性“規(guī)則”的數(shù)學(xué)方法將“數(shù)據(jù)”和“答案”視為一種廣義數(shù)據(jù)，借助數(shù)學(xué)方法學(xué)習(xí)“規(guī)則”的本質(zhì)是基于數(shù)據(jù)的建模從機(jī)器學(xué)習(xí)到深度學(xué)習(xí)：2006年提出的深度學(xué)習(xí)從數(shù)據(jù)中學(xué)習(xí)“數(shù)據(jù)表示”強(qiáng)調(diào)基于訓(xùn)練數(shù)據(jù)，通過(guò)眾多連續(xù)的神經(jīng)網(wǎng)絡(luò)層，過(guò)濾和提取數(shù)據(jù)中的服務(wù)于預(yù)測(cè)的重要特征相對(duì)于擁有眾多層的深度學(xué)習(xí)，機(jī)器學(xué)習(xí)有時(shí)也被稱為淺層學(xué)習(xí)（ShallowLearning）第1章機(jī)器學(xué)習(xí)概述機(jī)器學(xué)習(xí)的核心：數(shù)據(jù)和數(shù)據(jù)建模

機(jī)器學(xué)習(xí)的對(duì)象：數(shù)據(jù)集合，簡(jiǎn)稱數(shù)據(jù)集（也稱樣本集）例如：結(jié)構(gòu)化數(shù)據(jù)：數(shù)據(jù)集中的一行通常稱為一個(gè)樣本觀測(cè)數(shù)據(jù)集中的一列通常稱為一個(gè)變量(特征)依各變量的取值類型可將變量細(xì)分為：數(shù)值型、順序型和類別型三類，后兩類統(tǒng)稱為分類型不同視角下的數(shù)據(jù)集合經(jīng)典統(tǒng)計(jì)中的樣本；基于樣本對(duì)總體特征或關(guān)系進(jìn)行推斷機(jī)器學(xué)習(xí)中的數(shù)據(jù)集，一般不具有隨機(jī)樣本的典型特征第1章機(jī)器學(xué)習(xí)概述機(jī)器學(xué)習(xí)的核心：數(shù)據(jù)和數(shù)據(jù)建模

半結(jié)構(gòu)化數(shù)據(jù)：結(jié)構(gòu)不固定的數(shù)據(jù)例：?jiǎn)T工簡(jiǎn)歷數(shù)據(jù)JSON(JavaScriptObjectNotation)格式：非結(jié)構(gòu)化數(shù)據(jù):文本、圖像、音頻和視頻數(shù)據(jù)數(shù)據(jù)的數(shù)字化和結(jié)構(gòu)化處理數(shù)字的數(shù)字化二進(jìn)制，比特位文本的數(shù)字化ASCII編碼、國(guó)家漢字編碼標(biāo)準(zhǔn)GBK、萬(wàn)國(guó)碼圖形的數(shù)字化:位圖和矢量圖類似于計(jì)算機(jī)字形碼第1章機(jī)器學(xué)習(xí)概述機(jī)器學(xué)習(xí)的核心：數(shù)據(jù)和數(shù)據(jù)建模

機(jī)器學(xué)習(xí)的任務(wù)：數(shù)據(jù)建模，完成兩大主要任務(wù)：數(shù)據(jù)預(yù)測(cè)；數(shù)據(jù)聚類數(shù)據(jù)預(yù)測(cè)：基于已有數(shù)據(jù)集，歸納出輸入變量和輸出變量之間的數(shù)量關(guān)系回歸預(yù)測(cè)和分類預(yù)測(cè)（二分類預(yù)測(cè)和多分類預(yù)測(cè)）目的：在數(shù)量關(guān)系具有普適性和未來(lái)不變的假設(shè)下，可用于對(duì)新數(shù)據(jù)輸出變量取值的預(yù)測(cè)發(fā)現(xiàn)對(duì)輸出變量產(chǎn)生重要影響的輸入變量例如：空氣質(zhì)量數(shù)據(jù)的分析方法特點(diǎn)：經(jīng)典統(tǒng)計(jì)一般為驗(yàn)證式分析；機(jī)器學(xué)習(xí)的歸納式分析特點(diǎn)(從統(tǒng)計(jì)的模型驅(qū)動(dòng)到機(jī)器學(xué)習(xí)的數(shù)據(jù)驅(qū)動(dòng))統(tǒng)計(jì)方法有嚴(yán)格的數(shù)理支撐；機(jī)器學(xué)習(xí)探索式的試驗(yàn)發(fā)現(xiàn)第1章機(jī)器學(xué)習(xí)概述機(jī)器學(xué)習(xí)的核心：數(shù)據(jù)和數(shù)據(jù)建模

機(jī)器學(xué)習(xí)的任務(wù)：數(shù)據(jù)聚類發(fā)現(xiàn)數(shù)據(jù)中可能存在的小類，并通過(guò)小類刻畫和揭示數(shù)據(jù)的內(nèi)在組織結(jié)構(gòu)聚類結(jié)果：給每個(gè)樣本觀測(cè)指派一個(gè)屬于哪個(gè)小類的標(biāo)簽，稱為聚類解。聚類解將保存在一個(gè)新生成的分類型變量中例如：數(shù)據(jù)聚類和數(shù)據(jù)預(yù)測(cè)中的分類有聯(lián)系更有區(qū)別：有監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)第1章機(jī)器學(xué)習(xí)概述機(jī)器學(xué)習(xí)的核心：數(shù)據(jù)和數(shù)據(jù)建模

機(jī)器學(xué)習(xí)的任務(wù)：數(shù)據(jù)建模其他方面：關(guān)聯(lián)分析：尋找到事物之間的聯(lián)系規(guī)律，發(fā)現(xiàn)它們之間的關(guān)聯(lián)性模式診斷：模式（Pattern）是一個(gè)數(shù)據(jù)集合，由分散于數(shù)據(jù)集中的極少量的零星數(shù)據(jù)組成。模式通常具有其他眾多數(shù)據(jù)所沒(méi)有的某種局部的、非隨機(jī)的、非常規(guī)的特殊結(jié)構(gòu)或相關(guān)性。模式診斷就是要從不同角度采用不同方法發(fā)現(xiàn)數(shù)據(jù)中可能存在的模式第1章機(jī)器學(xué)習(xí)概述第2章機(jī)器學(xué)習(xí)中的Python基礎(chǔ)Python：機(jī)器學(xué)習(xí)的首選工具Python的集成開(kāi)發(fā)環(huán)境：AnacondaPython第三方包的引用NumPy使用示例Pandas使用示例NumPy和Pandas的綜合應(yīng)用Matplotlib的綜合應(yīng)用Python：機(jī)器學(xué)習(xí)的首選工具

Python是一款面向?qū)ο蟮慕忉屝陀?jì)算機(jī)語(yǔ)言。開(kāi)源、代碼可讀性強(qiáng)，可實(shí)現(xiàn)高效開(kāi)發(fā)等是Python的重要特征面向?qū)ο蟮某绦蛟O(shè)計(jì)(ObjectOrientedProgramming，OOP)是相對(duì)面向過(guò)程的程序設(shè)計(jì)而言的OOP采用“封裝”的思想，將具有一定獨(dú)立性和通用性的處理過(guò)程和變量(數(shù)據(jù))，封裝在“對(duì)象”中變量稱為對(duì)象的“屬性”，變量值對(duì)應(yīng)屬性值（有具體變量值的對(duì)象稱為“對(duì)象實(shí)例”）處理過(guò)程稱為對(duì)象的“方法”多個(gè)具有內(nèi)在聯(lián)系的對(duì)象可進(jìn)一步封裝在“類”中Python在機(jī)器學(xué)習(xí)領(lǐng)域獲得廣泛使用的原因：簡(jiǎn)明易用，嚴(yán)謹(jǐn)專業(yè)良好的開(kāi)發(fā)社區(qū)生態(tài)豐富的第三方程序包NumPyPandasSciPyMatplotlibScikit-learn（skLearn）第2章Python機(jī)器學(xué)習(xí)基礎(chǔ)Python的集成開(kāi)發(fā)環(huán)境：Anaconda

Anaconda：兼容Linux、Windows和MacOSX.環(huán)境，支持Python2.X和Python3.X，且可方便快捷完成機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)任務(wù)的開(kāi)源IDE通常將Anaconda可視為Python的發(fā)行版Anaconda?Anaconda的官方下載地址為：/AnacondaPrompt的使用第2章Python機(jī)器學(xué)習(xí)基礎(chǔ)Python的集成開(kāi)發(fā)環(huán)境：Anaconda

Spyder的使用:

Python程序的擴(kuò)展名為.py第2章Python機(jī)器學(xué)習(xí)基礎(chǔ)JupyterNotebook的使用:

1984年提出的文字表達(dá)化編程形式的具體體現(xiàn)是一個(gè)基于網(wǎng)頁(yè)的交互式筆記本；擴(kuò)展名為.ipynb的JSON格式文件第2章Python機(jī)器學(xué)習(xí)基礎(chǔ)Python第三方包的引用第三方包以模塊(Moduel，文件擴(kuò)展名為.py)方式，將可實(shí)現(xiàn)各種功能的程序代碼(變量、函數(shù))“打包”在一起包由多個(gè)相關(guān)模塊組成,一般以文件目錄的形式組織(目錄名為包名)引用第三方包中的模塊的基本函數(shù)：import函數(shù)import

包名或模塊名：導(dǎo)入指定包或模塊import

包名.模塊名：導(dǎo)入指定包中的指定模塊from

模塊名

import函數(shù)名：導(dǎo)入指定模塊中的指定函數(shù)from

模塊名

import

函數(shù)名1,函數(shù)名2,…：導(dǎo)入指定模塊中的若干個(gè)指定函數(shù)from

模塊名

import*：導(dǎo)入指定模塊中的所有函數(shù)可增加：as別名importnumpyasnp，表示導(dǎo)入numpy并指定別名為np指定別名可以有效避免不同模塊有相同函數(shù)名的問(wèn)題之后可在自己編寫的Python程序直接調(diào)用已導(dǎo)入模塊中的函數(shù)，通過(guò)代碼重用(重復(fù)使用)的方式快速實(shí)現(xiàn)某種特定功能第2章Python機(jī)器學(xué)習(xí)基礎(chǔ)

列表：Python重要的數(shù)據(jù)組織形式，NumPy數(shù)組數(shù)據(jù)的重要來(lái)源NumPy數(shù)組中元素應(yīng)有相同的數(shù)據(jù)類型，列表可以不同Chapter2_1.ipynb第2章Python機(jī)器學(xué)習(xí)基礎(chǔ)NumPy(NumericalPython)使用示例：最常用的

Python

包。特點(diǎn)：第二，擁有豐富的數(shù)學(xué)運(yùn)算和統(tǒng)計(jì)函數(shù)指定種子的目的是確保每次運(yùn)行代碼時(shí)生成的隨機(jī)數(shù)可以再現(xiàn)。否則，每次運(yùn)行代碼生成的隨機(jī)數(shù)會(huì)不相同random.randn()生成服從均值為0標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)數(shù)Chapter2_1.ipynb第2章Python機(jī)器學(xué)習(xí)基礎(chǔ)NumPy(NumericalPython)使用示例：最常用的

Python

包。特點(diǎn)：第二，擁有豐富的數(shù)學(xué)運(yùn)算和統(tǒng)計(jì)函數(shù)random.normal()函數(shù)生成2行5列的2維數(shù)組，數(shù)組元素服從均值為5標(biāo)準(zhǔn)差為1的正態(tài)分布利用floor函數(shù)得到距各數(shù)組元素最近的最大整數(shù)eye(5)函數(shù)生成5行5列的單位陣YChapter2_1.ipynb第2章Python機(jī)器學(xué)習(xí)基礎(chǔ)Pandas(Pythondataanalysis)使用示例:提供了快速便捷組織和處理結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)和大量功能豐富的函數(shù)。特點(diǎn)：基于NumPy構(gòu)建：序列（Series）：對(duì)應(yīng)1維數(shù)組數(shù)據(jù)框（DataFrame）：對(duì)應(yīng)2維表格型數(shù)據(jù)結(jié)構(gòu),也稱數(shù)據(jù)框?yàn)樾蛄械娜萜鱌andas數(shù)據(jù)框是存儲(chǔ)機(jī)器學(xué)習(xí)數(shù)據(jù)集的常用形式Pandas的索引Chapter2_2.ipynb第2章Python機(jī)器學(xué)習(xí)基礎(chǔ)Pandas的數(shù)據(jù)框Chapter2_2.ipynb第2章Python機(jī)器學(xué)習(xí)基礎(chǔ)Pandas的數(shù)據(jù)加工處理Chapter2_2.ipynb第2章Python機(jī)器學(xué)習(xí)基礎(chǔ)NumPy和Pandas的綜合應(yīng)用：空氣質(zhì)量監(jiān)測(cè)數(shù)據(jù)的預(yù)處理和基本分析數(shù)據(jù)預(yù)處理Chapter2_3.ipynb第2章Python機(jī)器學(xué)習(xí)基礎(chǔ)基本分析NumPy和Pandas的綜合應(yīng)用：空氣質(zhì)量監(jiān)測(cè)數(shù)據(jù)的預(yù)處理和基本分析Chapter2_3.ipynb第2章Python機(jī)器學(xué)習(xí)基礎(chǔ)派生虛擬自變量NumPy和Pandas的綜合應(yīng)用：空氣質(zhì)量監(jiān)測(cè)數(shù)據(jù)的預(yù)處理和基本分析Chapter2_3.ipynb第2章Python機(jī)器學(xué)習(xí)基礎(chǔ)抽取數(shù)據(jù)子集NumPy和Pandas的綜合應(yīng)用：空氣質(zhì)量監(jiān)測(cè)數(shù)據(jù)的預(yù)處理和基本分析Chapter2_3.ipynb第2章Python機(jī)器學(xué)習(xí)基礎(chǔ)AQI的時(shí)序變化特點(diǎn)Matplotlib的綜合應(yīng)用：空氣質(zhì)量監(jiān)測(cè)數(shù)據(jù)的圖形化展示Chapter2_4.ipynb第2章Python機(jī)器學(xué)習(xí)基礎(chǔ)第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模從線性回歸預(yù)測(cè)模型說(shuō)起認(rèn)識(shí)線性分類預(yù)測(cè)模型從線性預(yù)測(cè)模型到非線性預(yù)測(cè)模型預(yù)測(cè)模型的參數(shù)估計(jì)預(yù)測(cè)模型的選擇導(dǎo)言

數(shù)據(jù)預(yù)測(cè)，簡(jiǎn)而言之就是基于已有數(shù)據(jù)集，歸納出輸入變量和輸出變量之間的數(shù)量關(guān)系。基于這種數(shù)量關(guān)系:一方面，可發(fā)現(xiàn)對(duì)輸出變量產(chǎn)生重要影響的輸入變量；另一方面，在數(shù)量關(guān)系具有普適性和未來(lái)不變的假設(shè)下，可用于對(duì)新數(shù)據(jù)輸出變量取值的預(yù)測(cè)。對(duì)數(shù)值型輸出變量的預(yù)測(cè)稱為回歸。對(duì)分類型輸出變量的預(yù)測(cè)稱為分類數(shù)據(jù)預(yù)測(cè)涉及的問(wèn)題第一，預(yù)測(cè)模型基礎(chǔ)第二，參數(shù)估計(jì)策略第三，模型選擇第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模從線性回歸預(yù)測(cè)模型說(shuō)起

預(yù)測(cè)模型一般以數(shù)學(xué)形式展現(xiàn)，以精確刻畫和表述輸入變量和輸出變量取值之間的數(shù)量關(guān)系?？杉?xì)分為回歸預(yù)測(cè)模型和分類預(yù)測(cè)模型，分別適用于回歸問(wèn)題和分類問(wèn)題線性回歸預(yù)測(cè)模型的含義線性回歸預(yù)測(cè)模型用于預(yù)測(cè)的回歸方程應(yīng)明確模型系數(shù)的實(shí)際含義應(yīng)明確預(yù)測(cè)模型和回歸方程的聯(lián)系第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模

從線性回歸預(yù)測(cè)模型說(shuō)起

線性回歸模型的幾何理解可將數(shù)據(jù)集中的N個(gè)樣本觀測(cè)數(shù)據(jù)，視為m維實(shí)數(shù)空間中的N

個(gè)點(diǎn)幾何上與2維平面中的一條直線相對(duì)應(yīng)，該直線稱為回歸直線與3維平面中的一個(gè)平面相對(duì)應(yīng)，該平面稱為回歸平面線性回歸預(yù)測(cè)模型的評(píng)價(jià)均方誤差：越小越好擬合優(yōu)度：R方，越接近1越好第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模

從線性回歸預(yù)測(cè)模型說(shuō)起

Python應(yīng)用實(shí)踐：PM2.5濃度預(yù)測(cè)建立一元線性回歸模型第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模Chapter3_1.ipynb從線性回歸預(yù)測(cè)模型說(shuō)起

Python應(yīng)用實(shí)踐：PM2.5濃度預(yù)測(cè)建立多元線性回歸模型第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模Chapter3_1.ipynbPython模擬：可通過(guò)增加模型的復(fù)雜度減少模型的預(yù)測(cè)誤差第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模

增加模型復(fù)雜度可以有效降低模型的預(yù)測(cè)誤差，但當(dāng)復(fù)雜度達(dá)到一定程度后再繼續(xù)增加就不再有意義了Chapter3_2.ipynbLogistic回歸預(yù)測(cè)模型:分類預(yù)測(cè)模型僅討論二分類預(yù)測(cè)模型，多分類預(yù)測(cè)可通過(guò)多個(gè)二分類預(yù)測(cè)實(shí)現(xiàn)再看一般線性回歸模型對(duì)響應(yīng)概率建模，稱為：一般線性概率模型一般線性概率模型的不足：無(wú)法保證模型給出的概率值限制在0-1范圍內(nèi)線性概率模型反映了概率與自變量取值之間的線性而非一般經(jīng)驗(yàn)上的非線性關(guān)系例：收入和購(gòu)買某奢侈品的概率認(rèn)識(shí)線性分類預(yù)測(cè)模型

第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模Logistic回歸預(yù)測(cè)模型：二分類預(yù)測(cè)模型

認(rèn)識(shí)線性分類預(yù)測(cè)模型

第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模Logistic回歸預(yù)測(cè)模型：二分類預(yù)測(cè)模型β的實(shí)際意義仍不明顯例：有x1,x2兩個(gè)輸入變量；當(dāng)x1從0變化到1時(shí)：優(yōu)勢(shì)(odds)優(yōu)勢(shì)比(OddsRatio)Logistic回歸模型中：于是:輸入變量變化一個(gè)單位引起的優(yōu)勢(shì)比為exp(β)輸入變量變化一個(gè)單位引起響應(yīng)概率比(相對(duì)風(fēng)險(xiǎn))近似為exp(β)接近0時(shí)

第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模認(rèn)識(shí)線性分類預(yù)測(cè)模型

線性分類模型的幾何理解二分類預(yù)測(cè)建模的目的，就是找到一條能夠?qū)⒉煌螤罨蝾伾臉颖居^測(cè)點(diǎn)有效分開(kāi)的分類線，即分類邊界分類直線分類平面第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模Python應(yīng)用實(shí)踐：空氣質(zhì)量等級(jí)預(yù)測(cè)建立簡(jiǎn)單二分類預(yù)測(cè)模型數(shù)據(jù)預(yù)處理建立二項(xiàng)Logistic回歸模型繪制二項(xiàng)Logistic回歸模型的分類邊界計(jì)算分類模型的評(píng)價(jià)指標(biāo)

(chapter3-3.ipynb)

第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模Python應(yīng)用實(shí)踐：空氣質(zhì)量等級(jí)預(yù)測(cè)建立簡(jiǎn)單二分類預(yù)測(cè)模型模型的評(píng)價(jià)(chapter3-3.ipynb)第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模認(rèn)識(shí)線性分類預(yù)測(cè)模型

二分類預(yù)測(cè)模型中的誤差評(píng)價(jià)指標(biāo)混淆矩陣注意：總錯(cuò)判率會(huì)受數(shù)據(jù)不平衡性的影響TPR(真正率)TNR1-TNR=FPR(假正率)第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模

查全率也稱召回率(Recall)第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模Python應(yīng)用實(shí)踐：空氣質(zhì)量等級(jí)預(yù)測(cè)建立較復(fù)雜的二分類預(yù)測(cè)模型建立二項(xiàng)Logistic回歸模型計(jì)算模型的混淆矩陣，總正確率，F(xiàn)1得分評(píng)價(jià)模型：采用二分類模型評(píng)價(jià)的圖形化方式ROC曲線和PR曲線評(píng)價(jià)模型預(yù)測(cè)精度優(yōu)于前模型(chapter3-3.ipynb)第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模預(yù)測(cè)模型的評(píng)價(jià)---模型的圖形化評(píng)價(jià)工具

ROC曲線按預(yù)測(cè)概率降序排序取分位點(diǎn)上的概率值作為判斷1/0的閾值計(jì)算TPR和FPR，點(diǎn)連線AUC值第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模Python應(yīng)用實(shí)踐：空氣質(zhì)量等級(jí)預(yù)測(cè)ROC曲線和AUC值;PR曲線chapter3-3.ipynb第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模

第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模提高預(yù)測(cè)精度從直線到曲線，從平面到曲面

從線性預(yù)測(cè)模型到非線性預(yù)測(cè)模型

解決非線性回歸和非線性分類問(wèn)題：從直線到曲線，從平面到曲面第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模

預(yù)測(cè)模型的參數(shù)估計(jì)

總損失：第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模

預(yù)測(cè)模型的參數(shù)估計(jì)

其中：第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模

預(yù)測(cè)模型的參數(shù)估計(jì)

第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模參數(shù)解空間和搜索策略參數(shù)的最小二乘估計(jì)損失函數(shù)L是模型參數(shù)的非負(fù)二次函數(shù)

第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模參數(shù)解空間和搜索策略在預(yù)測(cè)模型參數(shù)解空間中，采用一定的搜索策略估計(jì)參數(shù)梯度下降法預(yù)測(cè)模型的參數(shù)估計(jì)第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模預(yù)測(cè)模型的選擇

預(yù)測(cè)模型的選擇涉及兩個(gè)問(wèn)題：如何估計(jì)預(yù)測(cè)模型未來(lái)的預(yù)測(cè)性能？若僅傾向選擇復(fù)雜模型會(huì)導(dǎo)致哪些問(wèn)題，應(yīng)如何解決？?jī)蓚€(gè)重要概念訓(xùn)練誤差：指預(yù)測(cè)模型對(duì)訓(xùn)練集中各樣本觀測(cè)輸出變量的實(shí)際值與預(yù)測(cè)值不一致程度的數(shù)值化度量。泛化誤差：是預(yù)測(cè)模型對(duì)新數(shù)據(jù)集進(jìn)行預(yù)測(cè)時(shí)，給出的預(yù)測(cè)值和實(shí)際值不一致程度的數(shù)值化度量。預(yù)測(cè)誤差測(cè)度模型在未來(lái)新數(shù)據(jù)集上的預(yù)測(cè)性能。泛化誤差值較低，說(shuō)明模型具有一般預(yù)測(cè)場(chǎng)景下的普適性和推廣性，認(rèn)為模型有較高的泛化能力訓(xùn)練誤差和泛化誤差的不同預(yù)測(cè)建模時(shí)可直接計(jì)算出預(yù)測(cè)模型的訓(xùn)練誤差泛化誤差是未知的，無(wú)法直接計(jì)算得到，只能給出泛化誤差的估計(jì)值第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模預(yù)測(cè)模型的選擇

泛化誤差的估計(jì)訓(xùn)練誤差，即為用于估計(jì)預(yù)測(cè)模型參數(shù)（也稱訓(xùn)練預(yù)測(cè)模型）的數(shù)據(jù)集，其中的樣本觀測(cè)稱為“袋內(nèi)觀測(cè)”在恰當(dāng)?shù)挠?xùn)練樣本量下，增加模型的復(fù)雜度會(huì)帶來(lái)訓(xùn)練誤差的降低模型復(fù)雜度確定的條件下，訓(xùn)練誤差會(huì)隨樣本量增加而下降第3章數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模預(yù)測(cè)模型的選擇

第3章數(shù)據(jù)預(yù)測(cè)與預(yù)

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

《Python機(jī)器學(xué)習(xí)：原理與實(shí)踐(第2版)》課件薛薇 - 第1-3章機(jī)器學(xué)習(xí)概述-數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

《Python機(jī)器學(xué)習(xí)：原理與實(shí)踐(第2版)》課件 薛薇 - 第1-3章 機(jī)器學(xué)習(xí)概述-數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔

《Python機(jī)器學(xué)習(xí)：原理與實(shí)踐(第2版)》課件薛薇 - 第1-3章機(jī)器學(xué)習(xí)概述-數(shù)據(jù)預(yù)測(cè)與預(yù)測(cè)建模