




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
人工智能初識1.2人工智能初識.pptx1.3~1.6人工智能初識.pptx2.2~2.9食堂消費預測.pptx3.1~3.4貧困生判別.pptx3.6~3.7貧困生判別.pptx4.1~4.8客戶流失分類.pptx4.9~4.13客戶流失分類.pptx5.1~5.15圖像識別.pptx6.1~6.10自然語言處理.pptx7.1~7.11爬行機器人.pptx8.1~8.10人工智能應用展.pptx9.1~9.9人工智能倫理.pptx全套可編輯PPT課件人工智能簡史—1.2—1.2.1人工智能的誕生:1930—1950年
對于人工智能來說,我們不僅僅需要計算機硬件本身感知外界資訊,還需要一種能夠?qū)@些信息進行加工和處理的實現(xiàn)人工智能的方法。那么我們有什么實現(xiàn)方法呢?人類智慧與人工智能
1936年艾倫?圖靈(圖1-10)預言了這種真正智能機器的可能性,并發(fā)明了通用圖靈機。這種多用途模型可以“運行”任何指令序列。1950年,圖靈發(fā)表了題為《機器能思考嗎》的論文。論文的開篇是一條明確的聲明:“我準備探討’機器能思考嗎'這個問題?!?.2.1人工智能的誕生:1930—1950年1.2.1人工智能的誕生:1930—1950年
圖靈設計了一個游戲來解釋這個問題的實證含義:如果一臺機器輸出的內(nèi)容和人類大腦別無二致的話,那么我們就沒有理由堅持認為這臺機器不是在“思考”。
進行多次測試后,如果有超過30%的測試者不能確定出被測試者是人還是機器,那么這臺機器就通過了測試,并被認為具有人類智能。這個測試也就是著名的“圖靈測試”。
這一階段的工作包括一些機器人的研發(fā),例如,1948年威廉?格雷?沃爾特(WilliamGreyWalter)研發(fā)了一款類似烏龜?shù)奈⑿蜋C器人(Turtles),并于1951年在“英國節(jié)”(FestivalofBritain)上向公眾展示。其感覺運動電路模擬了謝林頓的神經(jīng)反射理論。
這款機器人并未使用計算機、數(shù)字電路和符號推理,控制它的是純粹的模擬電路。1.2.1人工智能的誕生:1930—1950年沃爾特?皮茨(WalterPitts)和沃倫-麥卡洛克(WarrenMclChloch)分析了理想化的人工神經(jīng)元網(wǎng)絡,并且指出了它們進行簡單邏輯運算的機制。他們是最早描述所謂“神經(jīng)網(wǎng)絡”的學者。1951年,他們的學生馬文?閔斯基(MarinMinsk)與其他研究者一道建造了第一臺神經(jīng)網(wǎng)絡機,稱為SNARC(StochasticNeualAnalogReinforcementCalchator)1.2.1人工智能的誕生:1930—1950年1951年,克里斯托弗-斯特雷奇(ChristopherStrachey)使用曼徹斯特大學的FerrantiMark1機器寫出了一個西洋跳棋(Checkrs)程序;迪特里希?普林茨(DietrichPrinz)則寫出了一個國際象棋程序。
在20世紀50年代中期和60年代初亞瑟?塞繆爾(ArthuSame1)開發(fā)的西洋棋程序已經(jīng)可以挑戰(zhàn)具有相當水平的業(yè)余愛好者。游戲人工智能一直被認為是評價人工智能進展的一種標準。1.2.1人工智能的誕生:1930—1950年1956年的達特茅斯會議(DartmoUhConference)(圖1-14)是人工智能誕生的標志,在這次會議上人工智能的名稱和任務得以確定。會議提出的斷言之一是“學習或者智能的任何其他特性的每一個方面都應能被精確地加以描述,使得機器可以對其進行模擬?!?.2.1人工智能的誕生:1930—1950年1.2.2第一次浪潮:1956—1974年
達特茅斯會議推動了全球第一次人工智能浪潮的出現(xiàn),人們看到了機器模擬智能的可能性。當時樂觀的氣氛彌漫著整個學界,在算法方面出現(xiàn)了很多世界級的發(fā)明,其中包括增強學習的雛形一貝爾曼方程(BellmanEqtion),而增強學習就是谷歌AlphaGo算法的核心思想內(nèi)容?,F(xiàn)在常聽到的深度學習模型,其雛形叫作感知器,也是在那期間發(fā)明的。
1966年,麻省理工學院(MIT)約瑟夫?維森保姆教授(JosephWeizenam)發(fā)布了世界上第一臺能夠?qū)崿F(xiàn)簡單人機對話的機器ELIZA(1966年)(圖1-15)。1972年,日本早稻田大學研制出了世界上第一個全尺寸人形機器人WABOT-11.2.2第一次浪潮:1956—1974年1.2.2第一次浪潮:1956—1974年
人工智能界認為按照這樣的發(fā)展速度,人工智能真的可以代替人類。這個時候,計算機可以解決代數(shù)應用題、證明幾何定理、學習和使用英語,研究者們在私下的交流和公開發(fā)表的論文中表達出相當樂觀的情緒,認為具有完全智能的機器將在20年內(nèi)出現(xiàn)。
第一次人工智能的冬天出現(xiàn)在1974年到1980年,各界對人工智能的批判越來越多。因為人們過度高估了人工智能的發(fā)展,樂觀的承諾一直無法兌現(xiàn),而且在實際中發(fā)現(xiàn)邏輯證明器、感知器、增強學習等只能做很簡單、非常專門且很窄的任務,稍微超出范圍就無法應對。1.2.3第一次寒冬:1974—1980年
1.2.4再次繁榮:1980—1987年
在20世紀80年代出現(xiàn)了人工智能數(shù)學模型方面的重大發(fā)明,其中包括著名的多層神經(jīng)網(wǎng)絡(1986年)和反向傳播算法(1986年)等等,于是,大家又開始覺得人工智能也還不錯。
1980年,卡耐基?梅隆大學為DEC公司制造出了XCON專家系統(tǒng),這個專家系統(tǒng)可幫助DEC公司每年節(jié)約4000萬美元左右的費用,特別是在決策方面能提供有價值的內(nèi)容。這成為一個新時期的里程碑,專家系統(tǒng)開始在特定領域發(fā)揮威力。1.2.4再次繁榮:1980—1987年圖1-17Symbolis3640LipMabine
專家系統(tǒng)只能模擬特定領域人類專家的技能,但這足以激發(fā)新的融資趨勢。最活躍的是日本政府,意圖創(chuàng)造第五代計算機,這間接迫使美國和英國恢復對人工智能研究的資助。但是專家系統(tǒng)需要一個巨型知識庫,知識是固定的,簡單說就是一個條件判斷系統(tǒng),所有知識都是人輸入的,需要大量的人工來創(chuàng)建,所以是很難擴展更新的。1.2.4再次繁榮:1980—1987年
沉寂10年之后,神經(jīng)網(wǎng)絡也有了新的研究進展,尤其是1982年英國科學家霍普菲爾德(Hopfield)幾乎同時與杰弗里?辛頓(GeoffreyHinton)(圖1-18)發(fā)現(xiàn)了具有學習能力的神經(jīng)網(wǎng)絡算法,這使得神經(jīng)網(wǎng)絡一路發(fā)展,在20世紀90年代開始商業(yè)化,被用于文字圖像識別和語音識別。1.2.4再次繁榮:1980—1987年杰弗里?辛頓(GeoffreyHinton)
到1987年時,蘋果和IBM生產(chǎn)的臺式機性能都超過了Symblics等廠商生產(chǎn)的人工智能計算機(圖1-19),專家系統(tǒng)自然風光不再。1.2.5寒冬再襲
到20世紀80年代晚期,DARPA的新任領導認為人工智能并不是“下一個浪潮”;1991年,人們發(fā)現(xiàn)日本人設定的“第五代工程”也沒能實現(xiàn)。這些事實讓人們從對“專家系統(tǒng)”的狂熱追捧中一步步走向失望。人工智能研究再次遭遇經(jīng)費危機。圖1-19臺式機a(左圖)與人工智能計算機(右圖)1.2.5寒冬再襲1.2.6回歸:1993—2012年
到了20世紀90年代,科學家們不再追尋不切實際的承諾,開始專注于解決實際的問題。這個階段,人工智能技術加入了統(tǒng)計學的方法,這為人工智能打造了更堅實的數(shù)學基礎。在數(shù)學的驅(qū)動下,一些新的數(shù)學模型和算法逐步發(fā)展起來。
這些新算法不斷應用于實際問題中,比如語音識別、智能推薦等。不過,這個時候人們往往會用新名詞來掩飾“人工智能”這塊被玷污的金字招牌,比如信息學、知識系統(tǒng)、認知系統(tǒng)或計算智能。1.2.6回歸:1993—2012年“深藍”擊敗棋手卡斯帕羅夫2007年,在斯坦福任教的華裔科學家李飛飛,發(fā)起創(chuàng)建了ImageNet項目。1.2.6回歸:1993—2012年2012年12月4日,一組研究者在神經(jīng)信息處理系統(tǒng)(NIPS)會議上提出了讓他們在幾周前的ImageNet分類競賽中獲得第一名的卷積神經(jīng)網(wǎng)絡的詳細信息。他們使用了深度學習技術進行圖像識別,將人工智能的研究推向了急速上升期。1.2.7爆發(fā):2012年至今2016年,李世石與AlphaGo總比分以1比4告負(圖1-22),將公眾的注意力也大量投向了人工智能,真正地將人工智能推向了研究和公眾視野的中心。1.2.7爆發(fā):2012年至今李世石與AlphaGo人工智能將是全球新一輪科技革命和產(chǎn)業(yè)變革中的核心技術,最先掌握前沿技術,最先大規(guī)模應用人工智能的國家會是這一次科技革命的領導者,為此全球都在爭先進行人工智能戰(zhàn)略部署。1.2.7爆發(fā):2012年至今人工智能初識人工智能是什么—1.3—項目導入像人一樣行動像人一樣思考理性地行動理性地思考人工智能字面意義就是人造的智能(ArtificialIntelligence,AI),即用機器來模仿人的智能。人工智能干什么用—1.4—1.4.1工業(yè)
現(xiàn)階段,工業(yè)企業(yè)在智能制造趨勢下紛紛開始探索智能化轉(zhuǎn)型的路徑,基于工業(yè)大數(shù)據(jù)分析的工業(yè)智能蘊藏著巨大商業(yè)價值的革命性技術,越來越多地受到企業(yè)青睞。
自從電商興起以后,商業(yè)已經(jīng)變成了一個數(shù)據(jù)驅(qū)動的行業(yè),最典型的就是亞馬遜商城。亞馬遜商城的人工智能推薦系統(tǒng)是一個強大的引擎,可以為你推薦各種你可能購買的商品
1.4.2商業(yè)
隨著游戲市場競爭的日趨激烈,越來越多的游戲運營服務選擇借助大數(shù)據(jù)挖掘出更多更細的用戶群來進行精細化,個性化運營,從而更好地抓住用戶,獲得更大的收益。1.4.2商業(yè)
金融本來就是數(shù)字的游戲,不過現(xiàn)在正從數(shù)字(Number)轉(zhuǎn)向數(shù)據(jù)(Data)。金融機構(gòu)通過數(shù)據(jù)分析客戶信用,進行詐騙檢測、證券交易等。1.4.3金融
在醫(yī)學領域,首先是涉及圖像的,如B超、CT、病理專業(yè)等,其次是內(nèi)鏡診斷領域已經(jīng)開始了實踐。醫(yī)學影像是疾病診斷的主要路徑之一,因此,通過機器讀取醫(yī)學1.4.4醫(yī)療本章小結(jié)—1.5—
本章通過小明的智慧校園生活,開啟了人工智能的未來應用,并針對人工智能的歷史、概念以及應用做了簡單的瀏覽和介紹。人工智能技術隨著計算機的產(chǎn)生便已誕生,一路上雖然坎坷,但是也產(chǎn)生了巨大成就。人工智能技術本身的發(fā)展同時也是對人工智能本身是什么的重定義過程,“理性地行動”最符合當前技術的現(xiàn)實,也成為當前人工智能實現(xiàn)的主要指導思想。人工智能技術已經(jīng)應用在生活的方方面面,并將在未來產(chǎn)生更大的影響。人工智能前路漫漫,很多還是研究的無人區(qū),希望大家今后能夠“勇踏前人未至之境”(Tobldlygowherenomanhasgonebfore)°本章課后練習—1.6—(1)請觀察自己身邊的各類智能產(chǎn)品,說說你認為這里使用了人工智能的什么技術。(2)請查閱資料,說說你認為人工智能在本專業(yè)有哪些應用?
食堂消費預測學習目標—2.2—知識目標了解機器學習的含義了解機器學習的基本方法理解機器學習的基本流程理解線性回歸的原理理解模型的解釋方法項目引導—2.3—
高考后,學生需要選擇心儀的學校填報志愿,我們可以對所要選擇學校進行打分,最后根據(jù)評分結(jié)果選擇那個得分最高的學校。比如我們從“歷年分數(shù)”“師資力量”“校園大小”“招生數(shù)量”等10個維度進行評分,假設每個維度10分,我們根據(jù)實際情況對每個維度評分后,將這些分數(shù)相加,最終分數(shù)是最高的那個可能就是我們最應該去的學校2.3.1問題引導(1)請列出3個學校(包括現(xiàn)在所在的學校),僅從“歷年分數(shù)”“師資力量”“校園大小”“招生數(shù)量”4個維度對這3個學校進行評分,得分最高的學校是你現(xiàn)在所在的學校嗎?2.3.1問題引導(2)可能有的同學覺得“歷年分數(shù)”的權(quán)重應該大于“校園大小”,我們可以如何體現(xiàn)出這樣的權(quán)重大小區(qū)別呢?(3)如果填報志愿的各個維度還有權(quán)重大小區(qū)別,你是否需要反復斟酌嘗試各個維度的權(quán)重應該是多少呢
小明同學想要幫助食堂預測第二天的銷售額,從而改善食堂進貨情況。他發(fā)現(xiàn)這個問題其實也類似填報志愿的問題。如果我們也能找到若干食堂消費情況的維度來分析是不是就可能有辦法解決了呢?但是具體如何解決呢?
2.3.2初步分析
2.3.2初步分析通過查閱資料,他發(fā)現(xiàn)這幾個類似的問題:商場每天都要進貨,要進多少貨呢?家里要買新房,如何預測房價呢?又到出游的時候了,會有多少人出游呢?在理想公司工作幾年后,能拿到多少工資呢?
這個過程能用機器進一步優(yōu)化嗎?如果可以的話,你認為機器可以怎么做?不可以的話,為什么?2.3.2初步分析知識準備—2.4—
機器也可以學習,我們把這項技術叫作機器學習
機器學習是現(xiàn)代人工智能的核心。常見的機器學習有監(jiān)督學習和非監(jiān)督學習。2.4.1機器也可以學習
對于監(jiān)督學習來說,我們給算法一個數(shù)據(jù)集,并且給出正確答案,機器通過數(shù)據(jù)來學習正確答案的計算方法。
如果一個問題沒有給出標準答案,我們可以使用非監(jiān)督學習2.4.1機器也可以學習2.4.1機器也可以學習
使用食堂消費歷史記錄來協(xié)助食堂預測第二天的銷售額,是采用監(jiān)督學習還是使用非監(jiān)督學習呢?
2.4.2機器如何學習發(fā)現(xiàn)規(guī)律總結(jié)經(jīng)驗預測未來掌握規(guī)則以監(jiān)督學習為例機器學習的工作可以簡單理解為:2.4.2機器如何學習對于人類來說,我們可以通過歷史經(jīng)驗,學習到一個規(guī)律。如果有新的問題出現(xiàn),我們可以使用習得的歷史經(jīng)驗,來預測未來未知的事情2.4.2機器如何學習對于機器學習系統(tǒng)來說,它可以通過歷史數(shù)據(jù),學習到一個模型。如果有新的問題出現(xiàn),它可以使用習得的模型,來預測未來新的輸入深入分析—2.5—2.5.1線性回歸原理線性回歸的原理是什么?“SalaryData.csv”,坐標軸上繪制年薪和工齡關系圖2.5.1線性回歸原理小明同學畫出年薪與工齡的關系,發(fā)現(xiàn)關系如圖所示,貌似可以通過工齡長短預測一個人的年薪。他大致地在圖中畫出一條直線,盡量讓這條直線在點組成的區(qū)域中穿越。2.5.1線性回歸原理我們可以通過計算這個直線的方程,來預測未來的年薪嗎?他寫出一個直線方程:y=wx+b。X是什么?Y是什么?2.5.1線性回歸原理
偏置(Bias)權(quán)重(Weight)特征(Feature)標記(Label)2.5.2訓練與測試測試和評分”節(jié)點的作用就是:(1)使用數(shù)據(jù)訓練模型。(2)測試模型的好壞,給出評分。2.5.2訓練與測試為了方便理解訓練和測試,我們以人類學習進行類比。在我們的學習過程中,需要上課學習,課后做作業(yè)與考試。如果將上課理解成模型的訓練,那么做作業(yè)就是模型的測試了。2.5.2訓練與測試機器學習中,我們就需要將數(shù)據(jù)分為訓練集(上課)和測試集(作業(yè)),分別用來對模型進行訓練和測試:訓練集:其作用是讓算法學習出一個模型,通過優(yōu)化參數(shù),訓練模型。測試集:通過訓練集得出模型后,使用測試集進行模型測試,來查看模型的好壞。2.5.2訓練與測試同時注意,測試集還需要滿足以下兩個條件:規(guī)模足夠大,可產(chǎn)生具有統(tǒng)計意義的結(jié)果(一道題不會沒關系,但是每道題都會肯定就有問題了)。能代表整個數(shù)據(jù)集(課程都是代數(shù),作業(yè)卻是幾何,顯然不合理)。本章小結(jié)—2.6—本章以圖形化的方式闡述了線性回歸的基本思想和方法。通過人類和機器學習的類比,解釋了什么是機器學習以及機器如何學習,并在“橙現(xiàn)智能”實現(xiàn)了線性回歸模型。接著深入線性回歸理論,逐步介紹線性回歸的各項內(nèi)容,集合圖形化軟件實操,方便同學真正理解與應用。
課后練習—2.7—(1)什么是訓練集和測試集,請舉一個學習工作中的例子加以說明。(2)從模型的系數(shù)中,分析食堂消費額主要受什么影響比較大。(3)決定系數(shù)越大越好嗎?(4)熟悉“橙現(xiàn)智能”軟件,試試應用自己的數(shù)據(jù)。貧困生判別問題描述—3.1—
又到了貧困生申報的時間了,以往小明所在的學校都是采用個人書面申請等方式實現(xiàn)對貧困學生的判定與資助,然而隨著學生數(shù)量的增加以及各類家庭情況的復雜性,使得常規(guī)判定方法無法得到令人滿意的效果,有沒有可能學校通過技術手段來實現(xiàn)貧困生的精確判斷呢?學習目標—3.2—知識目標了解分類問題理解邏輯回歸原理了解分類模型的評價標準理解分類模型的解釋方法項目引導—3.3—
根據(jù)學生歷史消費數(shù)據(jù),提取若干特征,比如消費總額、平均值等,嘗試手工加權(quán)重然后相加,如果得出的分數(shù)大于某個數(shù),我們就認為此學生為非貧困生,如果得出的分數(shù)小于某個數(shù),我們就認為此學生為貧困生。3.3.1問題引導(1)請根據(jù)消費“總額”“平均值”“最大值”“最小值”4個特征設計此模型。說說你為什么這樣設計。3.3.1問題引導(2)假設某學生的消費“平均值”較小,你的模型應該判斷此學生較可能為貧困生還是非貧困生呢?3.3.2初步分析
小明如果拿到了全校學生一段時間內(nèi)的校園卡消費信息,就可以根據(jù)這些信息把學生分為兩類,一類是貧困生,一類是非貧困生。類似分類問題,在人工智能領域還有很多例子,比如:3.3.2初步分析(1)鶯尾花分類問題:根據(jù)花萼和花瓣的長度等數(shù)據(jù)判斷其類別。(2)垃圾郵件過濾器:根據(jù)電子郵件的發(fā)件人、標題等信息判斷其是否為垃圾郵件。(3)腫瘤:根據(jù)腫塊的形狀、邊界、生長快慢、質(zhì)地是否轉(zhuǎn)移等信息判斷腫瘤是惡性/良性的。你身邊還有其他分類的問題,寫一寫分類結(jié)果都跟哪些特征有關系?想一想3.3.2初步分析知識準備—3.4—
這些分類問題的共同點是有一些關于目標的信息數(shù)據(jù),需要以這些數(shù)據(jù)為基礎,建立相關數(shù)學模型,將目標分成若干種不同的類型。解決這類問題我們可以借助特征實現(xiàn)對結(jié)果的判斷或者預測。
這個過程能用機器進一步優(yōu)化嗎?如果可以的話,你認為機器可以怎么做?不可以的話,為什么?
前面的課程中,小明已經(jīng)學會了使用線性回歸的方法來預測食堂的消費情況,并且已經(jīng)構(gòu)建了一個線性回歸模型,大概找到一條直線可以使大部分的數(shù)據(jù)都靠近它。
在這個例子中,我們想要將數(shù)據(jù)分為不同種類,可以使用類似方法找到一條使大部分點都靠近的線嗎?
對于這種分類的問題,我們不可以用線性回歸,而是使用邏輯回歸方法來解決,具體的我們將在后續(xù)小節(jié)進行分析。貧困生判別深入分析—3.6—
小明同學為了探究邏輯回歸算法的原理,他以貧困生判定案例進行探索。
幾列數(shù)據(jù)分別為是否貧困生、平均每次消費的金額、單次最小的消費金額、單次最大的消費金額、總消費金額。其中貧困生標注為1,非貧困生標注為0。試一試
請在計算機或草稿紙上畫出總消費金額和是否貧困生的關系,如果使用線性回歸算法,這個回歸線大致怎么畫?自己試試吧。想一想
有了回歸線,能否使用回歸線來區(qū)分學生是否為貧困生?
邏輯回歸,雖然被稱為回歸,但其實際上是分類模型。邏輯回歸因其簡單易于解釋、可并行化、可解釋性強,深受工業(yè)界喜愛。那為什么不可以用線性回歸做分類呢?3.6.1為什么用邏輯回歸
那為什么不可以用線性回歸做分類呢?如圖所示畫出了貧困與否和特征的關系圖3.6.1為什么用邏輯回歸0102有了這條回歸斜線,你能區(qū)分貧困和非貧困嗎?寫出你的理由。你認為應該如何來理解這條回歸斜線?使用回歸方法
如圖所示,我們可以為所選特征設置一個閾值,根據(jù)特征的值與閾值的比較來預測是否貧困。也就是找到一個分界線對應的值,設置這個值為閾值,大于閾值的是貧困生,否則非貧困生。3.6.1為什么用邏輯回歸
但是這條回歸線到底代表什么呢?3.6.1為什么用邏輯回歸為什么回歸線想要讓所有點盡可能接近呢?3.6.1為什么用邏輯回歸3.6.1為什么用邏輯回歸
為了解決這些問題,我們可以想象,最好能做出圖所示的結(jié)果。如果可以的話,只要計算出來貧困的概率比閾值大,就預測為是貧困,否則就是非貧困。3.6.1為什么用邏輯回歸如圖所示類似的線,能夠解決上述的兩個問題嗎?為什么?想一想
3.6.1為什么用邏輯回歸現(xiàn)在的問題,就是如何能將直線變彎呢?
我們使用Sigmoid函數(shù)將線性回歸的直線轉(zhuǎn)為一個S形曲線。Sigmoid函數(shù)為:
3.6.2從線性回歸到邏輯回歸
這個例子中,閾值的兩側(cè)有不同的貧困結(jié)果,這條線就叫判定邊界(DecisionBoundary),我們可以調(diào)整判定邊界來調(diào)整判定的結(jié)果。3.6.3判定邊界假設學校對貧困生資助的預算充足,如圖3-23所示的判定邊界可以如何移動?假設學校對貧困生資助的預算不足,如圖3-23所示的判定邊界可以如何移動?3.6.3判定邊界
在前面線性回歸問題中,我們可以使用決定系數(shù)來評價模型,在分類問題中,我們使用ROC/AUC、F1等指標,這些指標都是值越接近1越好。3.6.4評價指標與模型解釋2網(wǎng)絡中獎詐騙
我們主要使用“分布”小部件對數(shù)據(jù)進行探索性分析。我們已經(jīng)嘗試過使用“散點圖”小部件可視化數(shù)據(jù),這里嘗試通過“分布”小部件來查看項目總結(jié)—3.7—
本章以圖形化的方式著重闡述了分類問題,為什么要采用邏輯回歸方法,以及邏輯回歸的基本思想和方法。通過學生身邊的貧困生判別的案例,分析了分類問題,并在“橙現(xiàn)智能”中采用邏輯回歸算法實現(xiàn)了貧困生的判定。接著深入分析邏輯回歸理論,通過上節(jié)課的線性回歸方法的逐步引導,過渡到邏輯回歸算法,集合圖形化的分析及軟件實操,方便學生真正地理解與應用??蛻袅魇Х诸悓W習目標—4.1—熟練掌握機器學習的步驟理解支持向量機的原理理解決策樹的原理了解集成學習的原理項目引導—4.2—4.2.1問題引導通過學習我們已經(jīng)知道了如何使用邏輯回歸解決分類問題,但是邏輯回歸并不是解決分類問題的唯一方法。你在生活中遇到分類問題,會如何解決呢?(1)請寫出一個你解決生活中分類問題的方法。(2)分組討論各個同學的方法。小明打開“橙現(xiàn)智能”軟件,發(fā)現(xiàn)在“模型”選項卡中有很多算法,比如有“支持向量機”“樹”等。這些算法可以用來做分類嗎?4.2.2初步分析試一試嘗試使用“支持向量機”和“樹”小部件,分析上一章的貧困生判別問題。知識準備—4.3—支持向量機對較小數(shù)據(jù)量的問題有較好的效果,但是很多情況下其結(jié)果缺乏良好的解釋性。決策樹算法在數(shù)據(jù)量足夠的情況下分類效果好,結(jié)果直觀,解釋性強,是一種經(jīng)常使用的算法。項目實戰(zhàn)—4.4—4.4.1數(shù)據(jù)說明我們先試一試能否使用已經(jīng)學過的模型方法解決這個問題,然后再試試支持向量機的方法。預測電信公司客戶流失率開放數(shù)據(jù)源21個字段的內(nèi)容分別如表所示。4.4.1數(shù)據(jù)說明支持向量機—4.5—支持向量機(SupportVectorMachine,SVM)是分類與回歸分析中的一種算法。在二維空間的分類問題中,支持向量機就是找到一條能將數(shù)據(jù)最好分類的線。4.5.1支持向量是什么每個點都可以看作是從原點出發(fā)指向此點的一個向量。支持向量機算法使用這些支持向量作為支撐點,使邊界盡可能寬。在數(shù)學中,向量(也稱矢量),指具有大?。∕agnitude)和方向的量。它可以形象化地表示為帶箭頭的線段。箭頭所指代表向量的方向;線段長度代表向量的大小。與向量對應的量叫作數(shù)量(物理學中稱標量),數(shù)量(或標量)只有大小,沒有方向。4.5.1支持向量是什么
4.5.1支持向量是什么
我們僅從二者的損失函數(shù)角度了解二者對數(shù)據(jù)的敏感程度的區(qū)別,其中,支持向量機的損失函數(shù)是Hingeloss,而邏輯回歸損失函數(shù)是Logisticloss。4.5.2邏輯回歸與支持向量機的比較損失函數(shù)值越小模型越好。在模型訓練的時候,其實就是將損失函數(shù)值不停降低。從圖4-12可見,如果真實值為1的話,兩個損失函數(shù)都是左側(cè)大右側(cè)小,訓練模型大致就是盡量讓取值靠右。4.5.2邏輯回歸與支持向量機的比較觀察二者的損失函數(shù),我們可以注意到以下四點:4.5.2邏輯回歸與支持向量機的比較Hingeloss沒有Logisticloss上升得快。也就是說,Logisticloss對于異常值會有更大的懲罰,導致邏輯回歸對異常點的容忍程度相對較低。不管哪個損失函數(shù),即使分類對了,在邊界附近的值也會受到懲罰,這導致二者都會要求能夠更好地分類,從而使各個值能夠盡可能地遠離邊界。即使一個值被確信地分類了,也就是它離邊界很遠Logisticloss也不會變?yōu)?,這導致邏輯回歸進一步要求所有點都能夠進一步遠離邊界。如果一個值被比較好地分類了,也就是它離邊界比較遠,Hingeloss立即變?yōu)?。這導致支持向量機并不在乎較遠的點到底在哪,它只在意邊界附近的點(支持向量)。在意附近的點是因為根據(jù)第二點,即使支持向量劃分正確Hingeloss也不為0,導致支持向量機僅僅想要將支持向量推離邊界,直到Hingeloss為0。4.5.2邏輯回歸與支持向量機的比較基于以上四點,二者的分類結(jié)果會出現(xiàn)以下兩種顯著區(qū)別:4.5.2邏輯回歸與支持向量機的比較邏輯回歸盡可能提高所有點分類正確的概率,而支持向量機嘗試最大化由支持向量確定的邊界距離。邏輯回歸對錯誤的承受能力更低,它會盡可能地要求所有值都正確分類。支持向量機對錯誤承受能力相對較高,它的目的是更多地將邊界拓寬。項目實戰(zhàn)—4.6—這個項目中,我們使用樹模型搭建工作流。試一試嘗試根據(jù)前面知識,用“樹”小節(jié)點搭建客戶流失分類工作流。決策樹—4.7—決策樹(DecisionTree),就是一個樹形結(jié)構(gòu),樹內(nèi)部的每一個節(jié)點代表的是一個特征,樹的分叉代表根據(jù)某特征的分類規(guī)則,而樹的每一個葉子節(jié)點代表一個最終類別。樹的最高層就是根節(jié)點。圖所示的就是客戶流失的決策樹描述。圖中,背景顏色越紅代表流失率越高,背景顏色越淺代表流失率越低。我們要判斷客戶流失情況,發(fā)現(xiàn)使用Contract可以更好地分類,就使用這個特征做“根”,OneyearorTwoyear分為一類,Month-to-month分為另一類。如果樹太大,分叉就會很多,每個葉子里面的數(shù)據(jù)就會不斷減少,此時的模型還好嗎?使用如圖所示的工作流,將“文件”數(shù)據(jù)連接到“樹”,“樹”模型連接到“查看樹”,打開“查看樹”觀察樹模型,嘗試解釋你的模型。想一想客戶流失分類項目實戰(zhàn)—4.8—在實際使用中,我們常常會使用基于樹的模型,而不是僅僅使用樹模型。基于樹的模型有很多,比如隨機森林、堆疊、提升等算法。此項目中,我們使用此類算法,搭建客戶流失分類工作流。這些算法的特點就是使用多棵樹組合形成一個新的模型,所以叫作集成學習。使用隨機森林、堆疊、自適應提升算法搭建客戶流失分類工作流。如果有問題,請單擊小部件左下角的“?”查看幫助文檔。試一試項目實施在軟件中選擇“隨機森林”和“自適應提升算法”,并建立如圖所示的工作流。深入分析—4.9—集成學習有一些共同點,也有很多不同點,我們深入分析一下這些方法的原理,方便自己可以調(diào)試出更好的模型。集成學習的好處就是可以讓被集成的子模型們集思廣益,起到三個臭皮匠賽過諸葛亮的效果。自助抽樣就是隨機有放回的抽樣。比如,如圖所示的果籃,我們從中取出一個水果,記錄一下是什么但是沒吃掉又原樣放回去了,然后再取出一個水果再記錄,完成三碗的抽樣。自助抽樣在理解集成學習前,我們先了解一下什么是自助抽樣(Bootstrap)。袋裝投票方法是袋裝常用的一種方法。從訓練集中自助抽樣出n個樣本集,建立n個決策樹模型,然后這幾個模型投票決定結(jié)果(圖4-25)。堆疊類似袋裝,它們最大的不同出現(xiàn)在投票階段。在堆疊中,其投票方法不是袋裝那樣簡單的“誰多聽誰的”,而是將各個模型的預測結(jié)果作為輸入,通入另一個“集成者”,讓它判斷最后結(jié)果到底是什么。堆疊隨機森林不僅對樣本進行自助抽樣,而且對特征也進行抽樣,每次抽m個特征(m一般為所有特征個數(shù)的平方根)。對特征抽樣是為了防止特征之間的相關性對模型的影響。隨機森林與袋裝類似,提升算法的基本思想方法都是把多個弱分類器集成為強分類器。提升中每一次迭代則是基于前一次的數(shù)據(jù)進行修正,提高前一次模型中分錯樣本在下次抽中的概率。提升
自適應提升提升算法是數(shù)據(jù)分析中十分熱門的算法,這里我們介紹一下提升算法中基礎的一個算法Adaboosting(AdaptiveBoosting),即自適應提升,其自適應在于:前一個分類器分錯的樣本會被用來訓練下一個分類器。我們通過圖來了解一下這個過程。假設對圖4-28中兩種顏色的點進行分類。自適應提升這個時候每一個數(shù)據(jù)的權(quán)重都一樣,模型f1簡單地如圖4-29所示做了分類??梢园l(fā)現(xiàn),這個簡單的劃分有大量的劃分錯誤,這個時候算法增大了錯誤數(shù)據(jù)的權(quán)重,如圖中的右圖顯示就是增大了點的大小。由于模型f1中錯誤的數(shù)據(jù)權(quán)重增大了,所以模型f2會更注重將f1分錯的點分對,即如圖4-30所示進行分類。自適應提升根據(jù)模型的錯誤率給模型賦予權(quán)重,錯誤率低權(quán)重就高,錯誤率高權(quán)重就低,也就是算法更看重分類效果好的模型的預測結(jié)果。然后將模型的預測結(jié)果加權(quán)相加,就是最后自適應提升的結(jié)果。自適應提升
通過增多弱分類器的數(shù)目,一般可以提高最終模型的準確率。如圖所示,更多的模型一起努力,得出一個強分類器。自適應提升本章小結(jié)—4.10—本章通過引入客戶流失分類這個問題,分別詳細比較了邏輯回歸、支持向量機、決策樹和隨機森林等算法在分類問題中的應用,并引導大家了解如何使用可視化功能查看數(shù)據(jù),結(jié)合模型給出的結(jié)果,為業(yè)務優(yōu)化打下基礎。
課后練習—4.11—(1)為什么支持向量機可以理解為“最寬大街法”?(2)支持向量機對異常值敏感嗎?為什么?(3)用自己生活中的例子說明樹模型的判斷過程。(4)使用“橙現(xiàn)智能”提供的可視化方法,加深自己對數(shù)據(jù)的認知,你有什么新發(fā)現(xiàn)?(5)采用“查看樹”小部件,你如何改善書中電信公司的客戶流失情況呢?圖像識別學習目標—5.1—知識目標了解深度學習的含義了解卷積神經(jīng)網(wǎng)絡的基本原理理解卷積的意義了解著名的卷積神經(jīng)網(wǎng)絡模型項目引導—5.2—前面例子中,小明使用帶有若干特征的數(shù)據(jù),采用邏輯回歸等方法解決了客戶流失等問題。但是如果涉及的是一個圖像識別問題,如簡單的手寫數(shù)字識別問題(圖5-2),應該如何做才能知道每一張圖片中是什么數(shù)字呢?5.2.1問題引導(1)假設把每一個像素看作一個特征,而且可以使用邏輯回歸進行手寫數(shù)字識別運算,那么可以使用同樣方法進行各類圖片識別嗎?如果圖像像素數(shù)量很大則有什么問題嗎?(2)如果不想將每一個像素看作一個特征,你可以根據(jù)要分類的圖片設計特征嗎?以手寫數(shù)字識別為例,試試設計你設計的特征。試一試5.2.1問題引導5.2.2初步分析如果將圖片的每一個像素看作一個特征,則特征的數(shù)量太多,計算機資源消耗會較大。而如果要我們?nèi)斯とふ覉D像特征,則費時費力還不一定好。既然機器學習可以學習目標分類方法,那么機器學習能學習特征嗎?再將這些學習到的特征進行邏輯回歸,這樣可以嗎?知識準備—5.3—“神經(jīng)網(wǎng)絡”算法可以做到自動學習特征并用于分類等任務。現(xiàn)代的“人工神經(jīng)網(wǎng)絡”受生物神經(jīng)的啟發(fā)逐步發(fā)展而來,生物神經(jīng)網(wǎng)絡中最基本的組織是神經(jīng)元,如所示的是一個人大腦中的神經(jīng)元,我們的大腦由大量的神經(jīng)元連接而成。5.3.1神經(jīng)網(wǎng)絡對于神經(jīng)網(wǎng)絡算法,如圖所示,我們可以將數(shù)個邏輯回歸一層一層地疊加起來,每一層都學習一些特征,最終學習出合適的特征,并通過最后一層邏輯回歸達到分類的目的。5.3.1神經(jīng)網(wǎng)絡神經(jīng)網(wǎng)絡如果進一步增加深度,就是深度神經(jīng)網(wǎng)絡,用這種網(wǎng)絡進行的機器學習就是深度學習。如圖所示,深度神經(jīng)網(wǎng)絡可以分為輸入層、隱藏層和輸出層。5.3.2深度學習深入分析1—5.4—如圖所示,僅僅一個32像素的輸入,3層隱藏層就需要很多的連接,進而產(chǎn)生很多的參數(shù),這會導致計算效率的極大降低。為了處理這個問題,我們可以使用卷積神經(jīng)網(wǎng)絡(CNN)進行圖像識別。
卷積神經(jīng)網(wǎng)絡—5.6—圖像識別是指利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對象的技術?,F(xiàn)階段圖像識別技術一般分為人臉識別與商品識別,人臉識別主要運用在安全檢查、身份核驗與移動支付中;商品識別主要運用在商品流通過程中,特別是無人貨架、智能零售柜等無人零售領域。5.6.1圖像識別如果神經(jīng)網(wǎng)絡的每層按照如圖所示的三個維度組織:寬度、高度和深度,一層中的神經(jīng)元不連接到下一層中的所有神經(jīng)元,而僅連接到它的一小部分區(qū)域,最終的輸出將被減少到一個沿著深度方向的概率值向量,這種形式的神經(jīng)網(wǎng)絡就是卷積神經(jīng)網(wǎng)絡(ConvolutionalNeuralNetworks,CNN)。5.6.2卷積神經(jīng)網(wǎng)絡(CNN)深入分析2—5.7—圖像識別問題的第一個特點就是圖像具有局部相關性。5.7.1圖像識別的特點圖像具有空間不變性,具體來說就是圖像在有限位移、尺度、形狀變化后,仍然可以分辨。5.7.2使用卷積神經(jīng)網(wǎng)絡為什么有效卷積神經(jīng)網(wǎng)絡可以通過以下4個手段保持了局部相關性和空間不變性:局部連接權(quán)值共享池化操作多層次結(jié)構(gòu)5.7.2使用卷積神經(jīng)網(wǎng)絡為什么有效卷積神經(jīng)網(wǎng)絡使用隱藏層進行特征提取,通過執(zhí)行一系列的數(shù)學運算來檢測特征。遷移學習—5.8—遷移學習(TransferLearning)顧名思義就是將訓練好的模型(預訓練模型)參數(shù)遷移到新的模型來優(yōu)化新模型訓練。
這里介紹幾個著名的卷積神經(jīng)網(wǎng)絡模型,以上項目很可能就是基于這些模型中的某個模型做的遷移學習。LeNet-5LeNet-5是YannLeCun在1998年設計的用于手寫數(shù)字識別的卷積神經(jīng)網(wǎng)絡,當年美國大多數(shù)銀行就是用它來識別支票上面的手寫數(shù)字的,它是早期卷積神經(jīng)網(wǎng)絡中最有代表性的實驗系統(tǒng)之一。
AlexNet(見圖5-37)于2012年由AlexKrizhevsky、IlyaSutskever和GeoffreyHinton等人提出,并在2012ILSVRC(ImageNetLarge-ScaleVisualRecognitionChallenge)中取得了最佳的成績。AlexNet這個網(wǎng)絡于2014年被牛津大學的KarenSimonyan和AndrewZisserman提出,主要特點是“簡潔,有深度”。有深度,是因為VggNet有19層,遠遠超過了它的前輩;而簡潔,則是在于它的結(jié)構(gòu)上,一律采用步幅為1的3×3濾波器,以及步幅為2的2×2最大池化。VggNetGoogLeNet是2014年ChristianSzegedy提出的一種全新的深度學習結(jié)構(gòu),GoogLeNet的提出從另一種角度來提升訓練結(jié)果:它能更高效地利用計算資源,在相同的計算量下能提取到更多的特征,從而提升訓練結(jié)果GoogLeNetCNN面臨的一個問題就是,隨著層數(shù)的增加,CNN的效果會遇到瓶頸,甚至會不增反降。這往往是梯度爆炸或者梯度消失引起的。ResNet就是為了解決這個問題而提出的,因而能幫助我們訓練更深的網(wǎng)絡。如圖所示,它引入了一個殘差塊來解決上述問題。ResNet本章小結(jié)—5.9—本章以邏輯回歸為起點,引入神經(jīng)網(wǎng)絡。本章的重點是神經(jīng)網(wǎng)絡在深度學習領域的應用,如圖像識別中的應用。通過卷積神經(jīng)網(wǎng)絡的學習,讀者能夠大致理解其原理,可以調(diào)用人工智能相關企業(yè)的人工智能開發(fā)接口進行簡單的圖像識別應用。讀者能夠理解各個技術在本領域的作用,建立大致的知識體系。課后練習—5.10—(1)生活中有哪些圖像識別的例子?(2)為什么使用卷積神經(jīng)網(wǎng)絡做圖像識別?(3)深度學習和邏輯回歸有什么關系?(4)在“橙現(xiàn)智能”中調(diào)節(jié)參數(shù),訓練出更好的MNIST模型。自然語言處理學習目標—6.1—知識目標了解自然語言處理的含義理解自然語言數(shù)字化的基本方法了解神經(jīng)網(wǎng)絡在自然語言處理中的作用項目引導—6.2—6.2.1問題引導假設有一句話:“小明和同學們經(jīng)常乘地鐵去動物園觀看動物,去植物園觀賞植物。”你可以如何將這句話轉(zhuǎn)變?yōu)閿?shù)字,以方便計算機處理呢?地圖可以將一個地名轉(zhuǎn)變?yōu)閷慕?jīng)緯度數(shù)字表示,我們可以用類似方法建立一個語言地圖,實現(xiàn)我們?nèi)粘UZ言轉(zhuǎn)換為語言地圖上的坐標嗎?這樣是不是就可以實現(xiàn)語言到數(shù)字的轉(zhuǎn)變了呢?6.2.2初步分析假設每個詞都可以在地圖上找到對應的位置,你如何將每個詞數(shù)字化呢?這些數(shù)字化后的詞可以比較詞義關系嗎?想一想知識準備—6.3—自然語言處理能實現(xiàn)人與計算機之間用自然語言進行有效通信,是一門融語言學、計算機科學、數(shù)學于一體的科學。它包括很多的內(nèi)容,如語義分析、信息抽取、機器翻譯等。其主要難點有單詞之間的分界的確定、詞義的消歧、句法的模糊性和有瑕疵的或不規(guī)范的輸入等。6.3.1自然語言處理是什么一個解決方法就是詞嵌入,即將詞映射到一個向量空間,也就是將詞嵌入另一個便于計算的空間。6.3.2機器如何理解自然語言6.3.3一個數(shù)字代表一個詞(獨熱編碼)
設想最簡單的詞嵌入表達方法,我們用自然數(shù)對應各個詞。例如,要把英文數(shù)字化,假設從“a”到“zoom”有100個詞,如圖所示,就用1代表“a”,2代表“abbreviation”,一直到100代表“zoom”。在計算機中,為了使用方便,會將這些數(shù)字以另外一種形式存儲。例如,在上面的英文數(shù)字化例子中,設計一個長度為100的由0或者1組成的數(shù)字串(向量),此數(shù)字串(向量)只有一個位置為1,其他99個位置全是0。若將1看作“熱”,0看作“冷”,則這個向量只有一個位置“熱”,所以叫作獨熱編碼。6.3.3一個數(shù)字代表一個詞(獨熱編碼)“a”用1表示,獨熱編碼后就是只有第一個位置為1;“abbreviation”用2表示,獨熱編碼后就是第2個位置為1;“zoom”用100表示,獨熱編碼后就是第100個位置為1。6.3.3一個數(shù)字代表一個詞(獨熱編碼)此模型可以分辨詞與詞之間的關系嗎?想一想設想有一個小動物園,有三種動物:獅子、老虎、斑馬,如果采用獨熱編碼,這三種動物就可以分別編碼為(0,0,1),(0,1,0)和(1,0,0)這樣的向量。這三個向量如果放在一個三維空間中,就是如圖所示的樣子。
6.3.3一個數(shù)字代表一個詞(獨熱編碼)憑我們對動物的了解,獅子和老虎都是食肉動物,關系應該比跟斑馬要近吧,但是從圖中,我們看不出誰跟誰關系更近。這說明目前的獨熱編碼無法解決詞義關聯(lián)的問題,我們需要某種方法,能告訴我們一個詞和另一個詞的關系有多遠或者多近。6.3.3一個數(shù)字代表一個詞(獨熱編碼)6.3.4詞袋模型要解決詞與詞之間的關系問題并不是很容易,如果只比較一段文本和另一段文本的關系呢?人們想出了另外一個簡單的方法,詞袋(BagofWords,BoW)模型。深入分析—6.4—神經(jīng)網(wǎng)絡語言模型(NeuralNetworkLanguageModel,NNLM)它可以采用Word2Vec等詞嵌入方法,很好地捕獲每個詞的意義。這些方法相對之前的方法很好地表達了自然語言。6.4.1神經(jīng)網(wǎng)絡語言模型雖然Word2Vec等方法看起來十分優(yōu)秀,但是在實際工作中并沒有表現(xiàn)得十分出色。這是為什么呢?主要就是一詞多義的問題。6.4.2一詞多義如圖沿著這個思路,我們可以得到ELMo,即EmbeddingfromLanguageModels。ELMo可以在實際使用中根據(jù)上下文動態(tài)調(diào)整詞的向量表示(即語義)。6.4.2一詞多義ELMo使用LSTM提取特征,那么什么是提取特征?LSTM又是什么呢?語言數(shù)字化為向量之后怎么用呢?所有向量作為特征輸入某個模型嗎?特征提取就像在圖像識別中,我們很難將成千上萬的向量輸入模型中直接運算,而是想要提取出特征,然后將這些特征作為后面模型的輸入。RNN特征提取ConvolutionalNeuralNetworks,CNN特征提取每一個輸出不僅與當前輸入有關,還和前面的輸出有關。長短期記憶網(wǎng)絡LSTM一種特殊的RNN網(wǎng)絡,長短期記憶網(wǎng)絡(LongShortTermMemorynetworks,LSTM)不僅僅能記住附近有什么詞,還能夠記住較遠的詞,但是長句不理想,并行計算也不好Transformer它是谷歌在2017年做機器翻譯任務的“Attentionisallyouneed”論文中提出的。其中使用了Attention,即注意力機制。這就解決了LSTM的處理長句方面不太理想和并行計算能力有限這兩個問題。2018年出現(xiàn)的BERT(BidirectionalEncoderRepresentationsfromTransformers)即在ELMo和Transformer基礎上,進一步提高了自然語言處理(NLP)在各個任務中的表現(xiàn)。本章小結(jié)—6.5—本章介紹了不使用神經(jīng)網(wǎng)絡的傳統(tǒng)的方法進行自然語言處理。重點是理解自然語言處理的數(shù)字化方法,了解神經(jīng)網(wǎng)絡語言模型的意義。通過使用“橙現(xiàn)智能”軟件,讀者可以完成語句的分詞等基本任務,并理解在分詞基礎上可以進行更深入的分析。
課后練習—6.6—(1)簡述自然語言處理中詞嵌入的含義。(2)在你的學習工作中有哪些場景可能會用到自然語言處理?(3)在“橙現(xiàn)智能”對文本進行分類時,可以使用軟件內(nèi)置的哪些數(shù)據(jù)?(4)探索“橙現(xiàn)智能”的自然語言處理模塊功能。爬行機器人波士頓動力公司的大狗(BigDog)。它能行走、奔跑、攀爬以及負載重物。大狗的四條腿和動物一樣擁有關節(jié),可吸收沖擊能量,每邁出一步就回收部分能量,以此帶動下一步。知識目標了解強化學習的含義了解強化學習的含義理了解如何在不確定的世界做決策了解Q學習的基本原理知識準備—7.1—強化學習就像是小孩子學走路,沒有哪個小孩子學走路是拿著“走路寶典”學會的,每個小孩子都是靠不斷地嘗試、摔跤、站起來繼續(xù)嘗試這樣不斷的“迭代”學會的。著名的波士頓動力大狗也是靠多次摔跤才學會各種炫酷的動作的。7.1.1強化學習7.1.2充滿不確定性的世界在現(xiàn)實世界中,我們的某一個動作不一定會帶來特定結(jié)果,這個結(jié)果往往是不確定的,我們真實的世界是一個不確定的世界。如圖所示,機器人想向前走,但是最終會到達哪里,并不確定。世界中充滿了危險和誘惑。如果是一個確定的世界,那機器人的選擇將會很簡單,直接走向鉆石成為人生贏家。但是世界不是這么簡單,是不確定的。7.1.3不確定的世界如何做決策如果沒有不確定性,機器人要繞路嗎?要繞多遠?如果有一點不確定性,機器人要繞路嗎?要繞多遠?如果有很大不確定性,機器人要繞路嗎?要繞多遠?生存回報—7.2—智能體走任意一步,不管怎么走,走到哪里,都會接收這個回報,它可能為正,也可能為負。這就是小孩子每走一步都會耗費一定的體力。不過如果我們忽略小孩子體力的問題,將小孩子學走路的生存回報變?yōu)槊孔咭徊骄徒o某個獎勵,小孩子可能就會嘗試一直走從而能夠一直得到這種獎勵。試一試深入分析—7.3—
探索與利用
學習率告訴我們當前體驗相對歷史經(jīng)驗有多大成分會影響我們的判斷。如何設置學習率,也是一個重要的技術。具體的設置,在每個任務中都會不同,一般來說開始的時候設置較大的學習率進行快速學習,隨后降低學習率慢慢學習。學習率本章小結(jié)—7.4—本章介紹了強化學習的基礎。真實的世界有著各種不確定性,強化學習幫助我們解決這類問題。通過對回報和Q值的感性認識,體驗Q學習。接著介紹了探索與利用的作用、學習率的重要性,并親自動手訓練一個爬行機器人。
課后練習—7.5—(1)除了小孩子學走路,生活中有沒有什么類似強化學習的例子?(2)生活中有沒有什么體現(xiàn)了合理設置回報的例子?(3)你認為如何設置參數(shù),爬行機器人會更快地到達終點?人工智能應用展學習目標—8.1—知識目標了解人工智能在圖像領域的應用了解人工智能在語言和語音方面的應用了解遷移學習的基本原理了解生成對抗網(wǎng)絡的基本原理理解推薦系統(tǒng)的基本原理展廳服務機器人—8.2—8.2.1人臉識別機器人怎么識別這個人是誰呢?使用了人臉識別和語音交互技術。8.2.1人臉識別人臉識別的過程中有4個關鍵的步驟:人臉檢測、人臉對齊、人臉編碼和人臉匹配。人臉檢測的目的是尋找圖片中人臉的位置。當發(fā)現(xiàn)有人臉出現(xiàn)在圖片中時,不管這個臉是誰,都會標記出人臉的坐標信息,或者將人臉切割出來。人臉檢測同一個人會有的姿態(tài)和表情,即使這個人大笑或者大哭我們也可以識別出來。機器要做到這一點,就需要將人臉圖像都變換到一個統(tǒng)一的角度和姿態(tài),這就是人臉對齊,如圖所示。它的原理是找到人臉的若干個關鍵點,將人臉盡可能變換到標準人臉。人臉對齊人臉編碼經(jīng)過前兩步之后,人臉圖像的像素值會被轉(zhuǎn)換成一串數(shù)字(向量)。理想情況下,一個人臉會對應類似的一串數(shù)字(向量),如圖所示。每個人臉都有了對應的一串數(shù)字,我們就可以根據(jù)這一串數(shù)字計算出最匹配的兩串數(shù)字,從而找出某張圖片對應的那個人是誰,如圖所示。人臉匹配8.2.2語音交互語音交互指的是人類與設備通過自然語音進行信息的交互。使用自動語音識別技術(ASR)將語音轉(zhuǎn)換為對應的指令文本通過自然語言處理(NLP)將此文本轉(zhuǎn)換為對應的機器可以理解的語言。使用內(nèi)置的各項功能,處理用戶的指令,最后通過使用語音合成技術,回復用戶。人物動漫化—8.3—計算機將人物照片轉(zhuǎn)化成動漫卡通形象采用的是生成對抗網(wǎng)絡技術
8.3.1生成對抗網(wǎng)絡核心思想生成對抗網(wǎng)絡是由Goodfellow于2014年提出的一種生成模型,其核心思想是“零和博弈”。8.3.2生成模型和判別模型生成對抗網(wǎng)絡模型主要包括兩部分:生成模型和判別模型。生成模型是指我們可以根據(jù)任務、通過模型訓練輸入的數(shù)據(jù)生成文字、圖像、視頻等數(shù)據(jù),類似上述籃球運動員不斷訓練的過程。判別模型會對生成模型生成的圖像等數(shù)據(jù)進行判斷,判斷其是否是真實的訓練數(shù)據(jù),類似上述籃球教練不斷判斷運動員訓練效果的過程。智能音樂創(chuàng)作—8.4—人工智能創(chuàng)作音樂也是借助深度學習來實現(xiàn)的。
典型的人工智能創(chuàng)作音樂是借助深度學習來實現(xiàn)的,和AlphaGo有著很大的相似之處。借助大量的原始音樂素材,從熱門舞曲到經(jīng)典的輕音樂,深度學習的長短期記憶網(wǎng)絡算法(LSTM)通過分析,找到其中潛在的模式,進而學習到節(jié)奏、長度及音符之間的關系,然后就可以寫出自己的旋律8.4.1人工智能如何創(chuàng)作音樂事實上,任何音樂都是從隨機選擇聲音并將它們組合成一段旋律開始的。早在1787年,莫扎特就提出了一個骰子游戲目的就是隨機地進行聲音選擇。他手工創(chuàng)作了近272個音調(diào),然后,根據(jù)兩個骰子的總和來選擇一個音調(diào)。8.4.2什么是自動音樂生成
8.4.3怎樣利用深度學習實現(xiàn)自動音樂生成利用人工智能創(chuàng)作的音樂,可能是為我們每一個人量身創(chuàng)作的,比如可能參考你的音樂偏好、身體習慣甚至心跳數(shù)據(jù),等等。采用深度學習的方法創(chuàng)作音樂,也是通過大量的音樂數(shù)據(jù)進行模型訓練,之后采用訓練好的模型自動生成音樂。
8.4.3怎樣利用深度學習實現(xiàn)自動音樂生成利用人工智能創(chuàng)作的音樂,可能是為我們每一個人量身創(chuàng)作的,比如可能參考你的音樂偏好、身體習慣甚至心跳數(shù)據(jù),等等。采用深度學習的方法創(chuàng)作音樂,也是通過大量的音樂數(shù)據(jù)進行模型訓練,之后采用訓練好的模型自動生成音樂。遷移學習—8.5—遷移學習概述遷移學習就是把已經(jīng)訓練好的模型參數(shù)遷移到新的模型中來幫助新模型訓練??紤]到大部分數(shù)據(jù)或任務是存在相關性的,所以通過遷移學習,我們可以將已經(jīng)學到的模型參數(shù)通過某種方式來分享給新模型,從而加快并優(yōu)化模型的學習效率,不用像大多數(shù)網(wǎng)絡那樣從零學習了。8.5.2深度學習和遷移學習結(jié)合深度學習需要大量的高質(zhì)量標注數(shù)據(jù),預訓練然后微調(diào)模型是現(xiàn)在深度學習中一個非常流行的技巧,以圖像識別領域為例,很多時候會選擇預訓練的ImageNet對模型進行初始化。自動駕駛技術—8.6—8.6.1自動駕駛級別自動駕駛汽車的自動化程度分為6個等級8.6.2自動駕駛原理自動駕駛汽車的核心是感知能力,它有4種不同視野的眼睛,包括無線雷達、激光雷達、超聲波雷達和攝像頭,通過它們能得到不
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度臨時保安服務合同-活動期間安全保衛(wèi)
- 2025年度知識產(chǎn)權(quán)質(zhì)押合同終止及質(zhì)權(quán)實現(xiàn)協(xié)議
- 產(chǎn)品發(fā)布營銷策略規(guī)劃
- 影視制作發(fā)行合作框架協(xié)議
- 智能能源管理系統(tǒng)建設投資協(xié)議
- 家具企業(yè)家具設計與制造預案
- 哈他瑜伽介紹課件:哈他瑜伽-身心平衡的藝術
- 小學生心理輔導觀后感
- 網(wǎng)絡購物平臺合作運營協(xié)議書
- 娛樂項目節(jié)目制作授權(quán)協(xié)議
- 透明度的測定SL87
- 消防設施定期檢查、檢測、維修保養(yǎng)記錄
- 論十大關系全文
- 涂裝工技能鑒定考試題庫匯總-下(多選、判斷題部分)
- 2021年山東能源集團西北礦業(yè)有限公司招聘筆試試題及答案解析
- 售后服務流程圖
- 建筑地基處理技術規(guī)范JGJ79-2012
- 印象主義、后印象主義課件
- 日常監(jiān)督檢查表
- 隊列訓練教程ppt課件(PPT 86頁)
- 第三章-農(nóng)村公共管理組織課件
評論
0/150
提交評論