




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
機器學習導論(2016春季學期)一、緒論
1ppt課件機器學習機器學習是從人工智能中產(chǎn)生的一個重要學科分支,是實現(xiàn)智能化的關鍵2ppt課件機器學習機器學習(MachineLearning)究竟是什么東東?看個例子3ppt課件“文獻篩選”的故事[C.Brodleyetal.,AIMagazine2012]在“循證醫(yī)學”(evidence-basedmedicine)中,針對特定的臨床問題,先要對相關研究報告進行詳盡評估查詢PubMed以獲取候選摘要人工找出值得全文審讀的文章4ppt課件“文獻篩選”的故事
在一項關于嬰兒和兒童殘疾的研 究中,美國Tufts醫(yī)學中心篩選 了約33,000篇摘要 盡管Tufts醫(yī)學中心的專家效率 很高,對每篇摘要只需30秒鐘,但該工作仍花費了250小時每項新的研究都要重復
這個麻煩的過程!需篩選的文章數(shù)在不斷顯著增長!5ppt課件“文獻篩選”的故事為了降低昂貴的成本,Tufts醫(yī)學中心引入了機器學習技術邀請專家閱讀少量摘要,標記為“有關”或“無關”分類模型對是否“有關”進行預測人類專家只需閱讀50篇摘要,系統(tǒng)的自動篩選精度就達到93%人類專家閱讀1,000篇摘要,則系統(tǒng)的自動篩選敏感度達到95%(人類專家以前需閱讀33,000篇摘要才能獲得此效果)6ppt課件色澤根蒂敲聲好瓜青綠蜷縮濁響是烏黑蜷縮濁響是青綠硬挺清脆否烏黑稍蜷沉悶否決策樹,神經(jīng)網(wǎng)絡,支持向量機,
Boosting,貝葉斯網(wǎng),……模型訓練數(shù)據(jù)(label)訓練
新數(shù)據(jù)樣本(淺白,蜷縮,濁響,?)
?=是類別標記 未知典型的機器學習過程
使用學習算法(learningalgorithm)
類別標記7ppt課件機器學習與數(shù)據(jù)挖掘8ppt課件機器學習能做什么?我們可能每天都在用機器學習9ppt課件權16南京大學機器學習導論課程專用所有20保留
機器 學習
模型
搜索引擎機器學習技術正在支撐著各種搜索引擎
搜索:南京大學例如:互聯(lián)網(wǎng)搜索
……10ppt課件有器學習導論課程專保留權用所2016南京大學機例如:自動汽車駕駛(即將改變?nèi)祟惿睿C器學習模型方向盤旋 轉(zhuǎn)幅度油門幅度剎車幅度車載攝像頭
車載雷達 控制汽車
美國在20世紀
80年代就開始 研究基于機器 學習的汽車自
動駕駛技術DARPAGrandChallenge–200411ppt課件2016南京大學機器學習導論課程專用所有權保留機器學習能做什么?小數(shù)據(jù)上就已經(jīng)很有用12ppt課件2016南京大學機器學習導論課程專用所有權保留例如:畫作鑒別(藝術)
畫作鑒別(paintingauthentication):確定作品的真?zhèn)?/p>
勃魯蓋爾(1525-1569)
的作品?
出自[J.Hughesetal.,PNAS2009]梵高(1853-1890)的作品?
出自[C.Johnsonetal.,IEEE-SP,2008]13ppt課件機器學習導論2016南京大學課程專用所有權保留例如:畫作鑒別(藝術)除專用技術手段外,筆觸分析(brushstrokeanalysis)是畫作鑒定的重要工具;它旨在從視覺上判斷畫作中是否具有藝術家的特有“筆跡”。該工作對專業(yè)知識要求極高-具有較高的繪畫藝術修養(yǎng)-掌握畫家的特定繪畫習慣只有少數(shù)專家花費很大精力才能完成分析工作!
很難同時掌握不同時期、不同流派多位畫家的繪畫風格![C.Johnsonetal.,IEEE-SP,2008]14ppt課件論課程專用所有權16南京大學20機器學習導保留例如:畫作鑒別(藝術)真跡+贗品特有“筆跡”待鑒定畫作為了降低分析成本,機器學習技術被引入
自動鑒定
分類模型Kr?llerMüller美術館與Cornell等大學的學者對82幅梵高真跡和6幅贗品進行分析,自動鑒別精度達95%[C.Johnsonetal.,IEEE-SP,2008]Dartmouth學院、巴黎高師的學者對8幅勃魯蓋爾真跡和5幅贗品進行分析,自動鑒別精度達100%[J.Hughesetal.,PNAS2009][J.Mairaletal.,PAMI’12](對用戶要求低、準確高效、適用范圍廣)15ppt課件2016南京大學機器學習導論課程專用所有權保留例如:古文獻修復(文化)
古文獻是進行歷史研究的重要素材,但是其中很多損毀嚴重
DeadSeaScrolls(死海古卷)
-1947年出土
-超過30,000個羊皮紙片段
CairoGenizah -19世紀末被發(fā)現(xiàn)
-超過300,000個片段
-散布于全球多家博物館
高水平專家的大量精力
被用于古文獻修復[L.Wolfetal.,IJCV2011]16ppt課件2016南京大學機器學習導論課程專用所有權保留例如:古文獻修復(文化)一個重要問題:
原書籍已經(jīng)變成分散且混雜的多個書頁,如何拼接相鄰的書頁?
人工完成書頁拼接十分困難
-書頁數(shù)量大,且分布在多處
-部分損毀較嚴重,字跡模糊
-需要大量掌握古文字的專業(yè)人才
近年來,古文獻的數(shù)字化浪潮給自動文學修復提供了機會17ppt課件所有權保留2016南京大學機器學習導論課程專用例如:古文獻修復(文化)以色列特拉維夫大學的學者將機器學習用于自動的書頁拼接已確定相鄰已確定不相鄰分類模型
判斷是否相鄰專家確認相鄰在CairoGenizah測試數(shù)據(jù)上,系統(tǒng)的自動判斷精度超過93%新完成約1,000篇CairoGenizah文章的拼接(對比:過去整個世紀,數(shù)百人類專家只完成了幾千篇文章拼接)18ppt課件2016南京大學機器學習導論課程專用所有權保留機器學習能做什么?大數(shù)據(jù)上更驚人19ppt課件2016南京大學機器學習導論課程專用所有權保留例如:幫助奧巴馬勝選(政治)《時代》周刊20ppt課件2016南京大學機器學習導論課程專用所有權保留例如:幫助奧巴馬勝選(政治)通過機器學習模型:
在總統(tǒng)候選人第一次辯論后,分析出哪些選民將倒戈,為每位選民找出一
個最能說服他的理由
精準定位不同選民群體,建議購買冷門廣告時段,廣告資金效率比2008年 提高14%
向奧巴馬推薦,競選后期應當在什么地方展開活動——那里有很多爭取
對象
借助模型幫助奧巴馬籌集到創(chuàng)紀錄的10億美元
例如:利用模型分析出,明星喬治克魯尼(GeorgeClooney)對于年齡在40- 49歲的美西地區(qū)女性頗具吸引力,而她們恰是最愿意為和克魯尼/奧巴馬共 進晚餐而掏錢的人……喬治克魯尼為奧巴馬舉辦的競選籌資晚宴成功募集 到1500萬美元
……21ppt課件導論課程專用學習2016南京大學機器所有權保留例如:幫助奧巴馬勝選(政治)
隊長:RayidGhani
卡內(nèi)基梅隆大學機器學習系 首任系主任TomMitchell
教授的博士生
這個團隊行動保密,定期向奧巴馬報送結(jié)果; 被奧巴馬公開稱為總統(tǒng)競選的“核武器按鈕”(“Theyareournuclearcodes”)22ppt課件權專用所有2016南京大學機器學習導論課程保留
約翰麥卡錫
(1927-2011)“人工智能之父”1971年圖靈獎1956年夏美國達特茅斯學院J.McCarthy,M.Minsky,N.Lochester,C.E.Shannon,H.A.Simon,A.Newell,A.L.Samuel等10余人達特茅斯會議標志著人工智能這一學科的誕生JohnMcCarthy(1927-2011):
1971年獲圖靈獎,1985年獲IJCAI終身成就獎。人工智能之父。他提出了“人工智能”的概念,設計出函數(shù)型程序設計語言Lisp,發(fā)展了遞歸的概念,提出常識推理和情境演算。出生于共產(chǎn)黨家庭,從小閱讀《10萬個為什么》,中學時自修CalTech的數(shù)學課程,17歲進入CalTech時免修兩年數(shù)學,22歲在Princeton獲博士學位,37歲擔任Stanford大學AI實驗室主任。機器學習源自“人工智能”
ArtificialIntelligence(AI),1956-23ppt課件權程專用所有保16南京大20學機器學習導論課留赫伯特西蒙
(1916-2001)1975年圖靈獎第一階段:推理期
1956-1960s:LogicReasoning
出發(fā)點:“數(shù)學家真聰明!”
主要成就:自動定理證明系統(tǒng)(例如,
西蒙與紐厄爾的“LogicTheorist”
系統(tǒng))漸漸地,研究者們意識到,僅有邏輯推理能力是不夠的…
阿倫紐厄爾
(1927-1992) 1975年圖靈獎24ppt課件用所有權保留2016南京大學機器學習導論課程專
出發(fā)點:“知識就是力量!”愛德華費根鮑姆
(1936-)
1994年圖靈獎
主要成就:專家系統(tǒng)(例如,費根鮑
姆等人的“DENDRAL”系統(tǒng))
漸漸地,研究者們發(fā)現(xiàn),要總結(jié)出知識再“教”給
系統(tǒng),實在太難了…第二階段:知識期
1970s-1980s:KnowledgeEngineering25ppt課件2016南京大學機器學習導論課程專用所有權保留
出發(fā)點:“讓系統(tǒng)自己學!”第三階段:學習期
1990s-now:MachineLearning
主要成就:……
機器學習是作為“突破知識工程瓶頸” 之利器而出現(xiàn)的恰好在20世紀90年代中后期,人類發(fā)現(xiàn)自己淹沒在數(shù)據(jù)的汪洋中,對自動數(shù)據(jù)分析技術——機器學習的需求日益迫切26ppt課件權專用所有16南京大學機器學保習導論留課程20
汽車自動駕駛(DARPAGrandChallenge)機器學習已經(jīng)“無處不在”
入侵檢測
Web搜索 生物信息學 決策助手(DARPA)火星機器人(JPL)27ppt課件2016南京大學機器學習導論課程專用所有權保留今天的“機器學習”已經(jīng)是一個廣袤的學科領域經(jīng)常被談到的“深度學習”
(DeepLearning)僅是
機器學習中的一個小分支 例如,這是第32屆 國際機器學習大會 的“主題領域”
2006年,美國CMU
(卡內(nèi)基梅隆大學)成立“機器學習系”28ppt課件導論課程專用所2016南京大學機器學習有權保留大數(shù)據(jù)時代的關鍵技術奧巴馬提出“大數(shù)據(jù)計劃”后,美國NSF進一步加強資助UCBerkeley研究如何整合將”數(shù)據(jù)”轉(zhuǎn)變?yōu)椤毙畔ⅰ钡娜箨P鍵技術——機器學習、云計算、眾包(crowdsourcing)整合三大關鍵技術29ppt課件權保2016南京留大學機器學習導論課程專用所有大數(shù)據(jù)時代,機器學習必不可少收集、傳輸、存儲大數(shù)據(jù)的目的,是為了“利用”大數(shù)據(jù)沒有機器學習技術分析大數(shù)據(jù),“利用”無從談起30ppt課件權有所習導論課程專用保2016南京大學機器學留基本術語???????數(shù)據(jù)集;訓練,測試示例(instance),樣例(example)樣本(sample)屬性(attribute),特征(feature);屬性值屬性空間,樣本空間,輸入空間特征向量(featurevector)標記空間,輸出空間??監(jiān)督學習(supervisedlearning)無監(jiān)督學習(unsupervisedlearning)???假設(hypothesis)真相(ground-truth)學習器(learner)????
?分類,回歸
?二分類,多分類
?正類,反類未見樣本(unseeninstance)未知“分布”獨立同分布(i.i.d.)泛化(generalization)31ppt課件權2016南京大學機器學習導論課程專用所有保留假設空間(色澤=?)?(根蒂=?)?(敲聲=?)?好瓜學習過程
在所有假設(hypothesis)組成的空間中進行搜索的過程目標:找到與訓練集“匹配”(fit)的假設假設空間的大?。簄1xn2xn3+132ppt課件權用所有保留論課程專機器學習導2016南京大學例如:(青綠;蜷縮;沉悶)應該采用哪一個 模型(假設)?版本空間
版本空間(versionspace):與訓練集一致的假設集合
濁響 濁響
在面臨新樣本時,會產(chǎn)生不同的輸出33ppt課件課程專用所有2016南京大學機器學習導論權保留歸納偏好(inductivebias)機器學習算法在學習過程中對某種類型假設的偏好A更
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 單人船舶出售合同范本
- 萌芽課題申報書
- 提升編導能力課題申報書
- 和學校超市合作合同范本
- 賣場出租租賃合同范本
- 為課題申報書
- 勞動合同范例 海南
- 產(chǎn)品競拍合同范本
- 勞務與員工合同范本
- 加氫原料采購合同范本
- DeepSeek的應用與部署
- ISO-IEC17025-2017實驗室管理體系全套程序文件
- 2019版外研社高中英語選擇性必修二Unit 1 Growing up 單詞表
- 重慶危險性較大的分部分項工程安全管理實施細則
- 三菱 PLC FX2N-4AD 4DA 模擬量模塊教材(課堂PPT)
- 有機金屬化學1
- JIT標準作業(yè)作業(yè)指導書
- 安徽省2020-2021學年七年級語文下學期期末測試卷[含答案]
- 混凝土面板堆石壩接縫止水
- 人教版三年級數(shù)學下冊各單元教材分析(全冊共九個單元)
- 公司駕駛員承諾書
評論
0/150
提交評論