版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第一章
初認識人工智能
《人工智能應(yīng)用概論(第2版)》RengongZhinengYingyongGailun
第1章:初識人工智能.pptx第2章:人工智能在經(jīng)濟社會生活中的應(yīng)用.pptx第3章:機器學(xué)習(xí).pptx第4章:神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí).pptx第5章:智能語音.pptx第6章:自然語言處理.pptx第7章_知識表示.pptx第8章:計算機視覺應(yīng)用.pptx第9章:人工智能未來及職業(yè)發(fā)展規(guī)劃.pptx第10章:人工智能的展望與爭論.pptx全套可編輯PPT課件Part0101人工智能的定義及發(fā)展歷程Part02022023年是人工智能重要的發(fā)展歷程一年P(guān)art0303生成式AI的發(fā)展與分析目
錄content163Part01人工智能的定義及發(fā)展歷程1.1課程導(dǎo)入我們?nèi)祟愐呀?jīng)進入人工智能時代1.1課程導(dǎo)入2018年11月7日,在第五屆世界互聯(lián)網(wǎng)大會上,由搜狗與新華社合作開發(fā)的全球首個全仿真智能合成主持人——“AI合成主播(ArtificialIntelligence)”正式亮相。它根據(jù)所提供的文字,就能準(zhǔn)確無誤地播送新聞,可以模擬人類說話時的聲音、嘴唇動作和表情,并且將三者自然匹配,逼真程度幾乎能以假亂真。我們?nèi)祟愐呀?jīng)進入人工智能時代—AI合成主播1.2人工智能的定義人工智能是研究、開發(fā)用于模擬、延伸和擴展人類智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新技術(shù)科學(xué)。人工智能,或稱AI,作為科技革命和產(chǎn)業(yè)變革的關(guān)鍵驅(qū)動力,其定義和研究范圍已廣泛滲透至多個領(lǐng)域,包括機器學(xué)習(xí)、深度學(xué)習(xí)、機器人、自然語言處理等。1.2人工智能的定義【企業(yè)】科大訊飛將人工智能定義為一種能夠理解、分析和執(zhí)行任務(wù)的智能系統(tǒng),特別強調(diào)其在自然語言理解和跨領(lǐng)域知識的應(yīng)用能力。1.2人工智能的定義人工智能(Al)產(chǎn)業(yè)是指以人工智能關(guān)鍵技術(shù)為核心的、由基礎(chǔ)支撐和應(yīng)用場景組成的、覆蓋領(lǐng)域極為廣闊的行業(yè)群。分類介紹對于人工智能的智能程度,分為弱人工智能(ANI)、強人工智能(AGI)和超強人工智能(ASI)。弱人工智能是指專注于且只能解決單個特定領(lǐng)域問題的人工智能。強人工智能是指能夠勝任人類所有工作的人工智能。超強人工智能是指在科學(xué)創(chuàng)造力、智能和社交能力等每一個方面都比人類大腦聰明的人工智能。1.3人工智能的核心要素◆核心要素人工智能三大核心要素包括算法、算力和數(shù)據(jù)。其背后的支撐技術(shù)分別為大數(shù)據(jù)技術(shù)、深度學(xué)習(xí)技術(shù)以及Al芯片技術(shù)。1.3人工智能的發(fā)展歷程人工智能從20世紀(jì)50年代到21世紀(jì)的發(fā)展歷程,包括教授、機器學(xué)習(xí)和深度學(xué)習(xí)等關(guān)鍵技術(shù)階段。1.3人工智能的發(fā)展歷程-達特莫斯(Dartmouth)學(xué)會“人工智能”一詞在1956年美國計算機協(xié)會組織的達特莫斯(Dartmouth)學(xué)會上提出,提出者是約翰?麥卡錫(JohnMcCarthy)、馬文?明斯基(MarvinMinsky)、納撒尼爾?羅切斯特(NathanilelRochester)、克勞德?香農(nóng)(ClaudeShannon)4位年輕學(xué)者。1.3人工智能的發(fā)展歷程-圖靈測試圖靈測試是由計算機科學(xué)和密碼學(xué)的先驅(qū)阿蘭·麥席森·圖靈于1950年在他的論文《計算機器與智能》中提出的一種檢測機器智能的方法。圖靈注意到“智能”這一概念難以確切定義,因此提出了這種通過對話來評估機器智能的方法。圖靈測試的核心是通過對話判斷機器是否能夠模仿人類的智能表現(xiàn)。如果超過30%的測試者認為回答來自人類,那么這臺機器即被視為通過了測試。1.3人工智能的發(fā)展歷程人工智能從20世紀(jì)50-80年的作品:跳棋計算機程序、擬人機器人和推理計算機機器人1.3人工智能的發(fā)展歷程人工智能2000年-2020年發(fā)展中著名作品。如擬人機器人、AlphaGo及其后續(xù)版本在與人類頂尖圍棋高手的對弈中取得了一系列引人注目的勝利,成為人工智能領(lǐng)域的一個里程碑事件。1.3人工智能的發(fā)展歷程人工智能進入大模型時代。國內(nèi)有很多AI大模型,其中一些是由科技公司開發(fā)的,比如科大訊飛、騰訊、百度、阿里等。這些公司都在積極開發(fā)自己的AI技術(shù),以提升其產(chǎn)品和服務(wù)的智能化水平。此外,還有一些國內(nèi)的高校和研究機構(gòu)也在開展AI領(lǐng)域的研究工作。Part022023年是人工智能重要的發(fā)展歷程一年3.12023年人工智能產(chǎn)業(yè)大事記總覽2023年成為人工智能發(fā)展歷程中值得被載入史冊的一年3.2中國人工智能產(chǎn)業(yè)規(guī)模盤點3.3中國人工智能產(chǎn)業(yè)全景深度解析圖譜3.4人工智能技術(shù)及產(chǎn)業(yè)發(fā)展相關(guān)政策分析3.4人工智能技術(shù)迭代圖3.3人工智能改變社會生活【課堂思考】1.人工智能的出現(xiàn),我們未來在生活、文化、工作方面會有什么樣的變化?2.談?wù)勀銓θ斯ぶ悄苷嬖u價和負面評價Part03生成式AI的發(fā)展與分析3.1預(yù)訓(xùn)練大模型優(yōu)化底層模型訓(xùn)推與理解產(chǎn)出3.2中國生成式AI落地場景多維分析4.3大模型在云、邊、端落地對物聯(lián)網(wǎng)技術(shù)體系的影響與塑造謝謝THANKS第二章
人工智能在經(jīng)濟社會生活中的應(yīng)用
《人工智能應(yīng)用概論(第2版)》RengongZhinengYingyongGailun
Part0101智慧交通Part0202智慧零售
Part0303智慧安防目
錄contentPart0404智慧政務(wù)Part01智慧交通1.1智慧交通的概念智慧交通系統(tǒng)(IntelligentTransportationSystem,ITS),指的是在較完善的基礎(chǔ)設(shè)施(包括道路、港口、機場和通信)之上將先進的信息技術(shù)、數(shù)據(jù)通信傳輸技術(shù)、電子傳感技術(shù)、電子控制技術(shù)以及計算機處理技術(shù)等有效地集成運用于整個交通運輸管理體系,從而建立起一種在大范圍、全方位發(fā)揮作用的實時、準(zhǔn)確、高效的綜合運輸和管理系統(tǒng)。1.2智慧交通現(xiàn)狀【行業(yè)痛點】(1)違法取證類型眾多,數(shù)量龐大。違法類型眾多,數(shù)量龐大,高達1.4億張/年。(2)人工審核任務(wù)重,效率低下。人工審核任務(wù)重,任務(wù)超負荷導(dǎo)致大量圖片直接丟機動車違法事故頻發(fā),早高峰違法高發(fā),加劇城市違法取證質(zhì)量較低,數(shù)據(jù)利用率低,廢片多棄擁堵。(3)違法事故行為識別不及時。人工審核效率低,超過50%的案件因過期無法處理。非機動車事故傷亡率高,占到總體事故總數(shù)的約40%。1.3智慧交通的算法解決方案【解決方案】基于AI視覺分析技術(shù),算法自適應(yīng)強,可兼容市面主流廠商違法取證設(shè)備,提高無效圖片剔除率,每秒鐘分析數(shù)量≥2張;每臺設(shè)備每天處理≥5萬張,剔除準(zhǔn)確率≥98%,實現(xiàn)證據(jù)采集標(biāo)準(zhǔn)化,證據(jù)剔除自動化,流程監(jiān)管常態(tài)化,助力全國各地交管部門開啟智慧執(zhí)法新時代.1.4智慧交通的三大應(yīng)用場景1.4智慧交通的三大應(yīng)用場景1.4智慧交通的三大應(yīng)用場景1.4智慧交通的真實案例極視角公司智慧交通案例:【客戶痛點】違法取證數(shù)據(jù)量每年幾何級數(shù)的增長,傳統(tǒng)人工審核工作量龐大。廢片率高,審核效率低下。【算法要求】極視角算法自適應(yīng)強,可兼容市面主流廠商違法取證設(shè)備拍攝的圖片數(shù)據(jù),且具有異常自愈功能,針對異常情況自動重啟算法,保障長效穩(wěn)定運行【運營成效】Part02智慧零售2.1智慧零售的概念智慧零售的核心是以消費者為中心的零售活動的生態(tài)化,生產(chǎn)設(shè)計、物流倉儲、集中采購、場景售賣、服務(wù)活動、經(jīng)營管理、資金流轉(zhuǎn)等環(huán)節(jié)都逐漸融入數(shù)據(jù)化和智能化的平臺,最終達到零售商效益優(yōu)化,消費者體驗優(yōu)化,實現(xiàn)萬物互聯(lián)、智能決策的自主商業(yè)。2.1智能定價、選品[選品]就是通過數(shù)據(jù)分析選出哪些商品或者哪些型號,應(yīng)該進貨,或值得生產(chǎn).[定價]就是通過數(shù)據(jù)分析決定每一件商品的最合適的出廠價格或零售價格。監(jiān)測競品的系列商品價格波動,判斷是否有降價營銷行為。通過計算機和大數(shù)據(jù)智能開展的選品和定價,對生產(chǎn)商和零售商都是強有力的“武器”。計算機系統(tǒng)定期自動地推薦進貨商品和更新建議價格,可以幫助對己方產(chǎn)品和市場競品在功能、價格、銷售情況等方面有實時和全面的掌握,以期及時地調(diào)整市場定價策略,使產(chǎn)品在市場上隨時保持著競爭優(yōu)勢2.2智慧選址科學(xué)選址根據(jù)區(qū)域內(nèi)核心人群分析進行基于數(shù)據(jù)的選址決策,脫離單純的主觀經(jīng)驗判斷。且實時方案,即對該區(qū)域的人口屬性、客戶畫像進行動態(tài)捕捉,實時更新。智慧選址是通過機器學(xué)習(xí)與建模,為新店選址提供決策。其主要功能包括:通過一段時間(一周、半個月、一個月)內(nèi)不同時間段人口熱力分布,進行熱力圖打分,了解各店面人流綜合值;選定人群(按年齡、性別、收入、職業(yè)、支付偏好劃分)的某段時期不同時間段客流熱力圖區(qū)域評分,劃定目標(biāo)區(qū)域;比對現(xiàn)有門店數(shù)量及潛在客戶區(qū)域,提供可以增開門店的熱區(qū)建議。2.3智慧零售系統(tǒng)智慧零售AI解決方案,基于算力服務(wù)器、前端采集攝像頭等基礎(chǔ)設(shè)施,將視頻流進行圖像處理,并對算法進行管理、迭代,通過應(yīng)用客流統(tǒng)計、行為識別等多種AI算法,實現(xiàn)門店智能監(jiān)控,幫助改善經(jīng)營策略,優(yōu)化人員配置。如極視角公司案例。2.4智慧選址科學(xué)選址根據(jù)區(qū)域內(nèi)核心人群分析進行基于數(shù)據(jù)的選址決策,脫離單純的主觀經(jīng)驗判斷。且實時方案,即對該區(qū)域的人口屬性、客戶畫像進行動態(tài)捕捉,實時更新。智慧選址是通過機器學(xué)習(xí)與建模,為新店選址提供決策。其主要功能包括:通過一段時間(一周、半個月、一個月)內(nèi)不同時間段人口熱力分布,進行熱力圖打分,了解各店面人流綜合值;選定人群(按年齡、性別、收入、職業(yè)、支付偏好劃分)的某段時期不同時間段客流熱力圖區(qū)域評分,劃定目標(biāo)區(qū)域;比對現(xiàn)有門店數(shù)量及潛在客戶區(qū)域,提供可以增開門店的熱區(qū)建議。2.4智慧零售應(yīng)用案例——美團大腦美團NLP中心開始構(gòu)建大規(guī)模的餐飲娛樂知識圖譜——美團大腦,它將充分挖掘關(guān)聯(lián)各個場景數(shù)據(jù),用AI技術(shù)讓機器“閱讀”用戶評論數(shù)據(jù),理解用戶在菜品、價格、服務(wù)、環(huán)境等方面的喜好,挖掘人、店、商品、標(biāo)簽之間的知識關(guān)聯(lián),從而構(gòu)建出一個“智慧大腦”。Part03智慧安防3.1智慧安防的概念智慧安防是基于泛在監(jiān)控、泛在網(wǎng)絡(luò)和泛在計算技術(shù)實現(xiàn)全域監(jiān)控、智能預(yù)警、防范和高效應(yīng)急救援功能為一體的綜合實時智能安防體系?;贏I視覺分析技術(shù),支持對已有攝像頭改造升級,通過部署AI視覺算法,對人、車、物、環(huán)境等不安全行為或狀態(tài)進行24小時智能化監(jiān)控,可聯(lián)動多系統(tǒng)與硬件設(shè)備,統(tǒng)一集中管理,主動識別預(yù)警,防患于未然3.2智慧安防相關(guān)技術(shù)算法、算力、數(shù)據(jù)作為智慧安防發(fā)展的三大要素。在產(chǎn)品落地時主要體現(xiàn)為視頻結(jié)構(gòu)化(對視頻數(shù)據(jù)的識別和提取)、生物識別(指紋識別、人臉識別)等、物體特征識別(車牌識別系統(tǒng))。視頻結(jié)構(gòu)化生物識別物體特征識別生物識別技術(shù)通過結(jié)合計算機、光學(xué)、聲學(xué)、生物傳感器和生物統(tǒng)計學(xué)原理等高科技手段,將人體的生理或行為特征收集起來,進行數(shù)字化處理,并與數(shù)據(jù)庫中的特征模板進行比對,以確定個體身份。視頻結(jié)構(gòu)化技術(shù)通過對視頻內(nèi)容進行時空分割、特征提取和對象識別,將非結(jié)構(gòu)化的視頻數(shù)據(jù)轉(zhuǎn)化為有意義的文本或可視化圖形信息。通過分析監(jiān)控視頻中的行人、車輛等目標(biāo),為公安實戰(zhàn)提供有價值的情報。物體特征識別通常包括圖像預(yù)處理、特征提取、分類器設(shè)計等步驟,以提高識別的準(zhǔn)確性。物體特征識別在多個領(lǐng)域得到廣泛應(yīng)用,如人臉識別、自動駕駛、智能安防等。3.3智慧安防應(yīng)用隨著AI技術(shù)在安防領(lǐng)域中的大規(guī)模應(yīng)用,基于檢測、跟蹤、識別三大主流方向,絕大部分安防產(chǎn)品都有落地的使用場景。從目前發(fā)展情況來看,智慧安防產(chǎn)業(yè)發(fā)展趨向于兩極化:更加偏重于宏觀的智慧城市大安防化與更加側(cè)重于微觀的民用服務(wù)微安防化,較為典型的是公安、司法和監(jiān)獄等警用場景和日常貼近生活的民用場景。以??低?017年破獲某個搶劫案為例,從大量的視頻圖像中找到嫌疑人,需要對來自500多個監(jiān)控點的長達250個小時的視頻進行分析,如果采用人力查閱,至少需要30天時間,但如果采用基于深度學(xué)習(xí)的視頻分析技術(shù),僅需不到5秒。根據(jù)國家統(tǒng)計局數(shù)據(jù),從2012年起,依靠智能視頻監(jiān)控系統(tǒng),公安受理和查處的案件數(shù)量都有大幅度減少,預(yù)警維穩(wěn)成效顯著。而在破獲案件精度和效率方面,AI技術(shù)讓安防精度趨近100%,但因為外界因素誤報率難以達到0;3.4智慧安防產(chǎn)業(yè)情況智慧安防在社會有著廣泛應(yīng)用,圖2-13所示智慧安防產(chǎn)業(yè)。對于場景劃分可以按照警用需求劃分為“點”“線”“面”“后臺”四個維度的布防,主要特點是利用智慧安防產(chǎn)品在識別和分析上的優(yōu)勢,做到預(yù)警和管控。智慧交通、智慧園區(qū)、智能樓宇、平安城市。3.5智慧安防應(yīng)用企業(yè)案例3.6智慧安防發(fā)展歷程【拓展】2009年,AI技術(shù)開始在多行業(yè)初步應(yīng)用,其中,安防監(jiān)控是AI最先大規(guī)模產(chǎn)生商業(yè)價值的領(lǐng)域,也成為許多AI技術(shù)研發(fā)公司的切入點。2005年開始的平安城市建設(shè),到2011年啟動的智慧城市建設(shè),以及后續(xù)提出的“天網(wǎng)工程”“雪亮工程”等安防重點項目,AI在安防領(lǐng)域中不斷滲透,智能安防產(chǎn)品運用于實體事件的需求?,F(xiàn)階段,傳統(tǒng)安防企業(yè)和智慧安防領(lǐng)域新興公司都開始注重安防產(chǎn)品在城市建設(shè)上的應(yīng)用。Part03智慧政務(wù)4.1智慧政務(wù)概念黨的二十大報告指出,“堅持把發(fā)展經(jīng)濟的著力點放在實體經(jīng)濟上,推進新型工業(yè)化,加快建設(shè)制造強國、質(zhì)量強國、航天強國、交通強國、網(wǎng)絡(luò)強國、數(shù)字中國。”目前通用的智慧政務(wù)的架構(gòu)方案不僅包括基礎(chǔ)網(wǎng)絡(luò)部署,更涵蓋了立體安全規(guī)劃、政務(wù)云計算建設(shè)、政府協(xié)同辦公在內(nèi)的方方面。4.2智慧政務(wù)關(guān)鍵技術(shù)云計算:云計算提供了可伸縮的計算資源和數(shù)據(jù)存儲,是智慧政務(wù)的基礎(chǔ)平臺。通過構(gòu)建政務(wù)云,政府能夠?qū)崿F(xiàn)跨部門、跨地區(qū)的資源共享與協(xié)同辦公,提高行政效率。例如,上海市電子政務(wù)云架構(gòu)就包括政務(wù)云管理體系、安全體系以及大數(shù)據(jù)框架,實現(xiàn)了從基礎(chǔ)設(shè)施到業(yè)務(wù)應(yīng)用的全方位支持。大數(shù)據(jù):大數(shù)據(jù)分析技術(shù)在智慧政務(wù)中主要應(yīng)用于數(shù)據(jù)采集、治理和共享。通過整合各類政務(wù)數(shù)據(jù),建立統(tǒng)一的數(shù)據(jù)平臺,政府能夠進行精準(zhǔn)管理和服務(wù)。例如,全國一體化大數(shù)據(jù)中心便歸集了來自不同部門和地區(qū)的數(shù)據(jù),通過模型算法加工形成主題庫,最終用于政務(wù)決策和應(yīng)用。物聯(lián)網(wǎng):泛在物聯(lián)網(wǎng)技術(shù)實現(xiàn)了全域全量數(shù)據(jù)采集。通過部署各種傳感器和終端設(shè)備,政府可以實時監(jiān)控和管理城市設(shè)施、交通、環(huán)保等各個方面,提升城市治理水平。例如,智慧城市服務(wù)中的各種便民功能,如生活繳費、預(yù)約掛號等,。人工智能:人工智能技術(shù)在智慧政務(wù)中的應(yīng)用主要包括語音識別、人臉識別、自然語言處理等。這些技術(shù)不僅提高了服務(wù)的響應(yīng)速度和準(zhǔn)確性,還通過自學(xué)習(xí)和自適應(yīng)能力,不斷提升政務(wù)服務(wù)質(zhì)量。例如,深圳市寶安區(qū)行政服務(wù)大廳利用5G技術(shù),實現(xiàn)了遠程視頻辦理和智能機器人服務(wù),大幅提升政務(wù)服務(wù)的智能化和便捷性。區(qū)塊鏈:區(qū)塊鏈技術(shù)在智慧政務(wù)中主要用于數(shù)據(jù)可信共享交換和統(tǒng)一身份認證。它通過分布式賬本和加密技術(shù),確保數(shù)據(jù)的安全和可靠流通,有效解決了信息孤島問題。例如,北京市目錄區(qū)塊鏈系統(tǒng)利用區(qū)塊鏈技術(shù)管理全市各部門的數(shù)據(jù)資源,實現(xiàn)了數(shù)據(jù)“盤得清”、“管得住”、“用得好”的目標(biāo)。4.2智慧政務(wù)應(yīng)用場景--智能辦公智能辦公系統(tǒng)對公務(wù)員的辦公行為有記憶功能,能夠根據(jù)公務(wù)員的職責(zé)、偏好、使用頻率等,對用戶界面、系統(tǒng)功能等進行自動優(yōu)化。智能辦公系統(tǒng)有自動提醒功能,如代辦件提醒、會議通知提醒等,公務(wù)員無須查詢就知道哪些事情需要處。虛擬政務(wù)助理。虛擬政務(wù)助理是一種對人們的需求有深層理解且功能強大的軟件應(yīng)用。虛擬個人助理通過人為命令或主動發(fā)現(xiàn)人的需求,經(jīng)過全面分析,執(zhí)行最能滿足需求的服務(wù),將人類從雜事中徹底解放出來。目前市場上成熟的產(chǎn)品有華為小藝、蘋果Siri等。智能會議。政府由于其工作的特殊性,重大事項均需要靠開會來集思廣益、集體決策和安排部署,開會是政府工作人員的一項必備工作。以往政府會議通知需要靠人工電話一一通知確認,靠人工進行會議記錄并形成會議紀(jì)要,耗時耗。而人工智能就能提供一個高效的解決方案:選定會議主題和參加人員以后,虛擬會議助理將第一時間主動聯(lián)系會議參加人員確認是否參加會議,會議開始則自動接通視頻會議以及撥通遠程參會人員電話。會議進行中,虛擬會議助理自動將語音轉(zhuǎn)化為文字記錄,并輔助政府工作人員生成會議紀(jì)要4.2智慧政務(wù)應(yīng)用場景智能監(jiān)管-湖南智慧政務(wù)區(qū)塊鏈科技有限公司的不動產(chǎn)監(jiān)管案例。2021年4月,國家稅務(wù)總局發(fā)票電子化改革(金稅四期)工作領(lǐng)導(dǎo)小組辦公室下發(fā)《關(guān)于開展稅務(wù)區(qū)塊鏈應(yīng)用驗證試點工作通知》(稅總金四便函〔2021〕28號),明確湖南婁底為全國不動產(chǎn)業(yè)務(wù)場景4個試點地區(qū)之一。在總局統(tǒng)一指揮下,探索將區(qū)塊鏈技術(shù)深度應(yīng)用到房地產(chǎn)交易生命周期全環(huán)節(jié),大幅度縮短不動產(chǎn)交易辦理時間,顯著改善營商環(huán)境。4.2智慧政務(wù)應(yīng)用場景智能監(jiān)管-湖南智慧政務(wù)區(qū)塊鏈科技有限公司的數(shù)字民政平臺。按照“精細、精準(zhǔn)、精確”識別要求,建立基于區(qū)塊鏈底層平臺的民政信息交互平臺,實現(xiàn)民政部門與勞動、財稅、工商、住建、公安、車管、金融管理等部門信息的比對,解決低貧困戶家庭收入核實難的問題、防止“騙吃低?!钡炔还浆F(xiàn)象的出現(xiàn)。
【課堂練習(xí)與討論】(1)人工智能如何賦能智慧交通?(2)人工智能給旅游行業(yè)帶來了哪些巨大變革?(3)智能時代來臨,金融領(lǐng)域?qū)⒂瓉砟男┳兓???)你了解哪些智慧零售的具體案例?(5)智慧安防的主要技術(shù)有哪些?(6)你認為目前我國智慧政務(wù)建設(shè)存在什么問謝謝THANKS第三章
機器學(xué)習(xí)
《人工智能應(yīng)用概論(第2版)》RengongZhinengYingyongGailun
Part0101機器學(xué)習(xí)概念Part0202機器學(xué)習(xí)的工作原理及算法Part0303機器學(xué)習(xí)分類目
錄contentPart01機器學(xué)習(xí)概念
【課程導(dǎo)入】人類學(xué)習(xí)與機器學(xué)習(xí)相同與相異1.1機器學(xué)習(xí)的定義機器學(xué)習(xí)是一門多學(xué)科交叉專業(yè),涵蓋概率論知識、統(tǒng)計學(xué)知識、近似理論知識和復(fù)雜算法知識,使用計算機作為工具并致力于真實實時的模擬人類學(xué)習(xí)方式,并將現(xiàn)有內(nèi)容進行知識結(jié)構(gòu)劃分來有效提高學(xué)習(xí)效率。機器學(xué)習(xí)已廣泛應(yīng)用于數(shù)據(jù)挖掘、計算機視覺、自然語言處理、生物特征識別、搜索引擎、醫(yī)學(xué)診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序語音和手寫識別、游戲和機器人等領(lǐng)域。1.2機器學(xué)習(xí)的原理機器學(xué)習(xí)與人類學(xué)習(xí)模式相似,如古代諸葛亮夜觀天象實現(xiàn)草船借箭、牛頓被蘋果砸發(fā)現(xiàn)“萬有引力”、中國古人發(fā)現(xiàn)自然規(guī)律的“二十四氣節(jié)”,春耕秋收。機器學(xué)習(xí)是一種使計算機能夠從數(shù)據(jù)中學(xué)習(xí)并做出決策的技術(shù)。它通過訓(xùn)練模型來識別數(shù)據(jù)中的模式和規(guī)律,從而實現(xiàn)對未知數(shù)據(jù)的預(yù)測和分類。如人臉識別、貓狗識別、農(nóng)作物病蟲害識別、電路版上瑕疵識別等。1.3機器學(xué)習(xí)的地位機器學(xué)習(xí)在人工智能學(xué)科體系,乃至計算機科學(xué)體系中都占有舉足輕重的地位。1.4機器學(xué)習(xí)的發(fā)展歷程機器學(xué)習(xí)發(fā)展過程也是人工智能發(fā)展的過程,從IBM西洋跳棋人機PK到深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)谷歌的阿爾法狗,再到最近的Ai大模型出現(xiàn)。1.5機器學(xué)習(xí)的分類機器學(xué)習(xí)是一個比較寬泛的概念,主要包括監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、強化學(xué)習(xí)等。1.6機器學(xué)習(xí)的算法分類Scikit-learn是機器學(xué)習(xí)領(lǐng)域中最知名的Python庫之一,在學(xué)習(xí)機器學(xué)習(xí)的過程中,必繞不開Scikit-learn。Scikit-learn提供了一幅清晰的路線圖給大家做算法選擇。1.7【課堂練習(xí)】【課堂思考】簡述機器學(xué)習(xí)與人類學(xué)習(xí)有什么相同之處?Part02機器學(xué)習(xí)的工作原理及算法2.1線性回歸算法線性回歸算法是一種通過屬性的線性組合來擬合圖中的點,找到一條直線或者一個平面或者更高維的超平面,使得預(yù)測值與真實值之間的誤差最小化。線性回歸的基礎(chǔ)概念涉及到統(tǒng)計學(xué)和機器學(xué)習(xí)領(lǐng)域,它利用稱為線性回歸方程的最小平方函數(shù)對一個或多個自變量和一個因變量之間的關(guān)系進行建模。2.1線性回歸算法【案例】探索學(xué)習(xí)時長與分數(shù)之間的關(guān)系。某門課程中學(xué)生學(xué)習(xí)時長(天數(shù))與期末考試分數(shù)統(tǒng)計表如表3-2所示?!締栴}】找出一根線擬合圖中的點2.1線性回歸算法(1)擬合圖中的點有無數(shù)條直線,哪條直線是最好擬合圖中的點。(2)計算出每個點分別到每條線上的誤差之和(3)誤差最小的就是最佳的擬合線,該線就是我們的要找的線(方程),該方程是我們的模型。2.2K最近鄰分類算法K最近鄰(k-NearestNeighbor,KNN)分類算法,是一個理論上比較成熟的方法,也是最簡單的機器學(xué)習(xí)算法之一。該方法的思路是:在特征空間中,如果一個樣本附近的k個最近(即特征空間中最鄰近)樣本的大多數(shù)屬于某一個類別,則該樣本也屬于這個類別。如果K=3,綠色圓點的最近的3個鄰居是2個紅色小三角形和1個藍色小正方形,少數(shù)從屬于多數(shù),基于統(tǒng)計的方法,判定綠色的這個待分類點屬于紅色的三角形一類。如果K=5,綠色圓點的最近的5個鄰居是2個紅色三角形和3個藍色的正方形,還是少數(shù)從屬于多數(shù),基于統(tǒng)計的方法,判定綠色的這個待分類點屬于藍色的正方形一類。2.2K最近鄰分類算法
【做一做】使用無監(jiān)督學(xué)習(xí)對10000篇新聞報到分析,對其新聞內(nèi)容特征進行提取,K1科技類、游戲類K2、汽車類K3。請問下黑色點是屬于哪個區(qū)域?屬于哪些新聞?如何分析K1K2K3?2.3決策樹算法決策樹分類算法的關(guān)鍵就是根據(jù)“先驗數(shù)據(jù)”構(gòu)造一棵最佳的決策樹,用以預(yù)測未知數(shù)據(jù)的類別。決策樹是一個樹結(jié)構(gòu)(可以是二叉樹或非二叉樹)。其每個非葉節(jié)點表示一個特征屬性上的測試,每個分支代表這個特征屬性在某個值域上的輸出,而每個葉節(jié)點存放一個類別。使用決策樹進行決策的過程就是從根節(jié)點開始,測試待分類項中相應(yīng)的特征屬性,并按照其值選擇輸出分支,直到到達葉子節(jié)點,將葉子節(jié)點存放的類別作為決策結(jié)果。信用等級決策樹算法模型2.4支持向量機SVM算法SVM想要的就是找到各類樣本點到超平面的距離最遠,也就是找到最大間隔超平面?!景咐渴褂肧VM算法完成水果識別分類。比如紅色表示“蘋果”,黃色表示“獼猴桃”,那么如何找到一個平面最大化的將兩類群體分開,如右圖所示,分開有很多種方式,左側(cè)也可以分開,右側(cè)也能分開。但明顯的,右側(cè)會“分的更開”,因而如何尋找到這樣的一個空間平面,讓標(biāo)簽項各類別最為明顯的分開,此算法過程即為支持向量機。將點分開時,離平面最近的點要盡可能的遠,比如右側(cè)時A點和B點離平面最近,那么算法需要想辦法讓該類點盡可能地遠離平面,這樣就稱為“分的更好”。左側(cè)時挨著平面最近的兩個點離平面太近,所以右側(cè)的分類更好。SVM算法完成水果識別分類2.4支持向量機SVM算法SVM想要的就是找到各類樣本點到超平面的距離最遠,也就是找到最大間隔超平面(多維)。Part03機器學(xué)習(xí)分類3.1監(jiān)督學(xué)習(xí)【知識回顧】機器學(xué)習(xí)是一種使計算機能夠從數(shù)據(jù)中學(xué)習(xí)并做出決策的技術(shù)。它通過訓(xùn)練模型來識別數(shù)據(jù)中的模式和規(guī)律,從而實現(xiàn)對未知數(shù)據(jù)的預(yù)測和分類。監(jiān)督學(xué)習(xí)(supervisedlearning)是機器學(xué)習(xí)的一類,給機器學(xué)習(xí)的訓(xùn)練數(shù)據(jù)打上標(biāo)簽。房價預(yù)測模型:是根據(jù)房子的特征來預(yù)測房子價格。收集10個房子樣本,樣本的特征包括有地區(qū)、房子大小、年齡等共13個特征,10個房子的房價,作為標(biāo)簽。先將房子13個特征和標(biāo)簽作為值,放入SVM或者決策樹算法,由電腦來計算,計算誤差最小的方程。我們把這個過程稱為監(jiān)督學(xué)習(xí)。3.1監(jiān)督學(xué)習(xí)監(jiān)督學(xué)習(xí)分為回歸和分類。回歸的預(yù)測結(jié)果是連續(xù)性的,比如房價預(yù)測、路程花費時間預(yù)測、股價走勢預(yù)測。監(jiān)督學(xué)習(xí)分為回歸和分類。分類的預(yù)測結(jié)果是離散的,比如腫瘤是良性/惡性,郵件是垃圾郵件/非垃圾郵件,天氣時好還是壞。3.2無監(jiān)督學(xué)習(xí)無監(jiān)督學(xué)習(xí)是機器學(xué)習(xí)中的一種重要方法,與監(jiān)督學(xué)習(xí)相對應(yīng)。它的目標(biāo)是從無標(biāo)簽的數(shù)據(jù)中發(fā)現(xiàn)隱藏的結(jié)構(gòu)和模式,而不需要預(yù)先定義的目標(biāo)變量。無監(jiān)督學(xué)習(xí)的核心思想是通過對數(shù)據(jù)的統(tǒng)計特性和相似性進行分析,來發(fā)現(xiàn)數(shù)據(jù)中的潛在結(jié)構(gòu)和模式。無監(jiān)督學(xué)習(xí)可以分為兩類問題:聚類和降維。聚類問題是將數(shù)據(jù)分成不同的組或簇,使得同一組內(nèi)的數(shù)據(jù)相似度高,不同組之間的相似度低。降維問題是將高維數(shù)據(jù)映射到低維空間,以減少特征維度和數(shù)據(jù)復(fù)雜性。3.2無監(jiān)督學(xué)習(xí)電商平臺對客戶的瀏覽痕跡、購買數(shù)量等特征進行學(xué)習(xí)分類。Google新聞按照內(nèi)容結(jié)構(gòu)的不同分成財經(jīng),娛樂,體育等不同的標(biāo)簽,這就是無監(jiān)督學(xué)習(xí)中的聚類3.3強化學(xué)習(xí)在強化學(xué)習(xí)中,智能體(Agent)與環(huán)境(Environment)交互,智能體根據(jù)環(huán)境狀態(tài)進行決策并執(zhí)行動作,環(huán)境根據(jù)智能體的動作給予獎勵或者懲罰。強化學(xué)習(xí)目標(biāo)是讓智能體學(xué)習(xí)到最優(yōu)策略,使得累積獎勵最大化。強化學(xué)習(xí)的原理五子棋人機博弈謝謝THANKS第四章
神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)
《人工智能應(yīng)用概論(第2版)》RengongZhinengYingyongGailun
Part0101神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)概念Part0202
深度學(xué)習(xí)原理目
錄contentPart0303卷積神經(jīng)網(wǎng)絡(luò)
【課程導(dǎo)入】現(xiàn)實中,我們的大腦接收眼睛或耳朵傳遞來的數(shù)據(jù)(輸入源),會通過一層層的神經(jīng)元去解析數(shù)據(jù)(神經(jīng)元),然后得到我們對于所見的判斷(輸出源)。對整個實現(xiàn)過程的抽象理解如圖4-2所示Part01神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)概念4.1.1生物神經(jīng)元(Biologicalneuron)人工神經(jīng)網(wǎng)絡(luò)是受到人類大腦結(jié)構(gòu)的啟發(fā)而創(chuàng)造出來的。生物神經(jīng)元是神經(jīng)系統(tǒng)的基本功能單元,負責(zé)接收、處理和傳遞信息。人類大腦中包含大約860億個神經(jīng)元,它們通過復(fù)雜的網(wǎng)絡(luò)相互連接,實現(xiàn)各種神經(jīng)功能。生物神經(jīng)元的結(jié)構(gòu)包括細胞體、樹突、軸突和突觸。以下是具體介紹:細胞體:細胞體是神經(jīng)元的主要部分,包含細胞核、細胞質(zhì)和細胞膜。它是神經(jīng)元的代謝中心,維持細胞的生命活動。樹突:樹突是從細胞體向外延伸的分支纖維,主要作用是接收來自其他神經(jīng)元的信號。一個神經(jīng)元可以有多個樹突,這使得神經(jīng)元能從多個源頭接收信號。軸突:軸突是一條長的纖維,從細胞體延伸出來,負責(zé)將信號從細胞體傳遞到其他神經(jīng)元或組織。一個神經(jīng)元只有一個軸突,其長度可從幾微米到一米不等。突觸:突觸是神經(jīng)元之間傳遞信息的連接點,通常是軸突末端與其他神經(jīng)元的樹突或細胞體相接觸的部分。在這里,神經(jīng)遞質(zhì)被釋放,從而將信號從一個神經(jīng)元傳遞到另一個神經(jīng)元。4神經(jīng)網(wǎng)絡(luò)是一種模擬人腦神經(jīng)元結(jié)構(gòu)的計算模型。人工神經(jīng)網(wǎng)絡(luò)(ANN)由神經(jīng)元(圓圈)和權(quán)重w(直線)兩部分組成,分為輸入層、隱藏層、輸出層。其中,輸入層相當(dāng)于輸入元,隱藏層相當(dāng)于人工神經(jīng)網(wǎng)絡(luò)輸出層相當(dāng)于輸出源。三層之間的神經(jīng)元相互連接,和權(quán)重組(w1,w2)經(jīng)過前向算法和反饋算法的數(shù)學(xué)運算,最終將結(jié)果以“激活碼”的方式輸出,這與生物(人類)神經(jīng)元中的突觸十分相似。輸入層是神經(jīng)網(wǎng)絡(luò)與外界數(shù)據(jù)的接口,負責(zé)接收并傳輸輸入數(shù)據(jù)到網(wǎng)絡(luò)中。隱藏層通過非線性變換和特征提取來加工輸入數(shù)據(jù)。輸出層將神經(jīng)網(wǎng)絡(luò)的處理結(jié)果轉(zhuǎn)換為外界可以理解的格式。4.1.2人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetworks)4神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)的基礎(chǔ),而深度學(xué)習(xí)是神經(jīng)網(wǎng)絡(luò)的一種特殊形式。深度學(xué)習(xí)是一種特殊的機器學(xué)習(xí)方法,采用多層神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)數(shù)據(jù)的高級特征。每一層網(wǎng)絡(luò)都從前一層的輸出中提取更復(fù)雜的信息,如自動駕駛。4.1.3深度學(xué)習(xí)(DeepLearning)如:自動駕駛中,將攝像頭、雷達、GPS、速度數(shù)據(jù)集放入到輸入層,經(jīng)過多層神經(jīng)網(wǎng)絡(luò)層計算,最終輸出層輸出方向、剎車、加速參數(shù),實現(xiàn)自動駕駛的效果。4八大深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò):CNN卷積神經(jīng)網(wǎng)絡(luò)(圖像識別與分類)、RNN循環(huán)神經(jīng)()、GAN對抗神經(jīng)網(wǎng)絡(luò)(生成式AI,生成新圖片)、LSTM長短期(天氣預(yù)測)、Transformer神經(jīng)網(wǎng)絡(luò)(自然語言處理)。4.1.3深度學(xué)習(xí)(DeepLearning)4傳統(tǒng)機器學(xué)習(xí)和深度學(xué)習(xí)算法的主要區(qū)別在于特征。傳統(tǒng)機器學(xué)習(xí)算法中,我們需要手工編碼特征;在深度學(xué)習(xí)算法中,特征由算法自動完成,但耗時且需要海量數(shù)據(jù)。4.1.4深度學(xué)習(xí)(DeepLearning)與機器學(xué)習(xí)Part02神經(jīng)網(wǎng)絡(luò)技術(shù)原理4感知器,也可翻譯為感知機(神經(jīng)元),是FrankRosenblatt在1957年就職于Cornell航空實驗室時所發(fā)明的一種人工神經(jīng)網(wǎng)絡(luò),被視為一種最簡單形式的前饋式人工神經(jīng)網(wǎng)絡(luò),是一種二元線性分類器。工作機制:輸入層I*W(I1*W1+I2*W2+I3*W3+......)求和sum,將sum放入到f(X)激活函數(shù),如果大于閾值T則為1,否則為0。如使用感知層識別西瓜和香蕉。4.2.1感知機模型-單層感知層1.假設(shè)西瓜和香蕉都僅有兩個特征(feature):形狀和顏色,特征x1代表輸入顏色,特征x2代表形狀;2.進一步簡化,我們把權(quán)重w1和w2默認值都為1,閾值θ(亦稱偏值——bias)設(shè)置為0;3.感知器輸出為“1”,代表判定為“西瓜”,而輸出為“0”,代表判定為“香蕉”4多層感知機(MLP,MultilayerPerceptron)除了輸入輸出層,它中間可以有多個隱層。最簡單的MLP只含一個隱層,即三層的結(jié)構(gòu),層與層之間是全連接的。輸入層是神經(jīng)網(wǎng)絡(luò)與外界數(shù)據(jù)的接口,負責(zé)接收并傳輸輸入數(shù)據(jù)到網(wǎng)絡(luò)中。隱藏層通過非線性變換和特征提取來加工輸入數(shù)據(jù)。輸出層將神經(jīng)網(wǎng)絡(luò)的處理結(jié)果轉(zhuǎn)換為外界可以理解的格式。4.2.1感知機模型-多層感知機44.2.2深度神經(jīng)網(wǎng)絡(luò)(DeepNeuralNetworks)【深度學(xué)習(xí)工作原理】深度學(xué)習(xí)是不停更改實驗因素的參數(shù),讓預(yù)測值接近真實值的過程。深度學(xué)習(xí)的過程首先是輸入層接收數(shù)據(jù),經(jīng)過隱藏層的前向算法(數(shù)據(jù)變換)得到一個預(yù)測值,預(yù)測值與真實目標(biāo)值代入損失函數(shù),使用反饋算法計算出最小的損失值,然后把損失值放入優(yōu)化器中來有方向性地更改權(quán)重值,這樣就完成了一次學(xué)習(xí)過程。不斷循環(huán)以上過程更改參數(shù),讓預(yù)測值接近真實目標(biāo)值,這就是深度學(xué)習(xí)的過程。44.2.3深度學(xué)習(xí)核心算法-前向傳播前向傳播用來計算預(yù)測值y。在神經(jīng)網(wǎng)絡(luò)中,信息從上一個神經(jīng)元直接流轉(zhuǎn)到下一個神經(jīng)元,直到輸出,最終得到在當(dāng)前參數(shù)下的損失函數(shù)的過程,稱為前向傳播算法。(類似學(xué)生做試題寫答案)44.2.3深度學(xué)習(xí)核心算法-反向傳播算法反向傳播算法是計算預(yù)測輸出與真實標(biāo)簽之間的誤差。反向傳播是一種基于微積分中鏈?zhǔn)椒▌t的算法,用于計算神經(jīng)網(wǎng)絡(luò)中各層權(quán)重和偏差的梯度。其核心思想是從輸出層開始,逐層向輸入層逆向傳播誤差,并計算每個參數(shù)的梯度。這一過程利用了前向傳播中保存的中間結(jié)果,避免重復(fù)計算,提高了訓(xùn)練效率。44.2.3深度學(xué)習(xí)核心算法-梯度下降梯度下降的過程可把求解損失函數(shù)最小值的過程看成“站在山坡某處去尋找山坡的最低點”。我們并不知道最低點的確切位置,梯度下降的策略是每次向“下坡路”的方向走一小步,經(jīng)過長時間地走“下坡路”,最后停留的位置也大概率在最低點附近。我們選這個“下坡路”的方向為梯度方向的負方向,因為每個點的梯度負方向是在該點處函數(shù)下坡最陡的方向,如圖4-7所示。在計算出梯度后,使用梯度下降算法更新網(wǎng)絡(luò)參數(shù)。更新規(guī)則為:新參數(shù)=舊參數(shù)-學(xué)習(xí)率*梯度,使得每次更新的參數(shù)其誤差縮小最快。44.2.4深度學(xué)習(xí)應(yīng)用場景-信貸場景下客戶信用評分信貸評分卡模型(見圖4-8)是當(dāng)前最常見的金融風(fēng)控手段之一,在信貸場景下客戶貸前申請、貸中調(diào)額、貸后催收等貸款生命周期的主要環(huán)節(jié)中已經(jīng)被普遍應(yīng)用。它主要是根據(jù)客戶的各種屬性和行為數(shù)據(jù),建設(shè)信用評分模型,基于模型判斷是否給予授信以及授信的額度,從而識別和減少金融業(yè)務(wù)中的交易風(fēng)險。在對客戶進行信用評分時,核心難點在于突發(fā)事件等因素可能導(dǎo)致模型效果不穩(wěn)定,因此需要能有效快速進行模型自迭代的完整循環(huán)。輸入客戶特征數(shù)據(jù)違約1/不違約0CHiME-6被稱為“史上最難的語音識別任務(wù)”4深度學(xué)習(xí)在圖像和物體識別方面的能力遠遠超過了人類CHiME-6“史上最難的語音識別任務(wù)”科大訊飛多場景語音識別大賽上奪冠。4.2.4深度學(xué)習(xí)應(yīng)用場景CHiME-6被稱為“史上最難的語音識別任務(wù)”4深度學(xué)習(xí)可以應(yīng)用到醫(yī)療臨床檢測與診斷各個環(huán)節(jié)中4.2.4深度學(xué)習(xí)應(yīng)用場景CHiME-6被稱為“史上最難的語音識別任務(wù)”4深度學(xué)習(xí)加速推進智慧城市建設(shè)4.2.4深度學(xué)習(xí)應(yīng)用場景Part03卷積神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)通過卷積、激活、池化等操作層層遞進地處理圖像數(shù)據(jù),最終通過全連接層輸出結(jié)果。這種結(jié)構(gòu)使得CNN在計算機視覺等領(lǐng)域表現(xiàn)出色,成為深度學(xué)習(xí)的重要工具。4.3.1深度學(xué)習(xí)經(jīng)典網(wǎng)絡(luò)-卷積神經(jīng)網(wǎng)絡(luò)卷積層是完成圖像特征提取池化層是圖像降維(32*32像素
降維到5*5)全連接層是圖像分類將圖片8放入輸入層經(jīng)過Layer1卷積層提取圖片特征經(jīng)過Layer1池化層圖片降維14*14經(jīng)過Layer2卷積層提取圖片特征經(jīng)過Layer2池化層圖片降維5*5經(jīng)過全連接神經(jīng)網(wǎng)絡(luò)層完成圖片分類,最終輸出預(yù)測值y‘。卷積神經(jīng)網(wǎng)絡(luò)通過卷積、激活、池化等操作層層遞進地處理圖像數(shù)據(jù),主要是特征提取。最終通過全連接層輸出結(jié)果。這種結(jié)構(gòu)使得CNN在計算機視覺等領(lǐng)域表現(xiàn)出色,成為深度學(xué)習(xí)的重要工具。4.3.2深度學(xué)習(xí)經(jīng)典網(wǎng)絡(luò)-卷積層卷積神經(jīng)網(wǎng)絡(luò)特征提取池化層在卷積神經(jīng)網(wǎng)絡(luò)(CNN)中的主要作用是通過降低特征圖的空間維度來減少參數(shù)數(shù)量和計算量,同時保留重要信息以增強特征的不變性。池化層方式有2*2最大池化、2*2平均池化、2*2隨機池化。4.3.3深度學(xué)習(xí)經(jīng)典網(wǎng)絡(luò)-池化層全連接層在卷積神經(jīng)網(wǎng)絡(luò)(CNN)中的主要作用是將前層(如卷積層和池化層)提取的特征進行整合,并將這些特征映射到樣本標(biāo)記空間,從而實現(xiàn)分類或回歸任務(wù)。全連接層通常位于CNN的最后幾層,每個神經(jīng)元都與前一層的所有神經(jīng)元相連。4.3.4深度學(xué)習(xí)經(jīng)典網(wǎng)絡(luò)-全連接層全連接層Part03神經(jīng)網(wǎng)絡(luò)模型TensorFlow是谷歌推出的深度學(xué)習(xí)開源框架,并且發(fā)布了TensorFlow游樂場。有了TensorFlow游樂場,我們在瀏覽器中就可以訓(xùn)練自己的神經(jīng)網(wǎng)絡(luò),還有好看的圖像讓我們更直觀地了解神經(jīng)網(wǎng)絡(luò)的主要功能以及計算流程。/4.4.1TensorFlow游樂場TensorFlow游樂場的左側(cè)提供了四個不同的數(shù)據(jù)集(見圖4-10)來測試神經(jīng)網(wǎng)絡(luò)。每組數(shù)據(jù),都是不同形態(tài)分布的一群點,如圖4-11所示,分別為高斯分布(Gaussian)、異或(XOR)、圓形(Circle)、螺旋形(Spiral),每一個點都自帶兩個特征.4.4.2數(shù)據(jù)集輸入層隱藏層輸出層訓(xùn)練次數(shù)神經(jīng)網(wǎng)絡(luò)訓(xùn)練流程圖。初始化神經(jīng)網(wǎng)絡(luò),使用前向傳播獲得預(yù)測值,使用反向傳播更新變量,是否達到目標(biāo),如果不達到,則繼續(xù)訓(xùn)練,一次類推。直到訓(xùn)練次數(shù)結(jié)束。4.4.3訓(xùn)練過程謝謝THANKS第五章
智能語音
《人工智能應(yīng)用概論(第2版)》RengongZhinengYingyongGailun
Part0101智能語音介紹Part0202智能語音技術(shù)應(yīng)用Part0303智能語音體驗?zāi)?/p>
錄content[課程導(dǎo)入】“智能問答機器人”基于深度學(xué)習(xí)的自然語言處理(NLP)技術(shù),幫助提升客服體驗及服務(wù)效率,實現(xiàn)24小時無須等候智能服務(wù),通過上下文多輪問答,實現(xiàn)用戶問題解決率超90%;“AI外呼機器人”通過自研語音技術(shù)(TTS)的植入,實現(xiàn)個性化擬人聲音服務(wù),人機交流更親切自然;【思考題】機器是如何實現(xiàn)識別人類說話,將語音轉(zhuǎn)換成文字的?Part01智能語音介紹5.1智能語音技術(shù)概況除了語音導(dǎo)航、智能音箱、語音輸入法等我們?nèi)粘I钪械某R姂?yīng)用場景,只要把語音識別理解成“獲取人類語言中的信息”,把語音合成理解成“讓人類通過聲音獲取信息”,再把聲紋識別、關(guān)鍵詞喚醒等理解成可供選擇的“功能”,將它們與不同載體、場景結(jié)合,就會形成各種各樣的產(chǎn)品。5.1.1語音識別語音識別讓機器識別人說出的話,即將語音轉(zhuǎn)換成相應(yīng)的文本內(nèi)容(見圖5-1),然后根據(jù)內(nèi)容信息執(zhí)行人的某種意圖。語音識別又稱言語識別,這項任務(wù)涉及將輸入聲學(xué)信號與存儲在計算機內(nèi)存的詞表(語音、音節(jié)、詞等)相匹配,而匹配個別語詞的標(biāo)準(zhǔn)技術(shù)則要用輸入信號與預(yù)存的波形(或波形特征/參數(shù))相比較(模型匹配),相當(dāng)于給機器裝上了“耳朵”。5.1.1語音識別語音識別讓機器識別人說出的話,即將語音轉(zhuǎn)換成相應(yīng)的文本內(nèi)容(見圖5-1),然后根據(jù)內(nèi)容信息執(zhí)行人的某種意圖。語音識別又稱言語識別,這項任務(wù)涉及將輸入聲學(xué)信號與存儲在計算機內(nèi)存的詞表(語音、音節(jié)、詞等)相匹配,而匹配個別語詞的標(biāo)準(zhǔn)技術(shù)則要用輸入信號與預(yù)存的波形(或波形特征/參數(shù))相比較(模型匹配),相當(dāng)于給機器裝上了“耳朵”。5.1.1語音識別語音識別系統(tǒng)本質(zhì)上是一種模式識別系統(tǒng),包括特征提取、模式匹配、參考模型庫等三個基本單元,它的基本結(jié)構(gòu)如下圖所示:5.1.1語音識別聲學(xué)模型在進行語音識別之前我們要做不少準(zhǔn)備工作。先用大量聲音數(shù)據(jù)訓(xùn)練一個聲學(xué)模型(見圖5-3),用來將聲音轉(zhuǎn)換為聲學(xué)符號。我們將要識別的語音按照一定時間間隔切割成彼此重疊、很小很小的段落,再通過聲學(xué)模型將這些小片段識別成對應(yīng)的語音狀態(tài)。這些語音狀態(tài)是聲母、韻母的組成部分,能很好地對語音進行描述。5.1.1語音識別語言模型(LanguageModel,簡稱LM)是一個用于建模自然語言(即人們?nèi)粘J褂玫恼Z言)的概率模型。簡單來說,語言模型的任務(wù)是評估一個給定的詞序列(即一個句子)在真實世界中出現(xiàn)的概率。5.1.2語音合成語音合成(TexttoSpeech,TTS)技術(shù),又稱文語轉(zhuǎn)換技術(shù),能將任意文字信息實時轉(zhuǎn)化為標(biāo)準(zhǔn)流暢的語音朗讀出來,相當(dāng)于給機器裝上了人工嘴巴(見圖5-6)。它涉及聲學(xué)、語言學(xué)、數(shù)字信號處理、計算機科學(xué)等多個學(xué)科技術(shù),是信息處理領(lǐng)域的一項前沿技術(shù),解決的主要問題就是如何將文字信息轉(zhuǎn)化為可聽的聲音信息,即讓機器像人一樣開口說話。5.1.3聲紋識別人們可以靠聲音判斷對方是誰,聲音同樣可以被用來證明“你是你”.和面容、指紋一樣,人類的發(fā)聲器官千差萬別,發(fā)出的聲音也不盡相同(見圖5-10)。人聲的這種特質(zhì)被稱為聲紋(見圖5-11)。5.1.3聲紋識別事實上,錄制和播放的過程會讓聲音衰減失真,與真人的聲音相差甚遠,很容易鑒別?;蛘吒纱鄰漠a(chǎn)品設(shè)計層面出發(fā),要求用戶在規(guī)定時間內(nèi)說出一組隨機數(shù)字,或者與人臉識別、指紋識別等其他識別手段相結(jié)合,從而提升安全性(見圖5-15).Part02智能語音技術(shù)應(yīng)用5.2智能語音技術(shù)應(yīng)用除了語音導(dǎo)航、智能音箱、語音輸入法等我們?nèi)粘I钪械某R姂?yīng)用場景,只要把語音識別理解成“獲取人類語言中的信息”,把語音合成理解成“讓人類通過聲音獲取信息”,再把聲紋識別、關(guān)鍵詞喚醒等理解成可供選擇的“功能”,將它們與不同載體、場景結(jié)合,就會形成各種各樣的產(chǎn)品。5.2.1酒店虛擬前臺酒店前臺工作人員每天都要撥打和接聽大量的電話,經(jīng)常出現(xiàn)接打不及時、處理問題沒耐心、影響現(xiàn)場接待和客房周轉(zhuǎn)等問題?;谌斯ぶ悄芗夹g(shù)的酒店虛擬前臺可以實現(xiàn)前臺電話智能接打,能夠自動完成酒店的到店確認、退房確認、咨詢和客需服務(wù)等工作,可同時接打多人電話,瞬間完成業(yè)務(wù)處理,實現(xiàn)全程無人化,帶來高效智能的前臺服務(wù),從而提升前臺業(yè)務(wù)效率,提高客房周轉(zhuǎn)能力,解決人手不足和成本攀升等問題。5.2.2語音質(zhì)檢考慮到復(fù)雜業(yè)務(wù)處理或客戶習(xí)慣喜好,目前仍配有人工客服接打客戶電話,而為了提升客戶服務(wù)水平,往往需要進行語音質(zhì)檢。傳統(tǒng)的質(zhì)檢是采用人工抽檢方式,質(zhì)檢覆蓋率低且無法準(zhǔn)確定位問題工單。人工聽錄音的質(zhì)檢方式,需要長時間集中精力,聽取大量的無效信息,導(dǎo)致成本高,效率低,工作強度大。同時大量未質(zhì)檢的工單中的有效內(nèi)容如客戶訴求信息、服務(wù)信息等未能得到充分挖掘利用。而借助智能語音技術(shù)可大幅提高質(zhì)檢效率,充分發(fā)揮電話數(shù)據(jù)價值。5.2.3智能音箱酒店場合下的公共設(shè)施的操作可以采用語音控制來避免接觸。5.2.4智能音箱智能音箱不僅是音箱,還是新一代的人機交互入口。它以藍牙音箱的形式集播放網(wǎng)絡(luò)音樂、查詢各類信息、語音娛樂互動甚至控制智能家電等功能于一身。Part03智能語音體驗5.3.2語音合成國內(nèi)外不少人工智能頭部企業(yè)建設(shè)了自己的人工智能開放平臺,供外部使用。如科大訊飛的訊飛開放平臺(見圖5-26)、百度的百度AI開放圖5-26訊飛開放平臺“語音合成”測試界面平臺(見圖5-27)、阿里云的阿里靈杰平臺(見圖5-28)等。請大家訪問這三家企業(yè)的人工智能開放平臺,比較三家平臺的“語音合成”AI能力實現(xiàn)效果。5.2.3探索與思考(1)在訊飛輸入法中說古詩、說文言文、說當(dāng)下流行語,觀察其識別率如何。從聲學(xué)模型和語言模型角度思考,語音識別準(zhǔn)確率與哪些因素相關(guān)?(2)在使用訊飛輸入法進行語音輸入時,距離手機麥克風(fēng)遠近、周圍環(huán)境安靜程度對語音識別率有多大影響?除此,還有哪些外在環(huán)境因素會影響識別率?(3)訊飛輸入法支持的方言里,有沒有你家鄉(xiāng)的方言?若增加一種方言,你認為可能要做哪些工作?(4)我們在運用語音合成技術(shù)時,除了法律法規(guī)之外,還應(yīng)該遵守哪些道德規(guī)范?(5)除了本章介紹的智能語音技術(shù),性別年齡識別、歌曲識別、對話情緒識別、語音審核等也是智能語音領(lǐng)域的技術(shù)。你能否結(jié)合你的專業(yè)對應(yīng)的工作崗位,思考這些語音技術(shù)有哪些應(yīng)用場景?(6)你認為智能語音交互會成為人機交互的主流方式嗎?為什么?閱讀延展謝謝THANKS第六章自然語言處理
《人工智能應(yīng)用概論(第2版)》RengongZhinengYingyongGailun
Part0101自然語言處理概論Part0202自然語言處理技術(shù)原理
Part0303自然語言處理的應(yīng)用場景
目
錄contentPart0404自然語言處理的典型實踐案例【案例導(dǎo)入】打開翻譯軟件,將中文“三人行,必有我?guī)熝伞狈g成英文,看看哪家的翻譯效果更好。Part01自然語言處理概論6.1.1自然語言處理定義自然語言處理(NaturalLanguageProcessing,NLP)研究的是能實現(xiàn)人與計算機之間用自然語言進行有效通信的各種理論和方法。而用自然語言與計算機進行通信,有著十分重要的實際應(yīng)用意義,也有著革命性的理論意義。實現(xiàn)人機間自然語言通信意味著要使計算機既能理解自然語言文本的意義,又能以自然語言文本來表達給定的意圖、思想等;前者稱為自然語言理解,后者稱為自然語言生成。自然語言處理主要應(yīng)用于機器翻譯、輿情監(jiān)測、自動摘要、觀點提取、文本分類、問題回答、文本語義對比、語音識別、中文OCR等方面。6.1.2自然語言處理發(fā)展歷程1950年,圖靈提出了著名的“圖靈測試”,這一般被認為是自然語言處理思想的開端。20世紀(jì)50年代到70年代,自然語言處理主要采用基于規(guī)則的方法。研究院認為自然語言處理的過程和人類學(xué)習(xí)認知一門語言的過程是類似的,所以他們基于這個觀點來進行研究。這一階段雖然解決了一些簡單的問題,但是無法從根本上將自然語言處理實用化。20世紀(jì)80年代以后,賈里尼克和他所在的IBM華生實驗室是推動這一轉(zhuǎn)變的關(guān)鍵,他們采用基于統(tǒng)計的方法,將當(dāng)時的語音識別率從70%提升到90%,從實驗室走向?qū)嶋H應(yīng)用。從2008年到現(xiàn)在,引入深度學(xué)習(xí)來做自然語言處理研究,由最初的詞向量到2013年的word2vec,將深度學(xué)習(xí)與自然語言處理的結(jié)合推向了高潮,并在機器翻譯、問答系統(tǒng)、閱讀理解等領(lǐng)域取得了一定成功。RNN成為自然語言處理最常用的方法之一后,Transformer、BERT、GNN等模型相繼引發(fā)了一輪又一輪的熱潮。6.1.3自然語言處理未來展望1)更優(yōu)的算法。人工智能發(fā)展的三要素(數(shù)據(jù)、計算能力和算法)中,與自然語言處理研究者最相關(guān)的就是算法設(shè)計。2)語言的深度分析。未來語言中的難題還需要關(guān)注語義理解,從大規(guī)模網(wǎng)絡(luò)數(shù)據(jù)中,通過深入的語義分析,結(jié)合語言學(xué)理論,發(fā)現(xiàn)語義產(chǎn)生與理解的規(guī)律,研究數(shù)據(jù)背后隱藏的模式,擴充和完善已有的知識模型,使語義表示更加準(zhǔn)確.語言理解需要理性與經(jīng)驗的結(jié)合,理性是先驗的,而經(jīng)驗可以擴充知識,因此需要充分利用世界知識和語言學(xué)理論指導(dǎo)先進技術(shù)來理解語義。3)多學(xué)科的交叉。在理解語義的問題上,需要尋找一個合適的模型。在模型的探索中,需要充分借鑒語言哲學(xué)、認知科學(xué)和腦科學(xué)領(lǐng)域的研究成果,從認知的角度去發(fā)現(xiàn)語義的產(chǎn)生與理解,有可能會為語言理解建立更好的模型。在科技創(chuàng)新的今天,多學(xué)科的交叉可以更好地促進自然語言處理的發(fā)展。6.1.4自然語言處理整體體系Part02自然語言處理技術(shù)原理6.2.1自然語言處理整體框架自然語言處理整體框架:包括三部分內(nèi)容信息、自然語言技術(shù)、知識庫。其過程是(1)需要構(gòu)建一個知識庫,包含實體、概念及它們之間的關(guān)系。(2)通過自然語言模型來理解和處理文本數(shù)據(jù)。(3)根據(jù)知識庫推理得出信息,實現(xiàn)問題回答、文本分類等功能。這一過程涉及數(shù)據(jù)預(yù)處理、特征提取和模型應(yīng)用等關(guān)鍵步驟,旨在讓計算機更好地理解人類語言。6.2.2自然語言處理技術(shù)從研究內(nèi)容來看,自然語言處理技術(shù)包括語法分析、語義分析、篇章理解,機器翻譯、語音識別及文語轉(zhuǎn)換、信息檢索、信息抽取與過濾、文本分類與聚類、輿情分析和觀點挖掘等等.。6.2.3自然語言處理關(guān)鍵技術(shù)1-分詞等分詞、詞性標(biāo)注、句法分析、命名實體識別(1)分詞模塊負責(zé)將輸入的漢字序列切分成單詞序列,在該例子中經(jīng)過分詞的輸出是“我/愛/自然語言處理”。(2)詞性標(biāo)注模塊負責(zé)為分詞結(jié)果中的每個單詞標(biāo)注一個詞性,如名詞、動詞、形容詞、連詞、副詞、標(biāo)點符號等。(3)依存句法分析模塊負責(zé)預(yù)測句子中單詞與單詞間的依存關(guān)系,確定句子的句法結(jié)構(gòu),包括主、謂、賓、定、補、狀等,并用樹狀結(jié)構(gòu)來表示整句的句法結(jié)構(gòu)。(4)命名實體識別模塊負責(zé)從文本中識別出具有特定意義的實體,如人名、地名、機構(gòu)名、專有名詞等。6.2.4自然語言處理關(guān)鍵技術(shù)2-消除語言歧義人類的語言多元且復(fù)雜,言語交流中同一個句子通常不止一種含義,自然語言處理的難題之一就是消除語言歧義(見圖6-5),即消除如詞法分析、句法分析、語義分析等過程中存在的歧義問題,簡稱消歧。6.2.4自然語言處理關(guān)鍵技術(shù)2-消除語言歧義第一,語言中充滿了歧義,這主要體現(xiàn)在詞法、句法及語義三個層次上。歧義的產(chǎn)生是由于自然語言所描述的對象——人類活動非常復(fù)雜,而語言的詞匯和句法規(guī)則又是有限的,這就造成同一種語言形式可能具有多種含義。第二,消除歧義所需要的知識在獲取、表達以及運用上存在困難。由于語言處理的復(fù)雜性,因此合適的語言處理方法和模型難以設(shè)計。從上述兩個主要困難可以看出,自然語言處理這個難題的根源是人類語言的復(fù)雜性和語言描述的外部世界的復(fù)雜性。為解決語義歧義問題,目前常見的算法策略有基于貝葉斯分類、基于信息論、基于詞典等消歧算法。消除語言歧義的基本過程如圖6-6所示。圖6-6消除語言歧義的基本過程6.2自然語言處理的應(yīng)用場景自然語言理解和自然語言生成是自然語言處理的兩大任務(wù),如圖6-7所示。接下來我們從這兩大任務(wù)去了解自然語言處理的應(yīng)用場景。Part03自然語言處理應(yīng)用場景6.3.1應(yīng)用場景自然語言理解(NaturalLanguageUnderstanding,NLU)和自然語言生成(NaturalLanguageGeneration,NLG)是自然語言處理的兩大任務(wù),如圖6-7所示。接下來我們從這兩大任務(wù)去了解自然語言處理的應(yīng)用場景。6.3.2智能問答智能問答系統(tǒng)通常分為知識型機器人、閑聊型機器人和任務(wù)型機器人(客服機器人)。知識型機器人主要用于解決用戶的問題,例如商品購買咨詢、商品退貨咨詢等;閑聊型機器人主要用于深入地與用戶進行無目的交流;任務(wù)型機器人(客服機器人)主要用于完成用戶的某些特定任務(wù),例如買機票、話費充值或者天氣咨詢。6.3.3智能寫作近年自然語言處理模型性能的不斷突破,促使其從規(guī)則、模板寫作發(fā)展到了以神經(jīng)網(wǎng)絡(luò)模型為核心的智能寫作,從輔助記者創(chuàng)作逐步走向自動化寫作,應(yīng)用場景也從模板化的資訊類數(shù)據(jù)報告,深入分析報告、詩歌創(chuàng)作、長故事文本創(chuàng)作、廣告營銷文本寫作等更豐富、復(fù)雜的內(nèi)容形式,貫穿信息監(jiān)管、素材采集、文本編輯、文本創(chuàng)作、修改優(yōu)化、敏感信息審核等多項業(yè)務(wù)環(huán)節(jié)。6.3.4文本情感分析情感分析作為一種常見的自然語言處理方法的應(yīng)用,可以從大量數(shù)據(jù)中識別和吸收相關(guān)信息,而且可以理解更深層次的含義。例如:企業(yè)分析消費者對產(chǎn)品的反饋信息,或者檢測在線評論中的差評信息等。通過情感分析,可以挖掘產(chǎn)品在各個維度的優(yōu)劣勢,明確如何改進產(chǎn)品。如對外賣評價進行情感分析,分析菜品口味、送達時間、送餐態(tài)度、菜品豐富度等多個維度的用戶情感指數(shù),從而從各個維度上改進外賣服務(wù)。6.3.4文本情感分析1、基于情感詞典的情感分類方法先對文本進行分詞和停用詞處理等預(yù)處理,再利用事先構(gòu)建好的情感詞典,對文本進行字符串匹配,從而挖掘正面和負面信息。情感詞典包含積極詞語、消極詞語、否定詞、程度副詞表四部分。6.3.4文本情感分析2、基于詞典的文本匹配算法相對簡單。遍歷語句中分詞后的詞語,如果詞語命中詞典,則進行相應(yīng)權(quán)重的處理。積極詞語權(quán)重為加法,消極詞語權(quán)重為減法,否定詞權(quán)重取相反數(shù),程度副詞權(quán)重則和它修飾的詞語權(quán)重相乘,如圖6-9所示。利用最終輸出的權(quán)重值,可以區(qū)分是積極、消極還是中性情感。6.3.5市場上較前沿的自然語言模型【OpenAI】ChatGPT(ChatGenerativePre-trainedTransformer)是OpenAI研發(fā)的一款聊天機器人程序,于2022年11月30日發(fā)布。ChatGPT是人工智能技術(shù)驅(qū)動的自然語言處理工具,它能夠基于在預(yù)訓(xùn)練階段所見的模式和統(tǒng)計規(guī)律來生成回答,還能根據(jù)聊天的上下文進行互動,真正像人類一樣來聊天交流,甚至能完成寫郵件、視頻腳本、文案、代碼、論文等任務(wù)。【科大訊飛】訊飛星火認知大模型是。該模型具有七大核心能力,即文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力、代碼能力、多模交互。該模型開放半年內(nèi)用戶數(shù)就高達上千萬。2.文心一言文心一言是百度全新一代知識增強大語言模型,是文心大模型家族的新成員,能夠與人對話互動、回答問題、協(xié)助創(chuàng)作,高效便捷地幫助人們獲取信息、知識和靈感?!景俣取课男囊谎詮臄?shù)萬億數(shù)據(jù)和數(shù)千億知識中融合學(xué)習(xí),得到預(yù)訓(xùn)練大模型,在此基礎(chǔ)上采用有監(jiān)督精調(diào)、人類反饋強化學(xué)習(xí)、提示等技術(shù),具備知識增強、檢索增強和對話增強的技術(shù)優(yōu)勢。開放首日,文心一言共計回復(fù)網(wǎng)友超3000萬個問題。【騰訊】混元大模型騰訊混元大模型是由騰訊全鏈路自研的通用大語言模型,擁有超千億參數(shù)規(guī)模,預(yù)訓(xùn)練語料超2萬億tokens,具有強大的中文理解與創(chuàng)作能力、邏輯推理能力,以及可靠的任務(wù)執(zhí)行能力。Part03自然語言處理的典型實踐案例6.4.1聊天機器人ElizaEliza是最早的人機對話程序,是世界上第一個真正意義上的聊天機器人。下面我們來運行程序,體驗和Eliza聊天。(1)按照如下網(wǎng)址,下載eliza.pyPython程序文件。(2)假定下載的文件放置在F盤的根目錄。打開CMD窗口,進入F盤目錄。(3)執(zhí)行Python命令,運行eliza.py程序。(4)開始與Eliza聊天,如圖6-11所示?!咎剿髋c思考】(1)拿出自己的手機,觀察手機的哪些功能或者手機中哪款A(yù)pp的功能是與自然語言處理相關(guān)的;這些功能使用起來效果如何,還存在哪些不足?(2)“圖靈測試”和“中文屋問題”都涉及機器的語言理解,試問這種語言理解和人類的語言理解是否一樣?機器智能和生物智能有什么區(qū)別?(3)從“不管黑貓白貓,捉到老鼠就是好貓”的實用角度給人工智能下定義,即若某個程序做了和人相似的有智能的事,那它就具有智能。對于這樣的定義,你是否接受?謝謝THANKS
第七章
知識表示《人工智能應(yīng)用概論(第2版)》RengongZhinengYingyongGailunPart0101知識表示的概念及發(fā)展歷程Part0202知識表示的各種方法Part0303知識表示的應(yīng)用場景Part01知識表示的概念及發(fā)展歷程
【課程導(dǎo)入】機場智能機器人的應(yīng)用場景從該案例中可以看出,智能機器人理解客人所說的問題后,能夠準(zhǔn)確地把問題的解決方法展示給客人看?!舅伎碱}】機器為什么能夠像人一樣做出智能行為和邏輯判斷呢?7.1知識的概念和特征1、相對正確性在一定的條件及環(huán)境下,知識是正確的。2、不確定性由于現(xiàn)實世界的復(fù)雜性,知識并不總是只有“真”與“假”這兩種狀態(tài),在“真”與“假”之間還存在許多中間狀態(tài),即存在為“真”的程度問題。3、可表示性與可利用性知識可以用適當(dāng)形式表示出來,如用語言、文字、圖形、神經(jīng)網(wǎng)絡(luò)等,這樣才能被存儲、傳播。每個人每天都在利用自己掌握的知識來解決各種問題。知識的特征知識的概念知識是人們在長期的生活及社會實踐中、在科學(xué)研究及實驗中,積累起來的對客觀世界的認識與經(jīng)驗。人工智能的知識:“規(guī)則”——用“如果……,則……”表示的關(guān)聯(lián)形式,反映了信息間的某種因果關(guān)系;“事實”——通過多個信息的關(guān)聯(lián),得出事物的客觀特征。7.2知識表示的概念知識表示(KnowledgeRepresentation)就是將人類知識形式化或者模型化。知識表示的目的是讓計算機儲存和運用人類的知識。7.3知識表示的發(fā)展歷程Part02知識表示的各種方法7.4知識表示的方法7.4知識表示的方法一階謂詞邏輯表示法是一種重要的知識表示方法,它以數(shù)理邏輯為基礎(chǔ),是到目前為止能夠表達人類思維活動規(guī)律的一種最精準(zhǔn)的形式語言。對事實性知識,一階謂詞邏輯表示法通常用合取符號(∧)和析取符號(∨)連接形成的謂詞公式來表示。例如:對事實性知識“張三是學(xué)生,李四也是學(xué)生”,可以表示為:ISSTUDENT(張三)∧ISSTUDENT(李四)這里,ISSTUDENT(x)是一個謂詞,表示x是學(xué)生。對規(guī)則性知識,一階謂詞邏輯表示法通常用蘊涵符號(→)連接形成的謂詞公式(即蘊涵式)來表示。例如:對于規(guī)則“如果x,則y”,可以用下列的謂詞公式表示:x→y7.4知識表示的方法(3)根據(jù)所要表達的知識的語義,用適當(dāng)?shù)倪B接符號將各個謂詞連接起來,形成謂詞公式。user(Li,201),user(Wang,202),user(Zhao,203),user(Zhang,204)
→telephone(590,201),telephone(591,202),telephone(592,203)telephone(593,204)(1)定義謂詞及個體,確定每個謂詞及個體的確切含義。租戶:user。電話號碼:telephone。(2)根據(jù)所要表達的事物或概念,為每個謂詞中的變元賦以特定的值。租戶與對應(yīng)的房號:(Li,201),(Wang,202),(Zhao,203),(Zhang,204)。房號與對應(yīng)的電話號碼:(590,201),(591,202),(592,203),(593,204)人類智能可識別的知識一階謂詞邏輯表示法進行知識表示的過程人工智能可識別的知識表示7.4知識表示的方法產(chǎn)生式表示法適合表示規(guī)則性知識和事實性知識。P→Q或者:IFPTHENQ如果前提P被滿足,則可推出結(jié)論Q或執(zhí)行Q所規(guī)定的操作。格式含義舉例1:表示規(guī)則性知識舉例2:表示事實性知識7.4知識表示的方法框架表示法:框架是一種描述對象屬性的數(shù)據(jù)結(jié)構(gòu)。格式舉例1:表示教師的數(shù)據(jù)結(jié)構(gòu)舉例2:表示教職工的數(shù)據(jù)結(jié)構(gòu)7.4知識表示的方法框架表示法之框架網(wǎng)絡(luò):用框架名作為槽值,建立框架間的橫向聯(lián)系,用繼承槽建立框架間的縱向聯(lián)系。像這樣具有橫向與縱向聯(lián)系的一組框架稱為框架網(wǎng)絡(luò)。框架網(wǎng)絡(luò)示例如下圖所示??蚣芟到y(tǒng)中求解問題的核心思想是匹配與填槽。小結(jié):框架表示法的基本過程框架表示法7.4知識表示的方法“動物能吃、能運動;鳥是一種動物,鳥有翅膀、會飛;魚是一種動物,魚生活在水中、會游泳”?!肮纺艹?,會跑”語義網(wǎng)絡(luò)表示法多元關(guān)系網(wǎng)絡(luò)知識含義一元關(guān)系網(wǎng)絡(luò)知識含義7.4知識表示的方法可表示事件和動作的語義網(wǎng)絡(luò)可表示情況和動作的語義網(wǎng)絡(luò)“小黑這只燕子從春天到秋天一直占有一個巢”。例如:“我給他一本書作為禮物”。語義網(wǎng)絡(luò)表示法知識含義知識含義7.4知識表示的方法腳本表示法使用一種特定的編程語言或腳本語言來表示實體、屬性和關(guān)系。腳本表示法的特點:制作一杯咖啡的過程被分解為了一系列的原子動作,這些動作按照特定的順序組織起來,形成了一個完整的制作咖啡的流程。這種方法使得知識表示既清晰又易于理解,特別適合于表示那些步驟固定、流程化的操作或活動。舉例:制作一杯咖啡定義原子動作定義進入條件、角色、道具、使用原子動作表示場景,明確結(jié)局Part03知識表示的應(yīng)用場景7.5知識表示的應(yīng)用場景知識圖譜技術(shù)最先應(yīng)用于搜索,最初由谷歌提出。(1)語義搜索:實現(xiàn)Web從網(wǎng)頁鏈接向概念鏈接轉(zhuǎn)變,支持用戶按主題而不是字符搜索。(2)關(guān)系搜索:獲取兩個實體之間的關(guān)系,例如公司之間的關(guān)系、人物之間的關(guān)系等。(3)結(jié)構(gòu)化展現(xiàn):以圖形化的方式向用戶展示經(jīng)過分類整理的結(jié)構(gòu)化知識,從而使用戶從人工過濾網(wǎng)頁尋找答案的模式中解脫出來。場景1:搜索7.5知識表示的應(yīng)用場景從具體應(yīng)用場景來看,當(dāng)前智能對話系統(tǒng)應(yīng)答的典型內(nèi)容有三種:(1)任務(wù)型(2)問答型(3)閑聊型場景2:智能對話系統(tǒng)7.5知識表示的應(yīng)用場景(1)知識圖譜問答(2)表格問答(3)文本問答(4)社區(qū)問答問答型機器人的知識來源7.5知識表示的應(yīng)用場景基于知識圖譜的商品推薦7.5知識表示的應(yīng)用場景輔助信貸審核可以基于知識圖譜數(shù)據(jù)進行統(tǒng)一查詢,全面掌握客戶信息,避免由于系統(tǒng)、數(shù)據(jù)等孤立造成的信息不一致導(dǎo)致信用重復(fù)使用、信息不完整等問題。7.5知識表示的應(yīng)用場景中醫(yī)藥知識平臺可以針對中醫(yī)藥知識體系進行系統(tǒng)梳理、建模和展示;以圖形可視化方式展示核心概念之間的關(guān)系;輔助中醫(yī)專家厘清學(xué)術(shù)發(fā)展脈絡(luò),瀏覽中醫(yī)知識,發(fā)現(xiàn)知識點之間的聯(lián)系。與閱讀文獻等手段相比,中醫(yī)藥知識平臺可大幅度節(jié)約知識檢索獲取時間。7.5知識表示的應(yīng)用場景建立知識圖譜,用于識別老虎、金錢豹、斑馬、長頸鹿、鴕鳥、企鵝、信天翁這七種動物的識別系統(tǒng)。如:識別下圖中包含哪些動物?7.5知識表示的應(yīng)用場景2、設(shè)計匹配過程根據(jù)系統(tǒng)規(guī)則庫來檢索動物已知的信息為動物特征:黑色斑點、長脖子、長腿、分泌乳汁、有蹄。這是什么動物?1、獲取知識表示庫3、程序運行結(jié)果探索與思考(1)知識怎么被表示?(2)為什么不同階段會有不同的知識表示概念模型產(chǎn)生?(3)知識表示在人工智能發(fā)展過程中有哪些作用?本章總結(jié)知識表示是對知識的一種描述,或者是對知識的一組約定,是一種計算機可以接受的用于描述知識的數(shù)據(jù)結(jié)構(gòu)。它是機器通往智能的基礎(chǔ),使得機器可以像人一樣運用知識。知識具有相對正確性、不確定性、可表示性與可利用性的特點。根據(jù)不同劃分標(biāo)準(zhǔn),知識可以分為不同的類別。例如:按確定性分類,知識可分為確定性知識、不確定性知識。謝謝THANKS第八章
計算機視覺
《人工智能應(yīng)用概論(第2版)》RengongZhinengYingyongGailun
Part0101計算機視覺技術(shù)概述Part0202計算機視覺的工作原理Part0303計算機視覺的典型實踐案例目
錄contentPart01計算機視覺技術(shù)概述嘗試過大型超市刷臉支付嗎?你有關(guān)注/體驗現(xiàn)在智能汽車的自動駕駛么?【課程導(dǎo)入】【生活案例】微信公眾號,搜索“訊飛Ai體驗棧”,身份證識別、銀行卡識別、顏值分析、速算題批改【課程導(dǎo)入】1.1計算機視覺的概念計算機視覺是人工智能的一個分支,是使用計算機模仿人類視覺系統(tǒng)的一門科學(xué)。它是用計算機代替人眼,使用圖像處理技術(shù)、深度學(xué)習(xí)算法進一步對目標(biāo)進行識別、跟蹤和測量等。這涉及開發(fā)能夠處理和理解圖像和視頻的算法、模型和系統(tǒng),使機器能夠從視覺數(shù)據(jù)中“看到”和提取有用的信息,并應(yīng)用于從簡單的圖像識別(計算機視覺領(lǐng)域最為經(jīng)典的研究問題,莫過于貓狗分類了)到復(fù)雜的場景理解(如自動駕駛汽車識別路上的行人和障礙物)的各種任務(wù)。1.2計算機視覺的發(fā)展計算機視覺的概念可以追溯到20世紀(jì)60年代,主要集中在基本的圖像處理和模式識別。近十年來,深度學(xué)習(xí)的興起極大地推動了計算機視覺技術(shù)的發(fā)展,特別是卷積神經(jīng)網(wǎng)絡(luò)(CNNs),在圖像識別和分類等任務(wù)中取得了革命性的進展,這使得計算機視覺應(yīng)用變得更加廣泛和強大。1.2計算機視覺的發(fā)展隨著GPT-4V、Gemini等大模型的驚艷亮相,更是使得計算機視覺的能力表現(xiàn)躍上了新臺階。1.2計算機視覺的發(fā)展隨著GPT-4V、Gemini等大模型的驚艷亮相,更是使得計算機視覺的能力表現(xiàn)躍上了新臺階。1.2計算機視覺主要技術(shù)步驟計算機視覺技術(shù)的主要步驟包括圖像預(yù)處理、特征提取、特征選擇、(圖像識別、目標(biāo)檢測和圖像分割)等。這些步驟共同構(gòu)成了計算機視覺處理流程的核心,使得機器能夠理解并解釋視覺信息,從而實現(xiàn)各種復(fù)雜的任務(wù)。圖像預(yù)處理特征提取特征選擇圖像識別目標(biāo)檢測圖像分割1.3計算機視覺主要技術(shù)步驟圖像預(yù)處理是計算機視覺技術(shù)的第一步,旨在提高圖像質(zhì)量和可處理性。常見的預(yù)處理操作包括灰度化、二值化和濾波等。例如,灰度化是將彩色圖像轉(zhuǎn)換為灰度圖像的過程。特征提取
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 課件:正確認識高職院校內(nèi)部質(zhì)量保證體系診斷與改進
- 二零二五年度牧草生物質(zhì)能項目合作協(xié)議4篇
- 第三單元 資產(chǎn)階級民主革命與中華民國的建立(解析版)- 2023-2024學(xué)年八年級歷史上學(xué)期期中考點大串講(部編版)
- 長沙市人教版七年級上冊道德與法治期末試卷及答案
- 二零二五年度廚房裝修工程竣工備案合同4篇
- 二零二五年度海鮮食材直采配送合同2篇
- 2025年度個人貸款擔(dān)保變更通知合同3篇
- 買賣房屋居間合同
- 2025年垃圾分類再利用合同
- 二零二五年度教育機構(gòu)學(xué)生貸款合同范本6篇
- 2024年蘇州工業(yè)園區(qū)服務(wù)外包職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測試歷年參考題庫含答案解析
- 人教版初中語文2022-2024年三年中考真題匯編-學(xué)生版-專題08 古詩詞名篇名句默寫
- 2024-2025學(xué)年人教版(2024)七年級(上)數(shù)學(xué)寒假作業(yè)(十二)
- 山西粵電能源有限公司招聘筆試沖刺題2025
- ESG表現(xiàn)對企業(yè)財務(wù)績效的影響研究
- 醫(yī)療行業(yè)軟件系統(tǒng)應(yīng)急預(yù)案
- 使用錯誤評估報告(可用性工程)模版
- 2024年湖南高速鐵路職業(yè)技術(shù)學(xué)院單招職業(yè)技能測試題庫附答案
- 2024年4月浙江省00015英語二試題及答案含評分參考
- 黑枸杞生物原液應(yīng)用及產(chǎn)業(yè)化項目可行性研究報告
- 2024年黑龍江省政工師理論知識考試參考題庫(含答案)
評論
0/150
提交評論