人工智能技術(shù)導(dǎo)論-課件第5、6章人工智能關(guān)鍵技術(shù)、人工智能產(chǎn)品形態(tài)

上傳人：y*** IP屬地：山東上傳時(shí)間：2023-12-01 格式：PPTX 頁數(shù)：81 大?。?7.79MB 積分：25 舉報(bào) 版權(quán)申訴

人工智能技術(shù)導(dǎo)論-課件第5、6章人工智能關(guān)鍵技術(shù)、人工智能產(chǎn)品形態(tài)_第2頁

人工智能技術(shù)導(dǎo)論-課件第5、6章人工智能關(guān)鍵技術(shù)、人工智能產(chǎn)品形態(tài)_第3頁

人工智能技術(shù)導(dǎo)論-課件第5、6章人工智能關(guān)鍵技術(shù)、人工智能產(chǎn)品形態(tài)_第4頁

人工智能技術(shù)導(dǎo)論-課件第5、6章人工智能關(guān)鍵技術(shù)、人工智能產(chǎn)品形態(tài)_第5頁

已閱讀5頁，還剩76頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第5章人工智能關(guān)鍵技術(shù)目錄5.1計(jì)算機(jī)視覺技術(shù)5.2智能語音技術(shù)5.3自然語言處理技術(shù)5.4知識圖譜技術(shù)學(xué)習(xí)目標(biāo)本章主要從人工智能系統(tǒng)的技術(shù)視角，圍繞人工智能中的計(jì)算機(jī)視覺技術(shù)、智能語音技術(shù)、自然語言處理技術(shù)、知識圖譜等核心技術(shù)進(jìn)行討論，希望帶領(lǐng)讀者正確理解人工智能關(guān)鍵技術(shù)的概念，初步認(rèn)識人工智能系統(tǒng)的“看、聽、說、做”實(shí)現(xiàn)方法。理解計(jì)算機(jī)視覺關(guān)鍵技術(shù)理解智能語音關(guān)鍵技術(shù)理解自然語言處理關(guān)鍵技術(shù)理解知識圖譜關(guān)鍵技術(shù)目錄5.1計(jì)算機(jī)視覺技術(shù)概述

人工智能的本質(zhì)工作是研究、開發(fā)用于模擬和延展人類的智能的應(yīng)用系統(tǒng)，具體來說就是通過人工智能技術(shù)來模仿人類的“視物”、“聽聲”、“說話”、“理解”及“推理”等人類智能能力。人類智能與人工智能概述計(jì)算機(jī)視覺（CompuerVision，CV）是研究使用計(jì)算機(jī)實(shí)現(xiàn)或模擬人類“視物”功能的技術(shù)，使用計(jì)算機(jī)模仿人類視覺系統(tǒng)的科學(xué)，讓計(jì)算機(jī)擁有類似人類提取、處理、理解和分析圖像以及圖像序列的能力。確切地說，計(jì)算機(jī)視覺技術(shù)就是利用了攝像機(jī)以及電腦替代人類眼睛，使得計(jì)算機(jī)擁有人類眼睛所具有的分類、識別、分割、跟蹤、判別決策等功能。概述

通過圖像獲取技術(shù)提取二維圖像、三維圖組、圖像序列等原始數(shù)據(jù)。

下面所示展示了人類看到的“冰墩墩”圖像和機(jī)器獲取到的“冰墩墩”數(shù)據(jù)（右圖為了清晰呈現(xiàn)，只截取了部分?jǐn)?shù)據(jù)）。人類看到的“冰墩墩”圖像機(jī)器“看到”的“冰墩墩”圖像概述

計(jì)算機(jī)視覺系統(tǒng)就是創(chuàng)建了能夠在二維平面圖像或者三維立體圖像的數(shù)據(jù)中，以獲取所需要的“信息”的一個(gè)完整的人工智能系統(tǒng)，例如自動(dòng)駕駛、智能機(jī)器人等領(lǐng)域均需要通過計(jì)算機(jī)視覺技術(shù)從視覺信號中提取并處理信息。自動(dòng)駕駛系統(tǒng)智能機(jī)器人圖像處理基礎(chǔ)

圖像是人類視覺的基礎(chǔ)，是自然景物的客觀反映，是人類認(rèn)識世界和人類自身的重要源泉。計(jì)算機(jī)視覺是讓機(jī)器具有智慧的“眼睛”，圖像處理是其重要的研究內(nèi)容。對于圖像，有一個(gè)重要的概念-圖像分辨率。圖像分辨率又分為空間分辨率和灰度分辨率。圖像處理基礎(chǔ)分辨率高

空間分辨率是每英寸圖像內(nèi)有多少個(gè)像素點(diǎn)被采樣，分辨率的單位為PPI(PixelsPerInch，像素每英寸)。采樣過程實(shí)質(zhì)上對一幅圖像等間距劃分成多個(gè)網(wǎng)格，每一個(gè)網(wǎng)格表示一個(gè)像素點(diǎn)。采樣間隔越大，所得圖像像素?cái)?shù)越少，空間分辨率越低，圖像質(zhì)量差，嚴(yán)重時(shí)出現(xiàn)馬賽克效應(yīng)；采樣間隔越小，所得圖像像素?cái)?shù)越多，空間分辨率越高，圖像質(zhì)量好，但數(shù)據(jù)量大。

分辨率低圖像處理基礎(chǔ)

灰度分辨率是用于量化灰度的比特?cái)?shù)，通常用2的整數(shù)次冪來表示，例如8bit，它表示的灰度范圍是0到255。量化實(shí)質(zhì)上是顏色值數(shù)字化的過程。根據(jù)圖像的灰度級數(shù)，可將圖像分為黑白圖像（二值圖像，用0和1表達(dá)）、灰度圖像和彩色圖像。彩色圖像黑白圖像灰度圖像計(jì)算機(jī)視覺技術(shù)的主要任務(wù)

計(jì)算機(jī)視覺是一種讓計(jì)算機(jī)學(xué)會(huì)“視物”并“識物”的技術(shù)，跟人類觀察世界一樣，從粗粒度的“歸類”到精細(xì)粒度的“理解”，計(jì)算機(jī)視覺技術(shù)的主要任務(wù)有圖像分類（What）、目標(biāo)檢測（What&Where）、圖像分割（What&Where），其中圖像分割不但能檢測位置，還能夠精細(xì)地將位置輪廓勾勒出來。計(jì)算機(jī)視覺技術(shù)的主要任務(wù)圖像分類體驗(yàn)網(wǎng)址：/tech/imagerecognition/ingredient圖片分類（ImageClassification），顧名思義，就是通過算法對其中的對象進(jìn)行分類，圖像分類一直是計(jì)算機(jī)視覺中非?；A(chǔ)且重要的一個(gè)任務(wù)，也是幾乎所有的深度學(xué)習(xí)網(wǎng)絡(luò)模型進(jìn)行評價(jià)測試的方向。計(jì)算機(jī)視覺技術(shù)的主要任務(wù)目標(biāo)檢測（ObjectDetection）主要從圖像中分離出感興趣的目標(biāo)，不僅要用算法判斷圖片目標(biāo)對象的類別，還要對圖像目標(biāo)對象進(jìn)行定位，即在圖像中確定其位置，并用矩形框把檢測目標(biāo)對象標(biāo)識出來。目標(biāo)檢測體驗(yàn)網(wǎng)址：/tech/vehicle/detect計(jì)算機(jī)視覺技術(shù)的主要任務(wù)

圖像分割用于預(yù)測圖像中每個(gè)像素點(diǎn)所屬的類別或者實(shí)體，是計(jì)算機(jī)視覺中非常重要的任務(wù)。按照分割任務(wù)不同，主要分為兩類：（1）語義分割（SemanticSegmentation）：是對圖像中的每個(gè)像素都劃分出對應(yīng)的類別，即實(shí)現(xiàn)像素級別的分類，對比目標(biāo)檢測，圖像分割支持用多邊形標(biāo)注訓(xùn)練數(shù)據(jù)，模型可像素級識別目標(biāo)，它的目標(biāo)是為圖像中的每個(gè)像素分類；（2）實(shí)例分割（InstanceSegmentation）：不但要進(jìn)行像素級別的分類，還需在具體的類別基礎(chǔ)上區(qū)分不同的實(shí)例，一般用不同的顏色標(biāo)識。目錄5.2智能語音技術(shù)智能語音系統(tǒng)構(gòu)成智能語音的識別過程

智能語音把語音作為研究對象，是語音信號處理的一個(gè)重要研究方向，涉及心理學(xué)、語言學(xué)、計(jì)算機(jī)科學(xué)以及信號處理等諸多領(lǐng)域，甚至還涉及到人的體態(tài)語言，最終目標(biāo)是實(shí)現(xiàn)人與機(jī)器進(jìn)行自然語言對話。智能語音技術(shù)，也被稱為自動(dòng)語音識別自動(dòng)語音識別（AutomaticSpeechRecognition，ASR），就是讓機(jī)器通過識別和理解，把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的技術(shù)。智能語音系統(tǒng)構(gòu)成智能語音識別系統(tǒng)構(gòu)成

為了實(shí)現(xiàn)機(jī)器與人類的正常對話、交流，智能語音系統(tǒng)需要完成“識別”、“聽清”、“理解”、“行動(dòng)”以及“播報(bào)”這一連貫的任務(wù)。因此，智能語音系統(tǒng)至少包含了5個(gè)基本的子模塊：語音喚醒、語音增強(qiáng)、聲紋識別、語種識別和語音合成等。智能語音系統(tǒng)構(gòu)成語音喚醒

語音喚醒的目標(biāo)就是讓機(jī)器“能聽”。“嘿，siri”、“小愛同學(xué)”，在使用智能語音助手時(shí)，常常會(huì)叫到人們呼喚這些名字，讓它們來幫助完成一些指令。而這個(gè)叫名字的過程，就是指的語音喚醒。智能語音系統(tǒng)構(gòu)成語音增強(qiáng)

語音增強(qiáng)的目標(biāo)是讓機(jī)器“聽得清”，是指當(dāng)語音信號被各種各樣的噪聲干擾、甚至淹沒后，從噪聲背景中提取有用的語音信號，抑制、降低噪聲干擾的技術(shù)?？偨Y(jié)起來，語音增強(qiáng)就是指從含噪聲的語音中提取盡可能純凈的原始語音。智能語音系統(tǒng)構(gòu)成聲紋識別

聲紋識別的目標(biāo)是讓機(jī)器“聽出說話的對象”，它是生物識別技術(shù)的一種，也稱為說話人識別。聲紋識別能夠提取每個(gè)人獨(dú)一無二的語音特征，實(shí)現(xiàn)“聽音辨人”，在涉及說話人身份識別的場景中具有重要應(yīng)用價(jià)值。智能語音系統(tǒng)構(gòu)成語種識別

語種識別的目標(biāo)是讓機(jī)器“聽出是哪種語言”，即讓機(jī)器判斷某段音頻是英語、中語還是法語，又稱判斷音頻的語種。致力于智能語音研究的科大訊飛，推出了方言識別功能，目前訊飛輸入法支持23種方言，其中粵語、閩南語、湖南話、四川話、東北話、河南話等方言的識別率均已超過90%。智能語音系統(tǒng)構(gòu)成語音合成

語音合成又稱文本轉(zhuǎn)語音技術(shù)（TexttoSpeech，TTS），目標(biāo)是讓機(jī)器“能說”，指通過機(jī)械的、電子的方法產(chǎn)生人造語音，將任意文字信息轉(zhuǎn)化為標(biāo)準(zhǔn)流暢的語音朗讀出來。通俗的講，語音合成技術(shù)就是賦予計(jì)算機(jī)“像人一樣開口說話”的能力。智能語音的應(yīng)用智能語音硬件產(chǎn)品

隨著人工智能技術(shù)的不斷發(fā)展，人工智能的各種應(yīng)用及產(chǎn)品在社會(huì)地各個(gè)方面都有滲透，人們已經(jīng)接觸過越來越多的人臉識別產(chǎn)品、智能語音產(chǎn)品等。這些智能語音產(chǎn)品分為硬件產(chǎn)品和軟件產(chǎn)品兩類。智能語音軟件產(chǎn)品目錄5.3自然語言處理技術(shù)自然語言處理任務(wù)層級

自然語言處理（NaturalLanguageProcessing，NLP），是研究人與計(jì)算機(jī)交互語言問題的一門學(xué)科，是計(jì)算機(jī)科學(xué)和人工智能結(jié)合的一個(gè)子領(lǐng)域。自然語言處理的主要任務(wù)是將機(jī)器學(xué)習(xí)算法應(yīng)用于處理文本，將自然語言（主要是以文本形式呈現(xiàn)的語言）作為計(jì)算機(jī)程序的輸入和（或）輸出，它的關(guān)鍵任務(wù)是使計(jì)算機(jī)“理解”人類語言，代替人類執(zhí)行語言翻譯和問題回答等任務(wù)。

自然語言處理技術(shù)按任務(wù)層級分為底層資源建設(shè)、基礎(chǔ)任務(wù)、中層應(yīng)用任務(wù)和上層應(yīng)用系統(tǒng)。自然語言處理技術(shù)體系

實(shí)現(xiàn)人類與計(jì)算機(jī)之間自然語言的通信，意味著要使計(jì)算機(jī)既能理解自然語言文本的意義，也能以自然語言文本來表達(dá)給定的意圖、思想等。前者稱為自然語言理解（NLU,NaturalLanguageUnderstanding），后者稱為自然語言生成（NLG,NaturalLanguagegeneration）。因此，自然語言處理技術(shù)體系大體包括了自然語言理解和自然語言生成兩大方向。自然語言處理技術(shù)體系語音合成

自然語言理解（NLU），顧名思義，就是讓機(jī)器“理解”人類語言，是所有支持機(jī)器理解文本內(nèi)容的方法模型或任務(wù)的總稱。自然語言理解在文本信息處理系統(tǒng)中扮演著非常重要的角色，是推薦、問答、搜索等系統(tǒng)的必備模塊。

自然語言生成（NLG），就像寫文章創(chuàng)作一樣，涉及構(gòu)詞、構(gòu)句、構(gòu)造上下文、構(gòu)造意境等，整體上相比自然語言理解難度更大，成熟度更低。目前比較多自然語言生成的應(yīng)用主要關(guān)注于垂直領(lǐng)域，比如文本摘要，古詩詞生成，機(jī)器翻譯，新聞通稿生成等，文本格式相對單一。自然語言處理應(yīng)用文本分類的應(yīng)用和文本情感分析應(yīng)用

自然語言處理相當(dāng)于機(jī)器語言和人類語言之間的翻譯，通過搭建溝通的橋梁，以實(shí)現(xiàn)人與機(jī)器交流的目的。自然語言處理的研究內(nèi)容包括機(jī)器翻譯、信息檢索、實(shí)體抽取、文本分類、智能問答、情感分析、自動(dòng)摘要、輿情分析等。有道自動(dòng)語種識別及翻譯目錄5.4知識圖譜技術(shù)知識圖譜技術(shù)概述知識圖譜概念演化

2012年Google公司提出“知識圖譜（KnowledgeGraph,，KG）”，最初特指Google公司為了支撐其語義搜索而建立的知識庫。隨著知識圖譜技術(shù)應(yīng)用的深化，知識圖譜已經(jīng)成為大數(shù)據(jù)時(shí)代最重要的知識表示形式，以開發(fā)專家系統(tǒng)（ExpertSystem，又稱為Knowledge-basedSystem）為主要內(nèi)容，以讓機(jī)器使用專家知識以及推理能力解決實(shí)際問題為主要目標(biāo)的人工智能子領(lǐng)域，主要模擬人類“推理”功能。知識圖譜的認(rèn)知微博轉(zhuǎn)發(fā)關(guān)系知識圖譜示例體驗(yàn)網(wǎng)址：/#/Graph/graph_weibo

知識圖譜(KnowledgeGraph)，在圖書情報(bào)界稱為知識域可視化或知識領(lǐng)域映射地圖，是顯示知識發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的一系列各種不同的圖形，用可視化技術(shù)描述知識資源及其載體，挖掘、分析、構(gòu)建、繪制和顯示知識及它們之間的相互聯(lián)系?，F(xiàn)實(shí)世界中，知識都是交叉在一起的，組成了一個(gè)復(fù)雜的關(guān)系網(wǎng)絡(luò)，知識圖譜就是為了表示知識之間結(jié)構(gòu)關(guān)系的一種可視化圖形表示。

知識圖譜由節(jié)點(diǎn)（Point）和邊（Edge）組成，每個(gè)節(jié)點(diǎn)表示現(xiàn)實(shí)世界的“實(shí)體（Entity）”，每條邊為實(shí)體與實(shí)體之間的“關(guān)系（Relationship）”。實(shí)體越多，所產(chǎn)生的關(guān)系就越復(fù)雜，知識圖譜規(guī)模也會(huì)越龐大。知識圖譜的認(rèn)知

2017年，我國學(xué)科目錄做了調(diào)整，首次出現(xiàn)了知識圖譜學(xué)科方向，教育部對于知識圖譜這一學(xué)科的定位是“大規(guī)模知識工程”。需要指出的是，知識圖譜技術(shù)的發(fā)展是一個(gè)循序漸進(jìn)的過程，其學(xué)科內(nèi)涵也在不斷發(fā)生變化。知識圖譜的認(rèn)知

近年來，隨著互聯(lián)網(wǎng)應(yīng)用需求日益增加，越來越多的知識圖譜應(yīng)運(yùn)而生。知識圖譜按照應(yīng)用的深度主要可以分為兩大類:

一是通用知識圖譜General-purposeKnowledgeGraph，GKG），通俗講就是大眾版，沒有特別深的行業(yè)知識及專業(yè)內(nèi)容，一般是解決科普類、常識類等問題。

二是行業(yè)知識圖譜（Domain-specificKnowledgeGraph,DKG），通俗講就是專業(yè)版，根據(jù)對某個(gè)行業(yè)或細(xì)分領(lǐng)域的深入研究而定制的版本，主要是解決當(dāng)前行業(yè)或細(xì)分領(lǐng)域的專業(yè)問題。知識圖譜構(gòu)建流程

知識圖譜的構(gòu)建流程主要包括：知識建模、知識獲取、知識融合、知識存儲(chǔ)、知識計(jì)算以及知識應(yīng)用。

知識建模，也叫做業(yè)務(wù)建模，是構(gòu)建多層級的知識體系，將知識、屬性、關(guān)聯(lián)關(guān)系等信息轉(zhuǎn)化為數(shù)據(jù)庫。

知識獲取是實(shí)現(xiàn)自動(dòng)化構(gòu)建大規(guī)模知識圖譜的重要技術(shù)，其目的在于從不同來源、不同結(jié)構(gòu)的數(shù)據(jù)中進(jìn)行知識提取并存入知識圖譜中。

知識融合又分為模式層的融合以及數(shù)據(jù)層的融合。

知識存儲(chǔ)主要是根據(jù)業(yè)務(wù)特點(diǎn)以及數(shù)據(jù)規(guī)模選擇合適的存儲(chǔ)方式將融合后的數(shù)據(jù)進(jìn)行保存。

知識計(jì)算主要是指在結(jié)構(gòu)化的知識存儲(chǔ)庫中發(fā)現(xiàn)隱含關(guān)系以及知識，從給定的知識圖譜推導(dǎo)出新的實(shí)體跟實(shí)體之間的關(guān)系。

知識應(yīng)用主要是指如何將上面環(huán)節(jié)中構(gòu)建的“知識”以最合適的方式呈現(xiàn)給用戶。本章總結(jié)知識速覽AI賦能，讓一切皆有可能，用人工智能建設(shè)美好世界！第6章人工智能產(chǎn)品形態(tài)目錄6.1人臉識別類產(chǎn)品6.2智能機(jī)器人產(chǎn)品6.3智能推薦類產(chǎn)品6.4智能語音類產(chǎn)品學(xué)習(xí)目標(biāo)本章主要從人工智能應(yīng)用產(chǎn)品的基本形態(tài)視角，圍繞人工智能應(yīng)用系統(tǒng)中人臉識別類產(chǎn)品、智能機(jī)器人產(chǎn)品、智能推薦類產(chǎn)品、智能語音類產(chǎn)品等典型的產(chǎn)品進(jìn)行分析和討論，希望帶領(lǐng)讀者正確認(rèn)識人工智能產(chǎn)品的基本功能和用途，初步探索智能產(chǎn)品背后的結(jié)構(gòu)邏輯。理解人臉識別系統(tǒng)的構(gòu)成和技術(shù)實(shí)現(xiàn)方法理解智能機(jī)器人的構(gòu)成和技術(shù)實(shí)現(xiàn)方法理解智能推薦系統(tǒng)的基本思想和應(yīng)用方法理解智能語音助手的關(guān)鍵技術(shù)和應(yīng)用領(lǐng)域目錄6.1人臉識別類產(chǎn)品人臉識別類產(chǎn)品傳統(tǒng)身份識別與生物識別

人們希望一種更安全、可靠的技術(shù)來進(jìn)行身份識別，生物識別技術(shù)正好能滿足這一要求。由于它的內(nèi)在屬性，具有很強(qiáng)的穩(wěn)定性和個(gè)體差異性，是理想的身份識別的手段。生物識別技術(shù)是人類所固有的且每個(gè)人所特有的一些物理特征（比如人臉、指紋、虹膜、聲紋等），通過模式識別技術(shù)手段來進(jìn)行身份鑒定的一種方法，包括人臉識別、指紋識別、虹膜識別、聲紋識別等。

傳統(tǒng)的身份識別多為鑰匙、身份證、各類證件、各種卡等識別方式，這些用于標(biāo)識身份的東西容易遺失、冒名頂替。所以，傳統(tǒng)的身份識別已遠(yuǎn)遠(yuǎn)不能滿足人類生活的需求。

人臉識別類產(chǎn)品人臉識別測溫閘機(jī)

人臉識別：是一項(xiàng)基于人的臉部特征信息來進(jìn)行身份識別的技術(shù)，其通過計(jì)算機(jī)分析采集到的人臉圖像信息，采用一定的特征提取算法提取出有效的人臉特征信息，最后利用提取到的人臉特征信息進(jìn)行身份識別。人臉識別發(fā)展現(xiàn)狀人臉識別類產(chǎn)品人臉識別技術(shù)相對于其他生物識別技術(shù)（如指紋識別、虹膜識別、聲紋識別等）具有以下優(yōu)點(diǎn)：①非接觸性：人臉識別可以不接觸人體，直接通過攝像頭在一定距離內(nèi)識別人的面部特征，達(dá)到辨別的目的。從而可以實(shí)現(xiàn)更大范圍，更多方位的信息采集。②非侵?jǐn)_性：一方面對人臉的采集無需被采集者配合也無需工作人員干預(yù)；另一方面人臉屬于暴露在外的生物特征，對人臉的識別采集更容易被大眾接受。③硬件基礎(chǔ)完善：人臉識別對硬件的需求主要體現(xiàn)在攝像頭上，當(dāng)前普及的智能手機(jī)均帶有高像素的攝像頭，同時(shí)伴隨國內(nèi)視頻監(jiān)控體系建立的逐漸完善，因此相比需要特定采集芯片的指紋識別等識別方式，人臉識別的硬件基礎(chǔ)優(yōu)勢明顯。④采集快捷簡便，可擴(kuò)展性好：對基礎(chǔ)設(shè)施的低要求及非接觸的采集方式很明顯縮短了信息采集時(shí)間，提供了方便的采集方式。人臉識別發(fā)展現(xiàn)狀人臉識別類產(chǎn)品人臉識別發(fā)展現(xiàn)狀

人臉識別最初在20世紀(jì)60年代已經(jīng)有研究人員開始研究，真正進(jìn)入初級的應(yīng)用階段是在90年代后期，發(fā)展至今其技術(shù)成熟度已經(jīng)達(dá)到較高的程度。整個(gè)發(fā)展過程可以分為機(jī)械識別、半自動(dòng)化識別、非接觸式識別及互聯(lián)網(wǎng)應(yīng)用階段。人臉識別關(guān)鍵技術(shù)人群畫像

人臉識別技術(shù)還處于不斷發(fā)展之中，但其商業(yè)化性質(zhì)特別明顯。比如某精準(zhǔn)營銷項(xiàng)目中需要通過線下門店的攝像頭采集人臉數(shù)據(jù)，同時(shí)構(gòu)建該門店的人臉數(shù)據(jù)庫以及該門店的人群畫像。在某人進(jìn)入該店后進(jìn)行人臉采集的同時(shí)進(jìn)行人臉識別，在識別出該人后彈出該人的相關(guān)信息，從而達(dá)到精準(zhǔn)營銷的目的。人臉識別關(guān)鍵技術(shù)人臉識別關(guān)鍵技術(shù)

人臉識別從應(yīng)用過程來看，可將人臉識別技術(shù)劃分為人臉采集錄入、人臉關(guān)鍵點(diǎn)檢測、人臉配準(zhǔn)對齊、人臉特征提取、人臉特征比對。

人臉識別技術(shù)的應(yīng)用主要受到光照、拍攝角度、圖像遮擋、年齡等多個(gè)因素的影響，在約束條件下人臉識別技術(shù)相對成熟，在自由條件下人臉識別技術(shù)還在不斷改進(jìn)。人臉識別關(guān)鍵技術(shù)（1）人臉采集錄入（2）人臉關(guān)鍵點(diǎn)檢測（3）人臉配準(zhǔn)對齊（4）人臉特征提取人臉識別關(guān)鍵技術(shù)（5）人臉特征比對人臉識別應(yīng)用領(lǐng)域目錄6.2智能機(jī)器人產(chǎn)品智能機(jī)器人產(chǎn)品

智能機(jī)器人是一種自動(dòng)化的機(jī)器，所不同的是這種機(jī)器具備一些與人或生物相似的智能能力，如感知能力、規(guī)劃能力、動(dòng)作能力和協(xié)同能力，是一種具有高度靈活性的自動(dòng)化機(jī)器。

廣義上的機(jī)器人指自動(dòng)完成某種任務(wù)或功能的人造物，手表、電話、汽車、飛機(jī)。

狹義上的機(jī)器人是整合材料、機(jī)械、電子、控制、計(jì)算機(jī)與人工智能等技術(shù)的自動(dòng)機(jī)器。

所以，智能機(jī)器人也可以概括為：智能機(jī)器人=機(jī)械+人工智能機(jī)器人按照應(yīng)用可以劃分為三大領(lǐng)域：工業(yè)機(jī)器人、服務(wù)機(jī)器人（個(gè)人/家用、公共）和特種機(jī)器人。智能機(jī)器人產(chǎn)品工業(yè)機(jī)器人智能機(jī)器人產(chǎn)品服務(wù)機(jī)器人智能機(jī)器人產(chǎn)品特種機(jī)器人智能機(jī)器人產(chǎn)品智能機(jī)器人是人工智能技術(shù)的綜合試驗(yàn)場，可以全面檢驗(yàn)考察人工智能各個(gè)研究領(lǐng)域的技術(shù)發(fā)展?fàn)顩r。智能機(jī)器人的內(nèi)涵和外延也會(huì)隨著技術(shù)的更新而發(fā)生變化。智能機(jī)器人主要技術(shù)智能感知系統(tǒng)感知系統(tǒng)構(gòu)成

智能機(jī)器人的感知系統(tǒng)相當(dāng)于人的五官和神經(jīng)系統(tǒng)，是機(jī)器人獲取內(nèi)部狀態(tài)或外部環(huán)境信息，用于內(nèi)部反饋控制的工具。感知系統(tǒng)本質(zhì)是傳感器系統(tǒng)，將機(jī)器人各種內(nèi)部狀態(tài)信息和外部環(huán)境信息，轉(zhuǎn)變?yōu)闄C(jī)器人自身或者機(jī)器人之間能夠理解和應(yīng)用的數(shù)據(jù)、信號甚至知識。智能機(jī)器人產(chǎn)品智能決策系統(tǒng)無人駕駛決策系統(tǒng)

智能決策相當(dāng)于人的大腦，通過對感知信息的分析和推理，規(guī)劃和確定機(jī)器人的任務(wù)，而且應(yīng)該具有學(xué)習(xí)能力，能夠?qū)崿F(xiàn)姿態(tài)控制、路徑規(guī)劃、躲避障礙、力度控制、各種優(yōu)化與控制算法。智能機(jī)器人產(chǎn)品智能執(zhí)行系統(tǒng)智能執(zhí)行系統(tǒng)

智能執(zhí)行系統(tǒng)及機(jī)器人本體，其臂部一般采用空間開鏈連桿機(jī)構(gòu)，其中的運(yùn)動(dòng)副（轉(zhuǎn)動(dòng)副或移動(dòng)副）常稱為關(guān)節(jié)，關(guān)節(jié)個(gè)數(shù)通常即為機(jī)器人的自由度數(shù)。

出于擬人化的考慮，常將機(jī)器人本體的有關(guān)部位分別稱為基座、腰部、臂部、腕部、手部（夾持器或末端執(zhí)行器）和行走部（對于移動(dòng)機(jī)器人）等。智能執(zhí)行系統(tǒng)一般分為兩部分：自身移動(dòng)或者變形；外部操作相應(yīng)的對象。智能機(jī)器人產(chǎn)品智能交互系統(tǒng)

智能交互系統(tǒng)主要實(shí)現(xiàn)人與機(jī)器人之間相互溝通、相互理解，可以分為：（1）直接交互：鍵盤、鼠標(biāo)、手機(jī)、有線遙控器、無線遙控器等。（2）自然交互：聲音、姿勢、肌電、意識等。（3）AR、VR、全息等。智能機(jī)器人產(chǎn)品

總體來說，“智能化”、“擬人化”將成為機(jī)器人產(chǎn)業(yè)未來的發(fā)展方向。智能機(jī)器人具有感知、思維的能力。智能機(jī)器人可獲取、處理并識別多種信息，自主地完成較為復(fù)雜的操作任務(wù)。相比一般的工業(yè)機(jī)器人，智能機(jī)器人具有更大的靈活性、機(jī)動(dòng)性和更廣泛的應(yīng)用領(lǐng)域。目錄6.3智能推薦類產(chǎn)品智能推薦類產(chǎn)品啤酒與紙尿褲的啟示

上世紀(jì)90年代，美國的沃爾瑪超市收銀員發(fā)現(xiàn)了一個(gè)奇怪的現(xiàn)象，結(jié)賬時(shí)乘客的購物車?yán)?，啤酒和紙尿褲總是擺在一起。收銀員把情況報(bào)告給了超市管理員，管理員也感到大惑不解，于是找到了學(xué)者艾格拉沃。

艾格拉沃經(jīng)過調(diào)查發(fā)現(xiàn)，原因出自“奶爸”這一群體。首先，從時(shí)間上，周末比工作日購買紙尿褲喝啤酒的頻率更多；其次，從年齡上看，這一群體的孩子不超過兩歲；再次，他們喜歡看體育節(jié)目，而且邊喝啤酒邊看；最后，美國的體育節(jié)目多在周末扎堆。所以，當(dāng)周末年輕的母親需要給孩子換紙尿褲時(shí)，通常會(huì)讓正在看球的奶爸去買。奶爸出去買紙尿褲，會(huì)順便帶一件啤酒回來。發(fā)現(xiàn)這個(gè)秘密后，沃爾瑪大膽地把紙尿褲擺放在啤酒旁邊，方便奶爸們購買。結(jié)果，二者的銷量雙雙上升。智能推薦類產(chǎn)品

推薦系統(tǒng)就是通過分析用戶的個(gè)人信息以及用戶的歷史行為數(shù)據(jù)，從而給用戶推薦其可能感興趣的物品。智能推薦基本思想

推薦系統(tǒng)可以看成是搜索的排序系統(tǒng)，或者是一個(gè)信息過濾系統(tǒng)。用戶通過信息輸入，推薦系統(tǒng)自動(dòng)返回一個(gè)結(jié)果序列。推薦系統(tǒng)具有以下兩個(gè)最顯著的特性：（1）主動(dòng)化。而推薦系統(tǒng)不需要用戶提供明確的需求，而是通過分析用戶和物品的數(shù)據(jù)，對用戶和物品進(jìn)行建模，從而主動(dòng)為用戶推薦他們感興趣的信息。（2）個(gè)性化。推薦系統(tǒng)能夠更好地發(fā)掘長尾信息，即將冷門物品推薦給對其感興趣的用戶。在電商平臺(tái)火熱的時(shí)代，由冷門物品帶來的營業(yè)額甚至超過熱門物品，發(fā)掘長尾信息是推薦系統(tǒng)的重要研究方向。智能推薦類產(chǎn)品

推薦系統(tǒng)的基本思想可概括為“物以類聚”、“人以群分”、“知你所想”。

“物以類聚”式的推薦思想，認(rèn)為用戶可能會(huì)喜歡與他之前曾經(jīng)喜歡的物品相似的物品。利用用戶曾經(jīng)喜歡過的物品信息（內(nèi)容信息、標(biāo)簽、關(guān)鍵字），給用戶推薦與他以前喜歡過的物品相似的其他物品。

“人以群分”式的推薦思想，利用用戶及其與之興趣愛好相似的其他用戶信息，給用戶推薦這些相似用戶喜歡的物品。

“知你所想”：利用用戶和物品的特征信息（用戶的基本信息及行為數(shù)據(jù)，例如點(diǎn)擊、瀏覽、收藏、購買、評論等），給用戶推薦那些具有用戶喜歡特征的物品。智能推薦基本思想智能推薦類產(chǎn)品智能推薦基本思想智能推薦類產(chǎn)品智能推薦系統(tǒng)流程

大數(shù)據(jù)時(shí)代，網(wǎng)絡(luò)上充斥著琳瑯滿目并且種類繁雜的商品、電影、歌曲、視頻等各種服務(wù)，這就是人們常說的信息過載。推薦系統(tǒng)被證明是一種解決“信息過載”和“長尾物品”問題的有效工具，基于知識發(fā)現(xiàn)的相關(guān)技術(shù)來解決人們選擇商品、信息或者服務(wù)問題。推薦系統(tǒng)具體的工作流程包括：數(shù)據(jù)預(yù)處理、用戶行為建模、物品特征建模、生成推薦結(jié)果。智能推薦類產(chǎn)品智能推薦系統(tǒng)實(shí)例

海倫女士一直使用在線約會(huì)網(wǎng)站尋找適合自己的約會(huì)對象。盡管約會(huì)網(wǎng)站會(huì)向她推薦不同的人選，但她并不是喜歡每一個(gè)推薦對象。經(jīng)過一番總結(jié)，她發(fā)現(xiàn)自己交往過的對象可以進(jìn)行如下分類：不喜歡型、有些喜歡型、非常喜歡型。

為了給她成功推薦約會(huì)對象，相親網(wǎng)站需要了解海倫女士對約會(huì)對象的偏好特征，約會(huì)網(wǎng)站收集了三個(gè)影響相親結(jié)果的特征：每年獲得的飛行?？屠锍虜?shù)、玩視頻游戲所消耗時(shí)間百分比、每周消費(fèi)的冰淇淋公升數(shù)。接下來，根據(jù)海倫曾經(jīng)的約會(huì)數(shù)據(jù)以及對約會(huì)對象的評價(jià)結(jié)果，相親網(wǎng)站對以上數(shù)據(jù)進(jìn)行分析。智能推薦類產(chǎn)品智能推薦系統(tǒng)實(shí)例每年獲得的飛行常客里程數(shù)與玩視頻游戲所消耗時(shí)間占比的關(guān)系圖每年獲得的飛行?？屠锍虜?shù)與每周消費(fèi)的冰淇淋公升數(shù)的關(guān)系圖玩視頻游戲所消耗時(shí)間占比與每周消費(fèi)的冰淇淋公升數(shù)的關(guān)系圖智能推薦類產(chǎn)品智能推薦系統(tǒng)應(yīng)用領(lǐng)域

推薦系統(tǒng)本質(zhì)上可以說是一個(gè)搜索排名系統(tǒng)，或者是一個(gè)信息過濾系統(tǒng)，旨在從紛繁復(fù)雜的數(shù)據(jù)中，找到于用戶個(gè)人有利的信息。總體來說，一個(gè)完整的推薦系統(tǒng)一般存在三個(gè)參與方：用戶、內(nèi)容提供者和提供推薦系統(tǒng)的網(wǎng)站。

首先，推薦系統(tǒng)要滿足用戶的需求，給用戶推薦那些讓他們感興趣的內(nèi)容；其次，推薦系統(tǒng)要讓內(nèi)容提供者的內(nèi)容能被推薦給對其感興趣的用戶；最后，好的推薦系統(tǒng)設(shè)計(jì)，能夠讓推薦系統(tǒng)本身收獲到高質(zhì)量的用戶反饋，不斷提高推薦的質(zhì)量，提高推薦系統(tǒng)的效益。推薦系統(tǒng)是以提升用戶體驗(yàn)感和提高商業(yè)利潤為目的技術(shù)，它的應(yīng)用領(lǐng)域主要有：電子商務(wù)、電影和視頻網(wǎng)站、個(gè)性化音樂網(wǎng)絡(luò)電臺(tái)、社交網(wǎng)絡(luò)。目錄6.4智能語音類產(chǎn)品智能語音類產(chǎn)品

智能語音技術(shù)作為人工智能的關(guān)鍵技術(shù)之一，其目標(biāo)是是實(shí)現(xiàn)人機(jī)語言的通信，具體包括語音識別技術(shù)（ASR）和語音合成技術(shù)（TTS）。智能語音技術(shù)的研究是以語音識別技術(shù)為開端，可以追溯到20世紀(jì)50年代。隨著信息技術(shù)的發(fā)展，智能語音技術(shù)已經(jīng)成為人們信息獲取和溝通最便捷、最有效的手段。智能語音助手作為智能語音技術(shù)的應(yīng)用落地產(chǎn)品，近年來備受用戶關(guān)注和喜愛。智能語音助手根據(jù)其依托的載體不同可分為手機(jī)智能語音助手、智能音箱等。知名的智能音箱有天貓精靈、小米AI音箱等，常見的手機(jī)智能語音助手有蘋果的Siri、華為的小藝和百度的小度等。智能語音助手通過提供智能化的語音識別技術(shù)來實(shí)現(xiàn)智能化操作，例如，熟知的語音助手像小米AI音箱不僅可以播放音樂、講故事、設(shè)置鬧鐘，還可以控制智能家居，為用戶提供更加全面的服務(wù)。智能語音助手發(fā)展歷程智能語音類產(chǎn)品智能語音技術(shù)的研究可追溯到20世紀(jì)50年代，發(fā)展過程從未間斷，其代表性發(fā)展歷程可分為四個(gè)階段：萌芽期、突破期、產(chǎn)業(yè)化期以及快速應(yīng)用期。萌芽期：1952年，貝爾實(shí)驗(yàn)室（BellLabs）制造一臺(tái)6英尺高自動(dòng)數(shù)字識別機(jī)“Audrey”，它可以識別數(shù)字0～9的發(fā)音，且準(zhǔn)確度高達(dá)90％以上。突破期：1988年，卡耐基梅隆大學(xué)結(jié)合

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

人工智能技術(shù)導(dǎo)論-課件 第5、6章 人工智能關(guān)鍵技術(shù)、人工智能產(chǎn)品形態(tài)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔

人工智能技術(shù)導(dǎo)論-課件第5、6章人工智能關(guān)鍵技術(shù)、人工智能產(chǎn)品形態(tài)