人工智能技術(shù)導(dǎo)論-課件 第5、6章 人工智能關(guān)鍵技術(shù)、人工智能產(chǎn)品形態(tài)_第1頁
人工智能技術(shù)導(dǎo)論-課件 第5、6章 人工智能關(guān)鍵技術(shù)、人工智能產(chǎn)品形態(tài)_第2頁
人工智能技術(shù)導(dǎo)論-課件 第5、6章 人工智能關(guān)鍵技術(shù)、人工智能產(chǎn)品形態(tài)_第3頁
人工智能技術(shù)導(dǎo)論-課件 第5、6章 人工智能關(guān)鍵技術(shù)、人工智能產(chǎn)品形態(tài)_第4頁
人工智能技術(shù)導(dǎo)論-課件 第5、6章 人工智能關(guān)鍵技術(shù)、人工智能產(chǎn)品形態(tài)_第5頁
已閱讀5頁,還剩76頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第5章人工智能關(guān)鍵技術(shù)目錄5.1計(jì)算機(jī)視覺技術(shù)5.2智能語音技術(shù)5.3自然語言處理技術(shù)5.4知識圖譜技術(shù)學(xué)習(xí)目標(biāo)本章主要從人工智能系統(tǒng)的技術(shù)視角,圍繞人工智能中的計(jì)算機(jī)視覺技術(shù)、智能語音技術(shù)、自然語言處理技術(shù)、知識圖譜等核心技術(shù)進(jìn)行討論,希望帶領(lǐng)讀者正確理解人工智能關(guān)鍵技術(shù)的概念,初步認(rèn)識人工智能系統(tǒng)的“看、聽、說、做”實(shí)現(xiàn)方法。理解計(jì)算機(jī)視覺關(guān)鍵技術(shù)理解智能語音關(guān)鍵技術(shù)理解自然語言處理關(guān)鍵技術(shù)理解知識圖譜關(guān)鍵技術(shù)目錄5.1計(jì)算機(jī)視覺技術(shù)概述

人工智能的本質(zhì)工作是研究、開發(fā)用于模擬和延展人類的智能的應(yīng)用系統(tǒng),具體來說就是通過人工智能技術(shù)來模仿人類的“視物”、“聽聲”、“說話”、“理解”及“推理”等人類智能能力。人類智能與人工智能概述計(jì)算機(jī)視覺(CompuerVision,CV)是研究使用計(jì)算機(jī)實(shí)現(xiàn)或模擬人類“視物”功能的技術(shù),使用計(jì)算機(jī)模仿人類視覺系統(tǒng)的科學(xué),讓計(jì)算機(jī)擁有類似人類提取、處理、理解和分析圖像以及圖像序列的能力。確切地說,計(jì)算機(jī)視覺技術(shù)就是利用了攝像機(jī)以及電腦替代人類眼睛,使得計(jì)算機(jī)擁有人類眼睛所具有的分類、識別、分割、跟蹤、判別決策等功能。概述

通過圖像獲取技術(shù)提取二維圖像、三維圖組、圖像序列等原始數(shù)據(jù)。

下面所示展示了人類看到的“冰墩墩”圖像和機(jī)器獲取到的“冰墩墩”數(shù)據(jù)(右圖為了清晰呈現(xiàn),只截取了部分?jǐn)?shù)據(jù))。人類看到的“冰墩墩”圖像機(jī)器“看到”的“冰墩墩”圖像概述

計(jì)算機(jī)視覺系統(tǒng)就是創(chuàng)建了能夠在二維平面圖像或者三維立體圖像的數(shù)據(jù)中,以獲取所需要的“信息”的一個(gè)完整的人工智能系統(tǒng),例如自動(dòng)駕駛、智能機(jī)器人等領(lǐng)域均需要通過計(jì)算機(jī)視覺技術(shù)從視覺信號中提取并處理信息。自動(dòng)駕駛系統(tǒng)智能機(jī)器人圖像處理基礎(chǔ)

圖像是人類視覺的基礎(chǔ),是自然景物的客觀反映,是人類認(rèn)識世界和人類自身的重要源泉。計(jì)算機(jī)視覺是讓機(jī)器具有智慧的“眼睛”,圖像處理是其重要的研究內(nèi)容。對于圖像,有一個(gè)重要的概念-圖像分辨率。圖像分辨率又分為空間分辨率和灰度分辨率。圖像處理基礎(chǔ)分辨率高

空間分辨率是每英寸圖像內(nèi)有多少個(gè)像素點(diǎn)被采樣,分辨率的單位為PPI(PixelsPerInch,像素每英寸)。采樣過程實(shí)質(zhì)上對一幅圖像等間距劃分成多個(gè)網(wǎng)格,每一個(gè)網(wǎng)格表示一個(gè)像素點(diǎn)。采樣間隔越大,所得圖像像素?cái)?shù)越少,空間分辨率越低,圖像質(zhì)量差,嚴(yán)重時(shí)出現(xiàn)馬賽克效應(yīng);采樣間隔越小,所得圖像像素?cái)?shù)越多,空間分辨率越高,圖像質(zhì)量好,但數(shù)據(jù)量大。

分辨率低圖像處理基礎(chǔ)

灰度分辨率是用于量化灰度的比特?cái)?shù),通常用2的整數(shù)次冪來表示,例如8bit,它表示的灰度范圍是0到255。量化實(shí)質(zhì)上是顏色值數(shù)字化的過程。根據(jù)圖像的灰度級數(shù),可將圖像分為黑白圖像(二值圖像,用0和1表達(dá))、灰度圖像和彩色圖像。彩色圖像黑白圖像灰度圖像計(jì)算機(jī)視覺技術(shù)的主要任務(wù)

計(jì)算機(jī)視覺是一種讓計(jì)算機(jī)學(xué)會(huì)“視物”并“識物”的技術(shù),跟人類觀察世界一樣,從粗粒度的“歸類”到精細(xì)粒度的“理解”,計(jì)算機(jī)視覺技術(shù)的主要任務(wù)有圖像分類(What)、目標(biāo)檢測(What&Where)、圖像分割(What&Where),其中圖像分割不但能檢測位置,還能夠精細(xì)地將位置輪廓勾勒出來。計(jì)算機(jī)視覺技術(shù)的主要任務(wù)圖像分類體驗(yàn)網(wǎng)址:/tech/imagerecognition/ingredient圖片分類(ImageClassification),顧名思義,就是通過算法對其中的對象進(jìn)行分類,圖像分類一直是計(jì)算機(jī)視覺中非?;A(chǔ)且重要的一個(gè)任務(wù),也是幾乎所有的深度學(xué)習(xí)網(wǎng)絡(luò)模型進(jìn)行評價(jià)測試的方向。計(jì)算機(jī)視覺技術(shù)的主要任務(wù)目標(biāo)檢測(ObjectDetection)主要從圖像中分離出感興趣的目標(biāo),不僅要用算法判斷圖片目標(biāo)對象的類別,還要對圖像目標(biāo)對象進(jìn)行定位,即在圖像中確定其位置,并用矩形框把檢測目標(biāo)對象標(biāo)識出來。目標(biāo)檢測體驗(yàn)網(wǎng)址:/tech/vehicle/detect計(jì)算機(jī)視覺技術(shù)的主要任務(wù)

圖像分割用于預(yù)測圖像中每個(gè)像素點(diǎn)所屬的類別或者實(shí)體,是計(jì)算機(jī)視覺中非常重要的任務(wù)。按照分割任務(wù)不同,主要分為兩類:(1)語義分割(SemanticSegmentation):是對圖像中的每個(gè)像素都劃分出對應(yīng)的類別,即實(shí)現(xiàn)像素級別的分類,對比目標(biāo)檢測,圖像分割支持用多邊形標(biāo)注訓(xùn)練數(shù)據(jù),模型可像素級識別目標(biāo),它的目標(biāo)是為圖像中的每個(gè)像素分類;(2)實(shí)例分割(InstanceSegmentation):不但要進(jìn)行像素級別的分類,還需在具體的類別基礎(chǔ)上區(qū)分不同的實(shí)例,一般用不同的顏色標(biāo)識。目錄5.2智能語音技術(shù)智能語音系統(tǒng)構(gòu)成智能語音的識別過程

智能語音把語音作為研究對象,是語音信號處理的一個(gè)重要研究方向,涉及心理學(xué)、語言學(xué)、計(jì)算機(jī)科學(xué)以及信號處理等諸多領(lǐng)域,甚至還涉及到人的體態(tài)語言,最終目標(biāo)是實(shí)現(xiàn)人與機(jī)器進(jìn)行自然語言對話。智能語音技術(shù),也被稱為自動(dòng)語音識別自動(dòng)語音識別(AutomaticSpeechRecognition,ASR),就是讓機(jī)器通過識別和理解,把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的技術(shù)。智能語音系統(tǒng)構(gòu)成智能語音識別系統(tǒng)構(gòu)成

為了實(shí)現(xiàn)機(jī)器與人類的正常對話、交流,智能語音系統(tǒng)需要完成“識別”、“聽清”、“理解”、“行動(dòng)”以及“播報(bào)”這一連貫的任務(wù)。因此,智能語音系統(tǒng)至少包含了5個(gè)基本的子模塊:語音喚醒、語音增強(qiáng)、聲紋識別、語種識別和語音合成等。智能語音系統(tǒng)構(gòu)成語音喚醒

語音喚醒的目標(biāo)就是讓機(jī)器“能聽”。“嘿,siri”、“小愛同學(xué)”,在使用智能語音助手時(shí),常常會(huì)叫到人們呼喚這些名字,讓它們來幫助完成一些指令。而這個(gè)叫名字的過程,就是指的語音喚醒。智能語音系統(tǒng)構(gòu)成語音增強(qiáng)

語音增強(qiáng)的目標(biāo)是讓機(jī)器“聽得清”,是指當(dāng)語音信號被各種各樣的噪聲干擾、甚至淹沒后,從噪聲背景中提取有用的語音信號,抑制、降低噪聲干擾的技術(shù)??偨Y(jié)起來,語音增強(qiáng)就是指從含噪聲的語音中提取盡可能純凈的原始語音。智能語音系統(tǒng)構(gòu)成聲紋識別

聲紋識別的目標(biāo)是讓機(jī)器“聽出說話的對象”,它是生物識別技術(shù)的一種,也稱為說話人識別。聲紋識別能夠提取每個(gè)人獨(dú)一無二的語音特征,實(shí)現(xiàn)“聽音辨人”,在涉及說話人身份識別的場景中具有重要應(yīng)用價(jià)值。智能語音系統(tǒng)構(gòu)成語種識別

語種識別的目標(biāo)是讓機(jī)器“聽出是哪種語言”,即讓機(jī)器判斷某段音頻是英語、中語還是法語,又稱判斷音頻的語種。致力于智能語音研究的科大訊飛,推出了方言識別功能,目前訊飛輸入法支持23種方言,其中粵語、閩南語、湖南話、四川話、東北話、河南話等方言的識別率均已超過90%。智能語音系統(tǒng)構(gòu)成語音合成

語音合成又稱文本轉(zhuǎn)語音技術(shù)(TexttoSpeech,TTS),目標(biāo)是讓機(jī)器“能說”,指通過機(jī)械的、電子的方法產(chǎn)生人造語音,將任意文字信息轉(zhuǎn)化為標(biāo)準(zhǔn)流暢的語音朗讀出來。通俗的講,語音合成技術(shù)就是賦予計(jì)算機(jī)“像人一樣開口說話”的能力。智能語音的應(yīng)用智能語音硬件產(chǎn)品

隨著人工智能技術(shù)的不斷發(fā)展,人工智能的各種應(yīng)用及產(chǎn)品在社會(huì)地各個(gè)方面都有滲透,人們已經(jīng)接觸過越來越多的人臉識別產(chǎn)品、智能語音產(chǎn)品等。這些智能語音產(chǎn)品分為硬件產(chǎn)品和軟件產(chǎn)品兩類。智能語音軟件產(chǎn)品目錄5.3自然語言處理技術(shù)自然語言處理任務(wù)層級

自然語言處理(NaturalLanguageProcessing,NLP),是研究人與計(jì)算機(jī)交互語言問題的一門學(xué)科,是計(jì)算機(jī)科學(xué)和人工智能結(jié)合的一個(gè)子領(lǐng)域。自然語言處理的主要任務(wù)是將機(jī)器學(xué)習(xí)算法應(yīng)用于處理文本,將自然語言(主要是以文本形式呈現(xiàn)的語言)作為計(jì)算機(jī)程序的輸入和(或)輸出,它的關(guān)鍵任務(wù)是使計(jì)算機(jī)“理解”人類語言,代替人類執(zhí)行語言翻譯和問題回答等任務(wù)。

自然語言處理技術(shù)按任務(wù)層級分為底層資源建設(shè)、基礎(chǔ)任務(wù)、中層應(yīng)用任務(wù)和上層應(yīng)用系統(tǒng)。自然語言處理技術(shù)體系

實(shí)現(xiàn)人類與計(jì)算機(jī)之間自然語言的通信,意味著要使計(jì)算機(jī)既能理解自然語言文本的意義,也能以自然語言文本來表達(dá)給定的意圖、思想等。前者稱為自然語言理解(NLU,NaturalLanguageUnderstanding),后者稱為自然語言生成(NLG,NaturalLanguagegeneration)。因此,自然語言處理技術(shù)體系大體包括了自然語言理解和自然語言生成兩大方向。自然語言處理技術(shù)體系語音合成

自然語言理解(NLU),顧名思義,就是讓機(jī)器“理解”人類語言,是所有支持機(jī)器理解文本內(nèi)容的方法模型或任務(wù)的總稱。自然語言理解在文本信息處理系統(tǒng)中扮演著非常重要的角色,是推薦、問答、搜索等系統(tǒng)的必備模塊。

自然語言生成(NLG),就像寫文章創(chuàng)作一樣,涉及構(gòu)詞、構(gòu)句、構(gòu)造上下文、構(gòu)造意境等,整體上相比自然語言理解難度更大,成熟度更低。目前比較多自然語言生成的應(yīng)用主要關(guān)注于垂直領(lǐng)域,比如文本摘要,古詩詞生成,機(jī)器翻譯,新聞通稿生成等,文本格式相對單一。自然語言處理應(yīng)用文本分類的應(yīng)用和文本情感分析應(yīng)用

自然語言處理相當(dāng)于機(jī)器語言和人類語言之間的翻譯,通過搭建溝通的橋梁,以實(shí)現(xiàn)人與機(jī)器交流的目的。自然語言處理的研究內(nèi)容包括機(jī)器翻譯、信息檢索、實(shí)體抽取、文本分類、智能問答、情感分析、自動(dòng)摘要、輿情分析等。有道自動(dòng)語種識別及翻譯目錄5.4知識圖譜技術(shù)知識圖譜技術(shù)概述知識圖譜概念演化

2012年Google公司提出“知識圖譜(KnowledgeGraph,,KG)”,最初特指Google公司為了支撐其語義搜索而建立的知識庫。隨著知識圖譜技術(shù)應(yīng)用的深化,知識圖譜已經(jīng)成為大數(shù)據(jù)時(shí)代最重要的知識表示形式,以開發(fā)專家系統(tǒng)(ExpertSystem,又稱為Knowledge-basedSystem)為主要內(nèi)容,以讓機(jī)器使用專家知識以及推理能力解決實(shí)際問題為主要目標(biāo)的人工智能子領(lǐng)域,主要模擬人類“推理”功能。知識圖譜的認(rèn)知微博轉(zhuǎn)發(fā)關(guān)系知識圖譜示例體驗(yàn)網(wǎng)址:/#/Graph/graph_weibo

知識圖譜(KnowledgeGraph),在圖書情報(bào)界稱為知識域可視化或知識領(lǐng)域映射地圖,是顯示知識發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的一系列各種不同的圖形,用可視化技術(shù)描述知識資源及其載體,挖掘、分析、構(gòu)建、繪制和顯示知識及它們之間的相互聯(lián)系?,F(xiàn)實(shí)世界中,知識都是交叉在一起的,組成了一個(gè)復(fù)雜的關(guān)系網(wǎng)絡(luò),知識圖譜就是為了表示知識之間結(jié)構(gòu)關(guān)系的一種可視化圖形表示。

知識圖譜由節(jié)點(diǎn)(Point)和邊(Edge)組成,每個(gè)節(jié)點(diǎn)表示現(xiàn)實(shí)世界的“實(shí)體(Entity)”,每條邊為實(shí)體與實(shí)體之間的“關(guān)系(Relationship)”。實(shí)體越多,所產(chǎn)生的關(guān)系就越復(fù)雜,知識圖譜規(guī)模也會(huì)越龐大。知識圖譜的認(rèn)知

2017年,我國學(xué)科目錄做了調(diào)整,首次出現(xiàn)了知識圖譜學(xué)科方向,教育部對于知識圖譜這一學(xué)科的定位是“大規(guī)模知識工程”。需要指出的是,知識圖譜技術(shù)的發(fā)展是一個(gè)循序漸進(jìn)的過程,其學(xué)科內(nèi)涵也在不斷發(fā)生變化。知識圖譜的認(rèn)知

近年來,隨著互聯(lián)網(wǎng)應(yīng)用需求日益增加,越來越多的知識圖譜應(yīng)運(yùn)而生。知識圖譜按照應(yīng)用的深度主要可以分為兩大類:

一是通用知識圖譜General-purposeKnowledgeGraph,GKG),通俗講就是大眾版,沒有特別深的行業(yè)知識及專業(yè)內(nèi)容,一般是解決科普類、常識類等問題。

二是行業(yè)知識圖譜(Domain-specificKnowledgeGraph,DKG),通俗講就是專業(yè)版,根據(jù)對某個(gè)行業(yè)或細(xì)分領(lǐng)域的深入研究而定制的版本,主要是解決當(dāng)前行業(yè)或細(xì)分領(lǐng)域的專業(yè)問題。知識圖譜構(gòu)建流程

知識圖譜的構(gòu)建流程主要包括:知識建模、知識獲取、知識融合、知識存儲(chǔ)、知識計(jì)算以及知識應(yīng)用。

知識建模,也叫做業(yè)務(wù)建模,是構(gòu)建多層級的知識體系,將知識、屬性、關(guān)聯(lián)關(guān)系等信息轉(zhuǎn)化為數(shù)據(jù)庫。

知識獲取是實(shí)現(xiàn)自動(dòng)化構(gòu)建大規(guī)模知識圖譜的重要技術(shù),其目的在于從不同來源、不同結(jié)構(gòu)的數(shù)據(jù)中進(jìn)行知識提取并存入知識圖譜中。

知識融合又分為模式層的融合以及數(shù)據(jù)層的融合。

知識存儲(chǔ)主要是根據(jù)業(yè)務(wù)特點(diǎn)以及數(shù)據(jù)規(guī)模選擇合適的存儲(chǔ)方式將融合后的數(shù)據(jù)進(jìn)行保存。

知識計(jì)算主要是指在結(jié)構(gòu)化的知識存儲(chǔ)庫中發(fā)現(xiàn)隱含關(guān)系以及知識,從給定的知識圖譜推導(dǎo)出新的實(shí)體跟實(shí)體之間的關(guān)系。

知識應(yīng)用主要是指如何將上面環(huán)節(jié)中構(gòu)建的“知識”以最合適的方式呈現(xiàn)給用戶。本章總結(jié)知識速覽AI賦能,讓一切皆有可能,用人工智能建設(shè)美好世界!第6章人工智能產(chǎn)品形態(tài)目錄6.1人臉識別類產(chǎn)品6.2智能機(jī)器人產(chǎn)品6.3智能推薦類產(chǎn)品6.4智能語音類產(chǎn)品學(xué)習(xí)目標(biāo)本章主要從人工智能應(yīng)用產(chǎn)品的基本形態(tài)視角,圍繞人工智能應(yīng)用系統(tǒng)中人臉識別類產(chǎn)品、智能機(jī)器人產(chǎn)品、智能推薦類產(chǎn)品、智能語音類產(chǎn)品等典型的產(chǎn)品進(jìn)行分析和討論,希望帶領(lǐng)讀者正確認(rèn)識人工智能產(chǎn)品的基本功能和用途,初步探索智能產(chǎn)品背后的結(jié)構(gòu)邏輯。理解人臉識別系統(tǒng)的構(gòu)成和技術(shù)實(shí)現(xiàn)方法理解智能機(jī)器人的構(gòu)成和技術(shù)實(shí)現(xiàn)方法理解智能推薦系統(tǒng)的基本思想和應(yīng)用方法理解智能語音助手的關(guān)鍵技術(shù)和應(yīng)用領(lǐng)域目錄6.1人臉識別類產(chǎn)品人臉識別類產(chǎn)品傳統(tǒng)身份識別與生物識別

人們希望一種更安全、可靠的技術(shù)來進(jìn)行身份識別,生物識別技術(shù)正好能滿足這一要求。由于它的內(nèi)在屬性,具有很強(qiáng)的穩(wěn)定性和個(gè)體差異性,是理想的身份識別的手段。生物識別技術(shù)是人類所固有的且每個(gè)人所特有的一些物理特征(比如人臉、指紋、虹膜、聲紋等),通過模式識別技術(shù)手段來進(jìn)行身份鑒定的一種方法,包括人臉識別、指紋識別、虹膜識別、聲紋識別等。

傳統(tǒng)的身份識別多為鑰匙、身份證、各類證件、各種卡等識別方式,這些用于標(biāo)識身份的東西容易遺失、冒名頂替。所以,傳統(tǒng)的身份識別已遠(yuǎn)遠(yuǎn)不能滿足人類生活的需求。

人臉識別類產(chǎn)品人臉識別測溫閘機(jī)

人臉識別:是一項(xiàng)基于人的臉部特征信息來進(jìn)行身份識別的技術(shù),其通過計(jì)算機(jī)分析采集到的人臉圖像信息,采用一定的特征提取算法提取出有效的人臉特征信息,最后利用提取到的人臉特征信息進(jìn)行身份識別。人臉識別發(fā)展現(xiàn)狀人臉識別類產(chǎn)品人臉識別技術(shù)相對于其他生物識別技術(shù)(如指紋識別、虹膜識別、聲紋識別等)具有以下優(yōu)點(diǎn):①非接觸性:人臉識別可以不接觸人體,直接通過攝像頭在一定距離內(nèi)識別人的面部特征,達(dá)到辨別的目的。從而可以實(shí)現(xiàn)更大范圍,更多方位的信息采集。②非侵?jǐn)_性:一方面對人臉的采集無需被采集者配合也無需工作人員干預(yù);另一方面人臉屬于暴露在外的生物特征,對人臉的識別采集更容易被大眾接受。③硬件基礎(chǔ)完善:人臉識別對硬件的需求主要體現(xiàn)在攝像頭上,當(dāng)前普及的智能手機(jī)均帶有高像素的攝像頭,同時(shí)伴隨國內(nèi)視頻監(jiān)控體系建立的逐漸完善,因此相比需要特定采集芯片的指紋識別等識別方式,人臉識別的硬件基礎(chǔ)優(yōu)勢明顯。④采集快捷簡便,可擴(kuò)展性好:對基礎(chǔ)設(shè)施的低要求及非接觸的采集方式很明顯縮短了信息采集時(shí)間,提供了方便的采集方式。人臉識別發(fā)展現(xiàn)狀人臉識別類產(chǎn)品人臉識別發(fā)展現(xiàn)狀

人臉識別最初在20世紀(jì)60年代已經(jīng)有研究人員開始研究,真正進(jìn)入初級的應(yīng)用階段是在90年代后期,發(fā)展至今其技術(shù)成熟度已經(jīng)達(dá)到較高的程度。整個(gè)發(fā)展過程可以分為機(jī)械識別、半自動(dòng)化識別、非接觸式識別及互聯(lián)網(wǎng)應(yīng)用階段。人臉識別關(guān)鍵技術(shù)人群畫像

人臉識別技術(shù)還處于不斷發(fā)展之中,但其商業(yè)化性質(zhì)特別明顯。比如某精準(zhǔn)營銷項(xiàng)目中需要通過線下門店的攝像頭采集人臉數(shù)據(jù),同時(shí)構(gòu)建該門店的人臉數(shù)據(jù)庫以及該門店的人群畫像。在某人進(jìn)入該店后進(jìn)行人臉采集的同時(shí)進(jìn)行人臉識別,在識別出該人后彈出該人的相關(guān)信息,從而達(dá)到精準(zhǔn)營銷的目的。人臉識別關(guān)鍵技術(shù)人臉識別關(guān)鍵技術(shù)

人臉識別從應(yīng)用過程來看,可將人臉識別技術(shù)劃分為人臉采集錄入、人臉關(guān)鍵點(diǎn)檢測、人臉配準(zhǔn)對齊、人臉特征提取、人臉特征比對。

人臉識別技術(shù)的應(yīng)用主要受到光照、拍攝角度、圖像遮擋、年齡等多個(gè)因素的影響,在約束條件下人臉識別技術(shù)相對成熟,在自由條件下人臉識別技術(shù)還在不斷改進(jìn)。人臉識別關(guān)鍵技術(shù)(1)人臉采集錄入(2)人臉關(guān)鍵點(diǎn)檢測(3)人臉配準(zhǔn)對齊(4)人臉特征提取人臉識別關(guān)鍵技術(shù)(5)人臉特征比對人臉識別應(yīng)用領(lǐng)域目錄6.2智能機(jī)器人產(chǎn)品智能機(jī)器人產(chǎn)品

智能機(jī)器人是一種自動(dòng)化的機(jī)器,所不同的是這種機(jī)器具備一些與人或生物相似的智能能力,如感知能力、規(guī)劃能力、動(dòng)作能力和協(xié)同能力,是一種具有高度靈活性的自動(dòng)化機(jī)器。

廣義上的機(jī)器人指自動(dòng)完成某種任務(wù)或功能的人造物,手表、電話、汽車、飛機(jī)。

狹義上的機(jī)器人是整合材料、機(jī)械、電子、控制、計(jì)算機(jī)與人工智能等技術(shù)的自動(dòng)機(jī)器。

所以,智能機(jī)器人也可以概括為:智能機(jī)器人=機(jī)械+人工智能機(jī)器人按照應(yīng)用可以劃分為三大領(lǐng)域:工業(yè)機(jī)器人、服務(wù)機(jī)器人(個(gè)人/家用、公共)和特種機(jī)器人。智能機(jī)器人產(chǎn)品工業(yè)機(jī)器人智能機(jī)器人產(chǎn)品服務(wù)機(jī)器人智能機(jī)器人產(chǎn)品特種機(jī)器人智能機(jī)器人產(chǎn)品智能機(jī)器人是人工智能技術(shù)的綜合試驗(yàn)場,可以全面檢驗(yàn)考察人工智能各個(gè)研究領(lǐng)域的技術(shù)發(fā)展?fàn)顩r。智能機(jī)器人的內(nèi)涵和外延也會(huì)隨著技術(shù)的更新而發(fā)生變化。智能機(jī)器人主要技術(shù)智能感知系統(tǒng)感知系統(tǒng)構(gòu)成

智能機(jī)器人的感知系統(tǒng)相當(dāng)于人的五官和神經(jīng)系統(tǒng),是機(jī)器人獲取內(nèi)部狀態(tài)或外部環(huán)境信息,用于內(nèi)部反饋控制的工具。感知系統(tǒng)本質(zhì)是傳感器系統(tǒng),將機(jī)器人各種內(nèi)部狀態(tài)信息和外部環(huán)境信息,轉(zhuǎn)變?yōu)闄C(jī)器人自身或者機(jī)器人之間能夠理解和應(yīng)用的數(shù)據(jù)、信號甚至知識。智能機(jī)器人產(chǎn)品智能決策系統(tǒng)無人駕駛決策系統(tǒng)

智能決策相當(dāng)于人的大腦,通過對感知信息的分析和推理,規(guī)劃和確定機(jī)器人的任務(wù),而且應(yīng)該具有學(xué)習(xí)能力,能夠?qū)崿F(xiàn)姿態(tài)控制、路徑規(guī)劃、躲避障礙、力度控制、各種優(yōu)化與控制算法。智能機(jī)器人產(chǎn)品智能執(zhí)行系統(tǒng)智能執(zhí)行系統(tǒng)

智能執(zhí)行系統(tǒng)及機(jī)器人本體,其臂部一般采用空間開鏈連桿機(jī)構(gòu),其中的運(yùn)動(dòng)副(轉(zhuǎn)動(dòng)副或移動(dòng)副)常稱為關(guān)節(jié),關(guān)節(jié)個(gè)數(shù)通常即為機(jī)器人的自由度數(shù)。

出于擬人化的考慮,常將機(jī)器人本體的有關(guān)部位分別稱為基座、腰部、臂部、腕部、手部(夾持器或末端執(zhí)行器)和行走部(對于移動(dòng)機(jī)器人)等。智能執(zhí)行系統(tǒng)一般分為兩部分:自身移動(dòng)或者變形;外部操作相應(yīng)的對象。智能機(jī)器人產(chǎn)品智能交互系統(tǒng)

智能交互系統(tǒng)主要實(shí)現(xiàn)人與機(jī)器人之間相互溝通、相互理解,可以分為:(1)直接交互:鍵盤、鼠標(biāo)、手機(jī)、有線遙控器、無線遙控器等。(2)自然交互:聲音、姿勢、肌電、意識等。(3)AR、VR、全息等。智能機(jī)器人產(chǎn)品

總體來說,“智能化”、“擬人化”將成為機(jī)器人產(chǎn)業(yè)未來的發(fā)展方向。智能機(jī)器人具有感知、思維的能力。智能機(jī)器人可獲取、處理并識別多種信息,自主地完成較為復(fù)雜的操作任務(wù)。相比一般的工業(yè)機(jī)器人,智能機(jī)器人具有更大的靈活性、機(jī)動(dòng)性和更廣泛的應(yīng)用領(lǐng)域。目錄6.3智能推薦類產(chǎn)品智能推薦類產(chǎn)品啤酒與紙尿褲的啟示

上世紀(jì)90年代,美國的沃爾瑪超市收銀員發(fā)現(xiàn)了一個(gè)奇怪的現(xiàn)象,結(jié)賬時(shí)乘客的購物車?yán)?,啤酒和紙尿褲總是擺在一起。收銀員把情況報(bào)告給了超市管理員,管理員也感到大惑不解,于是找到了學(xué)者艾格拉沃。

艾格拉沃經(jīng)過調(diào)查發(fā)現(xiàn),原因出自“奶爸”這一群體。首先,從時(shí)間上,周末比工作日購買紙尿褲喝啤酒的頻率更多;其次,從年齡上看,這一群體的孩子不超過兩歲;再次,他們喜歡看體育節(jié)目,而且邊喝啤酒邊看;最后,美國的體育節(jié)目多在周末扎堆。所以,當(dāng)周末年輕的母親需要給孩子換紙尿褲時(shí),通常會(huì)讓正在看球的奶爸去買。奶爸出去買紙尿褲,會(huì)順便帶一件啤酒回來。發(fā)現(xiàn)這個(gè)秘密后,沃爾瑪大膽地把紙尿褲擺放在啤酒旁邊,方便奶爸們購買。結(jié)果,二者的銷量雙雙上升。智能推薦類產(chǎn)品

推薦系統(tǒng)就是通過分析用戶的個(gè)人信息以及用戶的歷史行為數(shù)據(jù),從而給用戶推薦其可能感興趣的物品。智能推薦基本思想

推薦系統(tǒng)可以看成是搜索的排序系統(tǒng),或者是一個(gè)信息過濾系統(tǒng)。用戶通過信息輸入,推薦系統(tǒng)自動(dòng)返回一個(gè)結(jié)果序列。推薦系統(tǒng)具有以下兩個(gè)最顯著的特性:(1)主動(dòng)化。而推薦系統(tǒng)不需要用戶提供明確的需求,而是通過分析用戶和物品的數(shù)據(jù),對用戶和物品進(jìn)行建模,從而主動(dòng)為用戶推薦他們感興趣的信息。(2)個(gè)性化。推薦系統(tǒng)能夠更好地發(fā)掘長尾信息,即將冷門物品推薦給對其感興趣的用戶。在電商平臺(tái)火熱的時(shí)代,由冷門物品帶來的營業(yè)額甚至超過熱門物品,發(fā)掘長尾信息是推薦系統(tǒng)的重要研究方向。智能推薦類產(chǎn)品

推薦系統(tǒng)的基本思想可概括為“物以類聚”、“人以群分”、“知你所想”。

“物以類聚”式的推薦思想,認(rèn)為用戶可能會(huì)喜歡與他之前曾經(jīng)喜歡的物品相似的物品。利用用戶曾經(jīng)喜歡過的物品信息(內(nèi)容信息、標(biāo)簽、關(guān)鍵字),給用戶推薦與他以前喜歡過的物品相似的其他物品。

“人以群分”式的推薦思想,利用用戶及其與之興趣愛好相似的其他用戶信息,給用戶推薦這些相似用戶喜歡的物品。

“知你所想”:利用用戶和物品的特征信息(用戶的基本信息及行為數(shù)據(jù),例如點(diǎn)擊、瀏覽、收藏、購買、評論等),給用戶推薦那些具有用戶喜歡特征的物品。智能推薦基本思想智能推薦類產(chǎn)品智能推薦基本思想智能推薦類產(chǎn)品智能推薦系統(tǒng)流程

大數(shù)據(jù)時(shí)代,網(wǎng)絡(luò)上充斥著琳瑯滿目并且種類繁雜的商品、電影、歌曲、視頻等各種服務(wù),這就是人們常說的信息過載。推薦系統(tǒng)被證明是一種解決“信息過載”和“長尾物品”問題的有效工具,基于知識發(fā)現(xiàn)的相關(guān)技術(shù)來解決人們選擇商品、信息或者服務(wù)問題。推薦系統(tǒng)具體的工作流程包括:數(shù)據(jù)預(yù)處理、用戶行為建模、物品特征建模、生成推薦結(jié)果。智能推薦類產(chǎn)品智能推薦系統(tǒng)實(shí)例

海倫女士一直使用在線約會(huì)網(wǎng)站尋找適合自己的約會(huì)對象。盡管約會(huì)網(wǎng)站會(huì)向她推薦不同的人選,但她并不是喜歡每一個(gè)推薦對象。經(jīng)過一番總結(jié),她發(fā)現(xiàn)自己交往過的對象可以進(jìn)行如下分類:不喜歡型、有些喜歡型、非常喜歡型。

為了給她成功推薦約會(huì)對象,相親網(wǎng)站需要了解海倫女士對約會(huì)對象的偏好特征,約會(huì)網(wǎng)站收集了三個(gè)影響相親結(jié)果的特征:每年獲得的飛行??屠锍虜?shù)、玩視頻游戲所消耗時(shí)間百分比、每周消費(fèi)的冰淇淋公升數(shù)。接下來,根據(jù)海倫曾經(jīng)的約會(huì)數(shù)據(jù)以及對約會(huì)對象的評價(jià)結(jié)果,相親網(wǎng)站對以上數(shù)據(jù)進(jìn)行分析。智能推薦類產(chǎn)品智能推薦系統(tǒng)實(shí)例每年獲得的飛行常客里程數(shù)與玩視頻游戲所消耗時(shí)間占比的關(guān)系圖每年獲得的飛行??屠锍虜?shù)與每周消費(fèi)的冰淇淋公升數(shù)的關(guān)系圖玩視頻游戲所消耗時(shí)間占比與每周消費(fèi)的冰淇淋公升數(shù)的關(guān)系圖智能推薦類產(chǎn)品智能推薦系統(tǒng)應(yīng)用領(lǐng)域

推薦系統(tǒng)本質(zhì)上可以說是一個(gè)搜索排名系統(tǒng),或者是一個(gè)信息過濾系統(tǒng),旨在從紛繁復(fù)雜的數(shù)據(jù)中,找到于用戶個(gè)人有利的信息。總體來說,一個(gè)完整的推薦系統(tǒng)一般存在三個(gè)參與方:用戶、內(nèi)容提供者和提供推薦系統(tǒng)的網(wǎng)站。

首先,推薦系統(tǒng)要滿足用戶的需求,給用戶推薦那些讓他們感興趣的內(nèi)容;其次,推薦系統(tǒng)要讓內(nèi)容提供者的內(nèi)容能被推薦給對其感興趣的用戶;最后,好的推薦系統(tǒng)設(shè)計(jì),能夠讓推薦系統(tǒng)本身收獲到高質(zhì)量的用戶反饋,不斷提高推薦的質(zhì)量,提高推薦系統(tǒng)的效益。推薦系統(tǒng)是以提升用戶體驗(yàn)感和提高商業(yè)利潤為目的技術(shù),它的應(yīng)用領(lǐng)域主要有:電子商務(wù)、電影和視頻網(wǎng)站、個(gè)性化音樂網(wǎng)絡(luò)電臺(tái)、社交網(wǎng)絡(luò)。目錄6.4智能語音類產(chǎn)品智能語音類產(chǎn)品

智能語音技術(shù)作為人工智能的關(guān)鍵技術(shù)之一,其目標(biāo)是是實(shí)現(xiàn)人機(jī)語言的通信,具體包括語音識別技術(shù)(ASR)和語音合成技術(shù)(TTS)。智能語音技術(shù)的研究是以語音識別技術(shù)為開端,可以追溯到20世紀(jì)50年代。隨著信息技術(shù)的發(fā)展,智能語音技術(shù)已經(jīng)成為人們信息獲取和溝通最便捷、最有效的手段。智能語音助手作為智能語音技術(shù)的應(yīng)用落地產(chǎn)品,近年來備受用戶關(guān)注和喜愛。智能語音助手根據(jù)其依托的載體不同可分為手機(jī)智能語音助手、智能音箱等。知名的智能音箱有天貓精靈、小米AI音箱等,常見的手機(jī)智能語音助手有蘋果的Siri、華為的小藝和百度的小度等。智能語音助手通過提供智能化的語音識別技術(shù)來實(shí)現(xiàn)智能化操作,例如,熟知的語音助手像小米AI音箱不僅可以播放音樂、講故事、設(shè)置鬧鐘,還可以控制智能家居,為用戶提供更加全面的服務(wù)。智能語音類產(chǎn)品

智能語音技術(shù)作為人工智能的關(guān)鍵技術(shù)之一,其目標(biāo)是是實(shí)現(xiàn)人機(jī)語言的通信,具體包括語音識別技術(shù)(ASR)和語音合成技術(shù)(TTS)。智能語音技術(shù)的研究是以語音識別技術(shù)為開端,可以追溯到20世紀(jì)50年代。隨著信息技術(shù)的發(fā)展,智能語音技術(shù)已經(jīng)成為人們信息獲取和溝通最便捷、最有效的手段。智能語音助手作為智能語音技術(shù)的應(yīng)用落地產(chǎn)品,近年來備受用戶關(guān)注和喜愛。智能語音助手根據(jù)其依托的載體不同可分為手機(jī)智能語音助手、智能音箱等。知名的智能音箱有天貓精靈、小米AI音箱等,常見的手機(jī)智能語音助手有蘋果的Siri、華為的小藝和百度的小度等。智能語音助手通過提供智能化的語音識別技術(shù)來實(shí)現(xiàn)智能化操作,例如,熟知的語音助手像小米AI音箱不僅可以播放音樂、講故事、設(shè)置鬧鐘,還可以控制智能家居,為用戶提供更加全面的服務(wù)。智能語音助手發(fā)展歷程智能語音類產(chǎn)品智能語音技術(shù)的研究可追溯到20世紀(jì)50年代,發(fā)展過程從未間斷,其代表性發(fā)展歷程可分為四個(gè)階段:萌芽期、突破期、產(chǎn)業(yè)化期以及快速應(yīng)用期。萌芽期:1952年,貝爾實(shí)驗(yàn)室(BellLabs)制造一臺(tái)6英尺高自動(dòng)數(shù)字識別機(jī)“Audrey”,它可以識別數(shù)字0~9的發(fā)音,且準(zhǔn)確度高達(dá)90%以上。突破期:1988年,卡耐基梅隆大學(xué)結(jié)合

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論