人工智能技術(shù)導(dǎo)論-課件 第5、6章 人工智能關(guān)鍵技術(shù)、人工智能產(chǎn)品形態(tài)_第1頁(yè)
人工智能技術(shù)導(dǎo)論-課件 第5、6章 人工智能關(guān)鍵技術(shù)、人工智能產(chǎn)品形態(tài)_第2頁(yè)
人工智能技術(shù)導(dǎo)論-課件 第5、6章 人工智能關(guān)鍵技術(shù)、人工智能產(chǎn)品形態(tài)_第3頁(yè)
人工智能技術(shù)導(dǎo)論-課件 第5、6章 人工智能關(guān)鍵技術(shù)、人工智能產(chǎn)品形態(tài)_第4頁(yè)
人工智能技術(shù)導(dǎo)論-課件 第5、6章 人工智能關(guān)鍵技術(shù)、人工智能產(chǎn)品形態(tài)_第5頁(yè)
已閱讀5頁(yè),還剩76頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第5章人工智能關(guān)鍵技術(shù)目錄5.1計(jì)算機(jī)視覺(jué)技術(shù)5.2智能語(yǔ)音技術(shù)5.3自然語(yǔ)言處理技術(shù)5.4知識(shí)圖譜技術(shù)學(xué)習(xí)目標(biāo)本章主要從人工智能系統(tǒng)的技術(shù)視角,圍繞人工智能中的計(jì)算機(jī)視覺(jué)技術(shù)、智能語(yǔ)音技術(shù)、自然語(yǔ)言處理技術(shù)、知識(shí)圖譜等核心技術(shù)進(jìn)行討論,希望帶領(lǐng)讀者正確理解人工智能關(guān)鍵技術(shù)的概念,初步認(rèn)識(shí)人工智能系統(tǒng)的“看、聽(tīng)、說(shuō)、做”實(shí)現(xiàn)方法。理解計(jì)算機(jī)視覺(jué)關(guān)鍵技術(shù)理解智能語(yǔ)音關(guān)鍵技術(shù)理解自然語(yǔ)言處理關(guān)鍵技術(shù)理解知識(shí)圖譜關(guān)鍵技術(shù)目錄5.1計(jì)算機(jī)視覺(jué)技術(shù)概述

人工智能的本質(zhì)工作是研究、開(kāi)發(fā)用于模擬和延展人類的智能的應(yīng)用系統(tǒng),具體來(lái)說(shuō)就是通過(guò)人工智能技術(shù)來(lái)模仿人類的“視物”、“聽(tīng)聲”、“說(shuō)話”、“理解”及“推理”等人類智能能力。人類智能與人工智能概述計(jì)算機(jī)視覺(jué)(CompuerVision,CV)是研究使用計(jì)算機(jī)實(shí)現(xiàn)或模擬人類“視物”功能的技術(shù),使用計(jì)算機(jī)模仿人類視覺(jué)系統(tǒng)的科學(xué),讓計(jì)算機(jī)擁有類似人類提取、處理、理解和分析圖像以及圖像序列的能力。確切地說(shuō),計(jì)算機(jī)視覺(jué)技術(shù)就是利用了攝像機(jī)以及電腦替代人類眼睛,使得計(jì)算機(jī)擁有人類眼睛所具有的分類、識(shí)別、分割、跟蹤、判別決策等功能。概述

通過(guò)圖像獲取技術(shù)提取二維圖像、三維圖組、圖像序列等原始數(shù)據(jù)。

下面所示展示了人類看到的“冰墩墩”圖像和機(jī)器獲取到的“冰墩墩”數(shù)據(jù)(右圖為了清晰呈現(xiàn),只截取了部分?jǐn)?shù)據(jù))。人類看到的“冰墩墩”圖像機(jī)器“看到”的“冰墩墩”圖像概述

計(jì)算機(jī)視覺(jué)系統(tǒng)就是創(chuàng)建了能夠在二維平面圖像或者三維立體圖像的數(shù)據(jù)中,以獲取所需要的“信息”的一個(gè)完整的人工智能系統(tǒng),例如自動(dòng)駕駛、智能機(jī)器人等領(lǐng)域均需要通過(guò)計(jì)算機(jī)視覺(jué)技術(shù)從視覺(jué)信號(hào)中提取并處理信息。自動(dòng)駕駛系統(tǒng)智能機(jī)器人圖像處理基礎(chǔ)

圖像是人類視覺(jué)的基礎(chǔ),是自然景物的客觀反映,是人類認(rèn)識(shí)世界和人類自身的重要源泉。計(jì)算機(jī)視覺(jué)是讓機(jī)器具有智慧的“眼睛”,圖像處理是其重要的研究?jī)?nèi)容。對(duì)于圖像,有一個(gè)重要的概念-圖像分辨率。圖像分辨率又分為空間分辨率和灰度分辨率。圖像處理基礎(chǔ)分辨率高

空間分辨率是每英寸圖像內(nèi)有多少個(gè)像素點(diǎn)被采樣,分辨率的單位為PPI(PixelsPerInch,像素每英寸)。采樣過(guò)程實(shí)質(zhì)上對(duì)一幅圖像等間距劃分成多個(gè)網(wǎng)格,每一個(gè)網(wǎng)格表示一個(gè)像素點(diǎn)。采樣間隔越大,所得圖像像素?cái)?shù)越少,空間分辨率越低,圖像質(zhì)量差,嚴(yán)重時(shí)出現(xiàn)馬賽克效應(yīng);采樣間隔越小,所得圖像像素?cái)?shù)越多,空間分辨率越高,圖像質(zhì)量好,但數(shù)據(jù)量大。

分辨率低圖像處理基礎(chǔ)

灰度分辨率是用于量化灰度的比特?cái)?shù),通常用2的整數(shù)次冪來(lái)表示,例如8bit,它表示的灰度范圍是0到255。量化實(shí)質(zhì)上是顏色值數(shù)字化的過(guò)程。根據(jù)圖像的灰度級(jí)數(shù),可將圖像分為黑白圖像(二值圖像,用0和1表達(dá))、灰度圖像和彩色圖像。彩色圖像黑白圖像灰度圖像計(jì)算機(jī)視覺(jué)技術(shù)的主要任務(wù)

計(jì)算機(jī)視覺(jué)是一種讓計(jì)算機(jī)學(xué)會(huì)“視物”并“識(shí)物”的技術(shù),跟人類觀察世界一樣,從粗粒度的“歸類”到精細(xì)粒度的“理解”,計(jì)算機(jī)視覺(jué)技術(shù)的主要任務(wù)有圖像分類(What)、目標(biāo)檢測(cè)(What&Where)、圖像分割(What&Where),其中圖像分割不但能檢測(cè)位置,還能夠精細(xì)地將位置輪廓勾勒出來(lái)。計(jì)算機(jī)視覺(jué)技術(shù)的主要任務(wù)圖像分類體驗(yàn)網(wǎng)址:/tech/imagerecognition/ingredient圖片分類(ImageClassification),顧名思義,就是通過(guò)算法對(duì)其中的對(duì)象進(jìn)行分類,圖像分類一直是計(jì)算機(jī)視覺(jué)中非?;A(chǔ)且重要的一個(gè)任務(wù),也是幾乎所有的深度學(xué)習(xí)網(wǎng)絡(luò)模型進(jìn)行評(píng)價(jià)測(cè)試的方向。計(jì)算機(jī)視覺(jué)技術(shù)的主要任務(wù)目標(biāo)檢測(cè)(ObjectDetection)主要從圖像中分離出感興趣的目標(biāo),不僅要用算法判斷圖片目標(biāo)對(duì)象的類別,還要對(duì)圖像目標(biāo)對(duì)象進(jìn)行定位,即在圖像中確定其位置,并用矩形框把檢測(cè)目標(biāo)對(duì)象標(biāo)識(shí)出來(lái)。目標(biāo)檢測(cè)體驗(yàn)網(wǎng)址:/tech/vehicle/detect計(jì)算機(jī)視覺(jué)技術(shù)的主要任務(wù)

圖像分割用于預(yù)測(cè)圖像中每個(gè)像素點(diǎn)所屬的類別或者實(shí)體,是計(jì)算機(jī)視覺(jué)中非常重要的任務(wù)。按照分割任務(wù)不同,主要分為兩類:(1)語(yǔ)義分割(SemanticSegmentation):是對(duì)圖像中的每個(gè)像素都劃分出對(duì)應(yīng)的類別,即實(shí)現(xiàn)像素級(jí)別的分類,對(duì)比目標(biāo)檢測(cè),圖像分割支持用多邊形標(biāo)注訓(xùn)練數(shù)據(jù),模型可像素級(jí)識(shí)別目標(biāo),它的目標(biāo)是為圖像中的每個(gè)像素分類;(2)實(shí)例分割(InstanceSegmentation):不但要進(jìn)行像素級(jí)別的分類,還需在具體的類別基礎(chǔ)上區(qū)分不同的實(shí)例,一般用不同的顏色標(biāo)識(shí)。目錄5.2智能語(yǔ)音技術(shù)智能語(yǔ)音系統(tǒng)構(gòu)成智能語(yǔ)音的識(shí)別過(guò)程

智能語(yǔ)音把語(yǔ)音作為研究對(duì)象,是語(yǔ)音信號(hào)處理的一個(gè)重要研究方向,涉及心理學(xué)、語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)以及信號(hào)處理等諸多領(lǐng)域,甚至還涉及到人的體態(tài)語(yǔ)言,最終目標(biāo)是實(shí)現(xiàn)人與機(jī)器進(jìn)行自然語(yǔ)言對(duì)話。智能語(yǔ)音技術(shù),也被稱為自動(dòng)語(yǔ)音識(shí)別自動(dòng)語(yǔ)音識(shí)別(AutomaticSpeechRecognition,ASR),就是讓機(jī)器通過(guò)識(shí)別和理解,把語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的技術(shù)。智能語(yǔ)音系統(tǒng)構(gòu)成智能語(yǔ)音識(shí)別系統(tǒng)構(gòu)成

為了實(shí)現(xiàn)機(jī)器與人類的正常對(duì)話、交流,智能語(yǔ)音系統(tǒng)需要完成“識(shí)別”、“聽(tīng)清”、“理解”、“行動(dòng)”以及“播報(bào)”這一連貫的任務(wù)。因此,智能語(yǔ)音系統(tǒng)至少包含了5個(gè)基本的子模塊:語(yǔ)音喚醒、語(yǔ)音增強(qiáng)、聲紋識(shí)別、語(yǔ)種識(shí)別和語(yǔ)音合成等。智能語(yǔ)音系統(tǒng)構(gòu)成語(yǔ)音喚醒

語(yǔ)音喚醒的目標(biāo)就是讓機(jī)器“能聽(tīng)”?!昂?,siri”、“小愛(ài)同學(xué)”,在使用智能語(yǔ)音助手時(shí),常常會(huì)叫到人們呼喚這些名字,讓它們來(lái)幫助完成一些指令。而這個(gè)叫名字的過(guò)程,就是指的語(yǔ)音喚醒。智能語(yǔ)音系統(tǒng)構(gòu)成語(yǔ)音增強(qiáng)

語(yǔ)音增強(qiáng)的目標(biāo)是讓機(jī)器“聽(tīng)得清”,是指當(dāng)語(yǔ)音信號(hào)被各種各樣的噪聲干擾、甚至淹沒(méi)后,從噪聲背景中提取有用的語(yǔ)音信號(hào),抑制、降低噪聲干擾的技術(shù)??偨Y(jié)起來(lái),語(yǔ)音增強(qiáng)就是指從含噪聲的語(yǔ)音中提取盡可能純凈的原始語(yǔ)音。智能語(yǔ)音系統(tǒng)構(gòu)成聲紋識(shí)別

聲紋識(shí)別的目標(biāo)是讓機(jī)器“聽(tīng)出說(shuō)話的對(duì)象”,它是生物識(shí)別技術(shù)的一種,也稱為說(shuō)話人識(shí)別。聲紋識(shí)別能夠提取每個(gè)人獨(dú)一無(wú)二的語(yǔ)音特征,實(shí)現(xiàn)“聽(tīng)音辨人”,在涉及說(shuō)話人身份識(shí)別的場(chǎng)景中具有重要應(yīng)用價(jià)值。智能語(yǔ)音系統(tǒng)構(gòu)成語(yǔ)種識(shí)別

語(yǔ)種識(shí)別的目標(biāo)是讓機(jī)器“聽(tīng)出是哪種語(yǔ)言”,即讓機(jī)器判斷某段音頻是英語(yǔ)、中語(yǔ)還是法語(yǔ),又稱判斷音頻的語(yǔ)種。致力于智能語(yǔ)音研究的科大訊飛,推出了方言識(shí)別功能,目前訊飛輸入法支持23種方言,其中粵語(yǔ)、閩南語(yǔ)、湖南話、四川話、東北話、河南話等方言的識(shí)別率均已超過(guò)90%。智能語(yǔ)音系統(tǒng)構(gòu)成語(yǔ)音合成

語(yǔ)音合成又稱文本轉(zhuǎn)語(yǔ)音技術(shù)(TexttoSpeech,TTS),目標(biāo)是讓機(jī)器“能說(shuō)”,指通過(guò)機(jī)械的、電子的方法產(chǎn)生人造語(yǔ)音,將任意文字信息轉(zhuǎn)化為標(biāo)準(zhǔn)流暢的語(yǔ)音朗讀出來(lái)。通俗的講,語(yǔ)音合成技術(shù)就是賦予計(jì)算機(jī)“像人一樣開(kāi)口說(shuō)話”的能力。智能語(yǔ)音的應(yīng)用智能語(yǔ)音硬件產(chǎn)品

隨著人工智能技術(shù)的不斷發(fā)展,人工智能的各種應(yīng)用及產(chǎn)品在社會(huì)地各個(gè)方面都有滲透,人們已經(jīng)接觸過(guò)越來(lái)越多的人臉識(shí)別產(chǎn)品、智能語(yǔ)音產(chǎn)品等。這些智能語(yǔ)音產(chǎn)品分為硬件產(chǎn)品和軟件產(chǎn)品兩類。智能語(yǔ)音軟件產(chǎn)品目錄5.3自然語(yǔ)言處理技術(shù)自然語(yǔ)言處理任務(wù)層級(jí)

自然語(yǔ)言處理(NaturalLanguageProcessing,NLP),是研究人與計(jì)算機(jī)交互語(yǔ)言問(wèn)題的一門學(xué)科,是計(jì)算機(jī)科學(xué)和人工智能結(jié)合的一個(gè)子領(lǐng)域。自然語(yǔ)言處理的主要任務(wù)是將機(jī)器學(xué)習(xí)算法應(yīng)用于處理文本,將自然語(yǔ)言(主要是以文本形式呈現(xiàn)的語(yǔ)言)作為計(jì)算機(jī)程序的輸入和(或)輸出,它的關(guān)鍵任務(wù)是使計(jì)算機(jī)“理解”人類語(yǔ)言,代替人類執(zhí)行語(yǔ)言翻譯和問(wèn)題回答等任務(wù)。

自然語(yǔ)言處理技術(shù)按任務(wù)層級(jí)分為底層資源建設(shè)、基礎(chǔ)任務(wù)、中層應(yīng)用任務(wù)和上層應(yīng)用系統(tǒng)。自然語(yǔ)言處理技術(shù)體系

實(shí)現(xiàn)人類與計(jì)算機(jī)之間自然語(yǔ)言的通信,意味著要使計(jì)算機(jī)既能理解自然語(yǔ)言文本的意義,也能以自然語(yǔ)言文本來(lái)表達(dá)給定的意圖、思想等。前者稱為自然語(yǔ)言理解(NLU,NaturalLanguageUnderstanding),后者稱為自然語(yǔ)言生成(NLG,NaturalLanguagegeneration)。因此,自然語(yǔ)言處理技術(shù)體系大體包括了自然語(yǔ)言理解和自然語(yǔ)言生成兩大方向。自然語(yǔ)言處理技術(shù)體系語(yǔ)音合成

自然語(yǔ)言理解(NLU),顧名思義,就是讓機(jī)器“理解”人類語(yǔ)言,是所有支持機(jī)器理解文本內(nèi)容的方法模型或任務(wù)的總稱。自然語(yǔ)言理解在文本信息處理系統(tǒng)中扮演著非常重要的角色,是推薦、問(wèn)答、搜索等系統(tǒng)的必備模塊。

自然語(yǔ)言生成(NLG),就像寫文章創(chuàng)作一樣,涉及構(gòu)詞、構(gòu)句、構(gòu)造上下文、構(gòu)造意境等,整體上相比自然語(yǔ)言理解難度更大,成熟度更低。目前比較多自然語(yǔ)言生成的應(yīng)用主要關(guān)注于垂直領(lǐng)域,比如文本摘要,古詩(shī)詞生成,機(jī)器翻譯,新聞通稿生成等,文本格式相對(duì)單一。自然語(yǔ)言處理應(yīng)用文本分類的應(yīng)用和文本情感分析應(yīng)用

自然語(yǔ)言處理相當(dāng)于機(jī)器語(yǔ)言和人類語(yǔ)言之間的翻譯,通過(guò)搭建溝通的橋梁,以實(shí)現(xiàn)人與機(jī)器交流的目的。自然語(yǔ)言處理的研究?jī)?nèi)容包括機(jī)器翻譯、信息檢索、實(shí)體抽取、文本分類、智能問(wèn)答、情感分析、自動(dòng)摘要、輿情分析等。有道自動(dòng)語(yǔ)種識(shí)別及翻譯目錄5.4知識(shí)圖譜技術(shù)知識(shí)圖譜技術(shù)概述知識(shí)圖譜概念演化

2012年Google公司提出“知識(shí)圖譜(KnowledgeGraph,,KG)”,最初特指Google公司為了支撐其語(yǔ)義搜索而建立的知識(shí)庫(kù)。隨著知識(shí)圖譜技術(shù)應(yīng)用的深化,知識(shí)圖譜已經(jīng)成為大數(shù)據(jù)時(shí)代最重要的知識(shí)表示形式,以開(kāi)發(fā)專家系統(tǒng)(ExpertSystem,又稱為Knowledge-basedSystem)為主要內(nèi)容,以讓機(jī)器使用專家知識(shí)以及推理能力解決實(shí)際問(wèn)題為主要目標(biāo)的人工智能子領(lǐng)域,主要模擬人類“推理”功能。知識(shí)圖譜的認(rèn)知微博轉(zhuǎn)發(fā)關(guān)系知識(shí)圖譜示例體驗(yàn)網(wǎng)址:/#/Graph/graph_weibo

知識(shí)圖譜(KnowledgeGraph),在圖書情報(bào)界稱為知識(shí)域可視化或知識(shí)領(lǐng)域映射地圖,是顯示知識(shí)發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的一系列各種不同的圖形,用可視化技術(shù)描述知識(shí)資源及其載體,挖掘、分析、構(gòu)建、繪制和顯示知識(shí)及它們之間的相互聯(lián)系?,F(xiàn)實(shí)世界中,知識(shí)都是交叉在一起的,組成了一個(gè)復(fù)雜的關(guān)系網(wǎng)絡(luò),知識(shí)圖譜就是為了表示知識(shí)之間結(jié)構(gòu)關(guān)系的一種可視化圖形表示。

知識(shí)圖譜由節(jié)點(diǎn)(Point)和邊(Edge)組成,每個(gè)節(jié)點(diǎn)表示現(xiàn)實(shí)世界的“實(shí)體(Entity)”,每條邊為實(shí)體與實(shí)體之間的“關(guān)系(Relationship)”。實(shí)體越多,所產(chǎn)生的關(guān)系就越復(fù)雜,知識(shí)圖譜規(guī)模也會(huì)越龐大。知識(shí)圖譜的認(rèn)知

2017年,我國(guó)學(xué)科目錄做了調(diào)整,首次出現(xiàn)了知識(shí)圖譜學(xué)科方向,教育部對(duì)于知識(shí)圖譜這一學(xué)科的定位是“大規(guī)模知識(shí)工程”。需要指出的是,知識(shí)圖譜技術(shù)的發(fā)展是一個(gè)循序漸進(jìn)的過(guò)程,其學(xué)科內(nèi)涵也在不斷發(fā)生變化。知識(shí)圖譜的認(rèn)知

近年來(lái),隨著互聯(lián)網(wǎng)應(yīng)用需求日益增加,越來(lái)越多的知識(shí)圖譜應(yīng)運(yùn)而生。知識(shí)圖譜按照應(yīng)用的深度主要可以分為兩大類:

一是通用知識(shí)圖譜General-purposeKnowledgeGraph,GKG),通俗講就是大眾版,沒(méi)有特別深的行業(yè)知識(shí)及專業(yè)內(nèi)容,一般是解決科普類、常識(shí)類等問(wèn)題。

二是行業(yè)知識(shí)圖譜(Domain-specificKnowledgeGraph,DKG),通俗講就是專業(yè)版,根據(jù)對(duì)某個(gè)行業(yè)或細(xì)分領(lǐng)域的深入研究而定制的版本,主要是解決當(dāng)前行業(yè)或細(xì)分領(lǐng)域的專業(yè)問(wèn)題。知識(shí)圖譜構(gòu)建流程

知識(shí)圖譜的構(gòu)建流程主要包括:知識(shí)建模、知識(shí)獲取、知識(shí)融合、知識(shí)存儲(chǔ)、知識(shí)計(jì)算以及知識(shí)應(yīng)用。

知識(shí)建模,也叫做業(yè)務(wù)建模,是構(gòu)建多層級(jí)的知識(shí)體系,將知識(shí)、屬性、關(guān)聯(lián)關(guān)系等信息轉(zhuǎn)化為數(shù)據(jù)庫(kù)。

知識(shí)獲取是實(shí)現(xiàn)自動(dòng)化構(gòu)建大規(guī)模知識(shí)圖譜的重要技術(shù),其目的在于從不同來(lái)源、不同結(jié)構(gòu)的數(shù)據(jù)中進(jìn)行知識(shí)提取并存入知識(shí)圖譜中。

知識(shí)融合又分為模式層的融合以及數(shù)據(jù)層的融合。

知識(shí)存儲(chǔ)主要是根據(jù)業(yè)務(wù)特點(diǎn)以及數(shù)據(jù)規(guī)模選擇合適的存儲(chǔ)方式將融合后的數(shù)據(jù)進(jìn)行保存。

知識(shí)計(jì)算主要是指在結(jié)構(gòu)化的知識(shí)存儲(chǔ)庫(kù)中發(fā)現(xiàn)隱含關(guān)系以及知識(shí),從給定的知識(shí)圖譜推導(dǎo)出新的實(shí)體跟實(shí)體之間的關(guān)系。

知識(shí)應(yīng)用主要是指如何將上面環(huán)節(jié)中構(gòu)建的“知識(shí)”以最合適的方式呈現(xiàn)給用戶。本章總結(jié)知識(shí)速覽AI賦能,讓一切皆有可能,用人工智能建設(shè)美好世界!第6章人工智能產(chǎn)品形態(tài)目錄6.1人臉識(shí)別類產(chǎn)品6.2智能機(jī)器人產(chǎn)品6.3智能推薦類產(chǎn)品6.4智能語(yǔ)音類產(chǎn)品學(xué)習(xí)目標(biāo)本章主要從人工智能應(yīng)用產(chǎn)品的基本形態(tài)視角,圍繞人工智能應(yīng)用系統(tǒng)中人臉識(shí)別類產(chǎn)品、智能機(jī)器人產(chǎn)品、智能推薦類產(chǎn)品、智能語(yǔ)音類產(chǎn)品等典型的產(chǎn)品進(jìn)行分析和討論,希望帶領(lǐng)讀者正確認(rèn)識(shí)人工智能產(chǎn)品的基本功能和用途,初步探索智能產(chǎn)品背后的結(jié)構(gòu)邏輯。理解人臉識(shí)別系統(tǒng)的構(gòu)成和技術(shù)實(shí)現(xiàn)方法理解智能機(jī)器人的構(gòu)成和技術(shù)實(shí)現(xiàn)方法理解智能推薦系統(tǒng)的基本思想和應(yīng)用方法理解智能語(yǔ)音助手的關(guān)鍵技術(shù)和應(yīng)用領(lǐng)域目錄6.1人臉識(shí)別類產(chǎn)品人臉識(shí)別類產(chǎn)品傳統(tǒng)身份識(shí)別與生物識(shí)別

人們希望一種更安全、可靠的技術(shù)來(lái)進(jìn)行身份識(shí)別,生物識(shí)別技術(shù)正好能滿足這一要求。由于它的內(nèi)在屬性,具有很強(qiáng)的穩(wěn)定性和個(gè)體差異性,是理想的身份識(shí)別的手段。生物識(shí)別技術(shù)是人類所固有的且每個(gè)人所特有的一些物理特征(比如人臉、指紋、虹膜、聲紋等),通過(guò)模式識(shí)別技術(shù)手段來(lái)進(jìn)行身份鑒定的一種方法,包括人臉識(shí)別、指紋識(shí)別、虹膜識(shí)別、聲紋識(shí)別等。

傳統(tǒng)的身份識(shí)別多為鑰匙、身份證、各類證件、各種卡等識(shí)別方式,這些用于標(biāo)識(shí)身份的東西容易遺失、冒名頂替。所以,傳統(tǒng)的身份識(shí)別已遠(yuǎn)遠(yuǎn)不能滿足人類生活的需求。

人臉識(shí)別類產(chǎn)品人臉識(shí)別測(cè)溫閘機(jī)

人臉識(shí)別:是一項(xiàng)基于人的臉部特征信息來(lái)進(jìn)行身份識(shí)別的技術(shù),其通過(guò)計(jì)算機(jī)分析采集到的人臉圖像信息,采用一定的特征提取算法提取出有效的人臉特征信息,最后利用提取到的人臉特征信息進(jìn)行身份識(shí)別。人臉識(shí)別發(fā)展現(xiàn)狀人臉識(shí)別類產(chǎn)品人臉識(shí)別技術(shù)相對(duì)于其他生物識(shí)別技術(shù)(如指紋識(shí)別、虹膜識(shí)別、聲紋識(shí)別等)具有以下優(yōu)點(diǎn):①非接觸性:人臉識(shí)別可以不接觸人體,直接通過(guò)攝像頭在一定距離內(nèi)識(shí)別人的面部特征,達(dá)到辨別的目的。從而可以實(shí)現(xiàn)更大范圍,更多方位的信息采集。②非侵?jǐn)_性:一方面對(duì)人臉的采集無(wú)需被采集者配合也無(wú)需工作人員干預(yù);另一方面人臉屬于暴露在外的生物特征,對(duì)人臉的識(shí)別采集更容易被大眾接受。③硬件基礎(chǔ)完善:人臉識(shí)別對(duì)硬件的需求主要體現(xiàn)在攝像頭上,當(dāng)前普及的智能手機(jī)均帶有高像素的攝像頭,同時(shí)伴隨國(guó)內(nèi)視頻監(jiān)控體系建立的逐漸完善,因此相比需要特定采集芯片的指紋識(shí)別等識(shí)別方式,人臉識(shí)別的硬件基礎(chǔ)優(yōu)勢(shì)明顯。④采集快捷簡(jiǎn)便,可擴(kuò)展性好:對(duì)基礎(chǔ)設(shè)施的低要求及非接觸的采集方式很明顯縮短了信息采集時(shí)間,提供了方便的采集方式。人臉識(shí)別發(fā)展現(xiàn)狀人臉識(shí)別類產(chǎn)品人臉識(shí)別發(fā)展現(xiàn)狀

人臉識(shí)別最初在20世紀(jì)60年代已經(jīng)有研究人員開(kāi)始研究,真正進(jìn)入初級(jí)的應(yīng)用階段是在90年代后期,發(fā)展至今其技術(shù)成熟度已經(jīng)達(dá)到較高的程度。整個(gè)發(fā)展過(guò)程可以分為機(jī)械識(shí)別、半自動(dòng)化識(shí)別、非接觸式識(shí)別及互聯(lián)網(wǎng)應(yīng)用階段。人臉識(shí)別關(guān)鍵技術(shù)人群畫像

人臉識(shí)別技術(shù)還處于不斷發(fā)展之中,但其商業(yè)化性質(zhì)特別明顯。比如某精準(zhǔn)營(yíng)銷項(xiàng)目中需要通過(guò)線下門店的攝像頭采集人臉數(shù)據(jù),同時(shí)構(gòu)建該門店的人臉數(shù)據(jù)庫(kù)以及該門店的人群畫像。在某人進(jìn)入該店后進(jìn)行人臉采集的同時(shí)進(jìn)行人臉識(shí)別,在識(shí)別出該人后彈出該人的相關(guān)信息,從而達(dá)到精準(zhǔn)營(yíng)銷的目的。人臉識(shí)別關(guān)鍵技術(shù)人臉識(shí)別關(guān)鍵技術(shù)

人臉識(shí)別從應(yīng)用過(guò)程來(lái)看,可將人臉識(shí)別技術(shù)劃分為人臉采集錄入、人臉關(guān)鍵點(diǎn)檢測(cè)、人臉配準(zhǔn)對(duì)齊、人臉特征提取、人臉特征比對(duì)。

人臉識(shí)別技術(shù)的應(yīng)用主要受到光照、拍攝角度、圖像遮擋、年齡等多個(gè)因素的影響,在約束條件下人臉識(shí)別技術(shù)相對(duì)成熟,在自由條件下人臉識(shí)別技術(shù)還在不斷改進(jìn)。人臉識(shí)別關(guān)鍵技術(shù)(1)人臉采集錄入(2)人臉關(guān)鍵點(diǎn)檢測(cè)(3)人臉配準(zhǔn)對(duì)齊(4)人臉特征提取人臉識(shí)別關(guān)鍵技術(shù)(5)人臉特征比對(duì)人臉識(shí)別應(yīng)用領(lǐng)域目錄6.2智能機(jī)器人產(chǎn)品智能機(jī)器人產(chǎn)品

智能機(jī)器人是一種自動(dòng)化的機(jī)器,所不同的是這種機(jī)器具備一些與人或生物相似的智能能力,如感知能力、規(guī)劃能力、動(dòng)作能力和協(xié)同能力,是一種具有高度靈活性的自動(dòng)化機(jī)器。

廣義上的機(jī)器人指自動(dòng)完成某種任務(wù)或功能的人造物,手表、電話、汽車、飛機(jī)。

狹義上的機(jī)器人是整合材料、機(jī)械、電子、控制、計(jì)算機(jī)與人工智能等技術(shù)的自動(dòng)機(jī)器。

所以,智能機(jī)器人也可以概括為:智能機(jī)器人=機(jī)械+人工智能機(jī)器人按照應(yīng)用可以劃分為三大領(lǐng)域:工業(yè)機(jī)器人、服務(wù)機(jī)器人(個(gè)人/家用、公共)和特種機(jī)器人。智能機(jī)器人產(chǎn)品工業(yè)機(jī)器人智能機(jī)器人產(chǎn)品服務(wù)機(jī)器人智能機(jī)器人產(chǎn)品特種機(jī)器人智能機(jī)器人產(chǎn)品智能機(jī)器人是人工智能技術(shù)的綜合試驗(yàn)場(chǎng),可以全面檢驗(yàn)考察人工智能各個(gè)研究領(lǐng)域的技術(shù)發(fā)展?fàn)顩r。智能機(jī)器人的內(nèi)涵和外延也會(huì)隨著技術(shù)的更新而發(fā)生變化。智能機(jī)器人主要技術(shù)智能感知系統(tǒng)感知系統(tǒng)構(gòu)成

智能機(jī)器人的感知系統(tǒng)相當(dāng)于人的五官和神經(jīng)系統(tǒng),是機(jī)器人獲取內(nèi)部狀態(tài)或外部環(huán)境信息,用于內(nèi)部反饋控制的工具。感知系統(tǒng)本質(zhì)是傳感器系統(tǒng),將機(jī)器人各種內(nèi)部狀態(tài)信息和外部環(huán)境信息,轉(zhuǎn)變?yōu)闄C(jī)器人自身或者機(jī)器人之間能夠理解和應(yīng)用的數(shù)據(jù)、信號(hào)甚至知識(shí)。智能機(jī)器人產(chǎn)品智能決策系統(tǒng)無(wú)人駕駛決策系統(tǒng)

智能決策相當(dāng)于人的大腦,通過(guò)對(duì)感知信息的分析和推理,規(guī)劃和確定機(jī)器人的任務(wù),而且應(yīng)該具有學(xué)習(xí)能力,能夠?qū)崿F(xiàn)姿態(tài)控制、路徑規(guī)劃、躲避障礙、力度控制、各種優(yōu)化與控制算法。智能機(jī)器人產(chǎn)品智能執(zhí)行系統(tǒng)智能執(zhí)行系統(tǒng)

智能執(zhí)行系統(tǒng)及機(jī)器人本體,其臂部一般采用空間開(kāi)鏈連桿機(jī)構(gòu),其中的運(yùn)動(dòng)副(轉(zhuǎn)動(dòng)副或移動(dòng)副)常稱為關(guān)節(jié),關(guān)節(jié)個(gè)數(shù)通常即為機(jī)器人的自由度數(shù)。

出于擬人化的考慮,常將機(jī)器人本體的有關(guān)部位分別稱為基座、腰部、臂部、腕部、手部(夾持器或末端執(zhí)行器)和行走部(對(duì)于移動(dòng)機(jī)器人)等。智能執(zhí)行系統(tǒng)一般分為兩部分:自身移動(dòng)或者變形;外部操作相應(yīng)的對(duì)象。智能機(jī)器人產(chǎn)品智能交互系統(tǒng)

智能交互系統(tǒng)主要實(shí)現(xiàn)人與機(jī)器人之間相互溝通、相互理解,可以分為:(1)直接交互:鍵盤、鼠標(biāo)、手機(jī)、有線遙控器、無(wú)線遙控器等。(2)自然交互:聲音、姿勢(shì)、肌電、意識(shí)等。(3)AR、VR、全息等。智能機(jī)器人產(chǎn)品

總體來(lái)說(shuō),“智能化”、“擬人化”將成為機(jī)器人產(chǎn)業(yè)未來(lái)的發(fā)展方向。智能機(jī)器人具有感知、思維的能力。智能機(jī)器人可獲取、處理并識(shí)別多種信息,自主地完成較為復(fù)雜的操作任務(wù)。相比一般的工業(yè)機(jī)器人,智能機(jī)器人具有更大的靈活性、機(jī)動(dòng)性和更廣泛的應(yīng)用領(lǐng)域。目錄6.3智能推薦類產(chǎn)品智能推薦類產(chǎn)品啤酒與紙尿褲的啟示

上世紀(jì)90年代,美國(guó)的沃爾瑪超市收銀員發(fā)現(xiàn)了一個(gè)奇怪的現(xiàn)象,結(jié)賬時(shí)乘客的購(gòu)物車?yán)铮【坪图埬蜓澘偸菙[在一起。收銀員把情況報(bào)告給了超市管理員,管理員也感到大惑不解,于是找到了學(xué)者艾格拉沃。

艾格拉沃經(jīng)過(guò)調(diào)查發(fā)現(xiàn),原因出自“奶爸”這一群體。首先,從時(shí)間上,周末比工作日購(gòu)買紙尿褲喝啤酒的頻率更多;其次,從年齡上看,這一群體的孩子不超過(guò)兩歲;再次,他們喜歡看體育節(jié)目,而且邊喝啤酒邊看;最后,美國(guó)的體育節(jié)目多在周末扎堆。所以,當(dāng)周末年輕的母親需要給孩子換紙尿褲時(shí),通常會(huì)讓正在看球的奶爸去買。奶爸出去買紙尿褲,會(huì)順便帶一件啤酒回來(lái)。發(fā)現(xiàn)這個(gè)秘密后,沃爾瑪大膽地把紙尿褲擺放在啤酒旁邊,方便奶爸們購(gòu)買。結(jié)果,二者的銷量雙雙上升。智能推薦類產(chǎn)品

推薦系統(tǒng)就是通過(guò)分析用戶的個(gè)人信息以及用戶的歷史行為數(shù)據(jù),從而給用戶推薦其可能感興趣的物品。智能推薦基本思想

推薦系統(tǒng)可以看成是搜索的排序系統(tǒng),或者是一個(gè)信息過(guò)濾系統(tǒng)。用戶通過(guò)信息輸入,推薦系統(tǒng)自動(dòng)返回一個(gè)結(jié)果序列。推薦系統(tǒng)具有以下兩個(gè)最顯著的特性:(1)主動(dòng)化。而推薦系統(tǒng)不需要用戶提供明確的需求,而是通過(guò)分析用戶和物品的數(shù)據(jù),對(duì)用戶和物品進(jìn)行建模,從而主動(dòng)為用戶推薦他們感興趣的信息。(2)個(gè)性化。推薦系統(tǒng)能夠更好地發(fā)掘長(zhǎng)尾信息,即將冷門物品推薦給對(duì)其感興趣的用戶。在電商平臺(tái)火熱的時(shí)代,由冷門物品帶來(lái)的營(yíng)業(yè)額甚至超過(guò)熱門物品,發(fā)掘長(zhǎng)尾信息是推薦系統(tǒng)的重要研究方向。智能推薦類產(chǎn)品

推薦系統(tǒng)的基本思想可概括為“物以類聚”、“人以群分”、“知你所想”。

“物以類聚”式的推薦思想,認(rèn)為用戶可能會(huì)喜歡與他之前曾經(jīng)喜歡的物品相似的物品。利用用戶曾經(jīng)喜歡過(guò)的物品信息(內(nèi)容信息、標(biāo)簽、關(guān)鍵字),給用戶推薦與他以前喜歡過(guò)的物品相似的其他物品。

“人以群分”式的推薦思想,利用用戶及其與之興趣愛(ài)好相似的其他用戶信息,給用戶推薦這些相似用戶喜歡的物品。

“知你所想”:利用用戶和物品的特征信息(用戶的基本信息及行為數(shù)據(jù),例如點(diǎn)擊、瀏覽、收藏、購(gòu)買、評(píng)論等),給用戶推薦那些具有用戶喜歡特征的物品。智能推薦基本思想智能推薦類產(chǎn)品智能推薦基本思想智能推薦類產(chǎn)品智能推薦系統(tǒng)流程

大數(shù)據(jù)時(shí)代,網(wǎng)絡(luò)上充斥著琳瑯滿目并且種類繁雜的商品、電影、歌曲、視頻等各種服務(wù),這就是人們常說(shuō)的信息過(guò)載。推薦系統(tǒng)被證明是一種解決“信息過(guò)載”和“長(zhǎng)尾物品”問(wèn)題的有效工具,基于知識(shí)發(fā)現(xiàn)的相關(guān)技術(shù)來(lái)解決人們選擇商品、信息或者服務(wù)問(wèn)題。推薦系統(tǒng)具體的工作流程包括:數(shù)據(jù)預(yù)處理、用戶行為建模、物品特征建模、生成推薦結(jié)果。智能推薦類產(chǎn)品智能推薦系統(tǒng)實(shí)例

海倫女士一直使用在線約會(huì)網(wǎng)站尋找適合自己的約會(huì)對(duì)象。盡管約會(huì)網(wǎng)站會(huì)向她推薦不同的人選,但她并不是喜歡每一個(gè)推薦對(duì)象。經(jīng)過(guò)一番總結(jié),她發(fā)現(xiàn)自己交往過(guò)的對(duì)象可以進(jìn)行如下分類:不喜歡型、有些喜歡型、非常喜歡型。

為了給她成功推薦約會(huì)對(duì)象,相親網(wǎng)站需要了解海倫女士對(duì)約會(huì)對(duì)象的偏好特征,約會(huì)網(wǎng)站收集了三個(gè)影響相親結(jié)果的特征:每年獲得的飛行常客里程數(shù)、玩視頻游戲所消耗時(shí)間百分比、每周消費(fèi)的冰淇淋公升數(shù)。接下來(lái),根據(jù)海倫曾經(jīng)的約會(huì)數(shù)據(jù)以及對(duì)約會(huì)對(duì)象的評(píng)價(jià)結(jié)果,相親網(wǎng)站對(duì)以上數(shù)據(jù)進(jìn)行分析。智能推薦類產(chǎn)品智能推薦系統(tǒng)實(shí)例每年獲得的飛行常客里程數(shù)與玩視頻游戲所消耗時(shí)間占比的關(guān)系圖每年獲得的飛行??屠锍虜?shù)與每周消費(fèi)的冰淇淋公升數(shù)的關(guān)系圖玩視頻游戲所消耗時(shí)間占比與每周消費(fèi)的冰淇淋公升數(shù)的關(guān)系圖智能推薦類產(chǎn)品智能推薦系統(tǒng)應(yīng)用領(lǐng)域

推薦系統(tǒng)本質(zhì)上可以說(shuō)是一個(gè)搜索排名系統(tǒng),或者是一個(gè)信息過(guò)濾系統(tǒng),旨在從紛繁復(fù)雜的數(shù)據(jù)中,找到于用戶個(gè)人有利的信息。總體來(lái)說(shuō),一個(gè)完整的推薦系統(tǒng)一般存在三個(gè)參與方:用戶、內(nèi)容提供者和提供推薦系統(tǒng)的網(wǎng)站。

首先,推薦系統(tǒng)要滿足用戶的需求,給用戶推薦那些讓他們感興趣的內(nèi)容;其次,推薦系統(tǒng)要讓內(nèi)容提供者的內(nèi)容能被推薦給對(duì)其感興趣的用戶;最后,好的推薦系統(tǒng)設(shè)計(jì),能夠讓推薦系統(tǒng)本身收獲到高質(zhì)量的用戶反饋,不斷提高推薦的質(zhì)量,提高推薦系統(tǒng)的效益。推薦系統(tǒng)是以提升用戶體驗(yàn)感和提高商業(yè)利潤(rùn)為目的技術(shù),它的應(yīng)用領(lǐng)域主要有:電子商務(wù)、電影和視頻網(wǎng)站、個(gè)性化音樂(lè)網(wǎng)絡(luò)電臺(tái)、社交網(wǎng)絡(luò)。目錄6.4智能語(yǔ)音類產(chǎn)品智能語(yǔ)音類產(chǎn)品

智能語(yǔ)音技術(shù)作為人工智能的關(guān)鍵技術(shù)之一,其目標(biāo)是是實(shí)現(xiàn)人機(jī)語(yǔ)言的通信,具體包括語(yǔ)音識(shí)別技術(shù)(ASR)和語(yǔ)音合成技術(shù)(TTS)。智能語(yǔ)音技術(shù)的研究是以語(yǔ)音識(shí)別技術(shù)為開(kāi)端,可以追溯到20世紀(jì)50年代。隨著信息技術(shù)的發(fā)展,智能語(yǔ)音技術(shù)已經(jīng)成為人們信息獲取和溝通最便捷、最有效的手段。智能語(yǔ)音助手作為智能語(yǔ)音技術(shù)的應(yīng)用落地產(chǎn)品,近年來(lái)備受用戶關(guān)注和喜愛(ài)。智能語(yǔ)音助手根據(jù)其依托的載體不同可分為手機(jī)智能語(yǔ)音助手、智能音箱等。知名的智能音箱有天貓精靈、小米AI音箱等,常見(jiàn)的手機(jī)智能語(yǔ)音助手有蘋果的Siri、華為的小藝和百度的小度等。智能語(yǔ)音助手通過(guò)提供智能化的語(yǔ)音識(shí)別技術(shù)來(lái)實(shí)現(xiàn)智能化操作,例如,熟知的語(yǔ)音助手像小米AI音箱不僅可以播放音樂(lè)、講故事、設(shè)置鬧鐘,還可以控制智能家居,為用戶提供更加全面的服務(wù)。智能語(yǔ)音類產(chǎn)品

智能語(yǔ)音技術(shù)作為人工智能的關(guān)鍵技術(shù)之一,其目標(biāo)是是實(shí)現(xiàn)人機(jī)語(yǔ)言的通信,具體包括語(yǔ)音識(shí)別技術(shù)(ASR)和語(yǔ)音合成技術(shù)(TTS)。智能語(yǔ)音技術(shù)的研究是以語(yǔ)音識(shí)別技術(shù)為開(kāi)端,可以追溯到20世紀(jì)50年代。隨著信息技術(shù)的發(fā)展,智能語(yǔ)音技術(shù)已經(jīng)成為人們信息獲取和溝通最便捷、最有效的手段。智能語(yǔ)音助手作為智能語(yǔ)音技術(shù)的應(yīng)用落地產(chǎn)品,近年來(lái)備受用戶關(guān)注和喜愛(ài)。智能語(yǔ)音助手根據(jù)其依托的載體不同可分為手機(jī)智能語(yǔ)音助手、智能音箱等。知名的智能音箱有天貓精靈、小米AI音箱等,常見(jiàn)的手機(jī)智能語(yǔ)音助手有蘋果的Siri、華為的小藝和百度的小度等。智能語(yǔ)音助手通過(guò)提供智能化的語(yǔ)音識(shí)別技術(shù)來(lái)實(shí)現(xiàn)智能化操作,例如,熟知的語(yǔ)音助手像小米AI音箱不僅可以播放音樂(lè)、講故事、設(shè)置鬧鐘,還可以控制智能家居,為用戶提供更加全面的服務(wù)。智能語(yǔ)音助手發(fā)展歷程智能語(yǔ)音類產(chǎn)品智能語(yǔ)音技術(shù)的研究可追溯到20世紀(jì)50年代,發(fā)展過(guò)程從未間斷,其代表性發(fā)展歷程可分為四個(gè)階段:萌芽期、突破期、產(chǎn)業(yè)化期以及快速應(yīng)用期。萌芽期:1952年,貝爾實(shí)驗(yàn)室(BellLabs)制造一臺(tái)6英尺高自動(dòng)數(shù)字識(shí)別機(jī)“Audrey”,它可以識(shí)別數(shù)字0~9的發(fā)音,且準(zhǔn)確度高達(dá)90%以上。突破期:1988年,卡耐基梅隆大學(xué)結(jié)合

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論