人工智能地核心技術_第1頁
人工智能地核心技術_第2頁
人工智能地核心技術_第3頁
已閱讀5頁,還剩3頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、人工智能的核心技術是什么?人工智能標準化白皮書( 2018)1 機器學習機器學習( Machine Learning )是一門涉及統(tǒng)計學、系統(tǒng)辨識、逼近理論、神經網絡、優(yōu)化理論、計算機科學、腦科學等諸多領域的交叉學科,研究計算機 怎樣模擬或實現(xiàn)人類的學 習行為,以獲取新的知識或技能,重新組織已有的知識 結構使之不斷改善自身的性能,是 人工智能技術的核心。基于數(shù)據(jù)的機器學習是 現(xiàn)代智能技術中的重要方法之一,研究從觀 測數(shù)據(jù)(樣本)出發(fā)尋找規(guī)律,利用 這些規(guī)律對未來數(shù)據(jù)或無法觀測的數(shù)據(jù)進行預測。根 據(jù)學習模式、學習方法以及 算法的不同,機器學習存在不同的分類方法。(1)根據(jù)學習模式將機器學習分類為

2、監(jiān)督學習、無監(jiān)督學習和強化學習等。監(jiān)督學習監(jiān)督學習是利用已標記的有限訓練數(shù)據(jù)集,通過某種學習策略/方法建立一 個模型,實現(xiàn)對新數(shù)據(jù) /實例的標記(分類) /映射,最典型的監(jiān)督學習算法包括 回歸和分類。監(jiān)督學習要求 訓練樣本的分類標簽已知,分類標簽精確度越高,樣 本越具有代表性,學習模型的準確度 越高。監(jiān)督學習在自然語言處理、信息檢索、 文本挖掘、手寫體辨識、垃圾偵測等領域獲 得了廣泛應用。無監(jiān)督學習無監(jiān)督學習是利用無標記的有限數(shù)據(jù)描述隱藏在未標記數(shù)據(jù)中的結構 /規(guī)律, 最典型的非監(jiān) 督學習算法包括單類密度估計、單類數(shù)據(jù)降維、聚類等。無監(jiān)督學 習不需要訓練樣本和人 工標注數(shù)據(jù),便于壓縮數(shù)據(jù)存儲、

3、減少計算量、提升算法 速度,還可以避免正、負樣本偏 移引起的分類錯誤問題。主要用于經濟預測、異 常檢測、數(shù)據(jù)挖掘、圖像處理、模式識別 等領域,例如組織大型計算機集群、社 交網絡分析、市場分割、天文數(shù)據(jù)分析等。強化學習強化學習是智能系統(tǒng)從環(huán)境到行為映射的學習,以使強化信號函數(shù)值最大。 由于外部環(huán)境 提供的信息很少,強化學習系統(tǒng)必須靠自身的經歷進行學習。強化 學習的目標是學習從環(huán) 境狀態(tài)到行為的映射,使得智能體選擇的行為能夠獲得環(huán) 境最大的獎賞,使得外部環(huán)境對 學習系統(tǒng)在某種意義下的評價為最佳。其在機器 人控制、無人駕駛、下棋、工業(yè)控制等領 域獲得成功應用。(2)根據(jù)學習方法可以將機器學習分為傳統(tǒng)

4、機器學習和深度學習。傳統(tǒng)機器學習傳統(tǒng)機器學習從一些觀測(訓練)樣本出發(fā),試圖發(fā)現(xiàn)不能通過原理分析獲 得的規(guī)律,實 現(xiàn)對未來數(shù)據(jù)行為或趨勢的準確預測。相關算法包括邏輯回歸、隱 馬爾科夫方法、支持向 量機方法、 K 近鄰方法、三層人工神經網絡方法、 Adaboost 算法、貝葉斯方法以及決策樹 方法等。傳統(tǒng)機器學習平衡了學習結果的有效性與 學習模型的可解釋性,為解決有限樣本 的學習問題提供了一種框架,主要用于有 限樣本情況下的模式分類、回歸分析、概率密度 估計等。傳統(tǒng)機器學習方法共同 的重要理論基礎之一是統(tǒng)計學,在自然語言處理、語音識 別、圖像識別、信息檢 索和生物信息等許多計算機領域獲得了廣泛應

5、用。深度學習 深度學習是建立深層結構模型的學習方法,典型的深度學習算法包括深度置 信網絡、卷積 神經網絡、受限玻爾茲曼機和循環(huán)神經網絡等。深度學習又稱為深 度神經網絡(指層數(shù)超 過 3 層的神經網絡) 。深度學習作為機器學習研究中的一 個新興領域,由 Hinton 等人于 2006 年提出。 深度學習源于多層神經網絡, 其實 質是給出了一種將特征表示和學習合二為 一的方式。深度學習的特點是放棄了可 解釋性,單純追求學習的有效性。經過多年的摸索 嘗試和研究,已經產生了諸多 深度神經網絡的模型,其中卷積神經網絡、循環(huán)神經網絡是 兩類典型的模型。卷 積神經網絡常被應用于空間性分布數(shù)據(jù);循環(huán)神經網絡在

6、神經網絡中 引入了記憶 和反饋,常被應用于時間性分布數(shù)據(jù)。深度學習框架是進行深度學習的基礎底 層 框架,一般包含主流的神經網絡算法模型,提供穩(wěn)定的深度學習API ,支持訓練 模型在服務器和 GPU 、TPU 間的分布式學習,部分框架還具備在包括移動設備、云平臺在的多種 平臺上運行的移植能力,從而為深度學習算法帶來前所未有的 運行速度和實用性。目前主 流的開源算法框架有 TensorFlow 、 Caffe/Caffe2 、 CNTK 、 MXNet 、 Paddle-paddle 、 Torch/PyTorch 、Theano 等。(3)此外,機器學習的常見算法還包括遷移學習、主動學習和演化學

7、習等。遷移學習 遷移學習是指當在某些領域無法取得足夠多的數(shù)據(jù)進行模型訓練時,利用另 一領域數(shù)據(jù)獲 得的關系進行的學習。遷移學習可以把已訓練好的模型參數(shù)遷移到 新的模型指導新模型訓 練,可以更有效的學習底層規(guī)則、減少數(shù)據(jù)量。目前的遷 移學習技術主要在變量有限的小 規(guī)模應用中使用,如基于傳感器網絡的定位,文 字分類和圖像分類等。未來遷移學習將被 廣泛應用于解決更有挑戰(zhàn)性的問題,如 視頻分類、社交網絡分析、邏輯推理等。主動學習主動學習通過一定的算法查詢最有用的未標記樣本,并交由專家進行標記, 然后用查詢到 的樣本訓練分類模型來提高模型的精度。主動學習能夠選擇性地獲 取知識,通過較少的訓 練樣本獲得高

8、性能的模型,最常用的策略是通過不確定性 準則和差異性準則選取有效的樣 本。演化學習 演化學習對優(yōu)化問題性質要求極少,只需能夠評估解的好壞即可,適用于求 解復雜的優(yōu)化 問題,也能直接用于多目標優(yōu)化。演化算法包括粒子群優(yōu)化算法、 多目標演化算法等。目 前針對演化學習的研究主要集中在演化數(shù)據(jù)聚類、對演化 數(shù)據(jù)更有效的分類,以及提供某種自適應機制以確定演化機制的影響等。2 知識圖譜知識圖譜本質上是結構化的語義知識庫,是一種由節(jié)點和邊組成的圖數(shù)據(jù)結 構,以符號形 式描述物理世界中的概念及其相互關系, 其基本組成單位是 “實體 關系實體” 三元組, 以及實體及其相關“屬性值”對。不同實體之間通過 關系相互

9、聯(lián)結,構成網狀的知識結 構。在知識圖譜中, 每個節(jié)點表示現(xiàn)實世界的 “ 實體”,每條邊為實體與實體之間的 “關系”。 通俗地講, 知識圖譜就是把所有不同種類的信息連接在一起而得到的一個關系網絡, 提供了 從“關系”的角度 去分析問題的能力。知識圖譜可用于反欺詐、不一致性驗證、組團欺詐等公共安全保障領域,需 要用到異常分 析、靜態(tài)分析、動態(tài)分析等數(shù)據(jù)挖掘方法。特別地,知識圖譜在搜 索引擎、可視化展示和 精準營銷方面有很大的優(yōu)勢,已成為業(yè)界的熱門工具。但 是,知識圖譜的發(fā)展還有很大的 挑戰(zhàn),如數(shù)據(jù)的噪聲問題,即數(shù)據(jù)本身有錯誤或 者數(shù)據(jù)存在冗余。隨著知識圖譜應用的不 斷深入,還有一系列關鍵技術需要突

10、破。3 自然語言處理自然語言處理是計算機科學領域與人工智能領域中的一個重要方向,研究能 實現(xiàn)人與計算 機之間用自然語言進行有效通信的各種理論和方法, 涉及的領域較 多,主要包括機器翻譯、 機器閱讀理解和問答系統(tǒng)等。(1)機器翻譯機器翻譯技術是指利用計算機技術實現(xiàn)從一種自然語言到另外一種自然語 言的翻譯過程。 基于統(tǒng)計的機器翻譯方法突破了之前基于規(guī)則和實例翻譯方法的 局限性,翻譯性能取得巨 大提升?;谏疃壬窠浘W絡的機器翻譯在日??谡Z等一 些場景的成功應用已經顯現(xiàn)出了巨 大的潛力。隨著上下文的語境表征和知識邏輯 推理能力的發(fā)展,自然語言知識圖譜不斷擴 充,機器翻譯將會在多輪對話翻譯及 篇章翻譯等

11、領域取得更大進展。目前非限定領域機器翻譯中性能較佳的一種是統(tǒng)計機器翻譯,包括訓練及解 碼兩個階段。 訓練階段的目標是獲得模型參數(shù), 解碼階段的目標是利用所估計的 參數(shù)和給定的優(yōu)化目標, 獲取待翻譯語句的最佳翻譯結果。 統(tǒng)計機器翻譯主要包 括語料預處理、 詞對齊、 短語抽取、 短語概率計算、最大熵調序等步驟?;谏?經網絡的端到端翻譯方法不需要針對雙語句子 專門設計特征模型,而是直接把源 語言句子的詞串送入神經網絡模型,經過神經網絡的運 算,得到目標語言句子的 翻譯結果。在基于端到端的機器翻譯系統(tǒng)中,通常采用遞歸神經 網絡或卷積神經 網絡對句子進行表征建模,從海量訓練數(shù)據(jù)中抽取語義信息,與基于短

12、語 的統(tǒng)計 翻譯相比,其翻譯結果更加流暢自然,在實際應用中取得了較好的效果。(2)語義理解語義理解技術是指利用計算機技術實現(xiàn)對文本篇章的理解,并且回答與篇章 相關問題的過 程。語義理解更注重于對上下文的理解以及對答案精準程度的把控。 隨著 MCTest 數(shù)據(jù)集 的發(fā)布,語義理解受到更多關注,取得了快速發(fā)展,相關數(shù) 據(jù)集和對應的神經網絡模型層 出不窮。語義理解技術將在智能客服、產品自動問 答等相關領域發(fā)揮重要作用,進一步提 高問答與對話系統(tǒng)的精度。在數(shù)據(jù)采集方面,語義理解通過自動構造數(shù)據(jù)方法和自動構造填空型問題的 方法來有效擴 充數(shù)據(jù)資源。為了解決填充型問題,一些基于深度學習的方法相繼 提出,如

13、基于注意力的 神經網絡方法。當前主流的模型是利用神經網絡技術對篇 章、問題建模,對答案的開始和 終止位置進行預測,抽取出篇章片段。對于進一 步泛化的答案,處理難度進一步提升,目 前的語義理解技術仍有較大的提升空間。(3)問答系統(tǒng)問答系統(tǒng)分為開放領域的對話系統(tǒng)和特定領域的問答系統(tǒng)。問答系統(tǒng)技術是 指讓計算機像 人類一樣用自然語言與人交流的技術。人們可以向問答系統(tǒng)提交用 自然語言表達的問題, 系統(tǒng)會返回關聯(lián)性較高的答案。盡管問答系統(tǒng)目前已經有 了不少應用產品出現(xiàn),但大多是 在實際信息服務系統(tǒng)和智能手機助手等領域中的 應用,在問答系統(tǒng)魯棒性方面仍然存在著 問題和挑戰(zhàn)。自然語言處理面臨四大挑戰(zhàn):一是在

14、詞法、句法、語義、語用和語音等不同 層面存在不確 定性;二是新的詞匯、術語、語義和語法導致未知語言現(xiàn)象的不可 預測性;三是數(shù)據(jù)資源 的不充分使其難以覆蓋復雜的語言現(xiàn)象;四是語義知識的 模糊性和錯綜復雜的關聯(lián)性難以 用簡單的數(shù)學模型描述,語義計算需要參數(shù)龐大 的非線性計算。4 人機交互人機交互主要研究人和計算機之間的信息交換,主要包括人到計算機和計算 機到人的兩部 分信息交換,是人工智能領域的重要的外圍技術。人機交互是與認知心理學、人機工程學、 多媒體技術、 虛擬現(xiàn)實技術等密切相關的綜合學科。 傳統(tǒng)的人與計算機之間的信息交換主要 依靠交互設備進行, 主要包括鍵盤、 鼠標、 操縱桿、 數(shù)據(jù)服裝、

15、眼動跟蹤器、 位置跟蹤器、 數(shù)據(jù)手套、壓力筆等輸入設備,以及打印機、繪圖儀、顯示器、頭盔式顯示器、音箱等輸出 設備。人機交互技術 除了傳統(tǒng)的基本交互和圖形交互外,還包括語音交互、情感交互、體 感交互及腦 機交互等技術,以下對后四種與人工智能關聯(lián)密切的典型交互手段進行介紹。(1)語音交互語音交互是一種高效的交互方式,是人以自然語音或機器合成語音同計算機 進行交互的綜 合性技術,結合了語言學、心理學、工程和計算機技術等領域的知 識。語音交互不僅要對 語音識別和語音合成進行研究, 還要對人在語音通道下的 交互機理、 行為方式等進行研究。 語音交互過程包括四部分:語音采集、語音識 別、語義理解和語音合

16、成。語音采集完成音 頻的錄入、采樣及編碼;語音識別完 成語音信息到機器可識別的文本信息的轉化;語義理 解根據(jù)語音識別轉換后的文 本字符或命令完成相應的操作;語音合成完成文本信息到聲音 信息的轉換。作為 人類溝通和獲取信息最自然便捷的手段,語音交互比其他交互方式具備 更多優(yōu)勢, 能為人機交互帶來根本性變革,是大數(shù)據(jù)和認知計算時代未來發(fā)展的制高點, 具 有廣闊的發(fā)展前景和應用前景。(2)情感交互情感是一種高層次的信息傳遞,而情感交互是一種交互狀態(tài),它在表達功能 和信息時傳遞 情感,勾起人們的記憶或心的情愫。傳統(tǒng)的人機交互無法理解和 適應人的情緒或心境,缺 乏情感理解和表達能力,計算機難以具有類似人

17、一樣的 智能,也難以通過人機交互做到真 正的和諧與自然。情感交互就是要賦予計算機 類似于人一樣的觀察、理解和生成各種情感 的能力,最終使計算機像人一樣能進 行自然、親切和生動的交互。情感交互已經成為人工 智能領域中的熱點方向,旨 在讓人機交互變得更加自然。目前,在情感交互信息的處理方 式、情感描述方式、 情感數(shù)據(jù)獲取和處理過程、情感表達方式等方面還有諸多技術挑戰(zhàn)。(3)體感交互體感交互是個體不需要借助任何復雜的控制系統(tǒng),以體感技術為基礎,直接 通過肢體動作 與周邊數(shù)字設備裝置和環(huán)境進行自然的交互。依照體感方式與原理 的不同,體感技術主要 分為三類: 慣性感測、 光學感測以及光學聯(lián)合感測。 體感

18、 交互通常由運動追蹤、 手勢識別、 運動捕捉、 面部表情識別等一系列技術支撐。 與其他交互手段相比, 體感交互技術無論是硬 件還是軟件方面都有了較大的提升, 交互設備向小型化、 便攜化、 使用方便化等方面發(fā)展, 大大降低了對用戶的約束, 使得交互過程更加自然。目前,體感交互在游戲娛樂、醫(yī)療輔 助與康復、全自動 三維建模、輔助購物、眼動儀等領域有了較為廣泛的應用。(4)腦機交互腦機交互又稱為腦機接口,指不依賴于外圍神經和肌肉等神經通道,直接實 現(xiàn)大腦與外界 信息傳遞的通路。腦機接口系統(tǒng)檢測中樞神經系統(tǒng)活動,并將其轉 化為人工輸出指令,能 夠替代、修復、增強、補充或者改善中樞神經系統(tǒng)的正常 輸出,

19、從而改變中樞神經系統(tǒng)與 外環(huán)境之間的交互作用。腦機交互通過對神經 信號解碼,實現(xiàn)腦信號到機器指令的轉化, 一般包括信號采集、特征提取和命令 輸出三個模塊。從腦電信號采集的角度,一般將腦機 接口分為侵入式和非侵入式 兩大類。除此之外,腦機接口還有其他常見的分類方式:按照 信號傳輸方向可以 分為腦到機、機到腦和腦機雙向接口;按照信號生成的類型,可分為自 發(fā)式腦機 接口和誘發(fā)式腦機接口;按照信號源的不同還可分為基于腦電的腦機接口、基于 功能性核磁共振的腦機接口以及基于近紅外光譜分析的腦機接口。5 計算機視覺計算機視覺是使用計算機模仿人類視覺系統(tǒng)的科學,讓計算機擁有類似人類 提取、處理、 理解和分析圖

20、像以及圖像序列的能力。自動駕駛、機器人、智能醫(yī) 療等領域均需要通過計 算機視覺技術從視覺信號中提取并處理信息。近來隨著深 度學習的發(fā)展,預處理、特征提 取與算法處理漸漸融合,形成端到端的人工智能 算法技術。根據(jù)解決的問題,計算機視覺 可分為計算成像學、圖像理解、三維視 覺、動態(tài)視覺和視頻編解碼五大類。(1)計算成像學計算成像學是探索人眼結構、 相機成像原理以及其延伸應用的科學。 在相機 成像原理方面, 計算成像學不斷促進現(xiàn)有可見光相機的完善,使得現(xiàn)代相機更加 輕便,可以適用于不同場 景。同時計算成像學也推動著新型相機的產生,使相機 超出可見光的限制。在相機應用科 學方面,計算成像學可以提升相機

21、的能力,從 而通過后續(xù)的算法處理使得在受限條件下拍 攝的圖像更加完善,例如圖像去噪、去模糊、暗光增強、去霧霾等,以及實現(xiàn)新的功能,例 如全景圖、軟件虛化、超 分辨率等。(2)圖像理解圖像理解是通過用計算機系統(tǒng)解釋圖像, 實現(xiàn)類似人類視覺系統(tǒng)理解外部世 界的一門科學。 通常根據(jù)理解信息的抽象程度可分為三個層次:淺層理解,包括 圖像邊緣、圖像特征點、 紋理元素等;中層理解,包括物體邊界、區(qū)域與平面等; 高層理解,根據(jù)需要抽取的高層 語義信息,可大致分為識別、檢測、分割、姿態(tài) 估計、圖像文字說明等。目前高層圖像理 解算法已逐漸廣泛應用于人工智能系統(tǒng), 如刷臉支付、智慧安防、圖像搜索等。(3)三維視覺

22、三維視覺即研究如何通過視覺獲取三維信息(三維重建)以及如何理解所獲 取的三維信息 的科學。三維重建可以根據(jù)重建的信息來源,分為單目圖像重建、 多目圖像重建和深度圖 像重建等。三維信息理解,即使用三維信息輔助圖像理解 或者直接理解三維信息。三維信 息理解可分為,淺層:角點、邊緣、法向量等; 中層:平面、立方體等;高層:物體檢測、 識別、分割等。三維視覺技術可以廣 泛應用于機器人、無人駕駛、智慧工廠、虛擬/增強現(xiàn)實等方向。(4)動態(tài)視覺動態(tài)視覺即分析視頻或圖像序列,模擬人處理時序圖像的科學。通常動態(tài)視 覺問題可以定 義為尋找圖像元素,如像素、區(qū)域、物體在時序上的對應,以及提 取其語義信息的問題。

23、動態(tài)視覺研究被廣泛應用在視頻分析以及人機交互等方面。(5)視頻編解碼視頻編解碼是指通過特定的壓縮技術,將視頻流進行壓縮。視頻流傳輸中最 為重要的編解 碼標準有國際電聯(lián)的 H.261 、H.263、H.264、H.265 、M-JPEG 和 MPEG 系列標準。視頻壓 縮編碼主要分為兩大類: 無損壓縮和有損壓縮。 無損壓 縮指使用壓縮后的數(shù)據(jù)進行重構時, 重構后的數(shù)據(jù)與原來的數(shù)據(jù)完全相同, 例如 磁盤文件的壓縮。 有損壓縮也稱為不可逆編碼, 指使用壓縮后的數(shù)據(jù)進行重構時, 重構后的數(shù)據(jù)與原來的數(shù)據(jù)有差異,但不會影響人們對 原始資料所表達的信息產 生誤解。有損壓縮的應用圍廣泛,例如視頻會議、可視、

24、視頻廣 播、視頻監(jiān)控等。目前,計算機視覺技術發(fā)展迅速,已具備初步的產業(yè)規(guī)模。未來計算機視覺 技術的發(fā)展主 要面臨以下挑戰(zhàn):一是如何在不同的應用領域和其他技術更好的結 合,計算機視覺在解決 某些問題時可以廣泛利用大數(shù)據(jù),已經逐漸成熟并且可以 超過人類,而在某些問題上卻無 法達到很高的精度;二是如何降低計算機視覺算 法的開發(fā)時間和人力成本,目前計算機視 覺算法需要大量的數(shù)據(jù)與人工標注,需 要較長的研發(fā)周期以達到應用領域所要求的精度與耗時;三是如何加快新型算法 的設計開發(fā),隨著新的成像硬件與人工智能芯片的出現(xiàn),針 對不同芯片與數(shù)據(jù)采 集設備的計算機視覺算法的設計與開發(fā)也是挑戰(zhàn)之一。6 生物特征識別生

25、物特征識別技術是指通過個體生理特征或行為特征對個體身份進行識別 認證的技術。從 應用流程看,生物特征識別通常分為注冊和識別兩個階段。注冊 階段通過傳感器對人體的 生物表征信息進行采集,如利用圖像傳感器對指紋和人 臉等光學信息、麥克風對說話聲等 聲學信息進行采集,利用數(shù)據(jù)預處理以及特征 提取技術對采集的數(shù)據(jù)進行處理,得到相應 的特征進行存儲。 識別過程采用與注 冊過程一致的信息采集方式對待識別人進行信息采集、 數(shù)據(jù)預處理和特征提取, 然后將提取的特征與存儲的特征進行比對分析,完成識別。從應 用任務看,生物 特征識別一般分為辨認與確認兩種任務,辨認是指從存儲庫中確定待識別 人身份 的過程, 是一對

26、多的問題; 確認是指將待識別人信息與存儲庫中特定單人信息進 行 比對,確定身份的過程,是一對一的問題。生物特征識別技術涉及的容十分廣泛,包括指紋、掌紋、人臉、虹膜、指 靜脈、聲紋、步 態(tài)等多種生物特征,其識別過程涉及到圖像處理、計算機視覺、 語音識別、機器學習等多 項技術。目前生物特征識別作為重要的智能化身份認證 技術,在金融、公共安全、教育、 交通等領域得到廣泛的應用。下面將對指紋識 別、人臉識別、虹膜識別、指靜脈識別、聲 紋識別以及步態(tài)識別等技術進行介紹。(1)指紋識別 指紋識別過程通常包括數(shù)據(jù)采集、數(shù)據(jù)處理、分析判別三個過程。數(shù)據(jù)采集 通過光、電、力、熱等物理傳感器獲取指紋圖像;數(shù)據(jù)處理

27、包括預處理、畸變校正、特征提 取三個過程;分析判別是對提取的特征進行分析判別的過程。(2)人臉識別 人臉識別是典型的計算機視覺應用,從應用過程來看,可將人臉識別技術劃 分為檢測定位、 面部特征提取以及人臉確認三個過程。 人臉識別技術的應用主要 受到光照、 拍攝角度、圖像遮擋、年齡等多個因素的影響,在約束條件下人臉識 別技術相對成熟,在 自由條件下人臉識別技術還在不斷改進。(3)虹膜識別 虹膜識別的理論框架主要包括虹膜圖像分割、虹膜區(qū)域歸一化、特征提取和識別四個部分,研究工作大多是基于此理論框架發(fā)展而來。虹膜識別技術應用的 主要難題 包含傳感器和光照影響兩個方面:一方面,由于虹膜尺寸小且受黑色素

28、 遮擋,需在近紅外 光源下采用高分辨圖像傳感器才可清晰成像,對傳感器質量和 穩(wěn)定性要求比較高;另一方 面,光照的強弱變化會引起瞳孔縮放,導致虹膜紋理 產生復雜形變,增加了匹配的難度。(4)指靜脈識別 指靜脈識別是利用了人體靜脈血管中的脫氧血紅蛋白對特定波長圍的 近 紅外線有很好的吸收作用這一特性,采用近紅外光對指靜脈進行成像與識別的 技術。由于 指靜脈血管分布隨機性很強,其網絡特征具有很好的唯一性,且屬于 人體部特征,不受到 外界影響, 因此模態(tài)特性十分穩(wěn)定。 指靜脈識別技術應用 面臨的主要難題來自于成像單元。(5)聲紋識別 聲紋識別是指根據(jù)待識別語音的聲紋特征識別說話人的技術。 聲紋識別技術 通??梢苑譃榍岸颂幚砗徒7?/p>

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論