版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
語(yǔ)音識(shí)別與圖像識(shí)別認(rèn)知實(shí)習(xí)劉剛liugang@2023.91/16實(shí)習(xí)內(nèi)容基礎(chǔ)知識(shí)模式識(shí)別基本原理語(yǔ)音識(shí)別基本原理圖像識(shí)別基本原理系統(tǒng)演示2/16什么是模式識(shí)別模式(pattern)存在于時(shí)間,空間中可觀測(cè)事物,具有時(shí)間或空間分布信息。模式識(shí)別(PatternRecognition)指對(duì)表征事物或現(xiàn)象多種形式(數(shù)值、文字和邏輯關(guān)系)信息進(jìn)行處理和分析,以對(duì)事物或現(xiàn)象進(jìn)行描述、識(shí)別、分類和解釋過(guò)程,是信息科學(xué)和人工智能主要組成部分。模式識(shí)別是模擬人某些功能模擬人視覺(jué):計(jì)算機(jī)+光學(xué)系統(tǒng)--
圖像識(shí)別模擬人聽覺(jué):計(jì)算機(jī)+聲音傳感器---
語(yǔ)音識(shí)別模擬人嗅覺(jué)和觸覺(jué):計(jì)算機(jī)+傳感器3/16模式識(shí)別在智能信息處理中地位4/16模式識(shí)別在信息科學(xué)中地位信息獲取、信息傳遞、信息認(rèn)知、信息再生、信息思維、
信息傳遞、信息施效識(shí)別論、通信論、知識(shí)論、決策論、智能論、通信論、控制論5/16模式識(shí)別原理框圖6/16語(yǔ)音識(shí)別基本原理什么是語(yǔ)音識(shí)別語(yǔ)音識(shí)別是研究如何采取數(shù)字信號(hào)處理技術(shù)自動(dòng)提取以及決定語(yǔ)音信號(hào)中最基本、最故意義信息一門新興邊緣學(xué)科。分類語(yǔ)音識(shí)別(內(nèi)容)說(shuō)話人識(shí)別語(yǔ)種識(shí)別性別識(shí)別情緒識(shí)別7/16語(yǔ)音識(shí)別應(yīng)用領(lǐng)域桌面系統(tǒng)更多是理論研究,應(yīng)用不多,基礎(chǔ),主要,搜索嵌入式系統(tǒng)智能終端,軟硬件實(shí)現(xiàn),分布式電話系統(tǒng)最大應(yīng)用領(lǐng)域(信息服務(wù))人機(jī)交互8/16語(yǔ)音合成(TTS)基本原理什么是TTSTextToSpeech框圖評(píng)價(jià)指標(biāo)可懂度、自然度TTS應(yīng)用9/16CTI基本原理什么是CTI計(jì)算機(jī)電話集成(ComputerTelephonyIntegration),將計(jì)算機(jī)技術(shù)應(yīng)用到電話系統(tǒng)中,能夠自動(dòng)地對(duì)電話中信令信息進(jìn)行識(shí)別處理,并通過(guò)建立有關(guān)話路連接,而向顧客傳送預(yù)定錄音文獻(xiàn)、轉(zhuǎn)接來(lái)話等。計(jì)算機(jī)電信集成(ComputerTelecommunicationIntegration),不但要處理傳統(tǒng)電話語(yǔ)音,并且要處理包括傳真、電子郵件等形式信息媒體應(yīng)用目前提供某些典型業(yè)務(wù)主要有基于顧客設(shè)備(CPE)消息系統(tǒng)、交互語(yǔ)音應(yīng)答、呼叫中心系統(tǒng)、增值業(yè)務(wù)、IP電話等。10/16在CTI中應(yīng)用NECAspilaEX電話交換機(jī)三匯STH-8電話語(yǔ)音卡11/16語(yǔ)音門戶12/16圖像識(shí)別之人臉識(shí)別文字識(shí)別、指紋識(shí)別、虹膜識(shí)別、掌紋識(shí)別、人臉識(shí)別、車牌識(shí)別……人臉識(shí)別是指通過(guò)人臉進(jìn)行身份確認(rèn)或者身份查找技術(shù)或系統(tǒng)人臉圖像采集人臉定位人臉識(shí)別預(yù)處理身份確認(rèn)以及身份查找等;13/16人臉識(shí)別應(yīng)用公安刑偵破案通過(guò)查詢目標(biāo)人像數(shù)據(jù)尋找數(shù)據(jù)庫(kù)中是否存在重點(diǎn)人口基本信息。例如在機(jī)場(chǎng)或車站安裝系統(tǒng)以抓捕在逃案犯。門禁系統(tǒng)受安全保護(hù)地域能夠通過(guò)人臉識(shí)別辨識(shí)試圖進(jìn)入者身份。攝像監(jiān)視系統(tǒng)在例如機(jī)場(chǎng)、體育場(chǎng)、超級(jí)市場(chǎng)等公共場(chǎng)所對(duì)人群進(jìn)行監(jiān)視,以達(dá)成身份識(shí)別目標(biāo)。網(wǎng)絡(luò)應(yīng)用利用人臉識(shí)別輔助信用卡網(wǎng)絡(luò)支付,以避免非信用卡擁有者使用信用卡等。14/16演示系統(tǒng)(1)關(guān)鍵詞識(shí)別系統(tǒng)計(jì)算機(jī)聲控系統(tǒng)語(yǔ)音檢索系統(tǒng)廣播新聞?wù)Z音檢索demo音頻樣例
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2031年中國(guó)濃硫酸貯罐行業(yè)投資前景及策略咨詢研究報(bào)告
- 2025至2031年中國(guó)果味粉行業(yè)投資前景及策略咨詢研究報(bào)告
- 2025至2031年中國(guó)微波水分測(cè)定儀行業(yè)投資前景及策略咨詢研究報(bào)告
- 2025至2031年中國(guó)多功能同步呼吸機(jī)行業(yè)投資前景及策略咨詢研究報(bào)告
- 微納加工技術(shù)-第1篇-深度研究
- 2025年度診所護(hù)士特殊技能聘用合同模板
- 二零二五年度紙箱加工環(huán)保認(rèn)證與品牌推廣合同
- 2025年度營(yíng)業(yè)執(zhí)照轉(zhuǎn)讓及行業(yè)資質(zhì)許可合同
- 二零二五年度診所醫(yī)師聘用合同(含健康保險(xiǎn)合作)
- 二零二五年度人工智能領(lǐng)域?qū)<移赣脛趧?dòng)合同
- 小升初卷(試題)-2023-2024學(xué)年六年級(jí)下冊(cè)數(shù)學(xué)人教版
- GB/T 40565.1-2024液壓傳動(dòng)連接快換接頭第1部分:通用型
- 《教科版》二年級(jí)科學(xué)下冊(cè)全冊(cè)課件(完整版)
- (2024年)《處方管理辦法》培訓(xùn)課件
- 人工智能在化工生產(chǎn)安全中的應(yīng)用
- 2023年6月浙江高考政治試卷真題解讀及答案解析(課件)
- 銷售部廉政培訓(xùn)課件
- 三年級(jí)計(jì)算題三位數(shù)乘一位數(shù)練習(xí)300題帶答案
- 商務(wù)服務(wù)業(yè)的市場(chǎng)細(xì)分和定位策略
- 財(cái)政學(xué)論文我國(guó)財(cái)政支出存在的問(wèn)題及改革建議
- 2022年湖南高速鐵路職業(yè)技術(shù)學(xué)院?jiǎn)握袛?shù)學(xué)模擬試題及答案解析
評(píng)論
0/150
提交評(píng)論