語(yǔ)音識(shí)別技術(shù).doc_第1頁(yè)
語(yǔ)音識(shí)別技術(shù).doc_第2頁(yè)
語(yǔ)音識(shí)別技術(shù).doc_第3頁(yè)
語(yǔ)音識(shí)別技術(shù).doc_第4頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

目前主流的語(yǔ)音識(shí)別技術(shù)是基于統(tǒng)計(jì)模式識(shí)別的基本理論。一個(gè)完整的語(yǔ)音識(shí)別系統(tǒng)可大致分為三部分: (1)語(yǔ)音特征提?。?(2)聲學(xué)模型與模式匹配(識(shí)別算法)(3)語(yǔ)義理解:計(jì)算機(jī)對(duì)識(shí)別結(jié)果進(jìn)行語(yǔ)法、語(yǔ)義分析。語(yǔ)音識(shí)別技術(shù),也被稱為自動(dòng)語(yǔ)音識(shí)別Automatic Speech Recognition,(ASR),語(yǔ)音識(shí)別的發(fā)展簡(jiǎn)史1952年AT& T Bell實(shí)驗(yàn)室實(shí)現(xiàn)了一個(gè)單一發(fā)音人孤立發(fā)音的十個(gè)英文數(shù)字的語(yǔ)音識(shí)別系統(tǒng),到現(xiàn)在的人機(jī)語(yǔ)音交互。語(yǔ)音識(shí)別研究從二十世紀(jì)50年代開(kāi)始到現(xiàn)在歷半個(gè)多世紀(jì)的蓬勃發(fā)展,在這期間獲得了巨大的進(jìn)展?,F(xiàn)代語(yǔ)音識(shí)別技術(shù)研究重點(diǎn)包括即興口語(yǔ)的識(shí)別和理解,自然口語(yǔ)對(duì)話,以及多語(yǔ)種的語(yǔ)音同聲翻譯。語(yǔ)音識(shí)別應(yīng)用的特點(diǎn)1.語(yǔ)音識(shí)別系統(tǒng)必須覆蓋的功能包括:(1)語(yǔ)音識(shí)別系統(tǒng)要對(duì)用戶有益(希望它是能檢測(cè)到的)。例如提高生產(chǎn)率,容易使用,更好的人機(jī)界面,或更自然的信息交流模式。(2)語(yǔ)音識(shí)別系統(tǒng)要對(duì)用戶“友好”。 這種“友好”的含義是:用戶在和系統(tǒng)進(jìn)行語(yǔ)音對(duì)話時(shí)感到舒適;系統(tǒng)的語(yǔ)音提示既有幫助,又很親近。(3)語(yǔ)音識(shí)別系統(tǒng)必須有足夠的精度(4)語(yǔ)音識(shí)別系統(tǒng)要有實(shí)時(shí)處理能力;例如 系統(tǒng)對(duì)用戶詢問(wèn)的響應(yīng)時(shí)間要很短。2. 語(yǔ)音識(shí)別錯(cuò)誤的處理有以下四種方式可以處理這個(gè)問(wèn)題。(1)錯(cuò)誤弱化法。 這種處理僅僅花費(fèi)用戶很少一點(diǎn)時(shí)間,對(duì)用戶幾乎沒(méi)什么其它不利影響。(2)錯(cuò)誤自檢糾正法系統(tǒng)利用已知任務(wù)的限制自動(dòng)地檢測(cè)并糾正錯(cuò)誤。(3)確認(rèn)或多層次判定(4)拒絕/轉(zhuǎn)向人工座席。系統(tǒng)對(duì)其中通常較易導(dǎo)致系統(tǒng)識(shí)別錯(cuò)誤的極少部分語(yǔ)音指令拒絕做出識(shí)別決定,而是將其轉(zhuǎn)給人工座席。在很多情況下,語(yǔ)音識(shí)別技術(shù)可以充分發(fā)揮出RFID的潛能:1.積壓產(chǎn)品、脫銷產(chǎn)品2.被廢棄、被召回或已過(guò)期產(chǎn)品3.回收的商品4.促銷產(chǎn)品RFID系統(tǒng)在利用原有語(yǔ)音導(dǎo)向投資的情況下可以大大增加收益語(yǔ)音識(shí)別技術(shù)在郵件分揀中的應(yīng)用現(xiàn)代化分揀設(shè)備在郵政上的應(yīng)用大大提高了郵件處理的效率。但是,并不是所有的郵件都能上分揀機(jī)處理,那些需要人工處理的郵件成了郵政企業(yè)實(shí)現(xiàn)自動(dòng)化的瓶頸。郵政使用人工標(biāo)碼技術(shù)以及先進(jìn)的計(jì)算機(jī)軟件系統(tǒng)來(lái)處理不能上機(jī)的郵件,仍需要大量的勞動(dòng)力。由MailCode公司開(kāi)發(fā)并準(zhǔn)備申請(qǐng)專利的Spell-ItTM軟件技術(shù)通過(guò)提高系統(tǒng)數(shù)據(jù)庫(kù)能力的方式對(duì)語(yǔ)音識(shí)別自動(dòng)化設(shè)備進(jìn)行了革命性的變革。這種技術(shù)提供了無(wú)限的數(shù)據(jù)庫(kù)能力,并且保證分揀速度不會(huì)因數(shù)據(jù)庫(kù)的增大而減小。由各大語(yǔ)音引擎公司開(kāi)發(fā)的系統(tǒng)還支持世界上的各種主要語(yǔ)言,這樣,語(yǔ)音技術(shù)就成為世界性的產(chǎn)品。以英語(yǔ)語(yǔ)音識(shí)別系統(tǒng)為例,系統(tǒng)建立了36個(gè)可識(shí)別字符 26個(gè)字母加上09的10個(gè)數(shù)字,同時(shí)還建立了一套關(guān)鍵詞。Spell-It軟件使用這些字符來(lái)識(shí)別成千上萬(wàn)的口語(yǔ)詞匯和無(wú)數(shù)的詞語(yǔ)組合。對(duì)于大公司的郵件收發(fā)中心來(lái)說(shuō),使用MailCode公司的Spell-It軟件技術(shù),分揀員實(shí)際上只需發(fā)出幾個(gè)字符的音來(lái)找到和數(shù)據(jù)庫(kù)中相對(duì)應(yīng)的詞。例如:碰到了寄給Joseph Schneider的郵件,操作員只需發(fā)出 “J”、“S”、“C”和“H”幾個(gè)音就可以得到準(zhǔn)確的分揀信息。姓名和郵箱編碼:Jennifer Schroeder, 軟件工程部;Joseph Schneider, 技術(shù)操作部;Josh Schriver, 技術(shù)操作部,因?yàn)檫@三個(gè)姓名全都符合(J,S,C,H)的發(fā)音標(biāo)準(zhǔn)。郵件中心的操作員知道郵件實(shí)際上是寄給Joseph Schneider的,就可以把郵件投入Joseph Schneide的信箱了。郵局要把郵件按投遞路線分發(fā),分揀員必須熟悉長(zhǎng)長(zhǎng)的投遞段列表以及各種各樣的國(guó)際郵件投遞信息。Spell-It技術(shù)把地址、投遞路線等信息都存入了系統(tǒng),這樣就大大方便了分揀工作。例如,有一件寄往Stonehollow 路2036號(hào)的郵件。使用語(yǔ)音識(shí)別技術(shù),分揀員僅僅需要發(fā)出“2”、“0”、“S”、“T”和“O”幾個(gè)音,如表2所示,數(shù)據(jù)庫(kù)就會(huì)給出所有可能和這幾個(gè)音相對(duì)應(yīng)的地址及相應(yīng)的投遞路線的。在這個(gè)例子中,有三個(gè)投遞地址符合這一語(yǔ)音標(biāo)準(zhǔn),分揀員知道哪一個(gè)是正確的地址,于是就可以把郵件分給相應(yīng)投遞段的投遞員了。Spell-It技術(shù)可以識(shí)別字母、數(shù)字、關(guān)鍵詞以及無(wú)數(shù)的組合,對(duì)大公司的郵件收發(fā)中心和郵局的手工郵件分揀來(lái)說(shuō)都是一次徹底的變革。這種進(jìn)步使得郵件中心可以使用快捷、精密、配套的郵件自動(dòng)化處理設(shè)備來(lái)提高郵件處理全過(guò)程的工作效率。Spell-It技術(shù)還可以適用于世界上的多種語(yǔ)言。大公司的郵件收發(fā)中心和郵局所面臨的一個(gè)重大問(wèn)題就是如何能在控制培訓(xùn)經(jīng)費(fèi)的情況下提高生產(chǎn)率?通過(guò)減少對(duì)內(nèi)部郵件和不能上分揀機(jī)郵件的查找時(shí)間能得到什么樣的經(jīng)濟(jì)效益?手工郵件分揀中心經(jīng)常要考慮和勞動(dòng)力有關(guān)的問(wèn)題:人力成本越來(lái)越高,人員更迭越來(lái)越快,培訓(xùn)費(fèi)用越來(lái)越多。公司內(nèi)部收發(fā)中心和郵局的手工分揀都主要依靠分揀人員的記憶力。招募、培訓(xùn)和留住熟練分揀員往往需要很高的成本。如果一個(gè)熟練工因病、因事請(qǐng)假或去度假,或者辭職,必須有另外的人來(lái)補(bǔ)上空缺的崗位。因?yàn)樯a(chǎn)率的提高有賴于工人的工作熟練程度,而許多企業(yè)由于人員流動(dòng)頻繁導(dǎo)致了培訓(xùn)經(jīng)費(fèi)的持續(xù)增長(zhǎng),這樣效益目標(biāo)就很難達(dá)到。手工分揀主要依賴員工的記憶力,而人工標(biāo)碼等半自動(dòng)化處理雖然減輕了記憶的壓力,卻需要一套全新的技術(shù)。從手工操作到半自動(dòng)化操作往往需要員工完全改變操作技能,許多熟練的手工分揀員改換使用鍵盤操作時(shí)生產(chǎn)率不升反降。許多公司在采用人工標(biāo)碼臺(tái)及采用近距離或遠(yuǎn)距離視頻標(biāo)碼設(shè)備時(shí)都出現(xiàn)了這種情況,因?yàn)闃?biāo)碼技術(shù)完全依賴操作員的鍵盤技術(shù)來(lái)處理郵件。和標(biāo)碼技術(shù)相比,語(yǔ)音識(shí)別技術(shù)可以大大地減少職工培訓(xùn),并且可以減輕甚至消除從手工勞動(dòng)向自動(dòng)化轉(zhuǎn)變過(guò)程對(duì)生產(chǎn)率的影響。要達(dá)到熟練分揀不必再需要大量的工作經(jīng)驗(yàn)。實(shí)際上,語(yǔ)音識(shí)別技術(shù)的應(yīng)用使操作員不必再記憶郵箱編碼等郵政信息了,語(yǔ)音識(shí)別技術(shù)簡(jiǎn)單易學(xué),郵件中心的工作人員只用幾分鐘就可以達(dá)到熟練操作的程度了。培訓(xùn)時(shí)間的減少促使了人工成本的下降。另外,語(yǔ)音識(shí)別技術(shù)又提高了生產(chǎn)率,從而大大提高了郵件中心的效益。MailCode公司的語(yǔ)音識(shí)別設(shè)備有兩種:口音適應(yīng)型設(shè)備和非口音適應(yīng)型設(shè)備??谝暨m應(yīng)型設(shè)備需要在生產(chǎn)前操作員進(jìn)行口音適應(yīng)訓(xùn)練,操作員要花半小時(shí)左右的時(shí)間讓設(shè)備適應(yīng)自己的語(yǔ)音特點(diǎn),這些特點(diǎn)作為文件保存到系統(tǒng)中,以備將來(lái)使用。這種設(shè)備尤其適合那些有地方方言或口音的操作員。非口音適應(yīng)型設(shè)備基本上不需要語(yǔ)音訓(xùn)練,適用于臨時(shí)工較多,操作員不固定的場(chǎng)所。只是非口音適應(yīng)型設(shè)備比起口音適應(yīng)型設(shè)備來(lái)速度略慢,準(zhǔn)確率略低。實(shí)驗(yàn)表明語(yǔ)音技術(shù)提高了生產(chǎn)率。一個(gè)熟練的手工分揀員平均每小時(shí)分揀700件郵件,這樣的效率至少需要三個(gè)月的訓(xùn)練。而使用語(yǔ)音識(shí)別技術(shù),一個(gè)沒(méi)有經(jīng)過(guò)訓(xùn)練的操作員僅一星期后分揀速度就可以達(dá)到每小時(shí)550件,四周后分撿速度就可達(dá)到每小時(shí)700件。另外,手工分揀每小時(shí)查找郵件150件,而利用語(yǔ)音技術(shù),郵件查找量每小時(shí)可以達(dá)到600件,隨著操作員對(duì)設(shè)備越來(lái)越熟練,分揀的精確度會(huì)進(jìn)一步提高。因?yàn)榇蟛糠值恼Z(yǔ)音識(shí)別系統(tǒng)是基于界面友好的Windows NT開(kāi)發(fā)的,管理人員可以利用工具軟件對(duì)操作員的生產(chǎn)情況、郵件量以及整個(gè)郵件中心的生產(chǎn)情況進(jìn)行跟蹤。最新的設(shè)備還裝備有數(shù)據(jù)庫(kù)管理系統(tǒng),可以保證對(duì)數(shù)據(jù)庫(kù)進(jìn)行及時(shí)的更新,無(wú)論是公司內(nèi)部數(shù)據(jù)庫(kù),還是郵局?jǐn)?shù)據(jù)庫(kù),這樣的管理系統(tǒng)都能保證及時(shí)地對(duì)地址數(shù)據(jù)更新,以確保郵件被準(zhǔn)確地送到收件人手中。正是有了這些優(yōu)點(diǎn),郵件中心安裝語(yǔ)音識(shí)別設(shè)備不失為一種實(shí)用又有效益的選擇。MailCode 公司提供了兩種語(yǔ)音產(chǎn)品:語(yǔ)音策劃管理系統(tǒng)和語(yǔ)音分揀系統(tǒng)。語(yǔ)音策劃管理系統(tǒng)是用來(lái)為郵局把郵件分揀到投遞段的,可以對(duì)包裹、信函、扁平件以及無(wú)郵政編碼和編碼有誤的郵件進(jìn)行一次和二次分揀;語(yǔ)音分揀系統(tǒng)是為企業(yè)的郵件收發(fā)中心設(shè)計(jì)的,可以利用內(nèi)部的多重?cái)?shù)據(jù)庫(kù)生成完整準(zhǔn)確的文件來(lái)同時(shí)識(shí)別職員姓名、部門和投遞點(diǎn)。隨著技術(shù)的進(jìn)步,語(yǔ)音策劃管理系統(tǒng)和語(yǔ)音分揀系統(tǒng)的數(shù)據(jù)庫(kù)可以隨時(shí)更新,其速度和準(zhǔn)確度也越來(lái)越高。語(yǔ)音策劃管理系統(tǒng)和語(yǔ)音分揀系統(tǒng)都使用相似的硬件,每臺(tái)設(shè)備都配備了除噪音的無(wú)線耳機(jī)可以使操作員在語(yǔ)音分揀設(shè)備間自由走動(dòng),每個(gè)分揀臺(tái)都安裝有一臺(tái)配備3343cm的高清晰度平面液晶顯示器的微機(jī)。語(yǔ)音分揀系統(tǒng)還可以配以標(biāo)簽儀和打印機(jī)。隨著科學(xué)技術(shù)的發(fā)展,語(yǔ)音識(shí)別技術(shù)逐漸成為了郵件分揀的新技術(shù),可以克服手工分揀單純依靠分揀員記憶力的弊端,解決人員成本過(guò)高的問(wèn)題,提高郵件處理的效率和效益。語(yǔ)音識(shí)別技術(shù)的發(fā)展趨勢(shì)語(yǔ)音識(shí)別技術(shù)經(jīng)過(guò)全球半個(gè)多世紀(jì)的研究,目前已經(jīng)發(fā)展到了接近實(shí)用的階段。在實(shí)驗(yàn)室環(huán)境下,大詞匯量的朗讀式連續(xù)說(shuō)話的寬帶語(yǔ)音信號(hào)的平均識(shí)別率可以達(dá)到90%以上。在這樣的水平基礎(chǔ)上,語(yǔ)音識(shí)別技術(shù)開(kāi)始嘗試從實(shí)驗(yàn)室演示系統(tǒng)走向?qū)嵱没唐?。但是語(yǔ)音識(shí)別技術(shù)要進(jìn)入成熟的商業(yè)運(yùn)用還有一段艱難的路程,還必須在很多方面取得突破性進(jìn)展。表現(xiàn)在:1.提高可靠性。一方面,語(yǔ)音識(shí)別技術(shù)需要能排除各種聲學(xué)環(huán)境因素的影響。在公共場(chǎng)合,人能夠有意識(shí)地摒棄環(huán)境噪聲并從中獲取自己所需要的特定聲音,但幾乎不可能指望計(jì)算機(jī)能聽(tīng)懂你的話。2.增加詞匯量。3.應(yīng)用拓展。語(yǔ)音識(shí)別技術(shù)可能帶動(dòng)一系列嶄新或更便捷功能的設(shè)備出現(xiàn),更加方便人的工作和生活。將語(yǔ)音識(shí)別與語(yǔ)言理解、文字翻譯、語(yǔ)音合成進(jìn)行系統(tǒng)創(chuàng)新集成的語(yǔ)音同聲翻譯技術(shù),可以用于突破不同語(yǔ)種的人說(shuō)話交流的語(yǔ)言壁壘。4.降低成本減小體積21世紀(jì)是信息和網(wǎng)絡(luò)的時(shí)代,Internet、寬帶IP網(wǎng)、公用電話網(wǎng)、移動(dòng)電話網(wǎng)把全

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論