IBM語(yǔ)音識(shí)別輸入系統(tǒng)_第1頁(yè)
IBM語(yǔ)音識(shí)別輸入系統(tǒng)_第2頁(yè)
IBM語(yǔ)音識(shí)別輸入系統(tǒng)_第3頁(yè)
IBM語(yǔ)音識(shí)別輸入系統(tǒng)_第4頁(yè)
IBM語(yǔ)音識(shí)別輸入系統(tǒng)_第5頁(yè)
已閱讀5頁(yè),還剩6頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、IBM語(yǔ)音識(shí)別輸入系統(tǒng)(ViaVioce) V9.1 簡(jiǎn)體中文光盤(pán)版  軟件大小:276.08MB 軟件語(yǔ)言:多國(guó)語(yǔ)言  軟件類(lèi)別:國(guó)外軟件 / 漢字輸入  運(yùn)行環(huán)境:Win9x/NT/2000/XP/軟件介紹: 該系統(tǒng)可用于聲控打字和語(yǔ)音導(dǎo)航。只要對(duì)著微機(jī)講話(huà),不用敲鍵盤(pán)即可打漢字,每分鐘可輸入150個(gè)漢字,是鍵盤(pán)輸入的兩倍,是普通手寫(xiě)輸入的六倍。該系統(tǒng)識(shí)別率可達(dá)95%以上。并配備了高性能的麥克風(fēng),使用便利,特別適合于起草文稿、撰寫(xiě)文章、和準(zhǔn)備教案,是文職人員、作家和教育工作者的良好助手。 IBM潛心研究26年,他領(lǐng)導(dǎo)了世界的語(yǔ)音識(shí)

2、別技術(shù),其語(yǔ)音識(shí)別產(chǎn)品在全球銷(xiāo)售已達(dá)一百萬(wàn)套以上。使用語(yǔ)音輸入方式,您的工作空間更加自由舒暢: *即使您不會(huì)打字,也可迅速準(zhǔn)備好文稿; *只要集中精力思考問(wèn)題,無(wú)須琢磨怎樣拼音,怎樣拆字; *當(dāng)您疲勞時(shí),閉上眼、伸伸腰,雙手方在腦后,然后輕松地說(shuō):開(kāi)始聽(tīng)寫(xiě)吧. . 注:價(jià)值超數(shù)千元的IBM的中文語(yǔ)音錄入工具,有耳麥的朋友可以試一試,也可以當(dāng)作學(xué)習(xí)普通話(huà)的工具,沒(méi)有理由不下載使用它。 IBM ViaVoice語(yǔ)音輸入系統(tǒng)詳解 作者: 艾寒出處: 天極網(wǎng)  目前漢字輸入的方式主要有四種:鍵盤(pán)輸入,手寫(xiě)輸入,掃描輸入和我們現(xiàn)在要談到的語(yǔ)音輸入。讓我們先來(lái)了解一下這四種輸入方式。&

3、#160; 鍵盤(pán)輸入:鍵盤(pán)輸入基本上是基于各種輸入法,主要又分為字形輸入法和拼音輸入法。實(shí)際上字形輸入法是不符合人的寫(xiě)作思維習(xí)慣,因?yàn)槿藗冊(cè)诖朕o時(shí),頭腦中首先反映出的是即將這個(gè)詞語(yǔ)的語(yǔ)音,所以字形輸入法更適合專(zhuān)業(yè)錄入人員使用。拼音輸入法也分兩種,一種以詞語(yǔ)為輸入單位,另一種以語(yǔ)句為輸入單位,而后者不符合寫(xiě)作的思維習(xí)慣,因?yàn)槿藗冊(cè)趯?xiě)作時(shí)是以詞為思考單位。鍵盤(pán)輸入法在輸入速度有要求的情況下對(duì)于鍵盤(pán)操作、指法要求比較高;  手寫(xiě)輸入:手寫(xiě)輸入是最容易上手的輸入方法,但是同樣由于手寫(xiě)輸入的先天不足,很難達(dá)到較高的輸入速度;  掃描輸入:掃描輸入對(duì)于硬件

4、要求比較高,主要是適用于資料的整理;  語(yǔ)音輸入:語(yǔ)音輸入對(duì)輸入人員的鍵盤(pán)操作能力、指法要求很低,幾乎可以說(shuō)你只要會(huì)說(shuō)漢語(yǔ),就可以進(jìn)行語(yǔ)音輸入。  語(yǔ)音輸入尤其是漢字語(yǔ)音輸入經(jīng)歷了很長(zhǎng)時(shí)間的研究和應(yīng)用,到目前已經(jīng)達(dá)到了一個(gè)相當(dāng)?shù)母叨?,所以為了讓更多的人、更多不是非常熟悉電腦的人來(lái)使用電腦進(jìn)行漢字輸入,我把多年以來(lái)使用IBM VIAVOICE語(yǔ)音輸入系統(tǒng)的心得體會(huì)寫(xiě)下來(lái),使得語(yǔ)音輸入這種新的漢字輸入方法能得到更廣泛的應(yīng)用。  語(yǔ)音輸入是基于語(yǔ)音模型的一種輸入方法,涉及大量運(yùn)算,所以它對(duì)CPU和內(nèi)存有一定的要求,CPU頻率越高、內(nèi)存越大,

5、語(yǔ)音輸入就能更好地工作。不過(guò)也不需要太擔(dān)心這個(gè)問(wèn)題,我使用的CPU是賽揚(yáng)433,內(nèi)存96MB,基本上能很好的進(jìn)行語(yǔ)音輸入。自然,我們還需要一個(gè)耳麥。通過(guò)使用IBM VIAVOICE,我們發(fā)現(xiàn)這個(gè)系統(tǒng)對(duì)于耳麥要求并不高,我所用的就是十塊錢(qián)買(mǎi)來(lái)的耳麥,當(dāng)然性能良好的耳麥對(duì)于語(yǔ)音輸入也有很大的幫助。  -安裝完IBM VIAVOICE后,系統(tǒng)會(huì)默認(rèn)增加一個(gè)自啟動(dòng)項(xiàng)IBM VIAVOICE語(yǔ)音中心,我們可以在“開(kāi)始”“程序”菜單找到它,另外在菜單中我們還可以看到一個(gè)IBM VIAVOICE文件夾。(見(jiàn)圖1)  圖1  一、新建用戶(hù),建立自己的

6、語(yǔ)音模型  第一次打開(kāi)ViaVoice時(shí)會(huì)出現(xiàn)以下界面。(如圖2)  圖2  相應(yīng)的設(shè)置很簡(jiǎn)單,每個(gè)界面都有詳細(xì)的說(shuō)明,后面的操作按照提示可以一路點(diǎn)“下一步”完成即可。(如圖3、4)  圖3圖4  完成以上操作之后,進(jìn)入麥克風(fēng)設(shè)置完畢后,出現(xiàn)以下界面。下面我們要為自己建立語(yǔ)音模型,這對(duì)我們之后的語(yǔ)音輸入效果非常重要。(如圖5) 圖5  語(yǔ)音模型的建立共有五個(gè)階段:  1.在圖5中選擇“下一步”,這時(shí)會(huì)出現(xiàn)一個(gè)文本框,提示你讀出文本框中所列出的一段話(huà)。讀完后

7、,系統(tǒng)會(huì)進(jìn)行語(yǔ)音訓(xùn)練,訓(xùn)練完畢后,最簡(jiǎn)單的語(yǔ)音模型就建立完畢了,當(dāng)然可以想像得到,這樣輕松建立起來(lái)的模型效果并不是很好。然后你會(huì)看到如下界面。(如圖6)  圖6  四個(gè)部分的訓(xùn)練內(nèi)容中A是最基本的,四個(gè)部分總共有500多句話(huà),全部訓(xùn)練完需要兩個(gè)多小時(shí),所以要是想一勞永逸,嗓子可是要受罪,我試過(guò),口干舌燥的,但是就我使用感覺(jué)來(lái)看,經(jīng)過(guò)A部分的訓(xùn)練,已經(jīng)可以進(jìn)行基本的使用了,所以大家可以化整為零,免得一下子說(shuō)傷了,失去興趣。IBM ViaVoice系統(tǒng)有自行學(xué)習(xí)的功能,所以使用時(shí)間越長(zhǎng),識(shí)別率越高!如同歌里唱的:越來(lái)越好,來(lái)來(lái)來(lái)  到此,

8、個(gè)人用戶(hù)(語(yǔ)音模型)建立完畢,我們可以正式開(kāi)始使用語(yǔ)音輸入了。  二、語(yǔ)音輸入  啟動(dòng)IBM ViaVoice語(yǔ)音中心,在屏幕上方會(huì)出現(xiàn)一個(gè)工具條。(如圖7)  圖7  在正式輸入前,需要進(jìn)行音頻設(shè)置。(如圖8) 圖8  這也是影響輸入效果一個(gè)至關(guān)重要的因素,出現(xiàn)的界面是我們提到過(guò)的圖3、4及隨后的帶有提示的對(duì)話(huà)框,因?yàn)榍斑呉呀?jīng)做過(guò),不再累述。建議在設(shè)置完以后,最好不要改動(dòng)你帶耳麥的方式,以保證麥克風(fēng)相對(duì)嘴的位置保持不變,如輸入過(guò)程中曾經(jīng)摘下、挪動(dòng)過(guò)耳麥,建議最好重新進(jìn)行音頻設(shè)置,當(dāng)然可以視輸入

9、效果是否明顯變化而定。  音頻設(shè)置完畢后,進(jìn)入用戶(hù)選項(xiàng),點(diǎn)擊ViaVoice選項(xiàng)。(如圖9) 圖9  通過(guò)“用戶(hù)名”下拉菜單選擇相應(yīng)的用戶(hù)。(如圖10)  圖10  其中“語(yǔ)音”、“聽(tīng)寫(xiě)”、“直接聽(tīng)寫(xiě)”和“糾錯(cuò)”涉及一些比較高級(jí)的設(shè)置,推薦使用默認(rèn)設(shè)置,不要改動(dòng),當(dāng)使用比較熟練后可以做相應(yīng)調(diào)整。(如圖11)  圖11  這兩項(xiàng)工作(音頻設(shè)置和用戶(hù)選項(xiàng))做好以后,單擊工具欄上的麥克風(fēng)圖標(biāo),圖標(biāo)變?yōu)榫G色時(shí),就可以開(kāi)始正常工作了。(如圖12)  圖12 

10、; 這個(gè)時(shí)候,你就要出言謹(jǐn)慎了,你所說(shuō)的每一句話(huà)系統(tǒng)可能都有反應(yīng),你可以對(duì)它說(shuō):“幫助”,它會(huì)調(diào)出幫助內(nèi)容;你可以說(shuō)“關(guān)閉”,它會(huì)關(guān)閉當(dāng)前的任務(wù);你打哈欠,它會(huì)顯示“沒(méi)聽(tīng)清您說(shuō)什么,能再說(shuō)一遍嗎?”;你說(shuō)“格式化”,(沒(méi)有反應(yīng),開(kāi)玩笑的)  ViaVoice可以嵌入Word里,但是推薦使用其自帶的語(yǔ)音板,您可以對(duì)著麥克風(fēng)說(shuō):“聽(tīng)寫(xiě)到語(yǔ)音板”,也可以通過(guò)菜單調(diào)出。(如圖13)  圖13  出現(xiàn)一個(gè)類(lèi)似“寫(xiě)字板”的編輯界面,其操作很簡(jiǎn)單,不多說(shuō),唯一需要說(shuō)明的就是“糾錯(cuò)”,  使用語(yǔ)音輸入不可避免的會(huì)出現(xiàn)系統(tǒng)

11、的“理解”錯(cuò)誤,這個(gè)時(shí)候糾錯(cuò)對(duì)于調(diào)整語(yǔ)音模型、編輯文檔就格外重要,選中輸入錯(cuò)誤的詞,在下面這個(gè)例子中,筆者想輸入的是“越應(yīng)”,而輸出的是“也因”,選中后點(diǎn)“糾錯(cuò)”按鈕,或者對(duì)麥克風(fēng)說(shuō)“糾錯(cuò)”,會(huì)出現(xiàn)以下界面,如果候選詞中沒(méi)有待選詞,可以用其他輸入法輸入,系統(tǒng)將把這個(gè)詞作為“新詞”加入。(如圖14) 圖14  其他一般菜單指令如“全選”“復(fù)制”“粘貼”“刪除”“格式”“保存”“退出”等都可以通過(guò)語(yǔ)音控制,大家可以在熟悉語(yǔ)音輸入后加強(qiáng)運(yùn)用,完全可能用嘴來(lái)進(jìn)行這些編輯操作。  在完成聽(tīng)寫(xiě)、關(guān)閉聽(tīng)寫(xiě)文檔以后,IBM ViaVoice系統(tǒng)會(huì)依據(jù)需要提示用戶(hù)是否學(xué)習(xí)

12、剛才輸入的文章,并將其中涉及的新詞提取出來(lái)由用戶(hù)確定是否學(xué)習(xí)并加入詞匯庫(kù)中;在完成一定量的語(yǔ)音輸入后,系統(tǒng)會(huì)適時(shí)進(jìn)行語(yǔ)音訓(xùn)練,以期更好的在日后的輸入工作中為用戶(hù)服務(wù)。  是使用Word還是聽(tīng)寫(xiě)板可以視用戶(hù)習(xí)慣而定,所謂“當(dāng)前應(yīng)用程序”,比如你用QQ聊天,只要選擇“聽(tīng)寫(xiě)到當(dāng)前應(yīng)用程序”,就可以在聊天對(duì)話(huà)框中進(jìn)行語(yǔ)音輸入,當(dāng)然這個(gè)時(shí)候無(wú)法享受“糾錯(cuò)”服務(wù)了,但是輸入速度肯定比手打要快多了。  你也可以打開(kāi)FOXMAIL,選擇“聽(tīng)寫(xiě)到當(dāng)前應(yīng)用程序”說(shuō)一句“新建郵件”,然后說(shuō)“收件人”,F(xiàn)OXMAIL就會(huì)調(diào)出地址簿,選好后(這個(gè)時(shí)候手選可能還是比嘴好使一些),說(shuō)

13、“主題”,光標(biāo)會(huì)在主題欄中閃,總而言之,你盡可以用嘴來(lái)撰寫(xiě)郵件;其他應(yīng)用,不一而足,你會(huì)發(fā)現(xiàn)一旦IBM ViaVoice工作步入正軌,給我們帶來(lái)的方便是巨大的。  三、更好的發(fā)揮IBM ViaVoice的作用  1.堅(jiān)持使用  量的積累會(huì)導(dǎo)致質(zhì)的飛躍,系統(tǒng)所建立的個(gè)人語(yǔ)音模型會(huì)越來(lái)越完備,這一點(diǎn)尤其適合有一定口音的用戶(hù)。  2.勿忘設(shè)置  每次進(jìn)行輸入前,最好進(jìn)行“音頻設(shè)置”,這對(duì)于提高識(shí)別率有很大的作用,所謂“磨刀不誤砍柴工”。  3.注意文體  這一點(diǎn)

14、是我的使用體會(huì),在IBM ViaVoice使用手冊(cè)中沒(méi)有提到這一點(diǎn),IBM ViaVoice語(yǔ)音系統(tǒng)一是準(zhǔn)確辨認(rèn)你的實(shí)際發(fā)音,二是根據(jù)語(yǔ)音模型根據(jù)上下文推測(cè)你實(shí)際說(shuō)的那個(gè)詞語(yǔ)(同音詞畢竟很多),所以其實(shí)IBM ViaVoice系統(tǒng)更適合具有一定規(guī)范行文格式的文章,如公文、新聞報(bào)道、社論、論文等等,如果你試圖用這個(gè)系統(tǒng)輸入散文、詩(shī)歌、文言文,會(huì)非常困難。  4.充分開(kāi)發(fā)  如前文所述,IBM ViaVoice語(yǔ)音輸入系統(tǒng)還有一些高級(jí)設(shè)置,等大家使用得較為得心應(yīng)手時(shí),可以逐步發(fā)掘,讓IBM ViaVoice系統(tǒng)更好的發(fā)揮作用。  5.加強(qiáng)備份  隨時(shí)備份個(gè)人用戶(hù)檔案,必要時(shí),可以將你的模型移植到別人的機(jī)器上,這樣你不用再重頭來(lái)過(guò)了,這樣也擴(kuò)大了其應(yīng)用范圍。  四、IBM ViaVoice不

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論