基于云與語音識別的手機智能通話系統(tǒng)-SkyTalk_第1頁
基于云與語音識別的手機智能通話系統(tǒng)-SkyTalk_第2頁
基于云與語音識別的手機智能通話系統(tǒng)-SkyTalk_第3頁
基于云與語音識別的手機智能通話系統(tǒng)-SkyTalk_第4頁
基于云與語音識別的手機智能通話系統(tǒng)-SkyTalk_第5頁
全文預覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、基于云與語音識別的智能通話系統(tǒng)SkyTalk基于云與語音識別的智能通話系統(tǒng)SkyTalk簡介本工程提出一種智能通話系統(tǒng)SkyTalk,可以方便人們在雙方通話中簡單、快捷、實時地通過語音獲取信息、完成用戶指定任務,從而防止大量復雜、耗時的操作。在撥出SkyTalk智能 時,中的基站編號、GPS坐標、挪動速度、通訊錄等數(shù)據(jù)會上傳至效勞器,并由效勞器建立智能通話。在通話的過程中,效勞器作為第三方通過語音識別和語音合成響應用戶的語音懇求,可以發(fā)送通訊錄中的號碼、說出用戶的詳細位置、計算到達對方的時間、播送天氣預報、進展實時語音翻譯等。SkyTalk通過云計算提供反向地址解析、獲取互聯(lián)網(wǎng)信息,不僅簡化了

2、效勞器構(gòu)架,還能為用戶提供更多精彩應用。挪動 拉近了人與人之間的間隔 。 的開展,從貝爾到摩托羅拉,再到今天的4G,技術(shù)不斷革新,但人們的通話方式卻始終沒有改變。SkyTalk智能通話系統(tǒng)通過云資源、語音識別與合成,可以使用戶在通話過程中,不必掛斷、親自編輯短信、查閱信息或翻開GPS定位,而只需說出問題,SkyTalk便可以用語音加以答復??傊?,SkyTalk是信息化、智能化社會下人們通話方式的革新。工程原理根本構(gòu)架SkyTalk通話系統(tǒng)在 語音通道之外建立一條互聯(lián)網(wǎng)智能通道。上的GPS位置、通訊錄、個人偏好等信息通過這條通道傳輸?shù)街虚g效勞器,在云的輔助下對之進展處理與交換。而中間效勞器通過語

3、音識別SR和文本到語音轉(zhuǎn)換TTS在 通道上與用戶雙方進展交互。這樣,一方面可以利用互聯(lián)網(wǎng)通道交換根本數(shù)據(jù),另一方面又利用現(xiàn)有 通道進展語音傳輸,從而防止產(chǎn)生大量的語音數(shù)據(jù)包。更為詳細的SkyTalk的構(gòu)架如圖1分為3個部分:客戶端SkyTalklient、效勞器SkyTalkServer和云lud??蛻舳薙kyTalklient一方面取代原有 的撥號界面,另一方面通過平臺的API獲取的各類信息GPS、電子羅盤、通訊錄等,并通過UI交互獲取用戶的定制偏好及信息。當用戶撥打一個 時,客戶端SkyTalklient向效勞器SkyTalkServer發(fā)送一個懇求,并附上原先獲取的信息。效勞器SkyTa

4、lkServer收到懇求后,建立對等和效勞器之間的三方通話Phne-Server-Phne。效勞器作為第三方根據(jù)語音識別引擎分析用戶的語音命令,并結(jié)合用戶的信息進展相應處理。云端lud集成了用戶可能需要的信息。這片云是現(xiàn)有的互聯(lián)網(wǎng)效勞集合。根本流程本文由論文聯(lián)盟搜集整理SkyTalk根本工作流程見圖2。本工程的客戶端基于Qtute開發(fā)。由于涉及訪問系統(tǒng),用Java平臺實現(xiàn)是不適宜的。Java雖然提供了此方面的JSR開發(fā)包,但由于不同廠商支持的JSR不同,實現(xiàn)也不同,因此兼容性很差。于是,本工程采用效率更高、操作系統(tǒng)支持更強的Qt+實現(xiàn)。功能實現(xiàn)基于Skype的通話系統(tǒng)一方面為了保障正常通話質(zhì)量

5、,另一方面為了使效勞器的語音介入成為可能。本工程SkyTalk采用Skype構(gòu)建通話系統(tǒng)。Skype在inds平臺上為開發(fā)者提供了接口。本工程利用接口與Skype進展通信。音頻數(shù)據(jù)定向傳輸語音管道本工程通過虛擬硬件的驅(qū)動實現(xiàn)語音定向傳輸。語音識別與合成為了更好地實現(xiàn)語音功能,本工程基于微軟SAPI5.4語音引擎構(gòu)建。這一引擎在inds7和indsServer2022中內(nèi)置。已實現(xiàn)的幾項詳細功能在通話中查詢當?shù)靥鞖?。在通話中查詢當?shù)貢r間。在通話中提供地理位置效勞包括通話者的位置,與另一方的間隔 和到達對方的時間。在通話中說出通訊錄中某人的號碼。在通話中發(fā)送通訊錄中某人的號碼。在通話中播放音樂。在

6、通話中分享GgleReader。通話中的實時翻譯。創(chuàng)新點本工程SkyTalk使用Skype進展語音傳輸功能的實現(xiàn),從而可以利用現(xiàn)有挪動通訊網(wǎng)傳輸語音數(shù)據(jù)。這不僅大大減少了語音傳輸?shù)木W(wǎng)絡消耗,也使得客戶端可以對任何挪動、固定終端撥打智能 。SkyTalk可以根據(jù)用戶的需求在 語音通話中提供實時的語音信息效勞。這使得用戶在通話的過程中可以獲取互聯(lián)網(wǎng)資訊、交換信息、解析地理位置、分享各類數(shù)據(jù),而不需要事先準備或掛斷 后進展操作。因此用戶的交談、討論得到大大的簡化。通話的過程中進展其他操作如翻閱通訊錄、用計算機上網(wǎng)查找信息并不實際。SkyTalk利用語音技術(shù)解決這一問題。語音識別技術(shù)識別用戶的命令懇求

7、,而語音合成返回效勞器的響應。通過互聯(lián)網(wǎng)上的云資源,SkyTalkServer可以獲取各類計算功能和各類信息,如反向地址解析與天氣資訊。云資源大大拓展了SkyTalkServer的才能,使其可以提供各類通話中的語音效勞。SkyTalk可以通過利用用戶的個人標志進展個性化智能效勞。這樣做有3個優(yōu)點:可以加載相應的語音識別配置文件,到達更高的識別準確率??梢栽L問用戶的互聯(lián)網(wǎng)或私有云的數(shù)據(jù),從而能在通話中利用這些信息。解析用戶的個人偏好語言。SkyTalk對用戶通訊錄、用戶地理位置信息的存儲和傳輸進展了加密,以保障用戶隱私及平安。展望SkyTalk在功能上和性能上都有很多可以改進的地方。通過改進與擴

8、展,本工程將可以實現(xiàn)更多的應用,到達更好的性能和用戶體驗。這些改進與擴展包括:更強的兼容性。目前客戶端SkyTalklient基于諾基亞平臺實現(xiàn)。將來,可以為不同的平臺實現(xiàn)其客戶端,增加SkyTalk系統(tǒng)的應用范圍。更高的質(zhì)量與性能。在實驗中,本工程有多處可以改進之處。通過整合效勞器資源,SkyTalk可以減少撥出 時間、減少延遲。通過優(yōu)化效勞器框架、選擇更好的云資源,SkyTalk可以進步響應速度。通過采用更好的語音識別算法,SkyTalk可以增強識別率。通過這些改進,SkyTalk可以到達更高的性能。更平安的個人標志。盡管SkyTalk已經(jīng)通過較難偽造的號來作為用戶的個人標志,但不法分子仍

9、然可以通過某些技術(shù)手段到達偽造的目的。為了保護個人隱私平安,SkyTalk可以采用聲紋識別進展更強的個人信息認證。聲紋和指紋一樣,是每個人的生物特征。聲紋從個人語音聲波中提取,不易偽造。假設(shè)結(jié)合原先的號驗證,那么將大大增強SkyTalk的平安性。開放式語音平臺。這一改進將允許第三方開發(fā)平臺的插件,將大大增強SkyTalk的應用性。因此,本工程完全可以開展成一個開放的語音應用平臺,使各種eb網(wǎng)站或效勞都可以通過語音應用的方式出如今這個平臺上,為交談中的人們帶來更多的便利。面向個人的應用更智能的IVR。IVRInterativeVieRespnse在 系統(tǒng)中的應用相當廣泛。利用SkyTalk,那么可以進一步改進IVR效勞系統(tǒng)。傳統(tǒng)的IVR基于企業(yè)數(shù)據(jù)庫,旨在代替 接線員,向企業(yè)的用戶提供顧客咨詢效勞,或是提供 點餐、點歌。改進后的SkyTalkIVR那么基于云技術(shù)和用戶個人標志,可以將 和用戶的互聯(lián)網(wǎng)生活嚴密相連。例如,用戶可以像聽收音機一樣,收聽自己GgleReader的最新資訊;可以收聽個人電子郵箱中的最新郵件還可以利用語音遠程操縱自己的計算機只需說出文檔的名字,就可以將文檔提娶傳輸?shù)?。對于普通用戶而言,SkyTalkI

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論