(通信與信息系統(tǒng)專業(yè)論文)ilbc語(yǔ)音算法研究及dsp實(shí)現(xiàn).pdf_第1頁(yè)
(通信與信息系統(tǒng)專業(yè)論文)ilbc語(yǔ)音算法研究及dsp實(shí)現(xiàn).pdf_第2頁(yè)
(通信與信息系統(tǒng)專業(yè)論文)ilbc語(yǔ)音算法研究及dsp實(shí)現(xiàn).pdf_第3頁(yè)
(通信與信息系統(tǒng)專業(yè)論文)ilbc語(yǔ)音算法研究及dsp實(shí)現(xiàn).pdf_第4頁(yè)
(通信與信息系統(tǒng)專業(yè)論文)ilbc語(yǔ)音算法研究及dsp實(shí)現(xiàn).pdf_第5頁(yè)
已閱讀5頁(yè),還剩66頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

(通信與信息系統(tǒng)專業(yè)論文)ilbc語(yǔ)音算法研究及dsp實(shí)現(xiàn).pdf.pdf 免費(fèi)下載

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

獨(dú)創(chuàng)性( 或創(chuàng)新性) 聲明 本人聲明所呈交的論文是本人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究 成果。盡我所知,除了文中特別加以標(biāo)注和致謝中所羅列的內(nèi)容以外,論文中不 包含其他人已經(jīng)發(fā)表或撰寫(xiě)過(guò)的研究成果,也不包含為獲得北京郵電大學(xué)或其他 教育機(jī)構(gòu)的學(xué)位或證書(shū)而使用過(guò)的材料。與我一同工作的同志對(duì)本研究所做的任 何貢獻(xiàn)均已在論文中作了明確的說(shuō)明并表示了謝意。 申請(qǐng)學(xué)位論文與資料若有不實(shí)之處,本人承擔(dān)一切相關(guān)責(zé)任。 本人簽名: 翻挺日期:壘翌星主:! 三 關(guān)于論文使用授權(quán)的說(shuō)明 學(xué)位論文作者完全了解北京郵電大學(xué)有關(guān)保留和使用學(xué)位論文的規(guī)定,即: 研究生在校攻讀學(xué)位期間論文工作的知識(shí)產(chǎn)權(quán)單位屬北京郵電大學(xué)。學(xué)校有權(quán)保 留并向國(guó)家有關(guān)部門(mén)或機(jī)構(gòu)送交論文的復(fù)印件和磁盤(pán),允許學(xué)位論文被查閱和借 閱;學(xué)??梢怨紝W(xué)位論文的全部或部分內(nèi)容,可以允許采用影印、縮印或其它 復(fù)制手段保存、匯編學(xué)位論文。( 保密的學(xué)位論文在解密后遵守此規(guī)定) 保密論文注釋:本學(xué)位論文屬于保密在一年解密后適用本授權(quán)書(shū)。非保密論 文注釋:本學(xué)位論文不屬于保密范圍,適用本授權(quán)書(shū)。 本人簽名: 導(dǎo)師簽名: 2 1 7 1 辮i :塵塑:蘭:! 三 日期:坶3 。鞫 i l b c 語(yǔ)音算法研究及d s p 實(shí)現(xiàn) 摘要 隨著v o i p 技術(shù)日趨成熟,v o l p 逐漸成為一個(gè)熱門(mén)領(lǐng)域,g 7 2 3 1 、 g 7 2 9 、g s m 6 1 0 、i l b c 、s p e e x 等可以用于v o i p 的語(yǔ)音算法也不斷的 受到業(yè)界關(guān)注。 本論文的主要任務(wù)之一就是i l b c 語(yǔ)音算法的研究。 i l b c 算法本質(zhì)上是一種基于幀的線性預(yù)測(cè)編碼方法,是對(duì)c e l p 的一種發(fā)展,其獨(dú)有的動(dòng)態(tài)碼本更新,語(yǔ)音增強(qiáng)算法,及丟包掩蔽技 術(shù),使其在v o i p 中應(yīng)用時(shí)有更好的性能。根據(jù)網(wǎng)絡(luò)帶寬的不同,i l b c 提供2 0 m s 和3 0 m s 兩種編碼的格式。解碼端,i l b c 運(yùn)用了分析合成 方法的編解碼算法,解碼的部分運(yùn)算量相對(duì)要小一些,使其在功能不 強(qiáng)的客戶端的實(shí)時(shí)解碼成為可能。 i l b c 對(duì)每一個(gè)數(shù)據(jù)包的處理都能夠獨(dú)立于其它數(shù)據(jù)包來(lái)進(jìn)行, 是數(shù)據(jù)包通信的理想選擇。即使i p 丟包和延遲現(xiàn)象的惡化,這種編 解碼器的語(yǔ)音質(zhì)量下降情況也不會(huì)太差。 i l b c 是一種窄帶語(yǔ)音編解碼器,使用了整個(gè)4 k h z 頻帶,而大多 數(shù)標(biāo)準(zhǔn)低比特率編解碼器只利用從3 0 0 h z 到3 4 0 0 h z 的頻帶。這一點(diǎn) 對(duì)音質(zhì)的影響是相當(dāng)明顯的。 此外,i l b c 語(yǔ)音編碼的頻譜特性精確模擬了原始信號(hào)的特性, 其語(yǔ)音比標(biāo)準(zhǔn)低比特率編解碼器的更自然清晰。i l b c 算法為數(shù)據(jù)包 網(wǎng)絡(luò)實(shí)現(xiàn)了優(yōu)良的固定比特率編碼,在質(zhì)量與比特率之間取得了非常 出色的平衡。 與以往的低比特率語(yǔ)音編解碼算法相比,i l b c 算法在基于初始 狀態(tài)的動(dòng)態(tài)碼本的選取和更新、在幀間獨(dú)立的長(zhǎng)時(shí)預(yù)測(cè)方法基礎(chǔ)上的 p l c 丟包掩蔽技術(shù)以及利用有條件限制的優(yōu)化算法加強(qiáng)殘差語(yǔ)音這 幾個(gè)方面采用了與眾不同的方法,這些地方都值得研究。 本論文的另一主要任務(wù)就是i l b c 語(yǔ)音算法的d s p 實(shí)現(xiàn)。 在d s p 實(shí)現(xiàn)時(shí),以i e f e 組織給出的r f c 3 9 5 1 文檔中的c 語(yǔ)言i l b c 語(yǔ)音算法為標(biāo)準(zhǔn)算法,以a n a l o gd e v i c e 公司的a d s p 2 18 1 芯片為核 心d s p 處理芯片,對(duì)c 語(yǔ)言的i l b c 進(jìn)行d s p 轉(zhuǎn)換,使轉(zhuǎn)換后的匯 編代碼符合a d s p 2 1 8 1 芯片的規(guī)則。 轉(zhuǎn)換完成后利用大量語(yǔ)音序列對(duì)匯編代碼進(jìn)行測(cè)試,并在保證語(yǔ) 音質(zhì)量的條件下,從指令集、尋址方式、存儲(chǔ)方式、臨時(shí)變量等方面 對(duì)代碼進(jìn)行優(yōu)化。實(shí)際話機(jī)測(cè)試時(shí),選用微掌公司的a r l 6 8 8 芯片話 機(jī),其內(nèi)部d s p 兼容a d s p 2 1 8 1 芯片指令,功能完備,滿足當(dāng)今v o i p 的語(yǔ)音需求,成為實(shí)際測(cè)試時(shí)所選擇的硬件平臺(tái)。 關(guān)鍵詞:v o l pi l b c 算法線性預(yù)測(cè)a d s p 2 1 8 1 t h es t u d yo fi l b cv o i c ea r j t h m e t i c a n di t sd s pr e a l i z a t i o n a b s t r a c t a l o n gw i t ht h ed e v e l o po fv o mt e c h n i q u e , mi sb e c o m i n gt oah o td o m a i n s o m ev o mv o i c ea r i t h m e t i cs u c ha sg 7 2 3 1 、g 7 2 9 、g s m 6 1 0 、i l b c 、s p e e xa 托p a i d a t t e n t i o nb yi n d u s t r y o n eo ft h i sp a p e r st a s ki st h es t u d yo fi l b cv o i c ea r i t h m e t i c t h ei l b ca r i t h m e t i ce s s e n t i a l l yi st h ec o d ee x c i t e dl i n e a rp r e d i c t i v ec o d i n g , i ti s ad e v e l o p m e n to fc e l p t h ei l b ch a v ed y n a m i cc o d e b o o ku p d a t e , v o i c ee n h a n c i n g a r i t h m e t i ca n dp a c k a g el o s ec o n c e a lt e c h n i q u e , a l lo ft h i sm a k ei th a v eab e t t e r c a p a b i l i t y a c c o r d i n gt ot h ed i s s i m i l a r i t yo ft h en e t w o r kb a n d w i d t h , t h ei l b cp r o v i d e t h e2 0 m sa n d3 0 m st w ok i n d so fc o d i n gf o r m a t s w h e nd e c o d i n g , t h ei l b cm a k eu s e o fa n a l y s i sa n ds y n t h e s i z em e t h o d , t h eo p e r a t i o nq u a n t i t yo fd e c o d i n gp a r ti s c o m p a r a t i v e l ys m a l l ,t h i sm a k ei tc o m et r u et h a tr e a lt i m ed e c o d i n gi n c l i e n te n d w h i c hh a v en o ts os t r o n gf u n c t i o n t h ep r o c e s s i n gf o re a c hd a t ap a c k e ti si n d e p e n d e n t l yo ft h eo t h e rd a t ap a c k e t s ,i t i st h ei d e a lc h o i c eo fd a t ap a c k e tc o m m u n i c a t i o n s e v e ni ft h ei pp a c k e tl o s so rt h e d e l a yp h e n o m e n o nd e t e r i o r a t e ,t h i sc o d e cv o i c eq u a l i t yw i l ln o td r o pt o ob a d t h ei l b ci san a r r o w b a n dv o i c ec o d e c ,u s i n gt h ee n t i r e4k h zb a n d , a n dm o s to f t h es t a n d a r dl o wb i tr a t ec o d e cu s i n go n l yf r o m3 0 0 h zt o3 4 0 0 h zb a n d t h i sp o i n th a s ao b v i o u si m p a c to i lv o i c eq u a l i t y i na d d i t i o n , t h es p e c t r u mo fi l b ca c c u r a t e l ys i m u l a t et h ec h a r a c t e r i s t i c so ft h e o r i g i n a ls i g n a l ,i th a sam o r ec l e a rv o i c et h a nt h es t a n d a r dl o wb i tr a t ec o d e c t h e i l b ca l g o r i t h mp r o v i d ev e r yg o o d 缸e db i tr a t ee n c o d i n gf o rd a t ap a c k e tn e t w o r k , s g e t t i n gav e r y9 0 0 db a l a n c eb e t w e e nq u a l i t ya n db i tr a t e c o m p a r ew i t ht h ep r e v i o u sl o w b i tr a t ec o d o ca l g o r i t h m ,t h ei l b ca l g o r i t h mi s l a r r u p i n gi nt h ed y n a m i cc o d e b o o ks e l e c t i o na n du p d a t eb a s e d o nt h ei n i t i a ls t a t e ,t h e l o n gt i m ep r e d i c t i v em e t h o do f i n t e r f r a m ei n d e p e n d e n tb a s e do nt h ep l c p a c k e tl o s s c o n c e a l m e n tt e c h n i q u e sa n dt h es t r e n g t h e no fr e s i d u a l sv o i c eu s i n gc o n d i t i o n a l o p t i m i z a t i o na l g o r i t h m t h e s ep l a c e sa r ew o r t hs t u d y i n g i nt h i sp a p e r , a n o t h e rm a i nt a s ki sr e a l i z a t i o no fi l b cv o i c ea r i t h m e t i co nd s e i nt h ed s pr e a l i z a t i o n , t h ecl a n g u a g ei l b cv o i c ea l g o f i t h r ai nr f c 3 9 51 d o c u m e n t sg i v e nb yi e f eo r g a n i z a t i o ni ss t a n d a r da l g o r i t h m , t h ea d s p 2 181c h i p m a d eb ya n a l o gd e v i c ec o m p a n yi st h ec o r ed s pc h i p ,a n dt h e nc o n v e r tt h ec l a n g u a g ei l b c t od s p , m a k i n gt h ec o d ei nl i n ew i t ht h er u l e so f a d s p 2181c h i p a f t e rt h et r a n s f o r m a t i o nc o m p l e t e s ,l 娣t h em a s s i v es p e e c hs e q u e n c et o t e s tt h e c o d e ,a n du n d e rt h eg u a r a n t e eo fs p e e c hq u a l i t y , o p t i m i z e t h ec o d ef i o mt h e i n s t r u c t i o ns e t , a d d r e s s i n gm o d e s ,s t o r a g em o d e s , t e m p o r a r yv a r i a b l e sa n do t h e r a s p e c t s w h e nt h ea c t u a lt e l e p h o n et e s t s , s e l e c tt h ep a i m m i c r oc o m p a n y sa r l 6 8 8 c h i pt c l e p h o n e , i t si n t e r i o rd s pc h i pc o m p a t i b l ew i t ht h ea d s p 2 181 c h i po r d e r s , t h e f u n c t i o ni sc o m p l e t e ,m e e t st h ev o pp r o n u n c i a t i o nn e e dn o w , b e c o m e st h eh a r d w a r e p l a t f o r mw h e nt h ea c t u a lt e s t k e yw o r d s :v o i pi l b ca l g o r i t h ml p ca d s p 2 18 1 6 1 1v o l p 介紹 i 1 1v o l p z j i 言 第一章緒論 v o i p 是v o i c eo v e ri n t c r n e tp r o t o c o l 的縮寫(xiě),是一種將模擬的聲音訊號(hào)經(jīng)過(guò)壓 縮與封包之后,以數(shù)據(jù)封包的形式在口網(wǎng)絡(luò)的環(huán)境進(jìn)行語(yǔ)音訊號(hào)的傳輸?shù)募夹g(shù)。 如今炙手可熱的m 電話就是v o i p 技術(shù)的應(yīng)用【。但是,v o i p 技術(shù)又不僅可用于 語(yǔ)音的傳輸,還可以帶來(lái)許多更新的應(yīng)用。v 0 口是實(shí)現(xiàn)從傳統(tǒng)封閉的電信系統(tǒng) 向開(kāi)放的以p 為基礎(chǔ)的電信平臺(tái)轉(zhuǎn)變的革命性技術(shù),是建立新型電信運(yùn)營(yíng)商不 可缺少的組成部分。 v o i p 業(yè)務(wù)的最大特點(diǎn)在于它的開(kāi)放性,它開(kāi)放了以往傳統(tǒng)的各個(gè)交換控制 的平臺(tái)系統(tǒng),在t c p i p 下實(shí)現(xiàn)了統(tǒng)一。在開(kāi)放平臺(tái)下創(chuàng)造了空間,使得新產(chǎn)品 與新應(yīng)用層出不窮,開(kāi)放的v 0 口將傳統(tǒng)的電信推向一個(gè)新時(shí)代。 v o i p 的基本原理是:通過(guò)語(yǔ)音的壓縮算法對(duì)語(yǔ)音數(shù)據(jù)編碼進(jìn)行壓縮處理, 然后把這些語(yǔ)音數(shù)據(jù)按t c p i p 標(biāo)準(zhǔn)進(jìn)行打包,經(jīng)過(guò)口網(wǎng)絡(luò)把數(shù)據(jù)包送至接收地, 再把這些語(yǔ)音數(shù)據(jù)包串起來(lái),經(jīng)過(guò)解壓處理后,恢復(fù)成原來(lái)的語(yǔ)音信號(hào),從而達(dá) 到由互聯(lián)網(wǎng)傳送語(yǔ)音的目的。m 電話的重要設(shè)備之一是m 網(wǎng)關(guān),它把各地區(qū)電 話區(qū)號(hào)映射為相應(yīng)的地區(qū)網(wǎng)關(guān)口地址。這些信息存放在一個(gè)數(shù)據(jù)庫(kù)中,數(shù)據(jù)接 續(xù)處理軟件將完成呼叫處理、數(shù)字語(yǔ)音打包、路由管理等功能。 在用戶撥打長(zhǎng)途電話時(shí),網(wǎng)關(guān)根據(jù)電話區(qū)號(hào)數(shù)據(jù)庫(kù)資料,確定相應(yīng)網(wǎng)關(guān)的m 地址,并將此p 地址加入口數(shù)據(jù)包中,同時(shí)選擇最佳路由,以減少傳輸時(shí)延, 口數(shù)據(jù)包經(jīng)i n t c r n e t 到達(dá)目的地的網(wǎng)關(guān)。在一些i n t c r n c t 尚未延伸到或暫時(shí)未設(shè) 9 立網(wǎng)關(guān)的地區(qū),可設(shè)置路由,由最近的網(wǎng)關(guān)通過(guò)長(zhǎng)途電話網(wǎng)轉(zhuǎn)接,實(shí)現(xiàn)通信業(yè)務(wù)。 v 0 m 最大的優(yōu)勢(shì)是能廣泛地采用i n t e m e t 和全球m 互連的環(huán)境,提供比傳 統(tǒng)業(yè)務(wù)更多,更好的服務(wù)。v 0 可以在m 網(wǎng)絡(luò)上便宜的傳送語(yǔ)音、傳真、視頻 和數(shù)據(jù)等業(yè)務(wù),如統(tǒng)一消息、虛擬電話、虛擬語(yǔ)音或傳真郵箱、查號(hào)業(yè)務(wù)、i n t e m e t 呼叫中心、i n t e m e t 呼叫管理、電視會(huì)議、電子商務(wù)、傳真存儲(chǔ)轉(zhuǎn)發(fā)和各種信息 的存儲(chǔ)轉(zhuǎn)發(fā)等。 采用口網(wǎng)絡(luò)承載話音業(yè)務(wù)與傳統(tǒng)的電話業(yè)務(wù)相比存在著諸多的優(yōu)勢(shì)。v o 可以使電話物理網(wǎng)絡(luò)和i n t e r n e t 或p 物理數(shù)據(jù)網(wǎng)絡(luò)合二為一,有效地簡(jiǎn)化通信系 統(tǒng),減低系統(tǒng)成本和管理成本;利用口分布式的,靈活而可擴(kuò)展的通信方式, 以及v o i p 所提供的新功能可以使企業(yè)、雇員、合作伙伴和客戶更靈活而有效的 溝通;v o m 可以使話音應(yīng)用與原有的數(shù)據(jù)業(yè)務(wù)應(yīng)用有機(jī)的融合在一起,開(kāi)創(chuàng)新 一代業(yè)務(wù)應(yīng)用。 1 1 2v o i p 的基本傳輸過(guò)程 通過(guò)因特網(wǎng)進(jìn)行語(yǔ)音通信是一個(gè)非常復(fù)雜的系統(tǒng)工程,其應(yīng)用面很廣,因此 涉及的技術(shù)也特別多,其中最根本的技術(shù)是v o i p ( v o i c eo v e ri p ) 技術(shù),可以說(shuō), 因特網(wǎng)語(yǔ)音通信是v o i p 技術(shù)的一個(gè)最典型的,也是最有前景的應(yīng)用領(lǐng)域【l 】。因 此在討論用因特網(wǎng)進(jìn)行語(yǔ)音通信之前,有必要首先分析v 0 口的基本原理,以及 v 0 口中的相關(guān)技術(shù)問(wèn)題。 傳統(tǒng)的電話網(wǎng)是以電路交換方式傳輸語(yǔ)音,所要求的傳輸寬帶為6 4 k b i t s 。 而所謂的v 0 口是以分組交換網(wǎng)絡(luò)為傳輸平臺(tái),對(duì)模擬的語(yǔ)音信號(hào)進(jìn)行壓縮, 打包等一系列的特殊處理,使之可以采用無(wú)連接的u d p 協(xié)議進(jìn)行傳輸。 為了在一個(gè)口網(wǎng)絡(luò)上傳輸語(yǔ)音信號(hào),要求幾個(gè)元素和功能最簡(jiǎn)單形式的網(wǎng) 絡(luò)由兩個(gè)或多個(gè)具有v 0 口功能的設(shè)備組成,這一設(shè)備通過(guò)一個(gè)d 網(wǎng)絡(luò)連接。v o m 設(shè)備把語(yǔ)音信號(hào)轉(zhuǎn)換為口數(shù)據(jù)流,并把這些數(shù)據(jù)流轉(zhuǎn)發(fā)到口目的地,口目的地 1 0 又把它們轉(zhuǎn)換回到語(yǔ)音信號(hào)。兩者之音的網(wǎng)絡(luò)必須支持口傳輸,且可以是口路 由器和網(wǎng)絡(luò)鏈路的任意組合。因此可以簡(jiǎn)單地將v 0 口的傳輸過(guò)程分為下列幾個(gè) 階段。 1 語(yǔ)音數(shù)據(jù)轉(zhuǎn)換 語(yǔ)音信號(hào)是模擬波形,通過(guò)方式來(lái)傳輸語(yǔ)音,不管是實(shí)時(shí)應(yīng)用業(yè)務(wù)還是 非實(shí)時(shí)應(yīng)用業(yè)務(wù),首先要對(duì)語(yǔ)音信號(hào)進(jìn)行模擬數(shù)據(jù)轉(zhuǎn)換,也就是對(duì)模擬語(yǔ)音信號(hào) 進(jìn)行量化,然后送入到緩沖存儲(chǔ)區(qū)中,緩沖器的大小可以根據(jù)延遲和編碼的要求 選擇。許多低比特率的編碼器是采取以幀為單位進(jìn)行編碼。典型幀長(zhǎng)為1 0 - - 3 0 m s 。 數(shù)字化可以使用各種語(yǔ)音編碼方案來(lái)實(shí)現(xiàn),目前采用的語(yǔ)音編碼標(biāo)準(zhǔn)主要有 1 1 r u tg 7 1 1 。源和目的地的語(yǔ)音編碼器必須實(shí)現(xiàn)相同的算法,這樣目的地的語(yǔ) 音設(shè)備幫可以還原模擬語(yǔ)音信號(hào)。 2 原數(shù)據(jù)到p 轉(zhuǎn)換 一旦語(yǔ)音信號(hào)進(jìn)行數(shù)字編碼,下一步就是對(duì)語(yǔ)音包以特定的幀長(zhǎng)進(jìn)行壓縮編 碼。大部份的編碼器都有特定的幀長(zhǎng),若一個(gè)編碼器使用1 5 m s 的幀,則把從第 一幀來(lái)的6 0 m s 的包分成4 子幀,并按順序進(jìn)行編碼。每個(gè)幀合1 2 0 個(gè)語(yǔ)音樣點(diǎn) ( 抽樣率為8 k h z ) 。編碼后,將4 個(gè)壓縮的幀合成一個(gè)壓縮的語(yǔ)音包送入網(wǎng)絡(luò)處理 器。網(wǎng)絡(luò)處理器為語(yǔ)音添加包頭,時(shí)標(biāo)和其它信息后通過(guò)網(wǎng)絡(luò)傳送到另一端點(diǎn)。 語(yǔ)音網(wǎng)絡(luò)簡(jiǎn)單地建立通信端點(diǎn)之間的物理連接( 一條線路) ,并在端點(diǎn)之間傳輸編 碼的信號(hào)??诰W(wǎng)絡(luò)不像電路交換網(wǎng)絡(luò),它不形成連接,它要求把數(shù)據(jù)放在可變 長(zhǎng)的數(shù)據(jù)報(bào)或分組中,然后給每個(gè)數(shù)據(jù)報(bào)附帶尋址和控制信息,并通過(guò)網(wǎng)絡(luò)發(fā)送, 一站一站地轉(zhuǎn)發(fā)到目的地。 3 傳送 在這個(gè)通道中,全部網(wǎng)絡(luò)被看成一個(gè)從輸入端接收語(yǔ)音包,然后在一定時(shí)間 ( t ) 內(nèi)將其傳送到網(wǎng)絡(luò)輸出端。t 可以在某全范圍內(nèi)變化,反映了網(wǎng)絡(luò)傳輸中的抖 l l 動(dòng)。網(wǎng)絡(luò)中的同間節(jié)點(diǎn)檢查每個(gè)口數(shù)據(jù)附帶的尋址信息,并使用這個(gè)信息把該 數(shù)據(jù)報(bào)轉(zhuǎn)發(fā)到目的地路徑上的下一站。網(wǎng)絡(luò)鏈路可以是支持m 數(shù)據(jù)流的任何拓 結(jié)構(gòu)或訪問(wèn)方法。 4 i p 包數(shù)據(jù)的轉(zhuǎn)換 目的地v 0 口設(shè)備接收這個(gè)p 數(shù)據(jù)并開(kāi)始處理。網(wǎng)絡(luò)提供一個(gè)可變長(zhǎng)度的緩 沖器,用來(lái)調(diào)節(jié)網(wǎng)絡(luò)產(chǎn)生的抖動(dòng)。該緩沖器可容納許多語(yǔ)音包,用戶可以選擇緩 沖器的大小。小的緩沖器產(chǎn)生延遲較小,但不能調(diào)節(jié)大的抖動(dòng)。其次,解碼器將 經(jīng)編碼的語(yǔ)音包解壓縮后產(chǎn)生新的語(yǔ)音包,這個(gè)模塊也可以按幀進(jìn)行操作,完全 和解碼器的長(zhǎng)度相同。若幀長(zhǎng)度為1 5 m s ,是6 0 m s 的語(yǔ)音包被分成4 子幀,然后 它們被解碼還原成6 0 m s 的語(yǔ)音數(shù)據(jù)流送入解碼緩沖器。在數(shù)據(jù)報(bào)的處理過(guò)程中, 去掉尋址和控制信息,保留原始的原數(shù)據(jù),然后把這個(gè)原數(shù)據(jù)提供給解碼器。 5 數(shù)字語(yǔ)音轉(zhuǎn)換為模擬語(yǔ)音 播放驅(qū)動(dòng)器將緩沖器中的語(yǔ)音樣點(diǎn)取出送入聲卡,通過(guò)揚(yáng)聲器按預(yù)定的頻率 播出。簡(jiǎn)而言之,語(yǔ)音信號(hào)在口網(wǎng)絡(luò)上的傳送要經(jīng)過(guò)從模擬信號(hào)到數(shù)字信號(hào)的 轉(zhuǎn)換,數(shù)字語(yǔ)音封裝成口分組,口分組通過(guò)網(wǎng)絡(luò)的傳送,m 分組的解包和數(shù)字 語(yǔ)音還原到模擬信號(hào)等過(guò)程。 1 1 3 推動(dòng)v o i p 發(fā)展的動(dòng)力 由于相關(guān)的硬件、軟件、協(xié)議和標(biāo)準(zhǔn)中的許多發(fā)展和技術(shù)突破,使得v 0 m 的廣泛使用很快就會(huì)變成現(xiàn)實(shí)。這些領(lǐng)域中的技術(shù)進(jìn)步和發(fā)展為創(chuàng)建一個(gè)更有 效,功能和互操作性更強(qiáng)的v 0 網(wǎng)絡(luò)起著推波助瀾的作用。推動(dòng)v 0 口飛速發(fā)展 乃至廣泛應(yīng)用的技術(shù)因素可以歸納為如下幾個(gè)方面【2 】。 1 2 1 數(shù)字信號(hào)處理器 先進(jìn)的數(shù)字信號(hào)處理器( d i s t a ls i g n a lp r o c e s s o r ,d s p ) 執(zhí)行語(yǔ)音和數(shù)據(jù)集成 所要求的計(jì)算密集的任各。d s p 處理數(shù)字信號(hào)主要用于執(zhí)行復(fù)雜的計(jì)算,否則這 些計(jì)算可能必須由通用c p u 執(zhí)行。它們的專門(mén)化的處理能力與低成本的結(jié)合使 d s p 很好地適合于執(zhí)行v o i f 系統(tǒng)中的信號(hào)處理功能。 單個(gè)語(yǔ)音流上( 3 7 2 9 語(yǔ)音壓縮的計(jì)算開(kāi)銷開(kāi)常大,要求達(dá)到2 0 m i p s ,如果 要求一個(gè)中央c p u 在處理多個(gè)語(yǔ)音流的同時(shí),還執(zhí)行路由和系統(tǒng)管理功能,這 是不現(xiàn)實(shí)的,因此,使用一個(gè)或多個(gè)d s p 可以從中央c p u 卸載其中的復(fù)雜語(yǔ)音 壓縮算法的計(jì)算任務(wù)。另外,d s f 還適合于語(yǔ)音的活動(dòng)檢測(cè)和回聲取消這樣的功 能,因?yàn)樗鼈儗?shí)時(shí)處理語(yǔ)音數(shù)據(jù)流,并能快速訪問(wèn)板上內(nèi)存。 2 高級(jí)專用集成電路 專用集成電路( a p p l i c a t i o n s p e c i f i ci n t e g r a t e dc k c a i t ,a s l c ) 發(fā)展產(chǎn)生了更快, 更復(fù)雜,功能更強(qiáng)的a s i c a s i c 是執(zhí)行單一應(yīng)用或很小的一組功能專門(mén)的應(yīng)用 芯片。由于集中于很窄的應(yīng)用目標(biāo),故它們可以對(duì)特定的功能進(jìn)行高度的優(yōu)化, 通常雙通用c p u 快一個(gè)或幾個(gè)數(shù)量級(jí)。就像精簡(jiǎn)指令集計(jì)算機(jī)( r s l c ) 芯片集中 于快速執(zhí)行扔限數(shù)目的操作一樣,a s i c 被預(yù)先編程,使其能更快地執(zhí)行有限數(shù)目 的功能。一旦開(kāi)發(fā)完成,a s i c 批量生產(chǎn)的成本并不高,被用于包括路由器和交 換機(jī)這樣的網(wǎng)絡(luò)設(shè)備,執(zhí)行路由查表,分組轉(zhuǎn)發(fā),分組分類和檢查以及排隊(duì)等功 能。a s i c 的使用使設(shè)備的性能更高,而成本更低。它們?yōu)榫W(wǎng)絡(luò)提供增加的寬帶 和更好的q o s 支持,所以對(duì)v o i p 發(fā)展起著很大的促進(jìn)作用。 3 口傳輸持術(shù) 傳輸電信網(wǎng)大多采用時(shí)分多路復(fù)用方式,因特網(wǎng)須采用的是統(tǒng)計(jì)復(fù)用變長(zhǎng)分 組交換方式,二者相比,后者對(duì)網(wǎng)絡(luò)資源利用率高,互連互通簡(jiǎn)便有效,對(duì)數(shù)據(jù) 業(yè)務(wù)十分適用,這是因特網(wǎng)得以飛速發(fā)展的重要原因之一。但是,寬帶口網(wǎng)絡(luò) 通信對(duì)q o s 和延遲特性提出了茍刻的要求,因此,統(tǒng)計(jì)復(fù)用變長(zhǎng)分組交換的技術(shù) 1 3 發(fā)展為人們所關(guān)注。目前,除已問(wèn)世的新一代口協(xié)議i p v 6 外,世界因特網(wǎng)工程 任務(wù)組( i e t f ) 提出了多協(xié)議標(biāo)記交換技術(shù)( m p l s ) ,這是一種基于網(wǎng)絡(luò)層選路的各 種標(biāo)記標(biāo)簽的交換,能提高選路的靈活性,擴(kuò)展網(wǎng)絡(luò)層選路能力,簡(jiǎn)化路由器和 基于信元交換的集成,提高網(wǎng)絡(luò)性能。m p l $ 既可以作為獨(dú)立的選路協(xié)議工作, 又能與現(xiàn)有的網(wǎng)絡(luò)選路協(xié)議兼容,支持口網(wǎng)絡(luò)的各種操作,管理和維護(hù)功能, 使口網(wǎng)絡(luò)通信的q o s 、路由、信令等性能大大提高,達(dá)到或接近統(tǒng)計(jì)復(fù)用定長(zhǎng) 分組交換( a t m ) 的水平,而又比a t m 簡(jiǎn)單、高效、便宜、適用。正1 1 f 還地抓緊 新的分組理理持術(shù),以便實(shí)現(xiàn)q o s 選路。其中正在研究“隧道技術(shù) 就是為了 實(shí)現(xiàn)單向鏈路的寬帶傳送。另外,如何選擇口網(wǎng)絡(luò)傳輸平臺(tái)也是近年來(lái)研究的 一個(gè)重要領(lǐng)域,先后出現(xiàn)了i po v e r a t m 、i po v e l s d h 、i po v e rd w d m 等技術(shù)。 第一層是基層礎(chǔ),提供高速的數(shù)據(jù)傳輸骨干??趯酉蚩谟脩籼峁└哔|(zhì)量的, 具有一定服務(wù)保證的口接入服務(wù)。用戶層提供接入形式( 口接入和寬帶接入) 和 服務(wù)內(nèi)容形式。在基礎(chǔ)層,以太網(wǎng)作為網(wǎng)絡(luò)的物理層,是理所當(dāng)然的事情, 但是i po v e l d w d m 卻上最新技術(shù),并具有很大的發(fā)展?jié)摿Α?密集波分多路復(fù)用( d e n s ew a v ed i v i s i o nm u l t i p l e x i n g ,d w o m ) 為光纖網(wǎng)絡(luò) 注入新的活力,并在電信公司鋪設(shè)新的光纖主干網(wǎng)中提供驚人的帶寬。d w d m 技術(shù)利用光纖的能力和先進(jìn)的光傳輸設(shè)備。波分多路復(fù)用的名稱是從單股光纖上 傳送多個(gè)波長(zhǎng)的光( l a s e r ) 而得來(lái)的。目前的系統(tǒng)能夠發(fā)送和識(shí)別1 6 個(gè)波長(zhǎng), 而將來(lái)的系統(tǒng)能夠支持4 0 9 6 全波長(zhǎng)。這具有重要意義,因?yàn)槊吭黾右粋€(gè)波長(zhǎng), 就增加了一個(gè)信息流。因此可以將2 6 g b i t s ( o c - 4 8 ) l 網(wǎng)絡(luò)擴(kuò)大1 6 倍,而不必鋪設(shè) 新的光纖。 大多數(shù)新的光纖網(wǎng)絡(luò)以( 9 6 g b i t s ) 的速度運(yùn)行o c 1 9 2 ,在與d w d m 結(jié)合時(shí), 在一對(duì)光纖上產(chǎn)生1 5 0 g b i t s 以上的容量。另外,d w d m 提供了接1 1 1 的協(xié)議和速 度無(wú)關(guān)的特征,在一條光纖上可同時(shí)支持a t m 、s d h 和千兆以太網(wǎng)信號(hào)的傳輸, 這樣和現(xiàn)在已建成的各種網(wǎng)絡(luò)都可以兼容,因此d w d m 既可以保護(hù)已有的設(shè)資, 還可以以其巨大帶寬為i s p 和電信公司提供了功能更強(qiáng)的主干網(wǎng),并使寬帶成本 更低和訪問(wèn)性更強(qiáng),這對(duì)v 0 m 解決方案的帶寬要求提供強(qiáng)有力的支持。增加的 1 4 傳輸速率不僅可以提供更粗的管道,使阻塞的機(jī)會(huì)更少,而且使延時(shí)降低了許多, 因此可以在很大程度上減少口網(wǎng)絡(luò)上的q o s 要求。 4 寬帶接入技術(shù) i p 網(wǎng)絡(luò)的用戶接入已成為制約全網(wǎng)發(fā)展的瓶頸。從長(zhǎng)期發(fā)展看,用戶接入 的終極目標(biāo)是光纖到戶( 刪) 。光接入網(wǎng)從廣義上講包括光數(shù)字環(huán)路載波系統(tǒng) 和無(wú)源光網(wǎng)絡(luò)兩類前者主要在美國(guó),結(jié)合開(kāi)放口v 5 1 v 5 2 ,在光纖上傳送其綜 合系統(tǒng),顯示了很大的生命力。后者主要在目本和德國(guó)。日本堅(jiān)持不懈攻關(guān)十多 年,采取一系列措施,將無(wú)源光網(wǎng)絡(luò)成本降低至與銅纜和金屬雙絞線相近的水平, 并大量使用。特別是近年r r u 提出以a t m 為基礎(chǔ)的無(wú)源光網(wǎng)絡(luò)( a p o h 3 ,將a t m 與無(wú)源光網(wǎng)絡(luò)優(yōu)勢(shì)互補(bǔ),接入速率可達(dá)6 2 2 mb i t s ,對(duì)寬帶口多媒體業(yè)務(wù)發(fā)展十 分有利,且能減少故障率和節(jié)點(diǎn)數(shù)目,擴(kuò)大覆蓋范圍目前丌u 已完成了標(biāo)準(zhǔn)化 工作,各廠家正在積極研制,不久會(huì)有商品上市,將成為面向2 1 世紀(jì)的寬帶接 入技術(shù)的主要發(fā)展方向。 目前主要采用的接入技術(shù)有:p s t n 、i s d n 、a d s l 、c m 、d d n 、x 2 5 和 e t h e m e t 以及寬帶無(wú)線接入系統(tǒng)列等。這些接入技術(shù)各有特點(diǎn),其中發(fā)展最快的 是a d s l 和c m :c m ( c a b l em o d e m ) 采用同軸電纜,傳輸速率高,抗干擾能力強(qiáng): 但是不能雙向傳輸,無(wú)統(tǒng)一標(biāo)準(zhǔn)。a d s l ( a s y m m e t r i c a ld i g i t a ll o o p ) 獨(dú)享接入寬 帶,充分利有現(xiàn)有電話網(wǎng),提供非對(duì)稱的傳輸速率,用戶側(cè)的下載速率可以達(dá)到 8m b i t s ,用戶側(cè)的上載速率可以達(dá)到1 mb i t s 。a d s l 為企業(yè)和各個(gè)用戶提供必 要的寬帶,并極大地降低成本。使用較低成本的a d s l 地區(qū)環(huán)路,現(xiàn)在公司能 以更高的速度訪問(wèn)因特網(wǎng)和基于因特網(wǎng)服務(wù)供應(yīng)商的v p n ,允許更高的v 0 呼 叫容量。 5 中央處理單元技術(shù) 中央處理單元( c p 在功能,功率和速度方面繼續(xù)發(fā)展。這使多媒體p c 能夠 廣泛應(yīng)用,并提高了受c p u 功率限制的系統(tǒng)功能的性能p c 處理流式音頻和視 頻數(shù)據(jù)的能力在用戶中期待已久,所以在數(shù)據(jù)網(wǎng)絡(luò)上傳送語(yǔ)音呼叫理所當(dāng)然成為 下一步的目標(biāo)。這個(gè)計(jì)算功能使先進(jìn)的多媒體桌面應(yīng)用和網(wǎng)絡(luò)組件中的先進(jìn)功能 都支持語(yǔ)音應(yīng)用。 1 2i l b c 的發(fā)展?fàn)顩r 1 2 1i l b c 弓i 言 自v o i p 技術(shù)面世以來(lái),業(yè)界對(duì)現(xiàn)存的低比特率編解碼器標(biāo)準(zhǔn)的關(guān)注一直不 斷。影響v 0 口設(shè)備制造和應(yīng)用開(kāi)發(fā)商的主要問(wèn)題包括涉及眾多專利持有者的復(fù) 雜知識(shí)產(chǎn)權(quán)( i p r ) 管理、昂貴的使用許可模式,以及實(shí)際m 網(wǎng)絡(luò)的低劣質(zhì)量【3 1 。 在2 0 0 0 年,g l o b a li ps o u n d ( g i p s ) 公司決定開(kāi)發(fā)一種能夠滿足v o l p 產(chǎn)業(yè)需求的 編碼,目標(biāo)是利用g i p s 內(nèi)部的專業(yè)能力開(kāi)發(fā)一款免授權(quán)費(fèi)( r o y a l t y - f r e e ) 、專為數(shù) 據(jù)包通信而設(shè)計(jì),而且在理想無(wú)錯(cuò)情況和丟包情況下都能提供高音質(zhì)的編碼,并 把它引入不同的標(biāo)準(zhǔn)化機(jī)構(gòu)以符合互操作性的要求。這就是i l b c 編碼誕生的緣 起。 目前大多數(shù)的語(yǔ)音編碼都是基于碼本激勵(lì)線性預(yù)測(cè)( c o d ee x c i t e dl i n e a r p r e d i c t i o n , c e l p ) 編碼模型的,例如兀ug 7 2 9 、g 7 2 3 1 和3 g p p a m r 。c e l p 一直都被視為在交換網(wǎng)絡(luò)中以低比特率電路獲得高質(zhì)量的一種非常成功的方法。 這種編碼方法具有高效性,主要是由于它利用了連續(xù)語(yǔ)音片斷之間的互相依賴 性,因此c e l p 編碼的性能主要取決于前面編碼的歷史。c e l p 編碼器是基于存 儲(chǔ)器的,故丟包或延遲所造成的誤差會(huì)擴(kuò)散開(kāi)來(lái),結(jié)果是單個(gè)丟包會(huì)影響到隨后 多個(gè)數(shù)據(jù)包的質(zhì)量,這顯然是數(shù)據(jù)包通信的一大缺陷。 1 2 2i l b c 編解碼器 1 6 i l b c 是為專為提供穩(wěn)健的口語(yǔ)音通信而開(kāi)發(fā)的語(yǔ)音編解碼器,以窄帶語(yǔ)音 為設(shè)計(jì)基礎(chǔ),具有8k h z 的采樣率。i l b c 編解碼器支持兩種基本的幀長(zhǎng)度:1 3 3 k b p s 比特率下編碼幀長(zhǎng)度為3 0 m s ;而1 5 2k b p s 比特率下編碼幀長(zhǎng)度則為2 0 m s 。 比特搴 果樽搴 2 0 隧 3 i ) i 鼬 飄舯i h l 1 5 旌吶1 3 3 i 吶 圖1 1 i l b c 提供的兩種編碼格式 采用i l b c 算法可以獲得一個(gè)具有丟包響應(yīng)控制的語(yǔ)音編碼系統(tǒng)。i l b c 對(duì) 每一個(gè)數(shù)據(jù)包的處理都能夠獨(dú)立于其它數(shù)據(jù)包來(lái)進(jìn)行,是數(shù)據(jù)包通信的理想選 擇。即使丟包和或延遲現(xiàn)象的惡化,這種編解碼器的語(yǔ)音質(zhì)量下降情況也不 會(huì)太差。這與基于c e l p 模型的一般編解碼器的行為不同,這類編解碼器最先是 為電路交換網(wǎng)絡(luò)或無(wú)線網(wǎng)絡(luò)而設(shè)計(jì)的,是設(shè)計(jì)來(lái)恢復(fù)位錯(cuò)誤而非丟包的。 丟包現(xiàn)象發(fā)生時(shí),語(yǔ)音編解碼器的一項(xiàng)相關(guān)基準(zhǔn)是從單個(gè)丟包情況下恢復(fù)過(guò) 來(lái)所需的幀包數(shù)量。在i l b c 的情況中,數(shù)量是零。在丟包之后的第一個(gè)數(shù)據(jù)包 總?cè)阅馨丛景才诺谋痪_解碼。 i l b c 是一種窄帶語(yǔ)音編解碼器,使用了整個(gè)4 k h z 頻帶,而大多數(shù)標(biāo)準(zhǔn)低 比特率編解碼器只利用從3 0 0 h z 到3 4 0 0 h z 的頻帶。這一點(diǎn)對(duì)音質(zhì)的影響是相當(dāng) 明顯的。此外,i l b c 語(yǔ)音編碼的頻譜特性精確模擬了原始信號(hào)的特性,其語(yǔ)音 比標(biāo)準(zhǔn)低比特率編解碼器的更自然清晰。 總而言之,i l b c 算法為數(shù)據(jù)包網(wǎng)絡(luò)實(shí)現(xiàn)了優(yōu)良的固定比特率編碼,在質(zhì)量 與比特率之間取得了非常出色的平衡。 1 2 3i l b c 的性能 1 7 g i p s 公司和一些獨(dú)立實(shí)驗(yàn)室對(duì)編解碼器的若干性能進(jìn)行了評(píng)測(cè)。2 0 0 2 年, d y n a s t a t 公司對(duì)i l b c 實(shí)施了正式的聽(tīng)力測(cè)試。2 0 0 3 年,a t & t 的音質(zhì)評(píng)估實(shí)驗(yàn) 室( v o i c eq u a l i t ya s s e s s m e n tl a b ,v q a ) 也對(duì)i l b c 編解碼器進(jìn)行了廣泛的測(cè)試。 下圖所示為d y n a s t a t 的評(píng)估結(jié)果,其根據(jù)現(xiàn)有編碼標(biāo)準(zhǔn)g 7 2 9 a 和g 7 2 3 1 對(duì)i l b c 的3 0 m s 模式進(jìn)行了標(biāo)準(zhǔn)測(cè)試。結(jié)果明顯表明,用于實(shí)際環(huán)境時(shí),i l b c 的性能卓越,即使在惡劣的網(wǎng)絡(luò)條件下,其固有的數(shù)據(jù)包網(wǎng)絡(luò)屬性也能提供很高 的質(zhì)量。 - - _ q - 一_ - - - - - i i m t l , , m m m l j ) o ( w , 4 g i n 4 , 4 1 m m m l 圖i 一2 對(duì)i l b c 、g 7 2 9 a 、g 7 2 3 1 進(jìn)行比較的結(jié)果 這些測(cè)試還顯示了i l b c 在丟包條件下的性能不僅顯著優(yōu)于目前的標(biāo)準(zhǔn)編解 碼器( g 7 2 3 1 、g 7 2 8 、g 7 2 9 、g s m 等) ,而且還等于甚至優(yōu)于理想信道( 無(wú)丟包) 條件下的標(biāo)準(zhǔn)編解碼器。 條件:理想信道 b ci s :i g 7 2 3 1l g 7 2 9lx g 7 2 9 alg g 7 2 9 e 條件:丟包 圖1 3 兩種信道下各種算法的性能優(yōu)劣 a t & t 的測(cè)試結(jié)果也顯示i l b c 中,2 0 m s 和3 0 m s 模式之間沒(méi)有顯著的性能 差異;而在丟包情況下,2 0 m s 模式甚至表現(xiàn)出更好的丟包穩(wěn)健性。a t & tv q a 實(shí)驗(yàn)室也表示,i l b c 在存在背景噪聲時(shí)的性能十分優(yōu)秀,可媲美信道無(wú)丟包的 g 7 2 9 e 。 1 2 4i l b c 的標(biāo)準(zhǔn)化 i l b c 在2 0 0 2 年3 月獲互聯(lián)網(wǎng)工程工作小組( i n t a m e te n g i n e e r i n gt a s kf o r c e , i e t f ) 認(rèn)可,成為第一個(gè)標(biāo)準(zhǔn)化的語(yǔ)音音頻編解碼器,是i e t f 視聽(tīng)傳輸工作小 組( a u d i ov i s u a lt r a n s p o r tw o r kg r o u p ) 的一部分。 2 0 0 4 年4 月,在針對(duì)多媒體終端適配器( m u l t i p l et e r m i n a la d a p t e r , m t a ) 和 媒體網(wǎng)關(guān)發(fā)布的c a b l e l a b sp a c k c t c a b l e t m1 1 音頻視頻編解碼器規(guī)范中,i l b c 被規(guī)定為一種強(qiáng)制式編解碼器。 1 2 5 宴現(xiàn)方案 目前,好幾家v o 口設(shè)備及應(yīng)用生產(chǎn)商都在自己的產(chǎn)品中集成了i l b c 。在應(yīng) 用或軟件電話中選用了i l b c 的公司有:s k y p e 、n o r t e l 、w e b e x 、h o t s i p 、m a r r a t e c h 、 g a t e l i n x 、k - p h o n e 、x t e n ;在口電話中選用了i l b c 的公司有:w o r l d g a t e 、 g r a n d s t r e a m 、p i n g t e l :在芯片中選用了i l b c 的公司有:a u d i o c o d c s 、t it e l o g y 、 l e a d t e k 、m i n d s p e e d 。 1 3 論文主要工作及內(nèi)容安排 1 3 1 主要任務(wù)及工作 主要任務(wù)及工作是將標(biāo)準(zhǔn)的c 語(yǔ)言i l b c 語(yǔ)音算法在a r l 6 8 8 這個(gè)d s p 芯片 1 9 上實(shí)現(xiàn),使之能夠在m 系統(tǒng)的話機(jī)終端上得到應(yīng)用。 工作開(kāi)始時(shí)首先是對(duì)標(biāo)準(zhǔn)的定點(diǎn)c 語(yǔ)言i l b c 語(yǔ)音算法進(jìn)行研究,分析每個(gè) 函數(shù)功能,分割各個(gè)功能模塊,找出各種接口參數(shù),使之與要轉(zhuǎn)換的d s p 匯編 語(yǔ)言進(jìn)行對(duì)應(yīng),以便接下來(lái)的代碼轉(zhuǎn)換工作。 然后就是把c 語(yǔ)言代碼轉(zhuǎn)換成d s p 匯編語(yǔ)言代碼,初次轉(zhuǎn)換時(shí)主要考慮函 數(shù)功能的實(shí)現(xiàn)和函數(shù)結(jié)果的精確。 接下來(lái)的工作就是對(duì)d s p 匯編語(yǔ)言代碼進(jìn)行測(cè)試和優(yōu)化,利用運(yùn)算指令的 特點(diǎn)和記憶單元對(duì)數(shù)據(jù)的保留性以及一些并行單元的并行處理能力對(duì)代碼進(jìn)行 優(yōu)化。 最后,把d s p 代碼編譯到d s p 芯片上,測(cè)試代碼是否能在實(shí)際話機(jī)上運(yùn)行。 1 3 2 論文內(nèi)容安捧 基于前面的工作分析,本論文的內(nèi)容安排如下: 第一章是緒論,該章對(duì)v o l p 和i l b c 的發(fā)展?fàn)顩r等背景做了簡(jiǎn)單介紹。 第二章是i l b c 算法研究,該章從普通語(yǔ)音算法開(kāi)始,對(duì)i l b c 語(yǔ)音算法的 編碼器和解碼器做了詳細(xì)的研究。 第三章是a d s p 2 1 0 0 系列芯片,介紹課題所使用硬件平臺(tái)。 第四章是i l b c 的d s p 實(shí)現(xiàn),主要完成代碼的轉(zhuǎn)換工做和對(duì)轉(zhuǎn)換后的代碼進(jìn) 行測(cè)試及優(yōu)化。 第五章是總結(jié)和展望,對(duì)整個(gè)論文進(jìn)行了總結(jié)。 第二章i l b c 算法研究 2 1 普通語(yǔ)音算法研究 一般把編碼速率低于4 6 k b s 的語(yǔ)音編解碼器稱為低比特率編碼器,而把編 碼速率介于4 6 k b s - - 一2 4 k b s 的編碼器稱為中比特率編碼器。按照這個(gè)劃分標(biāo) 準(zhǔn),y o i p 系統(tǒng)中常用的語(yǔ)音編解碼器均屬于中比特率編碼器的范疇。 2 1 1 語(yǔ)音模型 按照激勵(lì)源的不同,可把語(yǔ)音分為三類:濁音,位于聲門(mén)處的準(zhǔn)周期脈沖序 列;清音,位于聲道的某個(gè)收縮區(qū)的空氣湍流( 類似于噪聲) ;爆破音,位于聲道 某個(gè)閉合點(diǎn)處建立起來(lái)的氣壓及其突然釋放。 根據(jù)發(fā)聲器官和語(yǔ)音的產(chǎn)生過(guò)程,在實(shí)際應(yīng)用中為了簡(jiǎn)化語(yǔ)音信號(hào)產(chǎn)生的數(shù) 字模型,激勵(lì)源分為濁音和清音兩類,濁音由周期性脈沖序列激勵(lì)產(chǎn)生,清音由 隨機(jī)白噪聲激勵(lì)產(chǎn)生,為了使?jié)嵋舻募?lì)信號(hào)具有聲門(mén)氣流脈沖的實(shí)際波形,還 需要將脈沖序列通過(guò)一個(gè)聲門(mén)脈沖模型濾波器,其傳輸函數(shù)表示為【4 】: g 2 而初 式( 2 - 1 ) 語(yǔ)音的激勵(lì)氣流經(jīng)聲道傳至嘴唇,由嘴唇向外輻射。嘴的張開(kāi)情況會(huì)影響語(yǔ) 音信號(hào)頻譜的形狀,嘴唇處輻射模型的傳輸函數(shù)可以由下式表示: r ( z ) - r o - z 1 ) i i ( 2 2 ) 下圖給出了語(yǔ)音產(chǎn)生的離散時(shí)域模型。它包括三個(gè)部分:激勵(lì)源、聲道模型 和輻射模型。激勵(lì)源分濁音和清音兩個(gè)分支,按照濁音清音開(kāi)關(guān)所處的位置來(lái) 決定產(chǎn)生的語(yǔ)音是濁音還是清音。 彳覃虬血, 一遺9 置 虬蚺 一啊青信 饋?zhàn)蟞 鬈磐p y ( z ) ii 衛(wèi)z 【 圖2 - i 語(yǔ)音產(chǎn)生離散時(shí)域模型 在濁音的情況下,激勵(lì)信號(hào)由一個(gè)周期脈沖發(fā)生器產(chǎn)生。所產(chǎn)生的序列是一 個(gè)周期為n o 的沖激序列,即每隔n o 點(diǎn)便有一個(gè)樣值為l ,而其他樣值皆為0 。 周期n o 取決于基音頻率f 0 和語(yǔ)音信號(hào)的采樣頻率f s ,n 0 = f s f 0 ,其中6 和f 0 皆以i - i z 計(jì)量。當(dāng)f s = 8 k h z ,f 0 的變化范圍為5 0 4 5 0 h z 時(shí),n o 的變化范圍是 1 8 1 6 0 。為了使?jié)嵋舻募?lì)信號(hào)具有聲門(mén)氣流脈沖的實(shí)際波形,還要使上述的 沖激序列通過(guò)一個(gè)聲門(mén)脈沖模型濾波器,其z 域傳輸函數(shù)為g ( z ) 。對(duì)聲門(mén)波 形的頻譜分析表明其幅度頻譜按每倍頻程1 2 d b 的速度遞減。如果令g ( z ) = i ( i - - g l z - 1 ) ( i - - g a z _ 1 ) ,其中g(shù) l 和9 2 都很接近于l ,那么由之形成的濁音激勵(lì)信號(hào) 頻譜很接近于聲門(mén)氣流脈沖的頻譜。乘以系數(shù)a v 作用是調(diào)節(jié)濁語(yǔ)音信號(hào)的幅度 或能量。在清音的情況下,激勵(lì)信號(hào)由一個(gè)隨機(jī)噪聲發(fā)生器產(chǎn)生??稍O(shè)其平均值 為0 ,其自相關(guān)函數(shù)是一個(gè)單位沖激函數(shù)。這表明它的任何兩個(gè)不同樣點(diǎn)都不相 關(guān)且其均方差值為l 。此外還假定它的幅度具有正態(tài)概率分布( 高斯分布) 。乘 系數(shù)a v 的作用是調(diào)節(jié)清語(yǔ)音信號(hào)的幅度或能量。 聲道模型v ( z ) 給出了離散時(shí)域的聲道傳輸函數(shù),把實(shí)際聲道作為一個(gè)變 截面聲管加以研究,采用流體力學(xué)的方法可以導(dǎo)出,在大多數(shù)情況下它是一個(gè) 全極點(diǎn)函數(shù)i s 。這樣v ( z ) 可以表示為: 一 y ( z ) = 式( 2 3 ) 亨g 一4 5 1 7 d 一 l f = 0 其中= l 、q 為實(shí)數(shù),這里,把截面積連續(xù)變化的聲管近似p 段短聲管的串聯(lián), 每段短聲管的截面積是不變的,p 稱為這個(gè)全極點(diǎn)濾波器的階。顯然,p 值取得 越大,模型的傳輸函數(shù)與聲道的實(shí)際傳輸函數(shù)的吻合度越高。但是對(duì)大多數(shù)實(shí)際 應(yīng)用而言,p 值取8 - - 1 2 就夠了。若p 取偶數(shù),v ( z ) 一般有p 2 對(duì)共軛極點(diǎn),r k e x p +

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論