版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、gsm移動通信系統(tǒng)的語音編碼技術(shù)研究speech coding techniques of gsm mobile communication system 專 業(yè):電子信息科學與技術(shù)學 號:姓 名:指導教師: 目錄內(nèi)容摘要iabstractii第一章 引言1第二章 gsm移動通信系統(tǒng)22.1 gsm移動通信系統(tǒng)簡介22.2 gsm移動通信系統(tǒng)的總體結(jié)構(gòu)22.2.1 移動臺(mobile station)22.2.2 基站子系統(tǒng)bss(base station sub-system)22.2.3 網(wǎng)絡子系統(tǒng)nss(network sub-system)22.2.4 操作支持子系統(tǒng)oss(oper
2、ations sub-system)3第三章 gsm系統(tǒng)的語音編碼簡介4第四章 語音編碼的發(fā)展現(xiàn)狀5第五章 語音編碼質(zhì)量的評定75.1 客觀評定方法75.2 主觀評定方法76.1 語音編碼技術(shù)的分類86.1.1 波形編碼86.1.2 聲碼器96.1.3 混合編碼106.2 分析gsm系統(tǒng)中的語音編碼技術(shù)多脈沖激勵lpc106.2.1 多脈沖激勵lpc編碼器的組成116.2.2 編碼過程116.2.3 多脈沖激勵lpc譯碼器的組成11第七章 語音編碼芯片12第八章 語音編碼技術(shù)進展13結(jié)束語14參考文獻15致謝16內(nèi)容摘要由于gsm系統(tǒng)的技術(shù)成熟、管理靈活、完善的技術(shù)規(guī)范,在歐洲取得很大的成功之
3、后,在世界上許多國家更是得到廣泛的應用,已成為陸地公用移動通信系統(tǒng)的主要系統(tǒng)。而gsm系統(tǒng)中語音編碼是很重要的,因為語音編碼往往決定了接受到的語音質(zhì)量和系統(tǒng)的容量。在移動通信系統(tǒng)中,信道帶寬始終是一個突出的問題。因此,業(yè)務提供商面臨的問題是:如何在有限的可分配的帶寬內(nèi)容納更多的用戶?由此可見gsm移動電話系統(tǒng)中語音編碼技術(shù)仍然有廣泛的前景?,F(xiàn)代通信的重要標志是實現(xiàn)數(shù)字化,而要實現(xiàn)數(shù)字化首先得把模擬信號變換成為數(shù)字信號,這種變換對語音信號來說就是語音編碼。為了提高語音編碼和語音信號數(shù)字傳輸?shù)挠行裕ǔ_€要進行語音壓縮編碼,這就是本文要討論的中心課題。關(guān)鍵詞: gsm,編碼技術(shù),語音編碼,參量編
4、碼abstractbecause of its technical maturity, flexible management and good technical norms, the gsm system has been used widely in many countries after it achieved great success in europe. and now it has become a common system for mobile communications system all over the world. gsm voice-coding syste
5、m is very important because voice-coding often sees the decision of voice quality and system capacity. in the mobile communication system, channel bandwidth is a prominent problem. therefore, the business providers face a problem is that how can the limited distribution of the bandwidth satisfy more
6、 customers? so gsm mobile telephone system voice coding technology is a broad prospect. an important indicator in modern communications is digital. in order to transform analog signals into digital signals, which transformation of the speech signal example is called speech code .to improve speech co
7、ding and voice signals in the validity of digital transmission, voice must be coded, which is the central issue in the paperkey words: gsm,coding technology,voice coding,parameter coding 第一章 引言移動通信發(fā)展到現(xiàn)在,經(jīng)歷了由模擬到數(shù)字的變化,早期的移動通信系統(tǒng)是 amps和etacs為代表的模擬移動通信系統(tǒng)。90年代,隨著移動通信擁護數(shù)量的增加,用戶對跨地區(qū),跨國漫游以及各種增值服務要求也隨之增加,同時數(shù)字
8、通信技術(shù)發(fā)展也日趨成熟,歐洲的移動通信運營商開始考慮發(fā)展一種新型的數(shù)字移動通信系統(tǒng),由于數(shù)字通信系統(tǒng)的優(yōu)點,如:頻譜效率高、容量大、業(yè)務種類多、保密性好、話音質(zhì)量好、網(wǎng)絡管理能力強等,使得數(shù)字通信網(wǎng)得到迅猛發(fā)展。特別是gsm系統(tǒng),技術(shù)成熟、管理靈活、有完善的技術(shù)規(guī)范,在歐洲取得很大的成功之后,在世界上許多國家更是得到廣泛的應用,已成為陸地公用移動通信的主要系統(tǒng)3。在移動系統(tǒng)中,語音編碼是很重要的,因為語音編碼往往決定了接受到的語音質(zhì)量和系統(tǒng)的容量5。由于大容量通信信道的引入,一段時間內(nèi)曾認為語音壓縮技術(shù)已經(jīng)沒有研究的必要,因為語音壓縮相對于光纖信道容量來說已經(jīng)微不足道。實際上,光纖信道目前也只
9、是在骨干網(wǎng)上得到應用,在接入網(wǎng)及支線的大規(guī)模應用仍需要一定的時間。另外,在移動通信系統(tǒng)中,信道帶寬始終是一個突出的問題。因此,業(yè)務提供商面臨的問題是: 如何在有限的可分配的帶寬內(nèi)容納更多的用戶。由此可見gsm移動電話系統(tǒng)中,低速率語音編碼技術(shù)仍然有廣泛的應用前景。在編碼器能夠傳送高質(zhì)量語音的前提下,如果比特率低,就能夠在一定的帶寬內(nèi)容納更多的語音通道。第二章 gsm移動通信系統(tǒng)2.1 gsm移動通信系統(tǒng)簡介gsm全稱數(shù)字蜂窩移動通信系統(tǒng)(global system for mobile communication ),俗稱“全球通”, 目前我國的移動通信網(wǎng)就是以gsm系統(tǒng)為基礎的移動網(wǎng)絡系統(tǒng)。
10、它依照歐洲通信標準化委員會(etsi)制定的gsm規(guī)范研制而成,是第二代移動通信技術(shù)(2g)。其開發(fā)目的是讓全球各地可以共同使用一個移動電話網(wǎng)絡標準,讓用戶使用一部手機就能行遍全球。2.2 gsm移動通信系統(tǒng)的總體結(jié)構(gòu)gsm移動通信系統(tǒng)是一種典型的基于tdma的數(shù)字蜂窩移動通信系統(tǒng),總體結(jié)構(gòu)由以下功能單元組成10:2.2.1 移動臺(mobile station)它包括移動設備(me)和用戶識別模塊(sim)。根據(jù)業(yè)務的狀況,移動設備可包括移動終端(mt),終端適配功能(taf)和終端設備(te)等功能部件。2.2.2 基站子系統(tǒng)bss(base station sub-system)1) 基
11、站(bts):為一個小區(qū)服務的無線收發(fā)信設備。2) 基站控制器(bsc):具有對一個或多個bts進行控制以及相應呼叫控制的功能,bsc以及相應的bts組成了bss(基站子系統(tǒng))。bss是在一定的無線覆蓋區(qū)中,由移動業(yè)務交換中心(msc)控制,與ms進行通信的系統(tǒng)設備。a. 接口管理b. btsbsc之間的地面信道管理c. 無線參數(shù)及無線資源管理d. 測量和統(tǒng)計e. 切換3) 基站發(fā)信臺(bts):受控于基站控制器(bsc),屬于基站子系統(tǒng)(bss)的無線部分,服務于某小區(qū)的無線收發(fā)信設備,實現(xiàn)bts與移動臺(ms)空中接口的功能。bts主要分為基帶單元、載頻單元和控制單元三部分。基帶單元主要用
12、于話音和數(shù)據(jù)速率適配以及信道編碼等;載頻單元主要用于調(diào)制/解調(diào)與發(fā)射機/接收機間的耦合;控制單元則用于bts的操作與維護。 bts中存儲編碼算法a5和密鑰kc,用于解密接收到的密文形式的用戶數(shù)據(jù)和信令數(shù)據(jù)(包括解密)。2.2.3 網(wǎng)絡子系統(tǒng)nss(network sub-system)1)移動業(yè)務交換中心(msc):對于位于它管轄區(qū)域中的移動臺進行控制交換的功能實體。2)拜訪位置寄存器(vlr):msc為所管轄區(qū)域中ms的呼叫接續(xù),所需檢索信息的數(shù)據(jù)庫。vlr存儲與呼叫處理有關(guān)的一些數(shù)據(jù),例如用戶的號碼,所處位置區(qū)的識別,向用戶提供的服務等參數(shù)。 3)歸屬位置寄存器(hlr):管理部門用于移動
13、用戶管理的數(shù)據(jù)庫。每個移動用戶都應在其歸屬位置寄存器注冊登記。hlr主要存儲兩類信息,有關(guān)用戶的參數(shù)和有關(guān)用戶目前所處位置的信息。 4)設備識別寄存器(eir):存儲有關(guān)移動臺設備參數(shù)的數(shù)據(jù)庫。主要完成對移動設備的識別、監(jiān)視、閉鎖等功能。 5)鑒權(quán)中心(auc):認證移動用戶的身份和產(chǎn)生相應鑒權(quán)參數(shù)(隨機數(shù)rand,符號響應sres,密鑰kc)的功能實體。2.2.4 操作支持子系統(tǒng)oss(operations sub-system)操作維護系統(tǒng)中的各功能實體。依據(jù)廠家的實現(xiàn)方式可分為無線子系統(tǒng)的操作維護中心(omc-r)和交換子系統(tǒng)的操作維護中心(omc-s)。gsm系統(tǒng)可通過msc實現(xiàn)與多種
14、網(wǎng)絡的互通,包括pstn、isdn、plmn和pspdn。以上是gsm的四個分系統(tǒng),各分系統(tǒng)之間都有定義明確且詳細的標準化接口方案,保證任何廠商提供的gsm 系統(tǒng)設備可以互連。同時,gsm 系統(tǒng)與各種公用通信網(wǎng)之間也都詳細定義了標準接口規(guī)范,使gsm 系統(tǒng)可以與各種公用通信網(wǎng)實現(xiàn)互連互通。gsm 系統(tǒng)除了可以開放基本的話音業(yè)務外,還可以開放各種承載業(yè)務、補充業(yè)務以及與isdn 相關(guān)的各種業(yè)務。gsm 系統(tǒng)采用 fdma/tdma 及跳頻的復用方式,頻率重復利用率較高,同時它具有靈活方便的組網(wǎng)結(jié)構(gòu),可滿足用戶的不同容量需求。gsm 系統(tǒng)具有較強的鑒權(quán)和加密功能,能確保用戶和網(wǎng)絡的安全需求,系統(tǒng)抗
15、干擾能力較強,通信質(zhì)量教高2。gsm系統(tǒng)工作頻段分配為:gsm900mhz頻段為:890915mhz(移動臺發(fā),基站收),935960mhz(基站發(fā),移動臺收);dcs 1800mhz 頻段為:17101785mhz(移動臺發(fā),基站收),18051880mhz(基站發(fā),移動臺收)。第三章 gsm系統(tǒng)的語音編碼簡介語音編碼就是對模擬的語音信號進行編碼,將模擬信號轉(zhuǎn)化成數(shù)字信號,從而降低傳輸碼率并進行數(shù)字傳輸,語音編碼的基本方法可分為波形編碼和參量編碼,波形編碼是將時域的模擬話音的波形信號經(jīng)過取樣、量化、編碼而形成的數(shù)字話音信號,參量編碼是基于人類語言的發(fā)音機理,找出表征語音的特征參量,對特征參量
16、進行編碼1。歐洲gsm系統(tǒng)用的是剩余激勵性預測編碼/長期預測(relp/lpt)。這種方法把來自送話器的話音信號經(jīng)過8khz抽樣,13bits均勻量化變?yōu)?04kbps的數(shù)據(jù)流,數(shù)據(jù)流進入話音編碼器進行規(guī)則脈沖激勵-長期預測(rpe-ltp)編碼。pre-ltp編碼屬于中速率混合型編碼,為提取特征參數(shù)而作的語音分析利用了語音信號的準平穩(wěn)性,即在1020ms的短時間內(nèi)可認為語音的特征參數(shù)不變。因此可將實際語音信號分成短時間段,在各個段內(nèi)分別進行參量提取。gsm系統(tǒng)的編碼處理是按幀進行的,每幀20ms,含160個語音樣本,經(jīng)話音編碼后為260bits的編碼塊,即話音編碼后的信號速率為13kbps。
17、同時gsm標準(phase2+)要求移動臺對語音進行檢測,將每個時間段分為有聲段和無聲段。在有聲段,進行語音編碼產(chǎn)生編碼語音幀;在無聲段,對背影噪聲進行估計,產(chǎn)生sid幀(靜寂描述幀)。發(fā)射機采用不連續(xù)發(fā)射方式,即僅在包含語音幀的時間段內(nèi)才開發(fā)射機。sid幀是在語音段結(jié)束時發(fā)射的。接收端根據(jù)受到的sid幀的信息在無聲期內(nèi)插入舒適噪聲。13kbps的話音信號進入信道編碼進行編碼。relp/lpt編碼后每幀長20ms,編碼速率為13kbps,有希望降到6.5kbps,這是一種既簡化編碼又能使合成波形失真較小的方法。第四章 語音編碼的發(fā)展現(xiàn)狀按照不同使用要求,目前已研究出不同的語音編碼方法,并制定了
18、相應的標準,在表1中對這些標準作了歸納。由此表可見,64和32kbps編碼技術(shù)已經(jīng)成熟,早已制定出國際標準算法。16kbps編碼方法,ccitt也已于前面發(fā)布了建議(g .728),其基本要求是:語音質(zhì)量足以適應多級編譯碼、處理時延低,足以克服回聲影響,以及處理音頻的非語音信號的能力。ccitt的建議采用一種后向自適應低延遲碼激勵線性預測(low delay-code excited linear prediction . ld-celp)算法15。 表1編碼速率(kbps)6432161384.82.46.4標準制定年代1972198619911988198919891975標準制定組織cc
19、ittccittccittgsmctiansansa海事衛(wèi)星編碼方法pcmadpcmld-celprpe-ltpvselpcelplpcmbe語音質(zhì)量mos4.34.143.73.0+2.5*drt959494*93+93+90dam736870*68*67-54主要用途通 信 網(wǎng)移動通信語音郵件保密電話移動通信注:ccitt-consulatative communicate for telephone and telegraph gsm-group special mobiale ctia-celuar technology industry association nsa-nationa
20、l security agency*估計值 , 上界, + 下界由上述可見,自64kbps至16kbps的語音編碼質(zhì)量,目前已可達到近于透明(mos分4.0以上)的質(zhì)量標準。13kbps及8kbps的語音編碼都是為移動通信制定的。13kbps是歐共體國家制定的標準,它采用規(guī)則脈沖激勵長時線性預測(regular pulse excited-long term prediction,rpe-ltp)方案。8kbps是美國ctia制定的標準,它采用矢量和激勵線性預測(vector sum excited linear prediction,vselp)方案。它們的質(zhì)量僅達到了“通信質(zhì)量”(mos3
21、.5以上)尚未達到透明或近于透明。這一級的語音編碼方法還有待于進一步研究,提高語音質(zhì)量。海事衛(wèi)星組織(inmarsat)制定的6.4kbps標準采用多帶激勵(multi-band excited,mbe)線性預測算法。6.4kbps中僅4.15kbps用于語音編碼,其余2.25kbps用于糾錯編碼。更低速率的語音編碼標準速率為4.8kbps和2.4kbps。2.4kbps的語音編碼信號由于可以通過2.4kbps的全雙工調(diào)解器進入pstn,使用價值極大,一直是人們研究和關(guān)注的重點。美國國防部國家安全局已于1975年制定了一個標準(lpc-10),采用典型參量編碼線性預測方案,語音質(zhì)量不能另人滿意
22、。因此,美國國防部在新的標準lpc-10e,它是在原方案基礎上改進的。新方案的語音質(zhì)量有所提高,但是對于非語音(例如,咳嗽、口哨、脈沖噪聲等)信號的處理還不另人滿意。因此,1988年12月美國國防部又頒布了1.8kbps標準。它的語音質(zhì)量教好,抗干擾和環(huán)境噪聲能力強,清晰度測試得分高于16kbps連續(xù)變斜率增量調(diào)制cvsd)的性能,達到drt93%,可以和32kbps的cvsd質(zhì)量相比較。這個4.8kbps標準采用的是一種混合編碼算法(celp),這種方案具有今后擴展的可能,并具有抗信道誤碼和環(huán)境噪聲的能力。目前,這一方案可以用單片新一代的dsp實現(xiàn),它將用于美國地面移動通信網(wǎng)中。nasa表示
23、將采用它于移動衛(wèi)星通信網(wǎng)中,nato也將要規(guī)定其作為nato的標準。第五章 語音編碼質(zhì)量的評定在語音編碼技術(shù)中,對語音質(zhì)量的評價是一個很重要的問題。如何評價語音編碼質(zhì)量歸納起來大致可以分為兩類,即客觀評定方法和主觀評定方法11。5.1 客觀評定方法用客觀測量的手段來評價語音編碼的質(zhì)量,常用的方法有信噪比,加權(quán)信噪比,平均分段信噪比等。它們都是建立在度量均方誤差的基礎上,其特點是計算簡單,但是不能完全反應人對語音質(zhì)量的感覺。這個問題對于速率為16kbits/s以下的中、低速率語音編碼尤為突出,因此主要適用于速率較高的波形編碼類型。5.2 主觀評定方法該方法符合人類聽話時對語音質(zhì)量的感覺,因而目前
24、得到廣泛應用。最主要的主觀評定方法是主觀評定等級(subjective opinion scale),或稱平均評價得分(mean opinion score)mos等級。mos得分采用五級評分標準,其方法是,由數(shù)十名視聽者在相同信道環(huán)境中視聽并給予評分,然后對評分進行統(tǒng)計處理,求出平均得分。由于主觀和客觀上的種種原因,每次視聽所得的評分會有波動。為了減小波動的誤差,除了試聽者人數(shù)要足夠多之外,所測語音材料也要足夠豐富,視聽環(huán)境也應盡量保持相同12。另外,試聽者對語音質(zhì)量的主觀感覺往往是何其注意力集中程度相聯(lián)系的,因而,對應于主觀評定等級,還有一個收聽注意力等級(listening effect
25、 scale)。表2給出主觀評定等級的質(zhì)量等級,分數(shù)和相應的收聽注意力等級。從用戶角度看,通常認為mos分4.04.5分為高質(zhì)量語音編碼,達到長途電話網(wǎng)的質(zhì)量要求。mos分3.5分左右稱為通信質(zhì)量,這時聽者能夠感覺到語音質(zhì)量有所下降,但不影響正常的通話,可以滿足多數(shù)通信系統(tǒng)的使用要求。mos分3.0分以下常稱為合成語音質(zhì)量,這種語音一般只有足夠高的可懂度,但是自然度教差,不容易識別講話者,這樣話音質(zhì)量不超過3分13。質(zhì)量等級分數(shù)收聽注意力等級優(yōu)5可完全放松,不需要注意力良4需要注意,但不需明顯集中注意力滿意(正常)3中等程度的注意力差2需要集中注意力劣1即使努力去聽,也很難聽懂表2 第六章 語
26、音編碼技術(shù)6.1 語音編碼技術(shù)的分類語音編碼主要有三種方式: 波形編碼、聲碼器和混合編碼, 通常把編碼速率低于64 kbps 的語音編碼方式稱為語音壓縮編碼技術(shù). 下面分別介紹這三種編碼方法。6.1.1 波形編碼波形編碼是將時間域信號直接變換為數(shù)字代碼,力圖使重建語音波形保持原語音信號的波形形狀。波形編碼的基本原理是在時間軸上對模擬語音按一定的速率抽樣,然后將幅度樣本分層量化,并用代碼表示。解碼是其反過程,將收到的數(shù)字序列經(jīng)過解碼和濾波恢復成模擬信號。可以看出,波形編碼的設計基本上是與信號源分離的,因此對各種各樣的信號進行編碼均可以達到很好的效果。波形編碼包括時域編碼和頻域編碼。時域編碼. 時
27、域編碼主要有脈沖編碼調(diào)制( pcm) 、增量調(diào)制(m) 、自適應差分脈碼調(diào)制(adpcm) 、自適應增量調(diào)制(adm) 、自適應預測編碼(apc) 等.線性pcm 是用同等的量化級進行量化, 沒有利用聲音的性質(zhì), 所以信息沒有得到壓縮, 對數(shù)pcm 利用了語音信號幅度的統(tǒng)計特性, 對幅度按對數(shù)變換壓縮, 將壓縮的結(jié)果作線性編碼, 在接收端解碼時, 按指數(shù)擴展, 這種方法在數(shù)字電話通信中得到了廣泛的應用, 現(xiàn)有的pcm 采用編碼速率為64 kbps 的a 律律對數(shù)壓擴方法. 由于對數(shù)pcm 廣泛應用于通信系統(tǒng)中, 而線性pcm 可以直接進行二進制運算, 所以一般速率低于64 kbps 的語音編碼
28、系統(tǒng)多是先進行對數(shù)pcmo線性pcm 變換后, 再采用信號處理器進行語音信號數(shù)字處理. pcm 最大缺點是數(shù)碼率高, 在傳輸時所占頻帶較寬.差分脈碼調(diào)制(dpcm) 是根據(jù)相鄰采樣值的差值信號進行編碼, adpcm 是在dpcm 的基礎上發(fā)展起來的, 其量化器與預測器的參數(shù)能根據(jù)輸入信號的統(tǒng)計特性自適應于最佳或接近于最佳參數(shù)狀態(tài). adpcm 是語音編碼中復雜程度較低的一種方法.增量調(diào)制是根據(jù)信號的瞬值是否增大或減小, 即根據(jù)增量編碼, 用一位二進制碼序列對模擬信號進行編碼. 這種方法簡單, 實現(xiàn)容易, 但由于量階固定, 量化噪聲功率固定, 所以當信號下降時, 信噪比(snr) 下降. 為了改
29、進這種方法的動態(tài)范圍, 引進了自適應技術(shù), 讓量階的大小隨輸入信號的統(tǒng)計特性變化而變, 這種方法稱為自適應增量調(diào)制(adm) . cvsd 是讓量階的大小隨音節(jié)時間間隔(520 ms) 中信號平均斜率變化, 信號的斜率是通過輸出連“0”或連“1”來檢測的. adm 編碼器簡易, 同步簡單, 成本低, 是數(shù)字移動通信中較好的一種語音編碼方法. apc 是根據(jù)語音的統(tǒng)計特性, 由過去的采樣值精確預測出當前樣值的一種編碼方法, 它是通過自適應預測器來提高預測精度的, 預測得越精確, 編碼速率越低, 這種方法可以做到低速率(10 kbps 以下) , 并且音質(zhì)與電話音質(zhì)相似.6頻域編碼. 頻域編碼方式
30、主要有子帶編碼(sbc) 和自適應變換編碼(atc)sbc 是利用帶通濾波器將語音頻帶分成若干子帶, 并且分別進行采樣、編碼, 編碼方式可以用adpcm 或adm , sbc 速率可以達到9. 6 kbps . 可變sbc 可使子帶的設計不固定, 而是隨共振峰變化, 使編碼速率進一步提高, 這種方式在速率為4. 8 kbps 時可具有相當于7. 2 kbps 的固定sbc 的語音質(zhì)量.atc 是先將語音信號在時間上分段, 每一段信號一般有64512 個采樣, 再將每段時域語音數(shù)據(jù)經(jīng)正交變換轉(zhuǎn)換到頻域, 得到相應的各組頻域系數(shù), 然后分別對每一組系數(shù)的每個分量單獨量化、編碼和傳輸, 在接收端解碼
31、得到的每組系數(shù)再進行頻域至時域的反變換, 恢復時段信號, 最后將各時段連接成語音信號, atc 編碼在速率為1216 kbps 可得到優(yōu)質(zhì)語音.脈沖編碼調(diào)制(pcm) 、差分脈沖編碼調(diào)制(dpcm) 、自適應差分脈沖編碼調(diào)制(adpcm) 、增量調(diào)制(m) 、自適應增量調(diào)制(adm) 、連續(xù)可變斜率增量調(diào)制(cvsdm) 、自適應預測編碼(apc) 、自適應變換編碼(atc) 、子帶編碼(sbc)等,都屬于波形編碼技術(shù)。波形編碼器從64kbit/s到16kbit/s的比特率,如果速率在16kbit/s以下,語音波形編碼的話音質(zhì)量通常迅速下降8。波形編碼適用于很寬范圍的語音特性,以及在噪音環(huán)境下
32、,它們都保持穩(wěn)定。因此,它具有適應能力強、語音質(zhì)量(64kbpspcm的mos一般為4.3分)好等優(yōu)點。但是所用的編碼速率高,在對信號帶寬要求不太嚴格的通信中得到應用,而對于頻率資源相對緊張的gsm系統(tǒng)來說,這種編碼方式顯然不合適。6.1.2 聲碼器所謂聲碼器是根據(jù)發(fā)音模型, 分析并提取語音信號的特征參數(shù), 且只傳送能夠合成語音信息的參數(shù), 不需要再現(xiàn)原語音的波形, 典型的聲碼器有譜帶式、共振峰式和按線性預測分析(l pc) 所組成的聲碼器等.( 簡單的說,聲碼器是以發(fā)聲機制的模型為基礎,確定了 一套模擬聲帶頻譜特性的濾波系數(shù)和若干聲源參數(shù),把這一套濾波器系數(shù)和聲源參數(shù)傳送到接受機,在接收機里
33、合成話音。)譜帶式聲碼器在發(fā)送語音信號的三種信息, 其中一種信息是使語音信號通過1020 個并聯(lián)帶通濾波器, 通過檢波得到信號的包絡值, 再用50 hz 或30 hz 的幀頻傳送, 另一種信息是聲帶音調(diào), 通過音調(diào)控制器從語音中分析出基音頻率, 并送出相應的電壓信號, 第三種信息是語音中的“濁”音、“清”音, 將上述信息通過采樣、量化、編碼, 合成發(fā)送出去, 在接收端設置蜂音, 噪聲發(fā)生器, 產(chǎn)生周期脈沖, 其頻率與基音相等, 發(fā)生器的輸出由濁音、清音檢測控制開關(guān)的交替通斷, 再被發(fā)送端送來的相應信息調(diào)制, 就得到合成的語音, 其速率可壓縮到2. 4 kbps .共振峰聲碼器是利用語音頻帶中的
34、共振峰信息進行編碼, 它的速率可壓縮到1. 2 kbps , 這種方法存在的問題是要準確地提取共振峰的頻率比較困難.線性預測聲碼器(l pc) 是一種比較有實用價值的聲碼器, 典型的方法如美國國家安全局于1975 年及1986 年選定的線性預測編碼(l pc 10) 及改進型線性預測編碼(l pc 10e) , 數(shù)碼率為2. 4 kbps , 用10 階線性預測的方法提取聲道參數(shù), 采用區(qū)分濁音和清音的二元激勵, 清音用白噪聲和濁音用周期為基音周期的脈沖序列合成語音, 用這種方法傳輸, 還原出來的語音的清晰度、可懂度仍很高.lpc為線性預測分析,是聲源編碼技術(shù)之一。它供一組語音信號模擬參數(shù),該
35、參數(shù)教精確地表征了語音信號的頻率幅度。線性預測由過去的樣本值來預測或估計當前信號的結(jié)束值,該值為線性預測值。線性預測誤差是信號值與線性預測值之差。設計一個預測誤差濾波器,使得在某個預定的準則條件下誤差最小,這個過程稱為線性預測分析(lpc) 。lpc模型中的所有模型參數(shù)都必須隨時間不斷修正,對于不同的音素(如聲母、韻母可分為輔音、單元音、復元音、復鼻尾音等)控制參數(shù)時刻的選取也不同。采用這種編碼技術(shù)可實現(xiàn)低速率語音編碼,比特率可壓縮到2kbit/s4.8kbit/s,甚至更低,但語音質(zhì)量(mos為3分)只能達到中等,往往清晰度可以而自然度沒有,很難辨認講話人是誰,其次是復雜度比較高。6.1.3
36、 混合編碼混合編碼是近年來出現(xiàn)的一種新的編碼方法, 這種方法在保留參數(shù)模型技術(shù)精華的基礎上, 應用波形編碼準則去優(yōu)化激勵信號, 從而在4. 89. 6 kbps 的數(shù)碼率上獲得了較高質(zhì)量的合成語音(簡而言之,混合編碼就是將波形編碼和參量編碼組合起來,保留了聲碼器的濾波,但改善了”激勵”參數(shù)的信息,克服了原有波形編碼和參量編碼的低速率,在416kbit/s速率上能夠得到高質(zhì)量(mos)的合成語音), 其代表是一類稱之為“按分析合成” (abs) 的方法, 采用聽覺加權(quán)技術(shù), 在閉環(huán)的基礎上尋找主觀意義上失真最小的激勵矢量. 由于采用的激勵信號模型不同, 這類方法派生出多種新的編碼方法, 都能在9
37、. 6 kbps 碼率上獲得較高的話音質(zhì)量. 典型的方法有剩余激勵線性預測編碼(rel p) , 多脈沖激勵線性預測編碼(mpc) , 碼激勵線性預測編碼(cel p) . mpc 采用數(shù)目有限, 非均勻間隔的沖激序列作為激勵, 在rel p 中信號同樣為沖激序列, 但其間隔為常數(shù), 所以rel p 除需指明序列的起始位置外, 無需對每一個脈沖位置進行描述, 而mpc 需用脈沖的位置與幅度來描述. cel p 采用矢量量化技術(shù), 將代表語音段的矢量構(gòu)成一龐大的碼本中的地址, 而不是傳送n 維樣值序列, 再用矢量去激勵聲道. cel p 能高效地壓縮數(shù)碼率, 但是, 建立碼本搜索碼字的運算量也比
38、較大.多脈沖激勵線性預測編碼(mplpc),規(guī)劃脈沖激勵線性預測編碼(kpelpc),碼本激勵線性預測編碼(celp)等都是屬于混合編碼技術(shù)。很顯然,混合編碼是適合于數(shù)字移動通信的語音編碼技術(shù)。其中,多脈沖激勵線性預測編碼(mplpc)就應用在gsm系統(tǒng)中。6.2 分析gsm系統(tǒng)中的語音編碼技術(shù)多脈沖激勵lpc為了有效利用信道帶寬,數(shù)字無線通信系統(tǒng)都依賴于語音編碼技術(shù)來去除語音中幾乎所有的冗余,來提供速率遠小于pcm的高質(zhì)量數(shù)字化語音通信。通常解決的方法是采用信源編碼技術(shù),如多脈沖激勵lpc或其規(guī)則脈沖激勵方式,以及celp,它們以低于16kbps的比特率維持了高質(zhì)量的合成語音。多脈沖激勵lp
39、c技術(shù)利用了合成分析原理,即在編碼器的設計中包括了譯碼器的副本。在語音編碼中,編碼過程常稱為語音分析,它功能是將語音信號轉(zhuǎn)換為低速率的數(shù)字信號;解碼過程通常稱為語音合成,其功能是將低速率的數(shù)字語音信號合成為模擬語音信號。6.2.1 多脈沖激勵lpc編碼器的組成(1)語音預測模型的合成濾波器這種濾波器由一個用來模型化語音的短期頻譜包絡的全極點(即濾波器的轉(zhuǎn)移函數(shù)只含極點)構(gòu)成。其中短期是指濾波器參量是基于語音信號的當前樣值計算得到的。其中,語音信號的當前值由816個先前的樣值預測得到的。合成濾波器還可能包含一個用長期預測器來模型化語音頻譜的精細結(jié)構(gòu)。在這種情況下,合成濾波器的功能都是為了提供原始
40、語音的高質(zhì)量的合成4。(2)產(chǎn)生激勵的激勵發(fā)生器此激勵由515ms周期內(nèi)數(shù)量一定的脈沖組成。多脈沖激勵(mpe)的設計思想是:只對激勵信號的重要部分抽樣編碼,忽略其它部分抽樣,以此降低編碼比特率。(3)差錯最小化用來最優(yōu)化原始語言與合成語音之間可感知的加權(quán)錯誤。進行最小化的目的是為了最優(yōu)化激勵中采用的脈沖幅度和相位。最小化中通常采用均方差準則。6.2.2 編碼過程(1)合成濾波器的自由參數(shù)采用實際語音樣本作為輸入計算得到的。此計算是在最優(yōu)化回路之外進行的,持續(xù)時間為1030ms(這段時間內(nèi)語音信號被視為是靜止的) 。(2) 合成濾波器的最優(yōu)激勵通過最小化圖(下圖a所示)的閉環(huán)可察覺加權(quán)誤差得到
41、。因此,語音樣本分不同幀(1030ms)來計算濾波參數(shù),每個幀又進一步分為子幀(515ms)來最優(yōu)化激勵。量化的濾波器參數(shù)和量化的激勵構(gòu)成了發(fā)射信號。這里允許幀與幀之間的濾波器參數(shù)和量化的激勵各不相同,也允許了子幀與子幀之間的激勵各不相同,因此編碼器能夠跟蹤語音的非穩(wěn)態(tài)特性,盡管是在分批基礎上進行的。6.2.3 多脈沖激勵lpc譯碼器的組成譯碼器位于接收機的內(nèi)部,由兩部分組成:激勵發(fā)生器和合成濾波器(如上圖b所示),兩個部分與編碼器中的對應部分相同。譯碼器的作用是為了利用接收信號來得到原始語音信號的合成信號,這是由譯碼激勵通過(參數(shù)設置與編碼器中一致的)合成濾波器獲得的。為了減少編譯碼器的計算
42、復雜度,激勵的單個脈沖之間的間隔限制為一個相同值。得到的分析合成編譯器具有規(guī)則脈沖激勵。第七章 語音編碼芯片實現(xiàn)adpcm 的芯片有mc145532 , 全雙工, 可提供速率為32 kbps ; 實現(xiàn)cvsd 有mc3417 , mc3418 , mc3517 , mc3518. 單片可調(diào)速聲碼器q4401 是具有20世紀90 年代國際先進水平的vlsi 單片聲碼器14, 它包括qcel p 編碼器、qcel p 解碼器、幀定時發(fā)生電路、輸入凈音、音調(diào)產(chǎn)生以及pcm 接口電路和微處理器接口等, 其中編碼器和解碼器是q4401的核心. q4401 具有速率可調(diào)(8009 600 bps) , 編
43、碼延遲較小(小于50 ms) , 語音質(zhì)量較高5。第八章 語音編碼技術(shù)進展從目前語音編碼技術(shù)發(fā)展來看, cel p 比mpl pc 的復雜度更高, 碼速率更低, 可以在4. 8 kbps左右的碼速率獲得較高質(zhì)量的語音,是當今中、低速率語音編碼的主流技術(shù)之一,在對其改善質(zhì)量,降低復雜度,減少編碼延遲等方面都提出了不少新方法,使cel p 在實踐中得到廣泛應用,許多國際標準化組織及機構(gòu)紛紛將這一編碼方案作為語音編碼標準,語音編碼今后的研究重點將逐步轉(zhuǎn)向更低速率的編碼方法.cel p 類算法是目前中低速語音壓縮編碼的主流算法之一,許多國際標準化組織及機構(gòu)將這一方案納為語音編碼標準,目前已形成的標準有
44、:美國政府標準fs1016 (4. 8 kbps cel p ) , 北美數(shù)字蜂窩語音編碼is54 (8 kbps vsrl p) , 日本數(shù)字蜂窩語音編碼jdc (6. 7 kbps cel p ) 等7,9。結(jié)束語在移動通信系統(tǒng)中,語音編碼的設計和主觀測試是相當困難的。只有在低速率語音編碼情況下,數(shù)字調(diào)制方案才有助于提高語音業(yè)務的頻譜效應。為了使語音編碼有實用性,語音編碼必須消耗的功率少和提供可直接接受直至很好的語音質(zhì)量。語音編碼的目的實在保持一定的算法復雜程度和通信時延的前提下,運用盡可能少的信道容量,傳送盡可能高質(zhì)量的語音。通常,編碼器的效應和獲得此效率的算法復雜度之間有正比關(guān)系。算法越復雜,時延與費用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度高科技研發(fā)企業(yè)參股合作協(xié)議范本3篇
- 2025年度醫(yī)療設備產(chǎn)品試用及醫(yī)療機構(gòu)采購協(xié)議4篇
- 二零二五年度留學家庭財務規(guī)劃服務協(xié)議4篇
- 2024運動員參賽合同協(xié)議
- 2025年度廠房裝修環(huán)保驗收與后續(xù)維護服務協(xié)議4篇
- 2025年度房地產(chǎn)臨時工勞動合同書模板(二零二五版)4篇
- 二零二五版錘式破碎機銷售代理與區(qū)域市場拓展合同3篇
- 專賣店臨時聘用協(xié)議范本版
- 二零二五年度無人機植保作業(yè)效果評估合同2篇
- 2025年度養(yǎng)老產(chǎn)業(yè)項目合作協(xié)議范本3篇
- 民航概論5套模擬試卷考試題帶答案
- 2024屆中國電建地產(chǎn)校園招聘網(wǎng)申平臺高頻500題難、易錯點模擬試題附帶答案詳解
- 名表買賣合同協(xié)議書
- COCA20000詞匯音標版表格
- 滬教版七年級數(shù)學上冊專題06圖形的運動(原卷版+解析)
- JTG-T-F20-2015公路路面基層施工技術(shù)細則
- 光伏發(fā)電站集中監(jiān)控系統(tǒng)通信及數(shù)據(jù)標準
- 建筑垃圾減排及資源化處置措施
- 2024年遼寧石化職業(yè)技術(shù)學院單招職業(yè)適應性測試題庫附答案
- 中西方校服文化差異研究
- 2024年一級建造師考試思維導圖-市政
評論
0/150
提交評論