基于FPGA的RPE-LTP語音編解碼的IP核設計

上傳人：灰*** IP屬地：寧夏上傳時間：2021-05-21 格式：DOC 頁數：68 大?。?76.56KB 積分：18 舉報 版權申訴

已閱讀5頁，還剩63頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

1、暨南大學碩士學位論文題名（中英對照）：基于fpga的rpe-ltp語音編解碼的ip核設計ip core design of rpe-ltp speech codec based on fpga作者姓名：胡建新指導教師姓名肖璋及學位、職稱：副教授學科、專業(yè)名稱：通信與信息系統論文提交日期：論文答辯日期：答辯委員會主席：論文評閱人：學位授予單位和日期：61獨創(chuàng) 性聲明本人聲明所呈交的學位論文是本人在導師指導下進行的研究工作及取得的研究成果。據我所知，除了文中特別加以標注和致謝的地方外，論文中不包含其他人已經發(fā)表或撰寫過的研究成果，也不包含為獲得或其他教育機構的學位或證書而使用過的材料。與我

2、一同工作的同志對本研究所做的任何貢獻均已在論文中作了明確的說明并表示謝意。學位論文作者簽名：簽字日期：年月日學位論文版權使用授權書本學位論文作者完全了解有關保留、使用學位論文的規(guī)定，有權保留并向國家有關部門或機構送交論文的復印件和磁盤，允許論文被查閱和借閱。本人授權可以將學位論文的全部或部分內容編入有關數據庫進行檢索，可以采用影印、縮印或掃描等復制手段保存、匯編學位論文。（保密的學位論文在解密后適用本授權書）學位論文作者簽名：導師簽名：簽字日期：年月日簽字日期：年月日學位論文作者畢業(yè)后去向：工作單位：電話：通訊地址：郵編：暨南大學碩士學位論文基于fpga

3、的rpe-ltp語音編解碼的ip核設計摘要rpe-ltp(規(guī)則脈沖激勵-長期預測)語音編解碼算法是gsm(全球移動通信系統)所使用的全速率語音編解碼標準。它采用20ms幀長，每幀包含語音樣本160個，編碼速率為13kbps，編解碼合成語音質量可以達到mos3.6以上。目前對rpe-ltp語音編解碼算法的實現方案設計中，大多采用dsp(數字信號處理器)作為首選，這與gsm移動通信系統建立時期的硬件技術發(fā)展狀況有關。在當時采用dsp無疑是最好的方案。但是隨著集成電子電路技術的發(fā)展，實現rpe-ltp語音編碼的可選方案也越來越多。本課題作為“gsm/cdma雙模手機基帶物理層關鍵技術的研究及其ip

4、core實現”項目的一部分，提出一種采用fpga實現rpe-ltp語音編解碼算法的設計方案，并完成了相應的vhdl程序的編寫、設計、仿真等工作。通過詳細分析算法的特征及關鍵技術，提出了幾種在不同的需求條件下的設計方法。由本課題設計實現的rpe-ltp語音編解碼算法的ip core，取得了很好的試驗結果。其編解碼總時延為5844個時鐘周期，時鐘頻率可達13mhz，極大地縮短了編解碼時延。關鍵詞：rpe-ltp，語音編解碼，fpga，gsmabstractrpe-ltp(regular pulse excited long term prediction) speech codec algorit

5、hm is one of the standards for gsm(global system for mobile communication). it adopts 20ms frame, each frame contains 160 speech samples. its code rate is 13kbps and the quality of reconstructed speech can reach above mos 3.6.dsp (digital signal processor) is the favorite for most people to implemen

6、t the rpe-ltp speech codec algorithm. this is for the state of the hardware technologys development in the gsm mobile communication setting-up period. undoubtedly it was the best scheme to choose dsp at that time. with the development of integrated electronic circuit technology, there are more and m

7、ore available implementation schemes for rpe-ltp speech codec.this subject is a part of the project “gsm/cdma bimodulus cell-phone base-band physical layers key technology research and the ip core implementation”. in this subject we put forward an implementation scheme of rpe-ltp speech codec algori

8、thm by using fpga and has finished the work of designing, programming, emulating the vhdl program, etc. and put forward several kinds of design methods on different needs through analyzing the characteristic and key technology of the algorithm in detail.after testing the ip core which we have design

9、ed to implement the rpe-ltp speech codec algorithm, the result is satisfying. the codecs whole delay is 5844 clock periods, and the clock frequency can up to 13mhz. it turned out that our implementation method can shorten codec delay greatly.keyword: rpe-ltp, speech codec, fpga, gsm目錄摘要iabstractii目

10、錄iii第1章緒論11.1 引言11.2 語音編碼方法的分類11.3 數字語音壓縮編碼標準21.4論文選題依據及背景4第2章語音信號處理的關鍵技術62.1 語音信號的數學模型62.1.1 發(fā)音機理及聲學特征62.1.2 語音信號的數學模型72.2 語音信號的短時分析和線性預測分析92.2.1短時分析92.2.2 線性預測分析92.3 語音信號的矢量量化編碼10第3章 fpga簡介113.1 fpga的概況113.2 fpga的基本結構113.3 fpga開發(fā)設計方法12第4章 rpe-ltp語音編解碼原理144.1 編碼器原理144.1.1 預處理144.1.2 lpc分析154.1.3

11、短期分析濾波164.1.4 長期預測174.1.5 rpe編碼194.1.6 重構短期濾波余量信號204.2 解碼器原理21第5章 rpe-ltp編解碼定點算法235.1 原始語音樣本表示方式235.2 預處理235.2.1 樣本縮放235.2.2 偏移補償235.2.3 預加重245.3 lpc分析245.3.1 分幀245.3.2 自相關245.3.3 schur遞歸255.3.4 對數域轉換265.3.5 對數域反射系數量化編碼265.4 短期分析濾波265.4.1 對數域反射系數反量化275.4.2 對數域反射系數插值275.4.3 反射系數解碼275.4.4 預處理結果的恢復285

12、.4.5 短期分析濾波285.5 長期預測分析285.5.1 子幀劃分285.2.2 短期余量信號縮放295.5.3 互相關295.5.4 搜索長期預測滯后參數ncj295.5.5 計算長期預測增益編碼bcj295.5.6 長期分析濾波305.6 rpe編碼305.6.1 加權濾波305.6.2 子采樣305.6.3 rpe格選315.6.4 rpe量化315.7 短期濾波余量的更新325.7.1 激勵脈沖序列解碼325.7.2 重構長期分析濾波結果325.7.3 長期綜合濾波335.8 解碼335.8.1 激勵脈沖序列解碼335.8.2 短期綜合濾波345.8.3 后處理34第6章 fpga

13、實現方案及vhdl程序設計356.1 rpe-ltp語音編解碼算法的特點356.1.1 算法中運算的操作類型356.1.2 算法中數據的特點356.2 fpga實現方案366.2.1 編碼器功能模塊劃分366.2.2 解碼器功能模塊劃分386.3 功能模塊的設計396.3.1 預處理模塊396.3.2 自相關模塊406.3.3 schur遞歸模塊416.3.4 對數域反射系數編解碼模塊426.3.5 反射系數解碼模塊426.3.6 短期分析濾波模塊426.3.7 計算長期預測滯后參數模塊436.3.8 計算長期預測增益參數模塊456.3.9 長期分析濾波模塊456.3.10 rpe編解碼模塊4

14、66.3.11 更新重構短期濾波余量模塊476.3.12 編碼輸出模塊486.3.13 編碼數據接收模塊486.3.14 短期綜合濾波及后處理模塊486.3.15 重構語音輸出模塊496.4 功能模塊的整合506.5 小結51第7章測試結果53第8章總結57致謝58參考文獻：59 第1章緒論1.1 引言語音是人類相互交流和傳遞信息的基本手段，它具有方便、快捷的優(yōu)點。在當今的通信領域中，語音通信一直占據著相當大的份額。隨著通信網絡數字業(yè)務量的急劇增長，如何在提供高質量語音服務的基礎上采用最低的碼率來傳送和存儲數字語音信號以增加現有信道的帶寬利用率、安全性、抗誤碼性以及降低成本等也顯得越來

15、越重要。自1962年美國bell labs推出第一套商用t1的24路pcm通信系統以來，語音信號在有線電話系統中全部實現了數字化。90年代在無線電話中gsm也逐步取代了傳統的模擬無線電話系統。近年來，隨著互聯網的迅速發(fā)展，網絡通信由單純的數據信息向多媒體業(yè)務發(fā)展，移動通信也在向第三代、第四代移動通信發(fā)展，對語音的編碼也成為通信系統中基本的也是關鍵的技術之一。中低碼率的語音編碼技術經過80年代中期至90年代中期的研究已經取得了很大的成果，國際電信聯盟(itu)和etsi等機構也制定出若干國際標準，如g.728、g.729、gsm06.10、gsm06.20等已獲得廣泛使用，給通信業(yè)務帶來了巨大的

16、商機。1.2 語音編碼方法的分類語音壓縮編碼的目的是追求在盡可能低的數碼率下獲得盡可能高的合成語音質量，而高質量與低碼率這兩方面又是相互矛盾的。根據人們對語音質量要求的不同，語音信號壓縮編碼的方法可以分成三類：波形編碼、參數編碼和混合編碼1, 2。波形編碼是指對語音信號在時域或頻域的波形經過取樣、量化和編碼，形成數字話音信號，力圖使重構語音的波形保持原始語音信號的形狀。這種方法保留了語音信號原始樣值細節(jié)上的變化，從而也保留了信號的各種細微特征。所以，利用波形編碼所重構的語音信號質量很高。但由于它的采樣速率必須滿足奈奎斯特采樣定理，為了保證數字話音信號解碼后的高保真度，其量化分層數要足夠大。因此

17、波形編碼需要較高的編碼速率，壓縮比不是很高。通常在1664kbps的速率范圍內可以重構出很高的語音質量，但當速率降低時，所重構的語音質量會迅速下降。波形編碼通常用在對語音質量要求較高的場合。脈沖編碼調制(pcm)、自適應差分脈沖編碼調制(adpcm)、增量調制(m)及其變型均屬于波形編碼。參數編碼是基于人類語音的發(fā)聲機理，提取表征語音信號的特征參數，然后對特征參數進行編碼，在接收端利用收到的語音特征編碼參數對語音信號進行重構。這些特征參數去除了語音信號的相關性和冗余度，因此大大的降低了數碼率。參數編碼的編碼速率可以達到1.22.4kbps。在當今通信信道資源有限的情況下，降低數碼率具有重要意義

18、，但參數編碼重構的語音信號與原始語音信號在波形上有相當大的差別，語音質量差，自然度較低。因此這種編碼方式目前主要用于軍事和一些對語音質量要求不高的地方。線性預測編碼(lpc)及其變型均屬于參量編碼?；旌暇幋a綜合了波形編碼和參數編碼各自的長處。在混合編碼的信號中，既包含有語音的若干特征參數，又包含有部分的波形編碼的信息。能夠在416kbps的速率上得到較高質量的重構語音信號。在編碼速率為816kbps的范圍時，其話音質量可達到商用話音通信要求的標準。由于混合編碼既能夠降低編碼的數碼率又能夠得到較高的重構語音質量，目前已廣泛用于移動通信系統中。規(guī)則脈沖激勵線性預測(rpe-ltp)編碼、矢量和激勵

19、線性預測編碼(vselp)等屬于混合編碼。1.3 數字語音壓縮編碼標準近幾十年來，數字語音壓縮編碼技術取得快速發(fā)展，涌現了多種壓縮編碼方法和標準，有些已成為區(qū)域性或國際性的語音編碼標準3。(1)g.711標準41972年，ccitt(現在的itu-t)通過了64kbps語音編碼標準g.711。該標準采用對數pcm(脈沖編碼調制)編碼方式。規(guī)定以8khz采樣率對語音信號進行采樣，采用非線性a律或u律進行編碼，樣值編碼位數為8比特，編碼速率為64kbps。(2)g.721標準51984年，ccitt制定了32kbps語音編碼標準g.721。該標準采用adpcm(自適應差分脈沖編碼調制)編碼方式。采

20、樣率與g.711一樣為8khz，所不同的是g.721采用的adpcm編碼方式是對語音預測誤差進行量化編碼，每個采樣值的預測誤差采用4bit。在一個pcm話路中可同時傳送兩路電話，并能實現g.711標準的64kbpspcm信道與32kbps信道之間的相互轉換。(3)g.723標準ccitt在1988年制定的語音編碼標準，采用24kbps和40kbps的adpcm編碼。24kbps碼率用在瞬時話務量超過傳輸容量時的dcme(數字電路增容設備)中，40kbps碼率能通過9.6kbps modem傳輸。(4)g.726標準6g.726標準是g.721和g.723標準的結合，另外增加了16kbps的ad

21、pcm編碼，主要用于dcme。其16kbps和24kbps編碼的語音質量達不到長途話音的質量。(5)g.728標準7g.728標準是ccitt于1992年公布的16kbps的ld-celp(短時延碼激勵線性預測)編碼標準。該算法以celp(碼激勵線性預測)為基礎，采用后向自適應線性預測、50階合成濾波和短激勵矢量等改進方法，算法編碼時延小于2ms。(6)g.723.1標準81995年，ccitt制定的一種多媒體語音編碼標準，其傳輸碼率有5.3kbps和6.3kbps兩種，在編碼過程中可隨時切換。5.3kbps的編碼器采用acelp(代數碼激勵線性預測)編碼方式，6.3kbps的編碼器采用mp-

22、mlq(多脈沖最大似然量化)編碼方式。該標準的主要應用是在ip電話業(yè)務、h.324視頻電話、無線電話、數字衛(wèi)星系統、dcme(數字電路增容設備)、pstn(公共交換電話網)、isdn(綜合業(yè)務數字網)等。(7)g.729標準91996年，ccitt公布了8kbps的g.729標準，該標準采用了cs-acelp(共軛結構代數碼激勵線性預測)算法。該算法采用線性預測、矢量量化和代數碼本搜索等技術，在略微增加算法復雜度的情況下，大大降低了編碼速率，同時又保證了良好的語音質量。(8)fs101610fs1016是美國政府公布的一種語音編碼標準，它基于celp的編碼算法，編碼速率為4.8kbps。該算法

23、利用線性預測提取語音特征參數，用一個激勵碼書作為激勵矢量，每次編碼時在碼書中搜尋一個最佳的激勵矢量，將該激勵矢量在碼書中的對應編號作為編碼結果。(9)vselp11vselp是北美蜂窩電話工業(yè)組織(ctua)在1989年公布的8kbps矢量和激勵線性預測(vselp)語音編碼方案。該算法采用兩個隨機碼本和一個自適應碼本作為激勵信號，最終使用的激勵為這三個激勵矢量的和。(10)gsm06.1012gsm06.10是etsi(歐洲電信標準化組織)為gsm制定的全速率語音壓縮編碼標準，該標準采用rpe-ltp(規(guī)則脈沖激勵-長期預測)編碼算法，壓縮后語音數碼率為13kbps。本文就是采用fpga實現

24、該標準所規(guī)定的語音編解碼算法。(11)gsm06.2013gsm06.20是etsi為gsm制定的半速率語音壓縮編碼標準，該標準采用vselp語音編碼方案，編碼后的語音數碼率為5.6kbps。1.4論文選題依據及背景語音編碼算法具有計算量大、處理的數據多等特點。因此語音編碼算法的實現方案多選用dsp來完成。從作者目前所收集到的國內外文獻來看，尚未發(fā)現有使用fpga實現gsm全速率語音編解碼算法的報道。究其原因，主要因為dsp是用于數字信號處理的專用器件，它在結構設計上考慮了數據信號處理中計算量大，處理數據多的特點，又能夠達到比單片機高得多的運行速度，在實際應用中也能夠達到語音編碼的實時要求。另

25、一方面是fpga在發(fā)展初期由于受到半導體工藝方面的影響，集成度、運行速度等方面都存在有一定的不足。使得人們當時在選擇實現方案更趨向于采用dsp。14隨著半導體工藝的發(fā)展，fpga已經取得了很大的突破，在集成度方面，已經出現了上千萬可用門的單片fpga。在速度方面，由于引入了高速時鐘管理電路，使得fpga的運行速度也得到了快速提高。另外，fpga內置的高速乘法器、加法器及塊ram也極大的增強了fpga進行數字信號處理的能力。15, 16本課題作為“gsm/cdma雙模手機物理層基帶關鍵技術地研究與ip core實現”的一個子項目，采用fpga實現rpe-ltp語音編解碼算法的ip core具有特

26、殊的意義。一方面fpga特有的并行處理能力能夠極大的增強語音編解碼速度，另一方面作為整個項目的一部分，也便于與其它模塊之間結合。只需調用本課題設計所產生的ip核即可實現整體結構的快速合并。而采用dsp卻不能很好地滿足這一要求。采用fpga實現語音編解碼算法可以達到比dsp更短的編解碼延時，因此當需要對多路語音信號進行編解碼處理時，采用時分方式也可處理更多的話音信號，獲得比采用dsp更好的編解碼性能。第2章語音信號處理的關鍵技術2.1 語音信號的數學模型2.1.1 發(fā)音機理及聲學特征聲音是由于空氣振動而產生的自然界的一種物理現象，引起空氣振動的部分稱作聲源，也叫做聲音激勵。人的語音發(fā)音機理類似

27、于管樂器，首先由氣源產生氣流并穿過一條狹長的有孔管道，氣流引起管樂器的發(fā)聲部分(如笛膜、音簧片等)的振動產生聲波，聲波經過管樂器的孔引起諧振。改變諧振孔開啟的位置就可以調整音調。17人的發(fā)音器官由三個子系統組成：肺和氣管產生氣源；喉和聲帶(相當于管樂器中的音簧片、笛子的笛膜)叫做聲門；咽腔、口腔和鼻腔組成聲道。當由肺產生的壓縮氣流被迫通過聲帶時就會產生振動。再通過聲道的調制后就形成了語音。語音激勵根據發(fā)音的機制不同可以分為兩類。一類稱為濁音，它是在氣體被迫通過聲帶時使聲帶產生振動，聲門的閉合開啟引起聲帶振動并產生一個準周期的脈沖氣流。聲帶振動的頻率稱為基音頻率，基音的頻率通常在70300hz范

28、圍內。另一類稱為清音，它是由氣體流速達到某一臨界速率時所產生湍流引起的。在發(fā)清音時聲帶不振動，聲道被噪聲狀的隨機波所激勵。其幅度一般較小，波形與噪聲相似。所謂語音的調制，就是指在激勵產生的氣流中加入其他信息。人的語音調制過程主要通過口腔、鼻腔及咽腔的不同位置和形狀變化產生的。不同的聲道形狀具有不同的固有頻率。通過改變聲道形狀來產生不同的共振峰，從而產生出不同的元音和輔音。另外，在聲波離開聲道時，由于嘴唇的輻射作用，也會對聲波產生一定的影響。2.1.2 語音信號的數學模型根據語音的生成機理可知，施加在語音聲波上的作用有三部分：由聲門產生的激勵；由聲道產生的調制和由嘴唇產生的輻射作用。語音信號是由

29、這三部分作用級聯產生的。對應著語音生成機理，語音信號的數學模型也分為三個部分：激勵模型；聲道模型；輻射模型。18激勵模型最常用的語音激勵模型為二元激勵模型，其結構圖如圖2-1所示。它將語音按濁音和清音分為兩種情況進行考慮。對于濁音，由于聲門的不斷開啟和關閉，產生間歇的脈沖。此時的激勵波是一個以基音為周期的斜三角脈沖串，單個的斜三角波的頻譜表現為低通濾波器的特性。這種作為激勵的斜三角波可以用一串加權的單位脈沖序列通過激勵產生。對于清音，是由于聲道被阻礙形成湍流。這時的激勵可以利用隨機白噪聲來模擬。圖2-1 語音的二元激勵模型激勵模型的另一種是碼激勵模型。該模型將可能的各種激勵預先計算好后進行保

30、存并對其編號(通常采用激勵存放的地址作為編號)，這種預先計算好的激勵稱為碼書。在實際應用中，通過相應的判據決定哪一種激勵是當前信號的最佳激勵，并將這個最佳激勵的碼書編號作為激勵的表征。通常所采用的碼書有兩部分組成。一部分的內容是固定不變的，稱為固定碼書。另一部分的內容隨著時間的變化而變化，稱為隨機碼書，有時也稱為自適應碼書。聲道模型典型的聲道模型主要有無損聲管模型19和共振峰模型20。無損聲管模型假定聲道是由多個等長的具有不同截面積的管子串聯而成的系統，并假定管子中的流體及管壁沒有熱傳導和粘滯損耗。在短時間內聲道可以表示為形狀穩(wěn)定的管道，聲波是沿著管道的軸向傳播的平面波。通過理論分析，可推導

31、出無損聲管模型的傳遞函數為式 (2-1)此模型為全極點模型。v(z)的極點對應于共振峰頻率。在實際應用中若考慮建立模型時所作的無損聲管的限制，可加入若干零點。共振峰模型根據聲波通過聲道時，受到聲腔共振的影響，在某些頻率附近形成諧振。這種諧振反映在信號頻譜圖上時表現為在諧振頻率處譜線的包絡產生峰值(如圖2-1所示)，通常將這些峰值叫做共振峰。圖2-1 語音頻譜的共振峰共振峰模型就是通過在編碼側提取語音信號的共振峰頻率，在解碼側利用共振峰頻率重構出語音信號。對于元音通常只需前3個共振峰就可代表，對于較復雜的輔音或鼻音，所需的共振峰個數要在5個以上。輻射模型從聲道模型輸出的是速度波，而語音信號是

32、聲壓波，二者的倒比稱為輻射阻抗。理論研究表明，由輻射引起的能量損耗正比于輻射阻抗的實部，其頻率響應曲線表現出一階高通濾波器的特性。在實際的語音信號分析中，常采用預加重技術，即在取樣之后加入一個一階的高通濾波器。在語音合成時再進行解加重處理。2.2 語音信號的短時分析和線性預測分析2.2.1短時分析語音信號從整體上來看不屬于平穩(wěn)信號，因此不能對語音信號直接采用分析平穩(wěn)信號的方法進行分析。在一個相應的短時間范圍內(1030ms)，語音信號具有短時平穩(wěn)的特性?？梢酝ㄟ^將語音信號加窗的方法進行分幀，然后分析計算語音幀的參數。這種對語音信號進行分幀處理的方法稱為語音信號的短時分析21。2.2.2 線性預

33、測分析線性預測分析是信號處理中極為有效的方法，它能夠用較少的參數來表現信號的特征及性質，其基本原理是信號的當前樣本值可以用過去的若干個樣本值的線性組合來逼近。當實際樣本與線性預測樣本值之間的誤差(通常采用均方誤差)最小時，就能夠確定唯一的一組預測參數，即線性組合過程中所使用的加權系數。例如，對于樣本序列s，其第n個樣本值為s(n)。利用前面p個樣本值對其進行預測，預測公式可表示為式 (2-2)式中ai為線性組合的加權系數。此時的預測誤差為式(2-3)采用最小均方誤差準則可得出一組唯一的加權系數a1、a2、ap。將式2-3改動成如下形式：式 (2-4)可以看出式2-4與p階的全極點濾波器模

34、型的差分方程具有相同的格式。即可以把當前樣本值看作是以誤差信號為激勵的p階全極點綜合濾波器的輸出響應。即：式(2-5)一般說來，階數p越大，預測值就越準確，對全極點模型參數的估計也就越準確。但當p增加到一定程度后，均方誤差的減小就不是很明顯了。通常在語音信號處理中，p的值一般取812之間。在rpe-ltp算法中p的取值為8。2.3 語音信號的矢量量化編碼矢量量化22編碼是利用碼本作為激勵源的一種編碼方法，即把預測誤差信號可能出現的樣值組合(矢量)按一定的規(guī)則排列，每一樣值組合按給定地址存放在存儲器中，因此，樣值組合與地址是一一對應的。在存儲器中存放的全部樣值組合叫做碼本。矢量量化編碼是將代表

35、語音的矢量構成一個龐大的碼本，發(fā)送端做線性預測時，是在碼本中找出使預測誤差信號最小所對應的樣值組合的地址。然后將這個碼本的地址傳送給接收方。由于發(fā)送和接收方均有同樣的碼本，接收端根據接收到的碼本地址可以從碼本中取出它所對應的預測誤差信號，利用該誤差信號激勵聲道就可以得到重建的語音。由于矢量量化編碼傳送的只是矢量在碼本中的地址而不是樣值序列，所以可降低傳送中所需的碼速率。矢量量化編碼的關鍵問題是產生和搜索碼本。碼本的產生，可用迭代的方法，利用包含有代表觀察量的語音的訓練序列，先假定一個起始碼本，而最佳碼字的獲得是平均所有訓練序列的矢量，它能映射到原始的碼字。至于碼本的搜索問題，可用許多次優(yōu)化算法

36、，以避免進行整個碼本的搜索過程。第3章 fpga簡介3.1 fpga的概況fpga(現場可編程門陣列)是在可編程器件的基礎上發(fā)展起來的大規(guī)?？删幊踢壿嬈骷?，是當今應用最廣泛的可編程專用集成電路之一，電子設計工程師們可以在辦公室或實驗室里通過編程設計出所需的專用集成電路，從而大大縮短了產品上市時間，降低了開發(fā)成本。此外，fpga具有高集成度、靜態(tài)可重復編程和動態(tài)在系統重構的特性，使得硬件的功能可以像軟件一樣通過編程來修改。極大地提高了電子系統設計的靈活性和通用性。由于fpga具備這些特點，受到了世界范圍內廣大電子設計工程師們的普遍歡迎，應用日益廣泛。自第一片fpga由美國xilinx公司研究開發(fā)

37、成功以來，隨著半導體工藝的不斷發(fā)展，亞微米、深亞微米技術的應用，使得fpga得到了快速的發(fā)展。由最初的1200個可用門，發(fā)展到了目前的數百萬可用門甚至上千萬可用門的單片fpga芯片。在結構方面，各fpga生產廠商根據市場需求對其產品做了優(yōu)化設計，在其產品中添加了高速、穩(wěn)定的功能模塊。這些模塊主要有：高速乘法器、加法器、雙端口塊ram、時鐘管理模塊等，有些fpga中還添加了dsp核、powerpc、以太網接口等功能模塊。233.2 fpga的基本結構典型的fpga通常包含有三類基本資源，可編程邏輯功能塊(clb)，可編程輸入/輸出(i/o)和可編程互連資源。可編程邏輯功能塊是實現用戶功能的基本單

38、元，多個邏輯功能塊通常規(guī)則的排列成一個陣列結構，分布于整個芯片；可編程輸入/輸出完成芯片內部邏輯與外部管腳之間的接口，圍繞在邏輯單元陣列四周；可編程內部互連資源包括各種長度的連線線段和一些可編程連接開關，它們將各個可編程邏輯塊或輸入/輸出連接起來，構成特定功能的電路。用戶可以通過編程決定每個單元的功能以及它們的互連關系，從而實現所需的邏輯功能。不同廠家或不同型號的fpga在可編程邏輯塊的內部結構、規(guī)模、內部互連的結構等方面存在有較大的差異。除了構成fpga基本結構的三種資源以外，隨著工藝的進步和應用系統需求的發(fā)展，一般在fpga中還可能包含以下的可選資源：存儲器資源，包括塊ram和分布式ram

39、；算術運算單元(高速硬件乘法器、加法器)；數字時鐘管理模塊；內嵌dsp硬核資源；多電平標準兼容的i/o接口；高速串行i/o接口；微處理器，等等。圖3-1顯示了xilinx公司生產的spartan3系列fpga的基本結構。圖3-1 xilinx公司spartan3系列fpga的基本結構243.3 fpga開發(fā)設計方法fpga的開發(fā)可采用多種不同的設計方法，常用的主要有原理圖輸入、vhdl語言編程、verilog語言編程等。不同的fpga生產廠家一般都推出了其相應的開發(fā)工具，如xilinx公司的xilinx ise25開發(fā)平臺，altera公司的max+plusii26、quartus等。雖然不同

40、廠家提供的開發(fā)工具在具體操作上有所不同，但基本上所有的開發(fā)工具都支持vhdl語言和verilog語言。vhdl語言27的英文全名是very high speed intergrated circuit hardware description language，即超高速集成電路硬件描述語言。是由美國國防部1982在實施超高速集成電路開發(fā)項目的進程中，根據需求提出的用于描述集成電路的結構和功能的標準語言，1987年底，vhdl被ieee確認為標準硬件描述語言(ieee-1076)。自該標準公布之后，由于各eda(電子設計自動化)廠家相繼推出了自己的vhdl設計環(huán)境，宣布自己的設計工具可以與vhd

41、l接口，使得vhdl在電子設計領域得到了廣泛的接受，并逐步取代了原有的非標準硬件描述語言。1993年，ieee對vhdl進行了修訂，從更高的抽象層次和系統描述能力上擴展vhdl的內容，并公布了新版本的vhdl標準(ieee-1076-1993)。verilog語言是ic行業(yè)使用的一種進行硬件描述的語言。其最初于1983年到1984年之間被設計為一種專用的驗證/模擬工具，后來，基于這種語言又開發(fā)了其他幾種專用分析工具，包括故障模擬器和時序分析器，還為邏輯綜合工具和行為綜合工具提供了輸入規(guī)范。1995年12月verilog被ieee接納為正式標準后，成為一種很有競爭力的硬件描述語言。一般的硬件描述

42、語言可以在三個層次上進行電路描述，其層次由高到低可分為行為級、寄存器傳輸級和門電路級。與verilog相比，vhdl通常更適于行為級和寄存器傳輸級的描述，因此適用于電路高級建模。verilog通常只適于寄存器傳輸級和門電路級的描述，易于控制電路資源。原理圖設計方法是一種利用圖元和連線進行fpga開發(fā)的設計方法，其設計過程更象是在畫原理圖。具有直觀、易操作的特點。但對于規(guī)模較大的系統開發(fā)則顯得繁瑣。適于規(guī)模較小的應用開發(fā)設計。第4章 rpe-ltp語音編解碼原理4.1 編碼器原理rpe-ltp語音編碼算法28屬于混合編碼方式，采用20ms對語音信號進行分幀，每幀包含160個采樣點。語音采樣值總長

43、度為16比特，前13位為有效位，后3位為補充位，在編碼過程中對后3位不予考慮。在每幀之中再按每40個樣點為一組劃分子幀，共4個子幀。劃分子幀的目的是對語音信號進行長期預測，進一步減少信號的相關度和冗余度。每一幀語音信號經過編碼后產生260比特的編碼數據。即編碼速率為13kbps。rpe-ltp語音編碼算法的結構如圖4-1所示。圖4-1 rpe-ltp語音編碼算法結構圖由圖4-1可以看出，rpe-ltp語音編碼算法可以分為以下5個部分組成：預處理、lpc分析、短期分析濾波、長期預測和rpe編碼。從編碼類型上來看，lpc分析部分屬參數編碼，短期濾波、長期預測和rpe編碼部分屬波形編碼。4.1.1

44、預處理預處理對語音樣值進行偏移補償和預加重處理。偏移補償的目的是減少語音信號中直流分量的影響，預加重處理是消除分析過程中的語音的輻射作用，以取得更好的lpc分析性能。在解碼器部分再進行解預加重的處理。rpe-ltp編解碼算法規(guī)定，原始語音樣本sop采用16位二進制補碼的方式表示。其中前13位為有效位，后3位為補充位。在進行運算時對后3位不予考慮。預處理的數學表述為：偏移補償：sof(k) = sop(k) sop(k 1) + (327352-15)sof(k 1)；預加重：s(k) = sof(k) (281802-15)sof(k 1)；4.1.2 lpc分析lpc分析將經過預處理的語音信

45、號按每160個樣點為一幀進行分幀，并計算9個幀內自相關值。然后通過schur遞歸算法計算出語音信號的8個反射系數。由自相關數據進行schur遞歸運算計算反射系數的流程圖如圖4-2所示。圖4-2 利用schur遞歸算法計算反射系數流程圖根據級聯聲管模型可知，反射系數是反映聲管模型截面積變化的一組參數，且這組參數與短期格形濾波器的濾波參數相等，即反射系數就是格形濾波器的濾波參數。由于反射系數具有分布不均勻的特點，為了合理的配置量化比特，需要將反射系數轉換為對數域表示的形式后再對其進行量化和編碼。經過量化編碼后的反射系數作為語音編碼輸出的一部分傳輸到解碼器。lpc分析的數學表述為：自相關：；schu

46、r正交遞歸：按圖4-2的流程圖進行；對數域轉換：，其中signr(i)為r(i)的符號，當r(i)為正時signr(i)為1，r(i)為負時signr(i)為-1；對數域反射系數量化編碼：larc(i) = int(a(i)lar(i) + b(i) + 0.5)，其中int為取整運算，量化系數a(i)和b(i)的值如表4-1所示。表4-1 對數域反射系數量化編碼參數表i12345678a(i)20.00020.00020.00020.00013.63715.0008.3348.824b(i)0.0000.0004.000-5.0000.184-3.500-0.666-2.235max lar

47、c(i)+31+31+15+15+7+7+3+3min larc(i)-32-32-16-16-8-8- 4- 44.1.3 短期分析濾波短期分析濾波對經過預處理和分幀后的語音信號進行短期分析濾波。去除掉語音之間的冗余成分。從語音發(fā)音原理上講，這一部分就是利用語音信號的實際采樣值，通過分析計算出語音的激勵源數據的過程。經過短期分析濾波所得到的信號稱為短期濾波余量信號。由于在lpc分析過程中利用的是由幀內自相關數據計算出的反射系數，為了防止在語音幀交替過程中因濾波參數發(fā)生突變而出現的短暫寄生現象，需要對反射系數進行處理。處理的過程包括反射系數量化編碼的解碼、對數域反射系數插值及對數域反變換。短期

48、分析濾波器采用格形濾波器，其結構圖如圖4-3所示。圖4-3 短期分析濾波器短期分析濾波的數學表述為：對數域反射系數反量化解碼：lard(i) = (larc(i) b(i) / a(i)；lard插值：，其中n為樣本在幀中的序號。lardp(i)為前一幀的對數域反射系數反量化解碼結果；對數域反射系數反變換：，短期分析濾波：每一幀短期分析濾波開始時，需要將濾波器狀態(tài)向量u0u8的值清零。即：ui,0 = 0，i = 0,8。4.1.4 長期預測長期預測將短期濾波余量信號按每40個為一組劃分子幀，在子幀間利用語音信號在短時間內具有相關性的特點進行長期預測分析。預測是根據先前子幀的重構短期余量信號與

49、當前子幀短期濾波余量信號的互相關，尋找出相關性最好的重構短期余量信號的位置及相應的預測增益并計算出預測值，最后將當前子幀的短期余量信號與預測值相減，得出長期預測余量。另外，在長期預測中還要完成重構余量信號的更新，即當前子幀的預測值與重構的長期預測余量相加，利用所得結果更新重構短期余量信號，用于后一子幀的預測。由于rpe-ltp編解碼算法中的長期預測為幀內預測，所以長期預測的范圍控制在120個樣值以內，并且在每一幀的第一子幀預測開始之前要將重構的短期濾波余量信號清零。在長期預測過程得出的滯后參數和預測增益參數經過量化后作為編碼輸出的一部分傳輸到解碼器。長期預測的數學表述為：劃分子幀：將輸入的160個短期余量信號分為4個子幀，每個子幀含40個值，為方便起見，將各子幀表示為：d(kj+k)，其中，j = 0,3表示子幀序號；kj = k0 + j40表示各子幀的第一個短期余量信號；k = 0,39表示各子幀中對應的短期余量信號。計算ltp參數：1、計算當前子幀短期余量信號d(kj + i)，(i=0,39)與重構短期余量信號dp(kj + i)，(i = -120,-1)的互相關rj(t)：；2、找出互相關最大值對應的t值作為長期預測的滯后參數nj；3、計算增益因子bj：。長期預測參數量化編碼及反量化：將

人人文庫> 全部分類> 生活休閑 > 科普知識

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

基于FPGA的RPE-LTP語音編解碼的IP核設計

文檔簡介

溫馨提示

最新文檔

評論

基于FPGA的RPE-LTP語音編解碼的IP核設計

文檔簡介

溫馨提示

最新文檔

評論

相關文檔