




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
精品文檔-下載后可編輯MPEG聲音編碼的單片DSP實現(xiàn)-基礎(chǔ)電子MPEG[1]聲音壓縮算法是關(guān)于高保真數(shù)字聲音壓縮的第1個國際標準,自1992年末國際標準化組織和國際電工委員會采納這項標準以來,它在數(shù)字聲音的存儲、Internet上的多媒體傳輸、聲音數(shù)字廣播(DAB)[2]等領(lǐng)域都得到了廣泛的應(yīng)用.然而,MPEG聲音編碼算法相當復(fù)雜,它對運算量和存儲量都有很高的要求,加上市場對編碼器的需求不大,因而到目前為止還沒有專門的ASIC芯片.現(xiàn)在常用的方法是采用通用的DSP完成MPEG聲音壓縮編碼,但是國外僅有DEC,Philips,Xingit等為數(shù)不多的幾家公司在單片DSP中完成了此算法,而且購買時費用昂貴,沒有源碼;國內(nèi)也有使用兩片TI公司的TMS320C30實現(xiàn)MPEG聲音編碼第2層[3],但是使用兩片DSP不但協(xié)調(diào)控制電路復(fù)雜,而且加上片外存儲器價格仍然不菲.因此,研究具有自有產(chǎn)權(quán)并且價格便宜的軟硬件實現(xiàn)成為必然的選擇.
1MPEG聲音編碼原理
MPEG聲音編碼是一種基于人耳聽覺特性的子帶聲音編碼算法,它屬于一種感覺聲音編碼方法.感覺聲音編碼算法的基本結(jié)構(gòu)如圖1所示.根據(jù)編碼器著重于頻率分辨率還是時間分辨率,可分為子帶編碼器和變換編碼器.MPEG聲音第2層編碼算法在頻域上把聲音信號劃分為32個子帶,屬于一種子帶編碼器.在圖1中,時頻映射也稱濾波器組,用于把輸入的聲音信號映射成亞抽樣的頻率分量.根據(jù)使用的濾波器組的性質(zhì),即濾波器組在頻域的分辨率的大小,這些頻率分量又可叫做子帶樣值或頻率線.
(a)
(b)
圖1感覺聲音解碼器結(jié)構(gòu)框圖
濾波器的輸出或者與濾波器組并行的時頻變換的輸出,提供給心理聲學模型以估計時間相關(guān)的聲音掩蔽門限.心理聲學模型使用了人們所知的同時掩蔽效應(yīng),包括有調(diào)音的掩蔽特性和無調(diào)音的掩蔽特性.如果使用聲音的前后掩蔽效應(yīng),還可進一步提高掩蔽門限估計的準確性.子帶樣值或頻率線按照盡量保證量化噪聲的頻譜處于掩蔽門限以下的準則進行量化和編碼,這樣能保證被人耳感知的量化引入的噪聲.根據(jù)對復(fù)雜度的要求,可以使用塊壓擴或熵編碼的分析合成方法.
幀打包把量化編碼的輸出和相關(guān)邊信息按照規(guī)定的格式組合起來,以便供解碼器使用.
2編碼質(zhì)量和DSP速度
單片ADSP-2181實現(xiàn)MPEG聲音編碼關(guān)鍵需要解決兩個問題:一是如何保證聲音編碼質(zhì)量;其次是如何充分利用DSP的運算速度.而這兩個問題往往又是一對矛盾,需要找到其結(jié)合點.
一般而言,決定MPEG聲音編碼器的優(yōu)劣主要是聲學模型的好壞.但是,對于使用單片16bit定點DSP的應(yīng)用而言,這個結(jié)論就不再適用了.分析表明,此時有限字長效應(yīng)對編碼質(zhì)量的影響成了主要矛盾.特別是分析濾波器組,截尾效應(yīng)竟帶來了33倍于16bitAD轉(zhuǎn)換量化誤差的噪聲,而窗系數(shù)的有限長度表示則使本來高達96dB旁瓣衰減的濾波器響應(yīng)降低到不到70dB.因此,要保證聲音編碼質(zhì)量,分析濾波器組算法必須進行精度擴展.
關(guān)于速度問題,首先想到的是使用快速算法,我們也嘗試了在子帶濾波中使用快速算法[4].但是,實踐證明,這些快速算法使用在DSP上效果并不理想,其原因有以下3條:(1)只考慮了加法和乘法的次數(shù),而對附值、尋址等操作毫不關(guān)心,但對所有指令都是單周期的DSP而言,乘法和加法的次數(shù)相對其他操作并不顯得特別重要;(2)沒有考慮DSP的硬件特點,其算法不能充分發(fā)揮DSP的乘累加器(MAC)并行處理的能力;(3)ADSP-2181是為16位算法操作優(yōu)化的,在需要精度擴展的情況下,運算量將以數(shù)量級的速度急劇增加.
基于以上質(zhì)量和速度要求的分析,我們選用了適合DSP乘累加指令的多相結(jié)構(gòu)濾波器組實現(xiàn)方式,且采用基于MAC結(jié)構(gòu)的精度擴展方法,較好地解決了編碼質(zhì)量和DSP速度之間的矛盾.另外,對抽樣數(shù)據(jù)的輸入方式、心理聲學模型、比例因子編碼都進行了適于ADSP-2181的改進,減少了運算量,保證了實時性.
3算法的軟件設(shè)計
軟件設(shè)計是MPEG聲音編碼的單片DSP實現(xiàn)的,編碼質(zhì)量和速度的要求都需要通過精心設(shè)計DSP軟件才能實現(xiàn).
(1)基于MAC結(jié)構(gòu)的精度擴展MPEG聲音編碼的分析濾波器組可以有許多種實現(xiàn)方式,多相結(jié)構(gòu)是MPEG標準推薦的一種,其數(shù)學表示為
(1)
(2)
分析表明,對Yk進行雙字擴展可將截尾效應(yīng)帶來的噪聲降低33倍.但是,考慮到ADSP-2181只支持16bit的乘累加運算,需要對式(1)進行轉(zhuǎn)化,即
(3)Yk=HYk+2-16LYk
(4)
這樣,就可利用DSP的乘累加器結(jié)構(gòu),運算量只增加約1倍,存儲量只增加64個字.
(2)輸入數(shù)據(jù)的組織輸入數(shù)據(jù)的組織不但要考慮方便地從數(shù)模轉(zhuǎn)換器取得聲音原始數(shù)據(jù),還要考慮輸入數(shù)據(jù)在片內(nèi)數(shù)據(jù)RAM的存儲適合作為多相濾波器組和聲學模型的FFT運算的輸入.多相濾波器組每次移入32個新的聲音數(shù)據(jù),移出32個舊的樣值,操作如下:
Xi=Xi-32,i=511,510,…,32Xi=next-input-audio-sample,i=31,30,…,0然而ADSP-2181并不適于實現(xiàn)數(shù)據(jù)的移動,每個賦值運算需要兩個指令才能完成,每次分析濾波操作需要1024個指令周期.如果利用ADSP-2181的多通道自動緩沖串口及間接尋址能力,適當?shù)亟M織輸入聲音數(shù)據(jù),就可利用滑動窗的方法實現(xiàn)數(shù)據(jù)的移入和移出,如圖2所示.
圖2多相濾波的滑動窗技術(shù)
為了保證幀邊界處理的連續(xù)性,輸入數(shù)據(jù)緩存應(yīng)該設(shè)計成圓緩沖的形式,其長度應(yīng)能存儲兩幀聲音輸入數(shù)據(jù).當DSP在處理一幀數(shù)據(jù)時,輸入數(shù)據(jù)可以緩沖到另一幀.這樣,數(shù)據(jù)移動的開銷就節(jié)約了.同時,輸入數(shù)據(jù)的組織還要利于聲學模型的FFT運算,F(xiàn)FT需要利用ADSP-2181的地址反轉(zhuǎn)尋址模式.由于FFT計算和輸入數(shù)據(jù)的緩存是同時進行的,所以FFT計算的指針需要地址反轉(zhuǎn),而輸入緩沖的指針卻不能地址反轉(zhuǎn),否則會導致輸入聲音數(shù)據(jù)排列混亂.ADSP-2181提供這種能力,它的地址指針組I0,I1,I2,I3有地址反轉(zhuǎn)能力,而第二地址指針組I4,I5,I6,I7卻不受地址反轉(zhuǎn)模式的影響.所以從第二地址指針組中選擇指針進行輸入緩沖,從地址指針組中選擇指針進行FFT計算.
(3)聲學模型的改進用DSP實現(xiàn)心理聲學模型的一個難題是其中有大量的對數(shù)運算,雖然可以用多項式逼近求得其近似值,但是其巨大的運算量說明這不是一個明智的選擇.在改進的心理聲學模型中,F(xiàn)FT運算后并不立即換算到對數(shù)域,而是用分段折線逼近線性域的掩蔽效應(yīng)曲線.為簡單起見,使用與標準一致的分段方法.逼近采用取指數(shù)的多項式展開的項的方法,這種方法雖然比較粗糙,但正如前面分析的那樣,聲學模型在16bit定點實現(xiàn)時不是主要矛盾,因而還是可以接受的.
得到掩蔽門限以后,為計算信掩比供比特分配使用,還是需要從線性域轉(zhuǎn)換到對數(shù)域.這時,我們采用一種利用ADSP-2181移位器的近似計算方法.通過EXP指令,可以提取2進制補碼小數(shù)的指數(shù),對能量而言又有1bit約3dB.因而指數(shù)值乘3就近似得到該補碼小數(shù)的dB值,尾數(shù)部分的影響忽略不計.
(4)比例因子的編碼MPEG聲音編碼標準中一共給出了63個比例因子,但是并不是所有這些比例因子都可以用16bit的2進制數(shù)表示.如果用雙字進行精度擴展,在量化時又將面臨雙字除法的巨大開銷,因此,只使用其中可以用16bit的2進制補碼小數(shù)表示的子集,即序號為3的倍數(shù)且小于等于45的比例因子.
采用比例因子子集后,比例因子編碼就可以不再通過比較的方法得到,而可以直接通過計算子帶幅度的指數(shù)獲得,簡化了比例因子的編碼.
(5)軟件仿真結(jié)果結(jié)合上述各項算法改進,根據(jù)ADSP-2181的特點和MPEG標準,用AD公司的開發(fā)軟件進行了軟件仿真.表1列出了仿真得到的各個模塊對運算量和存儲量要求進行的估算結(jié)果.仿真在抽樣率為48kHz,編碼模式為立體聲,輸入信號為頻率為1kHz的正弦波,輸出碼率為192kbit/s的情況下進行.
由表1可知,ADSP-2181的性能得到了較充分的利用.仿真結(jié)果表明,在以上的條件下,解碼輸出的信噪比可達80dB左右.可見,所作的算法改進是比較有效的.
表1各模塊的運算量和存儲量要求
運算量/(106指令/s)程序存儲量/103字數(shù)據(jù)存儲量/103字子帶濾波183.06.5聲學模型103.51.5比特分配和量化22.0—格式化比特流10.51.0
運算量/(106指令/s)程序存儲量/103字數(shù)據(jù)存儲量/103字子帶濾波183.06.5聲學模型103.51.5比特分配和量化22.0—格式化比特流10.51.0
4硬件設(shè)計
硬件結(jié)構(gòu)框圖如圖3所示.各模塊的基本功能如下:
DSP核:除完成所有編碼算法以外,還要完成對模數(shù)轉(zhuǎn)換電路的初始化配置;通過輔助控制電路選擇抽樣時鐘,通過接口電路接受主機的編碼參數(shù).
輔助控制電路:由FPGA及附屬電路實現(xiàn),完成時鐘的產(chǎn)生、FIFO狀態(tài)的監(jiān)測、地址譯碼等功能.
輸出緩沖:編碼碼流的暫時存儲區(qū),同時提供完全異步的輸出接口方式.在需要實現(xiàn)圖象聲音唇形同步的應(yīng)用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030中國異煙肼片行業(yè)市場深度分析及市場需求與投資價值研究報告
- 2025-2030中國平底電磁鍋行業(yè)市場深度調(diào)研及競爭格局與投資研究報告
- 2025-2030中國寵物衣服行業(yè)市場發(fā)展分析及前景趨勢與投資研究報告
- 2025年鄉(xiāng)村醫(yī)生考試模擬:農(nóng)村醫(yī)療衛(wèi)生機構(gòu)管理公共衛(wèi)生服務(wù)項目監(jiān)測與報告試題
- 農(nóng)作物種植合同
- 軟件系統(tǒng)銷售合同
- 介紹貨運司機合同5篇
- 大棚承包合同范本與大棚油菜買賣合同10篇
- 2025新編聯(lián)營合同5篇
- 中國超市H公司特許合同文本10篇
- 打破學習瓶頸,走出高原反應(yīng)ppt課件
- 束管監(jiān)測管理制度管理辦法及崗位責任制
- 安徽中醫(yī)藥大學專升本(語文)科目考試題庫(含歷年重點題)
- 后勤管理安全生產(chǎn)培訓內(nèi)容122頁PPT課件
- 直銷人必備—目標與計劃
- 等離子體光譜診斷實驗報告
- COMMERCIAL INVOICE 商業(yè)發(fā)票
- 永磁吸盤使用方法及安全事項
- 哈薩克斯坦2050戰(zhàn)略總統(tǒng)國情咨文(中文版)
- 接待手冊(范本)
- 還款證明(四種格式)
評論
0/150
提交評論