版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第10章聲源定位麥克風陣列模型房間回響模型概述雙耳聽覺定位原理及方法麥克風陣列的聲源定位方法總結(jié)與展望第10章聲源定位麥克風陣列模型房間回響模型概述雙耳聽覺定位10.1概述聲源定位技術(shù)主要是研究系統(tǒng)接收到的語音信號相對于接收傳感器是來自什么方向和什么距離,即方向估計和距離估計。聲源定位是一個有廣泛應用背景的研究課題,其在軍用、民用、工業(yè)上都有廣泛應用。聲源定位技術(shù)的內(nèi)容涉及了信號處理、語言科學、模式識別、計算機視覺技術(shù)、生理學、心理學、神經(jīng)網(wǎng)絡(luò)以及人工智能技術(shù)等多種學科。一個完整的聲源定位系統(tǒng)包括聲源數(shù)目估計、聲源定位和聲源增強(波束形成)。目前的聲源定位研究主要分為兩類:基于仿生的雙耳聲源定位算法和基于麥克風陣列的聲源定位算法。10.1概述聲源定位技術(shù)主要是研究系統(tǒng)接收到的語音信號相對應用——被動聲定位器應用——被動聲定位器應用——HumanoidRobotHRP-2ICRA2004應用——HumanoidRobotHRP-2ICRA應用——助聽器方向性麥克風技術(shù)應用——助聽器方向性麥克風技術(shù)應用——聲相儀應用——聲相儀10.2雙耳聽覺定位原理及方法人類聽覺系統(tǒng)對聲源的定位機理主要是由于人的頭部以及軀體等對入射的聲波具有一定的散射作用,以致到達人雙耳時,兩耳采集的信號存在著時間差(相位差)和強度差(聲級差)。對于頻率較高的聲音,還要考慮聲波的繞射性能。由于到達兩耳處的聲波狀態(tài)的不同,造成了聽覺的方位感和深度感,這就是常說的“雙耳效應”。不同方向上的聲源會使兩耳處產(chǎn)生不同的(但是特定的)聲波狀態(tài),從而使人能由此判斷聲源的方向位置??偟膩碚f,利用雙耳聽覺在水平面內(nèi)的聲源定位要比垂直面內(nèi)的聲源定位精確得多,后者存在較大的個體差異。10.2雙耳聽覺定位原理及方法人類聽覺系統(tǒng)對聲源的定位機理10.2.1人耳聽覺定位原理人耳可以聽到頻率在20Hz-20kHz范圍內(nèi)的聲音。人耳聽覺系統(tǒng)有兩個重要的特性,一個是耳蝸對于聲信號的分頻特性;另一個是人耳聽覺掩蔽效應。人耳對聲源目標的水平方位評估相比其垂直仰角而言,則要精確的多。在混響環(huán)境中,優(yōu)先效應起到重要作用,它是心理聲學的特性之一。所謂的優(yōu)先效應,當同一聲源的直達聲和反射聲被人耳聽到時,聽音者會將聲源定位在直達聲傳來的方向上,因為直達聲首先到達人耳處,即使反射聲的密度比直達聲高10dB。當將優(yōu)先效應用在混響環(huán)境中識別語音時,就產(chǎn)生了哈斯效應。哈斯觀察早期反射聲時,發(fā)現(xiàn)早期反射聲只要到達人耳足夠的早將不會影響語音的識別,相反的由于增加了語音的強度而有利于語音的識別。10.2.1人耳聽覺定位原理人耳可以聽到頻率在20Hz-10.2.2人耳聲源定位線索(1)雙耳定位線索不同方向上的聲源會使兩耳處產(chǎn)生不同的(但是特定的)聲波狀態(tài),從而使人能由此判斷聲源的方向位置。在實際應用中涉及到的定位線索主要有:ITD、ILD、雙耳相位差(IPD)、雙耳音色差(InterauralTimbreDifference)以及直達聲和環(huán)境反射群所產(chǎn)生的差別。在低中頻(f<1.5kHz)情況下,雙耳時間差是定位的主要因素;對于頻率范圍在1.5~4.0kHz的信號來說,聲級差和時間差都是聲源定位的影響因素;而當頻率f>5.0kHz時,雙耳聲級差是定位的主要因素,與時間差形成互補??偟膩碚f,雙耳時間差和聲級差涵蓋了整個聲音頻率范圍。10.2.2人耳聲源定位線索(1)雙耳定位線索10.2.2人耳聲源定位線索(2)耳廓效應耳廓效應的本質(zhì)就是改變不同空間方向聲音的頻譜特性,也就是說人類聽覺系統(tǒng)功能上相當于梳狀濾波器,將不同空間方向的聲音進行不同的濾波。耳廓具有不規(guī)則的形狀,形成一個共振腔。當聲波到達耳廓時,一部分聲波直接進入耳道,另一部分則經(jīng)過耳廓反射后才進入耳道。由于聲音到達的方向不同,不僅反射聲和直達聲之間強度比發(fā)生變化,而且反射聲與直達聲之間在不同頻率上產(chǎn)生不同的時間差和相位差,使反射聲與直達聲在鼓膜處形成一種與聲源方向位置有關(guān)的頻譜特性,聽覺神經(jīng)據(jù)此判斷聲音的空間方向。10.2.2人耳聲源定位線索(2)耳廓效應10.2.2人耳聲源定位線索(3)頭相關(guān)傳輸函數(shù)從某一個方位的聲源發(fā)出的聲信號在到達聽者的耳膜之前必然與聽者的頭部、肩部以及軀干、耳廓發(fā)生了反射、折射、散射以及衍射等聲學作用,其既與聲源相對于聽者的方向有關(guān),也因人體部位形狀及大小的不同而存在個體差異。人體的這些部位對聲信號的影響可以統(tǒng)一用一個函數(shù)來表示,即頭部相關(guān)傳輸函數(shù)HRTF。HRTF描述了聲波從聲源到雙耳的傳輸過程,它是綜合了ITD、ILD和頻譜結(jié)構(gòu)特性的聲源定位模型。在自由場情況下,HRTF定義為:10.2.2人耳聲源定位線索(3)頭相關(guān)傳輸函數(shù)10.2.3聲源估計方法對于不同的信號頻率,雙耳時間差模型有一定的變化規(guī)律,可以用參數(shù)化形式表示:
其中,αf是與頻率相關(guān)的尺度因子。反轉(zhuǎn)模型就可以得到水平角度θ,如下式所示:
上式不能通過普通方法求解方程,可使用切比雪夫序列獲得的多項式近似,進而獲得g-1的近似表示:
10.2.3聲源估計方法對于不同的信號頻率,雙耳時間差模10.3麥克風陣列模型麥克風陣列結(jié)構(gòu)就是一定數(shù)量的麥克風按照一定空間放置而構(gòu)成的麥克風組,也稱為麥克風陣列的拓撲結(jié)構(gòu)。麥克風近場和遠場模型的判斷公式為:r<2L2/λ
。近場和遠場模型下不同的拓撲結(jié)構(gòu)所構(gòu)成的導向向量也不相同。不同的導向向量攜帶的信息也不同,聲源近場模型中所攜帶的信息不僅有距離、時延,還有聲源空間位置;而聲源遠場模型中攜帶的僅僅是聲源的空間位置信息,即方位和俯仰。此外,陣元間距也直接影響聲源定位的結(jié)果,而陣元個數(shù)可以適當?shù)奶岣叨ㄎ痪取?0.3.1窄帶陣列信號處理模型10.3麥克風陣列模型麥克風陣列結(jié)構(gòu)就是一定數(shù)量的麥克風按10.3.1窄帶陣列信號處理模型假設(shè)麥克風陣由M個全向麥克風組成,信號源的個數(shù)為P,所有到達陣列的波可近似為平面波。將第一個陣元設(shè)為參考陣元,則到達參考陣元的第j個信號為:由于信號滿足窄帶假設(shè)條件,則zj(t-τ)≈zj(t),此時理想情況下第i個陣元接收到的信號可以表示為:
此時,整個麥克風陣接收到得信號為:
10.3.1窄帶陣列信號處理模型假設(shè)麥克風陣由M個全向麥10.3.2麥克風陣列信號模型假設(shè)P個聲源
Sj,M個無差異全向麥克風
Di。設(shè)聲源為點源,位置矢量為:當麥克風陣列應用于室外或者大型會議室等環(huán)境時,聲源與麥克風陣列相距較遠,此時可采用簡化的麥克風陣列的遠場信號模型。時延可表示為:10.3.2麥克風陣列信號模型假設(shè)P個聲源Sj,M個無10.3.2麥克風陣列信號模型1)均勻線陣均勻線陣是一最簡單常用的陣列形式。M個陣元等距離排列成一直線,陣元間距為d??紤]到聲源頻率在100~3400Hz之間,因此在空氣中波長相應為10~340厘米。綜合考慮空間采樣定理,陣列尺寸等因素,陣元間距一般為5~15厘米。等距線陣的流形矩陣為:10.3.2麥克風陣列信號模型1)均勻線陣10.3.2麥克風陣列信號模型2)均勻圓陣均勻圓周陣列簡稱均勻圓陣(UCA,UniformCircularArray),是平面陣列。陣列的有效估計是二維的,能夠同時確定信號的方位角和仰角。均勻圓陣相對于波達方向的信號的導向向量為:10.3.2麥克風陣列信號模型2)均勻圓陣10.4房間回響模型在聲源定位、信號提取、回波抵消等語音信號處理算法中,建立一個靈活、合理的房間混響模型對算法運行、評估具有重要的作用。Allen和Berkley在文獻中提出的IMAGE法是構(gòu)建房間混響模型最常用的方法之一。常見的房間聲學環(huán)境仿真方法主要分為波動方程模型、射線模型和統(tǒng)計模型三種。1)
房間模型的意義10.4房間回響模型在聲源定位、信號提取、回波抵消等語音信2)
仿真原理與方法麥克風和第i個虛擬聲源的距離可表示為:此時,虛擬源到原點的距離為每個虛擬源的延遲點數(shù)為2)仿真原理與方法麥克風和第i個虛擬聲源的距離可表示為:2)
仿真原理與方法定義單位脈沖響應函數(shù)
為影響回響幅度的因素主要有兩種:1)聲源到麥克風的距離:幅度系數(shù)反比于距離,即2)聲波反射個數(shù):如果所有墻壁的反射系數(shù)
相同,則墻壁系數(shù)
定義為
則最終的幅度系數(shù)為綜上所述,單位脈沖響應
為
2)仿真原理與方法定義單位脈沖響應函數(shù)為3)
麥克風接收信號的模擬獲得單位脈沖響應
后,麥克風接收到的信號為
此處,
hi(t)代表麥克風和聲源對建立的脈沖響應,
pi(t)代表實際的聲源信號。3)麥克風接收信號的模擬獲得單位脈沖響應后,麥克風接收10.5麥克風陣列的聲源定位方法基于麥克風陣列的聲源定位算法大致可以分為三類:基于可控波束形成器的聲源定位算法、基于到達時間差的聲源定位算法和基于高分辨率譜估計的聲源定位算法。1)基于最大輸出功率的可控波束形成技術(shù):對麥克風陣列接收到的語音信號進行濾波、加權(quán)求和,然后直接控制麥克風指向使波束有最大輸出功率的方向;2)基于到達時間差的定位算法:首先求出聲音到達不同位置麥克風的時間差,再利用該時間差求得聲音到達不同位置麥克風的距離差,最后用搜索或幾何知識確定聲源位置;3)基于高分辨率譜估計的定向算法:利用求解麥克風信號間的相關(guān)矩陣來定出方向角,從而進一步定出聲源位置。10.5麥克風陣列的聲源定位方法基于麥克風陣列的聲源定位算10.5.1基于最大輸出功率的可控波束形成算法該方法的優(yōu)點是可以一步完成定位,且在最大似然意義上是最優(yōu)的,同時對不相關(guān)的噪聲有抑制作用。最優(yōu)的條件有兩個:1)接收到的噪聲是加性噪聲、彼此互不相關(guān)、方差均一且數(shù)值不大;2)聲源到麥克風距離相等。但是,在實際情況下,存在反射以及復雜的噪聲影響,會影響該方法的精度。10.5.1基于最大輸出功率的可控波束形成算法該方法的優(yōu)點10.5.2基于到達時間差的定位算法基于到達時間差的定位算法的運算量較小,實時性效果比較好,而且硬件成本低?;赥DE的聲源定位算法一般要分為兩個步驟:第一,先進行時延估計,并確定麥克風陣列中不同麥克風對同源語音信號的到達時間差(TDOA);第二,就是根據(jù)測定出的TDOA和各個麥克風的幾何位置,通過雙曲方程,來最終確定聲源的方位和距離。時延估計算法的方法有很多,其中廣義互相關(guān)法運用最為廣泛。廣義互相關(guān)法通過求兩信號之間的互功率譜,并在頻域內(nèi)給予一定的加權(quán),來抑制噪聲和反射的影響,再反變換到時域,得到兩信號之間的互相關(guān)函數(shù)。而互相關(guān)函數(shù)的峰值處,就是兩信號之間的相對時延。廣義互相關(guān)法就是在功率譜域?qū)π盘栠M行加權(quán),突出相關(guān)的信號部分并抑制受噪聲干擾的部分,從而使相關(guān)函數(shù)在時延處的峰值更為突出。10.5.2基于到達時間差的定位算法基于到達時間差的定位10.5.2基于到達時間差的定位算法兩麥克風接收到信號的廣義互相關(guān)函數(shù)
可表示為:10.5.2基于到達時間差的定位算法兩麥克風接收到信號的10.5.2基于到達時間差的定位算法10.5.2基于到達時間差的定位算法10.5.3基于高分辨率譜估計的定位算法特征子空間類算法,是現(xiàn)代譜估計最重要的算法之一,通過對陣列接收數(shù)據(jù)作數(shù)學分解,劃分為兩個相互正交的子空間:與信號源的陣列流形空間一致的信號子空間,和與信號子空間正交的噪聲子空間。子空間分解類算法,就是利用兩個子空間的正交特性,構(gòu)造出“針狀”空間譜峰,從而大大提高算法的分辨力。子空間分解類算法從處理方式上大致可以分為兩種:一類是以MUSIC為代表的噪聲子空間類算法;一類是以旋轉(zhuǎn)不變子空間(ESPRIT)為代表的信號子空間類算法。以MUSIC為代表的算法包括特征矢量法、MUSIC以及求根MUSIC法等;以ESPRIT為代表的算法主要有TAM、LS-ESPRIT以及TLS-ESPRIT等。10.5.3基于高分辨率譜估計的定位算法特征子空間類算法10.6總結(jié)與展望根據(jù)這些新的發(fā)展,依然可以進一步進行下面的研究:1)結(jié)合定位與增強的方法,對麥克風陣列的實際工作性能進行進一步的實驗,得到麥克風陣列的工作參數(shù),并對陣列本身的性能與參數(shù)的關(guān)系進行詳細分析。2)改變麥克風陣列的拓撲結(jié)構(gòu),對更加復雜的拓撲結(jié)構(gòu)(如二維陣列或三維陣列)進行探討,甚至對無規(guī)則形狀的拓撲結(jié)構(gòu)進行理論分析與實驗證明。3)對于復雜環(huán)境,可使用多組麥克風陣列的協(xié)同定位,對各陣列間的信息融合方法進行探討。4)利用麥克風陣列與成熟的語音識別系統(tǒng)共同構(gòu)建功能更豐富的智能拾音系統(tǒng)。10.6總結(jié)與展望根據(jù)這些新的發(fā)展,依然可以進一步進行下面第10章聲源定位麥克風陣列模型房間回響模型概述雙耳聽覺定位原理及方法麥克風陣列的聲源定位方法總結(jié)與展望第10章聲源定位麥克風陣列模型房間回響模型概述雙耳聽覺定位10.1概述聲源定位技術(shù)主要是研究系統(tǒng)接收到的語音信號相對于接收傳感器是來自什么方向和什么距離,即方向估計和距離估計。聲源定位是一個有廣泛應用背景的研究課題,其在軍用、民用、工業(yè)上都有廣泛應用。聲源定位技術(shù)的內(nèi)容涉及了信號處理、語言科學、模式識別、計算機視覺技術(shù)、生理學、心理學、神經(jīng)網(wǎng)絡(luò)以及人工智能技術(shù)等多種學科。一個完整的聲源定位系統(tǒng)包括聲源數(shù)目估計、聲源定位和聲源增強(波束形成)。目前的聲源定位研究主要分為兩類:基于仿生的雙耳聲源定位算法和基于麥克風陣列的聲源定位算法。10.1概述聲源定位技術(shù)主要是研究系統(tǒng)接收到的語音信號相對應用——被動聲定位器應用——被動聲定位器應用——HumanoidRobotHRP-2ICRA2004應用——HumanoidRobotHRP-2ICRA應用——助聽器方向性麥克風技術(shù)應用——助聽器方向性麥克風技術(shù)應用——聲相儀應用——聲相儀10.2雙耳聽覺定位原理及方法人類聽覺系統(tǒng)對聲源的定位機理主要是由于人的頭部以及軀體等對入射的聲波具有一定的散射作用,以致到達人雙耳時,兩耳采集的信號存在著時間差(相位差)和強度差(聲級差)。對于頻率較高的聲音,還要考慮聲波的繞射性能。由于到達兩耳處的聲波狀態(tài)的不同,造成了聽覺的方位感和深度感,這就是常說的“雙耳效應”。不同方向上的聲源會使兩耳處產(chǎn)生不同的(但是特定的)聲波狀態(tài),從而使人能由此判斷聲源的方向位置。總的來說,利用雙耳聽覺在水平面內(nèi)的聲源定位要比垂直面內(nèi)的聲源定位精確得多,后者存在較大的個體差異。10.2雙耳聽覺定位原理及方法人類聽覺系統(tǒng)對聲源的定位機理10.2.1人耳聽覺定位原理人耳可以聽到頻率在20Hz-20kHz范圍內(nèi)的聲音。人耳聽覺系統(tǒng)有兩個重要的特性,一個是耳蝸對于聲信號的分頻特性;另一個是人耳聽覺掩蔽效應。人耳對聲源目標的水平方位評估相比其垂直仰角而言,則要精確的多。在混響環(huán)境中,優(yōu)先效應起到重要作用,它是心理聲學的特性之一。所謂的優(yōu)先效應,當同一聲源的直達聲和反射聲被人耳聽到時,聽音者會將聲源定位在直達聲傳來的方向上,因為直達聲首先到達人耳處,即使反射聲的密度比直達聲高10dB。當將優(yōu)先效應用在混響環(huán)境中識別語音時,就產(chǎn)生了哈斯效應。哈斯觀察早期反射聲時,發(fā)現(xiàn)早期反射聲只要到達人耳足夠的早將不會影響語音的識別,相反的由于增加了語音的強度而有利于語音的識別。10.2.1人耳聽覺定位原理人耳可以聽到頻率在20Hz-10.2.2人耳聲源定位線索(1)雙耳定位線索不同方向上的聲源會使兩耳處產(chǎn)生不同的(但是特定的)聲波狀態(tài),從而使人能由此判斷聲源的方向位置。在實際應用中涉及到的定位線索主要有:ITD、ILD、雙耳相位差(IPD)、雙耳音色差(InterauralTimbreDifference)以及直達聲和環(huán)境反射群所產(chǎn)生的差別。在低中頻(f<1.5kHz)情況下,雙耳時間差是定位的主要因素;對于頻率范圍在1.5~4.0kHz的信號來說,聲級差和時間差都是聲源定位的影響因素;而當頻率f>5.0kHz時,雙耳聲級差是定位的主要因素,與時間差形成互補??偟膩碚f,雙耳時間差和聲級差涵蓋了整個聲音頻率范圍。10.2.2人耳聲源定位線索(1)雙耳定位線索10.2.2人耳聲源定位線索(2)耳廓效應耳廓效應的本質(zhì)就是改變不同空間方向聲音的頻譜特性,也就是說人類聽覺系統(tǒng)功能上相當于梳狀濾波器,將不同空間方向的聲音進行不同的濾波。耳廓具有不規(guī)則的形狀,形成一個共振腔。當聲波到達耳廓時,一部分聲波直接進入耳道,另一部分則經(jīng)過耳廓反射后才進入耳道。由于聲音到達的方向不同,不僅反射聲和直達聲之間強度比發(fā)生變化,而且反射聲與直達聲之間在不同頻率上產(chǎn)生不同的時間差和相位差,使反射聲與直達聲在鼓膜處形成一種與聲源方向位置有關(guān)的頻譜特性,聽覺神經(jīng)據(jù)此判斷聲音的空間方向。10.2.2人耳聲源定位線索(2)耳廓效應10.2.2人耳聲源定位線索(3)頭相關(guān)傳輸函數(shù)從某一個方位的聲源發(fā)出的聲信號在到達聽者的耳膜之前必然與聽者的頭部、肩部以及軀干、耳廓發(fā)生了反射、折射、散射以及衍射等聲學作用,其既與聲源相對于聽者的方向有關(guān),也因人體部位形狀及大小的不同而存在個體差異。人體的這些部位對聲信號的影響可以統(tǒng)一用一個函數(shù)來表示,即頭部相關(guān)傳輸函數(shù)HRTF。HRTF描述了聲波從聲源到雙耳的傳輸過程,它是綜合了ITD、ILD和頻譜結(jié)構(gòu)特性的聲源定位模型。在自由場情況下,HRTF定義為:10.2.2人耳聲源定位線索(3)頭相關(guān)傳輸函數(shù)10.2.3聲源估計方法對于不同的信號頻率,雙耳時間差模型有一定的變化規(guī)律,可以用參數(shù)化形式表示:
其中,αf是與頻率相關(guān)的尺度因子。反轉(zhuǎn)模型就可以得到水平角度θ,如下式所示:
上式不能通過普通方法求解方程,可使用切比雪夫序列獲得的多項式近似,進而獲得g-1的近似表示:
10.2.3聲源估計方法對于不同的信號頻率,雙耳時間差模10.3麥克風陣列模型麥克風陣列結(jié)構(gòu)就是一定數(shù)量的麥克風按照一定空間放置而構(gòu)成的麥克風組,也稱為麥克風陣列的拓撲結(jié)構(gòu)。麥克風近場和遠場模型的判斷公式為:r<2L2/λ
。近場和遠場模型下不同的拓撲結(jié)構(gòu)所構(gòu)成的導向向量也不相同。不同的導向向量攜帶的信息也不同,聲源近場模型中所攜帶的信息不僅有距離、時延,還有聲源空間位置;而聲源遠場模型中攜帶的僅僅是聲源的空間位置信息,即方位和俯仰。此外,陣元間距也直接影響聲源定位的結(jié)果,而陣元個數(shù)可以適當?shù)奶岣叨ㄎ痪取?0.3.1窄帶陣列信號處理模型10.3麥克風陣列模型麥克風陣列結(jié)構(gòu)就是一定數(shù)量的麥克風按10.3.1窄帶陣列信號處理模型假設(shè)麥克風陣由M個全向麥克風組成,信號源的個數(shù)為P,所有到達陣列的波可近似為平面波。將第一個陣元設(shè)為參考陣元,則到達參考陣元的第j個信號為:由于信號滿足窄帶假設(shè)條件,則zj(t-τ)≈zj(t),此時理想情況下第i個陣元接收到的信號可以表示為:
此時,整個麥克風陣接收到得信號為:
10.3.1窄帶陣列信號處理模型假設(shè)麥克風陣由M個全向麥10.3.2麥克風陣列信號模型假設(shè)P個聲源
Sj,M個無差異全向麥克風
Di。設(shè)聲源為點源,位置矢量為:當麥克風陣列應用于室外或者大型會議室等環(huán)境時,聲源與麥克風陣列相距較遠,此時可采用簡化的麥克風陣列的遠場信號模型。時延可表示為:10.3.2麥克風陣列信號模型假設(shè)P個聲源Sj,M個無10.3.2麥克風陣列信號模型1)均勻線陣均勻線陣是一最簡單常用的陣列形式。M個陣元等距離排列成一直線,陣元間距為d??紤]到聲源頻率在100~3400Hz之間,因此在空氣中波長相應為10~340厘米。綜合考慮空間采樣定理,陣列尺寸等因素,陣元間距一般為5~15厘米。等距線陣的流形矩陣為:10.3.2麥克風陣列信號模型1)均勻線陣10.3.2麥克風陣列信號模型2)均勻圓陣均勻圓周陣列簡稱均勻圓陣(UCA,UniformCircularArray),是平面陣列。陣列的有效估計是二維的,能夠同時確定信號的方位角和仰角。均勻圓陣相對于波達方向的信號的導向向量為:10.3.2麥克風陣列信號模型2)均勻圓陣10.4房間回響模型在聲源定位、信號提取、回波抵消等語音信號處理算法中,建立一個靈活、合理的房間混響模型對算法運行、評估具有重要的作用。Allen和Berkley在文獻中提出的IMAGE法是構(gòu)建房間混響模型最常用的方法之一。常見的房間聲學環(huán)境仿真方法主要分為波動方程模型、射線模型和統(tǒng)計模型三種。1)
房間模型的意義10.4房間回響模型在聲源定位、信號提取、回波抵消等語音信2)
仿真原理與方法麥克風和第i個虛擬聲源的距離可表示為:此時,虛擬源到原點的距離為每個虛擬源的延遲點數(shù)為2)仿真原理與方法麥克風和第i個虛擬聲源的距離可表示為:2)
仿真原理與方法定義單位脈沖響應函數(shù)
為影響回響幅度的因素主要有兩種:1)聲源到麥克風的距離:幅度系數(shù)反比于距離,即2)聲波反射個數(shù):如果所有墻壁的反射系數(shù)
相同,則墻壁系數(shù)
定義為
則最終的幅度系數(shù)為綜上所述,單位脈沖響應
為
2)仿真原理與方法定義單位脈沖響應函數(shù)為3)
麥克風接收信號的模擬獲得單位脈沖響應
后,麥克風接收到的信號為
此處,
hi(t)代表麥克風和聲源對建立的脈沖響應,
pi(t)代表實際的聲源信號。3)麥克風接收信號的模擬獲得單位脈沖響應后,麥克風接收10.5麥克風陣列的聲源定位方法基于麥克風陣列的聲源定位算法大致可以分為三類:基于可控波束形成器的聲源定位算法、基于到達時間差的聲源定位算法和基于高分辨率譜估計的聲源定位算法。1)基于最大輸出功率的可控波束形成技術(shù):對麥克風陣列接收到的語音信號進行濾波、加權(quán)求和,然后直接控制麥克風指向使波束有最大輸出功率的方向;2)基于到達時間差的定位算法:首先求出聲音到達不同位置麥克風的時間差,再利用該時間差求得聲音到達不同位置麥克風的距離差,最后用搜索或幾何知識確定聲源位置;3)基于高分辨率譜估計的定向算法:利用求解麥克風信號間的相關(guān)矩陣來定出方向角,從而進一步定出聲源位置。10.5麥克風陣列的聲源定位方法基于麥克風陣列的聲源定位算10.5.1基于最大輸出功率的可控波束形成算法該方法的優(yōu)點是可以一步完成定位,且在最大似然意義上是最優(yōu)的,同時對不相關(guān)的噪聲有抑制作用。最優(yōu)的條件有兩個:1)接收到的噪聲是加性噪聲、彼此互不相關(guān)、方差均一且數(shù)值不大;2)聲源到麥克風距離相等。但是,在實際情況下,存在反射以及復雜的噪聲影響,會影響該方法的精度。10.5.1基于最大輸出功率的可控波束形成算法該方法的優(yōu)點10.5.2基于到達時間差的定位算法基于到達時間差的定位算法
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 妊娠期生殖器皰疹的健康宣教
- 膿皰型銀屑病的臨床護理
- JJF(陜) 013-2019 微量總有機碳分析儀校準規(guī)范
- 《解讀自由基》課件
- 北師大版不等式課件
- 大班級風采展示活動策劃計劃
- 摻混肥相關(guān)行業(yè)投資規(guī)劃報告
- 充換電站相關(guān)行業(yè)投資方案范本
- 割灌機相關(guān)行業(yè)投資方案
- 課程研究小組的組織與管理計劃
- 中考道法一輪復習講練測七年級下冊(綜合測試)(原卷版)
- 《我們的動物朋友》作業(yè)設(shè)計方案-2023-2024學年科學大象版2001
- 電梯維護保養(yǎng)規(guī)則(TSG T5002-2017)
- MOOC 美化嗓音 輕松講課-愛課程 中國大學慕課答案
- 髂總動脈瘤的護理查房
- 麻醉科科室副主任述職報告
- 2024年鐵嶺衛(wèi)生職業(yè)學院單招綜合素質(zhì)考試題庫及答案解析文檔版
- 食品行業(yè)的食品安全與質(zhì)量控制
- 關(guān)于開展2024年職工合理化建議征集評選活動的通知
- 月季嫁接技術(shù)的培訓課件
- 中心靜脈深靜脈導管維護操作評分標準
評論
0/150
提交評論