版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、回音消除技術(shù)在過去三十年中,回音消除(Echo cancellation)已演變發(fā)展出屬于它自己的專業(yè)領(lǐng)域。一般人將它視為是一個難以理解的技術(shù)領(lǐng)域,想要了解它并取得可接受的實(shí)務(wù)性成果,往往必須具備深厚的理論基礎(chǔ)和特殊的專業(yè)知識才能做到?;匾粝钤绫挥糜陂L距離語音通道的傳輸中,但對于回音消除的需求已延伸到透過封包或無線網(wǎng)路傳輸?shù)拿恳粭l語音通道中,其應(yīng)用包括VoIP(Voice over IP)、Voice over DSL或第三代行動網(wǎng)路(3G)等等。由于有愈來愈多的語音是透過封包網(wǎng)路來傳送,而封包式語音的本質(zhì)上即存在著延遲的議題,因此迴音消除就成了主要的設(shè)計(jì)考量之一,也是在語音解決方案的整體
2、成本中相當(dāng)重要的一部分。顯然地,回音消除的成本將成為電信設(shè)備中的一部分,而這部分的成本與元件的尺寸及功耗息息相關(guān)。成本固然重要,但更重要的考量還是品質(zhì)的達(dá)成。對于行動網(wǎng)路用戶來說,語音品質(zhì)一直是他們最關(guān)切的議題;對電信業(yè)者來說,語音也仍是他們最能獲利的服務(wù)項(xiàng)目,因此語音的品質(zhì)是不容妥協(xié)的。傳統(tǒng)的回音消除技術(shù)是從七十年代的早期作法發(fā)展而來,這類技術(shù)的采用相當(dāng)昂貴。為了滿足今日與未來的網(wǎng)路需求,回音消除技術(shù)的挑戰(zhàn)正在于如何有效地降低成本并持續(xù)改善語音品質(zhì)。經(jīng)過三十年的發(fā)展,回音消除技術(shù)的效益確實(shí)有所提升,但在演算法的建置上,基本上并沒有太大的改變。透過今日高密度晶片所發(fā)展出的新技術(shù),除了能揭露回音
3、消除技術(shù)的神祕性外,還能夠大幅地降低成本,并且以可量測的方式來提升解決方案的品質(zhì)與效能。 自適應(yīng)濾波器在所有回音消除器的核心部分是自適應(yīng)濾波器(Adaptive Filter, AF)。自適應(yīng)濾波器會建立起回音路徑的數(shù)學(xué)表示法或脈沖響應(yīng)(impulse response)。這個表示法一旦被建立后,它會被儲存在一般所知的H暫存器(H register)中。當(dāng)自適應(yīng)濾波器使用H暫存器來處理某個信號(Rin)時,輸出值是一個近似于預(yù)期中Rin迴音的新信號值。此一新信號可以從傳回的信號(Sin)中被減去,以移除或消除回音現(xiàn)象。 圖一回音消除器運(yùn)作架構(gòu)由于自適應(yīng)濾波器只能估算回音的近似值,因此它并不能將
4、回音完全消除,也就是說,仍然有些殘余的迴音留在信號當(dāng)中。在任何時刻中,H暫存器中的準(zhǔn)確性正是決定殘余回音音量的關(guān)鍵所在。如果殘余的回音量大到聽得見的音量,這時就得靠非線性處理器(non linear processor, NLP)來加以移除,NLP是每個迴音消除器組成架構(gòu)中的一部分。自適應(yīng)濾波器的范圍很廣,可以有各種的解決方案。所有的自適應(yīng)濾波器解決方案都有相同的目標(biāo),也就是找到一套最佳化的數(shù)學(xué)模型,讓此模型和系統(tǒng)實(shí)際響應(yīng)之間的誤差能達(dá)到最小這個過程被稱為收斂(convergence)。自適應(yīng)濾波器演算法在技術(shù)作法上的競爭發(fā)展,可以上溯到19世紀(jì)早期,當(dāng)時高斯(Carl Friedrich G
5、auss)和拉普拉斯(Pierre-Simon Laplace)兩位數(shù)學(xué)大師分別對此問題提出了不同的解決途徑,也引起了極大的爭議。高斯的最小平方(Least Squares, LS)法將誤差的平方做了最小化處理;拉普拉斯的解決方法則是對實(shí)際的誤差進(jìn)行最小化處理。針對特定的應(yīng)用以及當(dāng)時可行的技術(shù),基于這兩項(xiàng)途徑又衍生出許多的解決方案,它們都試著要改善將模型與實(shí)際響應(yīng)之間的誤差達(dá)到最小的能力。不過,多數(shù)人都同意最小平方法較適用于在回音消除環(huán)境的系統(tǒng)中?;诮ㄖ?LS 的成本考量,多數(shù)的回音消除器采用最小均方(Least Means Squares)法來實(shí)現(xiàn) LS 解決方案。語音的回音消除設(shè)備對自適
6、應(yīng)濾波器演算法有兩個主要的要求:快速性(sprint)和持久性(marathon)??焖傩缘囊笫窃谕ㄔ捯婚_始時即能快速的收斂,但回音路徑改變時,也能快速地重新收斂。由于在一開始時還不知道回音路為何,初始收斂必須要能很快的完成。在快速的收斂后,還需要有一個自適應(yīng)濾波器演算法來繼續(xù)改善收斂狀況,此演算法不管回音中所夾雜的任何回傳噪音。這種持久性在整段通話中都會持續(xù)進(jìn)行,包括不說話和同時說話(double talk)的含混語音狀況。在整個過程中,回音路徑的收斂是不能中斷的。簡單地說,自適應(yīng)濾波器的設(shè)計(jì)具有兩個互相矛盾的特性,也就是快速收斂和高度的穩(wěn)定性,如何同時實(shí)現(xiàn)這兩項(xiàng)特性,正是設(shè)計(jì)上的主要挑戰(zhàn)
7、。 線上濾波器 vs. 離線濾波器最簡化的自適應(yīng)濾波器型式會持續(xù)地對輸入信號進(jìn)行處理。自適應(yīng)濾波器會根據(jù)每個新的采樣數(shù)據(jù)來更新H暫存器。這個新的采樣數(shù)據(jù)會被分配到一個權(quán)重(weight),此權(quán)重會決定它與H暫存器中既存的數(shù)據(jù)何者較為重要。此權(quán)重通常被稱為自適應(yīng)增益(adaptation gain)、步長大?。╯tep size)或遺忘因子(forgetting factor)。在通話一開始時或回音路徑改變后,此增益值應(yīng)該會較大,其目的是要讓H暫存器快速地逼近當(dāng)下的回音路徑。當(dāng)double talk時,必須分配一個很小的自適應(yīng)增益值(有時此增益是 0)給新采樣數(shù)據(jù),其目的是要避免原本有
8、效的H暫存器遭到不良的影響。在所有其他的狀況中,一個低的增益值是用來讓收斂速度放慢,而以較大量的取樣數(shù)據(jù)來進(jìn)行平均,此舉能在H暫存器中產(chǎn)生更逼近的迴音路徑。有一套用來決定自適應(yīng)增益的邏輯,它控制了自適應(yīng)濾波器的穩(wěn)定性和響應(yīng)特性,此邏輯正是一個自適應(yīng)濾波器中最重要的技巧所在。在上述演算法中的最大問題之一,就是如何區(qū)分出近端通話(包括double talk和背景噪音)和回音路徑改變。如果近端通話被誤認(rèn)為回音路徑改變,新采樣數(shù)據(jù)就會因獲得較大的自適應(yīng)增益值,進(jìn)而對原先收斂地很好的H暫存器造成破壞。不過,如果一個迴音路徑的改變被誤認(rèn)為是近端通話,新取樣數(shù)據(jù)所得到的低增益將讓H暫存器無法在合理的時間內(nèi)估
9、算出新脈沖響應(yīng)的真實(shí)特性。為了解決這個問題,回音消除器演算法可以在完整地保有當(dāng)前線上H暫存器的條件下,同時采用第二個自適應(yīng)濾波器(稱為離線濾波器)。此一離線濾波器會嘗試對最新的取樣數(shù)據(jù)進(jìn)行收斂,以建置另一快速收斂的離線H暫存器。當(dāng)這個離線H暫存器對迴音路徑的匹配度達(dá)到比線上濾波器建置的H暫存器更佳的狀態(tài)時,它就會取代原先的H暫存器。為線上應(yīng)用選擇正確的H暫存器,正是建立快速且穩(wěn)定的離線濾波系統(tǒng)的關(guān)鍵所在。比較這兩個H暫存器的選擇過程,通常稱為離線濾波器選擇(offline filter selection)。此演算法採用一個H誤差暫存器來建立每個濾波器的收斂特性,進(jìn)而能進(jìn)行正確的比較。要實(shí)現(xiàn)穩(wěn)
10、定、不受double talk干擾和快速收斂的自適應(yīng)濾 波器特性,此一誤差的計(jì)量與標(biāo)準(zhǔn)統(tǒng)計(jì)方法的整合正是其中的關(guān)鍵。 簡化回音消除器范例我們將使用一個簡化的回音消除范例來清楚地說明離線濾波器選擇的決定過程。此一回音消除器包含一個延遲為 0 的單階(single tap)H暫存器,這表示此一回音消除器只能量測衰減,但不能檢查延遲。每隔1024個取樣(128ms),此設(shè)備會針對這些取樣計(jì)算出一個離線暫存器。當(dāng)這些取樣數(shù)據(jù)被用來計(jì)算出離線H暫存器后,它可能會取代線上暫存器(如果確信它是更佳的回音路徑模型),也可能被捨棄。此一回音消除器會使用最小平方演算法,來計(jì)算它的H暫存器,如下圖所示:
11、圖二的范例顯示一個延續(xù)了3072個取樣的測試通話。為了滿足此范例的目的,此一回音路徑是一個起始樣本為2048個、幅度為0.5的單階脈沖(impulse)。后1024個取樣包含一個不同的回音路徑,它的幅度是0.2,也就是說,在第2048個取樣時會出現(xiàn)回音路徑的一次改變。圖二回音消除測試范例從圖二可以很容易地看出,在第一個收斂時段(P0)中,其H暫存器中包含的誤差應(yīng)該是最小的,因?yàn)樵赟in信號中存在最少的噪音量。由于相似的理由,在中間收斂時段(P1)中,其H暫存器包含的誤差應(yīng)該是最大的,因?yàn)樗嬖谧畲蟮脑胍袅?。最后一個時段(P2)的誤差應(yīng)該是介于兩者之間。顯然地,一個好的自適應(yīng)濾波器應(yīng)該選擇由時段
12、P0所產(chǎn)生的H暫存器,只要它完成了(在第1024個取樣后)就立即用于線上處理;由P1時段產(chǎn)生的H暫存器則應(yīng)該被捨棄,因?yàn)樵赑1時段中因噪音而形成很大的誤差;最后,由P2時段產(chǎn)生的H暫存器,其幅度與自P0時段后即被採用的線上H暫存器有很大的差異,因此它應(yīng)該取代線上H暫存器以反應(yīng)出迴音路徑的改變。此一操作的細(xì)節(jié)將在下文中更具體的說明。 找出回音估算中的誤差自適應(yīng)濾波器透過測量Rin和Sin信號(參考圖一)之間的相關(guān)性來區(qū)分出回音和噪音的不同,其中Sin訊號是近端信號(背景噪音和近端語音)和回音信號的總合。要找出Sin信號中的迴音,需要將它和Rin進(jìn)行交叉關(guān)聯(lián),因?yàn)榇嘶匾魰荝in的線性函
13、數(shù),不過,Rin訊號與回音之間的關(guān)聯(lián)性很好,但它和近端信號的關(guān)聯(lián)性就小很多。雖然近端信號(Snear)和Rin是獨(dú)立的信號(通常不相關(guān)),但其相關(guān)性并不會等于零,這種相關(guān)性的結(jié)果正是讓H暫存器產(chǎn)生誤差的原因。為了解釋上述自適應(yīng)濾波器的行為,勢必會遭遇到不少的數(shù)學(xué)挑戰(zhàn)。首先,在每次收斂后的H暫存器誤差必須被估算出,但并不可能完全正確的計(jì)算出它的誤差。如果真的算出來了,那就可能透過從H暫存器的估計(jì)值減去誤差來找出實(shí)際的回音路徑。不過,透過數(shù)學(xué)方式來計(jì)算出誤差的標(biāo)準(zhǔn)偏差(standard deviation)還是可能實(shí)現(xiàn)的,此標(biāo)準(zhǔn)偏差值為圍繞在H估計(jì)值附近的誤差統(tǒng)計(jì)分布提供了一個可信度的參考。H暫存
14、器誤差的標(biāo)準(zhǔn)偏差會被儲存在H誤差暫存器中(見表一)。 標(biāo)準(zhǔn)偏差倍數(shù)大于預(yù)期的的誤差百分率131.73105007924.5500263930.26997960640.00633424850.0000573360.000000197表一標(biāo)準(zhǔn)偏差倍數(shù)與其代表的誤差百分率有許多統(tǒng)計(jì)方法被用來確定一個隨機(jī)過程的標(biāo)準(zhǔn)偏差。在此應(yīng)用中,我們可以看出此誤差是基于高斯分布的。使用高斯分析并知道誤差的標(biāo)準(zhǔn)偏差,就可以算出誤差超過某一特定值的概率,此特定值通常用標(biāo)準(zhǔn)偏差的倍數(shù)來衡量。表一顯示不同標(biāo)準(zhǔn)偏差的倍數(shù),以及試驗(yàn)中會產(chǎn)生大于這些特定值的誤差在理論上的百分率。H誤差暫存器的用途在于確定H暫存器中的數(shù)值究竟產(chǎn)生
15、了多大的誤差。當(dāng)H暫存器的實(shí)際誤差比預(yù)期的誤差來得低時,就會對演算法做出的決策進(jìn)行修正。不過,如果實(shí)際的誤差大于預(yù)期的數(shù)值時,就會做出錯誤的決策。換個角度來看,在整個過程中,采用一個大的誤差因子會拖慢決策確定的過程,因此必須在快速的反應(yīng)時間和錯誤行為的數(shù)量之間做出妥協(xié)。在此一離線濾波演算法中必須針對穩(wěn)定性做出妥協(xié),這是在設(shè)計(jì)上必需知道的重要概念。在上述的回音消除范例中,每經(jīng)過1024次取樣會做一次決定(也就是每次會有一個新的H暫存器可用)。如果決策過程採用 4 (四倍標(biāo)準(zhǔn)偏差)誤差因子,平均每15800個決策中將有一個是錯誤的(即0.0063%的錯誤率)。若使用8KHz的取樣率,那每33分鐘的
16、操作中平均會出現(xiàn)一次錯誤的決策。如果改采 6 誤差因子,每二年的操作才會出現(xiàn)一次錯誤的決策。 選擇正確的過濾器現(xiàn)在可以將這些資訊用于離線濾波器的選擇過程。每取樣1024次,就能計(jì)算出一個新的H暫存器值。采用下列的步驟來與線上H暫存器數(shù)值進(jìn)行比較,就能確定回音路徑是否有改變。首先會進(jìn)行一項(xiàng)一致性的測試,也就是計(jì)算出兩個H暫存器之間的差異。如果兩個暫存器之間的差異值大到無法解釋它們的誤差狀況,新的H暫存器會自動成為新的線上H暫存器,并將基于舊迴音路模式所收集到的所有資訊都刪除掉。這是一次回音路徑的改變。如果兩個H暫存器的比較結(jié)果是一致的(它們通過先前的測試),具有最小誤差的H暫存器會被保
17、留來做為新的線上暫存器。在P0時段之后,一個新的H暫存器被計(jì)算出,為了確定將它放在線上使用是否安全,它所代表的必須是非零的回音路徑。換句話說,此一H暫存器的數(shù)值必須大于H誤差暫存器與誤差因子的乘積,此一回音路徑才是有意義的。在我們的范例中使用 4 誤差因子,結(jié)果能滿足上述的條件 0.54 > (0.02 X 4) ,因此這個新的H暫存器可以被在線上使用。進(jìn)行此一驗(yàn)證是很重要的,因?yàn)樵诮?jīng)過一段double talk時段所計(jì)算出來的H暫存器,通常會包含很大的誤差,此誤差會放大返回的回音,採用此H暫存器的結(jié)果比什么都不做來得更糟。在收斂時段P1之后,新的H暫存器會與線上H暫存器互相比較,以確定
18、它們之間的一致性。線上暫存器和離線暫存器之間的差異必須大于兩者的誤差,才可做出回音路徑發(fā)生改變的判斷。在此范例中採用 4 誤差,可以發(fā)現(xiàn)并不能滿足閾值條件(0.54 0.4) > (0.02 + 0.13) X 4),因此,這兩個H暫存器是一致。第二個測試是要檢查那一個H暫存器具有最小的H誤差暫存器,一般來說,這表示此一H暫存器是迴音路徑的最佳模型。很顯然地,線上H暫存器(來自P0時段)是較好的線路模型,因而被保留下來。最后,當(dāng)P2時段計(jì)算出的H暫存器出現(xiàn)后,將會進(jìn)行與上述相同的回音路徑改變測試。在這個例子中,兩者的差異大于誤差,因此可判斷出回音路徑發(fā)生改變 (0.54 0.22) &g
19、t; (0.02 + 0.05) X 4)。新的H暫存器會取代線上H暫存器,即使新計(jì)算出的H誤差暫存器高于線上的H誤差暫存器。 模型的延伸現(xiàn)在要將用來解釋簡化迴音消除器的上述數(shù)學(xué)工具延伸到更實(shí)務(wù)性的建置上。主要的差異是回音的尾部通常比單階作法更長,這意味著它們也具有一個延遲分量。上述的概念也會再被用于1024階(128ms有效尾部)的回音消除器之上。H誤差暫存器的延伸有其重要性。H誤差暫存器可以在單一頻段上找出誤差的特性,并將H誤差暫存器放置于這個頻率區(qū)域,而不是在單階作法上找出一個幅度誤差(amplitude error)的特性。為了清楚地說明,圖三中顯示了在這個時域中的一般迴音路
20、徑脈沖響應(yīng),這正是H暫存器中所包含的。我們可以採用快速傅利葉轉(zhuǎn)換(FFT)來將H暫存器從時域轉(zhuǎn)換為頻域。此一轉(zhuǎn)換為一個1024階的H暫存器產(chǎn)生了512個獨(dú)立的頻段,每個都具有幅度和相位的分量。 圖三時域中一般迴音路徑的脈沖響應(yīng)在圖四中并沒有顯示相位的分量,一個以500Hz為中心的單頻段從圖四中被抽取出,并重新繪制出包含相位分量的圖五。圖五中的向量長度與圖四中的幅度完全相符。圖五中起于原點(diǎn)的向量角度代表相位分量。這兩個具有相同幅度響應(yīng)但不同相位的H暫存器有不同的回音路徑。舉例來說,不同延遲的相同混合會產(chǎn)生完全相同的幅度響應(yīng),但不同的相位。圖四圖五現(xiàn)在H誤差暫存器可以與頻域中的H暫存器相關(guān)聯(lián)。在簡
21、化的回音消除器中,H誤差是一個沒有符號的幅度,可以代表H暫存器中的正誤差或負(fù)誤差。頻域中的H誤差將H暫存器的向量端點(diǎn)往各個方向移動,而不是受限于只能增大或減小H暫存器的值,請見圖五中的太灰色誤差圖。頻域中的H誤差可以同時改變頻段的幅度和相位。誤差圓的半徑是由H誤差暫存器值(即標(biāo)準(zhǔn)偏差)與誤差因子的乘積來加以定義,誤差因子愈大,這個圓也會愈大。表一中列出實(shí)際回音路徑脈沖響應(yīng)超出誤差圓的機(jī)率。1024階H暫存器的復(fù)雜問題已被分解為512個較小的、更容易處理的問題。只要所有的計(jì)算都采用包含相位的復(fù)雜數(shù)值,那每個頻域都可以使用和上述相同的簡化回音消除器來進(jìn)行處理。 加速多頻段的決策當(dāng)采用了獨(dú)
22、立頻段自適應(yīng)濾波器的選擇技巧后,有一些線路事件(line event)的發(fā)生會同時對所有512個頻段發(fā)生影響。不過,因?yàn)閷?shí)際的訊號有不同的頻譜分布,有些頻段在Rin中可能都不會得到有效的能量信號,有些頻段則可能從近端(Snear)得到大量的噪音。這些頻段對于一個獨(dú)立性決策的確定來說都沒有什么幫助,相反地,其他頻段可以用來建立線路狀況的清楚描述。在實(shí)務(wù)上,這樣做讓回音路徑改變的偵測能比其他可行方式更快速的進(jìn)行。堅(jiān)實(shí)的統(tǒng)計(jì)數(shù)學(xué)方法又一次讓512組觀察(每頻段一組)的組合能夠做出更準(zhǔn)確的一般性決策。舉例來說,如果多數(shù)的頻段顯示出現(xiàn)了回音路徑的改變,即使有些頻段并沒有偵測到回音路徑的改變,這時所有的頻段都可以視為此一改變已經(jīng)發(fā)生。顯然地,當(dāng)一個頻段中的分析具有更高的準(zhǔn)確性時,就只需要從其他頻段中得到較少的資訊來確定回音路徑的改變。舉例來
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025關(guān)于招商合作合同樣本
- 二零二五年度2025年冷鏈物流槽罐車運(yùn)輸合作協(xié)議2篇
- 互動式信息披露對企業(yè)稅收規(guī)避的影響研究
- 2025公司的勞動合同范本
- 敦煌壁畫在人物油畫創(chuàng)作“守望·敦煌”中的應(yīng)用研究
- 二零二五年度綠色環(huán)保木材采購及加工合同4篇
- 2025年度橙子產(chǎn)品包裝設(shè)計(jì)與創(chuàng)新合同4篇
- 二零二五版奶粉品牌市場調(diào)研與推廣服務(wù)合同樣本頁22篇
- 干砌石石坎施工方案
- 2025版高端淋浴房設(shè)計(jì)、生產(chǎn)及一站式安裝服務(wù)合同4篇
- 消防產(chǎn)品目錄(2025年修訂本)
- 地方性分異規(guī)律下的植被演替課件高三地理二輪專題復(fù)習(xí)
- 光伏項(xiàng)目風(fēng)險控制與安全方案
- 《行政職業(yè)能力測驗(yàn)》2023年公務(wù)員考試新疆維吾爾新疆生產(chǎn)建設(shè)兵團(tuán)可克達(dá)拉市預(yù)測試題含解析
- 醫(yī)院投訴案例分析及處理要點(diǎn)
- 練習(xí)20連加連減
- 五四制青島版數(shù)學(xué)五年級上冊期末測試題及答案(共3套)
- 商法題庫(含答案)
- 鋼結(jié)構(gòu)用高強(qiáng)度大六角頭螺栓連接副 編制說明
- 溝通與談判PPT完整全套教學(xué)課件
- 移動商務(wù)內(nèi)容運(yùn)營(吳洪貴)項(xiàng)目四 移動商務(wù)運(yùn)營內(nèi)容的傳播
評論
0/150
提交評論