語音信號數(shù)字處理:2-1數(shù)字語音處理基礎(chǔ)_第1頁
語音信號數(shù)字處理:2-1數(shù)字語音處理基礎(chǔ)_第2頁
語音信號數(shù)字處理:2-1數(shù)字語音處理基礎(chǔ)_第3頁
語音信號數(shù)字處理:2-1數(shù)字語音處理基礎(chǔ)_第4頁
語音信號數(shù)字處理:2-1數(shù)字語音處理基礎(chǔ)_第5頁
已閱讀5頁,還剩62頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、第2章數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理2.1發(fā)音的生理器官與過程2.4語音學(xué)基礎(chǔ)及漢語語音學(xué)2.3語音和語言2.5語音信號的特性分析第 2 章數(shù)字語音處理基礎(chǔ)2.1發(fā)音的生理器官與過程語音:由人體發(fā)音器官在大腦控制下的生理運動產(chǎn)生。發(fā)音器官:由肺和氣管、喉(包括聲帶)、聲道(咽腔、鼻腔和口腔)三部分組成。肺和氣管:整個語音系統(tǒng)的能源提供者喉:主要的聲音生成機構(gòu)聲道:則對生成的聲音進行調(diào)制肺:胸腔內(nèi)有彈性的海綿狀物質(zhì),可存儲空氣。肺的功能: 呼吸功能,進行氣體交換 提供能量,將壓縮空氣供給發(fā)音器官氣管:連接肺和喉,是肺與聲道聯(lián)系的通道第2章數(shù)字語音處理基礎(chǔ) 2.1發(fā)音的生理器官與過程第

2、2章數(shù)字語音處理基礎(chǔ) 2.1發(fā)音的生理器官與過程呼吸: 不說話時,通常是規(guī)則的、平穩(wěn)的、節(jié)律性的 說話時,為保持語言的連續(xù)性,有短暫停頓呼吸特點:吸氣短、呼氣長,受句子結(jié)構(gòu)控制,無固定規(guī)則氣流的形成: 空氣由肺部排入喉部, 經(jīng)過聲帶進入聲道, 由嘴(或鼻)輻射出聲波,形成了語音圖2.1: 喉的構(gòu)造。前聲帶聲門裂甲狀軟骨環(huán)形軟骨杓形軟骨 (a) 發(fā)音階 (b) 呼吸圖2.1喉的構(gòu)造喉:由軟骨和肌肉組成的復(fù)雜系統(tǒng),含聲帶(發(fā)音器官)聲帶: 是閥門,又是振動部件 聲帶緊繃在喉頭的前后壁上,有折疊 聲帶的長度約10 14 mm聲門:兩片聲帶之間的空間聲帶的前端由甲狀軟骨支撐,后端由杓狀軟骨支撐 杓狀軟

3、骨與環(huán)狀軟骨的上部相連軟骨由一組肌肉控制,可使開啟或閉合聲帶聲帶啟開時,是正常呼吸狀態(tài)聲帶閉合時,肺部密封成密室聲帶的生物學(xué)功能: 封閉氣管,保護肺道 在胸腔和腹腔建立一定的氣壓聲帶的聲學(xué)功能:為語音提供主要的激勵源第2章數(shù)字語音處理基礎(chǔ) 2.1發(fā)音的生理器官與過程空氣作用:使聲帶開啟/閉合,形成脈動氣流(聲門脈沖串) 基音周期(振動周期):聲帶每開啟/閉合一次的時間基音頻率(基頻):基音周期的倒數(shù)典型的脈動氣流:基頻隨人性別、年齡而不同基頻:通常為50 450 Hz 男性一般為50 250 Hz 女性一般為200 450 Hz老年男性偏低,小孩和青年女性偏高基頻高則音調(diào)高,基頻低則音調(diào)低基頻

4、與聲帶的大小、厚薄、松緊程度以及聲門上下之間的氣壓差等有關(guān)第2章數(shù)字語音處理基礎(chǔ) 2.1發(fā)音的生理器官與過程圖2.2聲帶開啟的面積與時間的關(guān)系曲線8642 時間/ms50% 35% 15% 125Hz0 2 4 6 8 10 12 14 16 面積/mm2聲道:從聲門至口唇的所有發(fā)音器官 包括咽腔、口腔和鼻腔成男聲道:長17 cm/面積20 cm2聲道可看成非均勻截面的聲管, 是時間函數(shù)??谇唬汉舷麓?、齒、齒齦、腭、 舌和小舌等部分。上腭:分硬腭和軟腭舌:分舌尖、舌面和舌根鼻腔:在口腔上面,靠軟腭和小舌將其與口腔隔開 小舌下垂時,鼻腔與口腔便耦合起來 小舌上抬時,口腔與鼻腔不相通發(fā)音時,口腔

5、和鼻腔都起共鳴作用。第2章數(shù)字語音處理基礎(chǔ) 2.1發(fā)音的生理器官與過程圖2.3聲道縱剖面圖鼻鼻腔齒齦上唇牙齒下唇下腭骨舌骨甲狀軟骨氣管鼻咽軟腭口腔小舌舌根會咽喉管聲帶環(huán)形軟骨食道第2章數(shù)字語音處理基礎(chǔ) 2.1發(fā)音的生理器官與過程口腔各器官協(xié)同動作,空氣流通過時形成不同阻礙,并產(chǎn)生振顫,發(fā)出不同聲音。咽腔:連接喉和食管與鼻腔和口腔的一段管子講話時,咽腔的形狀變化(如圖) ei u e aw咽腔與口腔使聲道的形狀變化增多,能發(fā)出較多的聲音。鼻腔:從咽腔一直沿伸到鼻孔,約10 cm長。發(fā)鼻化語音時軟腭下垂??谇皇锹暤雷钪匾牟糠郑浯笮『托螤羁梢酝ㄟ^調(diào)整舌、唇、齒和腭來改變。舌是最活躍的調(diào)整發(fā)音器官

6、在發(fā)音過程中,肺部與相連的 肌肉相當(dāng)于聲道系統(tǒng)的激勵源濁音:聲帶處于收緊狀態(tài)時, 氣流使聲帶振動產(chǎn)生的聲音清音:聲帶處于放松狀態(tài)時, 不伴有聲帶振動產(chǎn)生的音兩種清音:摩擦音,爆破音摩擦音:舌在聲道的某處形成狹窄部位(收緊點) 氣流經(jīng)過時產(chǎn)生湍流形成噪聲型的聲音爆破音:松懈聲帶,用舌和嘴唇關(guān)閉聲道,暫時阻止氣流。 氣壓升高,突然放開舌與嘴唇,氣流釋放產(chǎn)生短暫沖音 不同的聲道收緊點和聲道形狀,形成不同的摩擦音 不同的聲道閉緊點和聲道形狀,形成不同的爆破音第2章數(shù)字語音處理基礎(chǔ) 2.1發(fā)音的生理器官與過程肺肌力聲帶 鼻腔 鼻音 口腔 口音軟上腭和小舌咽腔聲門圖2.5語音產(chǎn)生的機理圖調(diào)音:發(fā)聲時,需要

7、調(diào)整聲道的形狀調(diào)音運動:聲道各部位的運動調(diào)音器官:調(diào)音涉及聲道的各部分器官, 包括舌、腭、唇和嘴等可以自由活動的部分。調(diào)音點:因調(diào)音產(chǎn)生的聲道固定部位的狹窄位置不同聲道形狀有不同聲道傳遞特性,產(chǎn)生不同音色語音共鳴用使能量隨頻率變化,產(chǎn)生各種差異語音聲道是對發(fā)音起著決定性作用的器官聲學(xué)觀點:聲道可拉直而不影響其聲學(xué)特性, 用聲管(模型)分析聲道的物理學(xué)機理第2章數(shù)字語音處理基礎(chǔ) 2.1發(fā)音的生理器官與過程-第 2 章數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理2.2.1聽覺系統(tǒng)1耳的結(jié)構(gòu)圖2.6:人的聽覺系統(tǒng)。組成:外耳、中耳和內(nèi)耳。外耳和中耳有導(dǎo)音的作用, 合稱為導(dǎo)音系;內(nèi)耳有感音作用,稱感音器

8、。 其感音作用起始于蝸神經(jīng)的終端(螺旋器),故內(nèi)耳的淋巴系統(tǒng)也屬于導(dǎo)音系。第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理圖2.6人的聽覺系統(tǒng)砧骨錘骨鼓膜外耳道耳翼聽神經(jīng)耳蝸內(nèi)耳中耳咽鼓管鐙骨 半規(guī)管外耳:由耳翼、外耳道和鼓膜組成。耳翼:有保護耳孔和定向作用。外耳道:是一條耳管,聲音沿其傳至鼓膜。 有許多共振頻率,封閉時最低共振頻率約為3060 Hz。 共振效應(yīng)會使聲音得到10 dB左右的放大。成年人的外耳道長約2.7 cm,直徑約0.7 cm。鼓膜:位于外耳道內(nèi)端的韌性錐形結(jié)構(gòu), 聲音的振動通過鼓膜傳到內(nèi)耳。 日常談話中,鼓膜位移約為108 cm。外耳的作用:有對聲源定位和聲放大。頭部的衍

9、射效應(yīng)也會增大鼓膜處的聲壓,系統(tǒng)總放大:20 dB左右。 第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理圖2.7:中耳的結(jié)構(gòu)。中耳:為充氣腔體,由鼓膜將其與外耳隔離, 通過圓形窗和前庭窗兩個小孔與內(nèi)耳相通。 通過咽鼓管與外界相連,以平衡氣壓,保護鼓膜。聽骨鏈:由錘骨、砧骨和鐙骨三塊聽小骨組成, 由韌帶懸掛在中耳的腔體內(nèi)(見圖2.7)。錘骨一端固定地附著在鼓膜上,鐙骨腳端覆蓋內(nèi)耳入口的前庭窗,砧骨將它們連接起來。聽骨鏈將振動傳到內(nèi)耳并放大, 起到杠桿的作用。放大30倍左右。第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理圖2.7中耳的結(jié)構(gòu)韌帶錘骨鼓膜外耳道半規(guī)管砧骨鐙骨前庭窗膜中耳咽鼓管聽

10、小骨在不同聲強范圍內(nèi)實現(xiàn)聲音的線性或非線性傳遞。中耳的作用:通過聽小骨進行聲阻抗變換,放大聲壓; 保護內(nèi)耳。 內(nèi)耳(迷路):在顱骨腔內(nèi),由半規(guī)管、前庭窗和耳蝸組成。半規(guī)管和前庭窗屬于本體感受器,與機體的平衡機能有關(guān)。半規(guī)管內(nèi)的感受器能感受旋轉(zhuǎn)變速運動的刺激,前庭窗內(nèi)的感受器能感受靜止的位置和直線變速運動。耳蝸:是聽覺接受器,把聲音經(jīng)機械變換產(chǎn)生神經(jīng)發(fā)放信號。耳蝸高約2 cm,寬約1.5 cm,呈螺旋狀盤旋2.5 2.75圈,拉直后約3 3.2 cm長。第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理耳蝸:由鼓階、中階和前庭階三個分隔的部分組成。圖2.8:耳蝸示意圖 。前庭階和鼓階在耳蝸的尖端

11、部位相通。中階內(nèi)充滿高粘度的膠狀內(nèi)淋巴液,前庭階和鼓階內(nèi)則充滿粘度為水兩倍的淋巴液。第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理前庭階中階鼓階前庭階中階鼓階骨螺旋板蝸孔覆膜中階基底膜耳蝸神經(jīng)骨質(zhì)層前庭階鼓階(a) 耳蝸(通過蝸軸的剖面) (b) 耳蝸橫截面圖2.8耳蝸示意圖中階的底膜稱為基底膜,基底膜之上是柯蒂氏器官,由耳蝸覆膜、外毛細(xì)胞(共3列,約20000個)以及內(nèi)毛細(xì)胞(共1列,約3500個)構(gòu)成。圖2.9:柯蒂氏器官示意圖??碌偈掀鞴伲菏且粋€傳感裝置。毛細(xì)胞上部的微絨毛感受耳蝸內(nèi)流體速度的變化,從而引起毛細(xì)胞膜兩邊電位的變化,可造成聽覺神經(jīng)的發(fā)放或抑制。內(nèi)耳的作用:感受聲音。第2

12、章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理圖2.9柯蒂氏器官示意圖外毛細(xì)胞內(nèi)毛細(xì)胞血管纖毛 覆膜基底膜 神經(jīng)纖維2聽覺的形成聽覺系統(tǒng)的兩個重要特性: 聽覺掩蔽效應(yīng); 耳蝸對于聲信號的時頻分析特性(見圖2.10 )。耳蝸的時頻分析特性:聲音使鐙骨運動,使耳蝸內(nèi)流體壓強變化,引起行波沿基底膜的傳播。聲頻不同,產(chǎn)生的行波不同,峰值 出現(xiàn)在基底膜的位置不同。 為對數(shù)型分布。頻率低,峰值出現(xiàn)在基底膜的頂附近;頻率高,峰值出現(xiàn)在基底膜的底附近。振動強度增加,基底膜運動幅度加大,耳蝸:有頻譜分析作用。 第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理圖2.10基底膜的頻率響應(yīng)分布圖1943頂部7291

13、051431872382973654455366437669081073126414851741203723802777323737704386510059271915816774144691247810759927479916883基部基底膜上的絨毛細(xì)胞的特性:振動使基底膜和耳蝸覆膜之間的毛細(xì)胞上的絨毛發(fā)生彎曲。 絨毛彎向一邊,引起毛細(xì)胞的去極化,加強傳入神經(jīng)的作用; 絨毛彎向另一邊,引起毛細(xì)胞的超極化,導(dǎo)致抑制效應(yīng)。基底膜上不同部位的毛細(xì)胞具有不同的電學(xué)和力學(xué)特性。 在基部,基底膜窄而勁度強,毛細(xì)胞及其絨毛短而有勁度; 在頂部,基底膜寬而柔和,毛細(xì)胞及其絨毛較長而柔和。這種差異是基底膜有頻

14、率選擇性和對數(shù)分布性的重要因素。 人的聽覺范圍:20 Hz 20 kHz,0 130 dB的聲音信號。聽覺范圍外的信號分量可忽略掉,以節(jié)省處理成本。人耳的感覺不是絕對的,隨著信號特性的不同而不同。第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理發(fā)音和聽音及理解聲音都牽涉到人的神經(jīng)活動。發(fā)音時,將觀念轉(zhuǎn)換成單詞和句子并發(fā)出指令,控制發(fā)音器官使其作適當(dāng)運動;聽音時,柯蒂氏器官發(fā)出脈沖,經(jīng)神經(jīng)系統(tǒng)處理,使大腦感知這些編碼的神經(jīng)信號,轉(zhuǎn)換成詞匯并得到理解。 神經(jīng)系統(tǒng)的基元是神經(jīng)元。神經(jīng)元是一種專職細(xì)胞;有細(xì)胞體和細(xì)胞核。細(xì)胞體上伸展出的樹形支,稱軸突或神經(jīng)纖維。最小的分支的末端稱為神經(jīng)末梢。由突觸實

15、現(xiàn)神經(jīng)元間的聯(lián)系。柯蒂氏器官上的纖毛細(xì)胞是一種感受細(xì)胞, 將接受的感覺信息轉(zhuǎn)成電化學(xué)脈沖(見圖2.11), 傳達給神經(jīng)元的突觸,并由神經(jīng)系統(tǒng)處理。第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理圖2.11神經(jīng)系統(tǒng)的電化學(xué)脈沖的波形圖U/mV100 0 t/ms 1ms神經(jīng)受激反應(yīng)的規(guī)律: (1) 刺激的強弱。超過門限值的刺激才產(chǎn)生脈沖。脈沖波形并不攜帶有刺激的強度信息。(2) 刺激的時間。存在“絕對不應(yīng)期”和“相對不應(yīng)期”。 絕對不應(yīng)期:約1 2 ms,此期間的刺激不產(chǎn)生反應(yīng)脈沖。 相對不應(yīng)期:約10 ms,此期間需要強刺激才產(chǎn)生反應(yīng)脈沖。(3)刺激的強度反應(yīng)在脈沖的個數(shù)上,但也有限制。 刺

16、激超過門限值并持續(xù)10 ms以上,神經(jīng)元將不斷產(chǎn)生脈沖。 最高產(chǎn)生1000個脈沖/s左右,再增大刺激強度不起作用;(4) 脈沖沿神經(jīng)纖維傳輸?shù)乃俣热Q于纖維的粗細(xì)。 直徑越大,傳輸速度越快。 也可利用朗飛節(jié),跳躍傳輸。此時速度可高達100 m/s左右。 朗飛節(jié)是大的神經(jīng)纖維上的脂肪節(jié)。第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理(5) 神經(jīng)元之間的傳輸機制主要是化學(xué)的。 是一個脈沖刺激另一個神經(jīng)元的電化學(xué)反應(yīng),并產(chǎn)生脈沖, 然后在該神經(jīng)元軸突內(nèi)按上述方法傳輸。(6) 神經(jīng)纖維有興奮和抑制兩種狀態(tài)。 在興奮狀態(tài)時,神經(jīng)元之間的傳送是無阻的; 抑制狀態(tài)時,受到抑制而不能傳送脈沖。 若某種神經(jīng)

17、元同時受到好幾個興奮狀態(tài)的和抑制狀態(tài)的聯(lián)合 刺激,則由其綜合效應(yīng)來決定該神經(jīng)元的反應(yīng)。 第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理語音的產(chǎn)生和理解:與神經(jīng)系統(tǒng)和大腦有關(guān),是高級活動。搞清大腦產(chǎn)生和理解語音的機理,對語音技術(shù)有極重要意義。特別是對語音合成與語音識別兩個分支。例,語音合成:目前,按規(guī)則合成只能從尋找各種語言的規(guī)則入手,盡可能得出較好的人工語言。如果發(fā)音時大腦智能活動的機理之迷揭開,就可以獲得高度自然的語音合成。例,語音識別:目前,只能從語音信號出發(fā),用“隱過程”(如隱馬爾可夫模型)來模擬神經(jīng)系統(tǒng)的聽覺過程,不是按人的聽覺過程建立處理模型。不能達到理想的識別和理解效果。這種方

18、法與大腦用的方法并不一致。第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理2.2.2語音的聽覺心理聽覺系統(tǒng)極靈敏。能感覺到接近空氣分子熱運動產(chǎn)生的聲壓。兩耳的傳遞速度不同。聲音從右耳傳至左大腦的速度比較快;聲音從左耳傳至右大腦的速度比較慢。兩耳辨音性能有所不同。 辨聽元音的能力大體一致; 辨聽輔音或音調(diào),右耳比左耳強一些。正常人聽覺范圍:20 Hz 16 kHz; 年輕人可以聽到20 kHz; 老年人可聽頻率降到10 kHz左右。 聽覺器官對音高、音強、聲波的動態(tài)頻譜有分析感知能力。人耳對聲音的強度和主觀感覺是從響度和音調(diào)體現(xiàn)出來的 第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理 1.

19、人耳的聽閾和響度在物理上,客觀測量聲音強弱的單位: dyn/cm2(聲壓),或W/cm2(聲強)。在心理上,主觀測量聲音強弱的單位: 方(phon)(響度級),或宋(sone)(響度)??陀^和主觀兩種聲音強弱的計量單位是完全不同的兩種概念,它們之間又有一定關(guān)系。國際協(xié)議規(guī)定, 0 dB聲強級的1 kHz純音的響度級定義為 0 方, n dB聲強級的1 kHz純音的響度級定義為 n 方。語音是復(fù)合音,含豐富諧波成分。人耳對不同純音,有不同的聽辨靈敏度。 第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理聽閾:當(dāng)聲音的強度小到人耳剛剛可聽見時的聲強。1 kHz純音,聽閾為1016W/cm2聲強(0

20、 dB聲強度級); 0 dB聲強級是非常小的單位,僅使鼓膜移動約109 cm。痛閾:當(dāng)聲音的強度大到人耳感到疼痛時的聲強。1 kHz純音,痛閾約為104 W/cm2聲強(120 dB聲強度級); 120 dB使鼓膜的位移約為103cm。 “聽閾頻率”和 “痛閾頻率”曲線 表征其變化特性(見圖2.12)兩曲線間為聽覺范圍。聽覺范圍相當(dāng)寬,達1012量級以上。例:1 kHz,10 dB聲強級的聲音, 響度級為10方;與200 Hz,30dB 聲強級的聲音,感覺響度相同。第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理圖2.12等響度曲線與聲強/聲強級的關(guān)系聲強/Wcm2 10-410-610-8

21、10-1010-1210-1410-16聲強級/dB120100 80 60 40 20 020 50 100 200 500 1k 2k 5k 10k 頻率/Hz120方1101009080706050403020100方響度級不是響度。響度級是心理學(xué)家用來表示“漸強”的標(biāo)度。單位是方)例:響度級為50方比40方的聲音響一些, 響度級為40方比20方的聲音響一些,響多少倍未知。響度是數(shù)量的表示(單位是宋)。例:2 宋的響度使人感到比 1 宋的響度響了 2 倍。規(guī)定:1 宋響度為1 kHz純音在其 響度級為40 dB(聲強1012 W/cm2) 時的響度。圖2.13:“響度響度級”曲線。聽覺的

22、響度與響度級不是線性的。第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理圖2.13“響度-響度級”曲線圖120 10080604020 00.01 0.1 1 10 100響度宋響度級方 2. 音調(diào)音調(diào):是聽覺分辨聲音高低時用于描述這種感覺的一種特性??陀^上,用頻率表示聲音的音調(diào),其單位是Hz,主觀上,感覺音調(diào)的單位采用美(mel)標(biāo)度。這是兩個概念上的不同、既有聯(lián)系的計量單位 感音范圍:20Hz20 kHz,約 1000 倍頻程,9 10 個八度音。規(guī)定:音調(diào)的測量以40 dB聲強為基準(zhǔn),由主觀感覺定標(biāo), 且 1 kHz 純音的音調(diào)定為1 000美。例:讓聽者聽兩個40 dB聲強級的純音,

23、一純音頻率固定, 調(diào)節(jié)另一個純音的頻率使其感覺音調(diào)高 1 倍, 標(biāo)定這兩個同聲強聲音的音調(diào)差為 1 倍。實驗表明:音調(diào)與頻率是非線性的,與聲強及波形有關(guān)。例:1 kHz、1000美純音的倍音調(diào)是2000美(頻率4 kHz); 其半音調(diào)為500美(頻率400 Hz)。 第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理圖2.14:“音調(diào)-頻率”曲線。音調(diào)和頻率 f 的關(guān)系可以近似地表示為 人耳可分辨音調(diào)約1400個, 可分辨響度約280個。若聲強和頻率皆變化,人可分辨純音達30 40萬個。第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理圖2.14“音調(diào)-頻率”曲線300025002000150

24、01000 500 020 50 100 200 500 1k 2k 5k 10k 頻率/Hz主觀感覺的音調(diào)美2.2.3掩蔽效應(yīng)聽覺特性涉及到心理聲學(xué)和生理聲學(xué)方面的問題。聽覺特性的研究多在心理聲學(xué)和語言聲學(xué)領(lǐng)域。人的主觀感覺(聽覺)和客觀實際(聲波)不完全一致。聽覺機構(gòu)是極靈敏的聲音接收器,無物理儀器與之媲美。具有選擇性,起到分析器的作用。具有判斷響度、音調(diào)和音色的本領(lǐng)?,F(xiàn)今科學(xué)未能完全揭示聽覺系統(tǒng)的復(fù)雜結(jié)構(gòu)和信息處理過程。掩蔽現(xiàn)象:較強聲音附近的相對較弱聲音將不被人耳覺察, 即被強音所掩蔽。較強的音稱做掩蔽者,較弱的音稱做被掩蔽者。掩蔽效應(yīng):分同時掩蔽、異時掩蔽。第2章數(shù)字語音處理基礎(chǔ) 2

25、.2聽覺的生理器官與心理 1同時掩蔽和異時掩蔽同時掩蔽:指掩蔽現(xiàn)象發(fā)生在掩蔽者和被掩蔽者同時存在時, 也稱為頻域掩蔽。人耳對聲音響應(yīng)隨頻率變化,最敏感的頻率段是2 4 kHz。在這個頻率段以外,人耳的聽覺靈敏度逐漸降低。聽閾:人耳剛好可聽到的最小聲強級,是聲音頻率的函數(shù)。圖2.15中的虛線是人耳在安靜時的聽閾曲線。在掩蔽者頻率的鄰域 內(nèi),聽力閾值被提高。掩蔽閾值:不可聞的 被掩蔽者的最大聲強級。圖2.15:掩蔽閾值曲線。掩蔽閾值是時間、 頻率和聲強級的函數(shù)。 第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理圖2.151 kHz頻率且60 dB聲強級的音調(diào)信號掩蔽閾值曲線 80 60 40 2

26、0 020 50 100 200 500 1k 2k 5k 10k 頻率/Hz聲強級/dB掩蔽聲被掩蔽聲掩蔽閾值安靜聽閾值 低于掩蔽者的掩蔽閾值時,目標(biāo)信號被掩蔽。 利用掩蔽特性,可降低編碼速率; 對量化噪聲譜整形,使量化噪聲低于掩蔽閾值曲線, 既降低量化碼率,又提高音頻編碼的主觀質(zhì)量。異時掩蔽:指掩蔽效應(yīng)發(fā)生在掩蔽者和被掩蔽者不同時存在 時,也稱為時域掩蔽。分前掩蔽、后掩蔽兩種。 前掩蔽:掩蔽效應(yīng)發(fā)生在掩蔽者開始之前的某段時間; 后掩蔽:掩蔽效應(yīng)發(fā)生在掩蔽者結(jié)束之后的某段時間。圖2.16:同時掩蔽和異時掩蔽現(xiàn)象, 同時掩蔽在掩蔽者持續(xù)的時間內(nèi) 有效,是一種較強的效應(yīng); 異時掩蔽隨時間的推移很

27、快衰減。 后掩蔽100 ms,前掩蔽20 ms。利用前掩蔽,對抑制因時間分辨率 不夠而造成的預(yù)回聲起著重要作用。第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理圖2.163種掩蔽現(xiàn)象的強度及持續(xù)時間掩蔽者100 50 0 50 100 150 0 50 100 150 200時間ms前掩蔽 同時掩蔽 后掩蔽604020 0聲強級dB 2各種不同的掩蔽效果掩蔽者有純音調(diào)、寬帶噪聲和窄帶噪聲共3種類型。不同的掩蔽者和被掩蔽者的組合有不同的掩蔽結(jié)果。 (1) 純音調(diào)間的掩蔽。純音調(diào)間的掩蔽:指掩蔽者和被掩蔽者都是純音調(diào)聲音, (這種掩蔽效應(yīng)比較簡單)。圖2.17:純音調(diào)對純音調(diào)產(chǎn)生的掩蔽曲線。掩蔽

28、閾值曲線的低頻段陡峭,高頻段比較平坦。第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理圖2.171kHz的不同聲強級的純音調(diào)對純音調(diào)的掩蔽閾值曲線 80 60 40 20 0測試音聲強級/dB20 50 100 200 500 1k 2k 5k 10k 測試音頻率/HzLM=90dB7020安靜聽閾 (2) 寬帶噪聲對純音調(diào)的掩蔽。寬帶噪聲對純音調(diào)的掩蔽:指掩蔽者是寬帶噪聲, 被掩蔽者是純音調(diào)聲音。白噪聲功率譜平坦,所產(chǎn)生的掩蔽閾值只在低頻段保持水平。在低頻段,掩蔽閾值一般高于噪聲功率密度 17 dB。當(dāng)頻率大于約 500 Hz 時,掩蔽閾值隨著頻率的增大而提高,每 10 倍頻程約提高 10

29、 dB。圖2.18:寬帶噪聲對純音調(diào)的掩蔽曲線。 第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理圖2.18寬帶噪聲對純音調(diào)的掩蔽閾值曲線80604020 020 50 100 200 500 1k 2k 5k 10k測試音頻率/Hz測試音聲強級/dBLMN=50dB403020100-10安靜聽閾圖2.19中心頻率為1 kHz且聲強級不同的窄帶噪聲對純音調(diào)的掩蔽閾值曲線10080 60 40 20 020 50 100 200 500 1k 2k 5k 10k測試音頻率/Hz測試音聲強級/dBLCB=100dB80604020安靜聽閾 (3) 窄帶噪聲對純音調(diào)的掩蔽。窄帶噪聲對純音調(diào)的掩蔽

30、:指掩蔽者是窄帶噪聲, 被掩蔽者是純音調(diào)信號。該掩蔽效應(yīng)較復(fù)雜,掩蔽閾值隨聲強級、中心頻率變化。圖2.19: 1 kHz中心頻率,聲強級不同的窄帶噪聲 對純音調(diào)的掩蔽閾值曲線。 曲線的峰值出現(xiàn)在掩蔽者的中心頻率處, 聲強級80 dB,掩蔽閾值在高頻段出現(xiàn)嚴(yán)重的非線性特性,有谷點出現(xiàn)。第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理中心頻率不同的窄帶噪聲產(chǎn)生的掩蔽閾值曲線形狀是不同的。圖2.20:聲強級相同、中心頻率不同的窄帶噪聲 對純音調(diào)的掩蔽閾值曲線??梢姡诒伍撝登€是不等寬的,在低頻段曲線比較窄; 隨著頻率的增高曲線逐漸變寬。 第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理圖2.2

31、0聲強級相同但中心頻率不同的窄帶噪聲對純音調(diào)的掩蔽閾值曲線測試音聲強級dB 80 60 40 20 00 2 4 6 8 10 12 14 16測試音頻率kHz250Hz1kHz 4kHz 8kHz安靜聽閾 3. 臨界帶寬引入臨界帶寬,可方便描述窄帶噪聲對純音調(diào)的掩蔽效應(yīng)。臨界帶寬的定義:一個純音調(diào)可以被以它為中心頻率,且具有一定帶寬的連續(xù)噪聲所掩蔽。 若在這一頻帶內(nèi)噪聲功率等于該純音調(diào)的功率,且該純音調(diào)處于剛好能被聽到的臨界狀態(tài),稱這一帶寬為。臨界帶寬有許多近似表示。 一般在低于500 Hz的頻帶內(nèi),臨界帶寬約為100 Hz; 高于500 Hz的頻帶上,臨界帶寬約為中心頻率的20%; 最高可

32、達到4 kHz。由定義知,臨界帶寬的位置可以是音頻范圍內(nèi)的任意位置。第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理表2.1臨界帶寬表編號(Bark)中心頻率/Hz臨界帶寬/Hz相對帶寬/dB頻率范圍/Hz編號(Bark)中心頻率/Hz臨界帶寬/Hz相對帶寬/dB頻率范圍/Hz150801920 100131850280251720 2000215010020100 200142150320252000 2320325010020200 300152500380262320 2700435010020300 40016290045027270

33、0 3150545011020400 510173400550273150 3700657012021510 630184000700283700 4400770014021630 770194800900294400 5300884015022770 9202058001100305300 64009100016022920 10802170001300326400 7700101170190231080 12702285001800327700 9500111370210231270 148023105002500349500 12000121600240241480 1720241350

34、035003512000 15500表2.1:24個臨界帶寬的編號、中心頻率及其帶寬的數(shù)據(jù)。工程上,在20 Hz 16 kHz內(nèi)劃分為24個頻率群表示,或者說劃分為 24 Bark 域,這是為了紀(jì)念Bark hauseu而命名的。第2章數(shù)字語音處理基礎(chǔ) 2.2聽覺的生理器官與心理以臨界帶寬描述掩蔽效應(yīng)可從聽覺生理上找到科學(xué)依據(jù)。 人耳的基底膜具有與頻譜分析儀相似的作用。 頻率群的劃分相應(yīng)地將基底膜分成許多小的部分,每一部分對應(yīng)一個頻率群。 掩蔽效應(yīng)在這些頻率群內(nèi)發(fā)生: 同一頻率群的聲音作用于基底膜的相同部分,對大腦的刺激似乎是疊加在一起來評價的。 若同時發(fā)聲,可互相掩蔽。第2章數(shù)字語音處理基礎(chǔ)

35、 2.2聽覺的生理器官與心理Bark 域與基底膜的長度呈線性關(guān)系,與聲頻呈對數(shù)關(guān)系。Bark 頻帶 l 與頻率 f 的關(guān)系為:圖2.21: Bark域上聲強級相同中心頻率不同窄帶信號 對純音調(diào)的掩蔽閾值曲線。 可見,掩蔽閾值曲線在Bark尺度上是等寬的。圖2.21聲強級相同但中心頻率不同的窄帶噪聲對純音調(diào)的掩蔽閾值曲線250Hz 500Hz 1kHz 2kHz 4kHz 8kHz 80 60 40 20 00 5 10 15 20 25臨界頻帶Bark測試音聲強級dB安靜聽閾第 2 章數(shù)字語音處理基礎(chǔ)2.3語音和語言語言是從言語歷史中概括總結(jié)出來的規(guī)律性的符號系統(tǒng)語言是進行思維、交際的形式語音

36、是聲音、語言和意義的結(jié)合體聲音是語音的物質(zhì)形式;語音是語言的物質(zhì)外殼、信息載體但是,聲音和意義間無必然聯(lián)系,其意義是約定俗成的語音由一串音組成語言的聲音,音間過渡代表信息的符號,音(符號)的排列由語音規(guī)則約束。語音的研究:包括語言學(xué)、語音學(xué)語言學(xué):語音中各個音的排列規(guī)則及其含意的研究語音學(xué):語音中各個音的物理特征和分類的研究第2章數(shù)字語音處理基礎(chǔ) 2.3語音和語言說話過程可分五個階段:想說階段、說出階段、傳送階段、接收階段、理解階段1、想說階段:(與大腦中樞的活動有關(guān)) 大腦決策產(chǎn)生說話動機 講話神經(jīng)中樞選單詞、短語,按規(guī)則組合表達內(nèi)容和情感2、說出階段:(與發(fā)音器官的活動有關(guān)) 大腦中樞決策

37、,向發(fā)音器官發(fā)指令,使舌、唇、顎、聲帶、肺等協(xié)調(diào)動作,發(fā)出聲音 大腦也發(fā)指令給其它器官,產(chǎn)生各種動作來配合 根據(jù)聽覺系統(tǒng)接收的反饋語音信息,來幫助修改語音。3、傳送階段:(傳送聲波信息的物理過程) 聲波以空氣為媒介傳送到聽者的耳中第2章數(shù)字語音處理基礎(chǔ) 2.3語音和語言4、接收階段:(與聽覺系統(tǒng)活動有關(guān)) 外耳收集聲波信息,經(jīng)中耳放大,傳到內(nèi)耳 經(jīng)內(nèi)耳基底膜振動,激發(fā)柯蒂氏器官內(nèi)的神經(jīng)元產(chǎn)生脈沖 將信息以脈沖的形式傳送給大腦5、理解階段:(至今尚未完全了解,機理不很清楚) 聽覺神經(jīng)中樞收到脈沖信息,辨認(rèn)話者及所說信息說話過程相當(dāng)復(fù)雜,有心理、生理、物理及個人和社會因素個人因素:話者口音、用詞造

38、句特色 聽者的聽力、理解力。社會因素:話者、聽者的社會基礎(chǔ)、環(huán)境等語言要素:分語言的語素、詞、短語和句子等不同層次 及詞法、句法、文法等語法和語義內(nèi)容等。句法的最小單位是單詞,詞法的最小單位是音節(jié)。不同語言有不同語言規(guī)則第2章數(shù)字語音處理基礎(chǔ) 2.3語音和語言語音學(xué)研究語音產(chǎn)生、語音感知等,音的特征和分類等問題語音學(xué)與語音信號處理學(xué)科有緊密聯(lián)系。說話交流過程分為“發(fā)音傳遞感知”三個階段現(xiàn)代語音學(xué)分支:發(fā)音語音學(xué)、聲學(xué)語音學(xué)、聽覺語音學(xué)發(fā)音語音學(xué):從生理的角度研究語音(已相當(dāng)成熟) 直接觀察發(fā)音器官的動作或借助儀器來研究聲學(xué)語音學(xué):研究語音傳遞的聲學(xué)特性 用聲學(xué)和非平穩(wěn)信號分析理論解釋各種語音現(xiàn)

39、象 語音的聲學(xué)物理性質(zhì)及與發(fā)音器官之間的關(guān)系。 產(chǎn)生聲音模擬、語音合成和語音識別等研究方向。聽覺語音學(xué)和心理語言學(xué):(較新學(xué)科,處于探索階段) 探索大腦如何進行語音的發(fā)出和接收, 語言信息以什么形式在大腦的什么部位存儲等第2章數(shù)字語音處理基礎(chǔ) 2.3語音和語言第 2 章數(shù)字語音處理基礎(chǔ)2.4語音學(xué)基礎(chǔ)及漢語語音學(xué) 2.4.1聲波的物理描述聲波從聲源向四面八方傳播聲波的頻率:單位時間內(nèi)聲波的周期數(shù)聲波的波長:聲波中兩個波峰之間相隔的空間距離 波長=傳播速度/頻率頻率高波長短;頻率低波長長聲波有頻度和振幅兩個特點。聲頻與音調(diào)有關(guān),振幅與響度有關(guān)。聲頻高,聲音就高(音調(diào)高);聲頻低,聲音就低(音調(diào)低

40、)第2章數(shù)字語音處理基礎(chǔ) 2.4語音學(xué)基礎(chǔ)及漢語語音學(xué)聲音分:復(fù)合音、純音純音:僅有基音,沒有倍音倍音:頻率是基音頻率的整倍數(shù)的聲音成分復(fù)合音:除純音外的聲音 一般的聲音是包含了復(fù)合聲波的聲音人類發(fā)出的元音是復(fù)合音大部分聲音并非只有一個基頻通常,基頻的能量最高,力度最強, 其它倍音的能量逐漸減低,力度逐漸減弱不同聲音的區(qū)別是音色不同(不同樂器的音色不同)聲音的基音與倍音共同組成這個聲音的和聲第2章數(shù)字語音處理基礎(chǔ) 2.4語音學(xué)基礎(chǔ)及漢語語音學(xué)聲音的物理屬性:音色、音調(diào)、音強、音長音色:也稱作音質(zhì),一種聲音區(qū)別于其它聲音的基本特征 發(fā)音體(音帶)振動與不振動,發(fā)音的音色不同 用相同發(fā)音器官,送氣

41、與不送氣方式,發(fā)音的音色不同 聲道的形狀和尺寸不同,發(fā)的音的音色不同音調(diào):聲音的高低,漢語語音學(xué)中稱為音高,取決于聲頻 聲頻與發(fā)音體的長短、厚薄、松緊程度有關(guān) 語音的聲調(diào)由語音的基頻決定音強:聲音的強弱,由聲波的振幅(聲功率)決定音長:聲音的長短,取決于發(fā)音的持續(xù)時間的長短第2章數(shù)字語音處理基礎(chǔ) 2.4語音學(xué)基礎(chǔ)及漢語語音學(xué)2.4.2語音的聲學(xué)特性音節(jié):一次發(fā)出,有一個響亮中心,被明顯感覺的語音片段 音節(jié)由一個音素或幾個音素構(gòu)成音素:是語音的最小單位,分元音、輔音,兩種音素元音:聲帶振動的氣流經(jīng)聲道輻射,不受阻礙發(fā)出的樂音輔音:呼出的氣流,由聲道的部分封閉或受阻,產(chǎn)生的聲音 清輔音(清音):聲

42、帶不振動發(fā)出的輔音,送氣強 濁輔音(濁音):聲帶振動發(fā)出的輔音,不送氣或送氣弱 濁音是樂音和清音的混合音 形成阻礙的發(fā)音部位和發(fā)音方法不同,發(fā)出的輔音不同半元音:發(fā)音時聲道基本暢通,某處比較狹窄,引起輕微的摩擦發(fā)出的聲音元音:音節(jié)的主體,時長和能量在音節(jié)中占主要部分輔音:在音節(jié)的前端或后端或前后兩端,時長和能量很小第2章數(shù)字語音處理基礎(chǔ) 2.4語音學(xué)基礎(chǔ)及漢語語音學(xué)元音音色:主要由舌的形狀、舌位、口形等決定舌位高度、前后位置與音素關(guān)系見圖2.22 舌位高度:分高、中、低 舌位前后:分前、中、后 有9種基本組合,加上口唇開放程度、咽寬度,可發(fā)十多個不同的單元音 第2章數(shù)字語音處理基礎(chǔ) 2.4語音

43、學(xué)基礎(chǔ)及漢語語音學(xué)聲道的模擬:非均勻截面的聲管,發(fā)音時起共鳴器作用共振峰:元音激勵聲道時,引起共振,產(chǎn)生的一組共振頻率 稱為共振峰頻率(共振峰) 共振峰是區(qū)別元音的重要參數(shù),包括其位置和頻帶寬度精確描述語音,應(yīng)該用盡可能多的共振峰工程中,常用前三個共振峰參數(shù) 第一共振峰F1、第二共振峰F2、第三共振峰F3元音的共振峰特性與發(fā)音機制有關(guān)F1與舌位高低有關(guān),舌位高F1低;舌位低F1高舌位越低,嘴張得越大(開口度大);舌位越高開口度越小F2與舌位前后密切相關(guān),舌位靠前F2高,舌位靠后F2低 前元音i的舌位靠前,F(xiàn)2達2000 Hz 后元音u的舌位靠后,F(xiàn)2只有500 Hz第2章數(shù)字語音處理基礎(chǔ) 2.

44、4語音學(xué)基礎(chǔ)及漢語語音學(xué)F1和F2和嘴唇的圓展程度也有關(guān)系, 如圓唇可使F2降低等。F3與舌位有關(guān),并不密切, 但受舌尖活動的影響,舌尖抬高卷起時,F(xiàn)3就明顯下降圖2.23:舌位前后、唇形圓展和開口度大小對F1和F2 的影響情況。 第2章數(shù)字語音處理基礎(chǔ) 2.4語音學(xué)基礎(chǔ)及漢語語音學(xué) F2 F1后 低圓 低?。ǜ撸┣?高展高大(低)舌位(開口度)舌位前后唇形圓度圖2.23舌位、唇形和開口度對F1和F2的影響成年女子和兒童的基頻高于成年男子。區(qū)分語音是男聲還女聲,是成人聲音還是兒童聲音,更重要的因素是共振峰頻率的高低。表2.2:10個英語單元音前3個共振峰頻率的平均值。成年女性和男性的共振峰頻率

45、有明顯的差別(約高25%)第2章數(shù)字語音處理基礎(chǔ) 2.4語音學(xué)基礎(chǔ)及漢語語音學(xué)表2.210個英語單元音前3個共振峰頻率的平均值/Hz元音ii:eauu:F1男270390530660730570440300640490女310430610860850590470370760500F2男22901990184017201090840102087011901350女27902480233020501220920116095014001640F3男3010255024802410244024102240224023901690女331030702990281028102710261026702780

46、1960復(fù)合元音:由兩個或三個元音組合在一起的元音。 復(fù)合元音分:真性復(fù)合元音和假性復(fù)合元音。 真性復(fù)合元音的各單元音有一很長的穩(wěn)定段,過渡段很短; 假性復(fù)合元音的單元音很少有穩(wěn)定段,共振峰圖形是 一個滑動和平滑過渡的過程。 三復(fù)合元音很少有真性的 元音鼻化:是鼻與口耦合作用產(chǎn)生的, 是該元音與鼻輔音鄰近而發(fā)生的現(xiàn)象。元音鼻化作用將在該元音共振峰特性中引起兩對極零點, 一對極點在 290 Hz 左右,零點在 295 Hz 左右; 一對極點在 2240 Hz 左右,零點在 2340 Hz 左右。 每對極零點分離得越遠(yuǎn)鼻音越重。第2章數(shù)字語音處理基礎(chǔ) 2.4語音學(xué)基礎(chǔ)及漢語語音學(xué)產(chǎn)生元音有三個條件

47、: 聲道受到聲帶振動的激勵引起共振; 在語音流的持續(xù)期,聲道不發(fā)生極端的狹窄,并維持較穩(wěn)定的形狀; 和鼻腔不發(fā)生耦合,聲音只從口腔輻射。這三個條件中,只要缺少其中之一,該語音就是輔音。輔音:是把呼氣流在聲道的某一位置用適當(dāng)?shù)姆椒ㄟM行阻礙而產(chǎn)生的。 輔音沒有明確的共振峰結(jié)構(gòu)。 輔音發(fā)音時,阻礙的位置叫調(diào)音點, 阻礙的方法叫調(diào)音方式。 根據(jù)調(diào)音方式等不同可以把輔音分成幾類。 第2章數(shù)字語音處理基礎(chǔ) 2.4語音學(xué)基礎(chǔ)及漢語語音學(xué)一般分為 7 類輔音:塞音、摩擦音、塞擦音、鼻音、 邊音、顫音、通音。(1) 塞音(爆破音、破裂音):把口腔和鼻腔完全封閉, 然后急快解除口腔封閉。 例:普通話拼音的p, t

48、, k, b, d, g等。(2) 摩擦音:持阻階段阻礙處并不完全閉塞,但將聲道變窄到氣 流產(chǎn)生(湍流)摩擦噪音的程度。 例:普通話拼音的f, s, sh, x, h等。摩擦音可以任意延長。(3) 塞擦音:成阻階段阻礙處閉塞,無氣流通過;除阻階段阻礙 略微放松,讓氣流擠出去產(chǎn)生摩擦,形成先塞后擦的音。 例:普通話拼音的z, zh等。(4) 鼻音:封閉口腔,但同時軟腭下降,開放鼻腔通路,讓氣流 從鼻腔出去而形成的音。 例:普通話拼音的 m, n 等。鼻音可以任意延長。第2章數(shù)字語音處理基礎(chǔ) 2.4語音學(xué)基礎(chǔ)及漢語語音學(xué)(5) 邊音:舌尖形成阻礙不讓氣流通過,但舌尖兩邊有空隙能讓氣流通過,即封閉口

49、腔中央部分開放兩側(cè)通路而形成的音。 例:普通話拼音的 l 。(6) 顫音:氣流通過聲道時使發(fā)音器官調(diào)音點受氣流沖擊 而產(chǎn)生顫動,而發(fā)出顫音。 例:拉薩語 ra(羊)中的 r。(7) 通音(半元音或半輔音):是無擦通音。 使聲道稍微變窄,但是窄到不至于發(fā)出摩擦噪音的程度,然后逐漸向后續(xù)元音的過渡調(diào)音而產(chǎn)生的; 或從先行元音逐漸變窄,但窄到氣流通過時只產(chǎn)生極輕微的摩擦,甚至可能沒有摩擦,這樣的調(diào)音方式產(chǎn)生。通音一般都是濁音,性質(zhì)接近元音。 例:普通話拼音的 w, y。第2章數(shù)字語音處理基礎(chǔ) 2.4語音學(xué)基礎(chǔ)及漢語語音學(xué)輔音分:濁輔音(聲帶振動)和清輔音(聲帶無振動)。輔音分:送氣輔音和不送氣輔音。

50、 根據(jù)輔音除阻后是否緊跟著送出一股氣流分類。 例:普通話拼音的p, t, k是送氣輔音,b, d, g是不送氣輔音。各音節(jié)元音段的基音頻率都隨時間變化。聲調(diào):由基音頻率的變化產(chǎn)生,其變化軌跡稱為聲調(diào)軌跡。聲調(diào)反映語音的韻律,在漢語中聲調(diào)有辨意作用 重音:是在語流中,發(fā)音較重的音節(jié)。重音一般分為詞重音和語句重音。詞重音:以詞為考查對象,音位學(xué)把詞重音劃分為正常重音、 對比重音和弱重音。語句重音:是指由于句子語法結(jié)構(gòu)、邏輯語義或心理情感表達 的需要而產(chǎn)生的句子中的重讀音。語句重音一般分為語音重音、邏輯重音、心理重音。第2章數(shù)字語音處理基礎(chǔ) 2.4語音學(xué)基礎(chǔ)及漢語語音學(xué)把握詞重音特征對了解語音中蘊涵

51、的情感和情緒信息極重要。詞重音的情感效果往往同詞義本身有較強的聯(lián)系。重音的聲學(xué)特征:主要表現(xiàn)在時長、音高與音強及三者結(jié)合。不同語言的重音和語調(diào)特點不一樣,是一種附加的信息。漢語重音主要表現(xiàn)在時長增加,其次是調(diào)域擴大和音高提升。西方語言如英語,重音是辨意的一個重要特點。重音、語調(diào)和聲調(diào)也是構(gòu)成語音學(xué)的一部分。 表示一句話中的重要的單詞; 表示疑問句; 表示說話人的感情。 超音段特征:語流中由音高、音長和強度等方面的變化所表現(xiàn) 出來的特征。為表現(xiàn)說話人感情的重要特征。超語言學(xué)特點:低語表示秘密、高聲說話表示憤怒等。同音異義字(詞):是指相同發(fā)音,有兩種或多種意思。第2章數(shù)字語音處理基礎(chǔ) 2.4語音

52、學(xué)基礎(chǔ)及漢語語音學(xué)2.4.3漢語語音基本特性漢語語音:音系簡單,音素少,音節(jié)少。 音節(jié)一般由聲母、韻母和聲調(diào)三部分組成。 普通話有 6000 多個常用字,每字一個音節(jié); 普通話有 1332 個有調(diào)音節(jié),其中可以單念的有 1268 個。 普通話有陰平、陽平、上聲、去聲、輕聲五個聲調(diào)。 不考慮聲調(diào),無調(diào)音節(jié)共有 407 個。 漢字的“聲-韻”結(jié)構(gòu):元音、輔音+元音、元音+鼻輔音、 輔音+元音+鼻輔音。漢語標(biāo)準(zhǔn)語音是北京語音,又稱為普通話。漢語中清輔音多,且多為弱清音。開口呼的音節(jié)占全部音節(jié)的一半以上 (如用 a 這個音素為主要元音的音節(jié)就占40%)。漢語語音聽感上有清亮、高揚和舒服、柔和的感覺。第

53、2章數(shù)字語音處理基礎(chǔ) 2.4語音學(xué)基礎(chǔ)及漢語語音學(xué)漢語拼音方案: 10個元音和22個輔音組成; 21個聲母(見表2.3)和36個韻母(見表2.4)。聲母+韻母組成400個左右的音節(jié),與四聲組成1600個左右有調(diào)音節(jié),有的音節(jié)沒有對應(yīng)的漢字。 第2章數(shù)字語音處理基礎(chǔ) 2.4語音學(xué)基礎(chǔ)及漢語語音學(xué)表2.3漢語聲母表發(fā)音方法發(fā)音部位雙唇音唇齒音舌尖前音舌尖中音舌尖后音舌面前音舌根音塞音清音不送氣b, 玻d, 得g, 哥送氣p, 坡t, 特k, 科塞擦音清音不送氣z, 資zh, 知j, 基送氣c, 雌ch, 雖q, 欺擦音清音f, 佛s, 思sh, 詩x, 希h, 喝濁音r, 日鼻音濁音m, 摸n, 訥邊音濁音l, 勒表2.4漢語韻母表單韻母(6個)a啊, o喔, e鵝, i衣, u烏, 迂復(fù)韻母(14個)ai 哀, ei 誒, ao 熬, ou 歐, ia 呀, ie 耶, ua 蛙, uo 窩, e 約, er 而, iao 腰, iou 憂, uai 歪, uei 威鼻韻母(16個)a

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論