版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
語(yǔ)音信號(hào)處理基礎(chǔ)知識(shí)演示文稿第一頁(yè),共五十九頁(yè)。優(yōu)選語(yǔ)音信號(hào)處理基礎(chǔ)知識(shí)第二頁(yè),共五十九頁(yè)。語(yǔ)音中包含的信息語(yǔ)言(文字)說(shuō)話人信息:身份、性別、年齡方言:認(rèn)老鄉(xiāng)的主要依據(jù)情感(情緒)語(yǔ)種:國(guó)外找“親人”的主要信息來(lái)源說(shuō)話方式(快、慢、耳語(yǔ))語(yǔ)音品質(zhì)(口語(yǔ)、朗誦、流暢性、動(dòng)聽(tīng)度)健康狀況:特別是發(fā)音器官病變第三頁(yè),共五十九頁(yè)。重要概念語(yǔ)音音節(jié)元音、輔音清音、濁音聲母、韻母共振峰、音色語(yǔ)譜圖、聲紋第四頁(yè),共五十九頁(yè)。2.1概述2.2語(yǔ)音和語(yǔ)言2.3漢語(yǔ)語(yǔ)音學(xué)2.4語(yǔ)音生成系統(tǒng)和語(yǔ)音感知系統(tǒng)2.5語(yǔ)音信號(hào)生成的數(shù)學(xué)模型2.6語(yǔ)音信號(hào)的特性分析第2章語(yǔ)音信號(hào)處理的基礎(chǔ)知識(shí)第五頁(yè),共五十九頁(yè)。
2.2語(yǔ)音和語(yǔ)言語(yǔ)音是人的發(fā)聲器官發(fā)出的一種聲波,它具有一定的音色,音調(diào),音強(qiáng)和音長(zhǎng)。一種聲音區(qū)別于另一種聲音的基本特征聲音的高低,它取決于聲波的頻率聲音的強(qiáng)弱,聲波的振動(dòng)幅度決定聲音的長(zhǎng)短叫音長(zhǎng),它取決于發(fā)音時(shí)間的長(zhǎng)短第六頁(yè),共五十九頁(yè)。語(yǔ)音語(yǔ)音(Speech)=聲音(Acoustic)+語(yǔ)言(Language),是二者的組合體語(yǔ)音是由一連串的音組成語(yǔ)言的聲音第七頁(yè),共五十九頁(yè)。語(yǔ)言是從人們的話語(yǔ)中概括總結(jié)出來(lái)的規(guī)律性的符號(hào)系統(tǒng)。2.2語(yǔ)音和語(yǔ)言2.2語(yǔ)音和語(yǔ)言2.2語(yǔ)音和語(yǔ)言不同層次的單位:語(yǔ)素、詞、短語(yǔ)和句子語(yǔ)法和語(yǔ)義內(nèi)容:詞法、句法、文脈第八頁(yè),共五十九頁(yè)。2.2語(yǔ)音和語(yǔ)言人的說(shuō)話的過(guò)程:第九頁(yè),共五十九頁(yè)。語(yǔ)音學(xué)(Phonetics)是研究言語(yǔ)過(guò)程的一門(mén)科學(xué)。它考慮的是語(yǔ)音產(chǎn)生、語(yǔ)音感知等的過(guò)程以及語(yǔ)音中各個(gè)音的特征和分類(lèi)等問(wèn)題。
現(xiàn)代語(yǔ)音學(xué)發(fā)展成為三個(gè)主要分支:
發(fā)音語(yǔ)音學(xué)
聲學(xué)語(yǔ)音學(xué)
聽(tīng)覺(jué)語(yǔ)音學(xué)第十頁(yè),共五十九頁(yè)。2.2語(yǔ)音和語(yǔ)言第十一頁(yè),共五十九頁(yè)。2.2語(yǔ)音和語(yǔ)言
當(dāng)聲帶振動(dòng)發(fā)出的聲音氣流從喉腔、咽腔進(jìn)入口腔從唇腔出去時(shí),這些聲腔完全開(kāi)放,氣流順利通過(guò),這種音稱為元音。
第十二頁(yè),共五十九頁(yè)。
2.2語(yǔ)音和語(yǔ)言呼出的聲流,由于通路的某一部分封閉起來(lái)或受到阻礙,氣流被阻不能暢通,而克服發(fā)音器官的這種阻礙而產(chǎn)生的音素稱為輔音。發(fā)輔音時(shí)由聲帶是否振動(dòng)引起濁音和清音的區(qū)別,聲帶振動(dòng)的是濁音,聲帶不振動(dòng)的是清音。(b/p)第十三頁(yè),共五十九頁(yè)。
2.2語(yǔ)音和語(yǔ)言決定元音音色的主要因素是舌頭的形狀及其在口腔中的位置(簡(jiǎn)稱舌位)、嘴唇的形狀(簡(jiǎn)稱口形)等。元音的另一個(gè)重要聲學(xué)特性是共振峰(Formant)。共振峰參數(shù)是區(qū)別不同元音的重要參數(shù),它一般包括共振峰頻率(FormantFrequency)的位置和頻帶寬度(FormantBandwidth)。
一般地說(shuō),女聲和童聲的基頻高于男聲,但是實(shí)驗(yàn)表明:區(qū)分語(yǔ)音是男聲還是女聲、是成人聲音還是兒童聲音,更重要的因素是共振峰頻率的高低。
第十四頁(yè),共五十九頁(yè)。
2.2語(yǔ)音和語(yǔ)言發(fā)音器官產(chǎn)生元音的三條件①聲道受到聲帶振動(dòng)的激勵(lì)引起共振;②在語(yǔ)音流的持續(xù)過(guò)程中,聲道不發(fā)生極端的狹窄,并維持較穩(wěn)定的形狀;③和鼻腔不發(fā)生偶合,聲音只從口腔輻射出去。這三個(gè)條件中,只要缺少其中之一,則該語(yǔ)音就是輔音。輔音沒(méi)有明確的共振峰結(jié)構(gòu)。輔音發(fā)音時(shí)的阻礙的位置叫調(diào)音點(diǎn)(PlaceofArticulation)、阻礙的方法叫調(diào)音方式(MannerofArticulation)第十五頁(yè),共五十九頁(yè)。
2.2語(yǔ)音和語(yǔ)言調(diào)音方式等的不同可以把輔音分成如下幾類(lèi):塞音、摩擦音、塞擦音、鼻音、邊音、顫音、通音。根據(jù)發(fā)輔音時(shí)聲帶有無(wú)振動(dòng),可以把輔音分類(lèi)成濁輔音和清輔音。根據(jù)輔音除阻后是否緊跟著送出一股氣來(lái),可以把輔音分類(lèi)成送氣輔音和不送氣輔音。第十六頁(yè),共五十九頁(yè)。2.1概述2.2語(yǔ)音和語(yǔ)言2.3漢語(yǔ)語(yǔ)音學(xué)2.4語(yǔ)音生成系統(tǒng)和語(yǔ)音感知系統(tǒng)2.5語(yǔ)音信號(hào)生成的數(shù)學(xué)模型2.6語(yǔ)音信號(hào)的特性分析第2章語(yǔ)音信號(hào)處理的基礎(chǔ)知識(shí)第十七頁(yè),共五十九頁(yè)。
2.3漢語(yǔ)語(yǔ)音學(xué)漢語(yǔ)語(yǔ)音的特點(diǎn):
音系簡(jiǎn)單。這是指音素少、音節(jié)少。音節(jié)的結(jié)構(gòu)也比較簡(jiǎn)單。
由于清輔音多,而且多是弱清音,而且開(kāi)口呼的音節(jié)占全部音節(jié)的一半以上,所以漢語(yǔ)語(yǔ)音聽(tīng)感上有清亮、高揚(yáng)和舒服、柔和的感覺(jué)。
有鮮明的輕重音和兒化韻,所以字詞分隔清楚,語(yǔ)言表達(dá)準(zhǔn)確而豐富。
第十八頁(yè),共五十九頁(yè)。
漢語(yǔ)的拼音方法漢語(yǔ)由音素構(gòu)成聲母或韻母。有時(shí),將含有聲調(diào)(漢語(yǔ)通常認(rèn)為有五個(gè)聲調(diào))的韻母稱為調(diào)母。由單個(gè)調(diào)母或由聲母與調(diào)母拼音成為音節(jié)。漢語(yǔ)的一個(gè)音節(jié)就是漢語(yǔ)一個(gè)字的音,即音節(jié)字。由音節(jié)字構(gòu)成詞(其中主要是兩音節(jié)字構(gòu)成的兩字詞,約占74%),最后再由詞構(gòu)成句子。國(guó)際上,都是用音標(biāo)來(lái)描述拼音過(guò)程的。漢語(yǔ)也不例外。漢語(yǔ)拼音的音標(biāo)包括:聲母表、韻母表和聲調(diào)符號(hào)等。
第十九頁(yè),共五十九頁(yè)。漢語(yǔ)音節(jié)的一般結(jié)構(gòu)
漢語(yǔ)音節(jié)一般由聲母、韻母和聲調(diào)三部分組成。漢語(yǔ)普通話中有6000多個(gè)常用字每個(gè)漢字是一個(gè)音節(jié),如將同音字合一處理,則漢語(yǔ)中共有1332個(gè)有調(diào)音節(jié),其中可以單念的有1268個(gè)。漢語(yǔ)中一般有五個(gè)聲調(diào),即陰平、陽(yáng)平、上聲、去聲以及輕聲。如果不考慮聲調(diào),則漢語(yǔ)中無(wú)調(diào)音節(jié)共有407個(gè)。
漢語(yǔ)音節(jié)的一般結(jié)構(gòu),由9個(gè)部分組成。其中1~4段屬于聲母(輔音),6~9段屬于韻母(元音),第5段是二者的過(guò)渡段。一個(gè)音節(jié)可能只包含里面的某幾段,但是第7段(主要元音段)是每個(gè)音節(jié)是具有的。
第二十頁(yè),共五十九頁(yè)。漢語(yǔ)音節(jié)的一般結(jié)構(gòu)第二十一頁(yè),共五十九頁(yè)。漢語(yǔ)聲母的結(jié)構(gòu)
普通話中的22個(gè)聲母可分為六大類(lèi):擦音塞音塞擦音邊音鼻音零聲母除零聲母之外,其他所有的聲母全部都是單輔音。
第二十二頁(yè),共五十九頁(yè)。漢語(yǔ)韻母的結(jié)構(gòu)
普通話的38個(gè)韻母大致可以分為三類(lèi)8個(gè)單韻母,如[a]、[i]、[u]等14個(gè)復(fù)韻母,如[ai]、[ao]等16個(gè)鼻韻母如[an]、[uang]等在這38個(gè)韻母中有三個(gè)(-i、er、ê)是特殊韻母。應(yīng)該注意,元音并不等于韻母。元音、輔音是按音素的發(fā)音特征分類(lèi)的;而聲母、韻母則是按音節(jié)結(jié)構(gòu)分類(lèi)的。這是兩種不同的概念,盡管它們之間有一定的聯(lián)系。
第二十三頁(yè),共五十九頁(yè)。聲母和韻母的相互作用——音征互載
在普通話里,聲母和韻母的音征并不總是在各自的音段之內(nèi),而且又可能跨越兩者的邊界,即聲母里可能會(huì)帶有韻母的信息,韻母里也可能帶有聲母的信息,如輔音音渡。如果把韻母從元音起始就開(kāi)始算起的話,那么音渡就是韻母中載帶的輔音音征,對(duì)于某些輔音來(lái)說(shuō),如不送氣塞音[b]、[d],元音里的音渡正是它們之間相互區(qū)別的主要音征。而韻母中的某些音征有聲帶載帶的現(xiàn)象,最典型的就是介音的實(shí)現(xiàn)方式。第二十四頁(yè),共五十九頁(yè)。漢語(yǔ)的聲調(diào)漢語(yǔ)是一種聲調(diào)語(yǔ)言,相同聲母和韻母構(gòu)成的音節(jié)隨聲調(diào)的不同而具有完全不同的意義,對(duì)應(yīng)著不同的漢字。漢語(yǔ)普通話的聲調(diào)只有陰平、陽(yáng)平、上聲、去聲以及“輕聲”等五種聲調(diào)。聲調(diào)的變化就是濁音基音周期(或基音頻率)的變化,各個(gè)韻母段中基音周期隨時(shí)間的變化產(chǎn)生了聲調(diào),變化的軌跡稱為聲調(diào)曲線。
第二十五頁(yè),共五十九頁(yè)。漢語(yǔ)的聲調(diào)漢語(yǔ)普通話四種聲調(diào)的典型曲線:
第二十六頁(yè),共五十九頁(yè)。2.1概述2.2語(yǔ)音和語(yǔ)言2.3漢語(yǔ)語(yǔ)音學(xué)2.4語(yǔ)音生成系統(tǒng)和語(yǔ)音感知系統(tǒng)2.5語(yǔ)音信號(hào)生成的數(shù)學(xué)模型2.6語(yǔ)音信號(hào)的特性分析第2章語(yǔ)音信號(hào)處理的基礎(chǔ)知識(shí)第二十七頁(yè),共五十九頁(yè)。2.4語(yǔ)音生成系統(tǒng)和語(yǔ)音感知系統(tǒng)語(yǔ)音發(fā)音系統(tǒng)
人的發(fā)音器官包括:肺、氣管、喉(包括聲帶)、咽、鼻和口。這些器官共同形成一條形狀復(fù)雜的管道。喉的部分稱為聲門(mén)。從聲門(mén)到嘴唇的呼氣通道叫做聲道(VocalTract)。聲道的形狀主要由嘴唇、顎和舌頭的位置來(lái)決定。由聲道形狀的不斷改變,而發(fā)出不同的語(yǔ)音。
第二十八頁(yè),共五十九頁(yè)。語(yǔ)音聽(tīng)覺(jué)系統(tǒng)人耳由內(nèi)耳、中耳和外耳三部分組成。外耳由耳翼、外耳道和鼓膜構(gòu)成。外耳在對(duì)聲音的感知中起著聲源定位和聲音放大的作用。中耳包括由錘骨、砧骨和鐙骨這三塊聽(tīng)小骨構(gòu)成的聽(tīng)骨鏈以及咽鼓管等組成。中耳的作用是進(jìn)行聲阻抗的變換,即將中耳兩端的聲阻抗匹配起來(lái),同時(shí)對(duì)內(nèi)耳起著保護(hù)的作用。內(nèi)耳的主要構(gòu)成器官是耳蝸(Cochlea)。它是聽(tīng)覺(jué)的受納器,把聲音通過(guò)機(jī)械變換產(chǎn)生神經(jīng)發(fā)放信號(hào)。
第二十九頁(yè),共五十九頁(yè)。語(yǔ)音聽(tīng)覺(jué)系統(tǒng)人的聽(tīng)覺(jué)系統(tǒng)
第三十頁(yè),共五十九頁(yè)。語(yǔ)音聽(tīng)覺(jué)系統(tǒng)人的聽(tīng)覺(jué)系統(tǒng)有兩個(gè)重要特性,一個(gè)是耳蝸對(duì)于聲信號(hào)的時(shí)頻分析特性;另一個(gè)是人耳聽(tīng)覺(jué)掩蔽效應(yīng)。如果信號(hào)是一個(gè)多頻率信號(hào),則產(chǎn)生的行波將沿著基底膜在不同的位置產(chǎn)生最大幅度。從這個(gè)意義上講,耳蝸就象一個(gè)頻譜分析儀,將復(fù)雜的信號(hào)分解成各種頻率分量。并非所有的聲音都能被人耳聽(tīng)到,這取決于聲音的強(qiáng)度和其頻率范圍。心理聲學(xué)中的聽(tīng)覺(jué)掩蔽效應(yīng)是指,在一個(gè)強(qiáng)信號(hào)附近,弱信號(hào)將變得不可聞,被掩蔽掉了。時(shí)間掩蔽:同時(shí)掩蔽和短時(shí)掩蔽頻率掩蔽第三十一頁(yè),共五十九頁(yè)。2.1概述2.2語(yǔ)音和語(yǔ)言2.3漢語(yǔ)語(yǔ)音學(xué)2.4語(yǔ)音生成系統(tǒng)和語(yǔ)音感知系統(tǒng)2.5語(yǔ)音信號(hào)生成的數(shù)學(xué)模型2.6語(yǔ)音信號(hào)的特性分析第2章語(yǔ)音信號(hào)處理的基礎(chǔ)知識(shí)第三十二頁(yè),共五十九頁(yè)。
2.5語(yǔ)音信號(hào)生成的數(shù)學(xué)模型所謂建立數(shù)學(xué)模型就是要尋求一種可以表達(dá)一定物理狀態(tài)下量與量之間關(guān)系的數(shù)學(xué)表示。建立語(yǔ)音信號(hào)的數(shù)字模型,才能用計(jì)算機(jī)來(lái)定量地對(duì)語(yǔ)音信號(hào)進(jìn)行模擬和處理。所以語(yǔ)音信號(hào)生成的數(shù)學(xué)模型是語(yǔ)音信號(hào)處理的基礎(chǔ)。
第三十三頁(yè),共五十九頁(yè)。
2.5語(yǔ)音信號(hào)生成的數(shù)學(xué)模型理想的模型是線性的和時(shí)不變的。語(yǔ)音信號(hào)是非平穩(wěn)隨機(jī)過(guò)程,其特性是隨著時(shí)間變化的,所以模型中的參數(shù)應(yīng)該是隨時(shí)間而變化的。但語(yǔ)音信號(hào)特性隨著時(shí)間變化是很緩慢的。所以可以作出一些合理的假設(shè),將語(yǔ)音信號(hào)分為一些相繼的短段進(jìn)行處理,在這些短段中可以認(rèn)為語(yǔ)音信號(hào)特性是不隨著時(shí)間變化的平穩(wěn)隨機(jī)過(guò)程。這樣在這些短段時(shí)間內(nèi)表示語(yǔ)音信號(hào)時(shí),可以采用線性時(shí)不變模型。
第三十四頁(yè),共五十九頁(yè)。激勵(lì)模型激勵(lì)模型一般分成濁音激勵(lì)和清音激勵(lì)來(lái)討論。發(fā)濁音時(shí),由于聲帶不斷張開(kāi)和關(guān)閉,將產(chǎn)生間歇的脈沖波。這個(gè)脈沖波的波形類(lèi)似于斜三角形的脈沖,它的數(shù)學(xué)表達(dá)式如下:
N1為斜三角波上升部分的時(shí)間,N2為其下降部分的時(shí)間。第三十五頁(yè),共五十九頁(yè)。喉內(nèi)窺鏡圖像聲門(mén)波曲線聲門(mén)及聲門(mén)波第三十六頁(yè),共五十九頁(yè)。激勵(lì)模型單個(gè)斜三角波波形的頻譜的圖形如圖2-18所示。由圖可見(jiàn),它是一個(gè)低通濾波器。它的變換的全極模型的形式是:c是一個(gè)常數(shù)。顯然,上式表示斜三角波形可描述為一個(gè)二極點(diǎn)的模型。因此,斜三角波形串可視為加權(quán)了單位脈沖串激勵(lì)上述單個(gè)斜三角波模型的結(jié)果。第三十七頁(yè),共五十九頁(yè)。激勵(lì)模型單位脈沖串及幅值因子則可表示成下面的z變換形式:所以,整個(gè)濁音激勵(lì)模型可表示為:也就是說(shuō)濁音激勵(lì)波是一個(gè)以基音周期為周期的斜三角脈沖串。第三十八頁(yè),共五十九頁(yè)。
聲道模型目前最常用的有兩種:聲管模型、共振峰模型聲管模型:把聲道視為由多個(gè)等長(zhǎng)的不同截面積的管子串聯(lián)而成的系統(tǒng)。共振峰模型:把聲道視為一個(gè)諧振腔。共振峰就是這個(gè)腔體的諧振頻率。由于人耳聽(tīng)覺(jué)的柯替氏器官的纖毛細(xì)胞就是按頻率感受而排列其位置的,所以這種共振峰的聲道模型方法是非常有效的。一般來(lái)說(shuō),一個(gè)元音用前三個(gè)共振峰來(lái)表示就足夠了;而對(duì)于較復(fù)雜的輔音或鼻音,大概要用到前五個(gè)以上的共振峰才行。基于物理聲學(xué)的共振峰理論,可以建立起三種實(shí)用的共振峰模型:級(jí)聯(lián)型、并聯(lián)型和混合型。
第三十九頁(yè),共五十九頁(yè)。聲道模型級(jí)聯(lián)型這時(shí)認(rèn)為聲道是一組串聯(lián)的二階諧振器。從共振峰理論來(lái)看,整個(gè)聲道具有多個(gè)諧振頻率和多個(gè)反諧振頻率,所以它可被模擬為一個(gè)零極點(diǎn)的數(shù)學(xué)模型;但對(duì)于一般元音,則用全極點(diǎn)模型就可以了。傳輸函數(shù)可分解表示為多個(gè)二階極點(diǎn)的網(wǎng)絡(luò)的串聯(lián):
第四十頁(yè),共五十九頁(yè)。聲道模型級(jí)聯(lián)型第四十一頁(yè),共五十九頁(yè)。聲道模型并聯(lián)型對(duì)于非一般元音以及大部分輔音,必須考慮采用零極點(diǎn)模型。此時(shí),模型的傳輸函數(shù)如下:
通常,N>R,且設(shè)分子與分母無(wú)公因子及分母無(wú)重根,則上式可分解為如下部分分式之和的形式:這就是并聯(lián)型的共振峰模型。如圖2-21所示(M=5)。第四十二頁(yè),共五十九頁(yè)。聲道模型并聯(lián)型第四十三頁(yè),共五十九頁(yè)。聲道模型混合型上述兩種模型中,級(jí)聯(lián)型比較簡(jiǎn)單,可以用于描述一般元音。當(dāng)鼻化元音或鼻腔參與共振,以及阻塞音或摩擦音等情況時(shí),級(jí)聯(lián)模型就不能勝任了。這時(shí)腔體具有反諧振特性,必須考慮加入零點(diǎn),使之成為零極點(diǎn)模型。采用并聯(lián)結(jié)構(gòu)的目的就在于此,它比級(jí)聯(lián)型復(fù)雜些,每個(gè)諧振器的幅度都要獨(dú)立地給以控制。但對(duì)于鼻音、塞音、擦音以及塞擦音等都可以適用。正因?yàn)槿绱?,將?jí)聯(lián)模型和并聯(lián)模型結(jié)合起來(lái)的混合模型也許是比較完備的一種共振峰模型。
第四十四頁(yè),共五十九頁(yè)。聲道模型混合型共振峰模型
第四十五頁(yè),共五十九頁(yè)。輻射模型從聲道模型輸出的是速度波,而語(yǔ)音信號(hào)是聲壓波,二者之倒比稱為輻射阻抗。它表征口唇的輻射效應(yīng),也包括圓形的頭部的繞射效應(yīng)等。當(dāng)然,從理論上推導(dǎo)這個(gè)阻抗是有困難的。但是如果認(rèn)為口唇張開(kāi)的面積遠(yuǎn)小于頭部的表面積,則可近似地看成平板開(kāi)槽輻射的情況。此時(shí),可推導(dǎo)出輻射阻抗的公式如下:式中,,這里,是口唇張開(kāi)時(shí)的開(kāi)口半徑,是聲波傳播速度。圖2-24顯示了輻射阻抗的實(shí)部和虛部的頻率響應(yīng)曲線。由輻射引起的能量損耗正比于輻射阻抗的實(shí)部,所以輻射模型是一階類(lèi)高通濾波器。
第四十六頁(yè),共五十九頁(yè)。語(yǔ)音信號(hào)的數(shù)學(xué)模型
綜上所述,完整的語(yǔ)音信號(hào)的數(shù)字模型可以用三個(gè)子模型:激勵(lì)模型、聲道模型和輻射模型的串聯(lián)來(lái)表示。如圖所示:
它的傳輸函數(shù)可以表示為:第四十七頁(yè),共五十九頁(yè)。語(yǔ)音信號(hào)的數(shù)學(xué)模型這里,U(z)是激勵(lì)信號(hào),濁音時(shí)U(z)是聲門(mén)脈沖即斜三角形脈沖序列的z變換;在清音的情況下,U(z)是一個(gè)隨機(jī)噪聲的z變換。V(z)是聲道傳輸函數(shù),既可用聲管模型,也可以共振峰模型等來(lái)描述。實(shí)際上就是全極點(diǎn)模型:上式所示模型的內(nèi)部結(jié)構(gòu)并不和語(yǔ)音產(chǎn)生的物理過(guò)程相一致,但這種模型和真實(shí)模型在輸出處是等效的。第四十八頁(yè),共五十九頁(yè)。2.1概述2.2語(yǔ)音和語(yǔ)言2.3漢語(yǔ)語(yǔ)音學(xué)2.4語(yǔ)音生成系統(tǒng)和語(yǔ)音感知系統(tǒng)2.5語(yǔ)音信號(hào)生成的數(shù)學(xué)模型2.6語(yǔ)音信號(hào)的特性分析第2章語(yǔ)音信號(hào)處理的基礎(chǔ)知識(shí)第四十九頁(yè),共五十九頁(yè)。2.6語(yǔ)音信號(hào)的特性分析語(yǔ)音信號(hào)的特性主要是指它的聲學(xué)特性、語(yǔ)音信號(hào)的時(shí)域波形和頻譜特性以及語(yǔ)音信號(hào)的統(tǒng)計(jì)特性等。在時(shí)間域里,語(yǔ)音信號(hào)可以直接用它的時(shí)間波形表示出來(lái),通過(guò)觀察時(shí)間波形可以看出語(yǔ)音信號(hào)的一些重要特性。第五十頁(yè),共五十九頁(yè)。語(yǔ)音信號(hào)的時(shí)域波形
下圖是漢語(yǔ)拼音“souke”的時(shí)間波形。表示這段語(yǔ)音波形時(shí)采用的采樣頻率是8kHz,量化精度是16bit。從B點(diǎn)開(kāi)始的音節(jié)[OU]從D點(diǎn)開(kāi)始的音節(jié)[e]元音具有明顯的周期性,且振幅較大清輔音的波形類(lèi)似于白噪聲,振幅很小,沒(méi)有明顯的周期性從A點(diǎn)開(kāi)始的音節(jié)[s]從C點(diǎn)開(kāi)始的音節(jié)[k]第五十一頁(yè),共五十九頁(yè)。Waveformfor“Kaimen”第五十二頁(yè),共五十九頁(yè)。元音的準(zhǔn)平穩(wěn)特征長(zhǎng)約200ms的元音“a”的波形圖長(zhǎng)約45ms的元音“a”的波形圖長(zhǎng)約15ms的元音“a”的波形圖第五十三頁(yè),共五十九頁(yè)。背景噪音輔音輔音和背景噪聲的波形第五十四頁(yè),共五十九頁(yè)。語(yǔ)音信號(hào)的頻譜特性語(yǔ)音信號(hào)屬于短時(shí)平穩(wěn)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年房產(chǎn)大數(shù)據(jù)合作協(xié)議書(shū)
- 2025年低壓化成箔合作協(xié)議書(shū)
- 2025年減震系統(tǒng)材料合作協(xié)議書(shū)
- 2025年個(gè)人店鋪?zhàn)赓U合同樣本(三篇)
- 2025年中學(xué)設(shè)備供貨合同(2篇)
- 2025年二年級(jí)初中班主任工作總結(jié)樣本(五篇)
- 2025年二手房買(mǎi)賣(mài)購(gòu)房合同樣本(2篇)
- 2025年個(gè)人房屋簡(jiǎn)易租賃合同樣本(4篇)
- 2025年代理記賬委托協(xié)議合同格式版(2篇)
- 2025年互聯(lián)網(wǎng)專線電路接入服務(wù)協(xié)議范文(2篇)
- 同等學(xué)力英語(yǔ)申碩考試詞匯(第六版大綱)電子版
- 中日合同范本
- T-CARM 002-2023 康復(fù)醫(yī)院建設(shè)標(biāo)準(zhǔn)
- 《康復(fù)按摩知識(shí)》課件
- 旅游文本的翻譯課件
- 最全新能源材料-鋰離子電池材料189張課件
- 申論詳解(PPT課件)
- 立式加工中心說(shuō)明書(shū)
- 第八版神經(jīng)病學(xué)配套課件-12-中樞神經(jīng)系統(tǒng)感染性疾病
- 15MW風(fēng)力發(fā)電機(jī)
- 正面管教 讀書(shū)分享(課堂PPT)
評(píng)論
0/150
提交評(píng)論