版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、語(yǔ)音信號(hào)處理石 鈞2009.09第一章 緒論數(shù)字語(yǔ)音處理研究的內(nèi)容語(yǔ)音處理的發(fā)展歷史語(yǔ)音信息的重要性 人類(lèi)從大自然獲取信息的分布圖數(shù)字語(yǔ)音處理研究的內(nèi)容語(yǔ)音信號(hào)處理的實(shí)質(zhì)語(yǔ)音信號(hào)的數(shù)字表示語(yǔ)音信號(hào)數(shù)字處理的方法和技術(shù)數(shù)字語(yǔ)音處理的應(yīng)用返回1.語(yǔ)音信號(hào)處理的實(shí)質(zhì)1.實(shí)質(zhì):是研究用數(shù)字信號(hào)處理技術(shù)對(duì)語(yǔ)音信號(hào)進(jìn)行處理的一門(mén)學(xué)科2.目的:通過(guò)處理得到一些反映語(yǔ)音信號(hào)重要特征的語(yǔ)音參數(shù)以便高效地傳輸或儲(chǔ)存語(yǔ)音信號(hào)所包含的信息。通過(guò)對(duì)語(yǔ)音信號(hào)進(jìn)行某種運(yùn)算以達(dá)到某種要求。1.語(yǔ)音信號(hào)處理的實(shí)質(zhì)3.學(xué)科基礎(chǔ):以語(yǔ)音語(yǔ)言學(xué)和數(shù)字信號(hào)處理為基礎(chǔ)而形成的一門(mén)涉及面很廣的學(xué)科,與心理學(xué)、生理學(xué)、計(jì)算機(jī)科學(xué)、通信與信息
2、科學(xué)、模式識(shí)別和人工智能等學(xué)科均有密切的關(guān)系。 返回2. 語(yǔ)音信號(hào)的數(shù)字表示語(yǔ)音表示方法的選擇要保存語(yǔ)音信號(hào)中的消息內(nèi)容;表示形式要便于傳輸和存儲(chǔ)、變換和處理,不至于嚴(yán)重?fù)p害消息的內(nèi)容,有用信息更易于被提?。?. 語(yǔ)音信號(hào)數(shù)字表示的優(yōu)點(diǎn)數(shù)字技術(shù)能完成許多很復(fù)雜的信號(hào)處理工作;語(yǔ)音可以看成是音素的組合,具有離散的性質(zhì),特別適合于數(shù)字處理;2. 語(yǔ)音信號(hào)的表示數(shù)字系統(tǒng)具有高可靠性、價(jià)廉、緊湊、快速等特點(diǎn),很容易完成實(shí)時(shí)處理任務(wù);數(shù)字語(yǔ)音適于在強(qiáng)干擾信道中傳輸,易于和數(shù)據(jù)一起在通信網(wǎng)中傳輸,也易于進(jìn)行加密傳輸。語(yǔ)音信號(hào)的數(shù)字表示方法波形表示采樣和量化,保持波形參數(shù)表示激勵(lì)源和模型參數(shù)(第二章)3.
3、語(yǔ)音信號(hào)的數(shù)字處理方法語(yǔ)音信號(hào)的特點(diǎn)短時(shí)平穩(wěn)性短時(shí)時(shí)域處理方法短時(shí)能量、短時(shí)平均過(guò)零率以及短時(shí)自相關(guān)函數(shù)計(jì)算短時(shí)頻域分析短時(shí)傅立葉分析線(xiàn)性預(yù)測(cè)技術(shù)本質(zhì)上屬于時(shí)域分析方法,但其結(jié)果可以是頻域參數(shù)倒譜和同態(tài)分析、矢量量化和隱馬爾可夫模型語(yǔ)音信號(hào)數(shù)字處理基本過(guò)程 以降低語(yǔ)音發(fā)音速率的處理過(guò)程為例4. 數(shù)字語(yǔ)音處理的應(yīng)用語(yǔ)音壓縮和編碼語(yǔ)音通信數(shù)字化;語(yǔ)音合成自動(dòng)報(bào)站、自動(dòng)報(bào)時(shí)、自動(dòng)警告、電話(huà)自動(dòng)查詢(xún)和語(yǔ)音提示等;語(yǔ)音識(shí)別聲控應(yīng)用、自動(dòng)口語(yǔ)翻譯;說(shuō)話(huà)人識(shí)別安全加密、銀行信息電話(huà)查詢(xún)服務(wù)以及破案和法庭取證;語(yǔ)音增強(qiáng)通常作為語(yǔ)音處理的前端。 各種語(yǔ)音產(chǎn)品返回語(yǔ)音處理的發(fā)展歷史1876年電話(huà)的發(fā)明,貝爾(Be
4、ll);1939年聲碼器的研制成功聲源聲道;1947年貝爾實(shí)驗(yàn)室發(fā)明語(yǔ)譜圖儀語(yǔ)音識(shí)別研究的開(kāi)始;50年代第一臺(tái)口授打字機(jī)和英語(yǔ)單詞語(yǔ)音識(shí)別器;60年代出現(xiàn)了第一臺(tái)以數(shù)字計(jì)算機(jī)為基礎(chǔ)的孤立詞語(yǔ)音識(shí)別器和有限連續(xù)語(yǔ)音識(shí)別器;語(yǔ)音處理的發(fā)展歷史70年代動(dòng)態(tài)規(guī)劃技術(shù)、隱馬爾可夫模型、線(xiàn)性預(yù)測(cè)技術(shù)和矢量量化碼書(shū)生成方法用于語(yǔ)音編碼和識(shí)別;80、90年代語(yǔ)音處理技術(shù)產(chǎn)品化IBM Tangora-5和Tangora-20英語(yǔ)聽(tīng)寫(xiě)機(jī),Dragon Dictate 詞匯翻譯系統(tǒng)(70000),漢語(yǔ)聽(tīng)寫(xiě)機(jī)。CMU語(yǔ)音組研制成功SPHINX系統(tǒng)(997,95.8%);國(guó)內(nèi),清華大學(xué)、中科院聲學(xué)所和中科院自動(dòng)化所在漢
5、語(yǔ)聽(tīng)寫(xiě)機(jī)研究方面有一定成果。返回語(yǔ)音信號(hào)處理的概念語(yǔ)音信號(hào)處理簡(jiǎn)稱(chēng)語(yǔ)音處理,是以語(yǔ)音學(xué)和數(shù)字信號(hào)處理為基礎(chǔ)而形成的一門(mén)綜合性學(xué)科.處理的目的:是要得到一些語(yǔ)音參數(shù),以便高效的傳輸或存儲(chǔ),或者通過(guò)處理的某種運(yùn)算以達(dá)到某種用途的要求,例如人工合成出語(yǔ)音,辨識(shí)出說(shuō)話(huà)者,識(shí)別講話(huà)的內(nèi)容等。它包括語(yǔ)音編碼、語(yǔ)音合成、語(yǔ)音識(shí)別和說(shuō)話(huà)人識(shí)別四大分支。語(yǔ)音的定義語(yǔ)音是人類(lèi)發(fā)音器官發(fā)出的、具有一定意義的、能起社會(huì)交際作用的聲音。能夠代表一定的意義,這是語(yǔ)言的聲音同自然界其他一切聲音的本質(zhì)區(qū)別。人體外的聲音自不必說(shuō)(如鐘聲、風(fēng)聲、動(dòng)物叫聲、機(jī)器聲),就是人的發(fā)音器官發(fā)出的聲音,也并非都是語(yǔ)言。語(yǔ)音的定義如打噴嚏、
6、打嗝兒、打哈欠、咳嗽等等,雖然也傳遞出了某種信息病了,飽了,困了或是醒了,但聲音的發(fā)出不是為了交際,而是人體本能的生理反映;又如吹口哨、口技演員的表演、哭、笑等等,這些聲音的發(fā)出是有目的的,是一定的心理活動(dòng)的表現(xiàn),不是單純的生理現(xiàn)象,但聲音同意義之間沒(méi)有固定的結(jié)合關(guān)系,不能成為代表意義的聲音符號(hào),只能表示情緒,展示技巧。以上這些聲音都不是語(yǔ)言。語(yǔ)音的定義語(yǔ)言的聲音同它所代表的意義是相互依存的統(tǒng)一體,一方面,發(fā)音器官發(fā)出的聲音必須同意義緊密結(jié)合、成為一定意義的代表,才能成為語(yǔ)音;另一方面,意義必須借助聲音才能成為可被人感知、被人接受的東西,沒(méi)有聲音,意義便無(wú)法表達(dá)出來(lái)。語(yǔ)音的定義語(yǔ)音是一種具有多
7、重屬性的聲音。首先,它同自然界其他聲音一樣,是由物體振動(dòng)產(chǎn)生聲波而形成的一種自然現(xiàn)象,所以它具有物理的屬性方面的自然屬性。語(yǔ)言又是人類(lèi)的生理現(xiàn)象,發(fā)音是人體器官的動(dòng)作。因此,它同時(shí)具有生理屬性。作為語(yǔ)言這一特殊社會(huì)現(xiàn)象的物質(zhì)基礎(chǔ),語(yǔ)音又具有社會(huì)屬性,這是語(yǔ)音的本質(zhì)屬性。我們?cè)诜治稣Z(yǔ)音現(xiàn)象的時(shí)候,這三種屬性都會(huì)涉及到。 語(yǔ)音學(xué)語(yǔ)音學(xué)是研究語(yǔ)音過(guò)程的科學(xué),包括發(fā)音語(yǔ)音學(xué)、聲學(xué)語(yǔ)音學(xué)和聽(tīng)覺(jué)語(yǔ)音學(xué)三大分支。發(fā)音語(yǔ)音學(xué)研究發(fā)音器官在發(fā)音過(guò)程中的運(yùn)動(dòng)和語(yǔ)音的音位特征;聲學(xué)語(yǔ)音學(xué)研究語(yǔ)音的物理屬性,如語(yǔ)音聲波的頻率、振幅以及頻譜特性等;聽(tīng)覺(jué)語(yǔ)音學(xué)研究聽(tīng)覺(jué)和語(yǔ)音感知。語(yǔ)音的屬性物理屬性 物體由于某種外力的作用
8、發(fā)生振動(dòng),并引起周?chē)諝饣蚱渌浇槲镔|(zhì)的振動(dòng),產(chǎn)生了振動(dòng)波 聲波,聲波作用于耳鼓膜,使之產(chǎn)生同樣的振動(dòng),刺激聽(tīng)覺(jué)神經(jīng),人就感覺(jué)到了聲音。語(yǔ)音也是這樣產(chǎn)生、傳遞與接收的。物理聲學(xué)認(rèn)為聲波具有音高、音強(qiáng)、音長(zhǎng)、音色四種要素,語(yǔ)音同樣是這四種要素的統(tǒng)一體。 聲波示意(L. A. Rowe )壓縮稀薄時(shí)間幅度正弦波聲波頻率聲壓變化可以是周期性的和非周期性頻率概念循環(huán)(cycle)- 壓縮/稀薄過(guò)程頻率(frequency):每秒cycle數(shù),單位 hertz (Hz)周期 cycle的持續(xù)時(shí)間 (1/frequency)聲音信號(hào)一般由許多頻率不同的信號(hào)組成,稱(chēng)為復(fù)合信號(hào);而單一頻率的信號(hào)稱(chēng)為分量信號(hào)頻
9、率范圍頻率小于20Hz 一般稱(chēng)為次聲波(subsonic)人的聽(tīng)覺(jué)器官能感知的聲音頻率范圍約為20Hz20kHz的信號(hào)稱(chēng)為音頻(Audio)信號(hào)人發(fā)音器官發(fā)聲頻率約是803400Hz,但人說(shuō)話(huà)的信號(hào)頻率約為3003000Hz,即話(huà)音(speech)信號(hào)高于20kHz的信號(hào)稱(chēng)為超聲波 (ultrasonic)超聲波及次聲波一般不能引起人聽(tīng)覺(jué)器官的感覺(jué),但可借助一些儀器設(shè)備進(jìn)行觀(guān)察和測(cè)量語(yǔ)音的物理屬性音高 音高指聲音的高低,它取決于發(fā)音體振動(dòng)的快慢。發(fā)音體振動(dòng)越快,發(fā)出的聲音越高,反之聲音則低。物體每秒鐘振動(dòng)的次數(shù)叫頻率,聲學(xué)把頻率作為測(cè)定物體振動(dòng)快慢與聲音高低的標(biāo)準(zhǔn)。說(shuō)聲音的頻率高就是說(shuō)發(fā)音體在
10、單位時(shí)間里振動(dòng)次數(shù)多,它振動(dòng)得快,發(fā)出的聲音高,而頻率低也就表示聲音低。語(yǔ)音的物理屬性音高 頻率的高低是由物體自身的質(zhì)量、松緊度、長(zhǎng)短等項(xiàng)因素決定的,大而沉、粗而厚、長(zhǎng)而松的物體振動(dòng)慢,音低;小而輕、細(xì)而薄、短而緊的物體振動(dòng)快,音高。語(yǔ)音的高低則與聲帶的長(zhǎng)短、厚薄、松緊有關(guān)。通常,兒童和一般婦女的聲帶比成年男子的聲帶短而薄,所以聲音高;而聲音低的人聲帶相對(duì)說(shuō)長(zhǎng)而厚,如成年男子,女中、低音聲樂(lè)演員,老人等。同一個(gè)人發(fā)出的聲音有高低變化,則是靠控制聲帶的松緊來(lái)調(diào)節(jié)的。 典型聲門(mén)脈沖波形Tp為基音周期,倒數(shù)為基音頻率,用fp表示,取決于聲帶的尺寸和特性男性說(shuō)話(huà)者的fp大致分布在60-200Hz范圍內(nèi)
11、女性說(shuō)話(huà)者和小孩的fp值在200-450Hz范圍內(nèi)同一個(gè)人所發(fā)出的聲音有高低變化,是靠控制聲帶的松緊來(lái)調(diào)節(jié)的。語(yǔ)音的物理屬性音強(qiáng) 音強(qiáng)是指聲音的強(qiáng)弱,它取決于發(fā)音體振動(dòng)幅度的大小。物體振動(dòng)的幅度叫振幅,振幅大,發(fā)出的聲音強(qiáng)度就大,振幅小,聲音就弱。振幅的大小是由引起物體振動(dòng)的外力的大小決定的。語(yǔ)音的強(qiáng)弱同發(fā)音時(shí)呼出氣流量的大小和說(shuō)話(huà)人用力的大小有關(guān)。發(fā)音時(shí)用力大,沖擊聲帶或其他發(fā)音部位的氣流強(qiáng),語(yǔ)音就強(qiáng)。語(yǔ)音的物理屬性音長(zhǎng) 音長(zhǎng)指聲音的長(zhǎng)短,也就是聲波延續(xù)的長(zhǎng)度,它取決于發(fā)音體振動(dòng)持續(xù)的時(shí)間。在語(yǔ)音中,再長(zhǎng)的音實(shí)際上也很短,音長(zhǎng)一般決定于發(fā)音動(dòng)作持續(xù)的時(shí)間。 語(yǔ)音的物理屬性音長(zhǎng) 在四要素中,音
12、高音強(qiáng)音色總是隨著音波在時(shí)間上的延續(xù)表現(xiàn)出來(lái)的,音長(zhǎng)的變化往往會(huì)影響到音質(zhì)音高和音強(qiáng),語(yǔ)音中就常會(huì)出現(xiàn)這種情況。發(fā)音,頭發(fā)如普通話(huà)的輕聲,讀輕聲的字,聲韻母的音質(zhì)、聲調(diào)的音高、音節(jié)的強(qiáng)度都可能與讀它的本調(diào)時(shí)不同,但造成輕的決定性因素是音長(zhǎng)縮短,輕聲字音節(jié)的長(zhǎng)度只有重讀音節(jié)長(zhǎng)度的一半左右,這使得聲韻調(diào)原有的音高音強(qiáng)音質(zhì)來(lái)不及完全表現(xiàn),因而出現(xiàn)變化。 語(yǔ)音的物理屬性音質(zhì) 音質(zhì)又叫音色,是一個(gè)聲音能區(qū)別于其他聲音的本質(zhì)特點(diǎn)。聲波的振動(dòng)方式與共鳴器的共振作用,都決定著音質(zhì)的差別。 世界上的聲音很少是只有一種單純頻率的純音,絕大多數(shù)聲音都是由許多個(gè)頻率和振幅不同的音波組成的復(fù)合音。復(fù)合音的各成分波之間頻
13、率和振幅相互影響,形成了特定的波形,產(chǎn)生出特定的音質(zhì)。 語(yǔ)音的物理屬性音質(zhì) 樂(lè)音則由若干規(guī)則的純音組成,形成的復(fù)合音波有周期性,很有規(guī)律,這樣的聲音聽(tīng)起來(lái)和諧、悅耳,歌聲、樂(lè)聲和語(yǔ)音中的元音,都是這樣的聲音。 語(yǔ)音的物理屬性音質(zhì) 從波形上看,音質(zhì)可分為兩類(lèi)噪音與樂(lè)音。噪音是由許多無(wú)規(guī)則的音波合成的,它們的音高和強(qiáng)度隨時(shí)在變化,相互之間沒(méi)有一定的關(guān)系,合成的波形雜亂而無(wú)規(guī)律。這種聲音聽(tīng)起來(lái)刺耳、嘈雜。如剎車(chē)聲,電鋸鋸木聲,馬路上車(chē)馳笛鳴的喧鬧聲等等。語(yǔ)音中也有不少噪音成分,如輔聲中的塞音、擦音、塞擦音等等。 語(yǔ)音的物理屬性音質(zhì)從音波的產(chǎn)生上看,造成不同音質(zhì)的發(fā)音條件有三種:發(fā)音體不一樣,口琴和笛
14、子的音質(zhì)不同,因?yàn)榭谇俚陌l(fā)音體是金屬簧片,笛子的發(fā)音體是竹膜。發(fā)音方法不一樣,拍手掌發(fā)出的是“啪啪”聲,兩手掌來(lái)回搓發(fā)出的是“擦擦”聲。在語(yǔ)音中,用阻礙氣流的方法發(fā)出的是輔音,用不阻礙氣流的方法發(fā)出是就是元音。語(yǔ)音的物理屬性音質(zhì)共鳴器形狀不同。共鳴器有自己的振動(dòng)頻率,它會(huì)同跟自己頻率相同或相近的音波產(chǎn)生共振,把它加強(qiáng),其它頻率的音波就會(huì)被抑制或消耗。不同形狀的共鳴器頻率不一樣,即使是對(duì)同一束復(fù)合音波,產(chǎn)生的共振結(jié)果也不一樣。對(duì)于語(yǔ)音來(lái)說(shuō),口鼻腔就是共鳴器,一個(gè)人不斷改變口形就會(huì)發(fā)出不同的音。語(yǔ)音的物理屬性音質(zhì)共鳴器形狀對(duì)語(yǔ)音音質(zhì)的區(qū)分還有另一方面的意義。倘若男女老少四人來(lái)發(fā)一個(gè)a音,他們的聲帶
15、長(zhǎng)短厚薄及韌性等各有差異,產(chǎn)生的音波肯定是不同形式的,但我們除了聽(tīng)出是四個(gè)人的聲音外,總還是聽(tīng)到了同一個(gè)韻母的音質(zhì)。語(yǔ)音的物理屬性音質(zhì)原因還在共鳴器的形狀。不同的人發(fā)同一個(gè)音時(shí),口鼻腔形狀雖然不會(huì)絕對(duì)相同,但其形狀的基本特點(diǎn)是一致的,比如發(fā)a時(shí)都要把舌面壓低,口腔開(kāi)大,舌根后部的咽腔相對(duì)窄小?,F(xiàn)在就是四束復(fù)合波與同一個(gè)形狀的共鳴器發(fā)生共振了,每人被共振加強(qiáng)的音波在絕對(duì)頻率上雖不見(jiàn)得一樣,但共振頻率分布的位置卻有共性,這使我們聽(tīng)出了同樣的元音。在元音的識(shí)別中,音質(zhì)并不決定于聲波的振動(dòng)形式,而決定于共鳴器形狀對(duì)共振頻率的選擇。語(yǔ)音的物理屬性音質(zhì)3.這也說(shuō)明了在語(yǔ)音傳遞過(guò)程中,準(zhǔn)確的發(fā)音動(dòng)作有多么重
16、要,共鳴器形狀正是靠發(fā)音動(dòng)作來(lái)調(diào)節(jié)的。 語(yǔ)音的生理屬性 人體沒(méi)有專(zhuān)門(mén)用來(lái)發(fā)音的器官,起發(fā)音作用的是呼吸器官和消化器官的一部分,它們的協(xié)同動(dòng)作產(chǎn)生了語(yǔ)音。了解這部分器官的構(gòu)造、活動(dòng)方式及對(duì)語(yǔ)音的作用,是正確發(fā)音、辨音的基礎(chǔ)。 語(yǔ)音的生理屬性發(fā)音器官 發(fā)音器官可分三部分。 1 肺和氣管肺部呼吸產(chǎn)生的氣流是發(fā)音的動(dòng)力,氣流通過(guò)氣管送到喉頭,沖擊聲帶或其他發(fā)音器官,使之振動(dòng),發(fā)出聲音。 肺本身不能自由擴(kuò)張收縮,是依靠胸部腹部肌肉群的活動(dòng)來(lái)進(jìn)行呼吸的。這些肌肉群的活動(dòng)還可以控制肺部吸入氣流量的大小、呼出氣流量的強(qiáng)弱及持續(xù)時(shí)間,影響聲音的強(qiáng)弱與長(zhǎng)短。 語(yǔ)音的生理屬性發(fā)音器官 發(fā)音器官可分三部分。 2 喉頭
17、和聲帶氣管的頂端接著喉頭。喉頭由幾塊軟骨及它們相連的肌肉、韌帶組成,是個(gè)能活動(dòng)的管腔體,聲帶就長(zhǎng)在喉頭中間。 聲帶是一對(duì)唇形的韌帶,邊緣很薄,富有彈性。它一端合并固定在甲狀軟骨上,不能分開(kāi);另一端分別附在兩塊杓狀軟骨上。 杓狀軟骨小而靈活,能在肌肉牽引下轉(zhuǎn)動(dòng),使聲帶拉緊或放松,閉合或打開(kāi)。 聲帶中間的空隙叫聲門(mén),聲門(mén)有四種常見(jiàn)狀態(tài),語(yǔ)音的生理屬性發(fā)音器官 發(fā)音器官可分三部分。 2 喉頭和聲帶 聲帶中間的空隙叫聲門(mén),聲門(mén)有四種常見(jiàn)狀態(tài),正常呼吸狀態(tài),聲門(mén)敞開(kāi),略呈三角形;深呼吸狀態(tài),聲門(mén)大開(kāi)呈菱形;耳語(yǔ)狀,聲帶前半閉合后半接近,杓狀軟骨之間形成三角形空隙,叫氣聲門(mén),氣流從這里擦出,基本不觸及聲帶
18、;發(fā)音狀態(tài),杓狀軟骨轉(zhuǎn)動(dòng)向一起合,聲帶也并攏,聲門(mén)關(guān)閉 語(yǔ)音的生理屬性發(fā)音器官發(fā)聲狀態(tài)時(shí)聲門(mén)下的氣流受阻,壓力增加,氣流沖擊聲帶,聲帶被沖開(kāi)又合上,再被沖開(kāi),再合上,這樣不停地開(kāi)閉,形成有節(jié)奏的顫動(dòng)。氣流從聲帶間一噴一噴地沖出來(lái),產(chǎn)生了規(guī)律的周期波,這就是原始的聲帶音。聲帶音只是一種微弱的蜂鳴聲,我們是聽(tīng)不見(jiàn)的,經(jīng)過(guò)咽腔、口腔、鼻腔的共鳴作用放大,我們才聽(tīng)到響亮的樂(lè)音。聲帶的顫動(dòng)是語(yǔ)音中樂(lè)音成分的聲源。語(yǔ)音的生理屬性發(fā)音器官聲帶還同語(yǔ)音的高低有密切關(guān)系。杓狀軟骨的轉(zhuǎn)動(dòng)可以調(diào)節(jié)聲帶的松緊,聲帶繃緊時(shí)和放松時(shí)顫動(dòng)的頻率是不一樣的,發(fā)出的聲音高低也不一樣。漢語(yǔ)中聲調(diào)的高低升降變化,就是通過(guò)控制聲帶松
19、緊來(lái)實(shí)現(xiàn)的。語(yǔ)音的生理屬性發(fā)音器官3 口腔、鼻腔、咽腔 這一部分器官既是聲帶音的共鳴器,又是語(yǔ)音中噪音成分的聲源。 喉頭到小舌之間的條狀空間就是咽腔,這是人類(lèi)特有的。一般動(dòng)物的聲門(mén)位置很高,聲門(mén)與口腔間幾乎沒(méi)有空腔。人的聲門(mén)位置較低,喉頭和口腔間距離拉長(zhǎng),形成了咽腔。有了它,舌頭和軟腭有了充分的活動(dòng)空間,可以做出靈活多變的動(dòng)作,發(fā)出動(dòng)物發(fā)不出的復(fù)雜聲音。同時(shí)它還是口腔的延伸,是整個(gè)共鳴器的一部分。語(yǔ)音的生理屬性發(fā)音器官口腔是發(fā)音器官中活動(dòng)最復(fù)雜的部分,除牙齒、牙齦、硬腭外,其余部位都可以活動(dòng)。雙唇可做出開(kāi)閉攏放各種動(dòng)作,下唇還可以收回同上齒接觸。上腭后半部分的軟腭與小舌可以上升或下垂,它們的主
20、要作用是改變氣流方向。它們上升時(shí),小舌抵住咽壁,擋住鼻腔通道,氣流進(jìn)入口腔;下垂時(shí),鼻腔通道打開(kāi),氣流可進(jìn)入鼻腔。 語(yǔ)音的生理屬性發(fā)音器官舌頭是口腔中最活躍的部件,它柔軟而靈活,不僅整個(gè)舌頭可以前后上下移動(dòng),它的各部分(舌尖、舌面、舌根)都可以獨(dú)立活動(dòng)。舌頭多變的動(dòng)作是口腔形狀能出現(xiàn)豐富變化的重要條件。鼻腔不像口腔那樣可以變動(dòng),它是個(gè)形狀固定的共鳴腔,但當(dāng)它與口腔連通時(shí),口腔動(dòng)作的改變也可以發(fā)出不同的鼻音。語(yǔ)音的生理屬性發(fā)音器官這部分器官通過(guò)復(fù)雜的動(dòng)作不斷改變共鳴腔的形狀,用不同的共振把原始的聲帶音變成了我們聽(tīng)見(jiàn)的各種聲音??谇贿€有一部分動(dòng)作是由某些部位靠近或閉合,阻擋了氣流,氣流必須發(fā)力沖破
21、阻擋或從窄小的通道擠過(guò)去,才能到達(dá)口鼻腔外。在打通通道的同時(shí),氣流就沖擊了阻擋它的部位,產(chǎn)生出不規(guī)則振動(dòng)的噪聲波。這也就是語(yǔ)音中許多輔音的來(lái)源。語(yǔ)音處理研究的基本內(nèi)容說(shuō)的是什么內(nèi)容?是誰(shuí)在說(shuō)話(huà)?計(jì)算機(jī)去說(shuō)話(huà)?怎么把話(huà)說(shuō)好?語(yǔ)音識(shí)別聲紋識(shí)別文語(yǔ)轉(zhuǎn)換說(shuō)話(huà)水平評(píng)估說(shuō)的是什么語(yǔ)言?語(yǔ)種識(shí)別語(yǔ)音信號(hào)處理的內(nèi)容介紹一下語(yǔ)音學(xué)的基本知識(shí)語(yǔ)音產(chǎn)生模型清音、濁音的產(chǎn)生機(jī)理及特性語(yǔ)音的短時(shí)分析特性同態(tài)分析和線(xiàn)性預(yù)測(cè)分析目的:求得一組可以逼近聲道的特征矢量和相應(yīng)的激勵(lì)信號(hào)序列話(huà)音編譯碼器A/D話(huà)音編碼信道編碼信道信道譯碼話(huà)音譯碼D/A語(yǔ)音合成(Text To Speech)定義:語(yǔ)音合成技術(shù)是指將文本信息轉(zhuǎn)換為語(yǔ)音
22、數(shù)據(jù),然后以語(yǔ)音的方式播放出來(lái)語(yǔ)音合成的應(yīng)用:電話(huà)查詢(xún)業(yè)務(wù)、語(yǔ)音信箱、語(yǔ)音聊天室,公共汽車(chē)或電車(chē)的自動(dòng)報(bào)站等語(yǔ)音合成與傳統(tǒng)的數(shù)字錄音技術(shù)不同數(shù)字錄音技術(shù)需要人工錄音,語(yǔ)音合成可以利用有限的系統(tǒng)資源將大量的、無(wú)限的文本信息轉(zhuǎn)換為語(yǔ)音。就工作量而言,錄音需要大量的人力,語(yǔ)音合成的大部分工作由計(jì)算機(jī)完成,只需要給出文本信息即可語(yǔ)音合成與傳統(tǒng)的數(shù)字錄音技術(shù)不同對(duì)于一些動(dòng)態(tài)特別是要求實(shí)時(shí)性的信息,語(yǔ)音合成能夠進(jìn)行實(shí)時(shí)轉(zhuǎn)換錄音信息的存儲(chǔ)、查詢(xún)、維護(hù)、修改不如語(yǔ)音合成方便。語(yǔ)音識(shí)別(Automatic Speech Recognition)定義:語(yǔ)音識(shí)別是指將人們說(shuō)話(huà)的語(yǔ)音信號(hào)轉(zhuǎn)換為可以被計(jì)算機(jī)程序識(shí)別的文
23、字信息,從而識(shí)別說(shuō)話(huà)人的語(yǔ)音指令以及文字內(nèi)容應(yīng)用:自動(dòng)訂票系統(tǒng),電話(huà)查詢(xún)等語(yǔ)音識(shí)別的過(guò)程計(jì)算機(jī)語(yǔ)音識(shí)別的目的是讓計(jì)算機(jī)能夠聽(tīng)懂人的話(huà)語(yǔ)音識(shí)別實(shí)際上是一個(gè)模式識(shí)別匹配的過(guò)程。首先根據(jù)人的語(yǔ)言特征建立語(yǔ)音模型,對(duì)輸入的語(yǔ)音信號(hào)進(jìn)行分析,抽取相應(yīng)的特征,建立所需要的模板,在識(shí)別過(guò)程中,將計(jì)算機(jī)中存放的語(yǔ)音模板與輸入的語(yǔ)音信號(hào)特征進(jìn)行比較。語(yǔ)音識(shí)別的例子英國(guó)的Webflorists網(wǎng)上花站利用互聯(lián)網(wǎng)和語(yǔ)音識(shí)別技術(shù)接收和處理鮮花訂單。北京中科院研究一種將語(yǔ)音識(shí)別技術(shù)應(yīng)用于電視,控制電視的開(kāi)關(guān)和轉(zhuǎn)換頻道說(shuō)話(huà)人識(shí)別技術(shù)(Speaker Recognition)定義:說(shuō)話(huà)人識(shí)別技術(shù)是以話(huà)音對(duì)說(shuō)話(huà)人進(jìn)行區(qū)分,從
24、而進(jìn)行身份鑒別與認(rèn)證的技術(shù),通過(guò)說(shuō)話(huà)人識(shí)別可以利用人本身的生物特征進(jìn)行身份鑒別。應(yīng)用領(lǐng)域:公安部門(mén)進(jìn)行語(yǔ)音驗(yàn)證,為一般的用戶(hù)提供防盜門(mén)開(kāi)啟功能,語(yǔ)音撥號(hào),電話(huà)銀行,電話(huà)購(gòu)物,語(yǔ)音E-mail,信息服務(wù)等說(shuō)話(huà)認(rèn)識(shí)別的基本原理通過(guò)分析人的發(fā)聲和聽(tīng)覺(jué),為每個(gè)人建立一個(gè)數(shù)學(xué)模型,然后由計(jì)算機(jī)對(duì)模型和實(shí)際輸入的語(yǔ)音進(jìn)行精確的匹配,根據(jù)匹配的結(jié)果便人說(shuō)話(huà)人是誰(shuí)。語(yǔ)音的基本單位Phoneme (abstract, smallest)音素:清音,濁音 Morpheme 詞素 Syllable 音節(jié):元音和輔音構(gòu)成;(聲母和韻母) Word 單詞 Phrase 短語(yǔ) Sentence 句子 Paragraph 段落 Topics, Articles, Stories 主題文章 研究的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度文化創(chuàng)意產(chǎn)品采購(gòu)合同變更及版權(quán)協(xié)議3篇
- 二零二五版美團(tuán)騎手薪酬福利及晉升體系合同2篇
- 課題申報(bào)參考:南嶺走廊儺戲服飾文化基因解碼及傳承路徑研究
- 課題申報(bào)參考:慢波睡眠期間無(wú)意識(shí)序列學(xué)習(xí)的神經(jīng)機(jī)制及認(rèn)知調(diào)控
- 2025年度虛擬現(xiàn)實(shí)游戲開(kāi)發(fā)與授權(quán)合同范本4篇
- 2025年度個(gè)人旅游居間代理合同樣本2篇
- 南京市2025年度二手房購(gòu)房合同(含環(huán)保檢測(cè)報(bào)告)4篇
- 2025年度個(gè)人租賃城市中心公寓及家電配置合同3篇
- 2025版南寧高新區(qū)廠(chǎng)房租賃合同及技術(shù)支持服務(wù)協(xié)議4篇
- 2025年度個(gè)人小額信用貸款合同范本7篇
- 綠化養(yǎng)護(hù)難點(diǎn)要點(diǎn)分析及技術(shù)措施
- 2024年河北省高考?xì)v史試卷(含答案解析)
- 車(chē)位款抵扣工程款合同
- 2023年湖北省襄陽(yáng)市中考數(shù)學(xué)真題(原卷版)
- 小學(xué)六年級(jí)數(shù)學(xué)奧數(shù)題100題附答案(完整版)
- 湖南高速鐵路職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試參考試題庫(kù)(含答案)
- 英漢互譯單詞練習(xí)打印紙
- 2023湖北武漢華中科技大學(xué)招聘實(shí)驗(yàn)技術(shù)人員24人筆試參考題庫(kù)(共500題)答案詳解版
- 一氯二氟甲烷安全技術(shù)說(shuō)明書(shū)MSDS
- 母嬰護(hù)理員題庫(kù)
- SWITCH暗黑破壞神3超級(jí)金手指修改 版本號(hào):2.7.6.90885
評(píng)論
0/150
提交評(píng)論