實(shí)用語(yǔ)音情感的特征分析與識(shí)別的研究-_第1頁(yè)
實(shí)用語(yǔ)音情感的特征分析與識(shí)別的研究-_第2頁(yè)
實(shí)用語(yǔ)音情感的特征分析與識(shí)別的研究-_第3頁(yè)
實(shí)用語(yǔ)音情感的特征分析與識(shí)別的研究-_第4頁(yè)
實(shí)用語(yǔ)音情感的特征分析與識(shí)別的研究-_第5頁(yè)
已閱讀5頁(yè),還剩11頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第33卷第1期電子與信息學(xué)報(bào)Vol.33No.1 2011年1月 Journal of Electronics & Information Technology Jan. 2011實(shí)用語(yǔ)音情感的特征分析與識(shí)別的研究黃程韋*趙艷金于寅驊趙力(東南大學(xué)水聲信號(hào)處理教育部重點(diǎn)實(shí)驗(yàn)室南京 210096(徐州師范大學(xué)物理與電子工程學(xué)院徐州 221116摘要:該文針對(duì)語(yǔ)音情感識(shí)別在實(shí)際中的應(yīng)用,研究了煩躁等實(shí)用語(yǔ)音情感的分析與識(shí)別。通過(guò)計(jì)算機(jī)游戲誘發(fā)的方式采集了高自然度的語(yǔ)音情感數(shù)據(jù),提取了74種情感特征,分析了韻律特征、音質(zhì)特征與情感維度之間的關(guān)系,對(duì)煩躁等實(shí)用語(yǔ)音情感的聲學(xué)特征進(jìn)行了評(píng)價(jià)與選擇

2、,提出了針對(duì)實(shí)際應(yīng)用環(huán)境的可拒判的實(shí)用語(yǔ)音情感識(shí)別方法。實(shí)驗(yàn)結(jié)果表明,文中采用的語(yǔ)音情感特征,能較好識(shí)別煩躁等實(shí)用語(yǔ)音情感,平均識(shí)別率達(dá)到75%以上??删芘械膶?shí)用語(yǔ)音情感識(shí)別方法,對(duì)模糊的和未知的情感類別的分類進(jìn)行了合理的決策,在語(yǔ)音情感的實(shí)際應(yīng)用中具有重要的意義。關(guān)鍵詞:語(yǔ)音識(shí)別;實(shí)用語(yǔ)音情感;韻律特征;音質(zhì)特征;拒判方法中圖分類號(hào):TP391.42 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-5896(201101-0112-05 DOI: 10.3724/SP.J.1146.2009.00886A Study on Feature Analysis and Recognition of Prac

3、tical Speech EmotionHuang Cheng-weiZhao YanJin YunYu Yin-huaZhao Li(Key Laboratory of Underwater Acoustic Signal Processing of Ministry of Education, Southeast University,Nanjing 210096, China(School of Physics and Electronics Engineering, Xuzhou Normal University, Xuzhou 221116, ChinaAbstract: Prac

4、tical speech emotions as impatience and happiness are studied especially for evaluation of emotional well-being in real world applications. Induced natural speech emotion data is collected with a computer game, 74 emotion features are extracted, prosody features and voice quality features are analyz

5、ed according to dimensional emotion model, evaluation and selection of acoustic features are carried out for practical emotions in this paper, a method of practical speech emotion classification with rejection decision is proposed for real world occasions. The experiment results show, the speech fea

6、tures analyzed in this paper are suitable for classification of practical speech emotions like impatience and happiness, average recognition rate is above 75%, and the method of emotion classification with rejection decision is necessary for the proper recognition decision of ambiguous or unknown em

7、otion samples, especially for the real world challenges.Key words: Speech recognition; Practical speech emotion; Prosody features; Voice quality features; Rejection decision1引言人類的情緒能力在人們的工作和生活的各個(gè)方面起到了不可或缺的重要作用,近年來(lái)與情緒相關(guān)的研究已成為國(guó)際上多個(gè)學(xué)科的研究熱點(diǎn)13。情緒狀態(tài)的自動(dòng)評(píng)估具有重要的實(shí)際意義,特別是在航空航天等軍事應(yīng)用領(lǐng)域中,長(zhǎng)時(shí)間的、枯燥的、高強(qiáng)度的任務(wù)會(huì)使相關(guān)人員面臨嚴(yán)酷

8、的生理以及心理考驗(yàn),引發(fā)一些負(fù)面的情緒。目前國(guó)內(nèi)外對(duì)情感2009-06-16收到,2010-10-19改回國(guó)家自然科學(xué)基金(60472058,60975017,51075068和江蘇省自然科學(xué)基金(BK2008291資助課題*通信作者:黃程韋 Chengwei.Huang 識(shí)別的研究,主要集中在幾類基本情感的識(shí)別上411,尚不能滿足實(shí)際應(yīng)用中的需求。本文針對(duì)實(shí)際應(yīng)用中的需求,重點(diǎn)研究了語(yǔ)音通話中“煩躁”情感的自動(dòng)識(shí)別。在航空航天等應(yīng)用領(lǐng)域,長(zhǎng)時(shí)間的飛行任務(wù)中,由于枯燥的重復(fù)性作業(yè)、狹小的機(jī)艙空間、以及高度緊張的精神狀態(tài),都容易引發(fā)機(jī)組人員的煩躁情緒。煩躁情緒出現(xiàn)后,如果不妥善的處理,對(duì)人員的工

9、作能力會(huì)造成重大的影響,甚至引起人為的疏忽導(dǎo)致事故。因此,對(duì)煩躁情感的自動(dòng)識(shí)別研究具有重要的實(shí)際意義。實(shí)際應(yīng)用當(dāng)中對(duì)語(yǔ)音情感識(shí)別技術(shù)提出了諸多挑戰(zhàn)。以往基于表演語(yǔ)料的識(shí)別系統(tǒng),在實(shí)際條件第1期黃程韋等:實(shí)用語(yǔ)音情感的特征分析與識(shí)別的研究113下,系統(tǒng)的情感模型與真實(shí)的情感數(shù)據(jù)不能符合得很好,導(dǎo)致了識(shí)別正確率的顯著下降。在本文中,我們將通過(guò)心理學(xué)實(shí)驗(yàn)的方法來(lái)采集實(shí)用語(yǔ)音情感的誘發(fā)數(shù)據(jù),盡可能地使訓(xùn)練數(shù)據(jù)接近真實(shí)的情感數(shù)據(jù)。在實(shí)際環(huán)境中出現(xiàn)的情感具有模糊性和多樣性,在實(shí)用語(yǔ)音情感的識(shí)別中,有必要考慮可拒判的識(shí)別方法。傳統(tǒng)的識(shí)別方法,是將出現(xiàn)的樣本硬性地劃分為已知類別中的某一類,在實(shí)際中存在較多模糊

10、不清的情感樣本時(shí),分類的可信度就較差,誤判的概率就較高。因此本文采用可拒判的實(shí)用語(yǔ)音情感識(shí)別方法,對(duì)于不確定的或未知的情感樣本,分類器給出拒絕判斷的識(shí)別結(jié)果,即不屬于需要檢測(cè)的實(shí)用語(yǔ)音情感類別中的任何一類。2實(shí)用語(yǔ)音情感的誘發(fā)根據(jù)Scherer的觀點(diǎn)5,人類聲音中蘊(yùn)含的情感信息,受到無(wú)意識(shí)的心理狀態(tài)變化的影響,以及社會(huì)文化導(dǎo)致的有意識(shí)的說(shuō)話習(xí)慣的控制。然而在目前的語(yǔ)音情感數(shù)據(jù)的采集中,廣泛使用的是表演的方式,在實(shí)際的語(yǔ)音通話和自然交談中,說(shuō)話人的情感對(duì)語(yǔ)音產(chǎn)生的影響,常常是不受說(shuō)話人控制的,通常也不服務(wù)于有意識(shí)的交流目的11,而是反映了說(shuō)話人潛在的心理狀態(tài)的變化。相反,演員能通過(guò)刻意的控制聲音

11、的變化來(lái)表演所需要的情感。為了能更好地研究實(shí)際環(huán)境中的情感語(yǔ)音,有必要采集除表演語(yǔ)音以外的,較高自然度的情感數(shù)據(jù),在本文中,通過(guò)計(jì)算機(jī)游戲誘發(fā)情感的方法11,12來(lái)采集實(shí)用語(yǔ)音情感數(shù)據(jù)。在實(shí)驗(yàn)心理學(xué)中,計(jì)算機(jī)游戲通過(guò)畫面和音樂(lè)的視覺(jué)、聽(tīng)覺(jué)刺激,能提供一個(gè)互動(dòng)的、具有較強(qiáng)感染力的人機(jī)交互環(huán)境,能夠有效地誘發(fā)出被試人員的正面與負(fù)面的情感。特別是在游戲接連勝利時(shí),被試人員由于在游戲虛擬場(chǎng)景中的成功與滿足,被誘發(fā)出喜悅的情感;在游戲連續(xù)失敗時(shí),被試人員在虛擬場(chǎng)景中受到挫折,容易引發(fā)包括煩躁在內(nèi)的負(fù)面情感。在進(jìn)行較長(zhǎng)時(shí)間的實(shí)驗(yàn)過(guò)程中,重復(fù)性的游戲操作和失敗,能順利地誘發(fā)煩躁情感。對(duì)于語(yǔ)句文本的設(shè)計(jì),考慮

12、到煩躁等實(shí)用語(yǔ)音情感識(shí)別的一個(gè)主要應(yīng)用領(lǐng)域?yàn)殚L(zhǎng)期的航空、航天和航海任務(wù)所引發(fā)的負(fù)面情緒的評(píng)估,20句無(wú)情感傾向性的工作用語(yǔ)短句選自國(guó)際海事組織(IMO發(fā)布的標(biāo)準(zhǔn)航海通信用語(yǔ)(SMCP。3情感語(yǔ)音的特征分析3.1特征提取情感特征的優(yōu)劣對(duì)情感最終識(shí)別效果的好壞有非常重要的影響,如何提取和選擇能反映情感變化的語(yǔ)音特征,是目前語(yǔ)音情感識(shí)別領(lǐng)域最重要的問(wèn)題之一13,14。近年來(lái),Johnstone等人11,12的研究證明語(yǔ)音信號(hào)中的音質(zhì)特征,不僅與情感的“效價(jià)維”關(guān)系密切,而且也能夠部分反映3維維度模型中的“控制維”的信息。用于識(shí)別和建模的特征向量一般有兩種構(gòu)造方法,全局統(tǒng)計(jì)特征和動(dòng)態(tài)特征。由于動(dòng)態(tài)特征

13、對(duì)音位信息的依賴性太強(qiáng),不利于建立與文本無(wú)關(guān)的情感識(shí)別系統(tǒng),因此在本文中使用了74個(gè)全局統(tǒng)計(jì)特征,在下面列出,其中前36個(gè)特征為韻律特征,后38個(gè)特征為音質(zhì)特征。特征1-10:短時(shí)能量及其差分的均值、最大值、最小值、中值、方差;特征11-25:基音及其一階、二階差分的均值、最大值、最小值、中值、方差;特征26:基音范圍;特征27-36:發(fā)音幀數(shù)、不發(fā)音幀數(shù)、不發(fā)音幀數(shù)和發(fā)音幀數(shù)之比、發(fā)音幀數(shù)和總幀數(shù)之比、發(fā)音區(qū)域數(shù)、不發(fā)音區(qū)域數(shù)、發(fā)音區(qū)域數(shù)和不發(fā)音區(qū)域數(shù)之比、發(fā)音區(qū)域數(shù)和總區(qū)域數(shù)之比、最長(zhǎng)發(fā)音區(qū)域數(shù)、最長(zhǎng)不發(fā)音區(qū)域數(shù);特征37-66:第1、第2、第3共振峰及其一階差分的均值、最大值、最小值、中

14、值、方差;特征67-69:250 Hz以下譜能量百分比、650 Hz 以下譜能量百分比、4 kHz以上譜能量百分比。特征70-74:諧波噪聲比(HNR的均值、最大值、最小值、中值、方差。其中諧波噪聲比用來(lái)做為反映情感變化的音質(zhì)特征15。負(fù)面與正面的情緒往往在愉悅度上具有較大的差異,因而與情感的愉悅度關(guān)系密切的音質(zhì)特征對(duì)識(shí)別實(shí)用語(yǔ)音情感具有重要的價(jià)值。3.2 基于情感維度空間模型的特征分析根據(jù)文獻(xiàn)11,12,14的研究結(jié)果,韻律特征主要和激活度的相關(guān)性較大,音質(zhì)特征與愉悅度的相關(guān)性較大。我們使用PCA方法分別進(jìn)行愉悅度和激活度上的特征空間分析,截取PCA的前兩個(gè)維度構(gòu)成2維特征空間,圖1為韻律特

15、征構(gòu)成的2維PCA空間,圖2為音質(zhì)特征構(gòu)成的2維PCA空間??梢钥吹?在僅使用韻律特征時(shí),平靜和其余兩種情感能較好的區(qū)分開(kāi)來(lái)。然而煩躁和喜悅兩種情感,在激活度上差別相對(duì)較小,在僅使用韻律特征時(shí),兩種情感的樣本分布區(qū)域重疊的較多。這與韻律特征主要和激活維對(duì)應(yīng)的理論是一致的。使用音質(zhì)特征后,煩躁和喜悅的樣本之間能夠獲得較好的區(qū)分,音質(zhì)特征的使用對(duì)區(qū)分煩躁和喜悅兩種愉悅度上距離大的情感是有效的,說(shuō)明音質(zhì)特征與愉悅度的相關(guān)性較大。綜合使用74個(gè)韻律特征和音質(zhì)特征,如圖3所示,煩躁、喜悅和平靜3種情感的樣本分布得到了較好的區(qū)分。114 電 子 與 信 息 學(xué) 報(bào) 第33卷 圖1韻律特征空間中的樣本分布

16、圖2音質(zhì)特征空間中的樣本分布 圖3韻律與音質(zhì)特征空間中的樣本分布3.3 實(shí)用語(yǔ)音情感的特征評(píng)價(jià)與特征選擇情感特征的選擇一直是語(yǔ)音情感識(shí)別中最受重視的問(wèn)題之一,對(duì)一個(gè)特征的優(yōu)劣的評(píng)價(jià),我們考慮兩個(gè)方面:特征的均值,以及特征的方差。綜合考慮這兩個(gè)方面的因素,采用fisher 準(zhǔn)則進(jìn)行特征評(píng)價(jià)16,17。對(duì)煩躁、喜悅、平靜3種情感選擇出的前10個(gè)最佳特征如表1所示。表1 前10個(gè)最佳特征重要程度排序特征1 250 Hz 以下譜能量的百分比2 基音一階差分的均值3 基音的均值4 第1共振峰的中值5 第1共振峰的最小值6 短時(shí)能量的方差7 第2共振峰的均值8 發(fā)音幀數(shù)和總幀數(shù)之比 9諧波噪聲比均值10

17、650 Hz 以下譜能量的百分比4 可拒判的實(shí)用語(yǔ)音情感識(shí)別方法情感樣本在特征空間里的分布,可以用多個(gè)高斯函數(shù)的疊加來(lái)描述。理論上來(lái)說(shuō),只要混合足夠的高斯分量,高斯混合模型(GMM能夠擬合任意的概率密度分布函數(shù)。本文采用GMM 對(duì)煩躁、喜悅和平靜3種情感進(jìn)行建模,每種情感對(duì)應(yīng)一個(gè)GMM 模型,通過(guò)最大后驗(yàn)概率準(zhǔn)則判決。i x 表示第i 條語(yǔ)句樣本,j 表示情感類別,最大后驗(yàn)概率可以表示為(i j j i j i p x P p x P x = (1其中(|i j p x 通過(guò)每個(gè)情感的GMM 模型得到。對(duì)于給定的語(yǔ)句樣本,特征矢量出現(xiàn)的概率是一個(gè)常量,假設(shè)每種情感等概率地出現(xiàn),C 為情感類別數(shù)

18、。1(,1j P i C C= (2那么,待識(shí)別的樣本可以判決為*arg max (i j jj p x = (3其中*j 表示樣本所屬的類別。針對(duì)實(shí)際環(huán)境下情感的模糊與不確定性,實(shí)用語(yǔ)音情感種類的多樣性,有必要研究可以拒判的識(shí)別實(shí)用語(yǔ)音情感方法。下面將采用一種基于似然概率模糊熵的拒判方法,采用模糊熵來(lái)對(duì)樣本與情感類別之間的符合程度進(jìn)行度量,從而實(shí)現(xiàn)對(duì)未知類別樣本的拒判。待識(shí)別的樣本到達(dá)時(shí),分別通過(guò)C 種情感的GMM 模型,得到C 個(gè)GMM 似然概率密度值,以GMM 似然概率密度值映射到0到1之間作為第i 個(gè)樣本歸屬于第j 個(gè)情感類別的隸屬度(j i x :(arctan (/10(=/2i

19、j j i p x x (4其中采用的投影函數(shù)為(arctan /10=/2x y (5對(duì)于第j 個(gè)情感類別的所有可能的樣本構(gòu)成的模糊集12,j n E x x x =",其隸屬度分別為1(,j x 2(,(j j n x x ",令其模糊熵為(j i e x ,類似于隨機(jī)熵的證明,可以得到模糊熵的表達(dá)式為18(ln (j i j i e x K x = (6 其中K 是大于0的數(shù)。將式(4代入式(6得,第i 個(gè)樣本歸屬于第j 個(gè)情感類別的模糊熵為(ln arctan (|/10ln /2j i i j e x K p x =(7對(duì)第i 個(gè)待識(shí)別樣本的C 個(gè)似然概率值構(gòu)成的

20、判決集合的平均模糊熵評(píng)價(jià)為(j 11(Ci i j i j S x x e x C = (8將式(7代入式(8有第1期 黃程韋等:實(shí)用語(yǔ)音情感的特征分析與識(shí)別的研究 115(12arctan (/10 ln arctan (/10ln /2Ci i j j i j KS x p x Cp x = (9對(duì)煩躁、喜悅和平靜3種情感類別的GMM 模型,可以得到3個(gè)GMM 似然概率密度值,分別代表樣本與3個(gè)情感類別的符合程度。似然概率密度值構(gòu)成的判決集合的模糊熵越高表示樣本屬于煩躁、喜悅和平靜3種情感的不確定程度越大,當(dāng)模糊熵超過(guò)一定閾值Th 時(shí)則發(fā)生拒判,常數(shù)K 取/2。(Th i S x >

21、 (10將式(9代入式(10,即(11arctan (/10 ln /2ln arctan (/10Th Ci j j i j p x Cp x => (11其中Th 為實(shí)驗(yàn)中確定的模糊熵閾值。閾值的選取既要保證待識(shí)別的目標(biāo)情感類別得到正確的識(shí)別,又要兼顧未知的樣本不確定的情感得到拒判。5 實(shí)驗(yàn)測(cè)試結(jié)果進(jìn)行與說(shuō)話人無(wú)關(guān)文本無(wú)關(guān)的情感識(shí)別測(cè)試,每種情感隨機(jī)抽取400條,分為兩組,一組300條樣本,進(jìn)行GMM 情感模型的訓(xùn)練,3種情感共計(jì)900條,另一組100條樣本,用于測(cè)試識(shí)別率,3種情感共計(jì)300條。在誘發(fā)語(yǔ)音庫(kù)的原始語(yǔ)音中,通過(guò)聽(tīng)辨實(shí)驗(yàn)被剔除的情感語(yǔ)句共有479條,這些語(yǔ)句被認(rèn)為是情感

22、隸屬度較低的數(shù)據(jù),選取其中隸屬度最低的100條,作為不確定的未知情感類別樣本,用于拒判測(cè)試。分別采用PCA 方法的前10個(gè)特征維度和最佳特征組選擇方法的前10個(gè)最佳特征,使用可拒判的實(shí)用語(yǔ)音情感識(shí)別方法,對(duì)煩躁、喜悅和平靜3種情感的識(shí)別率進(jìn)行測(cè)試。模糊熵閾值的設(shè)置關(guān)系到樣本的拒判,設(shè)定得過(guò)低,則對(duì)不確定樣本的拒判效果不明顯。設(shè)定得過(guò)高,則拒判的過(guò)多,會(huì)使得系統(tǒng)平均識(shí)別率降低。當(dāng)部分樣本離已知的情感模型距離較遠(yuǎn)時(shí)需要拒判,同時(shí)拒判也會(huì)使得某些測(cè)試樣本不能得到正確識(shí)別。所以應(yīng)該在保證煩躁、喜悅、平靜等3個(gè)類別能夠獲得滿意的識(shí)別率的前提下,調(diào)節(jié)模糊熵閾值。當(dāng)平均識(shí)別率發(fā)生明顯的下降時(shí),此時(shí)的閾值為上

23、限,實(shí)驗(yàn)中模糊熵閾值設(shè)為0.1。本實(shí)驗(yàn)中的訓(xùn)練樣本數(shù)與測(cè)試樣本數(shù)比例為3:1,為了獲得更充分的實(shí)驗(yàn)測(cè)試數(shù)據(jù),將訓(xùn)練樣本集中的900條樣本隨機(jī)等分成3份后,與測(cè)試樣本集中的300條樣本輪換,進(jìn)行輪換測(cè)試。平均測(cè)試識(shí)別結(jié)果如表2和表3所示。表2 PCA 方法識(shí)別結(jié)果識(shí)別結(jié)果(% 測(cè)試樣本煩躁喜悅平靜拒判煩躁 74.5 6.25 12.25 7.0 喜悅 8.571.7515.25 4.5平靜 7.75 5.5 83.53.25不確定樣本4.75 15.25 21.5 58.5表3 最佳特征組識(shí)別結(jié)果識(shí)別結(jié)果(% 測(cè)試樣本煩躁喜悅平靜拒判煩躁 75.25 8.75 10.0 6.0 喜悅 7.570

24、.2516.5 5.75平靜7.5 6.7581.5 4.25不確定樣本 12.75 15.25 11.75 60.25根據(jù)識(shí)別測(cè)試結(jié)果,煩躁、喜悅和平靜3種情感,在本實(shí)驗(yàn)中容易發(fā)生混淆的是煩躁和平靜,喜悅和平靜。在情感的維度空間模型中喜悅與煩躁位于愉悅度的兩端,差別較大,而平靜位于它們之間,因此相對(duì)來(lái)說(shuō)喜悅?cè)菀着c平靜混淆,煩躁容易與平靜混淆。從特征空間中的樣本分布情況來(lái)看,平靜類別的樣本分布明顯要比煩躁和喜悅的樣本分布更為集中,平靜情感的樣本具有較高的一致性,因此其識(shí)別率較煩躁和喜悅高。6 結(jié)論為進(jìn)行煩躁、喜悅和平靜等實(shí)用語(yǔ)音情感的識(shí)別,本文提取了74個(gè)語(yǔ)音情感特征,平均識(shí)別率達(dá)到75%以上

25、,證實(shí)了本文中的情感特征用于識(shí)別煩躁等實(shí)用語(yǔ)音情感是有效的。通過(guò)PCA 方法進(jìn)行了基于情感維度空間的特征分析,結(jié)果顯示韻律特征與激活度相關(guān)性較大,音質(zhì)特征與愉悅度的相關(guān)性較大。通過(guò)fisher 判別準(zhǔn)則,對(duì)情感特征進(jìn)行了評(píng)價(jià),結(jié)果顯示表1中的10個(gè)特征能較好區(qū)分煩躁等實(shí)用語(yǔ)音情感。基于似然概率模糊熵的可拒判的實(shí)用語(yǔ)音情感識(shí)別方法,能對(duì)模糊和未知的情感類別的分類進(jìn)行合理的決策,可拒判識(shí)別方法在語(yǔ)音情感的實(shí)際應(yīng)用中是必要的。參 考 文 獻(xiàn)1 Spellman B A and Willingham D T. Current Directions in Cognitive Science. Bosto

26、n: Allyn & Bacon, 2007: 1-3. 2 Picard R W. Affective Computing. Cambridge: MIT Press, 1997, Chapter 6.3Vinciarelli A, Pantic M, Bourlard H, and Pentland A. Social116 電子與信息學(xué)報(bào)第33卷signal processing: survey of an emerging domain. ImageVision Computing, 2009, 27(12: 1743-1759.4Cowie R, Douglas-Cowie

27、E, Tsapatsoulis N, Votsis G, KolliasS, Fellenz W, and Taylor J G. Emotion recognition inhuman-computer interaction. IEEE Signal Processing Magazine, 2001, 18(1: 32-80.5Scherer K R. Vocal communication of emotion: a review ofresearch paradigms. Speech Communication, 2003, 40(1/2:227-256.6Zeng Z, Pant

28、ic M, Roisman G I, and Huang T. A survey ofaffect recognition methods: audio, visual and spontaneousexpressions. IEEE Transactions on Pattern Analysis andMachine Intelligence, 2009, 31(1: 39-58.7Casale S, Russo A, Scebba G, and Serrano S. Speech emotionclassification using machine learning algorithm

29、s. 2008 IEEEInternational Conference on Semantic Computing. SantaClara, CA, USA, Aug. 4-7, 2008: 158-165.8Zhao Yan, Zhao Li, Zou Cai-rong, and Yu Yin-hua. Speechemotion recognition using modified quadratic discriminatioinfunction. Journal of Electronics(China, 2008, 25(6: 840-844.9韓文靜, 李海峰, 韓紀(jì)慶. 基于長(zhǎng)

30、短時(shí)特征融合的語(yǔ)音情感識(shí)別方法. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版, 2008, 48(S1: 708-714.Han Wen-jing, Li Hai-feng, and Han Ji-qing. Speech emotionrecognition with combined short and long term features.Journal of Tsinghua University (Science and Technology,2008, 48(S1: 708-714.10Pao Tsang-long, Chen Yu-te, and Yeh Jun-heng. Emotionreco

31、gnition and evaluation from mandarin speech signals.International Journal of Innovative Computing, Informationand Control, 2008, 4(7: 1695-1709.11Johnstone T. Emotional speech elicited using computergames. Fourth International Conference on Spoken Language,Philadelphia, PA, USA, 1996, Vol. 3: 1985-1988.12Johnstone T, Van Reekum C M, hird K, and Kirsner K, et al.Affective speech elicited with a computer game. Emotion,2005, 5(4: 513-518.13王治平,趙力,鄒采榮. 基于基音參數(shù)規(guī)整及統(tǒng)計(jì)分布模型距離的語(yǔ)音情感識(shí)別. 聲學(xué)學(xué)報(bào),2006, 31(1: 28-34.Wang Zhi-ping, Zhao Li, and Zou Cai-rong. Emotion speech recognition based

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論