




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第5節(jié)體驗(yàn)語(yǔ)音合成
與人臉識(shí)別技術(shù)2.使用訊飛留音生成個(gè)人聲庫(kù)學(xué)習(xí)任務(wù)1.掌握語(yǔ)音合成技術(shù)和人臉識(shí)別技術(shù)的原理3.使用百度人工智能服務(wù)平臺(tái)進(jìn)行人臉識(shí)別分析新課導(dǎo)入上節(jié)課我們了解了各種類型的人工智能技術(shù),我想考考同學(xué)們,讓人工智能實(shí)現(xiàn)“看懂”和“聽(tīng)懂”的分別是什么技術(shù)?這兩種技術(shù)分別有什么應(yīng)用?一、體驗(yàn)并探究語(yǔ)音合成技術(shù)1.體驗(yàn)文本轉(zhuǎn)換為語(yǔ)音的技術(shù)訊飛有聲粘貼文本當(dāng)前主播正在播放的文本播放功能一、體驗(yàn)并探究語(yǔ)音合成技術(shù)1.體驗(yàn)文本轉(zhuǎn)換為語(yǔ)音的技術(shù)(1)更換主播后,聲音播放的具體內(nèi)容是否發(fā)生了變化?(2)更換主播操作究竟改變了什么?(3)從文字的錄入到語(yǔ)音播出,你認(rèn)為經(jīng)歷了哪些過(guò)程?一、體驗(yàn)并探究語(yǔ)音合成技術(shù)2.了解語(yǔ)音合成技術(shù)的主要過(guò)程將文字信息轉(zhuǎn)換為流利的可聽(tīng)懂的口語(yǔ)輸出技術(shù),稱為語(yǔ)音合成。這是一項(xiàng)綜合技術(shù),不僅需要計(jì)算機(jī)理解信息含義,保證信息正常輸出,還需要利用聲學(xué)相關(guān)知識(shí),使內(nèi)容可以轉(zhuǎn)換成恰當(dāng)?shù)穆晫W(xué)模型進(jìn)行語(yǔ)音輸出。一、體驗(yàn)并探究語(yǔ)音合成技術(shù)2.了解語(yǔ)音合成技術(shù)的主要過(guò)程(1)理解文本信息的含義在語(yǔ)言學(xué)家和計(jì)算機(jī)科學(xué)家的共同努力下,將文本中的語(yǔ)法規(guī)則轉(zhuǎn)化成相應(yīng)的程序輸入計(jì)算機(jī)中,系統(tǒng)根據(jù)相應(yīng)算法,為文本進(jìn)行斷句,準(zhǔn)確獲取文本需要表達(dá)的內(nèi)容,這是文本分析的過(guò)程。一、體驗(yàn)并探究語(yǔ)音合成技術(shù)2.了解語(yǔ)音合成技術(shù)的主要過(guò)程(2)韻律處理在理解文本的內(nèi)容后,通常需要考慮在讀取這段文本時(shí)使用的節(jié)奏、時(shí)長(zhǎng)、頻率等,從而使計(jì)算機(jī)的發(fā)音更接近于人類說(shuō)話的聲音。一、體驗(yàn)并探究語(yǔ)音合成技術(shù)2.了解語(yǔ)音合成技術(shù)的主要過(guò)程(3)創(chuàng)建聲學(xué)模型模擬發(fā)音這個(gè)過(guò)程類似我們模仿他人聲音,需要考慮語(yǔ)種、音色、響度、音調(diào)等。計(jì)算機(jī)模擬的方法是在原始的語(yǔ)音庫(kù)中提取相關(guān)的聲音信息,采用單元合成與拼接技術(shù)將信息進(jìn)行拼接,從而達(dá)到模擬發(fā)聲的效果。一、體驗(yàn)并探究語(yǔ)音合成技術(shù)3.模擬自己的聲音(1)明確任務(wù)了解了語(yǔ)音合成技術(shù)的原理,同學(xué)們想不想讓程序模擬你自己的聲音呢?接下來(lái)我們利用“訊飛留聲”程序復(fù)刻自己的聲音,然后讓機(jī)器模仿自己的聲音,進(jìn)行一段雙語(yǔ)朗誦。一、體驗(yàn)并探究語(yǔ)音合成技術(shù)3.模擬自己的聲音(2)解決問(wèn)題要點(diǎn)分析計(jì)算機(jī)完成對(duì)人類聲音的模仿,有以下兩個(gè)關(guān)鍵內(nèi)容:第一,形成個(gè)人的聲音庫(kù),為計(jì)算機(jī)提供聲學(xué)模型。通過(guò)形成個(gè)人的音庫(kù),將具有個(gè)人特色的聲學(xué)信息(音色、音調(diào)、響度等)存儲(chǔ)在其中,使計(jì)算機(jī)能夠提取出相關(guān)數(shù)據(jù)。第二,通過(guò)和個(gè)人音庫(kù)匹配,完成合成。通過(guò)語(yǔ)音合成技術(shù),在識(shí)別文本內(nèi)容的前提下,通過(guò)與個(gè)人音庫(kù)中的信息自匹配,從而使計(jì)算機(jī)可以模仿我們的聲音進(jìn)行輸出。一、體驗(yàn)并探究語(yǔ)音合成技術(shù)3.模擬自己的聲音一、體驗(yàn)并探究語(yǔ)音合成技術(shù)3.模擬自己的聲音第一步,關(guān)注微信公眾號(hào)“訊飛留聲”,選擇“復(fù)刻聲音”,進(jìn)入程序。單擊“去復(fù)刻我的聲音”按鈕,開(kāi)始進(jìn)入工作狀態(tài)。一、體驗(yàn)并探究語(yǔ)音合成技術(shù)3.模擬自己的聲音錄制停止第二步,根據(jù)要求,朗讀10段文字,按“話筒鍵”開(kāi)始,“停止鍵”結(jié)束。注意錄制時(shí)聲音要清晰,內(nèi)容要準(zhǔn)確。在朗讀文字過(guò)程中,采用的是語(yǔ)音識(shí)別技術(shù),對(duì)我們讀取的語(yǔ)音進(jìn)行識(shí)別,并和提供的文字進(jìn)行對(duì)比。錄制聲音完成后,系統(tǒng)會(huì)自動(dòng)制作并生成個(gè)人音庫(kù)。一、體驗(yàn)并探究語(yǔ)音合成技術(shù)3.模擬自己的聲音第三步,在“訊飛留聲”的“聲音應(yīng)用一玩轉(zhuǎn)好聲音”應(yīng)用中,選擇“我是歪果仁”選項(xiàng)卡,選定任意一條文本,選擇個(gè)人音庫(kù)進(jìn)行雙語(yǔ)朗誦,聽(tīng)取合成聲音,也可以將聲音分享到微信群中。一、體驗(yàn)并探究語(yǔ)音合成技術(shù)3.模擬自己的聲音(4)效果評(píng)價(jià)將生成的聲音分享到微信群,同學(xué)們互相傾聽(tīng)、評(píng)價(jià),填寫(xiě)下表。聲音是否流程聲音是否清晰發(fā)音是否自然和個(gè)人發(fā)音是否相似二、體驗(yàn)并探究人臉識(shí)別技術(shù)1.體驗(yàn)身邊的人臉識(shí)別技術(shù)(1)體驗(yàn)人臉識(shí)別①神奇的美顏拍攝功能很多人在拍照時(shí)喜歡使用美顏功能,有同學(xué)懂美顏功能嗎?你能給大家介紹一款帶有這類功能的智能相機(jī)應(yīng)用嗎?請(qǐng)你當(dāng)小老師指導(dǎo)大家一起體驗(yàn),并思考應(yīng)用程序是如何將相關(guān)裝飾和特效放到人臉各個(gè)部位的。二、體驗(yàn)并探究人臉識(shí)別技術(shù)1.體驗(yàn)身邊的人臉識(shí)別技術(shù)(1)體驗(yàn)人臉識(shí)別②會(huì)分類的智能程序帶有分類功能的智能手機(jī)等設(shè)備,能自動(dòng)識(shí)別照片中的面孔,根據(jù)不同的人像進(jìn)行分類,使每個(gè)人都能得到一個(gè)單獨(dú)的人物相冊(cè);如果是合影,還能自動(dòng)生成“合影”標(biāo)簽。分類功能是人臉識(shí)別的基礎(chǔ),我們熟悉的人臉識(shí)別、人臉解鎖相關(guān)功能都是在此基礎(chǔ)之上的應(yīng)用。二、體驗(yàn)并探究人臉識(shí)別技術(shù)2.了解常用的人臉識(shí)別技術(shù)(1)人臉檢測(cè)檢測(cè)出圖像的人臉?biāo)谖恢谩S?jì)算機(jī)通過(guò)對(duì)圖像的完整掃描,最終標(biāo)記出人臉的相關(guān)信息。二、體驗(yàn)并探究人臉識(shí)別技術(shù)2.了解常用的人臉識(shí)別技術(shù)(2)人臉配準(zhǔn)人臉配準(zhǔn)是指在人像中準(zhǔn)確定位五官的技術(shù)。通過(guò)人臉配準(zhǔn),計(jì)算機(jī)可以清晰地識(shí)別人臉圖像五官的位置。在計(jì)算機(jī)中,是通過(guò)標(biāo)記一些固定的關(guān)鍵點(diǎn)來(lái)描繪人物的眼鼻口耳。二、體驗(yàn)并探究人臉識(shí)別技術(shù)2.了解常用的人臉識(shí)別技術(shù)(3)人臉特征提取人臉特征提取是指將一張人臉圖像轉(zhuǎn)化為一串固定長(zhǎng)度的數(shù)值的過(guò)程。這些數(shù)值用來(lái)表示人臉的特征,這些特征包含大量的人臉信息。信息包含人臉的固有屬性和動(dòng)態(tài)屬性,固有屬性包括眼睛的大小、嘴巴的形狀、鼻梁的狀態(tài)、臉上是否有痣;動(dòng)態(tài)屬性包括“是否在微笑、歪頭”等信息。這些數(shù)據(jù)是計(jì)算機(jī)人臉識(shí)別工作的基礎(chǔ),也是應(yīng)用的基本保障。二、體驗(yàn)并探究人臉識(shí)別技術(shù)2.了解常用的人臉識(shí)別技術(shù)(4)人臉對(duì)比人臉對(duì)比是指在特征提取的基礎(chǔ)上,對(duì)比兩張圖片特征值的相似程度。通過(guò)相似程度,可以判定兩張圖片中是否包含了同一個(gè)人。這種技術(shù)在人臉解鎖、人臉簽到中被頻繁使用,二、體驗(yàn)并探究人臉識(shí)別技術(shù)3.利用人工智能服務(wù)平臺(tái)體驗(yàn)人臉識(shí)別技術(shù)(1)體驗(yàn)百度人工智能服務(wù)平臺(tái)的人臉識(shí)別功能首先,注冊(cè)百度平臺(tái)的賬號(hào),然后登錄該平臺(tái),通過(guò)網(wǎng)絡(luò)版百度人工智能開(kāi)放平臺(tái)網(wǎng)址或者移動(dòng)終端微信小程序“百度AI體驗(yàn)中心”兩種途徑來(lái)體驗(yàn)人工智能服務(wù)。任選一個(gè)平臺(tái),選取一張人像圖片上傳,可得到相應(yīng)的分析結(jié)果。二、體驗(yàn)并探究人臉識(shí)別技術(shù)3.利用人工智能服務(wù)平臺(tái)體驗(yàn)人臉識(shí)別技術(shù)(2)人臉識(shí)別執(zhí)行過(guò)程分析平臺(tái)是如何從圖像檢測(cè)人臉,并完成最終判定的呢?整個(gè)過(guò)程包括以下步驟:第一步,人臉檢測(cè)與定位。通過(guò)人臉檢測(cè)技術(shù)識(shí)別圖像的人臉區(qū)域,并對(duì)人的五官進(jìn)行準(zhǔn)確定位。第二步,特征提取。通過(guò)特征提取技術(shù),對(duì)圖像信息進(jìn)行數(shù)字化,并用復(fù)雜的數(shù)據(jù)代碼對(duì)圖像進(jìn)行描述。第三步,屬性分類。在得到人臉客觀數(shù)據(jù)的基礎(chǔ)上,通過(guò)“分類器”(可以將分類器理解成一個(gè)標(biāo)準(zhǔn)庫(kù))中提供的大量模型對(duì)人的屬性做出判斷,如人物的年齡、表情、情緒等。二、體驗(yàn)并探究人臉識(shí)別技術(shù)3.利用人工智能服務(wù)平臺(tái)體驗(yàn)人臉識(shí)別技術(shù)第四步,結(jié)果輸出。將判斷的答案進(jìn)行公布。人工智能平臺(tái)對(duì)人臉的識(shí)別過(guò)程和人類對(duì)人臉的識(shí)別存在相似之處,同時(shí)也存在很大不同。具體差別如圖所示。練習(xí)與思考(1
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 25年企業(yè)員工崗前安全培訓(xùn)考試試題帶答案解析
- 2025廠級(jí)職工安全培訓(xùn)考試試題加答案
- 2024-2025工廠車間安全培訓(xùn)考試試題(B卷)
- 2024-2025公司項(xiàng)目部安全培訓(xùn)考試試題附答案(能力提升)
- 民辦學(xué)校青年教師培訓(xùn)與學(xué)習(xí)計(jì)劃
- 2025年生產(chǎn)經(jīng)營(yíng)單位安全培訓(xùn)考試試題含下載答案可打印
- 藝術(shù)教育網(wǎng)絡(luò)研修心得體會(huì)
- 公證委托書(shū)辦理技巧分享3篇
- 房產(chǎn)代辦委托書(shū)的戰(zhàn)略規(guī)劃3篇
- 部編人教版四年級(jí)游學(xué)活動(dòng)總結(jié)
- 2023年中國(guó)少女發(fā)育內(nèi)衣行業(yè)發(fā)展白皮書(shū)
- 再生鋁商業(yè)計(jì)劃書(shū)
- 江蘇省蘇州市2022-2023學(xué)年二年級(jí)下學(xué)期語(yǔ)文期中調(diào)研試卷(含答案)
- 邊緣人格障礙患者辯證行為治療的療效研究
- 化學(xué)期中成績(jī)分析
- 江蘇省期末試題匯編-04-認(rèn)識(shí)圖形(二)(選擇題經(jīng)典常考題)-小學(xué)一年級(jí)數(shù)學(xué)下冊(cè)(蘇教版)
- 人力資源用工風(fēng)險(xiǎn)與防范一本通
- 用友ERPU8生產(chǎn)制造管理
- 產(chǎn)品生命周期管理培訓(xùn)
- 《明代染織工藝》課件
- 《品質(zhì)管理人員培訓(xùn)》課件
評(píng)論
0/150
提交評(píng)論