版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
HMI語音設(shè)計探索-入門篇(一)編輯導(dǎo)語:語音交互是未來的一大趨勢,HMI語音設(shè)計也有其背后的邏輯。這篇文章以介紹語音交互內(nèi)容為基礎(chǔ),并結(jié)合作者的實際工作項目經(jīng)驗,提出了一些想法和思路,一起看看吧。一、前言開頭必須來一句,我相信語音一定是未來,我非常確認。這篇HMI的語言探索以介紹語音交互內(nèi)容為基礎(chǔ),結(jié)合我的實際工作項目經(jīng)驗,輸出總結(jié)關(guān)于語音設(shè)計的內(nèi)容,最后在結(jié)合案例,在對話設(shè)計中會進行深度的探索,并提出個人的想法和思路,因為有的時候深度去思考覺得我們項目還可以有很多優(yōu)化的點。進入我們今天的正題:在說語音交互之前,先給大家講一下題外話,關(guān)于人機交互(HumanComputerInteraction)簡稱HCI,可能日后我想去攻讀這個碩士學(xué)位,簡單來說就是指人與計算機之間通過使用某種對話語言,以一定的交互方式,為完成確定任務(wù)的人與計算機之間的信息交換過程。語音助手最初的載體是手機APP,通過與用戶之間的對話方式,能夠幫助用戶來解決問題的,隨著我們現(xiàn)在人工智能的研發(fā)技術(shù)不斷發(fā)展,包括讓機器學(xué)習(xí),語音識別、圖像識別、自然語言處理、智能搜索等一系列。語音交互運用的很普遍了,不僅僅只是智能手機,現(xiàn)在涉及到的領(lǐng)域是越來越多了,如智能家居、汽車、可穿戴設(shè)備、就連商場普遍也有機器人語音對話。二、HMI語音介紹我這邊就不打算講語音的發(fā)展歷史了,不然又是水了一大堆內(nèi)容,我可是一個講干貨的小作家呢,如果我的小粉絲們需要的話,就私信我,我會在微信公眾號更文。語言是傳遞信息重要方式,對于我們用戶來說,語音交互也是學(xué)習(xí)成本相對較低、容易掌握的,語音交互設(shè)計簡稱為VUI。新能源汽車不斷的發(fā)展,智能車載系統(tǒng)也是我們最看重的。隨著語音交互的的普及,語音識別開始走入人們生活,憑借其實用性和準(zhǔn)確性得到了用戶的認可,因此在發(fā)展的過程中摒棄了傳統(tǒng)的、繁雜的手動操作,提高安全駕駛屬性和更高效的處理問題的能力,但是,在現(xiàn)階段的新能源汽車發(fā)展過程中還不能完全替換掉手動操作?,F(xiàn)在為什么用戶在駕駛車的過程中,還是不會常用到語音交互,首先提到的就是用戶習(xí)慣,根據(jù)數(shù)據(jù)調(diào)查,在使用語音交互的人群中,年輕人占了主力軍,其余年齡段的人由于常年駕駛都是通過硬按鍵來操控車內(nèi)空調(diào)、電話、音樂、電臺、內(nèi)置導(dǎo)航。其實就算是蘋果手機中的siri都很少用到,在使用初期因為技術(shù)的不成熟,再加上冰冷的對話方式使得用戶不對他這個買單,像我現(xiàn)在生活中,用到的siri頻率也會很少,最多就是定一個鬧鐘,app實在找不到就會使用到,還有無聊的時候和他進行無聊的對話,嗯就這樣子。國內(nèi)做語音頭部公司有我們熟悉的科大訊飛,還有和多家車企合作的思必馳、云知聲,對內(nèi)服務(wù)的百度,搜狗,騰訊,阿里這些大咖都有自己的語音技術(shù)。再講一下語音的基礎(chǔ)原理內(nèi)容,這一塊比較難懂一點,首先你要說出你需要解決的需求、要處理什么事情,通過車載系統(tǒng)設(shè)備收到指令的語音、自動語音識別(ASR)、將指令轉(zhuǎn)化為文本、自然語言處理(NLP)、了解用戶需要解決什么問題、通過Skill(普及一下知識:SKill是一個腳本語言運行在cadence的設(shè)計環(huán)境,是cadence設(shè)計工具的API,好了不啰嗦了),將處理好的結(jié)果處理成回復(fù)文本,最后再通過TTS播報形式,形成回復(fù)音頻,通過車載系統(tǒng)回復(fù)給用戶解決結(jié)果,聽起來是不是有點復(fù)雜了,我相信我是全網(wǎng)說的最細的了。如何去定義一個產(chǎn)品的語音的好壞?我覺得吧,能夠讓用戶對于這個語音系統(tǒng)的滿意度達到一個高標(biāo)準(zhǔn),首先能夠讓系統(tǒng)能夠聽懂你所說的內(nèi)容,并且給出相對應(yīng)的解決方案,語音系統(tǒng)運用的簡而易用即可,如何做到以上的要求,我會再下面對話設(shè)計中會著重講解深挖的。如何去定義一個產(chǎn)品的語音的好壞?我覺得吧,能夠讓用戶對于這個語音系統(tǒng)的滿意度達到一個高標(biāo)準(zhǔn),首先能夠讓系統(tǒng)能夠聽懂你所說的內(nèi)容,并且給出相對應(yīng)的解決方案,語音系統(tǒng)運用的簡而易用即可,如何做到以上的要求,我會再下面對話設(shè)計中會著重講解深挖的。三、車載語音交互(VUI)基本原則車載場景下的語音交互核心基本原則有三點:1.首先是安全駕駛過程中,司機的眼睛、耳朵和手占據(jù)了大部分多任務(wù)操作,如果一些功能還需要通過眼睛和手來操作的話,會降低安全駕駛的系數(shù),所以車載語音交互更有助于輔佐司機安全駕駛,減少注意力的分散。2.其次是便利語音交互設(shè)計之初,一定要考慮便利、快捷,盡量的減少每一個任務(wù)的對話次數(shù)、快速響應(yīng)、將對話流程簡單化,從而打破VUI對于用戶的一個心理障礙(便利這塊內(nèi)容我會在后面對話設(shè)計中著重講解)。3.最后是愉悅為什么要談到愉悅,因為市場上最初的語音對話交談,都是冷冰冰的,幾乎沒有情感可談,像極了和機器人對話,并且有的時候無法處理任務(wù)就會說,超出能力范圍,這是一個很不好的用戶體驗?,F(xiàn)在市場上可以看到,導(dǎo)航軟件也有語音包可以選擇,這也是增加了情感化設(shè)計,這是其中的一個點。還有一個小點就是自然的對話交流,很流暢的完成用戶提出的每一項任務(wù),盡可能的規(guī)避對話中的錯誤,讓整體的對話過程達到一個愉悅的感覺。四、用戶語音的目的用戶在語音交互的時候,絕大多數(shù)都是帶有明確指示任務(wù)指令的,也有可能是閑聊狀態(tài)。任務(wù)狀態(tài)下:任務(wù)式對話中,用戶需要盡快的得到想要反饋和解決方案,并且快速的完成,此類任務(wù)的反饋要求還需要清晰、簡單明了。閑聊狀態(tài)下:我們經(jīng)常也會問Siri一些無聊的問題,比如:“siri給我來一段Rap”通常這類的任務(wù)帶有的目的性不是很強,但是對于趣味性要求會高。五、市場現(xiàn)狀(VUI+GUI)語音是最舒服的交互形式,但是他不能完全取代GUI,相互協(xié)作才是更佳的方案,所以現(xiàn)在市場上的車載系統(tǒng)大多數(shù)都是以語音(VUI)和圖形用戶界面(GUI)相組合的,也有少部分車加入其他交互方式譬如手勢交互。語音與圖形的交互是交叉處理,從而形成了多模,多模態(tài)在我第二篇文章也有講到,第一次看我文章的同學(xué)們可以回顧一下,用戶在對車載系統(tǒng)發(fā)送一個指令的同時,設(shè)備會有多種的反饋方式,首先你可以聽到系統(tǒng)虛擬形象給你做出回答,其次你看到圖形界面的變化,舉一個例子,你說:“我要聽周杰倫的七里香”系統(tǒng)就會處理講頁面跳轉(zhuǎn)到音樂界面,并且播放周杰倫的七里香,如果聲音小了,你可以說:“聲音大一點”大家是不是發(fā)現(xiàn)一個問題呀?我在前面說系統(tǒng)首先會做出回答,然后界面才會發(fā)生變化,但是實際情況,系統(tǒng)語音形象沒有做出任何多余的回答,而是直接聽取到用戶的需求,直接反饋出結(jié)果,播放了周杰倫的#七里香#,這就是我準(zhǔn)備在下面會重點講到的“對話設(shè)計”。再說對話設(shè)計之前,我們先了解一下VUI設(shè)計師,想必大家頭一次聽說,還有語音(VUI)設(shè)計師嘛,國內(nèi)不太注重培養(yǎng)VUI設(shè)計師,大家可以去招聘平臺搜索一下語音交互設(shè)計師,很少有公司專門針對這個職位去招聘的,就算有,也是招聘算法等研發(fā)崗的職位,VUI設(shè)計師的工作任務(wù)一般都是公司的產(chǎn)品經(jīng)理或者交互設(shè)計師代勞了,這會肯定就有產(chǎn)品經(jīng)理或者交互設(shè)計師想出來吐槽了,哈哈哈。語音交互方式給用戶聽和說兩個動作,相信大家也有聽過7±2法則,因此在聽到的信息設(shè)計發(fā)面需要考量,因為用戶聽到一遍內(nèi)容之后就消失了,除非這款車機語音系統(tǒng),有再次復(fù)述上一段話的功能,不然在語音設(shè)計的時候,千萬不要讓用戶產(chǎn)生的認知負荷,更不要挑戰(zhàn)用戶的短時間的記憶力,最強大腦除外,我們大多數(shù)人可不是什么最強大腦是不是。再次強調(diào)一下,就算擁
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度品牌形象授權(quán)合同6篇
- 2025機器設(shè)備轉(zhuǎn)讓合同范文
- 2025年度搬遷工程物資采購合同3篇
- 疼痛護理查房
- 2024年汕頭房產(chǎn)買賣代理居間合同
- 2025年度水電站施工合同:水電站建設(shè)期項目管理與協(xié)調(diào)服務(wù)3篇
- 2025版智能工廠生產(chǎn)線設(shè)備采購合同2篇
- 2025版按揭房產(chǎn)買賣合同法律援助范本3篇
- 2024年鋁合金門窗行業(yè)大數(shù)據(jù)分析與應(yīng)用合同范本3篇
- 二零二五年度倉儲物流中心租賃合同3篇
- 2024-2025學(xué)年新疆省克孜勒蘇柯爾克孜自治州三年級數(shù)學(xué)第一學(xué)期期末統(tǒng)考試題含解析
- 隱患排查治理管理規(guī)定
- 2025材料供貨合同樣本
- 豪華酒店翻新工程協(xié)議
- 經(jīng)濟學(xué)原理模擬題含參考答案
- 考研心理學(xué)專業(yè)基礎(chǔ)(312)研究生考試試題及解答參考(2025年)
- 2025版國家開放大學(xué)法學(xué)本科《國際私法》歷年期末紙質(zhì)考試總題庫
- 機器人機構(gòu)學(xué)基礎(chǔ) 部分習(xí)題及答案(于靖軍 )
- 教科版2022-2023學(xué)年度上學(xué)期三年級科學(xué)上冊期末測試卷及答案(含八套題)
- DZ/T 0430-2023 固體礦產(chǎn)資源儲量核實報告編寫規(guī)范(正式版)
- 銅排載流量表
評論
0/150
提交評論