版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
ICS07.040
CCSA75
團(tuán)體標(biāo)準(zhǔn)
T/GLAC****-****
導(dǎo)航應(yīng)用軟件
智能語音交互與引導(dǎo)技術(shù)要求
Technicalrequirementsforintelligentvoiceinteractionandguidance
ofnavigationapplicationsoftware
點(diǎn)擊此處添加與國際標(biāo)準(zhǔn)一致性程度的標(biāo)識(shí)
(征求意見稿V1.0)
2023年12月
聯(lián)系人:黃際/p>
XXXX—XX—XX發(fā)布XXXX—XX—XX實(shí)施
中國衛(wèi)星導(dǎo)航定位協(xié)會(huì)發(fā)布
T/GLAC****-****
導(dǎo)航應(yīng)用軟件智能語音交互與引導(dǎo)技術(shù)要求
1范圍
本文件規(guī)定了導(dǎo)航應(yīng)用軟件智能語音交互與引導(dǎo)技術(shù)的總體要求和系統(tǒng)框架、語音交互界面、數(shù)據(jù)
資源、前端處理、語音處理、地圖服務(wù),導(dǎo)航業(yè)務(wù)應(yīng)用等要求。
本文件適用于導(dǎo)航應(yīng)用軟件智能語音交互與引導(dǎo)服務(wù)相關(guān)產(chǎn)品的設(shè)計(jì)、研發(fā)和應(yīng)用。
2規(guī)范性引用文件
下列文件對(duì)于本文件的應(yīng)用是必不可少的。凡是注日期的引用文件,僅所注日期的版本適用于本文
件。凡是不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。
GB/T5271.1—2000信息技術(shù)詞匯第1部分:基本術(shù)語
GB/T36464.1—2020信息技術(shù)智能語音交互系統(tǒng)第1部分:通用規(guī)范
GB/T36464.5—2018信息技術(shù)智能語音交互系統(tǒng)第5部分:車載終端
GB/T39774—2021導(dǎo)航應(yīng)用軟件基本功能及技術(shù)要求
3術(shù)語和定義
下列術(shù)語和定義適用于本文件。
3.1
語音交互系統(tǒng)speechinteractionsystem
由功能單元(或其組合)、數(shù)據(jù)資源等組成的能夠?qū)崿F(xiàn)與人類之間進(jìn)行語音交互的系統(tǒng)。
[來源:GB/T36464.1—2020,3.2]
3.2
智能語音交互intelligentspeechinteraction
基于語音識(shí)別、語音合成、自然語言理解等人工智能技術(shù),實(shí)現(xiàn)人類和功能單元之間通過語音即可
完成信息傳遞和交流活動(dòng)。
3.3
智能語音引導(dǎo)intelligentvoiceguidance
綜合應(yīng)用語音識(shí)別、語義理解、語音合成等人工智能技術(shù),使用準(zhǔn)確、簡潔的語音來提供引導(dǎo)信息。
3.4
功能單元functionalunit
能夠完成特定任務(wù)的硬件實(shí)體,或軟件實(shí)體,或硬件實(shí)體和軟件實(shí)體。
[來源:GB/T5271.1—2000,01.01.40]
3.5
語音合成speechsynthesis
1
T/GLAC****-****
通過機(jī)械的、電子的方法合成人類語言的過程。
[來源:GB/T36464.1—2020,3.6]
3.6
語音識(shí)別speechrecognition
將人類的聲音信號(hào)轉(zhuǎn)化為文字或者指令的過程。
[來源:GB/T36464.1—2020,3.7]
3.7
命令字識(shí)別commandwordrecognition
一種基于語音識(shí)別語法的語音識(shí)別方式,是在語音識(shí)別語法規(guī)則限定的范圍內(nèi),對(duì)于給定的語音輸
入,語音識(shí)別引擎給出語音識(shí)別語法覆蓋范圍內(nèi)的文本或拒識(shí)作為識(shí)別結(jié)果。
[來源:GB/T36461.1—2020,3.9]
3.8
連續(xù)語音識(shí)別continuousspeechrecognition
識(shí)別任意的連續(xù)語音,并給出相對(duì)應(yīng)的文本。
[來源:GB/T36461.1—2020,3.10]
3.9
語音喚醒voicewake_up;voicetrigger
處于音頻流監(jiān)控的語音交互系統(tǒng),在檢測到特定的特征或事件出現(xiàn)后,切換到命令字識(shí)別、連續(xù)語
音識(shí)別等其他處理狀態(tài)的過程。
[來源:GB/T36461.1—2020,3.17]
3.10
語音增強(qiáng)speechenhancement
當(dāng)有效語音信號(hào)被各種造成干擾,甚至淹沒后,從含有噪聲背景的聲音信號(hào)中提取有效語音信號(hào),
抑制、降低噪聲干擾的技術(shù)。
3.11
語音打斷speechinterruption
語音交互系統(tǒng)在播放聲音的過程中,當(dāng)語音采集設(shè)備檢測到有效語音輸入時(shí),中斷播放聲音,轉(zhuǎn)到
語音識(shí)別等其他處理過程。
[來源:GB/T36461.1—2020,3.29]
3.12
語義理解semanticunderstanding
使功能單元理解人說話的意圖。
[來源:GB∕T36464.1—2020,3.11]
3.13
指代消解coreferenceresolution
篇章中的一個(gè)語言單位(通常是詞或短語)與之前出現(xiàn)的語言單位存在特殊語義關(guān)聯(lián),其語義解釋
依賴于前者,指代消解就是將兩者關(guān)系進(jìn)行關(guān)聯(lián)。
3.15
知識(shí)推理knowledgeinference
推理是運(yùn)用邏輯思維能力,從已有的知識(shí)出發(fā),得出未知的、隱性的知識(shí)。語音交互中的知識(shí)推理
主要基于知識(shí)圖譜來實(shí)現(xiàn)。
2
T/GLAC****-****
3.16
槽slot
語音指令所明確定義的屬性信息,功能單元執(zhí)行操作前需要獲取的關(guān)鍵參數(shù)。
3.17
大語言模型largelanguagemodel
一種使用人工神經(jīng)網(wǎng)絡(luò)構(gòu)建的語言模型,它擁有許多參數(shù)(通常數(shù)十億個(gè)權(quán)重或更多),通過自監(jiān)
督學(xué)習(xí)或半監(jiān)督學(xué)習(xí)對(duì)大量未標(biāo)記文本進(jìn)行訓(xùn)練。
4總體要求
4.1控制對(duì)象
通過智能語音交互與引導(dǎo)技術(shù),實(shí)現(xiàn)對(duì)便攜式導(dǎo)航應(yīng)用軟件或車載導(dǎo)航應(yīng)用軟件的控制。
4.2語音交互成功率
語音交互成功率要求應(yīng)符合GB/T36464.5—2018中5.2.6的要求。
4.3硬件設(shè)備適用性
硬件設(shè)備適用性要求如下:
a)符合GB/T39774—2021中4.4的要求;
b)符合基本的音頻采集的硬件(傳聲器或麥克風(fēng)陣列)和基本的音頻播放的硬件(喇叭等)的要
求;
c)符合網(wǎng)絡(luò)通訊要求,可以接收Wi-Fi或者蜂窩移動(dòng)網(wǎng)絡(luò),CPU2000MHz以上,內(nèi)存2GM以上。
5系統(tǒng)框架
導(dǎo)航應(yīng)用軟件智能語音交互與引導(dǎo)系統(tǒng)框架包括語音交互界面、數(shù)據(jù)資源、前端處理、語音處理、
地圖服務(wù)、導(dǎo)航業(yè)務(wù)應(yīng)用等功能模塊,如圖1所示,其中:
a)語音交互界面提供系統(tǒng)與人直接進(jìn)行語音交互的人機(jī)界面,包括語音采集、語音應(yīng)答、語音
播報(bào)、語音信號(hào)輸入輸入、環(huán)境噪聲適應(yīng)能力;
b)數(shù)據(jù)資源包括系統(tǒng)處理的音頻數(shù)據(jù)、文本數(shù)據(jù)和地圖數(shù)據(jù);
c)前端處理包括語音喚醒、語音增強(qiáng);
d)語音處理包括語音識(shí)別、語義理解、多輪交互、語音合成、全雙工交互等功能;
e)地圖服務(wù)提供語音查詢、語音提示、語音引導(dǎo)的接口服務(wù);
f)導(dǎo)航業(yè)務(wù)處理對(duì)語音處理的結(jié)果轉(zhuǎn)換為對(duì)應(yīng)的應(yīng)用指令并反饋業(yè)務(wù)相應(yīng)結(jié)果,包括對(duì)駕車場
景、步行場景、騎行場景、公交場景的要求。駕車場景需提供查找目的地、引導(dǎo)信息播報(bào)、
交通信息問詢等功能;步行場景需提供查找目的地、引導(dǎo)信息播報(bào)等功能;騎行場景需提供
查找目的地、引導(dǎo)信息播報(bào)等功能;公交場景需提供查找目的地、換乘線路和到站提醒播報(bào)
等功能。
3
T/GLAC****-****
圖1系統(tǒng)框架示意圖
6語音交互界面
6.1語音采集
語音采集應(yīng)符合GB/T36464.1—2020中5.1的要求。
6.2語音應(yīng)答
6.2.1基本要求
系統(tǒng)應(yīng)支持針對(duì)用戶的輸入,通過語音答復(fù)的能力,即完成操作者與導(dǎo)航應(yīng)用軟件的一問一答人機(jī)
交互。
6.2.2聲音要求
應(yīng)答時(shí)的聲音要求如下:
a)應(yīng)符合聲音清晰,語速適中等要求;
b)宜支持個(gè)性化語音定制功能,用戶可設(shè)置定制化語音進(jìn)行應(yīng)答;
4
T/GLAC****-****
c)宜支持個(gè)性化語速定制功能,用戶設(shè)置定制化語速進(jìn)行應(yīng)答。
6.2.3內(nèi)容要求
應(yīng)答時(shí)的內(nèi)容要求如下:
a)應(yīng)包含基礎(chǔ)問答內(nèi)容(執(zhí)行成功/執(zhí)行不成功);
b)可包含詳情內(nèi)容和問詢內(nèi)容。導(dǎo)航中的詳細(xì)業(yè)務(wù)要求見本文件第6章。
示例1:找到頤和園,位于北京市海淀區(qū),距離你xkm。
示例2:去這里可以么?
6.2.4語言要求
應(yīng)答時(shí)的語言要求如下
a)應(yīng)支持按照用戶自主設(shè)置的語言進(jìn)行語音應(yīng)答;
b)應(yīng)符合GB/T36464.1—2020中5.3的要求。
6.3語音播報(bào)
6.3.1基本要求
系統(tǒng)應(yīng)支持語音播報(bào)的主動(dòng)引導(dǎo)能力。
6.3.2聲音要求
語音播報(bào)時(shí)的聲音要求如下:
a)應(yīng)符合聲音清晰,語速適中等要求;
b)宜支持個(gè)性化語音定制功能,用戶可設(shè)置定制化語音進(jìn)行播報(bào);
c)宜支持個(gè)性化語速定制功能,用戶設(shè)置定制化語速進(jìn)行播報(bào)。
6.3.3內(nèi)容要求
語音播報(bào)時(shí)的內(nèi)容要求如下:
a)應(yīng)在恰當(dāng)時(shí)機(jī)主動(dòng)為用戶播報(bào);
示例1:有更快路線推薦是否需要切換?
b)應(yīng)包含主動(dòng)的引導(dǎo)內(nèi)容;
示例1:您已超速,請(qǐng)減速。
6.3.4語言要求
應(yīng)支持按照用戶自主設(shè)置的語言進(jìn)行語音播報(bào)。
6.4輸入輸出
輸入輸出要求應(yīng)符合GB/T36464.1—2020中5.3的要求。
6.5環(huán)境噪聲適應(yīng)能力
環(huán)境噪聲適應(yīng)能力要求應(yīng)符合GB/T36464.1—2020中5.4的要求。
5
T/GLAC****-****
7數(shù)據(jù)資源
7.1音頻數(shù)據(jù)
音頻數(shù)據(jù)應(yīng)符合GB/T36464.1—2020中6.1的要求。
7.2文本數(shù)據(jù)
文本數(shù)據(jù)應(yīng)符合GB/T36464.1—2020中6.2的要求。
7.3地圖數(shù)據(jù)
導(dǎo)航電子地圖數(shù)據(jù)應(yīng)符合GB/T39774—2021中4.3的要求。
8前端處理
8.1語音喚醒
語音喚醒應(yīng)符合GB/T36464.1—2020中7.1的要求。除此之外應(yīng)符合以下要求:
a)本地小型化部署:應(yīng)小型化部署語音模型,方便在本地設(shè)備進(jìn)行部署,實(shí)現(xiàn)快速響應(yīng);
b)強(qiáng)環(huán)境適應(yīng)性:在各種復(fù)雜環(huán)境條件下,保證高準(zhǔn)確率;
c)低延遲:應(yīng)做到實(shí)時(shí)語音識(shí)別;
d)用戶隱私保護(hù):收集到的語音數(shù)據(jù)只能用于改善識(shí)別性能,除非用戶同意,不能用于其它任何
目的;
e)低功耗:喚醒模塊應(yīng)盡可能降低功耗,以減少電池?fù)p耗;
f)反饋機(jī)制:當(dāng)語音識(shí)別出現(xiàn)錯(cuò)誤時(shí),需要有反饋機(jī)制,以提高識(shí)別精度;
g)假喚醒控制機(jī)制:應(yīng)盡可能降低假喚醒情況發(fā)生,以免為用戶造成嚴(yán)重困擾。
8.2語音增強(qiáng)
語音增強(qiáng)應(yīng)符合GB/T36464.1—2020中7.4的要求。除此之外應(yīng)符合以下要求:
a)自適應(yīng)增益控制:應(yīng)根據(jù)檢測到的環(huán)境噪聲強(qiáng)度自動(dòng)調(diào)整音量的增益控制,以保持輸出語音的
一致性和穩(wěn)定性;
b)硬件兼容性:應(yīng)能適配各種音頻采集設(shè)備,比如不同型號(hào)和品牌的麥克風(fēng)等;
c)軟件兼容性:應(yīng)能適配各種操作系統(tǒng);
d)頻譜增強(qiáng):可通過調(diào)整語音信號(hào)頻譜特性,提高語音的清晰度;
e)用戶隱私保護(hù):處理和傳輸用于語音數(shù)據(jù)時(shí),需保護(hù)用戶隱私。
9語音處理
9.1語音識(shí)別
語音識(shí)別應(yīng)符合GB/T36464.1—2020中8.1的要求。除此之外應(yīng)符合以下要求:
6
T/GLAC****-****
a)活體檢測:應(yīng)能區(qū)分真人聲音和錄音,避免被合成語音攻擊;
b)多通道識(shí)別:應(yīng)支持分離和識(shí)別各個(gè)通道語音的能力;
c)用戶隱私保護(hù):
1)應(yīng)能夠透明告知數(shù)據(jù)使用范圍
2)數(shù)據(jù)收集最小化
3)對(duì)數(shù)據(jù)進(jìn)行加密存儲(chǔ)和匿名處理,并對(duì)數(shù)據(jù)做到訪問權(quán)限控制和安全傳輸;
d)魯棒性:應(yīng)能適應(yīng)各種噪聲環(huán)境及音頻采集設(shè)備;
e)低延遲和實(shí)時(shí)性:應(yīng)做到實(shí)時(shí),快速的語音識(shí)別,以保證交互體驗(yàn);
f)持續(xù)學(xué)習(xí)能力:應(yīng)具有持續(xù)學(xué)習(xí)能力,來提高識(shí)別性能。
9.2語義理解
9.2.1概述
語義理解按照實(shí)現(xiàn)方式分為傳統(tǒng)語義理解和大語言模型語義理解。基于大語言模型語義理解支持
從端到端語義理解方案,可直接將用戶的問題映射成對(duì)應(yīng)的API調(diào)用。
9.2.2傳統(tǒng)語義理解
傳統(tǒng)語義理解應(yīng)符合GB/T36464.1—2020中8.2的要求。除此之外應(yīng)符合以下要求:
a)情感識(shí)別(可選):能夠識(shí)別用戶情感狀態(tài),進(jìn)而提供更加人性化的對(duì)話體驗(yàn);
b)上下文理解:能夠結(jié)合上下文對(duì)話歷史和環(huán)境,準(zhǔn)確捕捉用戶意圖;
c)持續(xù)學(xué)習(xí):能夠根據(jù)用戶反饋,持續(xù)學(xué)習(xí),來不斷優(yōu)化語義理解能力;
d)新增意圖和槽位:應(yīng)支持快速處理新增意圖和槽位提取的能力;
e)推理能力:應(yīng)具有基本推理能力,如針對(duì)“現(xiàn)在”,“下周一天氣”等,需要準(zhǔn)確識(shí)別出時(shí)間
和日期;
f)多模態(tài)交互:除語音信息外,可結(jié)合當(dāng)前屏幕顯示狀態(tài),觸控等信息,提供更加靈活的交互方
式;
g)情景理解:能夠針對(duì)不同對(duì)話情景的特點(diǎn)和約束,提供針對(duì)性的理解和響應(yīng)。
9.2.3大語音模型語義理解
端到端語義理解方案除了符合傳統(tǒng)語義理解要求外,還應(yīng)符合以下要求:
a)可解釋性:為了保證安全和可靠性,模型決策過程需要盡可能透明;
b)長期記憶能力:模型要有能力理解和記憶長期對(duì)話歷史;
c)事實(shí)驗(yàn)證機(jī)制:對(duì)生成的輸出內(nèi)容和決策結(jié)果進(jìn)行驗(yàn)證,確保信息的準(zhǔn)確性;
d)防止幻覺:確保模型不會(huì)無中生有,編造虛假信息;
e)倫理合規(guī):防止模型運(yùn)行時(shí)產(chǎn)生有害、歧視、色情等不適當(dāng)?shù)膬?nèi)容;
f)安全性:模型應(yīng)能夠應(yīng)對(duì)潛在的攻擊和惡意輸入等。
7
T/GLAC****-****
9.3多輪交互
9.3.1基本要求
多輪交互需要結(jié)合上下文信息,對(duì)用戶當(dāng)前文本進(jìn)行更深度語義理解,并且具備主動(dòng)開啟新一輪對(duì)
話的能力,具體需具有指代消解、省略槽位自動(dòng)補(bǔ)齊、意圖或槽位澄清、知識(shí)推理等功能模塊之外,還
應(yīng)包括容錯(cuò)機(jī)制、自然交互、對(duì)話中斷與恢復(fù)、可擴(kuò)展性、個(gè)性化交互功能。
9.3.2容錯(cuò)機(jī)制
當(dāng)系統(tǒng)發(fā)生錯(cuò)誤或者錯(cuò)會(huì)用戶意圖時(shí),要有錯(cuò)誤提示和糾錯(cuò)機(jī)制。
9.3.3自然交互
應(yīng)保證自然的交互體驗(yàn),符合人類語言習(xí)慣,避免生硬和割裂的對(duì)話體驗(yàn)。
9.3.4對(duì)話中斷與恢復(fù)
用戶中斷對(duì)話或重啟對(duì)話時(shí),需準(zhǔn)確理解和判斷是否開啟新的對(duì)話,還是承接上一個(gè)對(duì)話。
9.3.5可擴(kuò)展性
支持新的交互需求的快速融入。
9.3.6個(gè)性化交互
在保障用戶隱私的前提下,獲取用戶授權(quán)后,結(jié)合用戶偏好和歷史行為,提供個(gè)性化的交互體驗(yàn)。
9.4語音合成
語音合成要求應(yīng)符合GB/T36464.1—2020中8.3的要求。除此之外還應(yīng)符合以下要求:
a)宜支持個(gè)性化語音定制功能,通過用戶自定義的語調(diào)、音色、語速實(shí)現(xiàn)語音合成功能;
b)個(gè)性化語音定制時(shí)的訓(xùn)練樣本語句應(yīng)不超過20句話,每句話的字?jǐn)?shù)宜不超過20個(gè)字。
9.5全雙工交互
全雙工交互應(yīng)符合GB/T36464.1—2020中8.6的要求。除此之外還應(yīng)符合以下要求:
a)回聲消除的能力應(yīng)消除麥克風(fēng)與喇叭因空氣產(chǎn)生回受路徑而產(chǎn)生的雜音;
b)語音打斷的能力應(yīng)符合GB/T36464.5—2018中5.3.2的要求。
10地圖服務(wù)
10.1語音查詢
10.1.1查詢對(duì)象
查詢對(duì)象要求應(yīng)符合GB/T39774—2021中5.2.1的要求,宜給出深度服務(wù)信息。
10.1.2查詢結(jié)果列表
查詢結(jié)果列表應(yīng)符合下列要求:
a)支持通過語音播報(bào)查詢結(jié)果列表;
8
T/GLAC****-****
b)優(yōu)先選擇滿足用戶需求的唯一結(jié)果;
c)當(dāng)存在多個(gè)查詢結(jié)果時(shí),通過結(jié)果相關(guān)性順序播報(bào)查詢結(jié)果列表。
10.1.3查詢效率
用戶查詢語音指令發(fā)出后,查詢的響應(yīng)時(shí)間和超時(shí)處理應(yīng)符合下列規(guī)定:
a)在行中導(dǎo)航場景做到快速響應(yīng),查詢響應(yīng)時(shí)間應(yīng)不大于2s;
b)在行前復(fù)雜決策場景,查詢響應(yīng)時(shí)間應(yīng)不大于5s;
c)若響應(yīng)時(shí)間大于5s,應(yīng)在等待過程中給予用戶處理過程進(jìn)度反饋;
d)響應(yīng)時(shí)間超時(shí),給出查詢超時(shí)響應(yīng)并退出操作。
10.2語音提示
語音提示要求應(yīng)符合GB∕T39774—2021中5.5.2的要求
10.3語音引導(dǎo)
10.3.1基本要求
語音引導(dǎo)應(yīng)智能化,在GB∕T39774—2021中5.4.3規(guī)定的場景下應(yīng)能全部及時(shí)給出語音引導(dǎo)指令。
10.3.2引導(dǎo)時(shí)機(jī)
語音引導(dǎo)時(shí)機(jī)應(yīng)智能化,應(yīng)根據(jù)實(shí)時(shí)車速、所在道路種別和交通場景設(shè)置合理的引導(dǎo)時(shí)間提前量,
為導(dǎo)航應(yīng)用軟件使用者留出預(yù)判和執(zhí)行下一步動(dòng)作的時(shí)間。
11導(dǎo)航業(yè)務(wù)應(yīng)用要求
11.1查找目的地
查找目的地應(yīng)符合三種場景下的語音指令交互,包括發(fā)起導(dǎo)航前查找目的地、導(dǎo)航過程中更換目的
地、途經(jīng)某地去往目的地。交互過程遵循如下步驟:
a)通過預(yù)先定義的命令字喚醒系統(tǒng);
b)用戶語音說出使用場景與目的地名稱或者途經(jīng)某地去往目的地;
示例1:導(dǎo)航/步行/騎行去中國美術(shù)館。
示例2:途經(jīng)中國美術(shù)館,導(dǎo)航/步行/騎行去往天安門。
c)導(dǎo)航前查找目的地:播報(bào)目的地詳細(xì)信息、詢問是否發(fā)起導(dǎo)航;
示例3:為您找到中國美術(shù)館,位于東城區(qū)五四大街1號(hào),需要導(dǎo)航嗎?
d)導(dǎo)航中更換目的地:播報(bào)目的地詳細(xì)信息、詢問是否更換目的地;
示例4:為您找到中國美術(shù)館,距您1.2km,需要更換目的地嗎?
e)途徑某地去往目的地:導(dǎo)航前與導(dǎo)航中支持多個(gè)途經(jīng)地點(diǎn)的設(shè)置與刪除,播報(bào)途徑地詳細(xì)信息,
詢問用戶是否確認(rèn)途經(jīng)地點(diǎn)。
示例5:為您找到途徑中國美術(shù)館、中國國家博物館的路線,需要開始導(dǎo)航嗎?
9
T/GLAC****-****
11.2引導(dǎo)信息播報(bào)
針對(duì)11.1查找目的地產(chǎn)生的規(guī)劃路徑,進(jìn)入不同場景導(dǎo)航中,引導(dǎo)信息播報(bào)應(yīng)符合如下要求:
a)語音播報(bào)內(nèi)容應(yīng)根據(jù)不同場景和應(yīng)用方式建立語音模板,在具體位置對(duì)特定模板的內(nèi)容進(jìn)行填
充,最后將組織好的文字通過語音合成技術(shù)適時(shí)播報(bào);
b)導(dǎo)航誘導(dǎo)語音播報(bào)模板基礎(chǔ)類別分為如下4類:
1)路口轉(zhuǎn)向提示信息
路口轉(zhuǎn)向提示語音模板的基本結(jié)構(gòu)宜為“‘前方’+距離+操作+‘去往’+前方道路名稱+附
加提示”?!熬嚯x”是指從當(dāng)前位置到轉(zhuǎn)向處的距離?!安僮鳌笔侵傅睫D(zhuǎn)向處時(shí),需要做
的操作,可分為左轉(zhuǎn)、右轉(zhuǎn)、靠左、靠右等?!案郊犹崾尽笔侵附Y(jié)合道路實(shí)際情況、車道
和自然地物(如紅綠燈路口、三岔路、上高架)等補(bǔ)充播報(bào)信息。
示例1:前方500m請(qǐng)右轉(zhuǎn),去往西五環(huán)路,請(qǐng)注意提前并入最右側(cè)車道。
2)路段中警示提示信息
路段中警示提示分兩種場景,實(shí)地警示信息提示與針對(duì)用戶違規(guī)行為提示,要求如下:
?實(shí)地警示信息語音模板基本結(jié)構(gòu)宜為“‘前方’+距離+警示場景+(附加信息)”?!熬?/p>
離”是指從當(dāng)前位置到現(xiàn)場警示信息的距離?!熬緢鼍啊笔侵杆淼?、鐵道、橋梁、
電子監(jiān)控設(shè)備、交通警告設(shè)施等?!案郊有畔ⅰ笔侵府?dāng)有監(jiān)控設(shè)備時(shí),此段道路的限
速值信息,或有交通警告牌的路段對(duì)應(yīng)的駕駛提示信息等。
示例2:前方300m有測速攝像頭,限速80km/h。
?應(yīng)對(duì)用戶違反法規(guī)、或影響用戶駕駛安全的行為進(jìn)行強(qiáng)烈提醒。如違規(guī)變道、超速、
走應(yīng)急車道、公交車道等行為,提醒的優(yōu)先級(jí)高于一般的警示信息。
3)路段中路況提示信息
以實(shí)時(shí)路況、事故、紅綠燈倒計(jì)時(shí)為主,路段中路況提示語音模板基本結(jié)構(gòu)宜為“‘前方’
+距離+前方道路名稱+警示場景+(附加信息)”。“警示場景”可根據(jù)內(nèi)容分為擁堵路況
提示、路口路況提示、交通事件提示等。
示例3:前方300m黃河北大街嚴(yán)重?fù)矶?,?qǐng)注意繞行。
示例4:前方300m路口紅燈即將變綠,請(qǐng)準(zhǔn)備起步。
4)友情提示信息
友情提示分為與地點(diǎn)相關(guān)及與地點(diǎn)無關(guān)提示。與地點(diǎn)相關(guān)語音模板的基本結(jié)構(gòu)宜為“‘前
方’+距離+友情提示”,“友情提示”可根據(jù)內(nèi)容分為出發(fā)時(shí)提示、抵達(dá)目的地提示等。
與地點(diǎn)無關(guān)友情提示可以包含更多駕駛關(guān)懷信息。如疲勞駕駛、服務(wù)區(qū)休息提醒、路段積
水、橫風(fēng)大霧、紅綠燈變燈提醒等。
示例5:前方100m達(dá)到目的地,石景山游樂園在您的右前方。
c)播報(bào)頻次要求
導(dǎo)航過程中根據(jù)不同信息的重要程度、以及用戶的操作成本和判斷成本的不同,給用戶進(jìn)行不
同頻次的強(qiáng)調(diào)。
1)簡單的直行路口在路口前給予用戶1—2次提醒;
2)復(fù)雜路口,如轉(zhuǎn)向角度大的路口或多方向的路口需要用戶提前選擇好方向,需要給用戶多
10
T/GLAC****-****
次提醒,確保用戶不會(huì)因?yàn)殄e(cuò)失路口或者選錯(cuò)方向,導(dǎo)致偏航繞路;
3)距離相近的相同信息,可適當(dāng)合并播報(bào),降低播報(bào)頻次,比如多個(gè)匯入口、多個(gè)相同類型
電子眼。
d)播報(bào)時(shí)機(jī)要求
播報(bào)內(nèi)容需要在合適的時(shí)機(jī)播報(bào)傳達(dá)給用戶,確保用戶在聽到信息后仍能及時(shí)有效做出反應(yīng)。
e)播報(bào)優(yōu)先級(jí)要求
道路元素多且復(fù)雜,當(dāng)相同位置存在多個(gè)需要提示的信息時(shí),根據(jù)信息的重要程度決策最高優(yōu)
的一個(gè)進(jìn)行提示。優(yōu)先級(jí)從高到低依次為駕駛安全提示、路口轉(zhuǎn)向提示、直行路口提示、道路
安全提示。
f)播報(bào)表達(dá)要求
播報(bào)內(nèi)容表達(dá)要求語言足夠清晰易懂,保證用戶能夠準(zhǔn)確理解播報(bào)的內(nèi)容信息,降低理解難度,
要求如下:
1)每一句播報(bào)的話術(shù)不宜過長;
2)播報(bào)元素不宜過多;
3)兩句播報(bào)之間需有間隔,不宜連續(xù)不停播報(bào)。
11.3結(jié)束導(dǎo)航
導(dǎo)航過程中可通過語音交互結(jié)束導(dǎo)航,方式有三種:
a)通過預(yù)先定義的命令字喚醒系統(tǒng);
b)用戶語音輸入“結(jié)束導(dǎo)航”。
c)語音回復(fù)操作結(jié)果。
示例:導(dǎo)航結(jié)束下次見。
結(jié)束導(dǎo)航需要在合適的位置結(jié)束,不宜過早或過晚,要求如下:
a)用戶距離目的地較遠(yuǎn)(300m以上)不宜結(jié)束導(dǎo)航;
b)用戶在到達(dá)目的地后仍在導(dǎo)航,可以通過語音問詢是否需要繼續(xù)導(dǎo)航。
11.4駕車場景
11.4.1查找目的地
駕車場景查找目的地,基本要求見11.1。當(dāng)目的地存在更加精細(xì)的誘導(dǎo)信息時(shí),如:停車場等,可
通過語音進(jìn)行二次交互。
示例:為您找到奎科科技大廈,西門存在停車場,要導(dǎo)航去西門么?
11.4.2引導(dǎo)信息播報(bào)
駕車場景引導(dǎo)信息播報(bào),基本要求見6.2,同時(shí)應(yīng)遵循如下要求:
a)播報(bào)內(nèi)容要求:對(duì)于駕車安全的路段中警示信息應(yīng)覆蓋完整,如:道路限速信息、交通警告牌、
限行、擁堵等;
b)播報(bào)頻次要求:轉(zhuǎn)向角度大的路口和多方向的路口需要用戶提前選擇好車道與方向,操作和選
擇成本更高,需要給用戶4~5次以上的預(yù)警;
11
T/GLAC****-****
c)播報(bào)時(shí)機(jī)要求:車道提示提前xxm,需要保證在聽到后仍有足夠變道范圍,限速電子眼提示提
前xxm,需要保證聽到后有足夠的減速區(qū)間;
d)播報(bào)優(yōu)先級(jí)要求:駕車場景下提示信息重要程度排序,路口轉(zhuǎn)向提示>直行路口提示>限
速抓拍、違章抓拍>道路安全提示;
e)播報(bào)表達(dá)要求:駕車場景無特殊要求播報(bào)應(yīng)簡明扼要、容易理解、自然親切,避免干擾用戶駕
駛及減少聽覺疲勞。
11.4.3交通信息問詢
駕車場景下,需要符合常用交通信息、不同形式的語音指令交互,包含限行信息問詢、限速信息問
詢、路況信息問詢、交通限制信息問詢、服務(wù)區(qū)信息問詢、高速收費(fèi)金額信息問詢等,查詢的基本示例
如下:
a)通過預(yù)先定義的命令字喚醒系統(tǒng);
b)語音問詢不附加條件的限行信息;
示例1:今天限號(hào)多少?
c)播報(bào)用戶所在地理位置的限行信息;
示例2:(地理位置在北京)北京市今天限行尾號(hào)為5、0。
d)語音問詢指定區(qū)域的限行信息;
示例3:北京市限號(hào)多少?
e)播報(bào)指定區(qū)域的限行信息;
示例4:北京市今天限行尾號(hào)為5、0。
f)語音問詢指定區(qū)域的交通限制信息;
示例5:青年大街禁止左轉(zhuǎn)時(shí)間是多少?
g)播報(bào)指定區(qū)域的交通限制信息;
示例6:青年大街全天禁止左轉(zhuǎn)。
h)語音問詢不附加條件的服務(wù)區(qū)信息;
示例7:離服務(wù)區(qū)多遠(yuǎn)?
i)播報(bào)用戶所在地理位置的服務(wù)區(qū)信息;
示例8:前方500m到達(dá)劉千戶服務(wù)區(qū)。
j)語音問詢指定區(qū)域的高速收費(fèi)金額信息;
示例9:去沈陽故宮走高速的費(fèi)用。
k)播報(bào)指定區(qū)域的高速收費(fèi)金額信息。
示例10:去往沈陽故宮高速費(fèi)用約為100元。
11.4.4信息上報(bào)
駕車導(dǎo)航過程中,事故、擁堵、施工、封路等場景可通過語音交互上報(bào)事件詳細(xì)信息,交互輪次不
超過3輪,避免對(duì)用戶造成打擾,交互要求如下:
a)通過預(yù)先定義的命令字喚醒系統(tǒng);
b)用戶語音說出上報(bào)類型;
12
T/GLAC****-****
c)語音引導(dǎo)用戶提供詳細(xì)信息。
示例:
軟件語音回復(fù):請(qǐng)問事故發(fā)生在哪側(cè)車道呢?
用戶:左側(cè)
軟件回復(fù):請(qǐng)問事故是剮蹭、追尾還是嚴(yán)重事故呢?
用戶:剮蹭
軟件語音回復(fù):上報(bào)成功,您的反饋將可能幫助14人。
11.4.5結(jié)束導(dǎo)航
駕車場景結(jié)束導(dǎo)航,基本要求見11.3。
11.5步行場景
11.5.1查找目的地
步行場景查找目的地,基本要求見11.1
11.5.2引導(dǎo)信息播報(bào)
11.5.2.1路途中提前播報(bào)
在步行方向變化或變換特殊結(jié)構(gòu)位置時(shí),需語音播報(bào)步行代價(jià)大的相關(guān)信息,如:天橋、地下通道、
隧道、階梯等。提前進(jìn)行語音播報(bào)提醒用戶準(zhǔn)備上天橋/下天橋,播報(bào)內(nèi)容需包含,“前方進(jìn)入天橋,
請(qǐng)步行上天橋/下天橋”。
11.5.2.2到達(dá)提醒播報(bào)
在到達(dá)上天橋/下天橋附近,還有20m或5m時(shí),需進(jìn)行語音播報(bào),提醒用戶準(zhǔn)備上天橋/下天橋,
播報(bào)內(nèi)容需區(qū)分步行方向變化、離目的地距離、預(yù)計(jì)到達(dá)時(shí)間等情況進(jìn)行播報(bào)。
示例1:(步行方向變化)您已到達(dá)xx天橋,請(qǐng)直行上天橋。
示例2:(預(yù)計(jì)到達(dá)時(shí)間)離目的地還剩xxkm,預(yù)計(jì)步行xx分鐘后到達(dá)。
11.5.3結(jié)束導(dǎo)航
步行場景結(jié)束導(dǎo)航,基本要求見11.3
11.6騎行場景
11.6.1查找目的地
騎行場景查找目的地,基本要求見11.1
11.6.2引導(dǎo)信息播報(bào)
11.6.2.1路途中提前播報(bào)
13
T/GLAC****-****
在騎行前進(jìn)方向變化或變換特殊結(jié)構(gòu)位置時(shí),需語音播報(bào)騎行代價(jià)大的相關(guān)信息,如:天橋、地下
通道、隧道、階梯等,提醒用戶
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 信息安全教育普及保護(hù)個(gè)人隱私權(quán)益
- 2025年大慶貨運(yùn)上崗證考試題庫答案
- 全面性教育培養(yǎng)孩子的自我保護(hù)意識(shí)
- 2025年南寧貨運(yùn)從業(yè)資格證考試題目
- 2025年長沙貨運(yùn)資格題庫
- 企業(yè)接待區(qū)打造專業(yè)而舒適的接待家具布局
- 2025年攀枝花怎么考貨運(yùn)從業(yè)資格證
- 從多方面綜合解決維護(hù)學(xué)術(shù)風(fēng)清氣正環(huán)境的方法探索
- 2025年貴州貨運(yùn)從業(yè)資格證摸擬考試試題
- 創(chuàng)新農(nóng)產(chǎn)品國際市場準(zhǔn)入的戰(zhàn)略規(guī)劃
- 律師事務(wù)所人員管理制度
- 渣土、余土運(yùn)輸服務(wù)方案(技術(shù)方案)
- 網(wǎng)絡(luò)安全管理責(zé)任制度制度存在的問題(8篇)
- 20以內(nèi)的加法口算練習(xí)題4000題 205
- 《網(wǎng)絡(luò)系統(tǒng)建設(shè)與運(yùn)維》課件-項(xiàng)目一 5G技術(shù)特點(diǎn)和網(wǎng)
- 渠道襯砌施工方案(渠道預(yù)制混凝土塊)
- 籃球球星姚明課件
- 人生海海讀書分享閱讀時(shí)光好書讀后感
- 02S515排水檢查井圖集
- 2024-2030年中國Janus激酶(JAK)抑制劑行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略分析報(bào)告
- 水稻育秧合同范本
評(píng)論
0/150
提交評(píng)論