《導(dǎo)航應(yīng)用軟件智能語音交互與引導(dǎo)技術(shù)要求》_第1頁
《導(dǎo)航應(yīng)用軟件智能語音交互與引導(dǎo)技術(shù)要求》_第2頁
《導(dǎo)航應(yīng)用軟件智能語音交互與引導(dǎo)技術(shù)要求》_第3頁
《導(dǎo)航應(yīng)用軟件智能語音交互與引導(dǎo)技術(shù)要求》_第4頁
《導(dǎo)航應(yīng)用軟件智能語音交互與引導(dǎo)技術(shù)要求》_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

ICS07.040

CCSA75

團(tuán)體標(biāo)準(zhǔn)

T/GLAC****-****

導(dǎo)航應(yīng)用軟件

智能語音交互與引導(dǎo)技術(shù)要求

Technicalrequirementsforintelligentvoiceinteractionandguidance

ofnavigationapplicationsoftware

點(diǎn)擊此處添加與國際標(biāo)準(zhǔn)一致性程度的標(biāo)識(shí)

(征求意見稿V1.0)

2023年12月

聯(lián)系人:黃際/p>

XXXX—XX—XX發(fā)布XXXX—XX—XX實(shí)施

中國衛(wèi)星導(dǎo)航定位協(xié)會(huì)發(fā)布

T/GLAC****-****

導(dǎo)航應(yīng)用軟件智能語音交互與引導(dǎo)技術(shù)要求

1范圍

本文件規(guī)定了導(dǎo)航應(yīng)用軟件智能語音交互與引導(dǎo)技術(shù)的總體要求和系統(tǒng)框架、語音交互界面、數(shù)據(jù)

資源、前端處理、語音處理、地圖服務(wù),導(dǎo)航業(yè)務(wù)應(yīng)用等要求。

本文件適用于導(dǎo)航應(yīng)用軟件智能語音交互與引導(dǎo)服務(wù)相關(guān)產(chǎn)品的設(shè)計(jì)、研發(fā)和應(yīng)用。

2規(guī)范性引用文件

下列文件對(duì)于本文件的應(yīng)用是必不可少的。凡是注日期的引用文件,僅所注日期的版本適用于本文

件。凡是不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。

GB/T5271.1—2000信息技術(shù)詞匯第1部分:基本術(shù)語

GB/T36464.1—2020信息技術(shù)智能語音交互系統(tǒng)第1部分:通用規(guī)范

GB/T36464.5—2018信息技術(shù)智能語音交互系統(tǒng)第5部分:車載終端

GB/T39774—2021導(dǎo)航應(yīng)用軟件基本功能及技術(shù)要求

3術(shù)語和定義

下列術(shù)語和定義適用于本文件。

3.1

語音交互系統(tǒng)speechinteractionsystem

由功能單元(或其組合)、數(shù)據(jù)資源等組成的能夠?qū)崿F(xiàn)與人類之間進(jìn)行語音交互的系統(tǒng)。

[來源:GB/T36464.1—2020,3.2]

3.2

智能語音交互intelligentspeechinteraction

基于語音識(shí)別、語音合成、自然語言理解等人工智能技術(shù),實(shí)現(xiàn)人類和功能單元之間通過語音即可

完成信息傳遞和交流活動(dòng)。

3.3

智能語音引導(dǎo)intelligentvoiceguidance

綜合應(yīng)用語音識(shí)別、語義理解、語音合成等人工智能技術(shù),使用準(zhǔn)確、簡潔的語音來提供引導(dǎo)信息。

3.4

功能單元functionalunit

能夠完成特定任務(wù)的硬件實(shí)體,或軟件實(shí)體,或硬件實(shí)體和軟件實(shí)體。

[來源:GB/T5271.1—2000,01.01.40]

3.5

語音合成speechsynthesis

1

T/GLAC****-****

通過機(jī)械的、電子的方法合成人類語言的過程。

[來源:GB/T36464.1—2020,3.6]

3.6

語音識(shí)別speechrecognition

將人類的聲音信號(hào)轉(zhuǎn)化為文字或者指令的過程。

[來源:GB/T36464.1—2020,3.7]

3.7

命令字識(shí)別commandwordrecognition

一種基于語音識(shí)別語法的語音識(shí)別方式,是在語音識(shí)別語法規(guī)則限定的范圍內(nèi),對(duì)于給定的語音輸

入,語音識(shí)別引擎給出語音識(shí)別語法覆蓋范圍內(nèi)的文本或拒識(shí)作為識(shí)別結(jié)果。

[來源:GB/T36461.1—2020,3.9]

3.8

連續(xù)語音識(shí)別continuousspeechrecognition

識(shí)別任意的連續(xù)語音,并給出相對(duì)應(yīng)的文本。

[來源:GB/T36461.1—2020,3.10]

3.9

語音喚醒voicewake_up;voicetrigger

處于音頻流監(jiān)控的語音交互系統(tǒng),在檢測到特定的特征或事件出現(xiàn)后,切換到命令字識(shí)別、連續(xù)語

音識(shí)別等其他處理狀態(tài)的過程。

[來源:GB/T36461.1—2020,3.17]

3.10

語音增強(qiáng)speechenhancement

當(dāng)有效語音信號(hào)被各種造成干擾,甚至淹沒后,從含有噪聲背景的聲音信號(hào)中提取有效語音信號(hào),

抑制、降低噪聲干擾的技術(shù)。

3.11

語音打斷speechinterruption

語音交互系統(tǒng)在播放聲音的過程中,當(dāng)語音采集設(shè)備檢測到有效語音輸入時(shí),中斷播放聲音,轉(zhuǎn)到

語音識(shí)別等其他處理過程。

[來源:GB/T36461.1—2020,3.29]

3.12

語義理解semanticunderstanding

使功能單元理解人說話的意圖。

[來源:GB∕T36464.1—2020,3.11]

3.13

指代消解coreferenceresolution

篇章中的一個(gè)語言單位(通常是詞或短語)與之前出現(xiàn)的語言單位存在特殊語義關(guān)聯(lián),其語義解釋

依賴于前者,指代消解就是將兩者關(guān)系進(jìn)行關(guān)聯(lián)。

3.15

知識(shí)推理knowledgeinference

推理是運(yùn)用邏輯思維能力,從已有的知識(shí)出發(fā),得出未知的、隱性的知識(shí)。語音交互中的知識(shí)推理

主要基于知識(shí)圖譜來實(shí)現(xiàn)。

2

T/GLAC****-****

3.16

槽slot

語音指令所明確定義的屬性信息,功能單元執(zhí)行操作前需要獲取的關(guān)鍵參數(shù)。

3.17

大語言模型largelanguagemodel

一種使用人工神經(jīng)網(wǎng)絡(luò)構(gòu)建的語言模型,它擁有許多參數(shù)(通常數(shù)十億個(gè)權(quán)重或更多),通過自監(jiān)

督學(xué)習(xí)或半監(jiān)督學(xué)習(xí)對(duì)大量未標(biāo)記文本進(jìn)行訓(xùn)練。

4總體要求

4.1控制對(duì)象

通過智能語音交互與引導(dǎo)技術(shù),實(shí)現(xiàn)對(duì)便攜式導(dǎo)航應(yīng)用軟件或車載導(dǎo)航應(yīng)用軟件的控制。

4.2語音交互成功率

語音交互成功率要求應(yīng)符合GB/T36464.5—2018中5.2.6的要求。

4.3硬件設(shè)備適用性

硬件設(shè)備適用性要求如下:

a)符合GB/T39774—2021中4.4的要求;

b)符合基本的音頻采集的硬件(傳聲器或麥克風(fēng)陣列)和基本的音頻播放的硬件(喇叭等)的要

求;

c)符合網(wǎng)絡(luò)通訊要求,可以接收Wi-Fi或者蜂窩移動(dòng)網(wǎng)絡(luò),CPU2000MHz以上,內(nèi)存2GM以上。

5系統(tǒng)框架

導(dǎo)航應(yīng)用軟件智能語音交互與引導(dǎo)系統(tǒng)框架包括語音交互界面、數(shù)據(jù)資源、前端處理、語音處理、

地圖服務(wù)、導(dǎo)航業(yè)務(wù)應(yīng)用等功能模塊,如圖1所示,其中:

a)語音交互界面提供系統(tǒng)與人直接進(jìn)行語音交互的人機(jī)界面,包括語音采集、語音應(yīng)答、語音

播報(bào)、語音信號(hào)輸入輸入、環(huán)境噪聲適應(yīng)能力;

b)數(shù)據(jù)資源包括系統(tǒng)處理的音頻數(shù)據(jù)、文本數(shù)據(jù)和地圖數(shù)據(jù);

c)前端處理包括語音喚醒、語音增強(qiáng);

d)語音處理包括語音識(shí)別、語義理解、多輪交互、語音合成、全雙工交互等功能;

e)地圖服務(wù)提供語音查詢、語音提示、語音引導(dǎo)的接口服務(wù);

f)導(dǎo)航業(yè)務(wù)處理對(duì)語音處理的結(jié)果轉(zhuǎn)換為對(duì)應(yīng)的應(yīng)用指令并反饋業(yè)務(wù)相應(yīng)結(jié)果,包括對(duì)駕車場

景、步行場景、騎行場景、公交場景的要求。駕車場景需提供查找目的地、引導(dǎo)信息播報(bào)、

交通信息問詢等功能;步行場景需提供查找目的地、引導(dǎo)信息播報(bào)等功能;騎行場景需提供

查找目的地、引導(dǎo)信息播報(bào)等功能;公交場景需提供查找目的地、換乘線路和到站提醒播報(bào)

等功能。

3

T/GLAC****-****

圖1系統(tǒng)框架示意圖

6語音交互界面

6.1語音采集

語音采集應(yīng)符合GB/T36464.1—2020中5.1的要求。

6.2語音應(yīng)答

6.2.1基本要求

系統(tǒng)應(yīng)支持針對(duì)用戶的輸入,通過語音答復(fù)的能力,即完成操作者與導(dǎo)航應(yīng)用軟件的一問一答人機(jī)

交互。

6.2.2聲音要求

應(yīng)答時(shí)的聲音要求如下:

a)應(yīng)符合聲音清晰,語速適中等要求;

b)宜支持個(gè)性化語音定制功能,用戶可設(shè)置定制化語音進(jìn)行應(yīng)答;

4

T/GLAC****-****

c)宜支持個(gè)性化語速定制功能,用戶設(shè)置定制化語速進(jìn)行應(yīng)答。

6.2.3內(nèi)容要求

應(yīng)答時(shí)的內(nèi)容要求如下:

a)應(yīng)包含基礎(chǔ)問答內(nèi)容(執(zhí)行成功/執(zhí)行不成功);

b)可包含詳情內(nèi)容和問詢內(nèi)容。導(dǎo)航中的詳細(xì)業(yè)務(wù)要求見本文件第6章。

示例1:找到頤和園,位于北京市海淀區(qū),距離你xkm。

示例2:去這里可以么?

6.2.4語言要求

應(yīng)答時(shí)的語言要求如下

a)應(yīng)支持按照用戶自主設(shè)置的語言進(jìn)行語音應(yīng)答;

b)應(yīng)符合GB/T36464.1—2020中5.3的要求。

6.3語音播報(bào)

6.3.1基本要求

系統(tǒng)應(yīng)支持語音播報(bào)的主動(dòng)引導(dǎo)能力。

6.3.2聲音要求

語音播報(bào)時(shí)的聲音要求如下:

a)應(yīng)符合聲音清晰,語速適中等要求;

b)宜支持個(gè)性化語音定制功能,用戶可設(shè)置定制化語音進(jìn)行播報(bào);

c)宜支持個(gè)性化語速定制功能,用戶設(shè)置定制化語速進(jìn)行播報(bào)。

6.3.3內(nèi)容要求

語音播報(bào)時(shí)的內(nèi)容要求如下:

a)應(yīng)在恰當(dāng)時(shí)機(jī)主動(dòng)為用戶播報(bào);

示例1:有更快路線推薦是否需要切換?

b)應(yīng)包含主動(dòng)的引導(dǎo)內(nèi)容;

示例1:您已超速,請(qǐng)減速。

6.3.4語言要求

應(yīng)支持按照用戶自主設(shè)置的語言進(jìn)行語音播報(bào)。

6.4輸入輸出

輸入輸出要求應(yīng)符合GB/T36464.1—2020中5.3的要求。

6.5環(huán)境噪聲適應(yīng)能力

環(huán)境噪聲適應(yīng)能力要求應(yīng)符合GB/T36464.1—2020中5.4的要求。

5

T/GLAC****-****

7數(shù)據(jù)資源

7.1音頻數(shù)據(jù)

音頻數(shù)據(jù)應(yīng)符合GB/T36464.1—2020中6.1的要求。

7.2文本數(shù)據(jù)

文本數(shù)據(jù)應(yīng)符合GB/T36464.1—2020中6.2的要求。

7.3地圖數(shù)據(jù)

導(dǎo)航電子地圖數(shù)據(jù)應(yīng)符合GB/T39774—2021中4.3的要求。

8前端處理

8.1語音喚醒

語音喚醒應(yīng)符合GB/T36464.1—2020中7.1的要求。除此之外應(yīng)符合以下要求:

a)本地小型化部署:應(yīng)小型化部署語音模型,方便在本地設(shè)備進(jìn)行部署,實(shí)現(xiàn)快速響應(yīng);

b)強(qiáng)環(huán)境適應(yīng)性:在各種復(fù)雜環(huán)境條件下,保證高準(zhǔn)確率;

c)低延遲:應(yīng)做到實(shí)時(shí)語音識(shí)別;

d)用戶隱私保護(hù):收集到的語音數(shù)據(jù)只能用于改善識(shí)別性能,除非用戶同意,不能用于其它任何

目的;

e)低功耗:喚醒模塊應(yīng)盡可能降低功耗,以減少電池?fù)p耗;

f)反饋機(jī)制:當(dāng)語音識(shí)別出現(xiàn)錯(cuò)誤時(shí),需要有反饋機(jī)制,以提高識(shí)別精度;

g)假喚醒控制機(jī)制:應(yīng)盡可能降低假喚醒情況發(fā)生,以免為用戶造成嚴(yán)重困擾。

8.2語音增強(qiáng)

語音增強(qiáng)應(yīng)符合GB/T36464.1—2020中7.4的要求。除此之外應(yīng)符合以下要求:

a)自適應(yīng)增益控制:應(yīng)根據(jù)檢測到的環(huán)境噪聲強(qiáng)度自動(dòng)調(diào)整音量的增益控制,以保持輸出語音的

一致性和穩(wěn)定性;

b)硬件兼容性:應(yīng)能適配各種音頻采集設(shè)備,比如不同型號(hào)和品牌的麥克風(fēng)等;

c)軟件兼容性:應(yīng)能適配各種操作系統(tǒng);

d)頻譜增強(qiáng):可通過調(diào)整語音信號(hào)頻譜特性,提高語音的清晰度;

e)用戶隱私保護(hù):處理和傳輸用于語音數(shù)據(jù)時(shí),需保護(hù)用戶隱私。

9語音處理

9.1語音識(shí)別

語音識(shí)別應(yīng)符合GB/T36464.1—2020中8.1的要求。除此之外應(yīng)符合以下要求:

6

T/GLAC****-****

a)活體檢測:應(yīng)能區(qū)分真人聲音和錄音,避免被合成語音攻擊;

b)多通道識(shí)別:應(yīng)支持分離和識(shí)別各個(gè)通道語音的能力;

c)用戶隱私保護(hù):

1)應(yīng)能夠透明告知數(shù)據(jù)使用范圍

2)數(shù)據(jù)收集最小化

3)對(duì)數(shù)據(jù)進(jìn)行加密存儲(chǔ)和匿名處理,并對(duì)數(shù)據(jù)做到訪問權(quán)限控制和安全傳輸;

d)魯棒性:應(yīng)能適應(yīng)各種噪聲環(huán)境及音頻采集設(shè)備;

e)低延遲和實(shí)時(shí)性:應(yīng)做到實(shí)時(shí),快速的語音識(shí)別,以保證交互體驗(yàn);

f)持續(xù)學(xué)習(xí)能力:應(yīng)具有持續(xù)學(xué)習(xí)能力,來提高識(shí)別性能。

9.2語義理解

9.2.1概述

語義理解按照實(shí)現(xiàn)方式分為傳統(tǒng)語義理解和大語言模型語義理解。基于大語言模型語義理解支持

從端到端語義理解方案,可直接將用戶的問題映射成對(duì)應(yīng)的API調(diào)用。

9.2.2傳統(tǒng)語義理解

傳統(tǒng)語義理解應(yīng)符合GB/T36464.1—2020中8.2的要求。除此之外應(yīng)符合以下要求:

a)情感識(shí)別(可選):能夠識(shí)別用戶情感狀態(tài),進(jìn)而提供更加人性化的對(duì)話體驗(yàn);

b)上下文理解:能夠結(jié)合上下文對(duì)話歷史和環(huán)境,準(zhǔn)確捕捉用戶意圖;

c)持續(xù)學(xué)習(xí):能夠根據(jù)用戶反饋,持續(xù)學(xué)習(xí),來不斷優(yōu)化語義理解能力;

d)新增意圖和槽位:應(yīng)支持快速處理新增意圖和槽位提取的能力;

e)推理能力:應(yīng)具有基本推理能力,如針對(duì)“現(xiàn)在”,“下周一天氣”等,需要準(zhǔn)確識(shí)別出時(shí)間

和日期;

f)多模態(tài)交互:除語音信息外,可結(jié)合當(dāng)前屏幕顯示狀態(tài),觸控等信息,提供更加靈活的交互方

式;

g)情景理解:能夠針對(duì)不同對(duì)話情景的特點(diǎn)和約束,提供針對(duì)性的理解和響應(yīng)。

9.2.3大語音模型語義理解

端到端語義理解方案除了符合傳統(tǒng)語義理解要求外,還應(yīng)符合以下要求:

a)可解釋性:為了保證安全和可靠性,模型決策過程需要盡可能透明;

b)長期記憶能力:模型要有能力理解和記憶長期對(duì)話歷史;

c)事實(shí)驗(yàn)證機(jī)制:對(duì)生成的輸出內(nèi)容和決策結(jié)果進(jìn)行驗(yàn)證,確保信息的準(zhǔn)確性;

d)防止幻覺:確保模型不會(huì)無中生有,編造虛假信息;

e)倫理合規(guī):防止模型運(yùn)行時(shí)產(chǎn)生有害、歧視、色情等不適當(dāng)?shù)膬?nèi)容;

f)安全性:模型應(yīng)能夠應(yīng)對(duì)潛在的攻擊和惡意輸入等。

7

T/GLAC****-****

9.3多輪交互

9.3.1基本要求

多輪交互需要結(jié)合上下文信息,對(duì)用戶當(dāng)前文本進(jìn)行更深度語義理解,并且具備主動(dòng)開啟新一輪對(duì)

話的能力,具體需具有指代消解、省略槽位自動(dòng)補(bǔ)齊、意圖或槽位澄清、知識(shí)推理等功能模塊之外,還

應(yīng)包括容錯(cuò)機(jī)制、自然交互、對(duì)話中斷與恢復(fù)、可擴(kuò)展性、個(gè)性化交互功能。

9.3.2容錯(cuò)機(jī)制

當(dāng)系統(tǒng)發(fā)生錯(cuò)誤或者錯(cuò)會(huì)用戶意圖時(shí),要有錯(cuò)誤提示和糾錯(cuò)機(jī)制。

9.3.3自然交互

應(yīng)保證自然的交互體驗(yàn),符合人類語言習(xí)慣,避免生硬和割裂的對(duì)話體驗(yàn)。

9.3.4對(duì)話中斷與恢復(fù)

用戶中斷對(duì)話或重啟對(duì)話時(shí),需準(zhǔn)確理解和判斷是否開啟新的對(duì)話,還是承接上一個(gè)對(duì)話。

9.3.5可擴(kuò)展性

支持新的交互需求的快速融入。

9.3.6個(gè)性化交互

在保障用戶隱私的前提下,獲取用戶授權(quán)后,結(jié)合用戶偏好和歷史行為,提供個(gè)性化的交互體驗(yàn)。

9.4語音合成

語音合成要求應(yīng)符合GB/T36464.1—2020中8.3的要求。除此之外還應(yīng)符合以下要求:

a)宜支持個(gè)性化語音定制功能,通過用戶自定義的語調(diào)、音色、語速實(shí)現(xiàn)語音合成功能;

b)個(gè)性化語音定制時(shí)的訓(xùn)練樣本語句應(yīng)不超過20句話,每句話的字?jǐn)?shù)宜不超過20個(gè)字。

9.5全雙工交互

全雙工交互應(yīng)符合GB/T36464.1—2020中8.6的要求。除此之外還應(yīng)符合以下要求:

a)回聲消除的能力應(yīng)消除麥克風(fēng)與喇叭因空氣產(chǎn)生回受路徑而產(chǎn)生的雜音;

b)語音打斷的能力應(yīng)符合GB/T36464.5—2018中5.3.2的要求。

10地圖服務(wù)

10.1語音查詢

10.1.1查詢對(duì)象

查詢對(duì)象要求應(yīng)符合GB/T39774—2021中5.2.1的要求,宜給出深度服務(wù)信息。

10.1.2查詢結(jié)果列表

查詢結(jié)果列表應(yīng)符合下列要求:

a)支持通過語音播報(bào)查詢結(jié)果列表;

8

T/GLAC****-****

b)優(yōu)先選擇滿足用戶需求的唯一結(jié)果;

c)當(dāng)存在多個(gè)查詢結(jié)果時(shí),通過結(jié)果相關(guān)性順序播報(bào)查詢結(jié)果列表。

10.1.3查詢效率

用戶查詢語音指令發(fā)出后,查詢的響應(yīng)時(shí)間和超時(shí)處理應(yīng)符合下列規(guī)定:

a)在行中導(dǎo)航場景做到快速響應(yīng),查詢響應(yīng)時(shí)間應(yīng)不大于2s;

b)在行前復(fù)雜決策場景,查詢響應(yīng)時(shí)間應(yīng)不大于5s;

c)若響應(yīng)時(shí)間大于5s,應(yīng)在等待過程中給予用戶處理過程進(jìn)度反饋;

d)響應(yīng)時(shí)間超時(shí),給出查詢超時(shí)響應(yīng)并退出操作。

10.2語音提示

語音提示要求應(yīng)符合GB∕T39774—2021中5.5.2的要求

10.3語音引導(dǎo)

10.3.1基本要求

語音引導(dǎo)應(yīng)智能化,在GB∕T39774—2021中5.4.3規(guī)定的場景下應(yīng)能全部及時(shí)給出語音引導(dǎo)指令。

10.3.2引導(dǎo)時(shí)機(jī)

語音引導(dǎo)時(shí)機(jī)應(yīng)智能化,應(yīng)根據(jù)實(shí)時(shí)車速、所在道路種別和交通場景設(shè)置合理的引導(dǎo)時(shí)間提前量,

為導(dǎo)航應(yīng)用軟件使用者留出預(yù)判和執(zhí)行下一步動(dòng)作的時(shí)間。

11導(dǎo)航業(yè)務(wù)應(yīng)用要求

11.1查找目的地

查找目的地應(yīng)符合三種場景下的語音指令交互,包括發(fā)起導(dǎo)航前查找目的地、導(dǎo)航過程中更換目的

地、途經(jīng)某地去往目的地。交互過程遵循如下步驟:

a)通過預(yù)先定義的命令字喚醒系統(tǒng);

b)用戶語音說出使用場景與目的地名稱或者途經(jīng)某地去往目的地;

示例1:導(dǎo)航/步行/騎行去中國美術(shù)館。

示例2:途經(jīng)中國美術(shù)館,導(dǎo)航/步行/騎行去往天安門。

c)導(dǎo)航前查找目的地:播報(bào)目的地詳細(xì)信息、詢問是否發(fā)起導(dǎo)航;

示例3:為您找到中國美術(shù)館,位于東城區(qū)五四大街1號(hào),需要導(dǎo)航嗎?

d)導(dǎo)航中更換目的地:播報(bào)目的地詳細(xì)信息、詢問是否更換目的地;

示例4:為您找到中國美術(shù)館,距您1.2km,需要更換目的地嗎?

e)途徑某地去往目的地:導(dǎo)航前與導(dǎo)航中支持多個(gè)途經(jīng)地點(diǎn)的設(shè)置與刪除,播報(bào)途徑地詳細(xì)信息,

詢問用戶是否確認(rèn)途經(jīng)地點(diǎn)。

示例5:為您找到途徑中國美術(shù)館、中國國家博物館的路線,需要開始導(dǎo)航嗎?

9

T/GLAC****-****

11.2引導(dǎo)信息播報(bào)

針對(duì)11.1查找目的地產(chǎn)生的規(guī)劃路徑,進(jìn)入不同場景導(dǎo)航中,引導(dǎo)信息播報(bào)應(yīng)符合如下要求:

a)語音播報(bào)內(nèi)容應(yīng)根據(jù)不同場景和應(yīng)用方式建立語音模板,在具體位置對(duì)特定模板的內(nèi)容進(jìn)行填

充,最后將組織好的文字通過語音合成技術(shù)適時(shí)播報(bào);

b)導(dǎo)航誘導(dǎo)語音播報(bào)模板基礎(chǔ)類別分為如下4類:

1)路口轉(zhuǎn)向提示信息

路口轉(zhuǎn)向提示語音模板的基本結(jié)構(gòu)宜為“‘前方’+距離+操作+‘去往’+前方道路名稱+附

加提示”?!熬嚯x”是指從當(dāng)前位置到轉(zhuǎn)向處的距離?!安僮鳌笔侵傅睫D(zhuǎn)向處時(shí),需要做

的操作,可分為左轉(zhuǎn)、右轉(zhuǎn)、靠左、靠右等?!案郊犹崾尽笔侵附Y(jié)合道路實(shí)際情況、車道

和自然地物(如紅綠燈路口、三岔路、上高架)等補(bǔ)充播報(bào)信息。

示例1:前方500m請(qǐng)右轉(zhuǎn),去往西五環(huán)路,請(qǐng)注意提前并入最右側(cè)車道。

2)路段中警示提示信息

路段中警示提示分兩種場景,實(shí)地警示信息提示與針對(duì)用戶違規(guī)行為提示,要求如下:

?實(shí)地警示信息語音模板基本結(jié)構(gòu)宜為“‘前方’+距離+警示場景+(附加信息)”?!熬?/p>

離”是指從當(dāng)前位置到現(xiàn)場警示信息的距離?!熬緢鼍啊笔侵杆淼?、鐵道、橋梁、

電子監(jiān)控設(shè)備、交通警告設(shè)施等?!案郊有畔ⅰ笔侵府?dāng)有監(jiān)控設(shè)備時(shí),此段道路的限

速值信息,或有交通警告牌的路段對(duì)應(yīng)的駕駛提示信息等。

示例2:前方300m有測速攝像頭,限速80km/h。

?應(yīng)對(duì)用戶違反法規(guī)、或影響用戶駕駛安全的行為進(jìn)行強(qiáng)烈提醒。如違規(guī)變道、超速、

走應(yīng)急車道、公交車道等行為,提醒的優(yōu)先級(jí)高于一般的警示信息。

3)路段中路況提示信息

以實(shí)時(shí)路況、事故、紅綠燈倒計(jì)時(shí)為主,路段中路況提示語音模板基本結(jié)構(gòu)宜為“‘前方’

+距離+前方道路名稱+警示場景+(附加信息)”。“警示場景”可根據(jù)內(nèi)容分為擁堵路況

提示、路口路況提示、交通事件提示等。

示例3:前方300m黃河北大街嚴(yán)重?fù)矶?,?qǐng)注意繞行。

示例4:前方300m路口紅燈即將變綠,請(qǐng)準(zhǔn)備起步。

4)友情提示信息

友情提示分為與地點(diǎn)相關(guān)及與地點(diǎn)無關(guān)提示。與地點(diǎn)相關(guān)語音模板的基本結(jié)構(gòu)宜為“‘前

方’+距離+友情提示”,“友情提示”可根據(jù)內(nèi)容分為出發(fā)時(shí)提示、抵達(dá)目的地提示等。

與地點(diǎn)無關(guān)友情提示可以包含更多駕駛關(guān)懷信息。如疲勞駕駛、服務(wù)區(qū)休息提醒、路段積

水、橫風(fēng)大霧、紅綠燈變燈提醒等。

示例5:前方100m達(dá)到目的地,石景山游樂園在您的右前方。

c)播報(bào)頻次要求

導(dǎo)航過程中根據(jù)不同信息的重要程度、以及用戶的操作成本和判斷成本的不同,給用戶進(jìn)行不

同頻次的強(qiáng)調(diào)。

1)簡單的直行路口在路口前給予用戶1—2次提醒;

2)復(fù)雜路口,如轉(zhuǎn)向角度大的路口或多方向的路口需要用戶提前選擇好方向,需要給用戶多

10

T/GLAC****-****

次提醒,確保用戶不會(huì)因?yàn)殄e(cuò)失路口或者選錯(cuò)方向,導(dǎo)致偏航繞路;

3)距離相近的相同信息,可適當(dāng)合并播報(bào),降低播報(bào)頻次,比如多個(gè)匯入口、多個(gè)相同類型

電子眼。

d)播報(bào)時(shí)機(jī)要求

播報(bào)內(nèi)容需要在合適的時(shí)機(jī)播報(bào)傳達(dá)給用戶,確保用戶在聽到信息后仍能及時(shí)有效做出反應(yīng)。

e)播報(bào)優(yōu)先級(jí)要求

道路元素多且復(fù)雜,當(dāng)相同位置存在多個(gè)需要提示的信息時(shí),根據(jù)信息的重要程度決策最高優(yōu)

的一個(gè)進(jìn)行提示。優(yōu)先級(jí)從高到低依次為駕駛安全提示、路口轉(zhuǎn)向提示、直行路口提示、道路

安全提示。

f)播報(bào)表達(dá)要求

播報(bào)內(nèi)容表達(dá)要求語言足夠清晰易懂,保證用戶能夠準(zhǔn)確理解播報(bào)的內(nèi)容信息,降低理解難度,

要求如下:

1)每一句播報(bào)的話術(shù)不宜過長;

2)播報(bào)元素不宜過多;

3)兩句播報(bào)之間需有間隔,不宜連續(xù)不停播報(bào)。

11.3結(jié)束導(dǎo)航

導(dǎo)航過程中可通過語音交互結(jié)束導(dǎo)航,方式有三種:

a)通過預(yù)先定義的命令字喚醒系統(tǒng);

b)用戶語音輸入“結(jié)束導(dǎo)航”。

c)語音回復(fù)操作結(jié)果。

示例:導(dǎo)航結(jié)束下次見。

結(jié)束導(dǎo)航需要在合適的位置結(jié)束,不宜過早或過晚,要求如下:

a)用戶距離目的地較遠(yuǎn)(300m以上)不宜結(jié)束導(dǎo)航;

b)用戶在到達(dá)目的地后仍在導(dǎo)航,可以通過語音問詢是否需要繼續(xù)導(dǎo)航。

11.4駕車場景

11.4.1查找目的地

駕車場景查找目的地,基本要求見11.1。當(dāng)目的地存在更加精細(xì)的誘導(dǎo)信息時(shí),如:停車場等,可

通過語音進(jìn)行二次交互。

示例:為您找到奎科科技大廈,西門存在停車場,要導(dǎo)航去西門么?

11.4.2引導(dǎo)信息播報(bào)

駕車場景引導(dǎo)信息播報(bào),基本要求見6.2,同時(shí)應(yīng)遵循如下要求:

a)播報(bào)內(nèi)容要求:對(duì)于駕車安全的路段中警示信息應(yīng)覆蓋完整,如:道路限速信息、交通警告牌、

限行、擁堵等;

b)播報(bào)頻次要求:轉(zhuǎn)向角度大的路口和多方向的路口需要用戶提前選擇好車道與方向,操作和選

擇成本更高,需要給用戶4~5次以上的預(yù)警;

11

T/GLAC****-****

c)播報(bào)時(shí)機(jī)要求:車道提示提前xxm,需要保證在聽到后仍有足夠變道范圍,限速電子眼提示提

前xxm,需要保證聽到后有足夠的減速區(qū)間;

d)播報(bào)優(yōu)先級(jí)要求:駕車場景下提示信息重要程度排序,路口轉(zhuǎn)向提示>直行路口提示>限

速抓拍、違章抓拍>道路安全提示;

e)播報(bào)表達(dá)要求:駕車場景無特殊要求播報(bào)應(yīng)簡明扼要、容易理解、自然親切,避免干擾用戶駕

駛及減少聽覺疲勞。

11.4.3交通信息問詢

駕車場景下,需要符合常用交通信息、不同形式的語音指令交互,包含限行信息問詢、限速信息問

詢、路況信息問詢、交通限制信息問詢、服務(wù)區(qū)信息問詢、高速收費(fèi)金額信息問詢等,查詢的基本示例

如下:

a)通過預(yù)先定義的命令字喚醒系統(tǒng);

b)語音問詢不附加條件的限行信息;

示例1:今天限號(hào)多少?

c)播報(bào)用戶所在地理位置的限行信息;

示例2:(地理位置在北京)北京市今天限行尾號(hào)為5、0。

d)語音問詢指定區(qū)域的限行信息;

示例3:北京市限號(hào)多少?

e)播報(bào)指定區(qū)域的限行信息;

示例4:北京市今天限行尾號(hào)為5、0。

f)語音問詢指定區(qū)域的交通限制信息;

示例5:青年大街禁止左轉(zhuǎn)時(shí)間是多少?

g)播報(bào)指定區(qū)域的交通限制信息;

示例6:青年大街全天禁止左轉(zhuǎn)。

h)語音問詢不附加條件的服務(wù)區(qū)信息;

示例7:離服務(wù)區(qū)多遠(yuǎn)?

i)播報(bào)用戶所在地理位置的服務(wù)區(qū)信息;

示例8:前方500m到達(dá)劉千戶服務(wù)區(qū)。

j)語音問詢指定區(qū)域的高速收費(fèi)金額信息;

示例9:去沈陽故宮走高速的費(fèi)用。

k)播報(bào)指定區(qū)域的高速收費(fèi)金額信息。

示例10:去往沈陽故宮高速費(fèi)用約為100元。

11.4.4信息上報(bào)

駕車導(dǎo)航過程中,事故、擁堵、施工、封路等場景可通過語音交互上報(bào)事件詳細(xì)信息,交互輪次不

超過3輪,避免對(duì)用戶造成打擾,交互要求如下:

a)通過預(yù)先定義的命令字喚醒系統(tǒng);

b)用戶語音說出上報(bào)類型;

12

T/GLAC****-****

c)語音引導(dǎo)用戶提供詳細(xì)信息。

示例:

軟件語音回復(fù):請(qǐng)問事故發(fā)生在哪側(cè)車道呢?

用戶:左側(cè)

軟件回復(fù):請(qǐng)問事故是剮蹭、追尾還是嚴(yán)重事故呢?

用戶:剮蹭

軟件語音回復(fù):上報(bào)成功,您的反饋將可能幫助14人。

11.4.5結(jié)束導(dǎo)航

駕車場景結(jié)束導(dǎo)航,基本要求見11.3。

11.5步行場景

11.5.1查找目的地

步行場景查找目的地,基本要求見11.1

11.5.2引導(dǎo)信息播報(bào)

11.5.2.1路途中提前播報(bào)

在步行方向變化或變換特殊結(jié)構(gòu)位置時(shí),需語音播報(bào)步行代價(jià)大的相關(guān)信息,如:天橋、地下通道、

隧道、階梯等。提前進(jìn)行語音播報(bào)提醒用戶準(zhǔn)備上天橋/下天橋,播報(bào)內(nèi)容需包含,“前方進(jìn)入天橋,

請(qǐng)步行上天橋/下天橋”。

11.5.2.2到達(dá)提醒播報(bào)

在到達(dá)上天橋/下天橋附近,還有20m或5m時(shí),需進(jìn)行語音播報(bào),提醒用戶準(zhǔn)備上天橋/下天橋,

播報(bào)內(nèi)容需區(qū)分步行方向變化、離目的地距離、預(yù)計(jì)到達(dá)時(shí)間等情況進(jìn)行播報(bào)。

示例1:(步行方向變化)您已到達(dá)xx天橋,請(qǐng)直行上天橋。

示例2:(預(yù)計(jì)到達(dá)時(shí)間)離目的地還剩xxkm,預(yù)計(jì)步行xx分鐘后到達(dá)。

11.5.3結(jié)束導(dǎo)航

步行場景結(jié)束導(dǎo)航,基本要求見11.3

11.6騎行場景

11.6.1查找目的地

騎行場景查找目的地,基本要求見11.1

11.6.2引導(dǎo)信息播報(bào)

11.6.2.1路途中提前播報(bào)

13

T/GLAC****-****

在騎行前進(jìn)方向變化或變換特殊結(jié)構(gòu)位置時(shí),需語音播報(bào)騎行代價(jià)大的相關(guān)信息,如:天橋、地下

通道、隧道、階梯等,提醒用戶

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論