語音控制無人機初探_第1頁
語音控制無人機初探_第2頁
語音控制無人機初探_第3頁
語音控制無人機初探_第4頁
免費預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、    語音控制無人機初探    朱立鑫 崔韞鑫摘要:隨著無人機技術(shù)的迅猛發(fā)展,控制無人機的方式也在不斷革新。研究在開源地面站上實現(xiàn)無人機語音指令控制技術(shù),可使操作更加便捷。通過簡潔、友好的語音界面就可與控制系統(tǒng)進行深入信息交互,完成語音指令所代表復(fù)雜控制內(nèi)容。由于本文僅為語音控制無人機初探,主要介紹通過特定的一種方式實現(xiàn)語音控制。本文以開源地面站mission planner作為基礎(chǔ)進行軟件開發(fā),利用windows自帶的語音識別模塊進行識別及其在無人機控制中的應(yīng)用為研究內(nèi)容,借此來簡化無人機控制流程、提供一種簡潔的語音指令控制界面,重點研究了語音識別技

2、術(shù)在無人機控制上的應(yīng)用。關(guān)鍵詞:語音識別;無人機;地面站語音識別技術(shù)是一種人機交互技術(shù)。語言作為信息溝通的最主要方式,可為人機交互使用時提供其它方式不可替代的直接和便利。因此,將語音識別這種人機交互手段應(yīng)用于無人機控制方面,可以為操作人員提供一種簡便的語音指令控制界面,使操作更加便捷。一、語音控制無人機研究現(xiàn)狀2001年,美國斯坦福大學(xué)研制出witas多模態(tài)對話系統(tǒng)用于控制無人機設(shè)備。隨后,語音控制技術(shù)高速發(fā)展。目前,我國民用無人機領(lǐng)域內(nèi),語音控制無人機已成為下一發(fā)展階段。二、語音控制無人機總體設(shè)計本人主要從三個方面介紹語音控制無人機,即語音識別技術(shù)、指令控制及地面站軟件開發(fā)。三、無人機語音識

3、別技術(shù)本文主要介紹通過使用c#和speech sdk來進行語音識別。本文介紹的語音識別功能,其實就是利用windows的語音引擎,它包含在speech sdk開發(fā)包中。我們就是使用此開發(fā)包根據(jù)自己的需要開發(fā)程序。speech sdk包含語音識別sr引擎和語音合成ss引擎兩種語音引擎。語音識別引擎用于識別語音命令,調(diào)用接口完成某個功能,實現(xiàn)語音控制。語音合成引擎用于將文字轉(zhuǎn)換成語音輸出。語音識別引擎分兩種模式識別:文本識別模式和命令識別模式。此兩種模式的主要區(qū)別在于識別過程中使用的匹配字典不同。前者使用的是通用字典,特點是覆蓋的詞匯量大,因為詞匯量大直接導(dǎo)致識別的精度降低,識別速度較慢。后者的字

4、典需要開發(fā)者自己編寫,這種方式由開發(fā)者定義詞匯的數(shù)量,大大降低匹配過程中需要檢索的詞匯量,提高了識別速度,同時因為候選項極少,所以一般不會識別錯誤。由于控制無人機飛行僅需要幾個特定的指令,而且對識別率要求較高,所以選用命令識別模式進行語音識別開發(fā)。四、無人機飛行協(xié)議及控制指令(一)mavlink簡介mavlink協(xié)議是在串口通訊基礎(chǔ)上的一種更高層的開源通訊協(xié)議,主要應(yīng)用在微型飛行器(micro aerial vehicle)的通訊上。mavlink是為小型飛行器和地面站通訊時常常用到的那些數(shù)據(jù)制定一種發(fā)送和接收的規(guī)則并加入了校驗(checksum)功能。如圖所示,每個消息幀都是上述的結(jié)構(gòu),除了

5、灰色外,其他的格子都代表了一個字節(jié)的數(shù)據(jù)?;疑褡永锩娴臄?shù)據(jù)長度是不固定的。紅色的是起始標(biāo)志位(stx)。這個標(biāo)志位用于mavlink消息幀接收端進行消息解碼。第二個格子代表的是payload的字節(jié)長度(len),范圍從0255。第三個格子代表的是本次消息幀的序號(seq),每次發(fā)完一個消息,這個字節(jié)的內(nèi)容會加1,加到255后會從0重新開始。這個序號用于mavlink消息幀接收端計算消息丟失比例。第四個格子代表發(fā)送本條消息幀的設(shè)備的系統(tǒng)編號(sys)。第五個格子代表了發(fā)送本條消息幀的設(shè)備的單元編號(comp)。第六個格子代表了有效載荷中消息包的編號(msg),mavlink消息幀接收端根據(jù)這個

6、編號來確定有效載荷里的消息包并根據(jù)編號選擇對應(yīng)的方式來處理有效載荷里的信息包。最后兩個字節(jié)是16位校驗位,ckb是高八位,cka是低八位。校驗碼由crc16算法得到。(二)地面站和飛控的通訊流程無人機連接好mp地面站后,都會主動向地面站發(fā)送心跳包、飛行器姿態(tài)、系統(tǒng)狀態(tài)等組成的數(shù)據(jù)流。地面站會在剛連接上飛控時發(fā)送命令,請求飛控傳回所有參數(shù),飛控根據(jù)自己的情況判斷是否接受地面站的請求,并根據(jù)不同的命令執(zhí)行相應(yīng)的操作。mp地面站比較成熟,在軟件內(nèi)已經(jīng)預(yù)設(shè)了無人機飛行所需的各種指令。這些指令通過mavlink協(xié)議傳遞給飛控,從而實現(xiàn)對無人機的控制。我們只需在地面站中找到這些指令,將語音識別結(jié)果與這些指

7、令相對應(yīng)就可以實現(xiàn)對無人機的語音控制。五、地面站軟件開發(fā)mission planner是一個功能齊全的開源地面站應(yīng)用程序。本人在此軟件的基礎(chǔ)上進行二次開發(fā),加入語音識別模塊,將識別結(jié)果與無人機飛行命令相對應(yīng),從而實現(xiàn)對無人機的語音控制。實現(xiàn)語音控制用到的mp地面站內(nèi)的飛行指令,主要是導(dǎo)航命令。導(dǎo)航命令是用于控制無人機的運動,包括起飛、航路點和移動至周圍和著陸。本人用到的導(dǎo)航命令:mav_cmd_nav_takeoff:從地面起飛(發(fā)射)。實現(xiàn)“起飛”指令。mav_cmd_nav_return_to_launch:返回home位置或就近的集結(jié)點。home的位置是飛行器解鎖位置。實現(xiàn)“返航”指令。mav_cmd_nav_land:在當(dāng)前或指定位置降落。實現(xiàn)“降落”指令。mav_cmd_nav_guided_enable:啟用引導(dǎo)控制模式切換到外部控制器。在guided模式下,在預(yù)先建立的三維坐標(biāo)系中,引導(dǎo)無人機在空間中實現(xiàn)“前進”、“后退”、“向左”、“向右”、“上升”、“下降”等指令。六、總結(jié)本文以開源地面站mission planner作為基礎(chǔ)進行軟件開發(fā),利用windows自帶的語音識別模塊進行識別及其在無人機控制中的應(yīng)用為研究內(nèi)容,借此簡化無人機控制流程、提供一種簡潔的語音指令控制界面,實現(xiàn)了語音控制無人機功能。本文僅為語音控制無人機初探,主要介紹通過特

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論