對話機器人語音識別之語義分析技術(shù)(計算機自然語言文字理解)的結(jié)構(gòu)思路_第1頁
對話機器人語音識別之語義分析技術(shù)(計算機自然語言文字理解)的結(jié)構(gòu)思路_第2頁
對話機器人語音識別之語義分析技術(shù)(計算機自然語言文字理解)的結(jié)構(gòu)思路_第3頁
對話機器人語音識別之語義分析技術(shù)(計算機自然語言文字理解)的結(jié)構(gòu)思路_第4頁
對話機器人語音識別之語義分析技術(shù)(計算機自然語言文字理解)的結(jié)構(gòu)思路_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、漢語語義分析技術(shù)的初步結(jié)構(gòu)思路語義分析技術(shù)需要實現(xiàn)的技術(shù)目標: 使對話機器人軟件能夠理解人類對他輸 入的句子的意思。這里需要強調(diào)的是“理解” ,而不是“識別”。本文所認為的文 字“識別” 是由專門的識別技術(shù)實現(xiàn), 包括使用光感掃描、 語音識別或直接鍵盤 輸入等一切可能的手段得到的文字符號, 而本文所指的語義分析技術(shù)是指對文字 識別技術(shù)( 不僅包括語音識別 )所識別出的文字符號的 理解力 。本文思路是通過對某一個語種的語法結(jié)構(gòu)進行分析, 進而使對話機器人軟件 實現(xiàn)基本的語義理解能力。本文對機器人軟件的智能程度理解如下:人類之間對話交流以 話題 為核心,一對一答可以形成一個基本的 對話單元 , 各

2、個對話單元邏輯上相互銜接就形成一個話題。對話單元基本可分為:1 問答式對話。如:甲:你在哪里?乙:我在家里2 命令式對話( 包括要求或請求 )。如:甲:請不要吸煙。乙:好的乙:你說的對 乙:哦。3 陳述式對話。如: 甲:這是個陷阱。 甲:我今天好傷心! 甲:今天天氣真好!。乙:是?。υ挋C器人軟件想要具備人機對話功能, 則必須首先具備完成一個對話單元 的能力。因此,對上述 3 種對話類型的語義分析是實現(xiàn)對話機器人軟件的重要途 徑。對上述 3 種對話單元的實現(xiàn),可以使對話機器人實現(xiàn)不同層次的智能程度。 完成命令式對話單元可以使對話機器人具備基本的商業(yè)功能, 如: 命令: 開 燈。機器人答:好的,

3、然后執(zhí)行。 但本文認為這種簡單的命令對答并不具備實用的商業(yè)功能,女口,對機器人命令:開燈,機器人可以聽懂,如果說:“把等打開”, “把燈開開”或“打開燈”等其他命令方式,則機器人就很容易聽不懂。如換成 另外一種設(shè)備,命令可能變?yōu)椋骸盁_”、“加滿”、“烘干”等,則出現(xiàn)的命令格 式會更加多變,機器人更加無法理解。這樣需要人類按照固定的文字向機器人輸 出命令它才能聽懂,因此嚴重限制了智能設(shè)備的實用性, 消費者體驗較差,這種 情況下智能設(shè)備必將逐步淪為雞肋產(chǎn)品。因此要讓對話機器人具備較好的實用性, 則必須讓對話機器人能夠?qū)θ祟愝斎氲木渥訉崿F(xiàn)語義分析與理解。(下文將詳細闡述實現(xiàn)思路)另外,對話機器人即

4、便實現(xiàn)了對命令句的語義理解, 本文認為也只是實現(xiàn)了基本 的實用功能,算不上實現(xiàn)了基本的智能。要想實現(xiàn)基本的智能,則需要對話機器 人能夠聽懂人類的問句。完成問答式對話單元可以使對話機器人具備基本的智能程度。 即具備了與人 類進行最基本的溝通能力(命令式對話屬于單向性質(zhì),而問答式屬于雙向性質(zhì))。讓對話機器人具備完成陳述式對話單元的能力,是機器人具備初級智能程度 的更高層次表現(xiàn)。能夠完成陳述式對話可以讓對話機器人實現(xiàn)與人類閑聊和初級 的感情互動功能。高級智能程度的機器人,可以讓對話機器人具備將各個對話單元形成上下邏 輯關(guān)系的能力,即完成一個基本的話題。女口:問:你打籃球了嗎?答:是的。問: 在哪打的

5、?答:球場。第二個問句在邏輯上承接了第一句問句,指的是在哪打球, 而不是在哪打架,因為“打”字可以形成很多種行為動次。另外,還可以不但實 現(xiàn)對漢語中單句的語義分析能力,而且要實現(xiàn)對復(fù)句(如果。就0 0 0)的語義 分析能力。高級智能程度的機器人還可以建立一個事物與另一個事物之間的聯(lián)系,(如人與衣服之間可以建立穿、保暖、美觀等聯(lián)系 )。還可以實現(xiàn)對話題中岔開 話題行為的處理及多人對話能力等等更多功能。然而,以上這些智能程度對機器人來講, 依然只處于智能階段,他們只具備 記憶和學(xué)習(xí)能力(記憶和學(xué)習(xí)方法下文闡述),而機器人最終必將走向智慧階段,即具備邏輯思維能力。例如,如下思路可以實現(xiàn)最初級的邏輯分

6、析能力,即有利或有害的分析判斷能力,機器人接收到一句話,會先判斷這個句子的信息是積極 還是消極,當(dāng)人類告訴機器人一個積極的信息, 機器人的回答則積極,遇到消極 信息則回答比較消極。上述總結(jié):機器人對語言的理解力是機器人智能程度的衡量標準,因此語義分析系統(tǒng)才是機 器人領(lǐng)域的核心與靈魂部分。語義分析系統(tǒng)對話單元1話題.。(單元與單元之間成邏輯關(guān)系)對話單元2對話單元3陳述式對話命令式對話問答式對話具備實用性初級智能其他高級功能邏輯分析能力邏輯分析能力高級智能語義分析的部分思路闡述(略去命令式和陳述式語義理解部分)以問答式對話單元為例:人問機答:(以第二人稱“你”為例),女口:你叫什么?你是誰?你在

7、干啥?思路如下:1建立動次數(shù)據(jù)庫、形容詞數(shù)據(jù)庫、代名詞數(shù)據(jù)庫等等各種詞類數(shù)據(jù)庫(人類的 語言句子是千變?nèi)f化的,但是組成句子的常用詞匯是有限的 )2建立疑問詞數(shù)據(jù)庫(漢語疑問詞數(shù)量有限,僅有幾十種,包括動次/形容詞+不/沒+動次/形容詞(如去不去、走沒走)等等有規(guī)律的疑問詞結(jié)構(gòu))3建立公共屬性數(shù)據(jù)庫、機器人自身屬性數(shù)據(jù)庫和動態(tài)詞數(shù)據(jù)庫,用來代表世界萬物及機器人自身所有信息。所需要的數(shù)據(jù)量并不大,因為人類常用的屬性是有 限的,高度、長度、密度、濕度、社會關(guān)系、所屬、功能等等屬性約上千種左右(常用幾百種)。動態(tài)詞數(shù)據(jù)量也是有限的,因為人類常用行為動作及動態(tài)詞約幾萬種左右(常用約1萬種,如打球、打架、

8、跑步、呼吸、倒塌、滾動等等 ), 而并非海量級數(shù)據(jù),實現(xiàn)難度較小機器人自身屬性數(shù)據(jù)庫如下:小寶(機器人名)屬性名屬性值參數(shù)(過去時)參數(shù)2 (進行時)參數(shù)3 (將來時)O O O O O O身高1沒有身高多高1沒有高度高度1沒有高度姓名1叫小寶是誰1是小寶叫什么1叫小寶功能1可以說話會干什么1會說話會做什么1會說話能干啥1會說話干啥2關(guān)機了在陪你聊天要給你放一首歌聽干什么2關(guān)機了在陪你聊天要給你放一首歌聽做什么2關(guān)機了在陪你聊天要給你放一首歌聽O O O O O O舉例你叫什么名字機器人需要先確定句子性質(zhì),掃描句子內(nèi)容并搜索疑問詞庫找到句子里有“什么”這個詞,確定為疑問句( 特殊句子另行判斷,

9、在此僅做舉例 ) 掃描公共屬性庫確定句子里有“叫什么”這個屬性詞從屬性詞向前掃描( 向前或向后這些人為規(guī)則的確定,每個語種各不一樣 ) 搜索代名詞庫,找到句子里有代詞“你” (僅作舉例,特殊句子另行考慮 ),即句 子的主語是“你”,確定下一步掃描對象為自身屬性庫 (如果掃描到主語是 “我”, 則下一步將掃描主人的屬性庫, 早期機器人主要是主人和機器人的人機對話, 因 此早期機器人只需要建立第一人稱 “我”<即主人 >的數(shù)據(jù)庫和第二人稱 “你”< 機器人自身 > 的數(shù)據(jù)庫,第三人稱數(shù)據(jù)庫則可囊括世界萬物,只需要不斷擴充即 可,擴充量越大,知識面越廣,并且和人類一樣學(xué)無止境

10、 < 通常會先建立常用的 第三人稱數(shù)據(jù)庫 >)。從自身屬性庫中找到 “叫什么”這個屬性詞, 從屬性詞后面的參數(shù)中調(diào)出回 答內(nèi)容:“叫小寶”。根據(jù)漢語語法規(guī)則,輸出:我 +“叫小寶” =我叫小寶 注:句子里的“名字”這個詞,屬于名詞,是第三人稱,未來將隨著數(shù)據(jù)庫不斷 擴充,將會像機器人自身屬性庫一樣為“名字”這個詞建立屬性庫, “名字”這 個詞即可以被機器人所“認識” ,機器人在高級智能程度下,將可以建立人與名 字之間的聯(lián)系。 另外,機器人一般會先建立常用的第三人稱數(shù)據(jù)庫, 如車載系統(tǒng) 會先建立車、 空調(diào)、后備箱、 音響等數(shù)據(jù)庫。 不常用的第三人稱通常不需要建立 數(shù)據(jù)庫就可以理解句子

11、的意思, 如,你叫什么和你叫什么名字兩句話, 機器人不 理解“名字”為何物并不重要,因為“叫什么”已經(jīng)成為了一種常用屬性名。舉例你想干什么?機器人先掃描句子并搜索疑問詞庫, 找到句子里有 “什么”這個疑問詞, 判 斷為問句。掃描公共屬性詞庫,找到句子里有“干什么”這個屬性詞,判斷屬性值為 2 ( 假設(shè) 2 表示為動態(tài)屬性 ),從屬性詞向前掃描,搜索時態(tài)詞庫,找到動態(tài)屬性 詞前面有時態(tài)詞“想” ,確定為將來時,在讀取屬性庫內(nèi)容時將讀取參數(shù) 3。 掃描時態(tài)詞前面并搜索代名詞數(shù)據(jù)庫, 找到主句是 “你”, 確定下一步掃描 對象為機器人自身屬性庫。讀取自身屬性庫中“干什么”屬性名后面的參數(shù) 3 的值

12、根據(jù)漢語語法規(guī)則, 輸出:我+“要給你放一首歌聽” =我要給你放一首歌聽 (如果搜索到動態(tài)屬性詞前面有個時態(tài)詞為 “在”,即“你在干什么”,則確定為 進行時,讀取參數(shù) 2,即回答:“我在陪你聊天”)注:以上思路僅為舉例,先搜索哪類詞庫需要設(shè)計一套不斷完善的語法分析結(jié) 構(gòu),用來依次分辨出句子性質(zhì)、屬性值、詞性、時態(tài)、主語、謂語、賓語、及 其他詞類,最終確定需要讀取哪個對答內(nèi)容進行輸出。 這樣可以讓對話機器人 實現(xiàn)對答內(nèi)容的高度智能化。 且因為每個語種的語法結(jié)構(gòu)各不相同, 因此這套語 義分析結(jié)構(gòu)只能用來分析一種語言, 如,根據(jù)漢語語法規(guī)則設(shè)計出的語義分析結(jié) 構(gòu)無法理解英語句子,即便數(shù)據(jù)庫里有英文單

13、詞。機問人答:機器人:你是什么顏色?答:紅色。 機器人:哦!(并同時將紅色這個參數(shù)值保存到主人屬性數(shù)據(jù)庫的顏色參數(shù)值里, 這個功能可以使機器人具備了基本的記憶與學(xué)習(xí)能力 )思路如下:1機器人根據(jù)條件的設(shè)置,自動向人類發(fā)出提問2 人類做出回答3 機器人掃描人類回答的句子,搜索所問問題中屬性名所對應(yīng)的參數(shù)值數(shù)據(jù)庫 (機器人提問的每個問題都有對應(yīng)的屬性名, 每個屬性名都對應(yīng)著一個參數(shù)數(shù)據(jù) 庫,如,顏色這個屬性,對應(yīng)著保存有紅黃藍綠等顏色參數(shù)的數(shù)據(jù)庫 ) 4找到人類回答的句子中有與參數(shù)數(shù)據(jù)庫中匹配的“紅色” ,將紅色保存到主人 屬性數(shù)據(jù)庫中的顏色屬性的參數(shù)值位置(僅做舉例,特殊回答另行考慮)。等于 機器人記住了主人的一個屬性或信息,即:主人的顏色為紅

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論