AI11章自然語(yǔ)言理解.ppt_第1頁(yè)
AI11章自然語(yǔ)言理解.ppt_第2頁(yè)
AI11章自然語(yǔ)言理解.ppt_第3頁(yè)
AI11章自然語(yǔ)言理解.ppt_第4頁(yè)
AI11章自然語(yǔ)言理解.ppt_第5頁(yè)
已閱讀5頁(yè),還剩43頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2019/7/11,1,自然語(yǔ)言理解,主 講 :付 宏 杰 單 位 :信息工程學(xué)院,使用教材: 人 工 智 能 基 礎(chǔ) 高 濟(jì) 朱淼良 何欽銘 高 等 教 育 出 版 社,第五章 自然語(yǔ)言理解,2019/7/11,2,第五章:自然語(yǔ)言理解,基本概念 當(dāng)我們從事任何一項(xiàng)研究的時(shí)候,總要關(guān)注兩方面的問(wèn)題:一是是什么,為什么?二是做什么,怎么做?這恰恰是科學(xué)與技術(shù)緊密相關(guān)的兩個(gè)方面。 自然語(yǔ)言處理既是一項(xiàng)技術(shù),又是一門(mén)科學(xué)。,2019/7/11,3,5.1 基本概念,信息的主要載體語(yǔ)言 語(yǔ)言的兩種形式文字和聲音 文字和聲音作為語(yǔ)言的兩個(gè)不同形式的載體,所承載的信息占整個(gè)信息組成的70以上(文字:70,圖象:20;其它:10) q 如何讓計(jì)算機(jī)實(shí)現(xiàn)人們希望實(shí)現(xiàn)的語(yǔ)言處理功能? q如何讓計(jì)算機(jī)真正實(shí)現(xiàn)海量的語(yǔ)言信息的自動(dòng)處理和有效利用?,2019/7/11,4,5.1 基本概念,q 語(yǔ)言學(xué)(linguistics) 是指對(duì)語(yǔ)言的科學(xué)研究。作為一門(mén)純理論的學(xué)科, 語(yǔ)言學(xué)在近期獲得了快速發(fā)展,尤其從上個(gè)世紀(jì)60年 代起,已經(jīng)成為一門(mén)知曉度很高的廣泛教授的學(xué)科。 包括:歷時(shí)語(yǔ)言學(xué)(diachronic linguistics)(或 稱(chēng)歷史語(yǔ)言學(xué)(historical linguistics)和共時(shí)語(yǔ)言學(xué)(synchronic linguistics)、描述語(yǔ)言學(xué)(descriptivelinguistics)、對(duì)比語(yǔ)言學(xué)(contrastive linguistics)、結(jié)構(gòu)語(yǔ)言學(xué)(structural linguistics)等等。,2019/7/11,5,5.1 基本概念,q 語(yǔ)音學(xué)(phonetics) 研究人類(lèi)發(fā)音特點(diǎn),特別是語(yǔ)音發(fā)音特點(diǎn),并提出各種語(yǔ)音描述、分類(lèi)和轉(zhuǎn)寫(xiě)方法的科學(xué)。 包括: (1)發(fā)音語(yǔ)音學(xué)(articulatory phonetics),研究 發(fā)音器官如何產(chǎn)生語(yǔ)音;(2)聲學(xué)語(yǔ)音學(xué)(acoustic phonetics),研究口耳之間傳遞語(yǔ)音的物理屬性;(3) 聽(tīng)覺(jué)語(yǔ)音學(xué)(auditory phonetics), 研究人通過(guò)耳、聽(tīng)覺(jué) 神經(jīng)和大腦對(duì)語(yǔ)音的知覺(jué)反應(yīng)。,2019/7/11,6,5.1 基本概念,根據(jù)不同的研究方法,語(yǔ)音學(xué)又分為: (a)一般語(yǔ)音學(xué)(general phonetics): 對(duì)語(yǔ)音發(fā)音、聲學(xué)或知覺(jué)的一般研究。 與語(yǔ)言學(xué)的分析目的沒(méi)有什么關(guān)系。 (b)實(shí)驗(yàn)語(yǔ)音學(xué)(experimental phonetics): 對(duì)具體語(yǔ)言語(yǔ)音特點(diǎn)的研究。 語(yǔ)言學(xué)研究的一部分,有人甚至認(rèn)為是語(yǔ)言學(xué)不可或缺的基礎(chǔ)。,2019/7/11,7,5.1 基本概念,問(wèn)題: 語(yǔ)音學(xué)究竟是一門(mén)獨(dú)立的學(xué)科還是應(yīng)視為語(yǔ)言學(xué)的一個(gè)分支呢? 復(fù)數(shù)的語(yǔ)言科學(xué)(linguistic sciences) 語(yǔ)言學(xué)和其它學(xué)科的交叉產(chǎn)生了許多語(yǔ)言學(xué)的新分支,包括純理論的和應(yīng)用性的,如人類(lèi)語(yǔ)言學(xué)(anthropologicallinguistics)、計(jì)算語(yǔ)言學(xué)(computational linguistics)、生物語(yǔ)言學(xué)(biolinguistics)、心理語(yǔ)言學(xué)(psycholinguistics)、教育語(yǔ)言學(xué)(educational linguistics)和社會(huì)語(yǔ)言學(xué)(sociolinguistics)等等。,2019/7/11,8,5.1 基本概念,q計(jì)算語(yǔ)言學(xué)(Computational Linguistics) 計(jì)算語(yǔ)言學(xué)是利用電子數(shù)字計(jì)算機(jī)進(jìn)行的語(yǔ)言分析。雖然許多其它類(lèi)型的語(yǔ)言分析也可以運(yùn)用計(jì)算機(jī),計(jì)算分析最常用于處理基本的語(yǔ)言數(shù)據(jù)例如建立語(yǔ)音、詞、詞元素的搭配以及統(tǒng)計(jì)它們的頻率。 大不列顛百科全書(shū),2019/7/11,9,5.1 基本概念,q計(jì)算語(yǔ)言學(xué)(Computational Linguistics) 是語(yǔ)言學(xué)的一個(gè)研究分支,用計(jì)算技術(shù)和概念來(lái)闡述語(yǔ)言學(xué)和語(yǔ)音學(xué)問(wèn)題。已開(kāi)發(fā)的領(lǐng)域包括自然語(yǔ)言處理(natural language processing, NLP),言語(yǔ)合成,言語(yǔ)識(shí)別,自動(dòng)翻譯,編制語(yǔ)詞索引,語(yǔ)法的檢測(cè),以及許多需要統(tǒng)計(jì)分析和領(lǐng)域(如文本考釋?zhuān)?現(xiàn)代語(yǔ)言學(xué)詞典戴維.克里斯特爾,1997,2019/7/11,10,5.1 基本概念,q自然語(yǔ)言處理 或稱(chēng)自然語(yǔ)言理解(natural language understanding, NLU),人工智能研究的重要內(nèi)容之一。自然語(yǔ)言處理(natural language processing,NLP)就是利用計(jì)算機(jī)為工具對(duì)人類(lèi)特有的書(shū)面形式和口頭形式的自然語(yǔ)言的信息進(jìn)行各種類(lèi)型處理和加工的技術(shù)。 -馮志偉自然語(yǔ)言的計(jì)算機(jī)處理,2019/7/11,11,5.1 基本概念,近幾年來(lái),自然語(yǔ)言處理研究得到了前所未有的重視和長(zhǎng)足的進(jìn)展,并逐漸發(fā)展成為一門(mén)相對(duì)獨(dú)立的學(xué)科而倍受關(guān)注,而且自然語(yǔ)言處理技術(shù)不斷與語(yǔ)音識(shí)別(speech recognition)、語(yǔ)音合(speech synthesis)等語(yǔ)音技術(shù)相互滲透和結(jié)合形成新的研究分支,因此,很多人在談到“計(jì)算語(yǔ)言學(xué)”、“自然語(yǔ)言處理”或“自然語(yǔ)言理解”這些術(shù)語(yǔ)時(shí),往往默認(rèn)為同一個(gè)概念。甚至有些專(zhuān)著中干脆直接這樣解釋?zhuān)河?jì)算語(yǔ)言學(xué)也稱(chēng)自然語(yǔ)言處理或自然語(yǔ)言理解劉穎,2002。,2019/7/11,12,5.2 關(guān)于“理解”標(biāo)準(zhǔn),q 如何判斷計(jì)算機(jī)系統(tǒng)的智能? 計(jì)算機(jī)系統(tǒng)的表現(xiàn)(act)如何? 反應(yīng)(react)如何? 相互作用(interact )如何? 與有意識(shí)個(gè)體(人)比較如何? 圖靈(Turing)設(shè)計(jì)的“模仿游戲”,即圖靈實(shí)驗(yàn)(Turing test),2019/7/11,13,5.3 自然語(yǔ)言理解研究的內(nèi)容,q 按照應(yīng)用目標(biāo)劃分 v 機(jī)器翻譯(Machine translation, MT):實(shí)現(xiàn)一種語(yǔ)言到另一種語(yǔ)言的自動(dòng)翻譯。 應(yīng)用:文獻(xiàn)翻譯、網(wǎng)頁(yè)翻譯和輔助瀏覽等。 實(shí)用系統(tǒng):Systran ()36種語(yǔ)言對(duì),20個(gè)專(zhuān)門(mén)領(lǐng)域。,2019/7/11,14,5.3 自然語(yǔ)言理解研究的內(nèi)容,機(jī)器翻譯現(xiàn)狀和對(duì)機(jī)器翻譯的認(rèn)識(shí) 機(jī)器翻譯研究在過(guò)去的五十多年曲折發(fā)展經(jīng)歷中,無(wú)論是它給人們帶來(lái)的希望還是失望我們都必須客觀地看到,機(jī)器翻譯作為一個(gè)科學(xué)問(wèn)題在被學(xué)術(shù)界不斷深入研究的同時(shí),企業(yè)家們已經(jīng)從市場(chǎng)上獲得了相應(yīng)的利潤(rùn)。 在機(jī)器翻譯研究中實(shí)現(xiàn)人機(jī)共生(man-machine symbiosis),人機(jī)互助比追求完全自動(dòng)的高質(zhì)量的翻譯(Full Automatic High Quality Translation, FAHQT) 更現(xiàn)實(shí)、更切合實(shí)際Hutchins, 1995 我們需要的是計(jì)算機(jī)幫助人類(lèi)完成某些翻譯工作,而不是完全替代人,人與機(jī)器翻譯系統(tǒng)之間應(yīng)該是互補(bǔ)的關(guān)系,而不是相互競(jìng)爭(zhēng)Hutchins, 2001,2019/7/11,15,5.3 自然語(yǔ)言理解研究的內(nèi)容,用機(jī)器翻譯的個(gè)別例子來(lái)批評(píng)甚至詆毀機(jī)器翻譯研究是不適當(dāng)?shù)摹?例1: The spirit is willing, but the flesh is weak. (心有余,而力不足。) 精神是愿意的, 但骨肉是微弱的。(Systran) English- Russian-English: The wine is good, but the meat is spoiled. (酒是好的,肉是餿的。),2019/7/11,16,5.3 自然語(yǔ)言理解研究的內(nèi)容,例2: Out of sight, out of mind. 眼不見(jiàn),心不煩。) 出于視域, 在頭腦外面。(Systran) From English to Russian: 又瞎又瘋。,2019/7/11,17,5.3 自然語(yǔ)言理解研究的內(nèi)容,v信息檢索(Information retrieval):信息檢索也稱(chēng)情報(bào)檢索,就是利用計(jì)算機(jī)系統(tǒng)從大量文檔中找到符合用戶需要的相關(guān)信息。 面向多語(yǔ)言的信息檢索叫做跨語(yǔ)言信息檢索(Cross-language / Trans-lingual information retrieval)。 代表系統(tǒng):Google: 百度:/ 目前已有300多億個(gè)網(wǎng)頁(yè),每天幾百萬(wàn)增加,獲得的信息只有1被有效利用。,2019/7/11,18,5.3 自然語(yǔ)言理解研究的內(nèi)容,v自動(dòng)文摘(Automatic summarization / Automaticabstracting):將原文檔的主要內(nèi)容或某方面的信息自動(dòng)提取出來(lái),并形成原文檔的摘要或縮寫(xiě)。 應(yīng)用:電子圖書(shū)管理、情報(bào)獲取等 v文檔分類(lèi)(Document categorization):文檔分類(lèi)也叫文本自動(dòng)分(Textcategorizationclassification) 或信息分類(lèi)(Information categorization / classification),其目的就是利用計(jì)算機(jī)系統(tǒng)對(duì)大量的文檔按照一定的分類(lèi)標(biāo)準(zhǔn)(例如,根據(jù)主題或內(nèi)容劃分等)實(shí)現(xiàn)自動(dòng)歸類(lèi)。 應(yīng)用:圖書(shū)管理、內(nèi)容管理、信息監(jiān)控等,2019/7/11,19,5.3 自然語(yǔ)言理解研究的內(nèi)容,v問(wèn)答系統(tǒng)(Question-answering system):通過(guò)計(jì)算機(jī)系統(tǒng)對(duì)人提出的問(wèn)題的理解,利用自動(dòng)推理等手段,在有關(guān)知識(shí)資源中自動(dòng)求解答案并做出相應(yīng)的回答。問(wèn)答技術(shù)有時(shí)與語(yǔ)音技術(shù)和多模態(tài)輸入/輸出技術(shù),以及人機(jī)交互技術(shù)等相結(jié)合,構(gòu)成人機(jī)對(duì)話系統(tǒng)(man-computer dialogue system)。 應(yīng)用:人機(jī)對(duì)話系統(tǒng)、信息檢索等,2019/7/11,20,5.3 自然語(yǔ)言理解研究的內(nèi)容,信息過(guò)濾(Information filtering):通過(guò)計(jì)算機(jī)系統(tǒng)自動(dòng)識(shí)別和過(guò)濾那些滿足特定條件的文檔信息 應(yīng)用:網(wǎng)絡(luò)有害信息過(guò)濾、信息安全等 語(yǔ)言教學(xué)(Language teaching):借助計(jì)算機(jī)輔助教學(xué)工具,進(jìn)行語(yǔ)言教學(xué)、操練和輔導(dǎo)等。 應(yīng)用:語(yǔ)言學(xué)習(xí)等,2019/7/11,21,5.3 自然語(yǔ)言理解研究的內(nèi)容,v 文字識(shí)別(Character recognition):通過(guò)計(jì)算機(jī)系統(tǒng)對(duì)印刷體或手寫(xiě)體等文字進(jìn)行自動(dòng)識(shí)別,將其轉(zhuǎn)換成計(jì)算機(jī)可以處理的電子文本。 應(yīng)用:文字輸入、識(shí)別等 文字編輯和自動(dòng)校對(duì)(Automatic proofreading):對(duì)文字拼寫(xiě)、用詞、甚至語(yǔ)法、文檔格式等進(jìn)行自動(dòng)檢查、校對(duì)和編排。 應(yīng)用:排版、印刷和書(shū)籍編撰等,2019/7/11,22,5.3 自然語(yǔ)言理解研究的內(nèi)容,v語(yǔ)音識(shí)別(speech recognition):將輸入計(jì)算機(jī)的語(yǔ)音信號(hào)識(shí)別轉(zhuǎn)換成書(shū)面語(yǔ)表示。語(yǔ)音識(shí)別也稱(chēng)自動(dòng)語(yǔ)音識(shí)別(automatic speech recognition, ASR)。 應(yīng)用:文字錄入、人機(jī)通訊、語(yǔ)音翻譯等等。 困難:大量存在的同音詞、近音詞、集外詞、口音等等。 例如:輸入:美歐貿(mào)易摩擦升級(jí) 識(shí)別結(jié)果:美歐貿(mào)易摩擦生機(jī),2019/7/11,23,5.3 自然語(yǔ)言理解研究的內(nèi)容, 極端情況下的同音字(詞)現(xiàn)象 施氏食獅史(趙元任) 石室詩(shī)士施氏,嗜獅,誓食十獅。氏時(shí)時(shí)適市視獅,十時(shí),適十獅適市,是時(shí),適施氏適市,施氏視是十獅,拭矢試,使是十獅逝世,適石室,石室濕,氏使侍拭石室,石室拭,始食是十獅尸,始識(shí)是十獅尸,實(shí)十石獅尸,試釋是事。,2019/7/11,24,5.3 自然語(yǔ)言理解研究的內(nèi)容,文語(yǔ)轉(zhuǎn)換(text-to-speech):將書(shū)面文本自動(dòng)轉(zhuǎn)換成對(duì)應(yīng)的語(yǔ)音表征。 應(yīng)用:朗讀系統(tǒng)、人機(jī)語(yǔ)音接口等等。 說(shuō)話人識(shí)別/認(rèn)同/驗(yàn)證(speaker recognition/identification/ verification):對(duì)一言語(yǔ)樣品做聲學(xué)分析,依此推斷(確定或驗(yàn)證)說(shuō)話人的身份。 應(yīng)用:信息安全、防偽等等。,2019/7/11,25,5.4 自然語(yǔ)言理解研究的基本問(wèn)題,q形態(tài)學(xué)(Morphology) 問(wèn)題:研究詞是如何由意義的基本單位詞素(morphemes)構(gòu)成的。 詞素(morphemes)詞(word)? 詞根、前綴、后綴、詞尾 例: 人,蜈蚣 老虎老 虎; 圖書(shū)館 圖 書(shū) 館 re + ex + port reexport,2019/7/11,26,5.4 自然語(yǔ)言理解研究的基本問(wèn)題,q語(yǔ)義學(xué)(Semantics) 問(wèn)題:研究如何從一個(gè)語(yǔ)句中詞的意義,以及這些詞在該語(yǔ)句中句法結(jié)構(gòu)中的作用來(lái)推導(dǎo)出該語(yǔ)句的意義。 這句話說(shuō)了什么? (1) 蘋(píng)果不吃了。 (2) 這個(gè)人真牛。 (3) 這個(gè)人眼下沒(méi)些什么,那個(gè)人嘴不太好。,2019/7/11,27,5.4 自然語(yǔ)言理解研究的基本問(wèn)題,q語(yǔ)用學(xué)(Pragmatics) 問(wèn)題:研究在不同上下文中的語(yǔ)句的應(yīng)用,以及上下文對(duì)語(yǔ)句理解所產(chǎn)生的影響。從狹隘的語(yǔ)言學(xué)觀點(diǎn)看,語(yǔ)用學(xué)處理的是語(yǔ)言結(jié)構(gòu)中有形式體現(xiàn)的那些語(yǔ)境。相反,語(yǔ)用學(xué)最寬泛的定義是研究語(yǔ)義學(xué)未能涵蓋的那些意義。 為什么要說(shuō)這句話? (1)火,火! (2)A: 看看魚(yú)怎么樣了? B: 我剛才翻了一下。,2019/7/11,28,2019/7/11,29,5.5 自然語(yǔ)言理解面臨的困難,v 語(yǔ)義歧義 他說(shuō):“她這個(gè)人真有意思(funny)”。她說(shuō):“他 這個(gè)人怪有意思的(funny)”。于是人們以為他們有了 意思(wish),并讓他向她意思意思(express)。他火了: “我根本沒(méi)有那個(gè)意思(thought)”!她也生氣了:“你 們這么說(shuō)是什么意思(intention)”?事后有人說(shuō):“真 有意思(funny)”。也有人說(shuō):“真沒(méi)意思(nonsense)”。 生活報(bào)1994. 11. 13. 第六版,2019/7/11,30,q自然語(yǔ)言中存在未知的語(yǔ)言現(xiàn)象,v 新的詞匯 例如: “非典”、專(zhuān)業(yè)術(shù)語(yǔ)、外來(lái)語(yǔ)、人名等 v 新的含義 例如:窗口、奔騰、農(nóng)民等 v 新的用法和語(yǔ)句結(jié)構(gòu)等 尤其在口語(yǔ)中或部分網(wǎng)絡(luò)語(yǔ)言中,不斷出現(xiàn)一些“非規(guī)范的”新的語(yǔ)句結(jié)構(gòu)。,2019/7/11,31,5.6 不同語(yǔ)言的差異,q 不同的語(yǔ)系 孤立語(yǔ)(分析語(yǔ)):形態(tài)變化少,語(yǔ)法關(guān)系靠詞序和虛詞表示,如漢語(yǔ)。 曲折語(yǔ):用詞的形態(tài)變化表示語(yǔ)法關(guān)系,如英語(yǔ)。 黏著語(yǔ):詞內(nèi)有專(zhuān)門(mén)表示語(yǔ)法意義的附加成分,詞根或詞干與附加成分的結(jié)合不緊密,如日語(yǔ)。,2019/7/11,32,5.6 不同語(yǔ)言的差異,q 不同的語(yǔ)言單位 漢語(yǔ):漢字(單音節(jié)、無(wú)空格) 英語(yǔ):英語(yǔ)(多音節(jié)、有空格) 日語(yǔ):字和詞(多音節(jié)、無(wú)空格),2019/7/11,33,5.6 不同語(yǔ)言的差異,q 不同的語(yǔ)法 v 例如: (1) 二樓1三號(hào)房間2桌子3上有一本書(shū)。 (2) There is a book on the desk3 in Room 32 at the 2nd floor1. q 語(yǔ)義的差異,2019/7/11,34,5.7 自然語(yǔ)言理解研究的基本方法,理性主義與經(jīng)驗(yàn)主義方法的哲學(xué)分野之一:對(duì)語(yǔ)言知識(shí)來(lái)源的不同認(rèn)識(shí) 理性主義認(rèn)為:人的很大一部分語(yǔ)言知識(shí)是與生俱來(lái)的,由遺傳決定的。 Chomsky 的內(nèi)在語(yǔ)言官能(innate language faculty)理論被廣泛接受。 人工編匯初始語(yǔ)言知識(shí) 推理系統(tǒng) 自然語(yǔ)言處理系統(tǒng)。,2019/7/11,35,5.7 自然語(yǔ)言理解研究的基本方法,經(jīng)驗(yàn)主義認(rèn)為:人的語(yǔ)言知識(shí)是通過(guò)感觀輸入,經(jīng)過(guò)一些簡(jiǎn)單的聯(lián)想(association)與通用化(generalization)的操作而得到的。 大量的語(yǔ)言數(shù)據(jù)中獲得語(yǔ)言的知識(shí)結(jié)構(gòu)。,2019/7/11,36,5.7 自然語(yǔ)言理解研究的基本方法,q 理性主義與經(jīng)驗(yàn)主義方法的哲學(xué)分野之二:研究對(duì)象的差異 理性主義方法:研究人的語(yǔ)言知識(shí)結(jié)構(gòu)(語(yǔ)言能力,language competence),實(shí)際的語(yǔ)言數(shù)據(jù)(語(yǔ)言行為,language performance)只提供了這種內(nèi)在知識(shí)的間接證據(jù)。 經(jīng)驗(yàn)主義方法:直接研究這些實(shí)際的語(yǔ)言數(shù)據(jù)。,2019/7/11,37,5.7 自然語(yǔ)言理解研究的基本方法,q 理性主義與經(jīng)驗(yàn)主義方法的哲學(xué)分野之三:運(yùn)用不同的理論 理性主義:通?;贑homsky 的語(yǔ)言原則principles),通過(guò)語(yǔ)言所必須遵守的一系列原則來(lái)描述語(yǔ)言。 經(jīng)驗(yàn)主義:通常是基于Shannon 的信息論。,2019/7/11,38,5.7 自然語(yǔ)言理解研究的基本方法,理性主義:通常通過(guò)一些特殊的語(yǔ)句或語(yǔ)言現(xiàn)象的研究來(lái)得到對(duì)人的語(yǔ)言能力的認(rèn)識(shí),而這些語(yǔ)句和語(yǔ)言現(xiàn)象在實(shí)際的應(yīng)用中并不常見(jiàn)。 經(jīng)驗(yàn)主義:偏重于對(duì)大規(guī)模語(yǔ)言數(shù)據(jù)中人們所實(shí)際使用的普通語(yǔ)句的統(tǒng)計(jì)。,2019/7/11,39,5.7 自然語(yǔ)言理解研究的基本方法,q 理性主義方法與經(jīng)驗(yàn)主義方法的融合 符號(hào)智能 計(jì)算智能 理性主義研究方法 符號(hào)處理系統(tǒng) 經(jīng)驗(yàn)主義研究方法 基于語(yǔ)言數(shù)據(jù)的計(jì)算方法 理性主義與經(jīng)驗(yàn)主義的合謀 融合方法,2019/7/11,40,5.8 自然語(yǔ)言理解的發(fā)展和研究現(xiàn)狀,q自然語(yǔ)言理解的發(fā)展 萌芽期:1946年世界上第一臺(tái)計(jì)算機(jī)出現(xiàn),自然語(yǔ)言理解的研究起始于機(jī)器翻譯。 發(fā)展期:自1966年美國(guó)自動(dòng)語(yǔ)言處理咨詢(xún)委員會(huì)(ALPAC) 提出ALPAC報(bào)告。研究重點(diǎn)轉(zhuǎn)寫(xiě)其它分支:人機(jī)接口、對(duì)話系統(tǒng)、信息檢索等?;痉椒ǎ夯谝?guī)則分析方法。 繁榮期:自20世紀(jì)80年代末期以后,基于語(yǔ)料庫(kù)的統(tǒng)計(jì)方法引入自然語(yǔ)言處理。,2019/7/11,41,5.8 自然語(yǔ)言理解的發(fā)展和研究現(xiàn)狀,q基本研究現(xiàn)狀 v實(shí)用或半實(shí)用的技術(shù)已經(jīng)得到廣泛運(yùn)用 文字處理器 文字輸入 網(wǎng)絡(luò)搜索引擎 輔助翻譯、電子詞典 語(yǔ)音合成 ,2019/7/11,42,5.8 自然語(yǔ)言理解的發(fā)展和研究現(xiàn)狀,v許多技術(shù)離真正實(shí)用的目標(biāo)還有相當(dāng)?shù)木嚯x,若干理論問(wèn)題有待于進(jìn)一步深入研究 現(xiàn)有模型和方法的改進(jìn) 期待新的理論方法 v許多新的研究方向不斷出現(xiàn) 網(wǎng)絡(luò)內(nèi)容管理、信息監(jiān)控、有害信息過(guò)濾等 語(yǔ)音文摘生成,2019/7/11,43,5.9 參考文獻(xiàn),q專(zhuān)著 1 甕富良,計(jì)算語(yǔ)言學(xué)導(dǎo)論,中國(guó)社會(huì)科學(xué)出版社,1998。 2 馮志偉,自然語(yǔ)言的計(jì)算機(jī)處理,上海外語(yǔ)教育出版社,1996。 3 姚天順,自然語(yǔ)言理解一種讓機(jī)器懂得人類(lèi)語(yǔ)言的研究,清華大學(xué)、廣西科技出版社,2002(第二版)。 4 趙鐵軍,機(jī)器翻譯原理,哈爾濱工業(yè)大學(xué)出版社,2000。,2019/7/11,44,5.9 參考文獻(xiàn),5 James Allen, Natural Language Understanding. TheBenjamin/Cummings Publishing Compan

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論