




已閱讀5頁,還剩35頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
本科畢業(yè)設(shè)計(論文)外文翻譯譯文學生姓名: 院 (系): 計算機學院 專業(yè)班級: 軟件 指導教師: 完成日期: 2011 年 3月 17 日 人工智能探索The Quest for Artificial Intelligence作者: Nils J. Nilsson (Author)起止頁碼:141-165出版日期(期刊號): ISBN-10: 0521122937 ISBN-13: 978-0521122931出版單位:Cambridge University Press第7章 自然語言處理 無論是打印的或者手寫的字體,如果想識別特定的字母字符,問題就在于理解單詞、句子或更大的一段文字組合的“自然”語言,如英語。為了區(qū)分語言如英語和機器語言,前者通常被稱為“自然語言”。在機器語言中, 理解輸入的自然語言通常指轉(zhuǎn)換到某種記憶模型(如拉斐爾使用的SIR系統(tǒng)或奎廉所使用的語義網(wǎng)絡(luò))或執(zhí)行一些恰當?shù)妮斎雱幼?。自然語言能說出和寫的一樣的意思。那是因為演講聽起來是和分割印刷在紙上的是不一樣的,理解話語有著額外的困難,我會在一個后來的篇章來描述。自然語言理解的逆輸入生成自然語言輸出的口語和書寫。從一種語言翻譯成另外一種,既要理解和又要生成。進行一場談話也是如此。所有的這些問題-理解、產(chǎn)生、翻譯與一般的談話構(gòu)成了“自然語言處理”(有時也簡稱NLP)。 7.1 語言水平語言學家和其他學習語言者對語言的認識和分析處在不同級別上的。從那些處理最基本組成的語言(音)和訴訟到部分進行上行水平處理序列的句子,這些可以安排在一種層次,如果演講處理成有層次的語音(語音)和音系學(組織的聲音字)。對于講話,交易形態(tài)與全字是如何加在一起,從小型零件的制造和銷售。例如,“走出去”包括“行走”加上“吸引”。接下來,語法關(guān)注句子的結(jié)構(gòu)和語法。它規(guī)定所試圖描述一串字在一個特定的語言被貼上要么語法或不是。例如,該字符串“約翰打了球”是語法,但是“球到約翰”則不是。連同這本字典定義的詞、句法的重要性理解句子的意義。舉例來說,這句話“約翰看見那人拿著望遠鏡”有兩種不同的意義取決于它句法結(jié)構(gòu)(也就是說,這取決于“用望遠鏡”是指“男人”有一個望遠鏡或“看見”。)但是語法是不夠確定的意義。例如這句話,“無色的綠色思想在瘋狂的睡眠”可能被認為語法,但它是荒謬的。語義層次幫助確定意義(或無意義的)一個句子的運用邏輯分析。例如,通過語義分析理論,提出一種“想法”不可能同時是“無色”和“綠色”。接下來是語用學的水平,以文章的上下文句子來牽制的意義。例如,約翰去銀行”有不同的意義中,在一個關(guān)于在流河里釣魚句子里和關(guān)于貿(mào)易的句子里。語用含義在語境中具體情況具體體現(xiàn)。這些層面,即在特定的主題,是語法早期的研究仍是自然語言處理的一個重要方面。在1957年美國語言學家喬姆斯基的一本書出版,他所提出的句法結(jié)構(gòu)的語法規(guī)則,可以設(shè)置可用于生成“合法”的一種語言。1 相同的規(guī)則也可以用來分析一串字來決定是否他們組成一個合法的語句的語言。我要說明這種分析被喬姆斯基稱為Phrase-Structure語法(PSG)。2這個過程是與我們所有的在高級學校的“Diagrammed”的句子非常相似的,。語法規(guī)則定義詞的聲明中所代替字符串符號相應(yīng)的句法類別,如名詞或動詞或形容詞。這些句法取代通過額外的象征符號形成語法的規(guī)律琴弦。這些思想的闡明,我會用非常簡單的改編喬姆斯基的一個語法來說明。這本語法只有三大句法類別:名詞、動詞、介詞。那三個充分分析字符串,如“這個人撞球。”其中一條規(guī)則在這說明,我們可以取代語法狀態(tài)句子:“的” 或“一” 的象征“DET”(限定詞)。語言學家寫這個規(guī)則如下:THE| A DET(這個符號“|”被用來顯示任何言語環(huán)繞著它能被正確的語法標志的箭頭)這里有一些其他的規(guī)則,用同樣的格式:MAN | BALL | JOHN N(這句話:“MAN”,“BALL”和“JONE”可以被取代的象征“N”的名詞。)HIT | TOOK | THREW V(這句話:“HIT”、“TOOK”和“THREW”可以被替換“V”是動詞。)DET N NP(字符串中的符號“DET”和“N”實現(xiàn)“硅碳棒可以被替換“NP”的名詞短語。)VNP VP(字符串中的符號“V”和“NP”可以被替換“VP”是動詞短語。)NPVP S(字符串中的符號“NP”和“VP”可以被取代的象征“S”的句子。)符號(例如“S”、“DET”、“NP”等等,被稱為非終止語言符號的定義語法,而詞匯如“BALL”、“JOHN”和“THREW”是語言“TERMINAL”的象征。我們可以把這些規(guī)則的字符串“男人擊球”轉(zhuǎn)變它變成“ S”。任何一個字符串,可以轉(zhuǎn)換成“S”這樣說語法的很簡單定義一個法定的語言語法。用一種規(guī)則應(yīng)用,說明了一個語法就是叫語法樹如圖7-1所示。3圖7-1: 一個句子分析的語法樹下面的例子是基于一項小樣本量的句法類別和僅僅說明了更換規(guī)則的句法分析。,使語法稍微更現(xiàn)實,我們將需要包含符號更換、形容詞、副詞規(guī)則和介詞等等。當然,我們必須包含更多的詞匯。文法被稱為上下文無關(guān)文法(CFGs)如果他們所有的規(guī)則有一個單獨的非終止符號右邊的箭頭。他們稱那是因為當規(guī)則適用于逆向更換不依賴于任何出現(xiàn)的其他符號(產(chǎn)生,而不是句子的語法分析的方式),是一個非終止象征。PSGs是上下文自由。這個圖表顯示如圖7-2所示。我們簡單的語法規(guī)則被用來生成句子。在這種情況下,它開始的標志句子,即“S”,而產(chǎn)生的句子“約翰擲球?!边@個簡單的語法當然不會產(chǎn)生所有的句子聲稱被規(guī)則可接受的。這也使我們產(chǎn)生的句子通常不愿接受,比如“約翰丟球?!倍鴨棠匪够臅f明的更復雜了,后來的作品也有產(chǎn)生相當精致的語法。由上世紀60年代早期,幾個語法在計算機程序中可以進行編碼分析樣品中的大學英語課文。4我將會提到幾種不同的語法,一些復雜多的成功的CFGs章節(jié)。然而即使是最復雜的語法不能讓我們將清潔區(qū)分句子當做正確的語法,那些我們也不會。我將會回到這個困難將用一種方法來解決它在以后的章節(jié)。圖7-2: 一個句子生成的分析樹一個句子的被解析語法方式是可以確定它的意思,所以一個很重要的一部分,自然語言處理涉及到使用的語法規(guī)則所能接受的解析語法樹的句子。找到一個語法樹包括搜索-在幾個不同的方面,非終止符號,從“S”開始,可以更換使用語法規(guī)則的企圖來配合目標的句子或單詞好幾種不同的目標句子可被非終止符號來產(chǎn)生“S”第一種類型的搜索被稱為“自上而下”(從“S”到一個句子);另一種叫“自下而上”(從一個句子到“S”)。它通常是(如果不是經(jīng)常)的情況下,給出了語法、句子有一個以上的語法樹,每個都有不同的含義。舉例來說,“這個人撞球在公園里”,在“公園”是動詞詞組隨著“撞”中會有一個語法樹或者在“公園”是一個名詞詞組隨著“球”中有一個語法分析樹。而且,我已經(jīng)提到,一些句子的分析可能是有意義的。舉例來說,根據(jù)我的簡單的語法,“球把那人”是一種合法的但是毫無意義的句子。哪一個解析樹是適當過程的一部分,是決定語義(甚至語言學)的水平。在20世紀50年代和超過整個大部分的60年代,句法分析比以前的語義是較發(fā)達。語義分析通常涉及利用解析樹來引導轉(zhuǎn)變成一個表達式語句的輸入,在一些明確的“或”的意思表達語言變成一個程式回應(yīng)的適當?shù)姆绞絹磔斎刖渥?。例如,“這名男子把球扔可能會變成一個邏輯表達式,如(x, y, z)Past(z) Man(x, z) Ball(y, z) Event(z) Throws(x, y, z),可解釋為“有x,y,z,這樣z是一個事件在過去,x是一個人在那次事件,是一個球在那次事件,x在那次事件扔y?!闭Z義分析也會變換句子“男人把球扔”變成程序,在過去某種程度上,就是模仿一個人把球扔了。7.2 機器翻譯最早的一些嘗試用電腦做超過平常的數(shù)值時是在自動計算的一種語言翻譯句子。詞典可以儲存在電腦內(nèi)存(在磁帶或在穿孔卡片),這樣可以用來發(fā)現(xiàn)英語與另外語言的同義詞。人們認為選擇一個在你的心中合適的每個詞,一個句子,連同適度的句法分析,可以用來翻譯國外的語言(俄羅斯)譯成英語句子。一個新的計算機5報告的標準是由一個在國家統(tǒng)計局(現(xiàn)在稱為國家標準與技術(shù)研究院)工作的Harry D. Huskey領(lǐng)導完成的。紐約時報5月31日報道,1949年6。一種新型的“電腦”,落戶在正在建設(shè)中在加利福尼亞的美國教育局州立大學的數(shù)值分析的標準實驗室,它的計算能力不是機器只有執(zhí)行復雜的數(shù)學問題,還有翻譯外文能力。而這臺機器將在翻譯領(lǐng)域準確的范圍還沒有定下來,科學家們進行這項工作,但那將是很可能的。它包含了6萬字的韋伯學院字典中每個詞的等價物多達3種外語。關(guān)于這臺機器如何做解釋翻譯,紐約時報的記者寫道:當一個外國詞翻譯成機器中的數(shù)字符號存儲在磁帶或卡中,這種機器將使用其“記憶”,如果發(fā)現(xiàn)的輸入的符號存儲在其數(shù)據(jù)庫中,它將會自動翻譯成一個預定的等效英語單詞。這顯然就相當于一個簡陋的逐字的英文翻譯, 雖仍是缺乏語法,但確實是極有價值的,但設(shè)計師說,這個機器若作為科學家用來翻譯外國的技術(shù)文件,詞匯是個比語法更嚴重的問題。這臺機器沒有實際執(zhí)行任何翻譯的理念,這樣做還只是Huskey的一種可能性的想象。但這個困難是非科學都能能夠想象的困難。第二天紐約時間的一篇社論將問題說了出來:我們對機器翻譯的準確度有疑慮。這臺機器是如何將法語單詞“pont”翻譯成“橋”或“牌”或去知道在德國“operation”就是意味著外科手術(shù)?所有的機器都只可以做簡單的任務(wù)如查閱字典中的單詞和在紙上寫上具有英語的同義詞,以便于翻譯者使用合適的框架句型,和適合上下文的語境意義。在1947年,沃倫維納,一個大雜院的織布者,一個數(shù)學家和科學的管理者,想利用數(shù)字計算機將文件翻譯成人類的自然語言。維納感到懷疑是否有這種可能性。在他回答,“我坦白我害怕的是邊界的詞在不同的語言意義太過含糊,情感和國際化內(nèi)涵粗放使得機器翻譯計劃很有希望?!比欢?949年7月,他精心闡述他的觀點在便簽上,命名為翻譯寄往幾個大學。他的聲明工備忘錄如下:相比論及世界各國多語言之間的文化交流阻礙這樣一個顯而易見的事實我們沒有必要做什么,理解是其中一種嚴重的障礙。在本諒解備忘錄,假定你的有效性和事實中這一點的重要性,一些評論和可能來自民眾的壓力造成至少一些需要解決問題的國際翻譯會通過使用電子計算機容量大,靈活性和速度來完成。根據(jù)大量7編輯發(fā)表備忘錄的翻印?!八麑⑺慕o了他大概200個在各個領(lǐng)域的熟人,就是所謂的第一個意見說曾經(jīng)見過計算機翻譯語言的技術(shù)的可能?!彼倪@個文件通常被記錄在機器翻譯領(lǐng)域中 (通常簡稱)8。1952年6月份在麻省理工學院,Yehoshua Bar-Hillel(1915-1975),一名以色列寬嚴兼濟工作在麻省理工學院的實驗室的科學家被認為是組織了致力于機器翻譯的第一次會議9。相比與最初的樂觀,Bar-Hillel在后來得出全自動翻譯是不可能的這樣一個結(jié)論。1954年一月,作為自動翻譯的樣品,俄羅斯課文自動翻譯成英語成功在IBM世界總部紐約市的麥迪遜大街57號得到論證。這個由國際商用機器公司(IBM)和喬治敦大學合作的演示用很少的詞匯和有限的語法。這個項目是由Cuthbert Hurd領(lǐng)導的,BM應(yīng)用科學部門和來自喬治城的Leon Dostert協(xié)作完成的。由國際商用機器公司(IBM)在1954年1月8日發(fā)布如下:10就在今天電子計算機第一次將俄文翻譯成英文。這個由來自喬治敦大學人文學院和語言學協(xié)會的語言學家提交的簡單的關(guān)于政治、法律、數(shù)學、化學,冶金、通訊和軍事事務(wù)的俄文報告被著名的國際商業(yè)機器公司的701電腦在幾秒鐘內(nèi)翻譯成英文。一個女孩不明白寫在國際商用機器公司(IBM)卡片上關(guān)于蘇聯(lián)人打下班鐘的文化信息?!澳X袋”被英文翻譯成一個以兩半線路每秒的玩命速度摔在了一個自動的打印機上。雖然這個證明造成極大的刺激和導致翻譯研究的資助的增加 ,但后續(xù)工作確是令人失望的11。在1959年傳閱評估MT工作報告的研究人員中,Bar-Hillel仍然確信優(yōu)質(zhì)的全自動的翻譯(他稱為FAHQT)并不可行“不僅在不久的將來不會,而且永遠不會”他在1960年擴展發(fā)表的報告?zhèn)鞑サ姆浅V泛12。支持Bar-Hillel說明高精度的使用計算機翻譯“世界知識”非常困難的負面結(jié)論的因素之一就是他下面的小故事:小約翰正在尋找他的玩具盒。他終于找到了。這個盒子里有只鋼筆。約翰非常高興。計算機應(yīng)該如何翻譯“盒子里的鋼筆?”Bar-Hillel爭論即使只有兩個定義的“筆”(一種寫作器具、一個是小孩子玩的附件),計算機知道只有那些定義卻沒有辦法知道那些特定的含義?!俺怂闹R的詞匯和句法之外一個翻譯的計算機能知道筆的相對大小,作為寫字工具的感覺、玩具盒、筆、感覺上的嬰兒圍欄?!边@樣的知識,Bar-Hillel聲稱,在電子計算機上不能處理。這給人們提供了任何進一步的討論一種計算機是百科知識結(jié)論幾乎是“完全荒謬絕倫?!毖芯咳藛T在以后終于承認,Bar-Hillel關(guān)于他的聲稱非常能干的自然語言處理系統(tǒng)(總體上主管艾系統(tǒng)的確廣泛)需要淵博知識是正確的。然而,大多數(shù)專家都不同意他的AI有關(guān)嘗試給計算機所需百科知識是徒勞的。Bar-Hillel是眾所周知的是對人工智能持反對意見的。 (一九五八年的的特丁頓學術(shù)研討會常見程序的約翰麥卡錫這樣評論。Bar-Hillel說: 麥卡錫博士的報紙雜志中Dr. I. J. Good的最近創(chuàng)造是不成熟的想法”。)13 1964年4月份,美國國家科學院形成自動語言處理諮詢委員會(ALPAC),與約翰r皮爾斯(1910-2002)的貝爾實驗室合作,國土防御局,中央情報局、國家科學基金會對計算機自動翻譯外語進行研究實驗。在1965年8月的委員會發(fā)布的結(jié)論報告中說“沒有直接和可預見性來證明機器翻譯的沒用?!?4他們推薦的支持基本的語言學科學和“艾滋病”的翻譯,但不適合全自動翻譯。該報道引發(fā)了一場戲劇,雖然大規(guī)模的機器翻譯研究經(jīng)費的減少但是機器翻譯幸存下來,并最終繁榮,如同我們在后面的章節(jié)講的。于1962年美國機器翻譯學會和計算語言學(AMTCL)舉行了第一次會議。在1968年,它改變了它的名字計算語言協(xié)會(前),已成為一種國際性科學與專業(yè)學會協(xié)助人們處理自然語言和計算上的問題。它出版季刊計算語言學和贊助者的會議和專題討論會15。7.2 程序問答除了工作上,研究人員開始探索機器翻譯在一個句子的自然語言,如英語,可以在計算機上使用了。你將召回一個人能夠進行對話情境的伊莉莎程序,盡管這個程序“理解”正在說什么呢。我已將拉斐爾的先生系統(tǒng)所能代表訊息給它然后回答問題。我要提到一些其他項目給予了自然語言的味道在這段時間里處理工作。一個項目叫做棒球(用IPL-V編程語言,一種特殊的list-processing開發(fā),紐尼爾蕭伯納、西蒙將要描述之后)是在亞伯拉罕林肯實驗室的指引下, 卡內(nèi)基研究所伯特格林心理學教授的技術(shù)16。它能回答簡單的英語的問題如在一年之內(nèi)關(guān)于棒球使用數(shù)據(jù)庫中關(guān)于棒球比賽在美國聯(lián)盟。例如,它可以回答一個問題等“7月7日紅襪隊在哪里玩”這個問題已經(jīng)成為一個特別簡單的形式和限制的話,在該程序的詞匯。在作者的話說, 17問題是局限于單一的條款;禁止結(jié)構(gòu)與從屬子句的語法分析是相當?shù)暮喕?。合乎邏輯的語義上,例如,或者,不,是禁止建筑暗示,像大多數(shù)關(guān)系最高的地方。最后,內(nèi)容涉及序列的事實,如紅襪隊贏得六連勝?”是被禁止的。這個程序轉(zhuǎn)換成一個問題變成一種特殊形式稱為“規(guī)格清單”,用專用句法和語義分析。這個列表將被用于訪問程序的數(shù)據(jù)庫來找到一個對這個問題的回答。舉例來說,這個問題:“7月7日紅襪在哪里?”首先會被轉(zhuǎn)換成名單: 地點 = ?球隊 = 紅襪隊月份 = 7月日子 = 7日作者們聲稱,“他們那些臨時的方法,這將會在以后限制程序的版本?!钡珦?jù)我所知,那里沒有以后版本的程序。正如我們所看到的(我知道的歷史有以下幾種情況,它證明那些“臨時”限制很難被清除。)另一個是由卡內(nèi)基技術(shù)研究的羅伯特林德賽在1962-1963在IPL-V所發(fā)表的自然語言程序SAD SAM18。它能夠分析英語句子的家庭關(guān)系和編碼這些家庭關(guān)系的樹。然后使用這棵樹回答關(guān)于人際關(guān)系英語問題。舉例來說,如果程序SAD SAM接收到句子“喬和簡是湯姆的后代”,構(gòu)建一個為樹狀結(jié)構(gòu)的列表作為“家庭單位”湯姆是父親和喬及簡是兒童。然后,如果它接收到這句話是說:“瑪麗是簡的媽媽”,這將增加結(jié)構(gòu)瑪麗為湯姆的妻子。它將能夠回答這個問題:“誰是喬的母親?”SAD SAM的全稱是句子的鑒定、圖形和語義分析的機器。SAD是分析句子然后發(fā)給SAM,而SAM將他們的語義信息提取所需家庭樹和尋找建設(shè)問題的答案。這個程序可以接受了在基礎(chǔ)英語中各式各樣的句子一個系統(tǒng)的語法和來自查爾斯奧格登字典的850個詞匯19。羅伯特西蒙斯(1925-1994)、一個來自加利福尼亞州圣莫尼卡SDC的心理學家、語言學家為自己工作的自然語言處理系統(tǒng)說明了系統(tǒng)的宏偉目標。根據(jù)隨拉脫維亞國家歌劇院”頁面撰寫之一戈登諾瓦克博士在奧斯丁州的得克薩斯大學就職的計算機科學與心理學教授學生西蒙斯說20:我的夢想是“可以與書對話”;當電腦能讀這本書時,用戶可以通過電腦來提問電腦,而計算機理解書本后可以做出的回答。完成這個“夢想”就像完成AI一樣困難。1961年他在它的“Synthex” 工程筆記中,西蒙斯講述了他將開始21:這個項目的目標是建立一個與車輛的設(shè)計和施工的一般用途的由電腦系統(tǒng)來合成復雜的人類認知功能的研究方法論。最初的車輛,proto-synthex, 是一個能理解簡單的打印資料和能回答基礎(chǔ)英語的簡單問題的語言處理系統(tǒng)。 1965年,俄克拉何馬州的勞倫西蒙斯用他們的Protosynthex系統(tǒng)進行了實驗。據(jù)Trudi Bellardo Hahn報道22,“兒童版的百科全書的章節(jié)作為小樣機的全文數(shù)據(jù)庫裝載在該系統(tǒng)。Protosynthex可以用英語對簡單的問題,進行一個“響應(yīng)”。它一種在自然語言檢索的創(chuàng)新的使用。”在此期間, Daniel G. Bobrow (1935 -),一個麻省理工學院博士學位的學生馬文明斯基,寫了一段叫學生系統(tǒng)的程序, 若是給它在一個受限制的子集,它能用英語解決代數(shù)“故事的問題”。這里有個例子可以用學生系統(tǒng)來解決問題:從紐約到洛杉磯是3000英里。如果一架噴氣式飛機的平均速度是每小時六百英里,計算噴氣機從紐約到洛杉磯的時間。學生系統(tǒng)用一些已知速度與距離的關(guān)系來建立適當?shù)那蠼夥匠淌浇鉀Q了這個問題。Bobrow的論文給的其他幾個例子中,學生系統(tǒng)也能用這樣的方法有效地解決題23。注釋:1. Noam Chomsky, Syntactic Structures, s-Gravenhage: Mouton & Co., 1957. 1422. The basic structure of PSGs was independently invented by computer scientist JohnBackus to describe the syntax of the ALGOL programming language. See John Backus,“The Syntax and Semantics of the Proposed International Algebraic Language of the ZurichACM-GAMM Conference,” Proceedings on the International Conference on Information Processing, pp. 125132, UNESCO, 1959. 1423. According to C. George Boeree (see /cgboeree/wundtjames.ht ml),Wilhelm Wundt “invented the tree diagram of syntax we are all familiar with in linguistics texts.” 1434. For a survey of work during this period, see Daniel Bobrow, “Syntactic Analysis of English by Computer: A Survey,” Proceedings of the 1963 Fall Joint Computer Conference, Vol. 24, pp. 365387, Baltimore: Spartan Books, 1963. 1455. The Standards Western Automatic Computer (later abbreviated to SWAC) 1476. The quotation appears in John Hutchins, “From First Conception to First Demonstration: The Nascent Years of Machine Translation, 19471954. A chronology,” Machine Translation, Vol. 12 No. 3, pp. 195252, 1997. (A corrected 2005 version, with minor additions, appears at http:/www.hutchinsweb.me.uk/MTJ-1997-corr.pdf .) 1477. W. N. Locke and A. D. Booth (eds.), Machine Translation of Languages: Fourteen Essays, pp. 1523, Cambridge, MA: MIT Press, 1955. 1488. For a history of MT, see W. John Hutchins, “Machine Translation: A Brief History,” in E. F. K. Koerner and R. E. Asher (eds.), Concise History of the Language Sciences: From the Sumerians to the Cognitivists, pp. 431445, Oxford: Pergamon Press, 1995. (Also available online at http:/www.hutchinsweb.me.uk/ConcHistoryLangSci-1995.pdf .)Hutchins also has a Web page devoted to his publications at /homepages/WJHutchins/#History1. 1489. For reports about this conference see E. Reier, “The First Conference on Mechanical ranslation,” Mechanical Translation, Vol. 1 No. 2, pp. 2332, 1954, and A. C. Reynolds,“The Conference on Mechanical Translation Held at MIT, June 1720, 1952,” Mechanical Translation, Vol. 1, No. 3, pp. 4755, 1954. 14810. /ibm/history/exhibits/701/701 translator.html. 14811. For a summary of the IBMGeorgetown work, see W. John Hutchins, “TheGeorgetownIBM Experiment Demonstrated in January 1954,” in Robert E. Frederking and Kathryn B.Taylor (eds.), Proceedings of Machine Translation: From Real Users to Research, 6th Conference of the Association for Machine Translation in the Americas, AMTA-2004, pp. 102114, Washington DC, USA, September 28October 2, 2004, Berlin: Springer, 2004.An online version is available at http:/www.hutchinsweb.me.uk/ATMA-2004.pdf . 14912. Yehoshua Bar-Hillel, “The Present Status of Automatic Translation of Languages,”Advances in Computers, Vol. 1, No. 1, pp. 91163, 1960. 14913. In D. V. Blake and A. M. Uttley (eds.), Proceedings of the Symposium on Mechanisation of Thought Processes, p. 85, London: Her Majestys Stationary Oce, 1959. 15014. John R. Pierce et al., Language and Machines: Computers in Translation andLinguistics, ALPAC Report, National Academy of Sciences Publication 416, NationalResearch Council, Washington, DC, 1966. 15015. See /. 15016. Bert F. Green Jr., Alice K. Wolf, Carol Chomsky, and Kenneth Laughery, “BASEBALL: An Automatic Question Answerer,” pp. 219224, Proceedings of the Western Joint Computer Conference, May 1961. Reprinted in Edward A. Feigenbaum and Julian Feldman (eds.), Computers and Thought, pp. 207216, New York: McGraw Hill, 1963, and in B.Grosz, K. Spark Jones, and B. Lynn Webber (eds.), Readings in Natural LanguageProcessing, Morgan Kaufman, Los Altos, CA, 1986. 15117. Ibid. 15118. See Robert K. Lindsay, “Inferential Memory as the Basis of Machines WhichUnderstand Natural Language,” in Edward A. Feigenbaum, and Julian Feldman, op. cit.,pp. 217233. 15119. Charles K. Ogden, Basic English: A General Introduction with Rules and Grammar,4th edition, London: Kegan, Paul, Trench, Trubner & Co., Ltd., 1933. (Lindsay says 1,700 words; other sources say 850.) 15220. From /users/ai-lab/simmons.html. 15221. Robert F. Simmons, “Synthex,” Communications of the ACM, Vol. 4 , No. 3, p. 140,March 1961. 15222. From “Text Retrieval Online: Historical Perspective on Web Search Engines,” by Trudi Bellardo Hahn, ASIS Bulletin, April/May 1998. Available online at/Bulletin/Apr-98/hahn.html. 15223. Daniel G. Bobrow, “Natural Language Input for a Computer Problem Solving System,” MIT Articial Intelligence Project Memo 66, Memorandum MAC-M-148, March 30, 1964.第8章 20世紀60年代基礎(chǔ)建設(shè)在20世紀60年代,由幾個系統(tǒng)支持和社會因素幫助(一個真正存在的可能)了技術(shù)的發(fā)展。新的計算機語言,使它更容易建立人工智能。研究者從數(shù)學,認知科學、語言學、和新型科學“計算機科學”各個領(lǐng)域聚集在會議和新形成的實驗室中解決機械化智能的行為的這個問題。此外,政府機構(gòu)和公司,也認為他們應(yīng)該在這個新領(lǐng)域中提供研究上的支持。8.1 編程語言紐尼爾,西蒙是首批意識到若有一個專門的易于操做的象征詞語作為計算機語言,將能更好的解決人工智能。最基本類型的符號表達式是列表的符號,例如(7,B,5)。更復雜的結(jié)構(gòu)可由創(chuàng)建表列出的符號表列出清單,等等。在我描述的符號的結(jié)構(gòu),我提到的eight-puzzle這個類型的操作是非常必要的。eight-puzzle的起始位置描述成表達式(2, 8, 3), (1, 6, 4), (7, B, 5).所需要的是一種新語言來編寫程序,可以產(chǎn)生位置移動的表達式代表相應(yīng)的難題。比如說, 可以由起始位置的移動描述成表達式,(2, 8, 3), (1, 6, 4), (B, 7, 5).產(chǎn)生這種表達式時,這個程序必須復制的首發(fā)位置的表達式,然后換乘在那個表達式的第一和第二元素的第三個清單。紐尼爾,肖博士,西蒙著手開發(fā)這些可編程的各種手法一種語言。1954年前后,蘭德公司,他們創(chuàng)造了一系列的語言都稱為IPL(處理信息的語言)。各種版本的語言被發(fā)。IPL-I實際上并不實行,但只是作為一個設(shè)計規(guī)格。1955年蘭德公司在JOHNNIAC計算機實施的IPL-II。以后的版本(直到IPL-VI)實施在卡內(nèi)基的技術(shù)。IPL語言程序是早期用來解決人工智能的程序,包括LT, GPS, NSS (紐尼爾,肖博士,西蒙象棋程序),這個項目由紐維爾和西門的學生,如奎廉和喬治恩斯特。達特茅斯后,約翰麥卡錫在達特茅斯夏季計劃后開始考慮運用鏈表語言。他很清楚在Gelernter的幾何據(jù)機器如何使用FLPL(FLPL堅固一些list-processing FORTRAN語言操作)。但是最后,麥卡錫認識到一門比IPL更容易使用比FLPL更強大的新語言是必需的。在1958年秋天的麻省理工學院, 麥卡錫開始實施一種叫LISP (表處理)的程序設(shè)計語言。他以它(一般)對數(shù)學的一個分支的特殊感情來學習這門在計算稱為遞歸函數(shù)理論。LISP有幾個復制列表的基本操作元素,去掉一個列表,添加一個元素,并檢查清單去看看列表有什么成分可以組成。LISP的一個重要的特性之一,項目的清單被自己操縱描繪成名單。這樣的程序可能因此元素列表和其他的可能子程序埋在他們。一個程序甚至能有一個版本的本身就嵌入在里面。我已經(jīng)說過, 作為可以激活自己版本的程序操作被稱為“遞歸”(如果使用非常有用的護理需要避免無盡的如果)。因為它的更容易使用, LISP很快就被作為重要的IPL語言研究和應(yīng)用的人工智能。寫LISP程序的有明斯基的學生埃文斯、拉斐爾、博布羅, 斯萊格爾和一些其他人。(有趣的是,亞瑟塞繆爾沒有使用list-processing語言寫他的西洋棋比賽程序。而他們的創(chuàng)新使用編程語言提高了機器的操作效率,也使他們節(jié)儉了內(nèi)存。)除了創(chuàng)造LISP,麥卡錫還提出了一種叫分時作業(yè)的方法模型, 就是一臺計算機可以為幾個用戶同時作業(yè),相當于每個用戶都有他或她自己的私人機器2。最初Ed-Fredkin 工作在BBN ,麥卡錫開發(fā)早期的分時作業(yè)系統(tǒng)是在12月的麻省理工學院計算機PDP-13。8.2早期的AI實驗室1955年,紐尼爾是從蘭德公司到卡內(nèi)基科技(它在1967年成為了卡內(nèi)基梅隆大學)在草本西門下攻讀工業(yè)管理博士學位。完成后他的學位,紐尼爾他在卡內(nèi)基大學擔任教授,他和西門開始建議許多再讀博士學生使用的“復雜的信息處理(CIP)”來處理自己的工作。(好幾年后他們得到了AI的綽號。)1956年的秋天,西門獲得了第一次使用CIP工作的電腦IBM 65。后來他們使用了緊隨其后的DEC系列的計算機IBM 704。在1958年的秋天,約翰麥卡錫從達特茅斯來到了麻省理工學院。一年后明斯基加入麻省理工學院。明斯基如是說4麥卡錫和我)在走上大廳時遇到杰瑞維斯納,齊默曼和某些人,他說怎么樣讓我們說得很好,我們正在改變想法,但對于人工智能,我們需要更多一點的機會和一些畢業(yè)生的支持。這樣一個機會出現(xiàn)幾天之后。這個“機會”很快就成了MIT的人工智能項目。起初,這個小組使用的是麻省理工學院的IBM 704計算機,但是IBM 704沒足夠的內(nèi)存來寫程序。所以就開始使用了屬于BBN的DEC PDP-1。隨著另一個項目在麻省理工學院被資助,它買了PDP-1,緊隨其后又買了PDP-6和PDP-10。小組的幾個具有博士學位的學生在BBN做他們的工作, 奧利弗塞爾弗里奇在林肯實驗室附近繼續(xù)他主要對機器學習和模式識別的人工智能研究-。1962年, 麥卡錫搬到斯坦福大學開始它的一個AI的項目。1963年,西蒙派珀特(1928 -),一個曾經(jīng)和皮亞杰工作過的數(shù)學家,以助理的身份加入了明斯基AI實驗室。1965年斯坦福大學的麥卡錫和它的同事們在PDP-1計算機創(chuàng)造了一種叫做索爾的分時作業(yè)系統(tǒng)。它包括十二個飛歌顯示終端,使它成為了世界上第一個被展示出來的分時作業(yè)系統(tǒng)。1965年,在萊斯特的幫助下(1930 -),麥卡錫從林肯實驗室搬到了斯坦福大學,并且建立斯坦福AI實驗室。1966年的夏天,一些實驗設(shè)施、斯坦福AI實驗室搬到斯坦福大學的一個大樓中。(參見圖8-1)因為ARPA的支持,該實驗室取得了一臺電腦DEC PDP-6,后來又得到一個PDP-10計算機。此外,它又進入人工智能領(lǐng)域(我會在隨后的幾章描述), SAIL參與了許多項目包括開發(fā)一種前兆“窗口”,早期安裝在個人的辦公室的電腦終端5。在早期,主要是卡內(nèi)基梅隆大學、麻省理工學院,和斯坦福大學的群體領(lǐng)導研究人工智能。后來一個又一個的學校的畢業(yè)生和老師成為了人工智能的研究者。1965年,另一個世界級的AI研究中心出現(xiàn)在蘇格蘭的愛丁堡大學周圍。它的創(chuàng)立者是在第二次世界大戰(zhàn)時曾經(jīng)和艾倫圖靈(杰克)一起工作過的唐納德 米奇(1923-2007;圖8-2)。與圖靈對智能機器的良好討論深深迷住了米奇。他在2002年10月份的采訪說,“我決定讓機器智能出現(xiàn)在我生命像企業(yè)變得可行一樣。”6因為年代的中期至晚期電腦設(shè)備的原始和少見,米奇成為了遺傳學家和分子生物學家。因為追求自己對機器智能的興趣,1960年他在業(yè)余時間做出了能學會玩tic-tac-toe 的“玻璃珠和火柴盒組成的奇妙裝置”。他把它叫做“機器” MENACE是可教育的打字游戲和十字架的火柴盒引擎的縮寫。(見圖8-3)(在我的解釋中MENACE預示著工作現(xiàn)在被稱為“強化學習一年?!?在20世紀60年代初參觀斯坦福大學(由美國海軍研究舉辦),米奇相遇了約翰麥卡錫,伯納德威德羅和其他研究AI的人(包括我)。在那里的時候,他曾在寫出了一個如何尋找機動車上的平衡支點的學習程序7。1965年一月份,米奇成為英國第一人工智能實驗室的主任,這個實驗室規(guī)劃單位在愛丁堡大學。1966年10月,該小組成為機器智慧和知覺的部門。米奇招募了一些頂級的計算機人才,包括Burstall,羅賓,約翰科林斯。這三個人研制了一種鏈表語言命名為POP-2。這個語言被部門的會員用來做人工智能的研究。(以后我將描述其中的一些程序)多年來,米奇小組一直與伯納德(1916-2008)領(lǐng)導的數(shù)學小組合作工作在愛丁堡大學的周圍。這個超數(shù)學小組以羅伯特博耶和斯特羅瑟摩爾工作于機械化定理與羅伯特柯在一些原則邏輯編程而聞名于世。在波基普西州的森羅切斯特和Herb Gelernter的IBM達特茅斯車間,繼續(xù)研究人工智能很短的一段時間后。然而不久后,根據(jù)一本關(guān)于政府支持計算研究的報告,“盡管早期羅徹斯特和其他國際商用機器公司(IBM)人員研究過,但是公司在人工智能的研究在逐漸冷卻?!?也許IBM希望人們重視電腦如何幫助,而不是可能會取代人們執(zhí)行任務(wù)。麥卡錫說,國際商用機器公司(IBM)覺得人工智能9(機器和人一樣聰明)對公司形象不太好這可能與公司形象口號“數(shù)據(jù)處理,而不是計算”10有關(guān)系。8.3 研究的歷程 隨著人工智能研究需要的計算機系統(tǒng)變得越來越大越多越貴,隨著AI實驗室的建立,必要的安全比財政的支持更重要。20世紀50年代晚期和60年代早期,兩個主要的資金來源是美國國防部撥給美國海軍研究(ONR)和高級研究計劃局(ARPA)的一個部分。ONR 成立在第二次世界大戰(zhàn)結(jié)束不久之后。其任務(wù)是“計劃、培育和鼓勵科學家拿出最重要的相關(guān)的認可技術(shù)來維修未來的海軍力量和維護國家安全”。它的信息系統(tǒng)部門在20世紀50年代中期馬歇爾的領(lǐng)導下建立的。這個分部機構(gòu)支持有關(guān)AI的工作,還獨自組織舉辦了人工智能控制論,光學字符,識別系統(tǒng)的研討會。所有這些都在期待這些技術(shù)可以廣泛應(yīng)用在美國海軍。(之后不久,馬文支持我對人工智能的一些研究和寫教科書)ARPA的成立,一部分是為了響應(yīng)1957年蘇聯(lián)人造衛(wèi)星的成功發(fā)射。ARPA的任務(wù)是大量的研究調(diào)查來尋找重要大的對美國國防部的攻擊。20世紀50年代它的一個最重要的項目是彈道導彈的過程中錐型材料的吸收和散熱。1962年,它的信息處理技術(shù)辦公室(IPTO)在J. C. R Licklider (1915-1990)的領(lǐng)導下成立?!癓ick”(他是由所有認識他的人取得)先在林肯實驗室和麻省理工學院工作,之后又工作在BBN。1960年Lick的論文“人與電腦共生”提出利用人和電腦應(yīng)該“在制定決策和控制預定的計劃中沒有固定依據(jù)的復雜情況進行合作”。11Lick被說服, 防御將是電腦中一個非常重要的角色特別是那些人和電腦工作在一起應(yīng)用軟件。在ARPA, 他提供的資金給麻省理工學院去建立項目MAC(Machine-Aided Cognition的縮寫也肯可能是對人與計算機的運算或多址的認知)項目MAC,1963年7月成立的,后來成為了計算機實驗室科學的發(fā)展趨向,并仍然的演變到計算機科學和人工智能實驗室(CSAIL)。項目MAC也是明斯基和麥卡錫在人工智能的項目,也是在費爾南多領(lǐng)導的支持麻省理工學院兼容分時作業(yè) (CTSS)。(CTSS工作是分離的分時作業(yè)項目。)ARPA基金是幫助計算機科學建立“卓越的中心”。除了麻省理工學院, 這些中心還包括卡內(nèi)基美倫大學,斯坦福大學。ARPA的工作還支持計算機科學工作在蘭德公司,系統(tǒng)開發(fā)公司, BBN等等。AI只是ARPA的利益之一。IPTO支持的圖形用戶界面和鼠標、高速計算,計算機硬件和超大規(guī)模集成電路的研究,或許最著名的研究就是互聯(lián)網(wǎng)。根據(jù)Licklider介紹“ARPA預算不包括AI,直到1968年它才作為一個單獨的項目進行預算?!?2但對于AI而言,Lick相信紐尼爾和西門,明斯基,麥卡錫應(yīng)當提供資金充足支持大AI的項目。關(guān)于斯坦福大學的這個情況(或許麻省理工學院和卡內(nèi)基梅隆大學也有),保羅愛德華茲解釋說:13從ARPA實際上是出發(fā),Licklider簡單地問麥卡錫他想要的東西,然后遞給他,一個大多數(shù)政府機構(gòu)覺得不可思議的程序。Licklider回憶說“似乎是顯而易見的,他應(yīng)該有個ARPA支持的實驗室,所以那個時候我和他寫了合同?!丙溈ㄥa記住了所有不同點。1962年到達斯坦福大學后不久,他給了Licklider一個去做AI的提議。在剛開始Licklider因為他們親密關(guān)系第一時間反對麥卡錫的提議,當時麥卡錫在麻省理工學院,Licklider在BBN,但是隨后Licklider給了他一個“小合同?!?4也許相比那個時候的調(diào)查研究報告書它并非很“小”(美國國家科學基金會這樣說)。萊斯熱切主張麥卡錫“在1963年6月15日通過小型活動(六人以內(nèi))獲得了高級研究計劃局的資金支持”。后來,為了強調(diào)它在國防科研的作用,ARPA更名為DARPA(國防部高
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于勞動力轉(zhuǎn)移視角的勞務(wù)品牌建設(shè)
- 公司章程內(nèi)部管理制度
- 2024年貴州六枝特區(qū)城政建設(shè)有限責任公司招聘真題
- 勞模感謝發(fā)言材料
- 河南鄭州工商學院招聘筆試真題2024
- 社區(qū)社區(qū)服務(wù)設(shè)施維護與管理基礎(chǔ)知識點歸納
- 制造系統(tǒng)安全性和可靠性評估指標體系研究-洞察闡釋
- 基于AI的生理學教學評估與學習效果提升
- 社區(qū)托育服務(wù)的質(zhì)量監(jiān)控與評估體系建設(shè)
- 造紙業(yè)企業(yè)經(jīng)營管理方案
- 中國特色社會主義思想概論 課件 第四章 堅持以人民為中心
- 廣州市地理生物結(jié)業(yè)考試卷2022
- 核賠經(jīng)典疑難案例解析
- 西班牙語入門語法(修正)
- 文科物理學習通課后章節(jié)答案期末考試題庫2023年
- 監(jiān)理工作驗收的流程及驗收的標準
- 大棚房整治工作總結(jié)報告【六篇】
- 古今字通假字異體字繁簡字
- “一河(湖)一策”方案編制指南 (試行)
- 湖南省專業(yè)技術(shù)人員繼續(xù)教育2022年公需科目考試試題及參考答案
- 消防栓定期檢查記錄表
評論
0/150
提交評論