世紀(jì)對(duì)弈-AlphaGo的勝利_第1頁
世紀(jì)對(duì)弈-AlphaGo的勝利_第2頁
世紀(jì)對(duì)弈-AlphaGo的勝利_第3頁
世紀(jì)對(duì)弈-AlphaGo的勝利_第4頁
世紀(jì)對(duì)弈-AlphaGo的勝利_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

世紀(jì)對(duì)弈——AlphaGo圍棋勝利的深度透視事件的最初與發(fā)展背景研究者讓“阿爾法圍棋”和其他的圍棋人工智能機(jī)器人進(jìn)行了較量,在總計(jì)495局中只輸了一局,勝率是99.8%。它甚至嘗試了讓4子對(duì)陣CrazyStone、Zen和Pachi三個(gè)先進(jìn)的人工智能機(jī)器人,勝率分別是77%、86%和99%。事件的最初與發(fā)展背景據(jù)國際頂尖期刊《自然》封面文章報(bào)道,谷歌研究者開發(fā)的名為“阿爾法圍棋”(AlphaGo)的人工智能機(jī)器人,在沒有任何讓子的情況下,以5:0完勝歐洲圍棋冠軍、職業(yè)二段選手樊麾。在圍棋人工智能領(lǐng)域,實(shí)現(xiàn)了一次史無前例的突破。計(jì)算機(jī)程序能在不讓子的情況下,在完整的圍棋游戲中擊敗專業(yè)選手,這是第一次。事件的最初與發(fā)展背景2016年李世石VSAlphaGo比賽成績(jī)表

AlphaGo李世石3月09日103月10日103月12日1

0

3月13日0

1

3月15日

阿爾法圍棋程序的下一個(gè)挑戰(zhàn)對(duì)象是世界圍棋冠軍李世石。這場(chǎng)人工智能與人類的博弈于2016年3月9日在首爾舉行,獎(jiǎng)金是由Google提供的100萬美金。[2-5]

2016年3月12日,“AlphaGo”與韓國14冠高手李世石之間的人機(jī)大戰(zhàn)第三局中,李世石沒能挽回賽點(diǎn),執(zhí)黑中盤再次失利,在五番棋的較量中總比分0-3落敗,錯(cuò)失百萬美元獎(jiǎng)金。[7]

2016年3月13日,谷歌人工智能“阿爾法圍棋”(AlphaGo)與韓國棋手李世石繼續(xù)進(jìn)行第四場(chǎng)較量,經(jīng)過4個(gè)多小時(shí)的比賽,最終李世石戰(zhàn)勝AlphaGo迎來首勝,終結(jié)三連敗的同時(shí)將比分扳成以1:3。[8]

3月9第一局李世石認(rèn)輸[9]

3月10第二局李世石認(rèn)輸[10]

3月12第三局李世石認(rèn)輸[11]

3月13第四局李世石勝[12]

經(jīng)過,選手資料,AlphaGo的誕生阿爾法圍棋(AlphaGo)是一款圍棋人工智能程序,由位于英國倫敦的谷歌(Google)旗下DeepMind公司的戴維·西爾弗、艾佳·黃和戴密斯·哈薩比斯與他們的團(tuán)隊(duì)開發(fā),這個(gè)程序利用“價(jià)值網(wǎng)絡(luò)”去計(jì)算局面,用“策略網(wǎng)絡(luò)”去選擇下子。2015年10月阿爾法圍棋以5:0完勝歐洲圍棋冠軍、職業(yè)二段選手樊麾;2016年3月對(duì)戰(zhàn)世界圍棋冠軍、職業(yè)九段選手李世石。[1]

經(jīng)過,選手資料,AlphaGo的誕生【賽前】自信“AI連1%的取勝機(jī)會(huì)都沒有”去年,AI專家預(yù)計(jì)電腦要打敗職業(yè)圍棋手還需要10年,但去年10月,AlphaGo就以5:0擊敗了歐洲圍棋冠軍樊麾,震驚棋界。但即便如此,當(dāng)眾高手知曉AlphaGo要挑戰(zhàn)李世石時(shí),仍不以為然?!爸荒苷f李世石運(yùn)氣太好了”,有著強(qiáng)烈自信的95后天才少年柯潔,賽前徹底看好人類獲勝,“計(jì)算機(jī)戰(zhàn)勝李世石的可能性不到百分之五?!焙屠钍朗粦?zhàn)多年的好友古力則表示:“贏李世石1%的可能性都沒有”。上述兩人代表了棋界的普遍觀點(diǎn),其實(shí)連AlphaGo的研發(fā)團(tuán)隊(duì),都摸不準(zhǔn)AI能表現(xiàn)出什么水平?!叭绻銌栆粋€(gè)偉大棋手如何決定落子位置的,他經(jīng)常會(huì)告訴你‘我覺得那樣比較正確’,但這是計(jì)算機(jī)不擅長(zhǎng)的?!毖邪l(fā)團(tuán)隊(duì)坦言,AI雖然有強(qiáng)大的計(jì)算能力,但在大的方面仍處劣勢(shì)。經(jīng)過,選手資料,AlphaGo的誕生【賽前】自信“AI連1%的取勝機(jī)會(huì)都沒有”去年,AI專家預(yù)計(jì)電腦要打敗職業(yè)圍棋手還需要10年,但去年10月,AlphaGo就以5:0擊敗了歐洲圍棋冠軍樊麾,震驚棋界。但即便如此,當(dāng)眾高手知曉AlphaGo要挑戰(zhàn)李世石時(shí),仍不以為然?!爸荒苷f李世石運(yùn)氣太好了”,有著強(qiáng)烈自信的95后天才少年柯潔,賽前徹底看好人類獲勝,“計(jì)算機(jī)戰(zhàn)勝李世石的可能性不到百分之五?!焙屠钍朗粦?zhàn)多年的好友古力則表示:“贏李世石1%的可能性都沒有”。上述兩人代表了棋界的普遍觀點(diǎn),其實(shí)連AlphaGo的研發(fā)團(tuán)隊(duì),都摸不準(zhǔn)AI能表現(xiàn)出什么水平?!叭绻銌栆粋€(gè)偉大棋手如何決定落子位置的,他經(jīng)常會(huì)告訴你‘我覺得那樣比較正確’,但這是計(jì)算機(jī)不擅長(zhǎng)的。”研發(fā)團(tuán)隊(duì)坦言,AI雖然有強(qiáng)大的計(jì)算能力,但在大的方面仍處劣勢(shì)。經(jīng)過,選手資料,AlphaGo的誕生【第一局賽后】震驚“李世石仍有五成勝率”3月9日,首戰(zhàn)打響,全球矚目。在全球一億人注視下,四個(gè)小時(shí)后,李世石執(zhí)黑投子認(rèn)輸,讓人措手不及。人們開始震驚:新的時(shí)代真的到來了?李世石首局本有取勝機(jī)會(huì),開局階段他占據(jù)優(yōu)勢(shì),可惜李世石隨后的棋路趨于保守,并在長(zhǎng)時(shí)間比賽后出現(xiàn)失誤。人會(huì)疲憊,人會(huì)失誤,但電腦不會(huì),AlphaGo抓住機(jī)會(huì)瘋狂反擊,李世石最終在局面大好時(shí)遭到逆轉(zhuǎn)。正是因?yàn)樽陨硎д`和情緒波動(dòng)的原因?qū)е侣鋽。@讓包括李世石在內(nèi)的絕大多數(shù)棋界人士,對(duì)接下來的比賽保持樂觀?!昂竺娴钠逦覄偎氵€是會(huì)很大吧,勝算會(huì)是五成吧。”李世石表示??聺嵰蔡鰜硐駻lphaGo宣戰(zhàn):“就算阿法狗戰(zhàn)勝了李世石,但它贏不了我!”經(jīng)過,選手資料,AlphaGo的誕生【第二局賽后】懷疑“有不能打劫的保密協(xié)議?”第二局,李世石再次落敗。但人們發(fā)現(xiàn)奇怪的一點(diǎn):AlphaGo為何從不打劫?除了和李世石的兩局,AlphaGo此前5:0零封歐洲圍棋冠軍樊麾的比賽里,也沒有打劫。同樣,李世石也沒有打劫。網(wǎng)友提出疑問:是否存在秘密協(xié)議,規(guī)定不能打劫?對(duì)于這個(gè)質(zhì)疑,AlphaGo的開發(fā)團(tuán)隊(duì)表示,根本不存在這個(gè)所謂的秘密協(xié)議。他們也想知道,AlphaGo在對(duì)陣?yán)钍朗@種高手打劫時(shí)的表現(xiàn)。兩局下來,人們對(duì)AI的力量有了更深刻的認(rèn)識(shí)。如果說第一局AlphaGo的一些落子還有待商榷,那么在第二局中,AlphaGo不但幾乎沒有破綻,而且有了超出人類棋手理解范圍的出招,這讓古力都感嘆“我們要向它學(xué)習(xí)了!”柯潔也不像之前那么高調(diào):“雖有信心,但不能保證穩(wěn)贏。”經(jīng)過,選手資料,AlphaGo的誕生【第三局賽后】服氣“5個(gè)九段一起上或許能贏”第二局結(jié)束后,李世石與幾位好友進(jìn)行了通宵復(fù)盤研究,尋找對(duì)付AlphaGo的策略,最終大家得出共同的結(jié)論:要想取勝,必須靠打劫等復(fù)雜下法才有機(jī)會(huì)獲勝??墒?,AlphaGo也在不停進(jìn)步,這讓它在第三局展現(xiàn)出了更強(qiáng)大的棋力。對(duì)弈中,李世石左下角“故意”選擇了一個(gè)可能留下打劫的變化,而AlphaGo在最后的較量中,實(shí)現(xiàn)了主動(dòng)打劫和提劫,這也讓此前盛傳的陰謀論不攻自破??膳碌氖?,AlphaGo劫爭(zhēng)時(shí)表現(xiàn)得幾乎無懈可擊,讓李世石招架得十分辛苦。三局之后,按照古力的估算,人類若要打敗AlphaGo需要組團(tuán)作戰(zhàn)。“即使柯潔出場(chǎng)也下不過”,古力認(rèn)為,如果頂尖棋手組團(tuán)作戰(zhàn),把失誤降到最低,或許有希望獲勝:“至少得5個(gè)九段!”(來源:重慶晨報(bào))經(jīng)過,選手資料,AlphaGo的誕生李世石出現(xiàn)“神之一手”第四局戰(zhàn)勝AlphaGo13日下午,谷歌人工智能“阿爾法圍棋”(AlphaGo)與韓國棋手李世石繼續(xù)在韓國首爾鐘路區(qū)四季酒店進(jìn)行第四場(chǎng)較量,經(jīng)過4個(gè)多小時(shí)的比賽,最終李世石戰(zhàn)勝AlphaGo迎來首勝,終結(jié)三連敗的同時(shí)將比分扳成以1:3。細(xì)節(jié),輿論,名字由來DemisHassabis為DeepMind共同創(chuàng)辦人暨執(zhí)行長(zhǎng),DeepMind作為受神經(jīng)科學(xué)啟發(fā)的人工智能公司,于2014年1月被Google收購,傳聞收購金額達(dá)4億美元,成為迄今最龐大的歐洲收購案。1Demis目前擔(dān)任GoogleDeepMind的工程部副總,帶領(lǐng)Google團(tuán)隊(duì)積極投入人工智能的研發(fā)。Demis小時(shí)候是一個(gè)國際象棋神童,僅僅13歲棋藝已達(dá)大師等級(jí)。當(dāng)時(shí)Demis的棋藝僅次于國際特級(jí)大師波爾加?朱迪(PolgárJudit),為世界段位第二高的棋手。在提前兩年完成A-Level考試之前,17歲的Demis已編寫好了銷售超過數(shù)百萬的“主題公園”(ThemePark)模擬游戲。談到開發(fā)AlphaGO的初衷,DeepMind執(zhí)行長(zhǎng)DemisHassabis提到他小時(shí)候很喜歡國際象棋,到了大學(xué)時(shí)期跟朋友瘋狂玩圍棋,那時(shí)候用的就是IBM開發(fā)的深藍(lán),那時(shí)候就覺得要開發(fā)一個(gè)可以學(xué)習(xí)下棋的機(jī)器。因此這個(gè)概念從20年前就有了,但是直到兩年前才開始做。目前AlphaGO的開發(fā)團(tuán)隊(duì)一共有9個(gè)人,3個(gè)人是Google內(nèi)部員工、3個(gè)人是DeepMind、另外三位則是業(yè)界人士,而之所以會(huì)從中國的圍棋出發(fā),DemisHassabis表示,是因?yàn)橹袊囊?guī)則讓電腦比較容易懂、容易吸收。而AlphaGO以一套名為“蒙特卡羅”的運(yùn)算技術(shù)為基礎(chǔ),搭配類神經(jīng)網(wǎng)路,從世界棋手、人類專家的技術(shù)細(xì)節(jié),進(jìn)行像是象棋、圍棋等棋局對(duì)弈的研究,然后通過兩個(gè)階段的機(jī)器學(xué)習(xí),第一段是人工喂資料給電腦去運(yùn)算,第二階段是給予電腦在比賽過程中去學(xué)習(xí)的程序,不管是贏還是輸,每次比賽過程都會(huì)把經(jīng)驗(yàn)學(xué)進(jìn)去。這個(gè)第二階段采用的技術(shù),叫做類神經(jīng)網(wǎng)絡(luò),主要是通過云端運(yùn)算的方式,進(jìn)行深度學(xué)習(xí),然后進(jìn)行“策略網(wǎng)絡(luò)(Policynetwork)”與“價(jià)值網(wǎng)絡(luò)(Valuenetwork)”的分析,程序就像人類的大腦一般,會(huì)有自己的思考模式,這也是為什么AlphaGO可以持續(xù)進(jìn)化。AlphaGo的算法秘密阿爾法圍棋(AlphaGo)是一款圍棋人工智能程序。這個(gè)程序利用“價(jià)值網(wǎng)絡(luò)”去計(jì)算局面,用“策略網(wǎng)絡(luò)”去選擇下子。深度學(xué)習(xí)阿爾法圍棋(AlphaGo)的主要工作原理是“深度學(xué)習(xí)”。“深度學(xué)習(xí)”是指多層的人工神經(jīng)網(wǎng)絡(luò)和訓(xùn)練它的方法。一層神經(jīng)網(wǎng)絡(luò)會(huì)把大量矩陣數(shù)字作為輸入,通過非線性激活方法取權(quán)重,再產(chǎn)生另一個(gè)數(shù)據(jù)集合作為輸出。這就像生物神經(jīng)大腦的工作機(jī)理一樣,通過合適的矩陣數(shù)量,多層組織鏈接一起,形成神經(jīng)網(wǎng)絡(luò)“大腦”進(jìn)行精準(zhǔn)復(fù)雜的處理,就像人們識(shí)別物體標(biāo)注圖片一樣。

AlphaGo的算法秘密兩個(gè)大腦阿爾法圍棋(AlphaGo)是通過兩個(gè)不同神經(jīng)網(wǎng)絡(luò)“大腦”合作來改進(jìn)下棋。這些大腦是多層神經(jīng)網(wǎng)絡(luò)跟那些Google圖片搜索引擎識(shí)別圖片在結(jié)構(gòu)上是相似的。它們從多層啟發(fā)式二維過濾器開始,去處理圍棋棋盤的定位,就像圖片分類器網(wǎng)絡(luò)處理圖片一樣。經(jīng)過過濾,13個(gè)完全連接的神經(jīng)網(wǎng)絡(luò)層產(chǎn)生對(duì)它們看到的局面判斷。這些層能夠做分類和邏輯推理。這些網(wǎng)絡(luò)通過反復(fù)訓(xùn)練來檢查結(jié)果,再去校對(duì)調(diào)整參數(shù),去讓下次執(zhí)行更好。這個(gè)處理器有大量的隨機(jī)性元素,所以人們是不可能精確知道網(wǎng)絡(luò)是如何“思考”的,但更多的訓(xùn)練后能讓它進(jìn)化到更好。AlphaGo的算法秘密第一大腦:落子選擇器(MovePicker)阿爾法圍棋(AlphaGo)的第一個(gè)神經(jīng)網(wǎng)絡(luò)大腦是“監(jiān)督學(xué)習(xí)的策略網(wǎng)絡(luò)(PolicyNetwork)”,觀察棋盤布局企圖找到最佳的下一步。事實(shí)上,它預(yù)測(cè)每一個(gè)合法下一步的最佳概率,那么最前面猜測(cè)的就是那個(gè)概率最高的。這可以理解成“落子選擇器”。AlphaGo的算法秘密第二大腦:棋局評(píng)估器(PositionEvaluator)阿爾法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論