IBM發(fā)布POWER 9處理器,專為AI、加速計(jì)算設(shè)計(jì)_第1頁
IBM發(fā)布POWER 9處理器,專為AI、加速計(jì)算設(shè)計(jì)_第2頁
IBM發(fā)布POWER 9處理器,專為AI、加速計(jì)算設(shè)計(jì)_第3頁
IBM發(fā)布POWER 9處理器,專為AI、加速計(jì)算設(shè)計(jì)_第4頁
IBM發(fā)布POWER 9處理器,專為AI、加速計(jì)算設(shè)計(jì)_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

IBM發(fā)布POWER9處理器,專為AI、加速計(jì)算設(shè)計(jì)日前IBM發(fā)布POWER9處理器是基于14nm工藝制程,并且專為AI、加速計(jì)算設(shè)計(jì),相比X86系統(tǒng),可縮短在機(jī)器學(xué)習(xí)框架下的訓(xùn)練時(shí)間。IBM表示設(shè)計(jì)之初的理念就是未來為AI服務(wù),且率先使用了PCIe4.0技術(shù)。近日IBM在紐約發(fā)布了最新設(shè)計(jì)的POWER9處理器,以及裝有POWER9的新一代PowerSystems服務(wù)器——AC922。2017年下半年以來,針對(duì)大數(shù)據(jù)和云計(jì)算,IBM發(fā)布了多款硬件。值得一提的是,AC922是IBM第一款針對(duì)企業(yè)級(jí)AI市場發(fā)布的新品,該系統(tǒng)專門為人工智能、加速計(jì)算而設(shè)計(jì),根據(jù)其內(nèi)部測試數(shù)據(jù),相比X86系統(tǒng),可將深度學(xué)習(xí)框架下將訓(xùn)練時(shí)間縮短至原來的1/4。IBM大中華區(qū)科技合作部副總裁MaryCoucher表示,早四年前IBM開始設(shè)計(jì)POWER9時(shí),就在整個(gè)過程中都考慮了如何來為AI服務(wù)。具體到數(shù)據(jù)上,跟x86相比,POWER9的線程增加2倍,I/O帶寬增加5倍,CPU和GPU之間的內(nèi)存共享提升至2TB,且率先使用了PCIe4.0技術(shù)的,速度比基于PCIeGen3的x86快了2倍多?;赑OWER9的AC922,則嵌入了PCI-Express4.0、新一代NVIDIA的NVLink及OpenCAPI,在加速數(shù)據(jù)傳送方面,超越了x86數(shù)倍,能夠大幅提升Chainer、TensorFlow及Caffe等人工智能框架的性能,并加速Kinetica等數(shù)據(jù)庫。記者了解到,正式產(chǎn)品已于本月22日上市。以下為針對(duì)該新品在人工智能及應(yīng)用方面的采訪,受訪人有IBM副總裁、大中華區(qū)硬件系統(tǒng)部總經(jīng)理侯淼,IBM大中華區(qū)科技合作部副總裁MaryCoucher,IBM杰出工程師、大中華區(qū)硬件系統(tǒng)部首席技術(shù)官李永輝等,記者在不改變?cè)獾幕A(chǔ)上,做了增刪。關(guān)于人工智能提問:為什么針對(duì)AI?使用場景有哪些?侯淼:大家好奇為什么這次發(fā)布針對(duì)AI,機(jī)器對(duì)AI和機(jī)器不對(duì)AI到底有什么差別。在過去IBM很多產(chǎn)品都是針對(duì)傳統(tǒng)的工作負(fù)載,像大家在銀行做銀行交易一樣,可能手機(jī)上有一個(gè)消費(fèi),你買了一本書,花了30塊錢,這筆交易會(huì)留到銀行和你的賬戶,會(huì)訪問Database,會(huì)從你的銀行的賬戶減掉30塊錢,然后確認(rèn)把這個(gè)錢給商家,這樣的輸入就完成了,整個(gè)過程是串行的程序來保證數(shù)據(jù)一致性,不可能并行起來。對(duì)后臺(tái)機(jī)器的要求在于I/O、內(nèi)存和CPU之間通路的完整性,通過軟件要使這個(gè)交易完整,我們傳統(tǒng)叫針對(duì)OnlineTransaction系統(tǒng)。什么是AI的場景?舉一個(gè)很有意思的例子,比如說在一個(gè)視頻上識(shí)別一個(gè)人,有幾個(gè)步驟來做,第一,要讓一個(gè)機(jī)器知道要找的這個(gè)人的面貌特征,知道的過程就要用深度學(xué)習(xí)訓(xùn)練。這里有幾個(gè)很關(guān)鍵的點(diǎn),識(shí)別時(shí)間越短越好,越快越好,越準(zhǔn)越好。IBM這一套技術(shù)在進(jìn)行訓(xùn)練的時(shí)候,有一個(gè)深度學(xué)習(xí)的的一套框架,這里包括我們改進(jìn)了NVLINKGPU-CPU互連加速技術(shù)、CAPII/O加速及內(nèi)存一致性訪問技術(shù)、水平擴(kuò)展等,以前只能在一臺(tái)機(jī)器,可能是十個(gè)小時(shí),如果能夠十臺(tái)機(jī)器一塊兒來做的,有可能是1個(gè)小時(shí),這是IBM的優(yōu)勢。接下來當(dāng)你進(jìn)行識(shí)別的時(shí)候,發(fā)現(xiàn)如果一個(gè)視頻里有十個(gè)人,這個(gè)識(shí)別不是不需要從左邊找第一個(gè)人到右邊,而是會(huì)同時(shí)去看這些人。如果有一百個(gè)人,也會(huì)同時(shí)看一百個(gè)人到底這里面能看多少人,這取決于GPU的能力,GPU的數(shù)量越多,并發(fā)的密度越高,能力越強(qiáng)。如果是高清圖像的話要求你的分辨率很高,這就跟GPU和CPU的內(nèi)存相關(guān),內(nèi)存越大,你所得到的數(shù)據(jù)越高,從而這個(gè)比對(duì)的精準(zhǔn)度會(huì)越快。IBM這次發(fā)布的AC922,第一個(gè)特征就是支持在2U的設(shè)備里支持6個(gè)GPU,這使識(shí)別的速度會(huì)大幅度提高。第二是跟NVIDIA合作,采用了新一代NVLink,它把CPU和GPU相連接,好處在于,進(jìn)行高清識(shí)別的時(shí)候,當(dāng)GPU內(nèi)存不夠的話可以訪問主內(nèi)存,這是非常大的優(yōu)勢。高清識(shí)別的時(shí)候,很多情況下GPU的內(nèi)存不夠,會(huì)限制訪問速率,或者犧牲速度增加質(zhì)量,或者犧牲質(zhì)量增加速度,而在AC922不需要這樣來做。提問:近4倍的超越對(duì)于芯片來講是一個(gè)什么概念?AI現(xiàn)在的發(fā)展跟軟件有很大關(guān)系,軟件的倍數(shù)會(huì)更多,是否可以介紹一下這一點(diǎn)?李永輝:人工智能不單單是硬件平臺(tái),還涉及到軟件的堆棧。AC922是為了人工智能而設(shè)計(jì)的,在2個(gè)U的密度里放了最多6個(gè)GPU,可以大大加速很多人工智能框架。我們采用最新的GPU技術(shù)——V100,業(yè)界最頂級(jí)的,有雙密度、單密度、半密度的算法,有效加速人工智能訓(xùn)練過程,也可以做一個(gè)性能的提升。在V100GPU里有TensorCore的設(shè)計(jì),專門針對(duì)人工智能權(quán)重算法,實(shí)現(xiàn)并行度的加速。在這個(gè)基礎(chǔ)上做了軟件堆棧,這個(gè)堆棧是去年年底發(fā)布的PowerAI,我們隨著業(yè)界出現(xiàn)的主流AI框架,優(yōu)化到IBMPower平臺(tái)上去。今天有很多客戶是不容許在網(wǎng)下載一些開源的軟件,怕有病毒,IBM已經(jīng)把這些應(yīng)用編譯到POWER平臺(tái)上,利用NVLink技術(shù)和POWER9,提供了對(duì)開源軟件很好的支持和優(yōu)化。此外,還做了一些功能性的增強(qiáng),一方面是水平的擴(kuò)展,很多的開源應(yīng)用只局限在一臺(tái)機(jī)器跑,我們透過Spark的技術(shù),在12月初剛發(fā)布了DeepLearningImpact,利用大數(shù)據(jù)的技術(shù),把人工智能的框架水平擴(kuò)展到多臺(tái)機(jī)器上去跑,同時(shí)也提供一些工具,實(shí)現(xiàn)Hyper-parameterSearch超參條選,縮短AI應(yīng)用開發(fā)的時(shí)間。提問:現(xiàn)在國內(nèi)對(duì)人工智能保持非常激進(jìn)的態(tài)度,政府、企業(yè)界、學(xué)術(shù)界都非常激進(jìn),對(duì)IBM來說,是否會(huì)在中國放更大的精力,投入更多?李永輝:我們了解到人工智能在中國是很熱門的課題,包括中國政府在8月4號(hào)發(fā)布新一代人工智能的規(guī)劃。其次,IBM看到在全球領(lǐng)域,在AI比較關(guān)注的國家或者是很多比較創(chuàng)新的跟AI有關(guān)的國家,中國絕對(duì)是領(lǐng)先之一。因此,在我們這次發(fā)布的POWER服務(wù)器和相關(guān)配套的解決方案里,IBM中國的研究院開發(fā)團(tuán)隊(duì)都有參與部分人工智能的軟件或者是有關(guān)產(chǎn)品的開發(fā)。IBM是非常關(guān)注中國人工智能的發(fā)展,同時(shí)我們也有一定的投入在這里,把我們對(duì)中國市場的了解反饋到產(chǎn)品里,更好的支持我們的客戶。提問:培訓(xùn)原來是單機(jī)用得比較多,什么情況下會(huì)用到并行?行業(yè)應(yīng)用好像一臺(tái)就夠了吧?李永輝:今天的AI剛剛發(fā)展起來,當(dāng)初發(fā)展很快的原因是因?yàn)闃I(yè)界有很多開源AI的框架可以供一些人做應(yīng)用實(shí)驗(yàn),這個(gè)框架往往只能放在一臺(tái)物理機(jī)器上跑。很多廠家,不只是IBM,也在摸索怎么樣可以更有效的把AI框架拓展到多臺(tái)機(jī)器上去。這里涉及到Caffe和TensorFlow等人工智能框架能不能水平擴(kuò)展開,還涉及到底層的互聯(lián)互通,信息的交互等。學(xué)習(xí)的過程,當(dāng)你處理的圖像越大,精密度越高,性能要快的話,就需要用到這種水平拓展的技術(shù)。單一臺(tái)機(jī)器跑,如果今天要處理一些比較復(fù)雜的問題,可能要跑數(shù)天或者超過一周的時(shí)間才能訓(xùn)練完一堆數(shù)據(jù)。如果你在神經(jīng)網(wǎng)絡(luò)里選擇了不合適的超參(Hyper-parameter),在人工智能網(wǎng)絡(luò)里,跑了一半或者跑了數(shù)天后才發(fā)現(xiàn)數(shù)據(jù)有問題或訓(xùn)練收斂不了,那就需要重新設(shè)定,重新訓(xùn)練,整個(gè)開發(fā)應(yīng)用周期就太慢了,IBM提供的工具可以自動(dòng)化幫你做一個(gè)超參的首巡,這也是IBM很出色的能力,同時(shí)間底層做水平的擴(kuò)展,加快訓(xùn)練的時(shí)間,做水平擴(kuò)展的另外一個(gè)好處是多租戶的環(huán)境。IBM是做平臺(tái)出身,我們做一個(gè)框架幫你打通所有的平臺(tái),將來對(duì)客戶來講這是AI的資源池,在上面放DeepLearningImpact解決方案,底層打通,無論將來的應(yīng)用提交到多少CPU上去都可以跑起來,如果一個(gè)不夠可以給兩個(gè),兩個(gè)不夠可以給三個(gè),這樣對(duì)用戶來講是加快速度,另外是多租戶的使用場景。提問:POWER9除了HPC和AI方面,還適用于什么市場呢?李永輝:POWER有超過25年的市場,今天很多的客戶是跑在核心的關(guān)鍵應(yīng)用,像數(shù)據(jù)庫的應(yīng)用,像一些企業(yè)資源管理的應(yīng)用,像一些大數(shù)據(jù)分析的應(yīng)用或者是中間件等等,今天很多客戶核心的平臺(tái)都會(huì)用的。為什么我們強(qiáng)調(diào)AI,原因是我們看到在過去可能一兩年內(nèi),這個(gè)領(lǐng)域做了很大的改變,我們看到IT正進(jìn)入一個(gè)新時(shí)代,這個(gè)新的時(shí)代,IBM稱之為認(rèn)知時(shí)代。在這個(gè)認(rèn)知時(shí)代里面,新的平臺(tái)是需要有能力做到一些認(rèn)知的能力,這些認(rèn)知的能力包括所謂理解的能力、推理的能力、學(xué)習(xí)的能力、交互的能力,這些能力很多都是需要通過GPU來實(shí)現(xiàn)的。比如說做圖像識(shí)別、語音識(shí)別等等。為什么我們看到新一代的機(jī)器需要有一種混合架構(gòu),GPU的能力,不單只是傳統(tǒng)的CPU能力,我們還需要很好的連接GPU的能力,POWER9的第一款服務(wù)器不僅提供了很好的CPU以外,也提供新一代NVLINK連接CPU來加速AI的能力,同時(shí)也做了很多I/O加速的能力。IBM的一個(gè)調(diào)研發(fā)現(xiàn),到2020年網(wǎng)絡(luò)上流動(dòng)的數(shù)據(jù)有超過一半是視頻,如果今天沒有一種像CAPI這種加速網(wǎng)絡(luò)的技術(shù),將來怎么應(yīng)付這么海量的數(shù)據(jù)處理呢?侯淼:從以前IBMPOWER4、5、6、7、8,到現(xiàn)在的POWER9,針對(duì)傳統(tǒng)的工作負(fù)載不斷在增強(qiáng),包括支持更多的核,包括更大的內(nèi)存總線、更大的內(nèi)存、更強(qiáng)的I/O,很正常。新的POWER9?AC922作為第一款的主打產(chǎn)品發(fā)布,實(shí)際上是增加了對(duì)AI市場的支持,換句話說增加了GPU,使這個(gè)機(jī)器不單單能夠解決傳統(tǒng)的工作負(fù)載的問題,也能夠解決新的有關(guān)分析和人工智能問題。關(guān)于應(yīng)用提問:AC922主要是面對(duì)AI,但我們更多的應(yīng)用還是傳統(tǒng)的應(yīng)用,不知道這些用戶從POWER9當(dāng)中能夠獲得什么受益?MaryCoucher:我們這個(gè)產(chǎn)品的確是針對(duì)AI來發(fā)布的,在整個(gè)2018年大家會(huì)看到我們會(huì)有更多關(guān)于POWER9的產(chǎn)品一些新的發(fā)布。我們針對(duì)各種類型的,比如說針對(duì)scale-out、針對(duì)超算,還有scale-up……傳統(tǒng)可能更注重商業(yè)機(jī)會(huì),對(duì)于傳統(tǒng)商業(yè)客戶和研究機(jī)構(gòu)來講,他們其實(shí)對(duì)AI非常感興趣,因?yàn)锳I可以幫助促進(jìn)他們的商業(yè)機(jī)會(huì),能夠更好地運(yùn)用他們掌握的數(shù)據(jù),增加更多的機(jī)會(huì),他們可以去更好的理解市場,更好的去獲得更大的客戶群。這對(duì)制造業(yè)、零售業(yè)、供應(yīng)鏈、醫(yī)療、銀行業(yè)等等來講都是這樣的。提問:原來在POWER8上跑的系統(tǒng)對(duì)軟件有沒有挑戰(zhàn),是可以順利的遷移呢?李永輝:IBMPOWER到今天是第九代,但是一直保留了兼容性,IBMPOWER的核是兼容的,今天POWER8的用戶到POWER9都可以跑下去,沒有問題。我們這次發(fā)布是AC922,是凸顯了IBM對(duì)AI領(lǐng)域的重視,并不是說我們只有這一款機(jī)器。這是POWER9的第一個(gè)開始。我

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論