多卡GPU是如何互聯(lián)通信的_第1頁
多卡GPU是如何互聯(lián)通信的_第2頁
多卡GPU是如何互聯(lián)通信的_第3頁
多卡GPU是如何互聯(lián)通信的_第4頁
多卡GPU是如何互聯(lián)通信的_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

自從GPU出現(xiàn)后,計(jì)算機(jī)愛好者和發(fā)燒友們就一直尋找新的方法來進(jìn)一步提高系統(tǒng)GPU性能。在單個(gè)GPU性能有限的情況下,將兩個(gè)或多個(gè)GPU連接起來這種在當(dāng)時(shí)看起來非?;闹嚨南敕ň谷粷u漸成為提升系統(tǒng)GPU性能的主流方法。特別是隨著游戲、圖形應(yīng)用的發(fā)展,以及AI、HPC等新興應(yīng)用的助推,多個(gè)GPU之間的互聯(lián)技術(shù)得到了快速迭代和發(fā)展,如今的GPU互聯(lián)已經(jīng)成為系統(tǒng)內(nèi)非常常見的一種技術(shù)。今天我們就來聊聊這些GPU互聯(lián)的那些技術(shù)。第一個(gè)連接多個(gè)GPU解決方案:SLISLI,全稱為"可擴(kuò)展的鏈接接口"(ScalableLinkInterface),最早是由3DFxInteractive開發(fā)。然而,3DFxInteractive這家公司在2000年破產(chǎn),NVIDIA公司收購了這家公司并獲得了多GPU技術(shù)的權(quán)利。于是,在2004年,NVIDIA首次推出了SLI技術(shù)版本,同時(shí)發(fā)布了GeForce6800UltraGPU。該技術(shù)允許兩個(gè)GeForce6800UltraGPU一起工作,以增強(qiáng)游戲時(shí)的圖形性能。因此,SLI技術(shù)迅速在游戲玩家和愛好者中流行起來。SLI采用主從配置方式在系統(tǒng)中實(shí)現(xiàn)使用多個(gè)GPU,這種配置的重點(diǎn)是使用一個(gè)GPU作為主車,其他GPU作為從卡,SLI能夠同時(shí)連接4個(gè)GPU。SLI是第一個(gè)連接多個(gè)GPU的解決方案。但是與所有技術(shù)一樣,SLI也有各種優(yōu)點(diǎn)和局限性。SLI配置必須選擇相同型號的兼容GPU。同時(shí)還需要分配一個(gè)單獨(dú)的PSU來滿足多個(gè)GPU的協(xié)調(diào)要求,導(dǎo)致GPU之間的通信延遲較高,且GPU之間的數(shù)據(jù)共享缺乏靈活性。另外,NVIDIA大約在兩年前停止了對該技術(shù)的支持,為開發(fā)NVLink等新技術(shù)讓路。SLI與CrossFire:多GPU解決方案之爭雖然NVIDIA的SLI走在了多GPU互聯(lián)的前面,但也并非沒有競爭。作為NVIDIAGPU市場上多年的老對手,AMD也推出了CrossFire這個(gè)技術(shù)來參與競爭。與SLI技術(shù)類似,使用CrossFire技術(shù)時(shí),用戶可選擇使用兩個(gè)或更多顯卡進(jìn)行渲染,從而增加幀數(shù)和提高游戲運(yùn)行效率。CrossFire技術(shù)的一大優(yōu)點(diǎn)是用戶可以使用不同型號的AMD顯卡,從而節(jié)省成本。然而,CrossFire也有其自身的優(yōu)勢和挑戰(zhàn),CrossFire經(jīng)常因其軟件堆棧而受到批評,一些用戶發(fā)現(xiàn)該軟件堆棧不如NVIDIASLI可靠且配置更復(fù)雜。盡管存在這些差異,但這兩種技術(shù)都致力于實(shí)現(xiàn)相同的目標(biāo):增強(qiáng)游戲和消費(fèi)者圖形體驗(yàn)。它們在處理更高級、數(shù)據(jù)密集型任務(wù)方面的局限性最終將為NVLink等下一代解決方案鋪平道路。隨著2010年代的到來,計(jì)算領(lǐng)域開始發(fā)生巨大變化。人工智能(AI)、高性能計(jì)算(HPC)和大數(shù)據(jù)分析的興起需要更強(qiáng)大的多GPU解決方案。很明顯,最初設(shè)計(jì)時(shí)考慮到游戲和消費(fèi)者工作負(fù)載的SLI不足以滿足這些計(jì)算密集型任務(wù)。NVIDIA需要一個(gè)新的GPU互聯(lián)技術(shù)。

雙GPU卡:多GPU計(jì)算的獨(dú)特存在雖然SLI和CrossFire等技術(shù)專注于連接多個(gè)獨(dú)立GPU,但還有另一種不太常見或者可以說是奇葩的多GPU配置方法:雙GPU卡。這些專用顯卡在單個(gè)PCB(印刷電路板)上安裝了兩個(gè)GPU核心,有效地充當(dāng)單張卡上的SLI或CrossFire設(shè)置。

NVIDIAGeForceGTX690和AMDRadeonHD6990等卡是這種方法的流行示例。雙GPU卡具有多種優(yōu)勢,他們通過將兩個(gè)GPU壓縮到一個(gè)卡槽中來節(jié)省空間,這使得它們對小型PC很有吸引力。同時(shí)他們還無需將單獨(dú)的卡與外部連接器連接起來,從而簡化了設(shè)置。然而,這些雙GPU卡散熱是一個(gè)重大問題,可以說每一個(gè)卡都是一個(gè)"小火爐"。通常這種配置方式需要先進(jìn)的冷卻解決方案。同時(shí)功耗也很高,需要強(qiáng)大的電源來提供穩(wěn)定的電流。雙GPU卡的方式看起來是一種"兩全其美"的解決方案,將多GPU設(shè)置的原始功能與單卡的簡單性結(jié)合在一起。然而,由于其高成本和相關(guān)的技術(shù)挑戰(zhàn),雙GPU卡經(jīng)常被視為雞肋產(chǎn)品。隨著NVLink等多GPU技術(shù)不斷發(fā)展以提供更高的帶寬和更低的延遲,對雙GPU卡的需求已經(jīng)減少。盡管如此,它仍然是GPU發(fā)展史上一個(gè)獨(dú)特的存在。NVLink的誕生NVLink是2017年隨NVIDIAVolta架構(gòu)推出的技術(shù)。這項(xiàng)技術(shù)不僅僅是SLI技術(shù)的升級,而且是對GPU如何互連的根本性重新思考。NVLink提供了更高的帶寬(最新版本高達(dá)900GB/s)、更低的延遲以及允許GPU之間更復(fù)雜和大量互連的網(wǎng)狀拓?fù)?。此外,NVLink引入了統(tǒng)一內(nèi)存的概念,支持連接的GPU之間的內(nèi)存池,這對于需要大型數(shù)據(jù)集的任務(wù)來說是一個(gè)至關(guān)重要的功能。

SLI與NVLink有何區(qū)別?乍一看,人們可能會認(rèn)為NVLink是SLI的簡單升級,但這過于武斷了。雖然這兩種技術(shù)都旨在連接多個(gè)GPU,但NVLink的設(shè)計(jì)考慮了不同的受眾。它專為科學(xué)研究、數(shù)據(jù)分析,尤其是人工智能和機(jī)器學(xué)習(xí)應(yīng)用而設(shè)計(jì)。更高的帶寬、更低的延遲和統(tǒng)一的內(nèi)存使NVLink成為應(yīng)對當(dāng)今計(jì)算挑戰(zhàn)的更加靈活和強(qiáng)大的解決方案。雖然NVLink和SLI兩者均由Nvidia開發(fā),但存在一些差異。SLI按照主從關(guān)系原理運(yùn)行,而NVLink通過網(wǎng)狀網(wǎng)絡(luò)運(yùn)行。結(jié)果,SLI中形成了NVLink中不存在的數(shù)據(jù)瓶頸。采用網(wǎng)狀網(wǎng)絡(luò)開發(fā)的并行連接可增強(qiáng)GPU的性能。因此,多個(gè)GPU作為一個(gè)單元,有助于提供增強(qiáng)的處理能力。連接的GPU擁有自己的內(nèi)存,從而增加了系統(tǒng)的總可用內(nèi)存。NVLink橋還支持20至30GB/s的帶寬,為4個(gè)GPU的設(shè)置提供超過100GB/s的速度。網(wǎng)狀網(wǎng)絡(luò)消除GPU之間的層級關(guān)系。計(jì)算數(shù)據(jù)因此連接到每個(gè)GPU的節(jié)點(diǎn),從而提高了整體渲染速度。因此,150至200GB/s的帶寬也可以實(shí)現(xiàn)。與SLI相比,NVLink的延遲非常低。

NVLink的技術(shù)原理NVLink代表了多GPU互連技術(shù)的邏輯演變,不僅在速度方面,而且在架構(gòu)設(shè)計(jì)方面。NVLink的結(jié)構(gòu)由可以雙向傳輸數(shù)據(jù)的高速數(shù)據(jù)通道組成。與傳統(tǒng)的基于總線的系統(tǒng)不同,NVLink采用點(diǎn)對點(diǎn)連接,有效減少瓶頸并提高數(shù)據(jù)吞吐量。最新的迭代提供高達(dá)900GB/s的帶寬,比SLI的功能有了顯著增強(qiáng)。NVLink與眾不同的關(guān)鍵功能之一是它支持網(wǎng)狀拓?fù)涞哪芰?。與舊技術(shù)的菊花鏈或中心輻射型拓?fù)湎啾?,網(wǎng)格設(shè)置允許GPU之間實(shí)現(xiàn)更通用且數(shù)量更多的連接。這在數(shù)據(jù)中心和高性能計(jì)算應(yīng)用程序中特別有用,在這些應(yīng)用程序中,復(fù)雜的數(shù)據(jù)路由是常態(tài)。統(tǒng)一內(nèi)存是NVLink的另一個(gè)特點(diǎn)。這允許GPU共享公共內(nèi)存池,從而實(shí)現(xiàn)更高效的數(shù)據(jù)共享并減少在GPU之間復(fù)制數(shù)據(jù)的需要。這對于機(jī)器學(xué)習(xí)和大數(shù)據(jù)分析等應(yīng)用程序來說是一個(gè)巨大的推動,在這些應(yīng)用程序中,大型數(shù)據(jù)集通常超過單個(gè)GPU的內(nèi)存容量。NVLink還改善了延遲,這是任何高性能計(jì)算設(shè)置中的一個(gè)關(guān)鍵因素。較低的延遲可確保GPU之間更快的數(shù)據(jù)傳輸和同步,從而實(shí)現(xiàn)更高效的并行計(jì)算。這是通過NVLink的直接內(nèi)存訪問(DMA)功能實(shí)現(xiàn)的,允許GPU直接讀寫彼此的內(nèi)存,而不需要CPU的參與。

NVlink的影響鑒于人工智能在現(xiàn)代計(jì)算中的重要性日益增加,NVLink的優(yōu)勢不僅是漸進(jìn)式的,而且是變革性的。在AI模型訓(xùn)練和數(shù)據(jù)創(chuàng)建中,NVLink可實(shí)現(xiàn)GPU之間更快的數(shù)據(jù)傳輸,從而實(shí)現(xiàn)更高效的并行處理。這在處理大型訓(xùn)練數(shù)據(jù)集時(shí)尤其有用,這是一個(gè)與人工智能模型訓(xùn)練數(shù)據(jù)創(chuàng)建的新興領(lǐng)域密切相關(guān)的主題。隨著量子模擬、實(shí)時(shí)分析和下一代人工智能算法等先進(jìn)計(jì)算的需求不斷增長,我們可以期待NVLink的功能進(jìn)一步增強(qiáng)。無論是帶寬的增加還是促進(jìn)G

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論