顯存的前世今生(終極剖析高手階進必知)

上傳人：碎*** IP屬地：天津上傳時間：2023-01-30 格式：DOCX 頁數(shù)：37 大?。?.75MB 積分：20 舉報 版權申訴

已閱讀5頁，還剩32頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權，請進行舉報或認領

文檔簡介

CPUDDR2DDR3過渡，而GPUGDDR2/3GDDR4、GDDR1/2/3/4/5DDR1/2/3假設您是一位求知欲很強的電腦愛好者，那么本文格外適合您，筆者特意搜集了大量官方技術文檔，為大家獻上內(nèi)存和顯存鮮為人知的奇特??CPU〔中心處理器〕和GPU〔圖形處理器〕的進展速度之快讓人目不暇接，產(chǎn)品的運算力量成CPU/GPU都是來自于CPU/GPUCPUIntelCPU50%；ATINVIDIA512Bit是何緣由導致業(yè)界三大巨頭如此大費周折呢？這是由于內(nèi)存技術的進展速度，其實并不如大家想象中的那么快，受到很多技術難題和傳統(tǒng)因素的制約，本文就對內(nèi)存和顯存的進展歷程及相關技術進展具體分析。內(nèi)存的存取原理及難以逾越的頻障：在半導體科技極為興旺的臺灣省，內(nèi)存和顯存被統(tǒng)稱為記憶體〔Memory〕，全名是動態(tài)隨機存取記憶體〔DynamicRandomAccessMemory，DRAM〕01，這就是一個二進制位元〔bit〕，內(nèi)存的最小單位。DRAMDRAM的構造可謂是簡潔高效，每一個bit只需要一個晶體管加一個電容。但是電容不行避開的存在漏上限，即便有先進工藝的支持也收效甚微?！吧瞎拧睍r代的FP/EDO25MHz/50MHzSDR一路飆升至133MHz，最終遇到了難以逾越的障礙。此后所誕生的DDR1/2/3系列，它們存儲單元官方頻率〔JEDEC制定始終在100MHz-200MHz〔超頻頻率也頂多在250MHz300MHz。事實上高頻內(nèi)存的出錯率很高、穩(wěn)定性也得不到保證，除了超頻跑簡潔測試外并無實際應用價值。既然存儲單元的頻率〔簡稱內(nèi)核頻率，也就是電容的刷頻率〕不能無限提升，那么就只有在I/O〔輸、GDDR1/2/3/4/5DDR1/2/3效頻率，這些DDR1/2/3內(nèi)存相當于老牌SDR內(nèi)存運行在400MHz、800MHz、1600MHz時的帶寬，因此頻率看200MHz內(nèi)存有三種不同的頻率指標，它們分別是核心頻率、時鐘頻率和有效數(shù)據(jù)傳輸頻率。核心頻率即為內(nèi)存Cell(MemoryCellArray，即內(nèi)部電容)的刷頻率，它是內(nèi)存的真實運行頻率；I/OBuffer〔輸入/輸出緩沖〕的傳輸頻率；而有效數(shù)據(jù)傳輸頻率就是指數(shù)據(jù)傳送的頻率〔即等效頻率〕。SDRDDR1/2/3常見DDR內(nèi)存頻率比照表通過上表就能格外直觀的看出，近年來內(nèi)存的頻率雖然在成倍增長，可實際上真正存儲單元的頻率始終133MHz-200MHz而每一代DDR的推出，都能夠以較低的存儲單元頻率，實現(xiàn)更大的帶寬，并且為將來頻率和帶寬的提升留下了肯定的空間。SDRDDR1/2/3雖然存儲單元的頻率始終都沒變，但內(nèi)存顆粒的I/O頻率卻始終在增長，再加上DDR是雙倍數(shù)據(jù)傳輸，8IO2/4/8bit數(shù)據(jù)預取技術〔Prefetch〕，I/ODDR1/2/3數(shù)據(jù)預取技術原理：預取，顧名思義就是預先/提前存取數(shù)據(jù)，也就是說在I/O掌握器發(fā)出懇求之前，存儲單元已經(jīng)事先預備Raid/多通道技術，可以說是以電容矩陣為單位的。內(nèi)存數(shù)據(jù)預取技術示意圖：并行轉(zhuǎn)串行這種存儲陣列內(nèi)部的實際位寬較大，但是數(shù)據(jù)輸出位寬卻比較小的設計，就是所謂的數(shù)據(jù)預取技術，它可以讓內(nèi)存的數(shù)據(jù)傳輸頻率倍增。試想假設我們把一條細水管安裝在粗水管之上，那么水流的噴射速度就會翻幾倍。明白了數(shù)據(jù)預取技術的原理之后，再來看看DDR1/2/3開朗了：SDRAM〔SynchronousDRAM〕：同步動態(tài)隨機存儲器SDR存儲單元頻率、I/OPC133133MHz。SDR在一個時鐘周期內(nèi)只能讀/寫一次，只在時鐘上升期讀/寫數(shù)據(jù)，當同時需要讀取和寫入時，就得等待其中一個動作完成之后才能連續(xù)進展下一個動作。DDR〔DoubleDateRateSDRAM〕：雙倍速率同步動態(tài)隨機存儲器雙倍是指在一個時鐘周期內(nèi)傳輸兩次數(shù)據(jù)術實現(xiàn))，在存儲陣列頻率不變的狀況下，數(shù)據(jù)傳輸率到達了SDR的兩倍，此時就需要I/O從存儲陣列中預2bitI/ODQ列的頻率。？？？DDR2〔DDR2SDRAM〕：其次代雙倍速率同步動態(tài)隨機存儲器DDR2在DDR12bit擴大至4bit，此時上下行同時傳輸數(shù)據(jù)〔雙倍〕已經(jīng)滿足4bitI/O133-200MHzDDR2266-400MHz，而〔等效〕533-800MHz。DDR3〔DDR3SDRAM〕：第三代雙倍速率同步動態(tài)隨機存儲器DDR38bit，同理I/O133-200MHzDDR3533-800MHz，而〔等效〕數(shù)據(jù)傳輸率高達1066-1600MHz。I/ODDR3I/O1GHzI/ODDR4〔GDDR4，兩者完全不是同一概念，后文會有具體解釋〕的話，將會受到很多未知因素的制約，必需等待更先進的工藝或者解決方案的消滅才DDR及內(nèi)存條了，這都是些看得見摸得著的東西，但有些概念還是不簡潔理解，這里一一進展說明：內(nèi)存位寬——SDR/DDR1/2/3單條內(nèi)存都是64bit內(nèi)存模組的設計取決于內(nèi)存掌握器〔集成在北橋或者CPU內(nèi)部〕，理論上位寬可以無限提升，但受制PCB內(nèi)存顆粒及芯片設計也必需作相應的調(diào)整?？芍^是牽一發(fā)而動全身，所以多年來業(yè)界都是墨守成規(guī)，維持64bit的設計不變。相比之下，顯卡作為一個整體就沒有那么多的顧忌，只需重設計GPU內(nèi)部的顯存掌握器，然后PCB依據(jù)位寬要求布線，焊更多的顯存顆粒上去就行了，雖然本錢也很高但實現(xiàn)512bit并沒有太大難度。多通道內(nèi)存——雙通道/三通道既然實現(xiàn)高位寬內(nèi)存條太難，那么就退而求其次，讓兩條內(nèi)存并行傳輸數(shù)據(jù)，同樣可以讓位寬翻倍。CPU64bit同時傳輸數(shù)據(jù)128bit。IntelNehalemCPU，192bit。CPU、主板、內(nèi)存方LynnfieldCPU又回歸了雙通道設計。事實上效勞器芯片組已經(jīng)能夠支持四通道內(nèi)存，對效勞器來說本錢方面不是問題，只是對穩(wěn)定性和容錯性要求很高。內(nèi)存顆粒位寬：4/8/16/32bit理論上，完全可以制造出一顆位寬為64bit的芯片來滿足一條內(nèi)存使用，但這種設計對技術要求很高，良品率很低導致本錢無法掌握，應用范圍很窄。16bit，4/8bit。這樣為64bit416bit88bit164bit。而顯卡對位寬要求很高，容量反而退居其次，所以顯存顆粒的位寬普遍比內(nèi)存顆粒大〔這就是顯存和內(nèi)存主要區(qū)分之一〕，GDDR3/4/532bit，4128bit8256bitGDDR216bit8128bit內(nèi)存芯片的規(guī)律Bank在芯片的內(nèi)部，內(nèi)存的數(shù)據(jù)是以bit為單位寫入一張大的矩陣中，每個單元稱為CELL陣列，只要指定一個行一個列，就可以準確地定位到某個CELL，這就是內(nèi)存芯片尋址的根本原理。這個陣列我們就稱為內(nèi)BANKBANK〔LogicalBANK〕。BankBankBankBank是一片平面的矩陣紙，而內(nèi)存顆粒是由多片這樣的紙疊起來的。BankBankBankBank片選。補充內(nèi)容：內(nèi)存內(nèi)存Bank的探討目前很多人對內(nèi)存Bank(電腦系統(tǒng)與內(nèi)存之間數(shù)據(jù)總線的根本工作單位)都有一種誤會，認為單面內(nèi)存就是單Bank，雙面內(nèi)存就是雙Bank的。其實這種觀念是Bank(Bank)數(shù)和內(nèi)存顆粒的面無關，它們之間有什么聯(lián)系呢？要講清這個問題，就要提到內(nèi)存的規(guī)律Bank，下面就給大家介紹一下物理Bank和規(guī)律Bank的概念。在介紹之前，我們先簡潔看一下現(xiàn)在市場上的DRAM內(nèi)存產(chǎn)品.現(xiàn)在市場上的內(nèi)存主要有：SDRAM、DDRSDRAM及Rambus。其中Rambus內(nèi)存的掌握器和前兩者不BankSDRAM和DDRSDRAMBank問題，由于SDRAM就內(nèi)核、Bank構造而言，和DDRSDRAM沒有什么規(guī)律Bank及其構造內(nèi)存芯片存儲數(shù)據(jù)的根本單位是bit(位)尋址的根本單位則是Byte(字節(jié))，一個Byte就等于8bit。大家知道，在平面坐標系中，要確定一個點就要先找到它的橫坐標和縱坐標。而在內(nèi)存中數(shù)據(jù)的定位也很相像，內(nèi)存中的數(shù)據(jù)構造就是一個大的數(shù)據(jù)陣列，為了便于理解，我們把它假想成一個大的表格，前面我們提到1bit的數(shù)據(jù)，而是由多個bit組成一個組放在單元格內(nèi)，這里一個單元格我們可以稱作一個組，這個單元格的位數(shù)也就是內(nèi)存規(guī)律Bank的位寬。在進展數(shù)據(jù)讀取時，先進展行的選定，再進展列的選定，最終再從這個單元格中讀取出所需要的數(shù)據(jù)。而這由許很多多的單元格組成的大表我們就可以理解成規(guī)律Bank，固然由于制造工藝及數(shù)據(jù)尋址的緣由，不行能讓這個表格無限大，一般內(nèi)存芯片中都是將內(nèi)存容量分成幾個陣列來制造，即多規(guī)律BankBank16Mbit之類的芯BankBank一般為4個(不包括Rambus)，這點大家可通過內(nèi)存條的編碼進展識別。內(nèi)存芯片設計時在一個時鐘周期內(nèi)只允許對一個規(guī)律內(nèi)只允許對一個規(guī)律Bank進展操作(實際上內(nèi)存芯片的位寬就是規(guī)律Bank的位寬)，而不能Bank的理解，我們來看看一個單Bank4個內(nèi)存陣列。從圖中可以很清楚地看到這個芯片是一個Bank數(shù)為44096和4bitBank4096×2048×4bit=32Mb。再乘以Bank的數(shù)量，則芯片的容量就可以算出來了，這里很明顯是4個Bank，那么芯片的容量就是128MbBankBank由內(nèi)存陣列、傳感放大器、一個行解碼器、一個列解碼器組成。接下來我們簡潔看看物理接下來我們簡潔看看物理BankBank的含義就是指內(nèi)存和主板北橋芯片之間傳遞586CPU64bitCPU一次只能對一個物理Bank64bitBank(PhysicalBank)，在前面我們已經(jīng)講過了規(guī)律Bank，所以在這里我給大家講一下如何自己算出物理Bank，大家就會格外好理解了。由于CPU一次只能翻開一個物理Bank，在單芯片上也只能翻開一個規(guī)律Bank，這樣我們就知道規(guī)律Bank的位寬也就是單芯片的位寬了，我們把芯片的數(shù)據(jù)寬度和芯片的數(shù)量相乘再除以64就得到了內(nèi)存條的物理BankBank數(shù)=數(shù)據(jù)寬度×芯片數(shù)量/64現(xiàn)在大家初步明白了內(nèi)存的物理Bank和內(nèi)存的面數(shù)無關了吧？后面我還會舉SDRAMDDRBankBank之后。RambusBankRambusBankPC800Rambus為例。Rambus不再承受SDRAMDDR內(nèi)存的并聯(lián)技術，而是承受了更先進的串聯(lián)技術。就現(xiàn)階段而言，PC800Rambus400MHz16位總線，在一個時鐘周期內(nèi)可以在上升沿和下降沿同時傳輸數(shù)據(jù)，實際操作頻率為400MHz×2=800MHz16bit×2×400MHz/8=1.6GB/s850主板芯片的雙通道模式，可以到達3.2GB/s的數(shù)據(jù)帶寬。這也是大家熟知的高帶寬，而它最重要的優(yōu)勢在于其規(guī)律Bank上，就現(xiàn)階段的主流Rambus來說，其規(guī)律Bank32個，擁有更多的Bank數(shù)則意味著具有較少的Bank沖突，尋址流更加短暫隨便。另外還可以提高尋址命中率和降低埋伏周期。固然，更多的Bank也使Rambus的制作模具制造更簡單，也就RAMBUS4iDRDRAM──在每個顆粒芯片上只有4Bank。BANK在芯片的內(nèi)部，內(nèi)存的數(shù)據(jù)是以位〔bit〕為單位寫入一張大的矩陣中，每個單元我們稱為CELL，只要指定一個行〔Row〕，再指定一個列〔Column〕，在芯片的內(nèi)部，內(nèi)存的數(shù)據(jù)是以位〔bit〕為單位寫入一張大的矩陣中，每個單元我們稱為CELL，只要指定一個行〔Row〕，再指定一個列〔Column〕，CELL，這就是內(nèi)存BANK，BANK〔LogicalBANK〕。由于工藝上的緣由，這個陣列不行能做得太大，所以一般內(nèi)存芯片中都是將內(nèi)存容量分成幾個陣列來制造，也就是說存在BANKBANK32MB1GB416Mbit32Mbit2BANK16MBK4S161622D〔512Kx16Bitx2BAN〕K4S160822DT〔1Mx8Bitx2BANK〕。芯片組本身設計時在一個時鐘周期內(nèi)只允許對一個規(guī)律BANK〔實際上芯片的位寬就是邏輯BANK的位寬〕，而不是芯片組對內(nèi)存芯片內(nèi)全部規(guī)律BANK同時操作。規(guī)律BANK的地址線是通用的，只〔BANK0BANK3〕。但是這個芯片的位寬打算了一次能從它那里讀出多少數(shù)據(jù)，并不是內(nèi)存芯片里全部單元的數(shù)據(jù)一次全部能夠讀出BANK8M〔CELL〕，一些廠商〔比方現(xiàn)代/三星〕BANKBANK64Mbit〔8M×8bit〕，4BANK256Mbit，256Mbit〔32MB〕。bit32Mbit32Mb〔b=bit=位字節(jié)=8BANK，每個bankBANK〔CELL64MB128MB64Mbit的芯片就有如下三種構造形式：①16Meg①16Megx4(4Megx4x4banks)[16M╳4]②8Meg②8Megx8(2Megx8x4banks)[8M╳8]③4Meg③4Megx16(1Megx16x4banks)[4M╳16]BANK〔芯片的位寬。芯片規(guī)律BANK位寬目前的工藝水平只能最多做到16BANK位寬只可4/8/1616MbitBANK，64Mbit4BANK二．內(nèi)存條的物理二．內(nèi)存條的物理BANK通常主板上的每個內(nèi)存插槽分為兩段通常主板上的每個內(nèi)存插槽分為兩段VIABIOSBANK0/1DRAMBANKBANK時提到的BANK可不一樣。簡潔地說這個BANK就是內(nèi)存和主板上的北橋芯片之間用來交換數(shù)據(jù)的通道，SDRAMCPU〔CPUDIMM〕64bit，CPU64bit64bitBANK，很多廠BANK〕，目前絕大多數(shù)的芯片組都只能支持一根內(nèi)存包含兩個DIMM。實際上物理BANK與面數(shù)是無關的，PCB電路可以設計成雙面和單面，也可把全部芯片〔16顆〕放在一面上〔至少從理論上是完全可能。有些內(nèi)存條單面就是一個物理BANK，但有些雙面才是一個物理BANK，能一概而論。256MB16BANK。要準確知道內(nèi)存條實際物理BANK數(shù)量，我們只要將單個芯片的規(guī)律BANK數(shù)量和位寬以及內(nèi)存條上芯片個數(shù)搞清楚。各個芯片位寬之和為64就是單物理BANK，假設是128就是雙物理BANK。CPU一次只能對一個物BANK〔BANK64bit〕，線供給或接收64bit的數(shù)據(jù)，而這些數(shù)據(jù)都是分別存儲在內(nèi)存條的芯片中。那么內(nèi)存條中有多個內(nèi)存芯片，這64256Mbit為例，16所以現(xiàn)在的芯片組設計時都是要求內(nèi)存條上每個芯片均擔當供給數(shù)據(jù)的任務，也就是說內(nèi)存條上的每個芯片都要要對這64位數(shù)據(jù)做奉獻，而那顆內(nèi)存芯片的位寬是8位，因此用這個芯片組成內(nèi)存條只需要864位數(shù)據(jù)16864MB256MB由于位寬不夠是不能正常工作。要能工作就必需承受16位位寬的64MB〔512Mbit〕芯片。58658664bit64bit，SDRAM64bit64bit128646464就不能讀取，通常很多廠家就分別將這兩局部放在內(nèi)存的兩面上。這就造成了很多人的錯覺：雙面是兩個BANKBANK256MB16于芯片大小的限制，不行能將16顆芯片都放在一面上，所以只能設計成雙面。對于64Mbit芯片(4M*16)16bit，8=16＊8=128bit〔BANK〕，4=16＊4=64bit〔即一個BANK〕BANK64〔即位寬消滅了充?！?，由于芯片64BANK。今后隨著一代數(shù)據(jù)總線位寬的提高，或許CPU64128BANK，而是指內(nèi)存芯片內(nèi)部規(guī)律BANK的穿插，假設芯片有4個BANK，那么就可以進展4路穿插，假設只有兩個BANK就只能是二路穿插。很多資料介紹的以內(nèi)存條的單面或雙面來打算穿插是錯誤的，實際上就是混BANKBANK..BankBank說成是內(nèi)存顆粒陣列的話，那全一樣，所以我將分開來簡潔介紹一下。SDRAM〔1陣列就如同表格一樣，將數(shù)據(jù)“填”進去。因此規(guī)律Bank我們可以看成是一張規(guī)律二維表，在此表中內(nèi)存的數(shù)據(jù)是以位〔bit〕CEL，只要指定一個行〔Row，再指定一個列ColumCELL，里面每個單元都可以存儲數(shù)據(jù)，而且每個單元的存儲空間一樣——BankBank的位寬〔Bank的位寬4bit、8bit16bit等幾種。假設你認為不好理解的話，那么你可以用硬盤操作中的簇與扇區(qū)的關系來理解內(nèi)存中的存儲形式——扇區(qū)是硬而一個簇則包含多個扇區(qū)Bank中的存儲單元數(shù)據(jù)的交換都是以一個簇為單位進展。由于工藝上的緣由，這個陣列不行能做得太大，所以一般內(nèi)存芯片中都是將內(nèi)存容量分成幾個陣列來制造，也就是說內(nèi)存芯片中存在多個規(guī)律Bank，隨著芯片容量的不斷增加，規(guī)律Bank數(shù)量也在不斷增加。Bank芯片內(nèi)全部規(guī)律Bank同時操作。規(guī)律Bank的地址線是通用的，只要再有一個規(guī)律Bank編號加以區(qū)分就可以了〔Bank0Bank全部單元的數(shù)據(jù)能夠一次全部讀出。DDRBank的作用、原理與在SDRAM中是一樣的，區(qū)分主要是在規(guī)律Bank容量、規(guī)格之上。從上面大家已經(jīng)知道，SDRAMBankDDR中并不是這樣。DDR的規(guī)律存儲單元的容量是芯片位寬的一倍：即“芯片位寬×2=存儲單元容量”，同時DDR中的真正行、列地址數(shù)量也與同規(guī)格SDRAM不一樣了。這主要是由于DDR的工作原理所打算的。DDR這種內(nèi)部存儲單元容量的設計，就是常說的兩位預取〔2-bitPrefetch〕，也稱為2-nPrefetch〔n代表芯片位寬〕。寬〕。注：目前品牌內(nèi)存大都在包裝和說明書中標明規(guī)律Bank注：目前品牌內(nèi)存大都在包裝和說明書中標明規(guī)律Bank，對于兼容條，你可以依據(jù)內(nèi)存顆粒上的編號標志進展計算。至于物理Bank，大家可以依據(jù)以上介紹的原理計算出來，在這里我就不多說了。另外我們常說Bank4Bank2路穿插。很多資料介紹的以內(nèi)存條的單面或雙面來打算穿插是錯誤的，實際上就是混淆了物理BankBank的區(qū)分。Bank傳統(tǒng)內(nèi)存系統(tǒng)為了保證傳統(tǒng)內(nèi)存系統(tǒng)為了保證CPU的正常工作，必需一次傳輸完CPU在一個傳輸周期內(nèi)所需要的數(shù)據(jù)。而CPU在一個傳輸周期能接收的數(shù)據(jù)容量就是CPU數(shù)據(jù)總線的位寬，單位是bit〔位〕CPU之間的數(shù)據(jù)交換通過主板上的北橋芯片進展，內(nèi)存總線的數(shù)據(jù)位寬等同于CPUBan〔PhysicalBankk的位寬。以目前主流的DDR系統(tǒng)為例，CPU與內(nèi)存之間的接口位寬是64bit，也就意味著CPU在64bit64bit的數(shù)據(jù)集合就是一個內(nèi)存條Bank。目前絕大多數(shù)的芯片組都只能支持一條內(nèi)存包含兩個物理Bank。不過以Bank是由面數(shù)打算的：即單面內(nèi)存條則包含一個物理Bank，雙面內(nèi)存則包含兩個。其實這個看法是錯誤的!Bank是由所承受的內(nèi)存顆粒的位寬打算的，各個芯片位寬之和為64bit就是單物理Bank128bit就是雙物理Bank。讀到這里，大家也應當知道，我量來增加BankBankBank已經(jīng)不能滿足容量的需要。所以，目前一代芯片組可以支持Bank4Bank。對于像Inteli845D這種支持4個BankBank選購雙Bank的內(nèi)存，這意味著在Inteli845D芯片組上我們最多只能使用兩條這樣的內(nèi)存來選購內(nèi)存，假設主板只供給了兩個內(nèi)存插槽，那就不必為內(nèi)存是單Bank還是雙Bank而4個內(nèi)存插槽〔同一種規(guī)格〕，那么應當盡量購置單Bank或大容量雙Bank的內(nèi)存，以免給日后升級留下不必要的麻煩。注：注：SDRAMDDRBankRDRAMBank被通道〔Channel〕取代。內(nèi)存條的物理Bank內(nèi)存掌握器的位寬必需與內(nèi)存條的位寬相等，這樣才能在一個時鐘周期內(nèi)傳輸全部數(shù)據(jù)，這個位寬就Bank〔64bit〕，Bank，Bank。Bank理Bank也是允許的，但內(nèi)存掌握器所能允許的最大Bank數(shù)存在上限，常見的是雙物理Bank設計，只有特別Bank事實上顯卡上也存在雙物理Bank設計，目的就是為了實現(xiàn)超大顯存容量，比方1GB的9800GT，正反兩1616M×32bitGDDR3512bit，256bit，這樣就是雙Bank。GPUSDRAMTNT2PC166SDR內(nèi)存滿足不了顯卡的需求，顯存應運而生SDRDDRDDR的DDRGPU，顯存顆粒與內(nèi)存顆粒開頭分道揚鑣，這其中包括了幾方面的因素：GPUCPUGPUCPUGPU遠比CPU頻繁，而且大多都是突發(fā)性的數(shù)據(jù)流，因此GPU比CPU更加渴望得到更高的顯存帶寬支持。位寬×頻率=帶寬，因此提高帶寬的方法就是增加位寬和提高頻率，但GPU對于位寬和頻率的需求還有其它的因素。顯卡需要高位寬的顯存。顯卡PCB空間是有限的，在有限的空間內(nèi)如何合理的安排顯存顆粒，無論高中低端顯卡都面臨這個問題。從布線、本錢、性能等多種角度來看，顯存都需要到達更高的位寬。16bit32bit，將來甚至還會有更高的規(guī)格消滅。而內(nèi)存則沒64bit，所以單顆內(nèi)存顆粒沒必要設計成高位寬，只要提高容量就行了，所以〔內(nèi)存芯片顆粒的〕4/8bit。GPU一般都經(jīng)過特地的設計和優(yōu)化，而不像內(nèi)存那樣有太多顧忌。GPUCPUPCB進展優(yōu)化，因此顯存一般都能到達更高的頻率。PCBCPU限制很難沖擊高頻率由此算來，顯存與內(nèi)存“分家”既是意料之外，又是情理之中的事情了。為了更好地滿足顯卡GPU的RateDRAM”，GDDR。GDDR——顯存和內(nèi)存正式分家GDDR作為第一代專用的顯存芯片，其實在技術方面與DDR沒有任何區(qū)分，同樣承受了2bit預取技術，GDDRDDR高多少。不過后期改進工藝的GDDRPCBGDDR900MHz，DDR600MHz，顯存和內(nèi)存的差距從今漸漸拉開。TSOPGDDR16bit：128M×16Bit4.0nsTSOPIIGDDR，16MB，500MHz9550、FX5700128Bit8128BitDDR“GDDR”與“DDR”是可以“劃等號”的。其實兩者還是有些差異：GDDR4K32msDDR8K64msGDDR為了追求頻率在延遲方面放的更寬一些，到底GPU對延遲不太敏感；GDDR128Mbit×16Bit(16MB)的規(guī)格，而DDR16Bit8Bit4Bit，32MB64MB。為了實現(xiàn)更大的位寬，并進一步提升GDDR的性能，后期很多廠商改用了電氣性能更好的MBGA封裝，MBGAMBGAGDDR32bit：128Mbit×32Bit2.2nsMBGAGDDR，16MB，900MHz8128MB256BitGDDR132Bit，GDDRDDR32BitGDDR2/3/4/5MBGATSOPGDDR32Bit16BitGDDR2第一版：短命的早產(chǎn)兒高壓高發(fā)熱GDDR2源于DDR2技術，也就是承受了4Bit預取，相比DDR1代可以將頻率翻倍。雖然技術原理一樣，但GDDR2DDR2DDR2915P2022GDDR2FX5800Ultra2022NVIDIANV30128Bit為了提高帶寬必需使用高頻顯存，700MHzGDDR2GDDR2DDR/GDDR2.5V1GHz，但功耗發(fā)熱格外的大。MBGA144BallGDDR2，16MB，1000MHzGDDR22.2ns2.0nsGDDR2第一版只在FX5800/Ultra和FX5600Ultra這三款顯卡上消滅過〔也包括對應的專業(yè)卡及個別非公版顯卡〕，ATI9800ProGDDR2。高電壓、高發(fā)熱、高功耗、高本錢給人的印象格外差。FX5900GDDR256Bit，GDDR2FX5800UltraGDDR2NVIDIAGeForceFX256Bit850-900MHzGDDR2)，F(xiàn)X5950Ultra9800XTGDDR2GDDR2PCBGDDR更加簡潔，這個特性被后來的gDDR2和GDDR3繼承。gDDR2其次版：統(tǒng)一低端顯卡永久的配角由于第一代GDDR2的失敗，高端顯卡的顯存是直接從GDDR跳至GDDR3的，但GDDR2并未消亡，而是開頭DRAMGDDR2〔DDR2〕，由此gDDR2，時至今日照舊活潑在低端顯卡之上。gDDR22.5V1.8V，功耗發(fā)熱大降；制造工藝有所進步，功耗發(fā)熱進一步下降，本錢降低，同時良率和容量有所提升；32Bit16Bit，只適合低端顯卡使用；144BallMBGA84BallFBGA，外觀上來看從正方形變成長方形或者長條形； gDDR2gDDR21.8V1000MHz1200MHz，趕超了GDDR2的記錄。承受gDDR2顯存的經(jīng)典顯卡有：7300GT、7600GS、X1600Pro、8500GT??一大堆低端顯卡。留意三星官方網(wǎng)站對于顯存的分類信任很多朋友也留意到了，本頁gDDR2的第一個字母為小寫，幾大DRAM廠商在其官方網(wǎng)站和PDF中就都是這么寫的，以示區(qū)分。我們可以這么認為：G32bit；而小寫g表示為顯卡優(yōu)化，16bit事實上，GDDR3gDDR3GDDRDDR，GDDR2DDR2，而GDDR3DDR3于是很多人認為GDDR3就是顯存版的DDR3，這可是個天大的誤區(qū)。GDDR3：GDDR3DDR2無論GDDR還是GDDR2，由于在技術方面與DDR/DDR2并無太大差異，因此最終在頻率方面GDDR并不比DDRGDDR2NVIDIA和ATI對JEDECGPUNVIDIA和ATIJEDEC雙方全都認為，顯存與內(nèi)存在數(shù)據(jù)存儲的應用方面完全不同，在內(nèi)存核心頻率(電容刷頻率)無法提升的狀況下，單純提高I/O頻率來獲得高帶寬很不現(xiàn)實。因此，必需要有一種針對高速點對點環(huán)境而重I/OGDDR3，這是GPUGDDR3GDDR2/DDR24BitGDDR3GDDR2并提升傳輸效率來緩解高延遲的負面影響。點對點DQS，讀寫無需等待〔DQS〕GDDR3DQS，而且是點對點設計。這樣做的好處在于，在讀取之后假設馬上進展寫入時，不必再等DQS的方向轉(zhuǎn)變，由此實現(xiàn)讀寫操作的快速切換。寫數(shù)據(jù)時，GDDR3GDDR2Bank，并不存在“全雙工”一說，但GDDR3的這項改進讓挨次讀寫成為可能。GPU本身緩存很小，與顯存之間的數(shù)據(jù)交換極其頻繁，讀寫操作GDDR3DQSCPUGPU那么頻繁，而且CPU擁有大容量的二三級緩存，所以GDDR3這種設計并不能極大的提升內(nèi)存帶寬，也沒有引DDR3改進I/O接口，簡化數(shù)據(jù)處理，掌握功耗GDDR2〔PushPull〕”接收器，而將其改為虛擬開極規(guī)律方式〔PseudoOpenDrainLogic〕，并且通過將全部的三相數(shù)據(jù)信號轉(zhuǎn)移到本位電路上，來簡化數(shù)據(jù)處理，將DCLOW從而很好的掌握了功耗和發(fā)熱。GDDR3的頻率能到達現(xiàn)在這么高，其實并沒有什么訣竅，憑借的就是不斷改進的工藝制程，來暴力拉升頻GDDR320226600GT1GHz，并不比GDDR2，5GDDR31GHz2GHz2.5GHz，生命力得到了連續(xù)。明白了GDDR3的原理技術后，再來看看實物。GDDR3和GDDR1類似，也有兩種封裝形式：144BallMBGAGDDRGDDR2GDDR3144BallMBGAGDDRGDDR2GDDR3GPUGDDRPCB2.0ns256M×32BitGDDR3256M×32Bit8256MB256Bit4128MB128Bit5700UltraGDDR3GDDR2。最高頻率止步于1400MHz7800GTX/GT6800GS6600GTX850/X800/X700144BallPCBGDDR3136BallFBGA136BallFBGA2022GDDR3136BallFBGA，并統(tǒng)一使用無鉛封裝工藝。PCBGDDR30.8nsGDDR3512M×32Bit136BallGDDR3規(guī)格不再局限8M×32Bit16M×32Bit32M×32Bit2.0V1.8V，但一些高頻顆?？蛇m當加壓；1.4ns1.2ns1.1ns1.0ns0.8ns0.7nsGPU當GDDR3的頻率首次到達2022MHz時，很多人都認為離極限不遠了，于是未雨綢繆的抓緊制定GDDR4DRAMGDDR30.8ns0.7ns32M×32Bit當前速度最快0.77nsGDDR3顯存顆粒，理論頻率可達2600MHz2.2nsGDDR900MHzI/O450MHz5GDDR3I/ODDR38bitGDDR4GDDR4是在GDDR3的根底上進展而來的，它繼承了GDDR3的兩大技術特性，但內(nèi)核改用DDR3的8bit預取技術，并參加了一些的技術來提升頻率。GDDR4DDR38bit，以較低的核心頻率到達更高帶寬，但延遲增加；BusInversion，下文做具體介紹〕，提高數(shù)據(jù)精度，降低功耗；GDDR3GDDR3〔BurstLimitATIon〕，從連續(xù)地址讀取少量數(shù)據(jù)時的性能大幅提升；1.8V1.5V；75%，2400MHzGDDR42022MHzGDDR3136BallFBGA32Bit，GDDR3；GDDR4由于承受了8bit預取技術，因此在一樣頻率下GDDR4的核心頻率〔即電容刷頻率〕只有GDDR3的一半，理論上來講GDDR4GDDR38bit半，GDDR4GDDR3I/OGDDR4I/O率。由于制造工藝和技術水平的限制，雖然三星官方宣稱早已生產(chǎn)出3GHz以上的GDDR4，但實際出貨的GDDR3GDDR4GDDR3然功耗發(fā)熱低，但延遲大性能稍弱，再加上本錢高產(chǎn)量小，GDDR4導致GDDR4失敗的非技術方面緣由GDDR3NVIDIA和ATI參與JEDECGDDR4DDR24bitI/OATIDDR38bitATI獲勝〔ATIJEDEC〕，而NVIDIAGDDR4GDDR4ATINVIDIA支持的話，GDDR46DRAM最終只有三星一家生產(chǎn)了少量的GDDR4顯存，其他家都在觀望。固然其他DRAM廠商都沒閑著，它們把GDDR3GDDR3GDDR4AGDDR4只有ATI生產(chǎn)過搭載GDDR4X1950XTXHD2600XTHD3870包括對應的專業(yè)卡)——與當年NVIDIA使用GDDR2的顯卡數(shù)量相等。NVIDIA在患病滑鐵盧后堅決放棄了GDDR2ATI對于GDDR4GDDR4的失敗并不是技術緣由，和當年的GDDR2相比它要成熟很多，沒推起來的緣由主要是對手太強：ATI的對手NVIDIA很強大，另外GDDR4GDDR3即便使用了8bitGDDR4GDDR3拉開頻率差距，I/OGDDR5GDDR5：恐懼的頻率是如何達成的GDDR4GDDR5DDR38bit，核心頻率明顯不是瓶頸I/OGDDR5I/ODQ。GDDR5DQGDDR5GDDR3/4136Ball170Ball，GPU器也需要重設計。GDDR5顯存擁有多達16個物理Bank，這些Bank被分為四組，雙DQ總線穿插掌握四組Bank，到達了實時讀寫操作4GHz以往GDDR1/2/3/4和DDR1/2/3的數(shù)據(jù)總線都是DDR技術(通過差分時鐘在上升沿和下降沿各傳輸一次數(shù)據(jù))，X2，也就是通常我們所說的等效頻率GDDR5條數(shù)據(jù)總線，相當于Rambus的QDR技術，所以官方標稱頻率X4才是數(shù)據(jù)傳輸率。比方HD4870官方顯存頻900MHz3600MHz。失敗乃成功之母，冒險使用GDDR5RV770GTX200GDDR4ATIGDDR4GDDR5I/O技術方面的問題不難解決，最難的是時間和進度。ATI在R600上面冒險使用512Bit顯存掌握器來提RV670256Bit，GDDR4GDDR3GDDR5GPURV770256Bit，急需高頻顯存的支持。NVIDIAGDDR3，GTX200核心使用了512BitR600NVIDIA從256Bit384Bit512Bit一步一個腳印走出來的穿插總線明顯更加成熟。256Bit512Bit，ATIGDDR5GDDR5ATI已經(jīng)在緊鑼密鼓的測試性能，并催促DRAM廠投產(chǎn)?？梢哉fGDDR5和GDDR2/4一樣也是個早產(chǎn)兒，但失敗乃成功之母，有了完善的技術規(guī)格和制造工藝的支持，GDDR5GDDR5HD4870256Bit448BitGTX260NVIDIA通過降128BitHD4770256Bit9600GT9800GT。之前我們分析過，TSOPGDDR1gDDR2DDR1/2，高位寬(16bitDDR3DDR2，于DDR3DDR2gDDR2。gDDR3：把內(nèi)存顆粒改裝成顯存用gDDR2GDDR3gDDR2釘釘?shù)氖隆MDDDR3DRAMGraphicsDDR3SDRAMgDDR3，DDR3SDRAMDDR24bit32bit，定位中高端顯卡?？梢钥闯?，GDDR5GDDR3，gDDR3gDDR2，中端則會消滅三代共存的局面。雖然gDDR3單顆位寬只有GDDR3的一半，但存儲密度卻是GDDR3的兩倍，而且在一樣頻率2022MHz)，gDDR3GDDR3，因此功耗發(fā)熱要低很多。對于位寬不高的中低端顯卡來說，gDDR3上圖就是現(xiàn)代官方網(wǎng)站列出的gDDR3和GDDR3兩種顯存的規(guī)格參數(shù)表，留意它們的全稱，是否有“G“，真的是差之毫厘謬以千里。gDDR316bitFBGA96BallDDR34/8bit，封裝是78/82Ball。也有少數(shù)DDR316bitFBGA96BallSDR+DDR1/2/3GDDR1/2/3/4/5顯存引領DRAM進展，將來內(nèi)存將以顯存為藍本開發(fā)縱觀近年來內(nèi)存與顯存的進展，就會覺察顯存的進展速度已經(jīng)遠遠超越了內(nèi)存，顯存帶寬幾乎到達了內(nèi)存帶寬的10倍之多，而且這個差距還在不斷的加大。目前三通道DDR3已經(jīng)足夠桌面CPU用好一陣子了，而GPU/附屬GDDR2提前DDR2GDDR4提前DDR3一年多，雖然都以失敗而告終，GDDR5在內(nèi)存領域，如今DDR3才剛剛站穩(wěn)腳跟，至少將統(tǒng)治PC兩至三年，但DDR4的標準已經(jīng)在樂觀制定當GDDR5DDR38bitI/O中緣由信任認真閱讀了本文的朋友們應當知道吧?！?C16840nmAMDDirectX11RadeonHD5000GDDR5GDDR5RadeonHD4770GDDR5顯存就成為了AMD端顯卡的標配，如今，AMDRadeonHD5700/4700系列也開頭承受GDDR5NVIDIAGeForceGT240GDDR5GDDR5GDDR3AIC/AIBGDDR5GDDR5EAH5870/2DIS/1GD5、華碩EAH5850/2DIS/1GD5、華碩EAH5770/2DIS/1GD5、華碩EAH5750/2DIS/1GD5、華碩EAH4750F1/DI/512MD5ENGT240/DI/512MD5GDDR5GDDR3上面這張圖清楚的反響了帶寬與顯存頻率位寬之間的關系！假設有一批貨物〔數(shù)據(jù)〕要從倉庫〔顯存〕運到工廠〔GPU〕處理，怎么樣才能更快的完成這件工作？我們有兩種方式：第一，在只有驢車運輸?shù)臓顩r下，可行的方法拓寬工廠與倉庫之間的車道數(shù)，這樣一次可以樣可以更快的完成任務。64Bit已經(jīng)進展512Bit500MHz進展到GDDR32600MHz〔GDDR5以前〕，但是增加顯存位寬這條路徑已經(jīng)消滅了瓶頸，512BitGPU的極限，且不管失敗的RadeonHD2900XT，即使是看起來風光無限的GT200GT200系列無論功耗還是發(fā)熱量都NVIDIA已經(jīng)打算在GT300384BitAMDRadeonHD3870256Bit就只有將驢車換成法拉利跑車了！將驢車換成法拉利跑車需要幾步？答：三步！GDDR400MHz，900MHz，GDDR2GDDR2和電壓問題，并不成功。其次步是GDDR3顯存顆粒，這也是近幾年顯卡承受最普遍的顯存顆粒，在這期間GDDR22.5V1.8VGDDR31000MHz0.77ns2600MHz，此時可以視為將驢車換成了寶馬，速度提升了格外明顯，但是這看要和誰比！由于和GDDR5相比，GDDR3能夠到達GDDR5GDDR5GDDR4是要說的是，GDDR4確實也是格外優(yōu)秀的產(chǎn)品，不過其致命點是雖然頻率夠高，最高可達3000MHzGDDR3GDDR42400MHz2022MHzGDDR3耗等方面仍有優(yōu)勢，NVIDIAGDDR3沒有大面積普及。GDDR5AMDNVIDIA3600MHz4800MHz6000MHzGDDR5在這個話題之前我們要先明白顯存的的三個頻率：核心頻率、I/O頻率、等效頻率。核心頻率是內(nèi)部電容的刷頻率，它是內(nèi)存的真實運行頻率；時鐘頻率即I/O〔輸入/輸出緩沖〕的傳輸頻率；而有效數(shù)據(jù)傳輸頻率就是指數(shù)據(jù)傳送的頻率〔即等效頻率〕。其中顯存的核心頻率現(xiàn)在很少被人提起，I/O〔也就是官方標稱的頻率〕及等效頻率，RadeonHD58704800MHz1200MHz，其中4800MHz1200MHzI/O150MHz150MHz先/提前存取數(shù)據(jù)，GDDR/GDDR2/GDDR3/GDDR4/GDDR5分別承受了2Bit/4Bit/4Bit/8bit/8it數(shù)據(jù)預取技術，也就是說I/O掌握器在發(fā)出懇求之前，它們會分別預備好2Bit/4Bit/4Bit/8bit/8it那么我們可以得出一個結(jié)論，那就是假設核心頻率同為200MHz的話，那么GDDR/GDDR2/GDDR3/GDDR4/GDDR5的I/O頻率分別是400Mz/800MHz/800MHz/1600MHz/1600MHz800MHz/1600MHz/1600MHz/3200MHz/3200MHzI/OGDDR/GDDR2/GDDR3/GDDR4GDDR53200MHz，6400MHz。這又是為什么呢？顯存規(guī)格顯存類型核心頻率I/O頻率等效頻率由于GDDR/GDDR2/GDDR3/GDDR4的數(shù)據(jù)總線都是DDR沿各傳輸一次數(shù)據(jù))，I/OX2就是等效頻率，而GDDR5兩條并行的DQRambusQDRI/O顯存規(guī)格顯存類型核心頻率I/O頻率等效頻率GDDRGDDR2GDDR3GDDR4GDDR5200M200MH200MH200MH200MHHzzzzz400M800MH800MH1600M1600MHzzzHzHz800M1600M1600M3200M6400MHzHzHzHzHz顯存規(guī)格顯存類型顯存規(guī)格顯存類型GDDRGDDR GDDR2 GDDR4 GDDR5核心頻率I/O頻率等效頻率200M200M3200M200MH200MHHzHzHzzz200M400MH400M800MH400MHHzzHzzz400M800MH800M1600M3200MHzzHzHzHz使用內(nèi)存計算方法的結(jié)論？？？？GDDR54800MHz150MHzGDDR51.5VGDDR317%的電量，更低的電壓意味著更低的功耗和發(fā)熱量，對于顯卡工作的穩(wěn)定至關重要。有了GDDR5＝顯存位寬×顯存工作頻率/8128Bit的華碩EAH5770/2DIS/1GD5，通過4800MHz4800MHz×128bit/8=76.8GB/s256BitGeForceGTS2502200MHz×256Bit/8=70.4GB/sGeForceGT240GDDR3GDDR510%以上，足見GDDR5大的發(fā)揮空間！GDDR5等效頻率=物理頻率×8〔GDDR58bit預讀取〕×4〔雙總線上下延傳輸〕由于，標稱頻率=物理頻率×8〔GDDR58bit預讀取〕GDDR5等效頻率也等于標稱頻率×4。GDDR5顯存GDDR32600MHz，相比之下，目前GDDR55000MHz。不過這照舊不是終點，GDDR5最高數(shù)據(jù)6000MHzGDDR顯存一樣，GDDR5也是建立在多倍數(shù)據(jù)預GDDR12bit數(shù)據(jù)預取技術，GDDR2、GDDR3GDDR44bit數(shù)據(jù)預取技術，GDDR58bit數(shù)據(jù)取技術的產(chǎn)物，到達了令人驚異的高性能。優(yōu)秀的雙總線設計—高速傳輸無憂GDDR34bit預取數(shù)據(jù)而言，GDDR5的優(yōu)勢在于將預取數(shù)據(jù)增加到了8bit，因此GDDR5就能夠在同樣的物理時鐘頻率下到達更高的數(shù)據(jù)傳輸速度。不僅如此，GDDR5顯存承受了雙數(shù)據(jù)總線，能夠同時在數(shù)據(jù)總線的上升和下降階段傳輸數(shù)據(jù)。同時，每條總線都獨立配備了完整的DBI，可以獨立傳輸、校驗數(shù)據(jù)，是完整的雙總線規(guī)格。以往單GDDR2、GDDR31/2〔比方標稱頻率為900MHzGDDR31800MHz〕，GDDR5顯存由于雙總線技術的存在，每條總線都可以在上升和下降階段傳輸數(shù)據(jù)，因此標稱頻率是等效工作頻率的1/4。4000MHzGDDR51000MHz。由于承受了8bit的預取技術125MHz。GDDR顯存幾種頻率的差異物理運行頻率：是指GDDR實際測得。在通常的使用中，物理運行頻率是極少被提及的。標稱頻率：GDDR顯存的標稱頻率遠遠高于物理運行頻率。以GDDR3為例，它承受4bit預取，因此250MHzGDDR3顯存，1000MHzGPU-Z、Rivatuner等軟件的截圖中，看到的顯存頻率就是標稱頻率。等效工作頻率：等效工作頻率是GDDR顯存衡量實際傳輸數(shù)據(jù)力量的頻率。一般GDDR2、GDDR3、GDDR42倍。而GDDR5承受了4倍。我們常常看到廠商和大局部媒體宣傳的顯存頻率實際就是等效工作頻率，這也是大家使用最廣泛、認知度最高的GDDR顯存頻率。另外，等效工作頻率可以直接和顯存位寬相乘進展計算。比方等效工作頻率為2000MHzGDDR3128bit2022MHz×128bit÷8=32GB/s。穩(wěn)定+節(jié)能，其實很簡潔—Dataeyeoptimization數(shù)據(jù)核心優(yōu)化對于數(shù)據(jù)的優(yōu)化是存儲器最為重要的方面，GDDR5重點承受了四項技術來保證數(shù)據(jù)的穩(wěn)定性和安全性。Data/addressbitinversio

人人文庫> 全部分類> 教育資料 > 輔導培訓

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

顯存的前世今生(終極剖析高手階進必知)

文檔簡介

溫馨提示

最新文檔

評論

顯存的前世今生(終極剖析高手階進必知)

文檔簡介

溫馨提示

最新文檔

評論

相關文檔