存儲管理_補充_CPU究竟需要多大緩存.ppt_第1頁
存儲管理_補充_CPU究竟需要多大緩存.ppt_第2頁
存儲管理_補充_CPU究竟需要多大緩存.ppt_第3頁
存儲管理_補充_CPU究竟需要多大緩存.ppt_第4頁
存儲管理_補充_CPU究竟需要多大緩存.ppt_第5頁
已閱讀5頁,還剩51頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

CPU究竟需要多大緩存 緩存的前世今生 CPU性能的影響因素 頻率 架構(gòu) 工藝 緩存 大緩存對于大會戰(zhàn)作用很大 CPU緩存 CPU緩存 CacheMemory 是位于CPU與內(nèi)存之間的規(guī)模較小的但速度很高的臨時存儲器 它通常由SRAM 靜態(tài)隨機存儲器 組成用來存放那些被CPU頻繁使用的數(shù)據(jù) 以便使CPU不必依賴于速度較慢的DRAM 動態(tài)隨機存儲器 不過限于它的昂貴成本 一般容量比內(nèi)存要小 SRAM結(jié)構(gòu)簡圖 DRAM結(jié)構(gòu)簡圖 緩存的設(shè)計思路是用少量的速度較快的SRAM作為CPU與DRAM存儲系統(tǒng)之間的緩沖區(qū) 起初是在芯片的外部 到了80486時期 這部分SRAM被集成到了芯片內(nèi) 因此又叫片內(nèi)Cache 片內(nèi)Cache即是今天的一級緩存 這部分緩存的容量是很少的 486芯片內(nèi)只有8KB 到了奔騰高檔芯片就升級到了16KB PowerPC可達32KB 后來Pentium微處理器改進片內(nèi)Cache 采用數(shù)據(jù)和雙通道Cache技術(shù)非常靈活 方便 極大地提高了微處理器的性能 CPU產(chǎn)品的檔次不只是可以按主頻的高低劃分 還可以按照緩存量的不同而區(qū)分開來 而且即使兩款處理器的其他參數(shù)完全一致 只緩存量略有出入 那么這兩款處理器的售價可以相差很多 緩存的容量目前一般都以MB計量 不同的處理器型號緩存量差別不小 有的擁有1MB二級緩存 而有些則可以高達12MB 而售價卻差了好幾倍 最高可以差十幾倍 那么緩存對處理器的售價影響可見一斑 同時也說明緩存對處理器的性能影響很大 緩存工作原理 當CPU要讀取一個數(shù)據(jù)時 首先會從緩存中查找 如果找到就立即讀取并送給CPU處理 如果沒有找到 就從速度相對慢得多的內(nèi)存中讀取并送給CPU處理 同時把這個數(shù)據(jù)所在的數(shù)據(jù)塊調(diào)入緩存中 可以使得以后對整塊數(shù)據(jù)的讀取都從緩存中進行 不必再調(diào)用內(nèi)存 AMDVS Intel 一般AMD的處理器相比Intel擁有更少的緩存 比如速龍64X25000 緩存量為2X128KB 2X512KB 1 256MB定位在同檔次的Intel奔騰E5200的緩存量只二級緩存就達到了2MBIntel的處理器性能相對更依賴緩存 1MB二級緩存的處理器要比同樣架構(gòu)的 具有2MB二級緩存的處理器性能差很多 為什么Intel的處理器更依賴緩存呢 這主要在于Intel與AMD的緩存邏輯結(jié)構(gòu)設(shè)計有關(guān) 一般CPU讀取的數(shù)據(jù) 包括指令 中有80 來自一級緩存 對于AMD來說一 二 三級緩存都是用來存儲CPU將要處理器的數(shù)據(jù)的 因此在一級緩存中未找到 命中 的數(shù)據(jù)可以去二級緩存 甚至三級緩存里去找 而Intel的結(jié)構(gòu)不是這樣的 Intel一級緩存采用 數(shù)據(jù)代碼指令追蹤緩存 架構(gòu) 數(shù)據(jù)代碼指令追蹤緩存 架構(gòu)不直接存儲CPU可以直接用的數(shù)據(jù) 而且存儲該部分數(shù)據(jù)的地址 而這部分數(shù)據(jù)則被存儲在二級緩存甚至三級緩存里 這樣CPU可以根據(jù)一級緩存的 地址目錄 來在緩存里面快速找到所需要的數(shù)據(jù) 因此理論上講對于Intel處理器二級緩存和三級緩存容量越大越好 一級緩存 一般CPU中的一級緩存容量都很少 即使是售價高昂的六核酷睿i7 980X 一級緩存也只有2X6X32KB 384KB 還不到512KB既然都是最高端的旗艦了 那么為什么CPU廠商不多給這些CPU多設(shè)計些一級緩存呢 前面提到了一級緩存是集成在芯片內(nèi)部的 因此就要占用一定的晶體管 這對于核心面積有限的處理器來說更多的緩存意味著要提供更多的地方來添加這些晶體管其次更重要的是一級緩存的速度極快 達幾十GB S 二級緩存一般為幾GB S 一級緩存比二級緩存要快一個數(shù)量級 所以售價很昂貴 這就極大的限制了它的容量最后緩存是處理器中的發(fā)熱大戶 設(shè)計太大容量所帶來的發(fā)熱量是很 可觀 的 那么如何應(yīng)對這種情況呢 CPU廠商想出的一個辦法就是給緩存分級 也就是引入二級緩存通俗來講 二級緩存即便是一級緩存的緩沖 主要用來存儲那些CPU處理時用到的 一級緩存無法存儲的數(shù)據(jù) 三級緩存相對二級緩存也類似 這樣采用緩存分級可以很好的解決延時問題而且效果不亞于增加一級緩存容量 成本也比較低 二級緩存 酷睿2系列處理器的二級緩存容量從1MB到2MB 3MB 4MB再到6MB 8MB 12MB可以說讓人眼花繚亂 那么為何二級緩存到了12MB就沒有再增加了呢 首先 二級緩存屬于SRAM 靜態(tài)RAM 成本雖然相比一級緩存有所降低 但仍然意味著較大的成本其次 SRAM雖然有著相比DRAM更高的性能但是卻有它的缺點即集成度不如后者高 換句話說相同容量的DRAM內(nèi)存可以設(shè)計得體積較小 而SRAM就需要很大的體積 這對于空間 寸土寸金 房價高昂 的CPU來說 顯然不能設(shè)計太大容量最后 前面已經(jīng)提到了給緩存分級 采用多級組織可以有效降低延時 提高cache的命中率 三級緩存 二級緩存在達到了12MB后就沒有再有增加 而且在增加L3緩存后容量有所降低 但是處理器的性能非但沒有降低 反而有了更大的提升 那么這又是怎么一回事呢 三級緩存可以看做是二級緩存的緩沖器 使用較快速的儲存裝置直接從較慢的內(nèi)存中讀取數(shù)據(jù)并進行拷貝 這對于有效得降低內(nèi)存的延遲大有好處 粉紅色部分即為三級緩存 最早的L3緩存被應(yīng)用在AMD發(fā)布的K6 III處理器上 當時的L3緩存受限于制造工藝 并沒有被集成進芯片內(nèi)部 而是集成在主板上在只能夠和系統(tǒng)總線頻率同步的L3緩存同主內(nèi)存其實差不了多少后來使用L3緩存的是英特爾為服務(wù)器市場所推出的Itanium處理器 接著就是P4EE和至強MP 酷睿i7二級緩存核心獨享 為什么酷睿i7的二級緩存反而隨著三級緩存的采用而減少了呢 仔細觀察酷睿i系列處理器的架構(gòu)即可發(fā)現(xiàn)酷睿i7處理器的二級緩存不再是采用酷睿2處理器的共享設(shè)計 而是每顆核心具有自己獨立的二級緩存 這樣就沒有必要設(shè)計那么大容量的公用資源區(qū) 而這一任務(wù)則交給了高達12MB的三級緩存 而且三級緩存和內(nèi)存一樣 容量越大 成本越低 這樣將公用數(shù)據(jù)資源的任務(wù)交給L3緩存不僅同樣解決了延時 同時也有效降低了成本 Intel的酷睿i系列處理器 在Intel的酷睿i系列處理器中 三級緩存容量繼續(xù)延續(xù)了酷睿2時代L2緩存容量 百花齊放 的局面酷睿i3 530具有4MB三級緩存 酷睿i5 750具備8MB三級緩存 酷睿i7 980X具有12MB三級緩存 三級緩存容量隨核心數(shù)的增加而增加 可以簡單理解為 越多的核心可以應(yīng)對更大的數(shù)據(jù)量處理 因此更大的三級緩存就很有必要了 三級緩存對處理器的性能影響到底有多大 實際上三級緩存的速度相比二級緩存要慢很多 但是三級緩存對于大數(shù)據(jù)量處理的貢獻是很大的 尤其是在一些較依賴緩存 運算量較大的游戲中表現(xiàn)明顯 而且三級緩存在服務(wù)器處理器中的作用也更為明顯 緩存的權(quán)衡 一般來講 緩存容量越大對處理器的性能提升越好 但是除了前面所說的成本 發(fā)熱量限制等因素外 緩存容量并不能純粹的保持越大越好 在實際應(yīng)用中 CPU處理的數(shù)據(jù)中大多數(shù)都是0KB 128KB大小的數(shù)據(jù) 128KB 256KB的數(shù)據(jù)約有10 256KB 512KB的數(shù)據(jù)有5 512KB 1MB的數(shù)據(jù)僅有3 左右 因此這對于CPU來說 二級緩存容量從0KB增加到256KB對CPU性能的提高幾乎是直線性的 增加到512KB對CPU性能的提高就要小一些 而從512KB增加到1MB 大多數(shù)情況下普通用戶就很難體會到CPU性能有多大提高了 經(jīng)過實際測試 桌面級處理器的三級緩存從2MB增加到6MB只帶來大約5 的性能提升 再增加帶來的性能提升就更不明顯了 這從在多數(shù)測試中酷睿i3 530處理器都性能直追酷睿i5 750上可以看出來 而且相比羿龍II四核處理器 AMD羿龍II六核處理器似乎只是增加了1MB的二級緩存 三級緩存容量仍然保持在了6MB 這樣合理的控制緩存容量 不僅沒有降低多少處理器的性能 還能更好的控制處理器的成本 這對于應(yīng)對競爭激烈的最高形式 價格戰(zhàn)是非常有利的 總結(jié) 處理器的制造工藝不斷進步 處理器架構(gòu)也不斷更新 緩存在處理器中將會有何種形式的調(diào)整恐怕只有兩大處理器巨頭的技術(shù)工程師知道了 不過緩存作為CPU和內(nèi)存間的緩沖器的作用在內(nèi)存的速度趕上處理器速度之前是很難發(fā)生改變的 IntelCPU 筆記本電腦移動核心I3I5I7區(qū)別i3雙核模擬四核心 即四線程 無睿頻 i5雙核模擬四核心 即四線程 除睿頻技術(shù)外其他技術(shù)規(guī)格與i3相同 i7四核模擬八核心 即八線程 功耗大性能強 I3 i5的性能差距比i5 i7的性能差距小 臺式電腦Corei3i5i7區(qū)別i5 基于Nehalem架構(gòu)的四核處理器 采用整合內(nèi)存控制器 三級緩存模式 L3達到8MB 支持TurboBoost等技術(shù) i5和i7 Bloomfield 的主要區(qū)別在于總線不采用QPI 采用的是成熟的DMI DirectMediaInterface 并且只支持雙通道的DDR3內(nèi)存 結(jié)構(gòu)上采用LGA1156接口 i7采用的是LGA1366 i5有睿頻技術(shù) 可以在一定情況下超頻 i3可看作是Corei5的進一步精簡版 或閹割版 i3最大的特點是整合GPU 圖形處理器 即i3由CPU GPU兩個核心封裝而成 由于整合的GPU性能有限 用戶想獲得更好的3D性能 可以外加顯卡 顯示核心部分的制作工藝仍會是45nm I3和i5區(qū)別最大之處是i3沒有睿頻技術(shù) 認識Clarkdale 模組化設(shè)計再建新功 CPU中塞進GPU Clarkdale是CPU史上首款整合有GPU的處理器 同時也是首款采用32nm制程技術(shù)的CPU 具有開創(chuàng)性的歷史意義 在2010年1月8日 英特爾正式發(fā)布了Clarkdale核心的處理器 這樣它與之前上市的Bloomfield核心和Lynnfied核心處理器組成了全新的Core 酷睿 處理器家族 即Corei7 i5 i3系列處理器 形成一個完整的高中低產(chǎn)品線 Corei7以英特爾桌面旗艦處理器的身份統(tǒng)領(lǐng)高端消費市場 Corei5則是中端桌面處理器的領(lǐng)軍人物 Corei3定位于Core家族入門處理器 在Core品牌之后 還有經(jīng)典的Pentium品牌主導(dǎo)普通應(yīng)用 Celeron系列提供入門級的解決方案 Atom處理器則是為上網(wǎng)本和手持設(shè)備量身定造 Clarkdale 首款32nm制程CPU 英特爾的 Tick Tock 戰(zhàn)略眾所周知 制程技術(shù) 微架構(gòu) 交替更新 比如說在2008年將CPU制程技術(shù)升級到了45nm 在2009年將微架構(gòu)升級到了Nehalem 在2010年伊始 英特爾就非常精準地將制程提升到了32nm Clarkdale乘此東風 成為首款采用32nm制程技術(shù)的處理器 每兩年更新一次硅制程技術(shù) ticks 同時 每兩年更新一次架構(gòu) tocks Clarkdale 首款整合GPU的CPUAMD在收購ATI后 首先提出了CPU與GPU融合的概念 然而一直停留在 紙上談兵 的階段 英特爾后發(fā)卻先至 發(fā)布了首款整合GPU圖形單元的處理器Clarkdale Clarkdale處理器 只是簡單的將GPU和CPU封裝在一起 并沒有真正達到 融合 一顆CPU里其實有兩顆 芯 這樣雙 芯 獨立并存的方式可能是未來很長一段時間內(nèi)的主流 Clarkdale中的CPU核心是采用的32nm制程技術(shù) 而GPU核心還是采用的45nm制程 兩個核心采用MCP Multi ChipPackage 的方式封裝在一起 45nm制程的Lynnfield Corei7 800 i5 700系列 處理器核心大小為296mm2 晶體管數(shù)為7 74億個 而32nm制程的Clarkdale處理器中CPUDie大小為81mm2 不含GPUDie 晶體管數(shù)為3 82億個 除了制程上的影響外 CPUDie不再包含內(nèi)存控制器和PCI E控制器 再加上核心和L3Cache只有Lynnfield的一半 使得CPUDie的大小和晶體管數(shù)急劇減少 對于GPUDie來說 其大小為114mm2 晶體管數(shù)為1 77億個 DMI DirectMediaInterface Clarkdale內(nèi)核結(jié)構(gòu) 認識Clarkdale Core系列處理器家譜 Clarkdale平臺架構(gòu) 英特爾對Core處理器的定位 Bloomfield核心的Corei7將是發(fā)燒級玩家的選擇 他們需要非常強勁的處理器性能 可以靈活搭配獨立顯卡 可以組建三通道內(nèi)存 一臺運算速度飛快的電腦是他們追尋的理想 Lynnfield核心的Corei7 i5以替代現(xiàn)在的Core2Quad為已任 它所面對的用戶更注意性能與價格間的平衡 性能不可低 價格不可高 魚與熊掌并非不可得兼 整合有GPU的Clarkdale核心處理器Corei5 i3將取代Core2Duo 它面向于高清HTPC市場和普通日常應(yīng)用 這部分用戶不需要很高性能的CPU 也不需要很強游戲性能的顯卡 低功耗和高整合度是很多消費者的理想選擇 Clarkdale整合的GPU強化了高清視頻與音頻輸出品質(zhì) 如支持xvYCC標準 支持DolbyTrueHD和DTS HDMA無損音頻輸出 能夠讓它在HTPC市場大展身手 尤其是兩款Corei3處理器 價格控制在千元以下 受眾面更廣 總結(jié) Clarkdale開創(chuàng)CPU新紀元 32nm 處理器制程技術(shù)邁進一大步首次實現(xiàn)CPU整合GPU 3I 平臺初具雛形 Intel五年規(guī)劃 從45nm到22nm從Nehalem到Haswell Westmere Nehalem微架構(gòu)的改良版Clarkdale核心處理器采用的是Westmere微架構(gòu) Westmere實際上是脫胎于大名鼎鼎的Nehalem微架構(gòu) 并作了少少的增強設(shè)計 可以看作是Nehalem的改良版 Westmere微架構(gòu)最主要的改進在于增加了AES指令集SandyBridge Nehalem的繼任者也是其工藝升級版 從45nm進化到32nm SandyBridge將有八核心版本 二級緩存仍為512KB 但三級緩存將擴容至16MB SandyBridge最大的亮點是將引入 高級矢量擴展 指令集 簡稱 AVX 其重要性堪比1999年P(guān)entiumIII引入SSE Intel宣稱 用AVX取代SSE執(zhí)行矩陣乘法等特定應(yīng)用時可帶來大約90 的性能提升 Haswell 第三代酷睿處理器有關(guān)SandyBridge的工藝升級版IVYBridge和架構(gòu)升級版Haswell 22nm 具體架構(gòu)情況不知 預(yù)計Haswell會普遍使用八核心設(shè)計 緩存架構(gòu)會全面升級 節(jié)能技術(shù)也會有很大改進 預(yù)計將于2012年上半年正式亮相 英特爾架構(gòu) 自1989年起英特爾就一直有條不紊地遵循著其稱為 Tick Tock模式 的新產(chǎn)品創(chuàng)新節(jié)奏 即每隔一年交替推出新一代的先進制程技術(shù)和處理器微體系架構(gòu) 隨著時間的推移 我們逐漸看到了這二者在處理器整體性能表現(xiàn)中所起到的作用已遠遠超出了處理器主頻和緩存技術(shù) P5與P6架構(gòu)奔騰采用P5架構(gòu) 這被證明是偉大的創(chuàng)舉 在英特爾的發(fā)展歷史中 第一代奔騰絕對是具有里程碑意義的產(chǎn)品 這一品牌甚至沿用至今 盡管第一代奔騰60的綜合表現(xiàn)很一般 甚至不比486強多少 但是當主頻優(yōu)勢體現(xiàn)出來之后 此時所表現(xiàn)出來的威力令人震驚 奔騰75 奔騰100及133 經(jīng)典的產(chǎn)品一度稱雄業(yè)界 奔騰II 英特爾采用了專利保護的P6架構(gòu) P6架構(gòu)與奔騰的P5架構(gòu)最大的不同在于 以前集成在主板上的二級緩存被移植到了處理器內(nèi) 從而大大地加快了數(shù)據(jù)讀取和命中率 提高了性能 NetBurst架構(gòu)Netburst微架構(gòu)是P6微架構(gòu)的后繼者 第一個使用這架構(gòu)的是Willamette核心 于2000年推出 Willamette是第一代奔騰IV處理器所用的核心 而全部的奔騰IV處理器都是使用Netburst微架構(gòu) 2001年推出的Foster 至強處理器 也是使用本架構(gòu) 同時基于奔騰IV的賽揚 賽揚D 以及雙核心的奔騰D 奔騰ExtremeEdition都是使用本架構(gòu) NetBurst微架構(gòu)將頻率提升超過了40 雖然IPC值較低 但由于頻率的增加彌補了不足 性能 頻率 IPC 并且為最終用戶提供了更高的整體性能 和P6微架構(gòu)一樣 英特爾NetBurst微架構(gòu)憑借無序推測執(zhí)行 盡管分支預(yù)測算法相當精確 但也不可能100 正確 為了使由于分支誤預(yù)測而引起的損失降到最低并使IPC均值最大化 采用擴展深度流水線技術(shù)的IntelNetBurst微架構(gòu)極大地減小了分支預(yù)測錯誤的數(shù)量 并提供了從這些錯誤恢復(fù)的快速方法 為了能使誤預(yù)測引起的損失最小 英特爾NetBurst微架構(gòu)實現(xiàn)了高級動態(tài)執(zhí)行引擎和一個執(zhí)行跟蹤緩存 超流水線技術(shù)使得流水線的深度相比P6微處理器體系結(jié)構(gòu)的提高了一倍 不過在后來的實際應(yīng)用中表明提高流水線長度之后會令執(zhí)行效率大幅度降低 彌補這個問題的辦法只能是再次提高主頻和增加二級緩存容量 不過由于當時處理器工藝制成的限制 導(dǎo)致處理器的主頻的可提升空間越來越小 與此同時巨大的緩存容量也是一個負擔 這不僅提高了成本 也令發(fā)熱量驟升 這一點使得英特爾必須要及時地對處理器微架做出新的 根本性地調(diào)整 Core微架構(gòu) 2006年推出了具有革新意義的Core微架構(gòu)拋棄了主頻至上的處理器研發(fā)思路1 流水線效率大幅度提升2 全新的整數(shù)與浮點單元3 數(shù)據(jù)預(yù)讀機制與緩存結(jié)構(gòu) Core架構(gòu)的緩存系統(tǒng)令人印象深刻 雙核心Core架構(gòu)的二級緩存容量高達4MB 且兩個核心共享 訪問延遲僅12到14個時鐘周期 每個核心還擁有32KB的一級指令緩存和一級數(shù)據(jù)緩存 訪問延遲僅僅3個時鐘周期 Nehalem微架構(gòu)經(jīng)歷Core微架構(gòu)的輝煌之后 于2008年末推出了新的Nehalem微架構(gòu) 基本是建立在Core微架構(gòu)的骨架上 外加增添了SMT 3層Cache TLB和分支預(yù)測的等級化 IMC QPI和支持DDR3等技術(shù) 比起從Pentium4的NetBurst架構(gòu)到Core微架構(gòu)的較大變化來說 從Core微架構(gòu)到Nehalem微架構(gòu)的基本核心部分的變化則要小一些 1 QPI總線技術(shù)2 IMC整合內(nèi)存控制器3 SMT 同步多線程 SimultaneousMulti Threading SMT 技術(shù)又重新回歸到了Nehalem架構(gòu) 4 全新設(shè)計的緩存體系 Nehalem的每個核心有一個私有的通用型L2 是8路聯(lián)合的256KB 訪問速度相當快 與Core微

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論