《微型計(jì)算機(jī)技術(shù)》教學(xué)課件-微機(jī)技術(shù)(3版)第15章版

上傳人：g*** IP屬地：貴州上傳時(shí)間：2022-12-27 格式：PPT 頁數(shù)：276 大?。?.79MB 積分：30 舉報(bào) 版權(quán)申訴

《微型計(jì)算機(jī)技術(shù)》教學(xué)課件-微機(jī)技術(shù)(3版)第15章版_第2頁

《微型計(jì)算機(jī)技術(shù)》教學(xué)課件-微機(jī)技術(shù)(3版)第15章版_第3頁

《微型計(jì)算機(jī)技術(shù)》教學(xué)課件-微機(jī)技術(shù)(3版)第15章版_第4頁

《微型計(jì)算機(jī)技術(shù)》教學(xué)課件-微機(jī)技術(shù)(3版)第15章版_第5頁

已閱讀5頁，還剩271頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

2022/12/26上海交通大學(xué)1面向21世紀(jì)課程教材普通高等教育“十一五”國家級規(guī)劃教材微型計(jì)算機(jī)技術(shù)WeixinɡJisuɑnjiJishu

（第3版）孫德文編著2022/12/26上海交通大學(xué)1面向21世紀(jì)課程教材微型12022/12/26上海交通大學(xué)2

第15章

多核芯片簡介2022/12/26上海交通大學(xué)2

第15章

多22022/12/26上海交通大學(xué)3多核芯片簡介

15.1多核處理器芯片概述

15.1.1多核處理器

15.1.2

CPU核心架構(gòu)的發(fā)展

15.2

Intel臺(tái)式機(jī)雙核處理器的早期產(chǎn)品

15.3

Core微架構(gòu)

15.4

Core２Duo／Quad／Extreme

15.5

IntelNehalem架構(gòu)Corei７處理器2022/12/26上海交通大學(xué)3多核芯片簡介15.132022/12/26上海交通大學(xué)4多核芯片簡介

６４位微處理器和多核處理器是進(jìn)入２１世紀(jì)后，微處理器硬件技術(shù)更新的兩個(gè)重點(diǎn)，在１４章介紹了３種６４位微處理器的主要特性后，本章簡要介紹有關(guān)多核處理器的一些基本知識。2022/12/26上海交通大學(xué)4多核芯片簡介６４位微處42022/12/26上海交通大學(xué)515.1多核處理器芯片概述

15.1.1多核處理器

15.1.2

CPU核心架構(gòu)的發(fā)展2022/12/26上海交通大學(xué)515.1多核處理器芯片52022/12/26上海交通大學(xué)615.1.1多核處理器

所謂多核處理器，簡而言之，是指在一塊CPU基板上集成多個(gè)處理器核心，并通過并行總線將各處理器核心連接起來。其中雙核只是CMP（ChipMult‐Processors，單芯片多處理器）中最基本、最簡單、最容易實(shí)現(xiàn)的一種類型。在RISC處理器領(lǐng)域，雙核甚至多核都早已經(jīng)實(shí)現(xiàn)。CMP最早是由美國斯坦福大學(xué)提出的，其思想是在一塊芯片內(nèi)實(shí)現(xiàn)SMP（SymmetricalMulti‐Processing，對稱多處理）架構(gòu)，且并行執(zhí)行不同的進(jìn)程。2022/12/26上海交通大學(xué)615.1.1多核處理器62022/12/26上海交通大學(xué)7多核處理器在２０世紀(jì)末，HP公司和IBM公司就已經(jīng)提出了雙核處理器的可行性設(shè)計(jì)。２００１年IBM公司推出了基于雙核的POWER４處理器，隨后，Sun公司和HP公司先后推出了基于雙核架構(gòu)的UltraSPARC及PA‐RISC芯片，但當(dāng)時(shí)雙核處理器架構(gòu)都是在高端的RISC領(lǐng)域，直到２００６年Intel公司和AMD公司相繼推出自己的雙核處理器，雙核才真正進(jìn)入主流的X８６領(lǐng)域。Intel公司和AMD公司之所以推出雙核處理器，最重要的原因是原有的普通單核處理器的頻率難于提升，性能沒有質(zhì)的飛躍。2022/12/26上海交通大學(xué)7多核處理器在２０世紀(jì)末，72022/12/26上海交通大學(xué)815.1.2

CPU核心架構(gòu)的發(fā)展

當(dāng)今CPU整體性能表現(xiàn)的關(guān)鍵因素已經(jīng)不僅僅是主頻的高低，也不是緩存技術(shù)的優(yōu)劣，而是核心架構(gòu)。優(yōu)秀的核心架構(gòu)能夠彌補(bǔ)主頻的不足，更能簡化緩存設(shè)計(jì)而降低成本，優(yōu)秀的核心架構(gòu)是優(yōu)秀處理器的根基。2022/12/26上海交通大學(xué)815.1.2CPU核82022/12/26上海交通大學(xué)9CPU核心架構(gòu)的發(fā)展１９８５年，Intel公司推出了Intel８０３８６芯片，之后又出現(xiàn)了許多高性能的３２位微處理器，如Intel８０４８６、IntelPentium（奔騰）等。從２０世紀(jì)９０年代中期開始，３２位微處理器芯片的發(fā)展進(jìn)入鼎盛時(shí)期。１９９５年１１月Intel公司推出了含５５０萬個(gè)晶體管的PentiumPro（高能奔騰），2022/12/26上海交通大學(xué)9CPU核心架構(gòu)的發(fā)展１９92022/12/26上海交通大學(xué)10CPU核心架構(gòu)的發(fā)展１９９７年１月推出了PentiumWithMMX（多能奔騰），簡稱MMX（MultiMediaeXtension，多媒體擴(kuò)展）；１９９７年５月推出了帶有MMX指令集的PentiumPro———PentiumⅡ（PⅡ，奔騰Ⅱ）。１９９９年３月，推出了４５０／５００MHzPentiumⅢ（PⅢ，奔騰Ⅲ）。２０００年６月又推出了新型體系結(jié)構(gòu)（Architecture，又稱架構(gòu)）的３２位微處理器芯片Pentium４。２００３年３月，Intel公司發(fā)布了以迅馳技術(shù)Banias為核心的PentiumM微處理器，用于移動(dòng)計(jì)算的筆記本式計(jì)算機(jī)。2022/12/26上海交通大學(xué)10CPU核心架構(gòu)的發(fā)展１102022/12/26上海交通大學(xué)11CPU核心架構(gòu)的發(fā)展從８０４８６到PentiumM，IntelCPU的核心架構(gòu)經(jīng)歷了如下幾個(gè)階段：

①Intel公司在４８６芯片中開始使用流水線技術(shù)。在CPU中由５、６個(gè)不同功能的電路單元組成一條指令處理流水線，然后將一條X８６指令分成５、６步后再由這些電路單元分別執(zhí)行，這樣就能實(shí)現(xiàn)在一個(gè)CPU時(shí)鐘周期內(nèi)完成一條指令，因而能提高CPU的運(yùn)算速度。2022/12/26上海交通大學(xué)11CPU核心架構(gòu)的發(fā)展從112022/12/26上海交通大學(xué)12CPU核心架構(gòu)的發(fā)展

②Pentium（奔騰）和PentiumWithMMX（多能奔騰）采用P５架構(gòu)。

P５架構(gòu)采用超標(biāo)量技術(shù)，通過內(nèi)置多條流水線來同時(shí)執(zhí)行多個(gè)處理任務(wù)，其實(shí)質(zhì)是以空間換取時(shí)間。經(jīng)典Pentium每條整數(shù)流水線都分為四級流水，即指令預(yù)取、譯碼、執(zhí)行、寫回結(jié)果，浮點(diǎn)流水又分為八級流水。2022/12/26上海交通大學(xué)12CPU核心架構(gòu)的發(fā)展122022/12/26上海交通大學(xué)13CPU核心架構(gòu)的發(fā)展

③PentiumPro（高能奔騰）和PentiumⅡ（PⅡ，奔騰Ⅱ）采用P６架構(gòu)。

P６架構(gòu)與Pentium的P５架構(gòu)的最大區(qū)別在于，以前集成在主板上的二級緩存被移植到了CPU內(nèi)，從而大大地加快了數(shù)據(jù)讀取和命中率，提高了性能。P６架構(gòu)采用超標(biāo)量技術(shù)和超流水線技術(shù)，超流水線通過細(xì)化流水、提高主頻，使得在一個(gè)機(jī)器周期內(nèi)完成一個(gè)甚至多個(gè)操作，其實(shí)質(zhì)是以時(shí)間換取空間。2022/12/26上海交通大學(xué)13CPU核心架構(gòu)的發(fā)展132022/12/26上海交通大學(xué)14CPU核心架構(gòu)的發(fā)展

④Pentium４（奔騰４）采用NetBurst架構(gòu)。對于全新的NetBurst結(jié)構(gòu)而言，發(fā)揮強(qiáng)大的性能需要更高的主頻以及強(qiáng)大的緩存結(jié)構(gòu)，NetBurst架構(gòu)的Pentium４在提高流水線長度之后令執(zhí)行效率大幅度降低，此時(shí)大容量二級緩存與高主頻才是真正的彌補(bǔ)方法。NetBurst架構(gòu)過分依賴于主頻與緩存，為了提高主頻，Net‐Burst架構(gòu)不斷延長CPU超流水線的級數(shù)。2022/12/26上海交通大學(xué)14CPU核心架構(gòu)的發(fā)展142022/12/26上海交通大學(xué)15CPU核心架構(gòu)的發(fā)展起初Pentium４的超流水線就長達(dá)２０級，隨后的Prescott更是提升到３１級。超流水線設(shè)計(jì)的級數(shù)越長，其完成一條指令的速度越快，因此才能適應(yīng)工作主頻更高的CPU。但是超流水線過長也帶來了一定副作用，很可能會(huì)出現(xiàn)主頻較高的CPU實(shí)際運(yùn)算速度較低的現(xiàn)象，Intel公司的NetBurst架構(gòu)就出現(xiàn)了這種情況，雖然它的主頻可以很高，但其運(yùn)算性能卻遠(yuǎn)遠(yuǎn)比不上低主頻的AMD處理器。Intel公司不得不繼續(xù)提高主頻并且加大二級緩存容量。2022/12/26上海交通大學(xué)15CPU核心架構(gòu)的發(fā)展起152022/12/26上海交通大學(xué)16CPU核心架構(gòu)的發(fā)展如今處理器制作工藝開始面臨瓶頸，即便是６５nm工藝，未來想要在NetBurst架構(gòu)實(shí)現(xiàn)高主頻也是極為困難的事情，這意味著NetBurst架構(gòu)今后將無法繼續(xù)憑借主頻優(yōu)勢來提高CPU的性能。此外，巨大的緩存容量也是一個(gè)負(fù)擔(dān)，這不僅提高了成本，也令發(fā)熱量驟升。高發(fā)熱量和高功耗成為高頻Pentium的兩大弊病。2022/12/26上海交通大學(xué)16CPU核心架構(gòu)的發(fā)展如162022/12/26上海交通大學(xué)17CPU核心架構(gòu)的發(fā)展⑤PentiumM。在傳統(tǒng)模式下，Intel移動(dòng)處理器只是桌面處理器的低頻低電壓版本，然后加上一些節(jié)能技術(shù)，但是第一代迅馳PentiumM卻走出了這一框架。第一代PentiumM（Banias）可以認(rèn)為僅僅是改良版的PentiumⅢM，通過超大容量的二級緩存以及更高的前端總線來提升性能，但是對于移動(dòng)用戶而言，看重的僅僅是性能與功耗。Banias的性能已經(jīng)幾乎與Pentium４并駕齊驅(qū)，而功耗更是大幅度減小。2022/12/26上海交通大學(xué)17CPU核心架構(gòu)的發(fā)展⑤172022/12/26上海交通大學(xué)18CPU核心架構(gòu)的發(fā)展Banias核心的PentiumM一旦應(yīng)用到桌面平臺(tái)并大幅度超頻之后，其性能完全壓倒了Pentium４，隨后Dothan核心的PentiumM優(yōu)勢更為明顯，可以認(rèn)為PentiumM的核心架構(gòu)依然是P６，只不過結(jié)合了NetBurst架構(gòu)的前端總線技術(shù)，通過減少原先P６微架構(gòu)下指令編譯后的微指令數(shù)目來改善指令編譯器及處理單元的效能，并且主頻和緩存都大幅度加強(qiáng)。PentiumM為IntelCPU新的內(nèi)核架構(gòu)做好了準(zhǔn)備。2022/12/26上海交通大學(xué)18CPU核心架構(gòu)的發(fā)展B182022/12/26上海交通大學(xué)1915.2

Intel臺(tái)式機(jī)雙核處理器的

早期產(chǎn)品早期Intel公司推出的臺(tái)式機(jī)雙核處理器有PentiumDPentiumEE（PentiumExtremeEdition）CoreDuo三種類型，三者的工作原理有很大不同。2022/12/26上海交通大學(xué)1915.2Intel192022/12/26上海交通大學(xué)201.PentiumD和PentiumEE

PentiumD和PentiumEE分別面向主流市場和高端市場，其每個(gè)核心采用獨(dú)立式緩存設(shè)計(jì)，在處理器內(nèi)部兩個(gè)核心之間是互相隔離的，通過處理器外部（主板北橋芯片）的仲裁器負(fù)責(zé)兩個(gè)核心之間的任務(wù)分配以及緩存數(shù)據(jù)的同步等協(xié)調(diào)工作。兩個(gè)核心共享前端總線，并依靠前端總線在兩個(gè)核心之間傳輸緩存同步數(shù)據(jù)。從架構(gòu)上來看，這種類型是基于獨(dú)立緩存的松散型雙核處理器耦合方案，其優(yōu)點(diǎn)是技術(shù)簡單，只需要將兩個(gè)相同的處理器內(nèi)核封裝在同一塊基板上即可；缺點(diǎn)是數(shù)據(jù)延遲問題比較嚴(yán)重，性能并不盡如人意。另外，PentiumD和PentiumEE的最大區(qū)別就是，PentiumEE支持超線程技術(shù)而PentiumD則不支持，PentiumEE在打開超線程技術(shù)之后會(huì)被操作系統(tǒng)識別為４個(gè)邏輯處理器。2022/12/26上海交通大學(xué)201.PentiumD202022/12/26上海交通大學(xué)21PentiumD和PentiumEEIntel公司的PentiumD和PentiumEE是獨(dú)立式二級緩存，協(xié)調(diào)單元在CPU外部（依賴于主板），相對來說都比較簡單———

只需要為兩個(gè)核心添加一個(gè)協(xié)調(diào)單元即可。這兩種處理器不是真正意義上的雙核處理器，只不過是向雙核處理器發(fā)展中的過渡產(chǎn)品。需要注意的是，無論是PentiumD還是PentiumEE，由于都必須依賴主板北橋芯片來負(fù)責(zé)兩個(gè)核心之間的協(xié)調(diào)工作，因此必須是特定的主板芯片組才能支持，如Intel公司的９４５P、９４５G、９４５PL、９４５GZ、９５５X、９７５X以及其他芯片組廠商的雙核芯片組。2022/12/26上海交通大學(xué)21PentiumD和P212022/12/26上海交通大學(xué)222.CoreDuo

２００６年初發(fā)布的CoreDuo與PentiumD和PentiumEE所采用的基于獨(dú)立緩存的松散型雙核處理器耦合方案完全不同，CoreDuo采用的是基于共享緩存的緊密型雙核處理器耦合方案，其最重要的特征是拋棄了兩個(gè)核心分別具有獨(dú)立的二級緩存的方案，改為采用與IBM公司的多核處理器類似的兩個(gè)核心共享二級緩存的方案。與獨(dú)立的二級緩存相比，共享的二級緩存具有如下優(yōu)勢：2022/12/26上海交通大學(xué)222.CoreDuo222022/12/26上海交通大學(xué)23CoreDuo①二級緩存的全部資源可以被任何一個(gè)核心訪問，當(dāng)二級緩存的數(shù)據(jù)更新之后，兩個(gè)核心并不需要作緩存數(shù)據(jù)同步的工作，工作量相對減少了，而且極大地降低了緩存數(shù)據(jù)延遲問題，這有利于處理器性能的提升。②PentiumD和PentiumEE處理器的每個(gè)核心的二級緩存資源都是固定不變的，而CoreDuo處理器的任何一個(gè)核心都可以根據(jù)工作量的大小來決定占用多少二級緩存資源，利用效率相對于獨(dú)立的二級緩存得到了極大的提高。2022/12/26上海交通大學(xué)23CoreDuo①二級232022/12/26上海交通大學(xué)24CoreDuo

③有利于降低處理器的功耗?？梢园褍蓚€(gè)核心分為“冷核”和“熱核”模式，在工作量較大時(shí)兩個(gè)核心都全速運(yùn)行，而在工作量較小時(shí)則可以讓“冷核”關(guān)閉，進(jìn)入休眠模式，而繼續(xù)運(yùn)行的“熱核”則可以占有全部的二級緩存資源，相比之下，獨(dú)立式緩存就只剩下一半的二級緩存資源可用了。2022/12/26上海交通大學(xué)24CoreDuo242022/12/26上海交通大學(xué)25CoreDuo

CoreDuo采用SmartCache共享緩存技術(shù)在兩個(gè)核心之間作協(xié)調(diào)。在CoreDuo處理器內(nèi)部，兩個(gè)核心通過SBR（ShareBusRouter，共享資源協(xié)調(diào)器）共享二級緩存資源，當(dāng)其中一個(gè)核心運(yùn)算完畢并將結(jié)果存放到二級緩存中后，另一個(gè)核心就可以通過SBR讀取這些數(shù)據(jù)，不但有效解決了二級緩存資源爭奪的問題，與前兩種類型相比，也不必對緩存資源作頻繁的同步化操作，而且比起Intel自己早先采用的第一種類型需要通過主板北橋芯片迂回的方法相比，不但大幅度降低了緩存數(shù)據(jù)的延遲，而且還不必占用前端總線資源。2022/12/26上海交通大學(xué)25CoreDuoCor252022/12/26上海交通大學(xué)26CoreDuo另外，SBR還具有BandwidthAdaptation（帶寬適應(yīng)）功能，可以對兩個(gè)核心共享前端總線資源進(jìn)行統(tǒng)一管理和協(xié)調(diào)，改善了兩個(gè)核心共享前端總線的效率，減少了不必要的延遲，而且有效避免了兩個(gè)核心之間的沖突。

SmartCache共享緩存技術(shù)是行之有效的雙核處理器的高效解決方案，借助于SmartCache共享緩存技術(shù)，CoreDuo也體現(xiàn)出了強(qiáng)大的性能，這才是嚴(yán)格意義上的真正的雙核處理器。SmartCache共享緩存技術(shù)將被應(yīng)用到Intel公司今后所有的雙核處理器中。2022/12/26上海交通大學(xué)26CoreDuo另外，S262022/12/26上海交通大學(xué)27CoreDuo

雖然共享的二級緩存具有極大的優(yōu)勢，但其技術(shù)要比獨(dú)立的二級緩存復(fù)雜得多，所以在早期Intel公司推出的雙核處理器只有CoreDuo才采用了這一方案。CoreDuo中用于臺(tái)式機(jī)的主要是T系列的T２３００（１。６６GHz）、T２４００（１。８３GHz）、T２５００（２。０GHz）和T２６００（２。１６GHz），都基于６５nm制造工藝的Yonah核心，采用６６７MHzFSB、２MB共享式二級緩存、改良了的新版Socket４７８接口（與以前臺(tái)式機(jī)的Socket４７８并不兼容），都支持硬件防病毒技術(shù)EDB、節(jié)能省電技術(shù)EIST以及虛擬化技術(shù)IntelVT，但不支持６４位技術(shù)，僅僅只是３２位的處理器。與臺(tái)式機(jī)CoreDuo搭配的主要是Intel９４５GT芯片組，原用于筆記本式計(jì)算機(jī)的Intel９４５GM、９４５PM、９４５GMS也能支持CoreDuo。

2022/12/26上海交通大學(xué)27CoreDuo雖然共272022/12/26上海交通大學(xué)28圖１５-１CoreDuo2022/12/26上海交通大學(xué)28圖１５-１Core282022/12/26上海交通大學(xué)293.幾點(diǎn)說明

１）雙核技術(shù)與超線程技術(shù)的區(qū)別其實(shí)，可以簡單地把雙核技術(shù)理解為兩個(gè)“物理”處理器，是一種“硬”的方式；

而超線程技術(shù)只是兩個(gè)“邏輯”處理器，

是一種“軟”的方式。2022/12/26上海交通大學(xué)293.幾點(diǎn)說明１）雙核292022/12/26上海交通大學(xué)30雙核技術(shù)與超線程技術(shù)的區(qū)別

從原理上來說，超線程技術(shù)屬于Intel版本的多線程技術(shù)。這種技術(shù)可以讓單CPU擁有處理多線程的能力，而物理上只使用一個(gè)處理器。超線程技術(shù)為每個(gè)物理處理器設(shè)置了兩個(gè)入口——AS（ArchitectureState，架構(gòu)狀態(tài)）接口，從而使操作系統(tǒng)等軟件將其識別為兩個(gè)邏輯處理器。這兩個(gè)邏輯處理器像傳統(tǒng)處理器一樣，都有獨(dú)立的IA32架構(gòu)，它們可以分別進(jìn)入暫停和中斷狀態(tài)，或直接執(zhí)行特殊線程，并且每個(gè)邏輯處理器都擁有APIC（AdvancedProgrammableInterruptController，高級可編程中斷控制器）2022/12/26上海交通大學(xué)30雙核技術(shù)與超線程技術(shù)的區(qū)302022/12/26上海交通大學(xué)31圖１５-２PentiumD、PentiumEE2022/12/26上海交通大學(xué)31圖１５-２Penti312022/12/26上海交通大學(xué)32雙核技術(shù)與超線程技術(shù)的區(qū)別雖然支持超線程的Pentium４能同時(shí)執(zhí)行兩個(gè)線程，但不同于傳統(tǒng)的雙處理器平臺(tái)或雙核處理器，超線程中的兩個(gè)邏輯處理器并沒有獨(dú)立的執(zhí)行單元、整數(shù)單元、寄存器、緩存等資源。它們在運(yùn)行過程中仍需要共用執(zhí)行單元、緩存和系統(tǒng)總線接口。在執(zhí)行多線程時(shí)兩個(gè)邏輯處理器均是交替工作，如果兩個(gè)線程同時(shí)需要某一個(gè)資源，其中一個(gè)要暫停并讓出資源，等待直到那些資源閑置時(shí)才能繼續(xù)。因此，超線程技術(shù)所帶來的性能提升遠(yuǎn)不能等同于兩個(gè)相同時(shí)鐘頻率處理器帶來的性能提升。可以說Intel的超線程技術(shù)僅可以看做是對單個(gè)處理器運(yùn)算資源的優(yōu)化利用。2022/12/26上海交通大學(xué)32雙核技術(shù)與超線程技術(shù)的區(qū)322022/12/26上海交通大學(xué)33雙核技術(shù)與超線程技術(shù)的區(qū)別雙核技術(shù)則是通過“硬”的物理核心實(shí)現(xiàn)多線程工作：每個(gè)核心擁有獨(dú)立的指令集、執(zhí)行單元，與超線程中所采用的模擬共享機(jī)制完全不一樣。在操作系統(tǒng)看來，它是實(shí)實(shí)在在的雙處理器，可以同時(shí)執(zhí)行多項(xiàng)任務(wù)，能讓處理器資源真正實(shí)現(xiàn)并行處理模式，其效率和性能提升比超線程技術(shù)要高得多。2022/12/26上海交通大學(xué)33雙核技術(shù)與超線程技術(shù)的區(qū)332022/12/26上海交通大學(xué)34２）雙核處理器的適用范圍

目前，WindowsXP專業(yè)版等操作系統(tǒng)支持雙物理核心和四個(gè)邏輯核心，但這并不意味著所有軟件對此都有優(yōu)化。事實(shí)上大量的測試已經(jīng)證明，無論是Intel還是AMD的雙核處理器，相對于其各自的同頻率的單核處理器而言，對于普通應(yīng)用，例如多媒體軟件、游戲和辦公軟件等，都沒有任何性能提升，甚至可能還稍有降低，因?yàn)檫@些普通應(yīng)用目前都還只是單線程程序，在處理器執(zhí)行指令時(shí)實(shí)際上只有一個(gè)核心在工作，而另一個(gè)核心則處于空閑狀態(tài)。2022/12/26上海交通大學(xué)34２）雙核處理器的適用范342022/12/26上海交通大學(xué)35雙核處理器的適用范圍

所以對普通用戶而言，只要日常應(yīng)用的程序仍然是單線程，雙核處理器實(shí)際上沒有任何意義，反而還增大了購買成本。除非經(jīng)常執(zhí)行大運(yùn)算量的多任務(wù)處理，例如，在游戲的同時(shí)進(jìn)行音視頻處理等，這時(shí)雙核處理器才能真正發(fā)揮作用。2022/12/26上海交通大學(xué)35雙核處理器的適用范圍所352022/12/26上海交通大學(xué)36雙核處理器的適用范圍

目前最適合雙核處理器發(fā)揮威力的平臺(tái)是服務(wù)器和工作站，這是因?yàn)槠浣?jīng)常進(jìn)行多任務(wù)處理，而且日常運(yùn)行的大量程序都是多線程程序，例如，圖形工作站所使用的AdobePhotoshop和３DMAX等都是多線程程序。一般來說，在執(zhí)行多任務(wù)處理和多線程程序時(shí)，雙核處理器的性能比同頻率的單核處理器的性能要高大約５０％～７０％，甚至在某些應(yīng)用下性能幾乎能提升１００％。當(dāng)然，隨著雙核處理器的強(qiáng)勢推出和逐漸普及，日后支持多線程的普通應(yīng)用程序也會(huì)逐漸增多，對普通用戶而言，那時(shí)雙核處理器才會(huì)真正發(fā)揮作用。2022/12/26上海交通大學(xué)36雙核處理器的適用范圍目362022/12/26上海交通大學(xué)3715.3

Core微架構(gòu)從CPU核心架構(gòu)的發(fā)展可見，NetBurst架構(gòu)已經(jīng)無法滿足未來CPU發(fā)展的需要，必須開辟全新的CPU核心架構(gòu)。事實(shí)上，Intel公司在迅馳Ⅲ中的Yonah移動(dòng)處理器已經(jīng)具備Core微架構(gòu)的技術(shù)精髓。Intel公司于２００６年上半年正式公布了全新的Core微架構(gòu)（CoreMicro‐Architecture）。Core微架構(gòu)建立在雙核心的基礎(chǔ)上。按應(yīng)用的不同，臺(tái)式機(jī)使用Conroe，筆記本式計(jì)算機(jī)使用Merom，服務(wù)器使用WoodCrest，這三款處理器全部基于Core微架構(gòu)。2022/12/26上海交通大學(xué)3715.3Core微372022/12/26上海交通大學(xué)38Core微架構(gòu)的特點(diǎn)

1.流水線效率大幅度提升

Core微架構(gòu)改變了主頻至上的研發(fā)思路，將超流水線縮短到１４級，大幅度提升了整體效率，避免CPU出現(xiàn)“高頻低能”的現(xiàn)象。更值得關(guān)注的是，Core微架構(gòu)采用了四組指令編譯器，這與PentiumM處理器有些類似。所謂四組指令編譯器，就是指能夠在單一頻率周期內(nèi)編譯４個(gè)X８６指令。這四組指令編譯器由三組簡單編譯器（SimplDecoder）與一組復(fù)雜編譯器（ComplexDecoder）組成。其中，只有復(fù)雜編譯器能處理最多由４個(gè)微指令所組成的復(fù)雜X８６指令。若遇到非常復(fù)雜的指令，則復(fù)雜編譯器必須呼叫微碼循序器（MicrocodeSequencer），以取得微指令序列。2022/12/26上海交通大學(xué)38Core微架構(gòu)的特點(diǎn)382022/12/26上海交通大學(xué)39Core微架構(gòu)的特點(diǎn)為了配合超寬的編譯單元，Core微架構(gòu)的指令讀取單元在一個(gè)頻率周期內(nèi)，從第一階指令快取中，抓?。秱€(gè)X８６指令到指令編譯緩沖區(qū)———

指令隊(duì)列（InstructionQueue），判定是否有符合宏指令融合的配對，然后再將最多５個(gè)X８６指令分派給四組指令編譯器。四組指令編譯器在每個(gè)頻率周期中，發(fā)給保留站（ReservationStation）４個(gè)編譯后的微指令，保留站再將存放的微指令分派（Dispatch）給５個(gè)執(zhí)行單元。由于高主頻對于四組精簡結(jié)構(gòu)有著很大的依賴性，同時(shí)其他輔助性技術(shù)也能在很大程度上彌補(bǔ)解決定址模式混亂的難題。Core微架構(gòu)采用四組指令編譯器的設(shè)計(jì)將會(huì)使CPU的整體性能有大幅度的提升。2022/12/26上海交通大學(xué)39Core微架構(gòu)的特點(diǎn)為392022/12/26上海交通大學(xué)402.全新的整數(shù)與浮點(diǎn)單元

從P６到NetBurst架構(gòu)，整數(shù)與浮點(diǎn)單元的變化是相當(dāng)明顯的，Core微架構(gòu)對此也作了不小的改變，只是部分關(guān)鍵技術(shù)又改回P６架構(gòu)時(shí)代的設(shè)計(jì)。Core微架構(gòu)具備了３個(gè)６４位的整數(shù)執(zhí)行單元，每一個(gè)都可以單獨(dú)完成６４位整數(shù)運(yùn)算操作，這樣，Core微架構(gòu)有了一套６４位的復(fù)雜整數(shù)單元（和P６核心的CIU（ComplexIntegerUnit）相同）及兩個(gè)簡單整數(shù)單元，以用來處理基本的操作和運(yùn)算任務(wù)。特別是，３個(gè)６４位的整數(shù)執(zhí)行單元中的一個(gè)簡單整數(shù)單元和分支執(zhí)行單元將會(huì)共享端口。該端口處的簡單整數(shù)單元將和分支單元共同完成此處的宏指令結(jié)合的任務(wù)。2022/12/26上海交通大學(xué)402.全新的整數(shù)與浮點(diǎn)單402022/12/26上海交通大學(xué)41Core微架構(gòu)的特點(diǎn)Core是IntelX８６處理器中第一個(gè)能夠獨(dú)立完成６４位整數(shù)運(yùn)算的處理器，這也讓Core微架構(gòu)得以走在同類CPU的前列。此外，６４位的整數(shù)單元使用彼此獨(dú)立的數(shù)據(jù)端口，因此Core能夠在一個(gè)周期內(nèi)同時(shí)完成３組６４位的整數(shù)運(yùn)算。極強(qiáng)的整數(shù)運(yùn)算單元使得Core微架構(gòu)在包括游戲、服務(wù)器項(xiàng)目、移動(dòng)等方面都能夠發(fā)揮廣泛而強(qiáng)大的作用。2022/12/26上海交通大學(xué)41Core微架構(gòu)的特點(diǎn)C412022/12/26上海交通大學(xué)42Core微架構(gòu)的特點(diǎn)Core微架構(gòu)對浮點(diǎn)單元進(jìn)行改進(jìn)。Core微架構(gòu)擁有２個(gè)浮點(diǎn)執(zhí)行單元以同時(shí)處理向量和標(biāo)量的浮點(diǎn)運(yùn)算，其中一個(gè)浮點(diǎn)單元負(fù)責(zé)執(zhí)行加減等簡單的處理，而另一個(gè)浮點(diǎn)單元?jiǎng)t負(fù)責(zé)執(zhí)行乘除等運(yùn)算。其改進(jìn)效果還是顯而易見的。在多項(xiàng)測試中，Conroe臺(tái)式機(jī)處理器性能優(yōu)于AMD高端的FX６２，使Core微架構(gòu)在３D游戲中有更好的表現(xiàn)。2022/12/26上海交通大學(xué)42Core微架構(gòu)的特點(diǎn)C422022/12/26上海交通大學(xué)433.數(shù)據(jù)預(yù)讀機(jī)制與緩存結(jié)構(gòu)

Core微架構(gòu)的預(yù)讀取機(jī)制有更多新特性數(shù)據(jù)預(yù)取單元經(jīng)常需要在緩存中進(jìn)行標(biāo)簽查找。為了避免標(biāo)簽查找可能帶來的高延遲，數(shù)據(jù)預(yù)取單元使用存儲(chǔ)接口進(jìn)行標(biāo)簽查找。存儲(chǔ)操作在大多數(shù)情況下并不是影響系統(tǒng)性能的關(guān)鍵，因?yàn)樵跀?shù)據(jù)開始寫入時(shí)，CPU即可以馬上開始進(jìn)行下面的工作，而不必等待寫入操作完成。緩存／內(nèi)存子系統(tǒng)會(huì)負(fù)責(zé)將數(shù)據(jù)整個(gè)寫入到緩存、復(fù)制到主內(nèi)存的過程。2022/12/26上海交通大學(xué)433.數(shù)據(jù)預(yù)讀機(jī)制與緩存432022/12/26上海交通大學(xué)44Core微架構(gòu)的特點(diǎn)

此外，Core微架構(gòu)使用了SmartMemoryAccess算法，這將幫助CPU在前端總線與內(nèi)存?zhèn)鬏斨g實(shí)現(xiàn)更高的效率。SmartMemoryAccess算法使用８個(gè)預(yù)取器，這種預(yù)取器可以利用推測算法將數(shù)據(jù)從內(nèi)存轉(zhuǎn)移到二級緩存，或者從二級緩存轉(zhuǎn)移到一級緩存，這對于提高內(nèi)存單元性能和緩存效率都是很有幫助的。2022/12/26上海交通大學(xué)44Core微架構(gòu)的特點(diǎn)442022/12/26上海交通大學(xué)45Core微架構(gòu)的特點(diǎn)

Core微架構(gòu)的緩存系統(tǒng)也有其特點(diǎn)。雙核Core微架構(gòu)的二級緩存容量高達(dá)４MB，且兩個(gè)核心共享，訪問延遲僅１２～１４個(gè)時(shí)鐘周期。每個(gè)核心還擁有３２KB的一級指令緩存和一級數(shù)據(jù)緩存，訪問延遲僅僅３個(gè)時(shí)鐘周期。從NetBurst架構(gòu)開始引入的追蹤式緩存（TraceCache）在Core微架構(gòu)中不再使用。NetBurst架構(gòu)中的追蹤式緩存的作用與常見的指令緩存相類似，用來存放解碼前的指令，對NetBurst架構(gòu)的長流水線結(jié)構(gòu)非常有用。而Core微架構(gòu)回歸相對較短的流水線之后，追蹤式緩存也隨之消失，因?yàn)閭鹘y(tǒng)的一級指令緩存對短流水線的Core微架構(gòu)更加有用。如今的緩存結(jié)構(gòu)還僅僅是Core微架構(gòu)的最低版本，隨著未來核心的改進(jìn)，緩存結(jié)構(gòu)只會(huì)變得越來強(qiáng)。2022/12/26上海交通大學(xué)45Core微架構(gòu)的特點(diǎn)452022/12/26上海交通大學(xué)464.真正的雙核處理器對于PC用戶而言，多任務(wù)處理一直是難題，因?yàn)閱翁幚砥鞯亩嗳蝿?wù)以分隔時(shí)間段的方式來實(shí)現(xiàn)，此時(shí)的性能損失相當(dāng)巨大。而在雙核處理器的支持下，真正的多任務(wù)得以應(yīng)用，而且越來越多的應(yīng)用程序甚至?xí)橹畠?yōu)化，進(jìn)而奠定扎實(shí)的應(yīng)用基礎(chǔ)。Intel公司早期規(guī)劃的雙核心處理器包括PentiumExtremeEdition和PentiumD等。但是這些雙核心芯片的實(shí)質(zhì)僅僅是封裝兩個(gè)獨(dú)立的核心，相互之間的數(shù)據(jù)傳輸還需要通過外部總線，這令效率大幅度降低。而Core微架構(gòu)設(shè)計(jì)的二級緩存并沒有分成兩個(gè)單獨(dú)的單元，而是兩個(gè)核心共享緩存。這一點(diǎn)非常重要，它說明Core并不是簡單地將兩個(gè)核心拼在一起。2022/12/26上海交通大學(xué)464.真正的雙核處理器462022/12/26上海交通大學(xué)47Core微架構(gòu)的特點(diǎn)Core微架構(gòu)的優(yōu)勢還包括降低功耗的IntelligentPowerCapability技術(shù)以及優(yōu)化多媒體性能的AdvancedDigitalMediaBoost技術(shù)。Core微架構(gòu)的設(shè)計(jì)理念在摒棄主頻至上策略之后，Intel終于回到體系結(jié)構(gòu)的正軌。此外，Core微架構(gòu)的Conroe臺(tái)式機(jī)處理器兼容Intel９７５芯片組，因此Intel的Core微架構(gòu)處理器的產(chǎn)品將會(huì)覆蓋更廣領(lǐng)域。2022/12/26上海交通大學(xué)47Core微架構(gòu)的特點(diǎn)C472022/12/26上海交通大學(xué)4815.4

Core2Duo／Quad／Extreme從２００６年第三季度開始，臺(tái)式機(jī)CoreDuo逐漸采用基于Core微架構(gòu)的Conroe核心，改用Socket７７５接口，主流型號的前端總線提高到１０６６MHzFSB，而ExtremeEdition加強(qiáng)版則進(jìn)一步提高到１３３３MHzFSB，并且將共享式二級緩存提高到４MB；只有部分低端型號才會(huì)繼續(xù)采用８００MHzFSB和２MB共享式二級緩存?；贑ore微架構(gòu)的Conroe核心的芯片即Core２Duo，它比原有的臺(tái)式機(jī)雙核心處理器（包括Yonah核心CoreDuo、PentiumD、PentiumEE、Athlon６４X２和Athlon６４FX）的性能有大幅度提升，而功耗則進(jìn)一步降低。2022/12/26上海交通大學(xué)4815.4Core2482022/12/26上海交通大學(xué)49Core2Duo／Quad／Extreme以前Intel公司針對桌面、移動(dòng)和服務(wù)器市場的處理器，是基于不同的架構(gòu)，而今，Intel公司第一次在所有平臺(tái)上使用了統(tǒng)一的構(gòu)架，即Core微架構(gòu)，Intel公司沿用奔騰系列的命名規(guī)則，將新系列“酷?！保–ore）芯片命名為Core２Duo，并推出了Core２Duo處理器。Conroe是Core處理器中的桌面平臺(tái)的統(tǒng)稱，移動(dòng)平臺(tái)稱為Merom，服務(wù)器平臺(tái)稱為Woodcrest。Conroe、Merom和Woodcrest都擁有６４位處理能力，是雙核產(chǎn)品。2022/12/26上海交通大學(xué)49Core2Duo／492022/12/26上海交通大學(xué)50有關(guān)Core２的幾點(diǎn)說明

①Core２Duo改變了以Pentium命名處理器的傳統(tǒng)，以后不會(huì)再有奔騰５、奔騰６等。

②借助SMARTCache和高動(dòng)態(tài)執(zhí)行等技術(shù)，Core２Duo和Core２Extreme的速度大大提高，比PentiumEE和AMDFX６２都快得多。③Intel公司第一次在所有平臺(tái)上使用了統(tǒng)一的構(gòu)架：無論是Conroe（桌面）、Merom（筆記本式計(jì)機(jī)），還是Woodcrest（服務(wù)器），都采用了Core微構(gòu)架，擁有６４位處理能力，而且它們都是雙核的。

2022/12/26上海交通大學(xué)50有關(guān)Core２的幾點(diǎn)502022/12/26上海交通大學(xué)51幾點(diǎn)說明④所有的Core微構(gòu)架的處理器都將擁有更強(qiáng)的處理性能和更低的功耗，筆記本式計(jì)算機(jī)的電池使用時(shí)間將延長，桌面機(jī)器和工作站將變得輕巧，狹窄空間內(nèi)的散熱問題也將得到緩解。⑤因?yàn)楣牡慕档停L(fēng)扇馬力減小，使工作環(huán)境更安靜。⑥Core２Duo沿用了PentiumD和PentiumEE上的LGA７７５接口（需要BIOS或軟件升級），系統(tǒng)升級方便、快捷，甚至不需要購買任何零件。2022/12/26上海交通大學(xué)51幾點(diǎn)說明④所有的Cor512022/12/26上海交通大學(xué)52幾點(diǎn)說明⑦多任務(wù)處理達(dá)到新的高度，依托雙核系統(tǒng)的強(qiáng)勁性能，虛擬技術(shù)可以將一臺(tái)計(jì)算機(jī)當(dāng)做幾臺(tái)虛擬的計(jì)算機(jī)來用，同時(shí)運(yùn)行不同的操作系統(tǒng)，例如，可以同時(shí)運(yùn)行FTP服務(wù)和Web服務(wù)，還可以打開一個(gè)數(shù)據(jù)庫，與此同時(shí)還能玩游戲或上網(wǎng)沖浪。與現(xiàn)有虛擬軟件不同的是，這種虛擬是完全硬件層次上的。⑧Core２Duo上都將有TPM安全保護(hù)，將從硬件層次上維護(hù)用戶的密碼、數(shù)據(jù)、登錄等信息的安全。2022/12/26上海交通大學(xué)52幾點(diǎn)說明⑦多任務(wù)處522022/12/26上海交通大學(xué)53幾點(diǎn)說明

⑨Conroe、Merom和Woodcrest等名稱并不是源于速度或性能，其實(shí)這些代表了開發(fā)部門所在地的名稱，Conroe位于美國得克薩斯州，Woodcrest位于美國加利福尼亞州，而Merom則是以色列一個(gè)古老的湖泊的名字。2022/12/26上海交通大學(xué)53幾點(diǎn)說明⑨Conro532022/12/26上海交通大學(xué)541.Core２Duo（“酷睿２雙核”）

由前述可知，Conroe是Core處理器中的桌面平臺(tái)的統(tǒng)稱，移動(dòng)平臺(tái)稱為Merom，服務(wù)器平臺(tái)Woodcrest。Conroe、Merom和Woodcrest都擁有６４位處理能力，并且是雙核產(chǎn)品。Merom比Conroe能耗更低，但在其他性能上兩者非常類似。2022/12/26上海交通大學(xué)541.Core２Du542022/12/26上海交通大學(xué)55Core２DuoMerom是Intel公司基于Core２架構(gòu)的第一個(gè)移動(dòng)版本處理器，正式發(fā)布于２００６年７月２７日。Merom是Intel公司的一線移動(dòng)處理器，擁有同Conroe一樣強(qiáng)大的功能，但同時(shí)Intel公司也強(qiáng)調(diào)了其對于電能的低消耗會(huì)有助于延長筆記本式計(jì)算機(jī)電池的壽命。Intel公司強(qiáng)調(diào)在維持相同的電池壽命的基礎(chǔ)上，Merom將會(huì)比基于Yonah的CoreDuo的筆記本式計(jì)算機(jī)整體性能提升２０％。Merom將會(huì)成為Intel移動(dòng)處理器中第一個(gè)具備EM６４T擴(kuò)展技術(shù)的處理器。Intel公司強(qiáng)調(diào)只需要升級BIOS，第一版Merom兼容CoreDuo的平臺(tái)。擁有一樣的熱封裝以及相同的６６７MHz的總線頻率。2022/12/26上海交通大學(xué)55Core２DuoMe552022/12/26上海交通大學(xué)56Core２DuoMerom處理器共有兩個(gè)版本，被標(biāo)稱為“

T５x００”為２MB二級緩存版本，“

T７x００”則為４MB二級緩存版本。其中，T５５００時(shí)鐘頻率為1.６６GHz，T５６００時(shí)鐘頻率為１.８３GHz，T７２００時(shí)鐘頻率為２.０GHz，T７４００時(shí)鐘頻率為２.１６GHz，T７６００時(shí)鐘頻率為２.３３GHz。2022/12/26上海交通大學(xué)56Core２DuoMe562022/12/26上海交通大學(xué)572.Core２Quad

Penryn是Core架構(gòu)中的四核處理器,Core２Quad的Penryn可以說是個(gè)縮小版的Merom。在改用４５nm制程后，更進(jìn)一步地增加運(yùn)算速率和更省電。2022/12/26上海交通大學(xué)572.Core２Q572022/12/26上海交通大學(xué)58Core２Extreme

（“酷睿２至尊版”）

Core２Extreme是Conroe系列的至尊版處理器，它與Core２Duo處理器所不同的是，它的倍頻并沒有鎖死，在Intel公司的原裝９７５XBX主板上，能實(shí)現(xiàn)倍頻的向上調(diào)整，也就是說，Core２Extreme處理器的倍頻在一定程度上是開放的，任由用戶調(diào)整。2022/12/26上海交通大學(xué)58Core２Extre582022/12/26上海交通大學(xué)59Core２Extreme

Core２ExtremeX６８００２.９３GHz、Core２DuoE６７００２.６７GHz、E６６００２.４０GHz、E６４００２.１３GHz、E６３００１.８６GHz、E４３００１.８Ghz，前五款處理器FSB均為１０６６MHz；在二級緩存方面，X６８００、E６７００、E６６００是４MB，而E６４００和E６３００擁有２MB二級緩存；全部采用LGA７７５封裝，支持VT虛擬化技術(shù)和EIST省電技術(shù)。２００７年１月２１日推出主頻提升至１.８GHz的E４３００，二級緩存為2MB，前端總線為８００MHz，不支持虛擬化技術(shù)。另外，除了X６８００功耗為７５W之外，余下的Conroe功耗均只有６５W。核心尺寸為１４３mm２，集成了２億９１００萬個(gè)晶體管。2022/12/26上海交通大學(xué)59Core２Extre592022/12/26上海交通大學(xué)60Core２Extreme

Intel公司在２００８年第四季度發(fā)布Core２DuoE７０００系列雙核心處理器的第二款型號E７４００，取代現(xiàn)有的E７２００。除了主頻從２.５３GHz提升到２.８３GHz，７４００的規(guī)格與E７２００完全一致，例如４５nmPenrynWofldale核心、３MB二級緩存、１０６６MHz前端總線、６５W熱設(shè)計(jì)功耗等。2022/12/26上海交通大學(xué)60Core２Extre602022/12/26上海交通大學(xué)6115.5

IntelNehalem架構(gòu)

Corei7處理器1.Corei７處理器２００８年Intel公司宣布正式確認(rèn)，基于全新Nehalem架構(gòu)的下一代桌面處理器將沿用“Core”（酷睿）名稱，命名為IntelCorei７系列，至尊版的名稱是IntelCorei７Extreme系列。而同架構(gòu)服務(wù)器處理器將繼續(xù)延用“Xeon”名稱。２００８年１１月１８日正式發(fā)布三款I(lǐng)ntelCorei７處理器，頻率分別為３.２GHz、２.９３GHz和２.６６GHz，主頻為３.２GHz的屬于IntelCorei７Extreme，這款頂級處理器面向的是發(fā)燒級用戶，而頻率較低的２暢６６GHz面向的是普通消費(fèi)者。2022/12/26上海交通大學(xué)6115.5Intel612022/12/26上海交通大學(xué)621.Corei７處理器

Corei７就是此前Intel公司一直力推的Nehalem處理器。早在２００６年，在推出Core２處理器時(shí)，Intel公司就宣布了每年更新CPU的Tick‐Tock計(jì)劃。Tick代表CPU制作工藝上的改進(jìn)，而Tock則代表CPU架構(gòu)上的更新。對于Corei７處理器來說，比較關(guān)鍵的技術(shù)應(yīng)用包括原生４核心甚至原生８核心處理器設(shè)計(jì)，采用全新QPI總線，處理器擁有８MB三級緩存，支持第二代超線程技術(shù)———

處理器能以８線程運(yùn)行。TurboMode內(nèi)核加速，集成了內(nèi)存控制器，支持三通道DDR３內(nèi)存，有LGA１３６６接口（針腳設(shè)計(jì)）等。同頻下Corei７比Core２Quad性能要高出很多。相比Core２，在功耗不變的前提下，Corei７處理器使視頻編輯、大型游戲和其他流行的互聯(lián)網(wǎng)及計(jì)算機(jī)應(yīng)用的速度可提升３０％～４０％。2022/12/26上海交通大學(xué)621.Corei７622022/12/26上海交通大學(xué)63Corei７處理器

Corei７處理器的基本特性如下。

１）原生４核心＋全新緩存設(shè)計(jì)

Core２Quad系列四核處理器其實(shí)是把兩個(gè)Core２Duo處理器封裝在一起，并非原生的４核心設(shè)計(jì)，通過狹窄的前端總線FSB來通信，其缺點(diǎn)是數(shù)據(jù)延遲問題比較嚴(yán)重，性能并不盡如人意。Corei７則采用原生４核設(shè)計(jì)，使用先進(jìn)的QPI（QuickPathInterconnect，快速通路互連）總線進(jìn)行通信，傳輸速度是FSB的５倍。緩存方面也采用了三級內(nèi)含式Cache設(shè)計(jì)，L１的設(shè)計(jì)和Core微架構(gòu)一樣；L２采用超低延遲的設(shè)計(jì)，每個(gè)內(nèi)核為２５６KB（共２５６×４KB）；L３采用共享式設(shè)計(jì)，被片上所有內(nèi)核共享，容量為８MB。2022/12/26上海交通大學(xué)63Corei７處理器632022/12/26上海交通大學(xué)64２）采用全新QPI總線

Corei７的Nehalem架構(gòu)最大的改進(jìn)是在前端總線（FSB）上，傳統(tǒng)的并行傳輸方式被徹底廢棄，轉(zhuǎn)而采用基于PCIExpress串行點(diǎn)對點(diǎn)傳輸技術(shù)的通用系統(tǒng)接口（CommonSystemInterface，CSI），被Intel公司稱為QuickPath

。QuickPath的傳輸速率為６.４Gbps，這樣一條３２b的QuickPath帶寬就能達(dá)到２５.６GBps。QuickPath的傳輸速率是１３３３MHz的FSB的５倍，前者雖然數(shù)據(jù)位寬較窄，但傳輸帶寬仍然是后者的２.５倍。它們分別用于雙處理器平臺(tái)和單處理平臺(tái)。2022/12/26上海交通大學(xué)64２）采用全新QPI總642022/12/26上海交通大學(xué)65基本特性目前桌面級CPU的QPI總線為１條，服務(wù)器級別的Nehalem處理器則會(huì)配備２條甚至４條QPI總線。2022/12/26上海交通大學(xué)65基本特性目前桌面級CPU652022/12/26上海交通大學(xué)66基本特性QPI總線能夠有效地提高系統(tǒng)性能。QPI總線可以將處理器的每個(gè)核心分隔為獨(dú)立的小塊，每個(gè)核心之間也可以通過QPI總線進(jìn)行連接。其實(shí)它和AMDHyperTransport技術(shù)類似，也是一種點(diǎn)對點(diǎn)總線，同樣具有非常高的帶寬。第一批Nehalem處理器使用了２０b的連接位寬，Corei７Extreme９６５的QPI總線數(shù)據(jù)傳輸率為６.４GTps，處理器和北橋之間的帶寬單向?yàn)椋保?８GBps，雙向?yàn)椋玻?６GBps；Corei７９４０／９２０的速度為４.８GTps，單向?yàn)椋?６GBps，雙向?yàn)椋保?２GBps。而FSB技術(shù)在１３３３MHz下，帶寬不過１０.６GBps，只有Corei７９４０／９２０的一半。2022/12/26上海交通大學(xué)66基本特性QPI總線能夠662022/12/26上海交通大學(xué)67３）集成內(nèi)存控制器

在Corei７中擁有集成內(nèi)存控制器（IntegratedMemoryController，IMC），可以支持三通道的DDR３內(nèi)存，運(yùn)行在DDR３１３３３，內(nèi)存位寬從１２８位提升到１９２位，這樣總共的峰值帶寬就可以達(dá)到３２GBps，是Core２的２～４倍。處理器采用了集成內(nèi)存控制器后，就能直接與物理存儲(chǔ)器陣列相連接，從而極大程度地減少了內(nèi)存延遲的現(xiàn)象。2022/12/26上海交通大學(xué)67３）集成內(nèi)存控制器672022/12/26上海交通大學(xué)68基本特性

Corei７將內(nèi)存控制器整合到了內(nèi)部，而不再由北橋芯片控制，支持三通道DDR３內(nèi)存規(guī)格，徹底拋棄DDR２。通過內(nèi)存控制器的設(shè)計(jì)，Nehalem處理器達(dá)到了酷睿２處理器的４倍內(nèi)存帶寬，使得每個(gè)核心可以支持最大１０個(gè)未解決的數(shù)據(jù)緩存命中失敗和總共１６個(gè)命中失敗，比酷睿２的單核心８個(gè)未解決的數(shù)據(jù)緩存命中失敗和總共１４個(gè)命中失敗提高了不少。Corei７內(nèi)存控制器能直接與物理存儲(chǔ)器陣列相連接，從而極大程度地減少了內(nèi)存延遲的現(xiàn)象。早在２００３年，AMD公司在K８中就已經(jīng)集成了內(nèi)存控制器，大幅提升了內(nèi)存性能。2022/12/26上海交通大學(xué)68基本特性Corei７682022/12/26上海交通大學(xué)69基本特性而Intel公司即便是２００６年推出的Core２處理器，也沒有集成內(nèi)存控制器，所以在內(nèi)存性能上一直遜色于Athlon６４X２與Phenom。Intel公司在Corei７設(shè)計(jì)中集成了內(nèi)存控制器。其三通道內(nèi)存默認(rèn)運(yùn)行在DDR３１０６６，也可以很容易地運(yùn)行在DDR３１３３３，運(yùn)行在DDR３１３３３內(nèi)存的位寬從１２８位提升到１９２位，總峰值帶寬可以達(dá)到３２GBps，是Core２的２～４倍。用戶只要將三條DDR３內(nèi)存插入三條藍(lán)色的DIMM內(nèi)存插槽之中，就可以開啟三通道。同時(shí)，三通道內(nèi)存的支持對３２b系統(tǒng)的支持。2022/12/26上海交通大學(xué)69基本特性而Intel公692022/12/26上海交通大學(xué)70４）同步多線程技術(shù)

原生４核Corei７有８個(gè)邏輯內(nèi)核。超線程技術(shù)（Hyper‐Threading）最早出現(xiàn)在１３０nm的Pentium４上，超線程技術(shù)就是利用特殊的硬件指令，把兩個(gè)邏輯核心模擬成兩個(gè)物理芯片，讓單個(gè)處理器都能使用線程級并行計(jì)算，進(jìn)而兼容多線程操作系統(tǒng)和軟件，減少了CPU的閑置時(shí)間，提高了CPU的運(yùn)行效率。2022/12/26上海交通大學(xué)70４）同步多線程技術(shù)702022/12/26上海交通大學(xué)71基本特性超線程技術(shù)使得Pentium４單核CPU也擁有較出色的多任務(wù)性能，可能由于帶寬的緣故，實(shí)際帶來的性能提升并不明顯，因此后來的酷睿２處理器直接拋棄了超線程技術(shù)。而引入了QPI和集成內(nèi)存控制器之后的Corei７，帶來驚人的帶寬，不用再擔(dān)心傳輸帶寬所產(chǎn)生的瓶頸，所以重新啟用了超線程技術(shù)?，F(xiàn)在通過改進(jìn)后的超線程技術(shù)再次回歸到Corei７處理器上。2022/12/26上海交通大學(xué)71基本特性超線程技術(shù)使得P712022/12/26上海交通大學(xué)72基本特性超線程技術(shù)又稱為同步多線程技術(shù)（SimultaneousMult‐Threading，SMT），同步多線程是２way的，每核心可以同時(shí)執(zhí)行２個(gè)線程。對于執(zhí)行引擎來說，在多線程任務(wù)的情況下，就可以掩蓋單個(gè)線程的延遲。SMT的好處是只需要消耗很小的核心面積代價(jià)，就可以在多任務(wù)的情況下提供顯著的性能提升，比起完全再添加一個(gè)物理核心來說要?jiǎng)澦愕枚?。比起Pentium４的超線程技術(shù)（Hyper‐Threading），Corei７的優(yōu)勢是有更大的緩存和更大的內(nèi)存帶寬，這樣就更能夠有效地發(fā)揮多線程的作用。按照Intel公司的說法，Nehalem的SMT可以在增加很少能耗的情況下，讓性能提升２０％～３０％。2022/12/26上海交通大學(xué)72基本特性超線程技術(shù)又稱為722022/12/26上海交通大學(xué)73５）自動(dòng)超頻，核心加速

Corei７引入了全新的加速模式（TurboMode）。TurboMode，顧名思義，就是加速模式，它是基于Nehalem架構(gòu)的電源管理技術(shù)，通過分析當(dāng)前CPU的負(fù)載情況，智能地完全關(guān)閉一些暫時(shí)不用的核心，把能源留給正在使用的核心，并使其運(yùn)行在更高的頻率，進(jìn)一步提升性能；相反，需要多個(gè)核心時(shí)，動(dòng)態(tài)開啟相應(yīng)的核心，智能調(diào)整頻率。這樣，在不影響CPU的TDP情況下，能把核心工作頻率調(diào)得更高。2022/12/26上海交通大學(xué)73５）自動(dòng)超頻，核心加速732022/12/26上海交通大學(xué)74基本特性例如，如果游戲只用到一個(gè)核心，TurboMode就會(huì)把其他三個(gè)核心自動(dòng)關(guān)閉，把正在運(yùn)行游戲的那個(gè)核心的頻率提高，也就是自動(dòng)超頻，在不浪費(fèi)能源的情況下獲得更好的性能。在Core２時(shí)代，即使是運(yùn)行只支持單核的程序，其他核心仍會(huì)全速運(yùn)行，既得不到性能的提升，又造成了能源的浪費(fèi)。2022/12/26上海交通大學(xué)74基本特性例如，如果游戲只742022/12/26上海交通大學(xué)75基本特性TurboMode是一種基于Nehalem架構(gòu)的電源管理技術(shù)。在BIOS中，TurboMode是默認(rèn)開啟的，通過自動(dòng)調(diào)高CPU的倍頻提高性能。在Intel原廠X５８主板上，低負(fù)載時(shí)默認(rèn)調(diào)高１、２個(gè)倍頻。例如，Corei７９２０的默認(rèn)頻率為２暢６６GHz，在TurboBoost默認(rèn)開啟的情況下，運(yùn)行SuperPI是以單核２.８GHz來執(zhí)行，這樣單線程性能也會(huì)得到提升。2022/12/26上海交通大學(xué)75基本特性TurboMo752022/12/26上海交通大學(xué)76６）文本處理再提速和完整的SSE４

多媒體指令支持

SSE４.１＋SSE４.２組成完整的SSE４（StreamingSIMDExtensions４，流式單指令多數(shù)據(jù)流擴(kuò)展）指令集共包含５４條指令，其中的４７條指令已在４５nm的Core２上實(shí)現(xiàn)，稱為SSE４.１。SSE４.１指令的引入進(jìn)一步增強(qiáng)了CPU在視頻編碼／解碼、圖形處理以及游戲等多媒體應(yīng)用上的性能。其余的７條指令在Corei７中也得以實(shí)現(xiàn)，稱為SSE４.２。SSE４.２是對SSE４.１的補(bǔ)充，主要針對的是對XML文本的字符串操作、存儲(chǔ)校驗(yàn)CRC３２的處理等。2022/12/26上海交通大學(xué)76６）文本處理再提速和完762022/12/26上海交通大學(xué)77７）新的主板芯片組

Intel公司每發(fā)布一新系列CPU，都推出一新主板芯片組，由于Corei７封裝接口改成了LGA１３６６，為此也推出了新的主板芯片組X５８Express以及X５８系列主板。由于Bloomfield處理器上整合了支持三通道DDR３內(nèi)存的控制器，X５８芯片組的功能簡化了不少，最大的改進(jìn)點(diǎn)是提供了兩片PCIExpress２.０×１６顯卡，同時(shí)也可以拆分成４×８的配置。該芯片組采用傳統(tǒng)的南北橋設(shè)計(jì)，在北橋芯片與Corei７處理器之間，采用全新的QPI（QuickPathInterconnect）總線連接，帶寬高達(dá)２５.６GBps。南橋芯片并沒有重大更新，搭配了P４５時(shí)代ICH１０家族中的ICH１０R，并加入了AHCI，強(qiáng)化了喚醒、管理和安全功能。2022/12/26上海交通大學(xué)77７）新的主板芯片組772022/12/26上海交通大學(xué)78基本特性在顯卡支持方面，X５８Express芯片組支持PCIE２.０規(guī)范，并首次正式支持NVIDISLI／QuadSLI以及AMD的CrossFire／QuadCrossFire。目前ODM合作伙伴微星、華碩、技嘉、映泰、富士康、精英等都有X５８系列主板上市。與Intel原廠X５８主板所不同的是，這些大廠的X５８產(chǎn)品都通過NVIDIA授權(quán)加入了對SLI的支持2022/12/26上海交通大學(xué)78基本特性在顯卡支持方面，782022/12/26上海交通大學(xué)792.Corei５和Corei３２００９年年中Intel公司闡述了新的消費(fèi)級處理器品牌體系，并正式宣布了Corei５和Corei３兩個(gè)子品牌系列，還簡單介紹了它們的應(yīng)用范圍。

Corei５及Corei３處理器在架構(gòu)上有著極為明顯的差異性，具體如下：●Corei５核心為原生四核處理器，并不具備圖形處理能力，其研發(fā)代號為Lynnfield，采用了Nehalem架構(gòu)?！馛orei３處理器是一款雙核CPU，其內(nèi)置了圖形核心，具備了圖形處理能力。這款處理器的研發(fā)代號為Clarkdale，采用了Westmere架構(gòu)。2022/12/26上海交通大學(xué)792.Corei５792022/12/26上海交通大學(xué)80Corei５和Corei３

Intel公司公布的新處理器品牌體系———Corei７以及兩個(gè)子系列Corei５、Corei３，該新體系的幾個(gè)要點(diǎn)是：①以Core（酷睿）為核心，面向高、中、低端市場分別衍生出Corei７、Corei５、Corei３。②Core２Duo（酷睿２雙核）、Core２Quad（酷睿２四核）、Core２Extreme（酷睿２至尊版）將逐漸淡出，也預(yù)示著Core２時(shí)代的終結(jié)。③Pentium（奔騰）、Celeron（賽揚(yáng)）、Atom（凌動(dòng)）繼續(xù)存在，面向入門級桌面市場和上網(wǎng)筆記本式計(jì)算機(jī)、智能手機(jī)等移動(dòng)領(lǐng)域。④Centrino（迅馳）也還在，不過從２０１０年起市場定位有所變化，不再代表移動(dòng)處理器。2022/12/26上海交通大學(xué)80Corei５和Cor802022/12/26上海交通大學(xué)813.QPI總線

１）什么是QPI

Intel公司的QPI（QuickPathInterconnect）是一種快速通道互連技術(shù)。官方名字為CSI（CommonSystemInterface，公共系統(tǒng)界面），用來實(shí)現(xiàn)芯片之間的直接互連，而不是通過FSB連接到北橋，它是針對AMD的HT總線而提出的。無論是速度、每個(gè)針腳的帶寬、功耗等一切規(guī)格都要超越HT總線。2022/12/26上海交通大學(xué)813.QPI總線812022/12/26上海交通大學(xué)82２）QPI技術(shù)的特點(diǎn)

（１）帶寬更大

QPI最大的改進(jìn)是采用單條點(diǎn)對點(diǎn)模式，QPI的輸出傳輸能力非常驚人，在４.８～６.４GBps之間。一個(gè)連接的每個(gè)方向的位寬可以是５b、１０b、２０b。因此每一個(gè)方向的QPI全寬度連接可以提供１２～１６GBps的帶寬，那么每一個(gè)QPI連接的帶寬為２４～３２GBps。2022/12/26上海交通大學(xué)82２）QPI技術(shù)的特點(diǎn)822022/12/26上海交通大學(xué)83QPI總線

（２）效率更高

QPI的另一個(gè)亮點(diǎn)就是支持多條系統(tǒng)總線連接，Intel稱之為multi‐FSB

。系統(tǒng)總線將會(huì)被分成多條連接，并且頻率不再是單一固定的，也無須經(jīng)過FSB進(jìn)行連接。根據(jù)系統(tǒng)各個(gè)子系統(tǒng)對數(shù)據(jù)吞吐量的需求，每條系統(tǒng)總線的連接速度也可同，這種特性無疑要比AMD目前的Hypertransport總線更具彈性。2022/12/26上海交通大學(xué)83QPI總線（２）效832022/12/26上海交通大學(xué)84QPI總線

３）QPI與FSB的區(qū)別

前端總線（FrontSideBus，F(xiàn)SB）是將CPU連接到北橋芯片的系統(tǒng)總線，它是CPU和外界交換數(shù)據(jù)的主要通道。前端總線的數(shù)據(jù)傳輸能力對計(jì)算機(jī)整體性能影響很大，如果沒有足夠帶寬的前端總線，即使配備再強(qiáng)勁的CPU，用戶也不會(huì)感覺到計(jì)算機(jī)整體速度的明顯提升。2022/12/26上海交通大學(xué)84QPI總線３）QP842022/12/26上海交通大學(xué)85QPI總線

Intel處理器主流的前端總線頻率有８００MHz、１０６６MHz、１３３３MHz幾種，而在2007年11月，Intel公司再度將處理器的前端總線頻率提升至１６００MHz（默認(rèn)外頻４００MHz），比２００３年最高的８００MHzFSB總線頻率整整提升了一倍。當(dāng)前端總線為１３３３MHz時(shí)，處理器與北橋之間的帶寬為１０.６７GBps，而將前端總線提升到１６００MHz，帶寬就能達(dá)到１２.８GBps，增加了２０％。2022/12/26上海交通大學(xué)85QPI總線Intel852022/12/26上海交通大學(xué)86QPI總線雖然Intel處理器的前端總線頻率看起來已經(jīng)很高，但與同時(shí)不斷提升的內(nèi)存頻率、高性能顯卡（特別是雙顯卡系統(tǒng)或多顯卡系統(tǒng)）相比，CPU與芯片組存在的前端總線瓶頸仍未根本改變。例如，１３３３MHz的FSB所提供的內(nèi)存帶寬是１３３３MHz×６４b／８＝１０６６７MBps＝１０.６７GBps，與雙通道的DDR２６６７內(nèi)存剛好匹配，但如果使用雙通道的DDR２８００、DDR２１０６６的內(nèi)存，這時(shí)FSB的帶寬就小于內(nèi)存的帶寬，更不用說和未來的三通道和更高頻率的DDR３內(nèi)存搭配了（Nehalem平臺(tái)三通道DDR３１３３３內(nèi)存的帶寬可達(dá)３２GBps）。

2022/12/26上海交通大學(xué)86QPI總線雖然Inte862022/12/26上海交通大學(xué)87QPI總線與AMD公司的HyperTransport（HT）總線技術(shù)相比，F(xiàn)SB的帶寬瓶頸也很明顯。HT作為AMDCPU上廣為應(yīng)用的一種端到端的總線技術(shù)，它可在內(nèi)存控制器、磁盤控制器以及PCI‐E總線控制器之間提供更高的數(shù)據(jù)傳輸帶寬。HT１.０在雙向３２b模式的總線帶寬為１２.８GBps，可匹敵目前最新的FSB帶寬。２００４年，AMD公司推出的HT２.０規(guī)格，最大帶寬又由HT１.０的１２.８GBps提高到了２２.４GBps。而最新的HT３.０又將工作頻率從HT２.０最高的１.４GHz提高到了２.６GHz，提升幅度幾乎又達(dá)到了一倍。2022/12/26上海交通大學(xué)87QPI總線與AMD公87QPI總線這樣，HT３.０在２.６GHz高頻率３２b高位寬運(yùn)行模式下，即可提供高達(dá)４１.６GBps的總線帶寬（即使在１６b的位寬下也能提供２０.８GBps的總線帶寬），相比FSB優(yōu)勢明顯，應(yīng)付未來兩年內(nèi)內(nèi)存、顯卡和處理器的升級需要也沒有問題。而將FSB頻率進(jìn)一步提高到２１３３MHz，也難以應(yīng)付未來DDR３內(nèi)存及多顯卡系統(tǒng)所帶來的帶寬需求。因此，推出新的總線技術(shù)勢在必行。

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

《微型計(jì)算機(jī)技術(shù)》教學(xué)課件-微機(jī)技術(shù)(3版)第15章版

文檔簡介

溫馨提示

最新文檔

評論

《微型計(jì)算機(jī)技術(shù)》教學(xué)課件-微機(jī)技術(shù)(3版)第15章版

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔