《微型計(jì)算機(jī)技術(shù)》教學(xué)課件-微機(jī)技術(shù)(3版)第15章版_第1頁
《微型計(jì)算機(jī)技術(shù)》教學(xué)課件-微機(jī)技術(shù)(3版)第15章版_第2頁
《微型計(jì)算機(jī)技術(shù)》教學(xué)課件-微機(jī)技術(shù)(3版)第15章版_第3頁
《微型計(jì)算機(jī)技術(shù)》教學(xué)課件-微機(jī)技術(shù)(3版)第15章版_第4頁
《微型計(jì)算機(jī)技術(shù)》教學(xué)課件-微機(jī)技術(shù)(3版)第15章版_第5頁
已閱讀5頁,還剩271頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

2022/12/26上海交通大學(xué)1面向21世紀(jì)課程教材普通高等教育“十一五”國家級規(guī)劃教材微型計(jì)算機(jī)技術(shù)WeixinɡJisuɑnjiJishu

(第3版)孫德文編著2022/12/26上海交通大學(xué)1面向21世紀(jì)課程教材微型12022/12/26上海交通大學(xué)2

第15章

多核芯片簡介2022/12/26上海交通大學(xué)2

第15章

多22022/12/26上海交通大學(xué)3多核芯片簡介

15.1多核處理器芯片概述

15.1.1多核處理器

15.1.2

CPU核心架構(gòu)的發(fā)展

15.2

Intel臺(tái)式機(jī)雙核處理器的早期產(chǎn)品

15.3

Core微架構(gòu)

15.4

Core2Duo/Quad/Extreme

15.5

IntelNehalem架構(gòu)Corei7處理器2022/12/26上海交通大學(xué)3多核芯片簡介15.132022/12/26上海交通大學(xué)4多核芯片簡介

64位微處理器和多核處理器是進(jìn)入21世紀(jì)后,微處理器硬件技術(shù)更新的兩個(gè)重點(diǎn),在14章介紹了3種64位微處理器的主要特性后,本章簡要介紹有關(guān)多核處理器的一些基本知識。2022/12/26上海交通大學(xué)4多核芯片簡介64位微處42022/12/26上海交通大學(xué)515.1多核處理器芯片概述

15.1.1多核處理器

15.1.2

CPU核心架構(gòu)的發(fā)展2022/12/26上海交通大學(xué)515.1多核處理器芯片52022/12/26上海交通大學(xué)615.1.1多核處理器

所謂多核處理器,簡而言之,是指在一塊CPU基板上集成多個(gè)處理器核心,并通過并行總線將各處理器核心連接起來。其中雙核只是CMP(ChipMult‐Processors,單芯片多處理器)中最基本、最簡單、最容易實(shí)現(xiàn)的一種類型。在RISC處理器領(lǐng)域,雙核甚至多核都早已經(jīng)實(shí)現(xiàn)。CMP最早是由美國斯坦福大學(xué)提出的,其思想是在一塊芯片內(nèi)實(shí)現(xiàn)SMP(SymmetricalMulti‐Processing,對稱多處理)架構(gòu),且并行執(zhí)行不同的進(jìn)程。2022/12/26上海交通大學(xué)615.1.1多核處理器62022/12/26上海交通大學(xué)7多核處理器在20世紀(jì)末,HP公司和IBM公司就已經(jīng)提出了雙核處理器的可行性設(shè)計(jì)。2001年IBM公司推出了基于雙核的POWER4處理器,隨后,Sun公司和HP公司先后推出了基于雙核架構(gòu)的UltraSPARC及PA‐RISC芯片,但當(dāng)時(shí)雙核處理器架構(gòu)都是在高端的RISC領(lǐng)域,直到2006年Intel公司和AMD公司相繼推出自己的雙核處理器,雙核才真正進(jìn)入主流的X86領(lǐng)域。Intel公司和AMD公司之所以推出雙核處理器,最重要的原因是原有的普通單核處理器的頻率難于提升,性能沒有質(zhì)的飛躍。2022/12/26上海交通大學(xué)7多核處理器在20世紀(jì)末,72022/12/26上海交通大學(xué)815.1.2

CPU核心架構(gòu)的發(fā)展

當(dāng)今CPU整體性能表現(xiàn)的關(guān)鍵因素已經(jīng)不僅僅是主頻的高低,也不是緩存技術(shù)的優(yōu)劣,而是核心架構(gòu)。優(yōu)秀的核心架構(gòu)能夠彌補(bǔ)主頻的不足,更能簡化緩存設(shè)計(jì)而降低成本,優(yōu)秀的核心架構(gòu)是優(yōu)秀處理器的根基。2022/12/26上海交通大學(xué)815.1.2CPU核82022/12/26上海交通大學(xué)9CPU核心架構(gòu)的發(fā)展1985年,Intel公司推出了Intel80386芯片,之后又出現(xiàn)了許多高性能的32位微處理器,如Intel80486、IntelPentium(奔騰)等。從20世紀(jì)90年代中期開始,32位微處理器芯片的發(fā)展進(jìn)入鼎盛時(shí)期。1995年11月Intel公司推出了含550萬個(gè)晶體管的PentiumPro(高能奔騰),2022/12/26上海交通大學(xué)9CPU核心架構(gòu)的發(fā)展1992022/12/26上海交通大學(xué)10CPU核心架構(gòu)的發(fā)展1997年1月推出了PentiumWithMMX(多能奔騰),簡稱MMX(MultiMediaeXtension,多媒體擴(kuò)展);1997年5月推出了帶有MMX指令集的PentiumPro———PentiumⅡ(PⅡ,奔騰Ⅱ)。1999年3月,推出了450/500MHzPentiumⅢ(PⅢ,奔騰Ⅲ)。2000年6月又推出了新型體系結(jié)構(gòu)(Architecture,又稱架構(gòu))的32位微處理器芯片Pentium4。2003年3月,Intel公司發(fā)布了以迅馳技術(shù)Banias為核心的PentiumM微處理器,用于移動(dòng)計(jì)算的筆記本式計(jì)算機(jī)。2022/12/26上海交通大學(xué)10CPU核心架構(gòu)的發(fā)展1102022/12/26上海交通大學(xué)11CPU核心架構(gòu)的發(fā)展從80486到PentiumM,IntelCPU的核心架構(gòu)經(jīng)歷了如下幾個(gè)階段:

①Intel公司在486芯片中開始使用流水線技術(shù)。在CPU中由5、6個(gè)不同功能的電路單元組成一條指令處理流水線,然后將一條X86指令分成5、6步后再由這些電路單元分別執(zhí)行,這樣就能實(shí)現(xiàn)在一個(gè)CPU時(shí)鐘周期內(nèi)完成一條指令,因而能提高CPU的運(yùn)算速度。2022/12/26上海交通大學(xué)11CPU核心架構(gòu)的發(fā)展從112022/12/26上海交通大學(xué)12CPU核心架構(gòu)的發(fā)展

②Pentium(奔騰)和PentiumWithMMX(多能奔騰)采用P5架構(gòu)。

P5架構(gòu)采用超標(biāo)量技術(shù),通過內(nèi)置多條流水線來同時(shí)執(zhí)行多個(gè)處理任務(wù),其實(shí)質(zhì)是以空間換取時(shí)間。經(jīng)典Pentium每條整數(shù)流水線都分為四級流水,即指令預(yù)取、譯碼、執(zhí)行、寫回結(jié)果,浮點(diǎn)流水又分為八級流水。2022/12/26上海交通大學(xué)12CPU核心架構(gòu)的發(fā)展122022/12/26上海交通大學(xué)13CPU核心架構(gòu)的發(fā)展

③PentiumPro(高能奔騰)和PentiumⅡ(PⅡ,奔騰Ⅱ)采用P6架構(gòu)。

P6架構(gòu)與Pentium的P5架構(gòu)的最大區(qū)別在于,以前集成在主板上的二級緩存被移植到了CPU內(nèi),從而大大地加快了數(shù)據(jù)讀取和命中率,提高了性能。P6架構(gòu)采用超標(biāo)量技術(shù)和超流水線技術(shù),超流水線通過細(xì)化流水、提高主頻,使得在一個(gè)機(jī)器周期內(nèi)完成一個(gè)甚至多個(gè)操作,其實(shí)質(zhì)是以時(shí)間換取空間。2022/12/26上海交通大學(xué)13CPU核心架構(gòu)的發(fā)展132022/12/26上海交通大學(xué)14CPU核心架構(gòu)的發(fā)展

④Pentium4(奔騰4)采用NetBurst架構(gòu)。對于全新的NetBurst結(jié)構(gòu)而言,發(fā)揮強(qiáng)大的性能需要更高的主頻以及強(qiáng)大的緩存結(jié)構(gòu),NetBurst架構(gòu)的Pentium4在提高流水線長度之后令執(zhí)行效率大幅度降低,此時(shí)大容量二級緩存與高主頻才是真正的彌補(bǔ)方法。NetBurst架構(gòu)過分依賴于主頻與緩存,為了提高主頻,Net‐Burst架構(gòu)不斷延長CPU超流水線的級數(shù)。2022/12/26上海交通大學(xué)14CPU核心架構(gòu)的發(fā)展142022/12/26上海交通大學(xué)15CPU核心架構(gòu)的發(fā)展起初Pentium4的超流水線就長達(dá)20級,隨后的Prescott更是提升到31級。超流水線設(shè)計(jì)的級數(shù)越長,其完成一條指令的速度越快,因此才能適應(yīng)工作主頻更高的CPU。但是超流水線過長也帶來了一定副作用,很可能會(huì)出現(xiàn)主頻較高的CPU實(shí)際運(yùn)算速度較低的現(xiàn)象,Intel公司的NetBurst架構(gòu)就出現(xiàn)了這種情況,雖然它的主頻可以很高,但其運(yùn)算性能卻遠(yuǎn)遠(yuǎn)比不上低主頻的AMD處理器。Intel公司不得不繼續(xù)提高主頻并且加大二級緩存容量。2022/12/26上海交通大學(xué)15CPU核心架構(gòu)的發(fā)展起152022/12/26上海交通大學(xué)16CPU核心架構(gòu)的發(fā)展如今處理器制作工藝開始面臨瓶頸,即便是65nm工藝,未來想要在NetBurst架構(gòu)實(shí)現(xiàn)高主頻也是極為困難的事情,這意味著NetBurst架構(gòu)今后將無法繼續(xù)憑借主頻優(yōu)勢來提高CPU的性能。此外,巨大的緩存容量也是一個(gè)負(fù)擔(dān),這不僅提高了成本,也令發(fā)熱量驟升。高發(fā)熱量和高功耗成為高頻Pentium的兩大弊病。2022/12/26上海交通大學(xué)16CPU核心架構(gòu)的發(fā)展如162022/12/26上海交通大學(xué)17CPU核心架構(gòu)的發(fā)展⑤PentiumM。在傳統(tǒng)模式下,Intel移動(dòng)處理器只是桌面處理器的低頻低電壓版本,然后加上一些節(jié)能技術(shù),但是第一代迅馳PentiumM卻走出了這一框架。第一代PentiumM(Banias)可以認(rèn)為僅僅是改良版的PentiumⅢM,通過超大容量的二級緩存以及更高的前端總線來提升性能,但是對于移動(dòng)用戶而言,看重的僅僅是性能與功耗。Banias的性能已經(jīng)幾乎與Pentium4并駕齊驅(qū),而功耗更是大幅度減小。2022/12/26上海交通大學(xué)17CPU核心架構(gòu)的發(fā)展⑤172022/12/26上海交通大學(xué)18CPU核心架構(gòu)的發(fā)展Banias核心的PentiumM一旦應(yīng)用到桌面平臺(tái)并大幅度超頻之后,其性能完全壓倒了Pentium4,隨后Dothan核心的PentiumM優(yōu)勢更為明顯,可以認(rèn)為PentiumM的核心架構(gòu)依然是P6,只不過結(jié)合了NetBurst架構(gòu)的前端總線技術(shù),通過減少原先P6微架構(gòu)下指令編譯后的微指令數(shù)目來改善指令編譯器及處理單元的效能,并且主頻和緩存都大幅度加強(qiáng)。PentiumM為IntelCPU新的內(nèi)核架構(gòu)做好了準(zhǔn)備。2022/12/26上海交通大學(xué)18CPU核心架構(gòu)的發(fā)展B182022/12/26上海交通大學(xué)1915.2

Intel臺(tái)式機(jī)雙核處理器的

早期產(chǎn)品早期Intel公司推出的臺(tái)式機(jī)雙核處理器有PentiumDPentiumEE(PentiumExtremeEdition)CoreDuo三種類型,三者的工作原理有很大不同。2022/12/26上海交通大學(xué)1915.2Intel192022/12/26上海交通大學(xué)201.PentiumD和PentiumEE

PentiumD和PentiumEE分別面向主流市場和高端市場,其每個(gè)核心采用獨(dú)立式緩存設(shè)計(jì),在處理器內(nèi)部兩個(gè)核心之間是互相隔離的,通過處理器外部(主板北橋芯片)的仲裁器負(fù)責(zé)兩個(gè)核心之間的任務(wù)分配以及緩存數(shù)據(jù)的同步等協(xié)調(diào)工作。兩個(gè)核心共享前端總線,并依靠前端總線在兩個(gè)核心之間傳輸緩存同步數(shù)據(jù)。從架構(gòu)上來看,這種類型是基于獨(dú)立緩存的松散型雙核處理器耦合方案,其優(yōu)點(diǎn)是技術(shù)簡單,只需要將兩個(gè)相同的處理器內(nèi)核封裝在同一塊基板上即可;缺點(diǎn)是數(shù)據(jù)延遲問題比較嚴(yán)重,性能并不盡如人意。另外,PentiumD和PentiumEE的最大區(qū)別就是,PentiumEE支持超線程技術(shù)而PentiumD則不支持,PentiumEE在打開超線程技術(shù)之后會(huì)被操作系統(tǒng)識別為4個(gè)邏輯處理器。2022/12/26上海交通大學(xué)201.PentiumD202022/12/26上海交通大學(xué)21PentiumD和PentiumEEIntel公司的PentiumD和PentiumEE是獨(dú)立式二級緩存,協(xié)調(diào)單元在CPU外部(依賴于主板),相對來說都比較簡單———

只需要為兩個(gè)核心添加一個(gè)協(xié)調(diào)單元即可。這兩種處理器不是真正意義上的雙核處理器,只不過是向雙核處理器發(fā)展中的過渡產(chǎn)品。需要注意的是,無論是PentiumD還是PentiumEE,由于都必須依賴主板北橋芯片來負(fù)責(zé)兩個(gè)核心之間的協(xié)調(diào)工作,因此必須是特定的主板芯片組才能支持,如Intel公司的945P、945G、945PL、945GZ、955X、975X以及其他芯片組廠商的雙核芯片組。2022/12/26上海交通大學(xué)21PentiumD和P212022/12/26上海交通大學(xué)222.CoreDuo

2006年初發(fā)布的CoreDuo與PentiumD和PentiumEE所采用的基于獨(dú)立緩存的松散型雙核處理器耦合方案完全不同,CoreDuo采用的是基于共享緩存的緊密型雙核處理器耦合方案,其最重要的特征是拋棄了兩個(gè)核心分別具有獨(dú)立的二級緩存的方案,改為采用與IBM公司的多核處理器類似的兩個(gè)核心共享二級緩存的方案。與獨(dú)立的二級緩存相比,共享的二級緩存具有如下優(yōu)勢:2022/12/26上海交通大學(xué)222.CoreDuo222022/12/26上海交通大學(xué)23CoreDuo①二級緩存的全部資源可以被任何一個(gè)核心訪問,當(dāng)二級緩存的數(shù)據(jù)更新之后,兩個(gè)核心并不需要作緩存數(shù)據(jù)同步的工作,工作量相對減少了,而且極大地降低了緩存數(shù)據(jù)延遲問題,這有利于處理器性能的提升。②PentiumD和PentiumEE處理器的每個(gè)核心的二級緩存資源都是固定不變的,而CoreDuo處理器的任何一個(gè)核心都可以根據(jù)工作量的大小來決定占用多少二級緩存資源,利用效率相對于獨(dú)立的二級緩存得到了極大的提高。2022/12/26上海交通大學(xué)23CoreDuo①二級232022/12/26上海交通大學(xué)24CoreDuo

③有利于降低處理器的功耗??梢园褍蓚€(gè)核心分為“冷核”和“熱核”模式,在工作量較大時(shí)兩個(gè)核心都全速運(yùn)行,而在工作量較小時(shí)則可以讓“冷核”關(guān)閉,進(jìn)入休眠模式,而繼續(xù)運(yùn)行的“熱核”則可以占有全部的二級緩存資源,相比之下,獨(dú)立式緩存就只剩下一半的二級緩存資源可用了。2022/12/26上海交通大學(xué)24CoreDuo242022/12/26上海交通大學(xué)25CoreDuo

CoreDuo采用SmartCache共享緩存技術(shù)在兩個(gè)核心之間作協(xié)調(diào)。在CoreDuo處理器內(nèi)部,兩個(gè)核心通過SBR(ShareBusRouter,共享資源協(xié)調(diào)器)共享二級緩存資源,當(dāng)其中一個(gè)核心運(yùn)算完畢并將結(jié)果存放到二級緩存中后,另一個(gè)核心就可以通過SBR讀取這些數(shù)據(jù),不但有效解決了二級緩存資源爭奪的問題,與前兩種類型相比,也不必對緩存資源作頻繁的同步化操作,而且比起Intel自己早先采用的第一種類型需要通過主板北橋芯片迂回的方法相比,不但大幅度降低了緩存數(shù)據(jù)的延遲,而且還不必占用前端總線資源。2022/12/26上海交通大學(xué)25CoreDuoCor252022/12/26上海交通大學(xué)26CoreDuo另外,SBR還具有BandwidthAdaptation(帶寬適應(yīng))功能,可以對兩個(gè)核心共享前端總線資源進(jìn)行統(tǒng)一管理和協(xié)調(diào),改善了兩個(gè)核心共享前端總線的效率,減少了不必要的延遲,而且有效避免了兩個(gè)核心之間的沖突。

SmartCache共享緩存技術(shù)是行之有效的雙核處理器的高效解決方案,借助于SmartCache共享緩存技術(shù),CoreDuo也體現(xiàn)出了強(qiáng)大的性能,這才是嚴(yán)格意義上的真正的雙核處理器。SmartCache共享緩存技術(shù)將被應(yīng)用到Intel公司今后所有的雙核處理器中。2022/12/26上海交通大學(xué)26CoreDuo另外,S262022/12/26上海交通大學(xué)27CoreDuo

雖然共享的二級緩存具有極大的優(yōu)勢,但其技術(shù)要比獨(dú)立的二級緩存復(fù)雜得多,所以在早期Intel公司推出的雙核處理器只有CoreDuo才采用了這一方案。CoreDuo中用于臺(tái)式機(jī)的主要是T系列的T2300(1。66GHz)、T2400(1。83GHz)、T2500(2。0GHz)和T2600(2。16GHz),都基于65nm制造工藝的Yonah核心,采用667MHzFSB、2MB共享式二級緩存、改良了的新版Socket478接口(與以前臺(tái)式機(jī)的Socket478并不兼容),都支持硬件防病毒技術(shù)EDB、節(jié)能省電技術(shù)EIST以及虛擬化技術(shù)IntelVT,但不支持64位技術(shù),僅僅只是32位的處理器。與臺(tái)式機(jī)CoreDuo搭配的主要是Intel945GT芯片組,原用于筆記本式計(jì)算機(jī)的Intel945GM、945PM、945GMS也能支持CoreDuo。

2022/12/26上海交通大學(xué)27CoreDuo雖然共272022/12/26上海交通大學(xué)28圖15-1CoreDuo2022/12/26上海交通大學(xué)28圖15-1Core282022/12/26上海交通大學(xué)293.幾點(diǎn)說明

1)雙核技術(shù)與超線程技術(shù)的區(qū)別其實(shí),可以簡單地把雙核技術(shù)理解為兩個(gè)“物理”處理器,是一種“硬”的方式;

而超線程技術(shù)只是兩個(gè)“邏輯”處理器,

是一種“軟”的方式。2022/12/26上海交通大學(xué)293.幾點(diǎn)說明1)雙核292022/12/26上海交通大學(xué)30雙核技術(shù)與超線程技術(shù)的區(qū)別

從原理上來說,超線程技術(shù)屬于Intel版本的多線程技術(shù)。這種技術(shù)可以讓單CPU擁有處理多線程的能力,而物理上只使用一個(gè)處理器。超線程技術(shù)為每個(gè)物理處理器設(shè)置了兩個(gè)入口——AS(ArchitectureState,架構(gòu)狀態(tài))接口,從而使操作系統(tǒng)等軟件將其識別為兩個(gè)邏輯處理器。這兩個(gè)邏輯處理器像傳統(tǒng)處理器一樣,都有獨(dú)立的IA32架構(gòu),它們可以分別進(jìn)入暫停和中斷狀態(tài),或直接執(zhí)行特殊線程,并且每個(gè)邏輯處理器都擁有APIC(AdvancedProgrammableInterruptController,高級可編程中斷控制器)2022/12/26上海交通大學(xué)30雙核技術(shù)與超線程技術(shù)的區(qū)302022/12/26上海交通大學(xué)31圖15-2PentiumD、PentiumEE2022/12/26上海交通大學(xué)31圖15-2Penti312022/12/26上海交通大學(xué)32雙核技術(shù)與超線程技術(shù)的區(qū)別雖然支持超線程的Pentium4能同時(shí)執(zhí)行兩個(gè)線程,但不同于傳統(tǒng)的雙處理器平臺(tái)或雙核處理器,超線程中的兩個(gè)邏輯處理器并沒有獨(dú)立的執(zhí)行單元、整數(shù)單元、寄存器、緩存等資源。它們在運(yùn)行過程中仍需要共用執(zhí)行單元、緩存和系統(tǒng)總線接口。在執(zhí)行多線程時(shí)兩個(gè)邏輯處理器均是交替工作,如果兩個(gè)線程同時(shí)需要某一個(gè)資源,其中一個(gè)要暫停并讓出資源,等待直到那些資源閑置時(shí)才能繼續(xù)。因此,超線程技術(shù)所帶來的性能提升遠(yuǎn)不能等同于兩個(gè)相同時(shí)鐘頻率處理器帶來的性能提升。可以說Intel的超線程技術(shù)僅可以看做是對單個(gè)處理器運(yùn)算資源的優(yōu)化利用。2022/12/26上海交通大學(xué)32雙核技術(shù)與超線程技術(shù)的區(qū)322022/12/26上海交通大學(xué)33雙核技術(shù)與超線程技術(shù)的區(qū)別雙核技術(shù)則是通過“硬”的物理核心實(shí)現(xiàn)多線程工作:每個(gè)核心擁有獨(dú)立的指令集、執(zhí)行單元,與超線程中所采用的模擬共享機(jī)制完全不一樣。在操作系統(tǒng)看來,它是實(shí)實(shí)在在的雙處理器,可以同時(shí)執(zhí)行多項(xiàng)任務(wù),能讓處理器資源真正實(shí)現(xiàn)并行處理模式,其效率和性能提升比超線程技術(shù)要高得多。2022/12/26上海交通大學(xué)33雙核技術(shù)與超線程技術(shù)的區(qū)332022/12/26上海交通大學(xué)342)雙核處理器的適用范圍

目前,WindowsXP專業(yè)版等操作系統(tǒng)支持雙物理核心和四個(gè)邏輯核心,但這并不意味著所有軟件對此都有優(yōu)化。事實(shí)上大量的測試已經(jīng)證明,無論是Intel還是AMD的雙核處理器,相對于其各自的同頻率的單核處理器而言,對于普通應(yīng)用,例如多媒體軟件、游戲和辦公軟件等,都沒有任何性能提升,甚至可能還稍有降低,因?yàn)檫@些普通應(yīng)用目前都還只是單線程程序,在處理器執(zhí)行指令時(shí)實(shí)際上只有一個(gè)核心在工作,而另一個(gè)核心則處于空閑狀態(tài)。2022/12/26上海交通大學(xué)342)雙核處理器的適用范342022/12/26上海交通大學(xué)35雙核處理器的適用范圍

所以對普通用戶而言,只要日常應(yīng)用的程序仍然是單線程,雙核處理器實(shí)際上沒有任何意義,反而還增大了購買成本。除非經(jīng)常執(zhí)行大運(yùn)算量的多任務(wù)處理,例如,在游戲的同時(shí)進(jìn)行音視頻處理等,這時(shí)雙核處理器才能真正發(fā)揮作用。2022/12/26上海交通大學(xué)35雙核處理器的適用范圍所352022/12/26上海交通大學(xué)36雙核處理器的適用范圍

目前最適合雙核處理器發(fā)揮威力的平臺(tái)是服務(wù)器和工作站,這是因?yàn)槠浣?jīng)常進(jìn)行多任務(wù)處理,而且日常運(yùn)行的大量程序都是多線程程序,例如,圖形工作站所使用的AdobePhotoshop和3DMAX等都是多線程程序。一般來說,在執(zhí)行多任務(wù)處理和多線程程序時(shí),雙核處理器的性能比同頻率的單核處理器的性能要高大約50%~70%,甚至在某些應(yīng)用下性能幾乎能提升100%。當(dāng)然,隨著雙核處理器的強(qiáng)勢推出和逐漸普及,日后支持多線程的普通應(yīng)用程序也會(huì)逐漸增多,對普通用戶而言,那時(shí)雙核處理器才會(huì)真正發(fā)揮作用。2022/12/26上海交通大學(xué)36雙核處理器的適用范圍目362022/12/26上海交通大學(xué)3715.3

Core微架構(gòu)從CPU核心架構(gòu)的發(fā)展可見,NetBurst架構(gòu)已經(jīng)無法滿足未來CPU發(fā)展的需要,必須開辟全新的CPU核心架構(gòu)。事實(shí)上,Intel公司在迅馳Ⅲ中的Yonah移動(dòng)處理器已經(jīng)具備Core微架構(gòu)的技術(shù)精髓。Intel公司于2006年上半年正式公布了全新的Core微架構(gòu)(CoreMicro‐Architecture)。Core微架構(gòu)建立在雙核心的基礎(chǔ)上。按應(yīng)用的不同,臺(tái)式機(jī)使用Conroe,筆記本式計(jì)算機(jī)使用Merom,服務(wù)器使用WoodCrest,這三款處理器全部基于Core微架構(gòu)。2022/12/26上海交通大學(xué)3715.3Core微372022/12/26上海交通大學(xué)38Core微架構(gòu)的特點(diǎn)

1.流水線效率大幅度提升

Core微架構(gòu)改變了主頻至上的研發(fā)思路,將超流水線縮短到14級,大幅度提升了整體效率,避免CPU出現(xiàn)“高頻低能”的現(xiàn)象。更值得關(guān)注的是,Core微架構(gòu)采用了四組指令編譯器,這與PentiumM處理器有些類似。所謂四組指令編譯器,就是指能夠在單一頻率周期內(nèi)編譯4個(gè)X86指令。這四組指令編譯器由三組簡單編譯器(SimplDecoder)與一組復(fù)雜編譯器(ComplexDecoder)組成。其中,只有復(fù)雜編譯器能處理最多由4個(gè)微指令所組成的復(fù)雜X86指令。若遇到非常復(fù)雜的指令,則復(fù)雜編譯器必須呼叫微碼循序器(MicrocodeSequencer),以取得微指令序列。2022/12/26上海交通大學(xué)38Core微架構(gòu)的特點(diǎn)382022/12/26上海交通大學(xué)39Core微架構(gòu)的特點(diǎn)為了配合超寬的編譯單元,Core微架構(gòu)的指令讀取單元在一個(gè)頻率周期內(nèi),從第一階指令快取中,抓?。秱€(gè)X86指令到指令編譯緩沖區(qū)———

指令隊(duì)列(InstructionQueue),判定是否有符合宏指令融合的配對,然后再將最多5個(gè)X86指令分派給四組指令編譯器。四組指令編譯器在每個(gè)頻率周期中,發(fā)給保留站(ReservationStation)4個(gè)編譯后的微指令,保留站再將存放的微指令分派(Dispatch)給5個(gè)執(zhí)行單元。由于高主頻對于四組精簡結(jié)構(gòu)有著很大的依賴性,同時(shí)其他輔助性技術(shù)也能在很大程度上彌補(bǔ)解決定址模式混亂的難題。Core微架構(gòu)采用四組指令編譯器的設(shè)計(jì)將會(huì)使CPU的整體性能有大幅度的提升。2022/12/26上海交通大學(xué)39Core微架構(gòu)的特點(diǎn)為392022/12/26上海交通大學(xué)402.全新的整數(shù)與浮點(diǎn)單元

從P6到NetBurst架構(gòu),整數(shù)與浮點(diǎn)單元的變化是相當(dāng)明顯的,Core微架構(gòu)對此也作了不小的改變,只是部分關(guān)鍵技術(shù)又改回P6架構(gòu)時(shí)代的設(shè)計(jì)。Core微架構(gòu)具備了3個(gè)64位的整數(shù)執(zhí)行單元,每一個(gè)都可以單獨(dú)完成64位整數(shù)運(yùn)算操作,這樣,Core微架構(gòu)有了一套64位的復(fù)雜整數(shù)單元(和P6核心的CIU(ComplexIntegerUnit)相同)及兩個(gè)簡單整數(shù)單元,以用來處理基本的操作和運(yùn)算任務(wù)。特別是,3個(gè)64位的整數(shù)執(zhí)行單元中的一個(gè)簡單整數(shù)單元和分支執(zhí)行單元將會(huì)共享端口。該端口處的簡單整數(shù)單元將和分支單元共同完成此處的宏指令結(jié)合的任務(wù)。2022/12/26上海交通大學(xué)402.全新的整數(shù)與浮點(diǎn)單402022/12/26上海交通大學(xué)41Core微架構(gòu)的特點(diǎn)Core是IntelX86處理器中第一個(gè)能夠獨(dú)立完成64位整數(shù)運(yùn)算的處理器,這也讓Core微架構(gòu)得以走在同類CPU的前列。此外,64位的整數(shù)單元使用彼此獨(dú)立的數(shù)據(jù)端口,因此Core能夠在一個(gè)周期內(nèi)同時(shí)完成3組64位的整數(shù)運(yùn)算。極強(qiáng)的整數(shù)運(yùn)算單元使得Core微架構(gòu)在包括游戲、服務(wù)器項(xiàng)目、移動(dòng)等方面都能夠發(fā)揮廣泛而強(qiáng)大的作用。2022/12/26上海交通大學(xué)41Core微架構(gòu)的特點(diǎn)C412022/12/26上海交通大學(xué)42Core微架構(gòu)的特點(diǎn)Core微架構(gòu)對浮點(diǎn)單元進(jìn)行改進(jìn)。Core微架構(gòu)擁有2個(gè)浮點(diǎn)執(zhí)行單元以同時(shí)處理向量和標(biāo)量的浮點(diǎn)運(yùn)算,其中一個(gè)浮點(diǎn)單元負(fù)責(zé)執(zhí)行加減等簡單的處理,而另一個(gè)浮點(diǎn)單元?jiǎng)t負(fù)責(zé)執(zhí)行乘除等運(yùn)算。其改進(jìn)效果還是顯而易見的。在多項(xiàng)測試中,Conroe臺(tái)式機(jī)處理器性能優(yōu)于AMD高端的FX62,使Core微架構(gòu)在3D游戲中有更好的表現(xiàn)。2022/12/26上海交通大學(xué)42Core微架構(gòu)的特點(diǎn)C422022/12/26上海交通大學(xué)433.數(shù)據(jù)預(yù)讀機(jī)制與緩存結(jié)構(gòu)

Core微架構(gòu)的預(yù)讀取機(jī)制有更多新特性數(shù)據(jù)預(yù)取單元經(jīng)常需要在緩存中進(jìn)行標(biāo)簽查找。為了避免標(biāo)簽查找可能帶來的高延遲,數(shù)據(jù)預(yù)取單元使用存儲(chǔ)接口進(jìn)行標(biāo)簽查找。存儲(chǔ)操作在大多數(shù)情況下并不是影響系統(tǒng)性能的關(guān)鍵,因?yàn)樵跀?shù)據(jù)開始寫入時(shí),CPU即可以馬上開始進(jìn)行下面的工作,而不必等待寫入操作完成。緩存/內(nèi)存子系統(tǒng)會(huì)負(fù)責(zé)將數(shù)據(jù)整個(gè)寫入到緩存、復(fù)制到主內(nèi)存的過程。2022/12/26上海交通大學(xué)433.數(shù)據(jù)預(yù)讀機(jī)制與緩存432022/12/26上海交通大學(xué)44Core微架構(gòu)的特點(diǎn)

此外,Core微架構(gòu)使用了SmartMemoryAccess算法,這將幫助CPU在前端總線與內(nèi)存?zhèn)鬏斨g實(shí)現(xiàn)更高的效率。SmartMemoryAccess算法使用8個(gè)預(yù)取器,這種預(yù)取器可以利用推測算法將數(shù)據(jù)從內(nèi)存轉(zhuǎn)移到二級緩存,或者從二級緩存轉(zhuǎn)移到一級緩存,這對于提高內(nèi)存單元性能和緩存效率都是很有幫助的。2022/12/26上海交通大學(xué)44Core微架構(gòu)的特點(diǎn)442022/12/26上海交通大學(xué)45Core微架構(gòu)的特點(diǎn)

Core微架構(gòu)的緩存系統(tǒng)也有其特點(diǎn)。雙核Core微架構(gòu)的二級緩存容量高達(dá)4MB,且兩個(gè)核心共享,訪問延遲僅12~14個(gè)時(shí)鐘周期。每個(gè)核心還擁有32KB的一級指令緩存和一級數(shù)據(jù)緩存,訪問延遲僅僅3個(gè)時(shí)鐘周期。從NetBurst架構(gòu)開始引入的追蹤式緩存(TraceCache)在Core微架構(gòu)中不再使用。NetBurst架構(gòu)中的追蹤式緩存的作用與常見的指令緩存相類似,用來存放解碼前的指令,對NetBurst架構(gòu)的長流水線結(jié)構(gòu)非常有用。而Core微架構(gòu)回歸相對較短的流水線之后,追蹤式緩存也隨之消失,因?yàn)閭鹘y(tǒng)的一級指令緩存對短流水線的Core微架構(gòu)更加有用。如今的緩存結(jié)構(gòu)還僅僅是Core微架構(gòu)的最低版本,隨著未來核心的改進(jìn),緩存結(jié)構(gòu)只會(huì)變得越來強(qiáng)。2022/12/26上海交通大學(xué)45Core微架構(gòu)的特點(diǎn)452022/12/26上海交通大學(xué)464.真正的雙核處理器對于PC用戶而言,多任務(wù)處理一直是難題,因?yàn)閱翁幚砥鞯亩嗳蝿?wù)以分隔時(shí)間段的方式來實(shí)現(xiàn),此時(shí)的性能損失相當(dāng)巨大。而在雙核處理器的支持下,真正的多任務(wù)得以應(yīng)用,而且越來越多的應(yīng)用程序甚至?xí)橹畠?yōu)化,進(jìn)而奠定扎實(shí)的應(yīng)用基礎(chǔ)。Intel公司早期規(guī)劃的雙核心處理器包括PentiumExtremeEdition和PentiumD等。但是這些雙核心芯片的實(shí)質(zhì)僅僅是封裝兩個(gè)獨(dú)立的核心,相互之間的數(shù)據(jù)傳輸還需要通過外部總線,這令效率大幅度降低。而Core微架構(gòu)設(shè)計(jì)的二級緩存并沒有分成兩個(gè)單獨(dú)的單元,而是兩個(gè)核心共享緩存。這一點(diǎn)非常重要,它說明Core并不是簡單地將兩個(gè)核心拼在一起。2022/12/26上海交通大學(xué)464.真正的雙核處理器462022/12/26上海交通大學(xué)47Core微架構(gòu)的特點(diǎn)Core微架構(gòu)的優(yōu)勢還包括降低功耗的IntelligentPowerCapability技術(shù)以及優(yōu)化多媒體性能的AdvancedDigitalMediaBoost技術(shù)。Core微架構(gòu)的設(shè)計(jì)理念在摒棄主頻至上策略之后,Intel終于回到體系結(jié)構(gòu)的正軌。此外,Core微架構(gòu)的Conroe臺(tái)式機(jī)處理器兼容Intel975芯片組,因此Intel的Core微架構(gòu)處理器的產(chǎn)品將會(huì)覆蓋更廣領(lǐng)域。2022/12/26上海交通大學(xué)47Core微架構(gòu)的特點(diǎn)C472022/12/26上海交通大學(xué)4815.4

Core2Duo/Quad/Extreme從2006年第三季度開始,臺(tái)式機(jī)CoreDuo逐漸采用基于Core微架構(gòu)的Conroe核心,改用Socket775接口,主流型號的前端總線提高到1066MHzFSB,而ExtremeEdition加強(qiáng)版則進(jìn)一步提高到1333MHzFSB,并且將共享式二級緩存提高到4MB;只有部分低端型號才會(huì)繼續(xù)采用800MHzFSB和2MB共享式二級緩存?;贑ore微架構(gòu)的Conroe核心的芯片即Core2Duo,它比原有的臺(tái)式機(jī)雙核心處理器(包括Yonah核心CoreDuo、PentiumD、PentiumEE、Athlon64X2和Athlon64FX)的性能有大幅度提升,而功耗則進(jìn)一步降低。2022/12/26上海交通大學(xué)4815.4Core2482022/12/26上海交通大學(xué)49Core2Duo/Quad/Extreme以前Intel公司針對桌面、移動(dòng)和服務(wù)器市場的處理器,是基于不同的架構(gòu),而今,Intel公司第一次在所有平臺(tái)上使用了統(tǒng)一的構(gòu)架,即Core微架構(gòu),Intel公司沿用奔騰系列的命名規(guī)則,將新系列“酷?!保–ore)芯片命名為Core2Duo,并推出了Core2Duo處理器。Conroe是Core處理器中的桌面平臺(tái)的統(tǒng)稱,移動(dòng)平臺(tái)稱為Merom,服務(wù)器平臺(tái)稱為Woodcrest。Conroe、Merom和Woodcrest都擁有64位處理能力,是雙核產(chǎn)品。2022/12/26上海交通大學(xué)49Core2Duo/492022/12/26上海交通大學(xué)50有關(guān)Core2的幾點(diǎn)說明

①Core2Duo改變了以Pentium命名處理器的傳統(tǒng),以后不會(huì)再有奔騰5、奔騰6等。

②借助SMARTCache和高動(dòng)態(tài)執(zhí)行等技術(shù),Core2Duo和Core2Extreme的速度大大提高,比PentiumEE和AMDFX62都快得多。③Intel公司第一次在所有平臺(tái)上使用了統(tǒng)一的構(gòu)架:無論是Conroe(桌面)、Merom(筆記本式計(jì)機(jī)),還是Woodcrest(服務(wù)器),都采用了Core微構(gòu)架,擁有64位處理能力,而且它們都是雙核的。

2022/12/26上海交通大學(xué)50有關(guān)Core2的幾點(diǎn)502022/12/26上海交通大學(xué)51幾點(diǎn)說明④所有的Core微構(gòu)架的處理器都將擁有更強(qiáng)的處理性能和更低的功耗,筆記本式計(jì)算機(jī)的電池使用時(shí)間將延長,桌面機(jī)器和工作站將變得輕巧,狹窄空間內(nèi)的散熱問題也將得到緩解。⑤因?yàn)楣牡慕档停L(fēng)扇馬力減小,使工作環(huán)境更安靜。⑥Core2Duo沿用了PentiumD和PentiumEE上的LGA775接口(需要BIOS或軟件升級),系統(tǒng)升級方便、快捷,甚至不需要購買任何零件。2022/12/26上海交通大學(xué)51幾點(diǎn)說明④所有的Cor512022/12/26上海交通大學(xué)52幾點(diǎn)說明⑦多任務(wù)處理達(dá)到新的高度,依托雙核系統(tǒng)的強(qiáng)勁性能,虛擬技術(shù)可以將一臺(tái)計(jì)算機(jī)當(dāng)做幾臺(tái)虛擬的計(jì)算機(jī)來用,同時(shí)運(yùn)行不同的操作系統(tǒng),例如,可以同時(shí)運(yùn)行FTP服務(wù)和Web服務(wù),還可以打開一個(gè)數(shù)據(jù)庫,與此同時(shí)還能玩游戲或上網(wǎng)沖浪。與現(xiàn)有虛擬軟件不同的是,這種虛擬是完全硬件層次上的。⑧Core2Duo上都將有TPM安全保護(hù),將從硬件層次上維護(hù)用戶的密碼、數(shù)據(jù)、登錄等信息的安全。2022/12/26上海交通大學(xué)52幾點(diǎn)說明⑦多任務(wù)處522022/12/26上海交通大學(xué)53幾點(diǎn)說明

⑨Conroe、Merom和Woodcrest等名稱并不是源于速度或性能,其實(shí)這些代表了開發(fā)部門所在地的名稱,Conroe位于美國得克薩斯州,Woodcrest位于美國加利福尼亞州,而Merom則是以色列一個(gè)古老的湖泊的名字。2022/12/26上海交通大學(xué)53幾點(diǎn)說明⑨Conro532022/12/26上海交通大學(xué)541.Core2Duo(“酷睿2雙核”)

由前述可知,Conroe是Core處理器中的桌面平臺(tái)的統(tǒng)稱,移動(dòng)平臺(tái)稱為Merom,服務(wù)器平臺(tái)Woodcrest。Conroe、Merom和Woodcrest都擁有64位處理能力,并且是雙核產(chǎn)品。Merom比Conroe能耗更低,但在其他性能上兩者非常類似。2022/12/26上海交通大學(xué)541.Core2Du542022/12/26上海交通大學(xué)55Core2DuoMerom是Intel公司基于Core2架構(gòu)的第一個(gè)移動(dòng)版本處理器,正式發(fā)布于2006年7月27日。Merom是Intel公司的一線移動(dòng)處理器,擁有同Conroe一樣強(qiáng)大的功能,但同時(shí)Intel公司也強(qiáng)調(diào)了其對于電能的低消耗會(huì)有助于延長筆記本式計(jì)算機(jī)電池的壽命。Intel公司強(qiáng)調(diào)在維持相同的電池壽命的基礎(chǔ)上,Merom將會(huì)比基于Yonah的CoreDuo的筆記本式計(jì)算機(jī)整體性能提升20%。Merom將會(huì)成為Intel移動(dòng)處理器中第一個(gè)具備EM64T擴(kuò)展技術(shù)的處理器。Intel公司強(qiáng)調(diào)只需要升級BIOS,第一版Merom兼容CoreDuo的平臺(tái)。擁有一樣的熱封裝以及相同的667MHz的總線頻率。2022/12/26上海交通大學(xué)55Core2DuoMe552022/12/26上海交通大學(xué)56Core2DuoMerom處理器共有兩個(gè)版本,被標(biāo)稱為“

T5x00”為2MB二級緩存版本,“

T7x00”則為4MB二級緩存版本。其中,T5500時(shí)鐘頻率為1.66GHz,T5600時(shí)鐘頻率為1.83GHz,T7200時(shí)鐘頻率為2.0GHz,T7400時(shí)鐘頻率為2.16GHz,T7600時(shí)鐘頻率為2.33GHz。2022/12/26上海交通大學(xué)56Core2DuoMe562022/12/26上海交通大學(xué)572.Core2Quad

Penryn是Core架構(gòu)中的四核處理器,Core2Quad的Penryn可以說是個(gè)縮小版的Merom。在改用45nm制程后,更進(jìn)一步地增加運(yùn)算速率和更省電。2022/12/26上海交通大學(xué)572.Core2Q572022/12/26上海交通大學(xué)58Core2Extreme

(“酷睿2至尊版”)

Core2Extreme是Conroe系列的至尊版處理器,它與Core2Duo處理器所不同的是,它的倍頻并沒有鎖死,在Intel公司的原裝975XBX主板上,能實(shí)現(xiàn)倍頻的向上調(diào)整,也就是說,Core2Extreme處理器的倍頻在一定程度上是開放的,任由用戶調(diào)整。2022/12/26上海交通大學(xué)58Core2Extre582022/12/26上海交通大學(xué)59Core2Extreme

Core2ExtremeX68002.93GHz、Core2DuoE67002.67GHz、E66002.40GHz、E64002.13GHz、E63001.86GHz、E43001.8Ghz,前五款處理器FSB均為1066MHz;在二級緩存方面,X6800、E6700、E6600是4MB,而E6400和E6300擁有2MB二級緩存;全部采用LGA775封裝,支持VT虛擬化技術(shù)和EIST省電技術(shù)。2007年1月21日推出主頻提升至1.8GHz的E4300,二級緩存為2MB,前端總線為800MHz,不支持虛擬化技術(shù)。另外,除了X6800功耗為75W之外,余下的Conroe功耗均只有65W。核心尺寸為143mm2,集成了2億9100萬個(gè)晶體管。2022/12/26上海交通大學(xué)59Core2Extre592022/12/26上海交通大學(xué)60Core2Extreme

Intel公司在2008年第四季度發(fā)布Core2DuoE7000系列雙核心處理器的第二款型號E7400,取代現(xiàn)有的E7200。除了主頻從2.53GHz提升到2.83GHz,7400的規(guī)格與E7200完全一致,例如45nmPenrynWofldale核心、3MB二級緩存、1066MHz前端總線、65W熱設(shè)計(jì)功耗等。2022/12/26上海交通大學(xué)60Core2Extre602022/12/26上海交通大學(xué)6115.5

IntelNehalem架構(gòu)

Corei7處理器1.Corei7處理器2008年Intel公司宣布正式確認(rèn),基于全新Nehalem架構(gòu)的下一代桌面處理器將沿用“Core”(酷睿)名稱,命名為IntelCorei7系列,至尊版的名稱是IntelCorei7Extreme系列。而同架構(gòu)服務(wù)器處理器將繼續(xù)延用“Xeon”名稱。2008年11月18日正式發(fā)布三款I(lǐng)ntelCorei7處理器,頻率分別為3.2GHz、2.93GHz和2.66GHz,主頻為3.2GHz的屬于IntelCorei7Extreme,這款頂級處理器面向的是發(fā)燒級用戶,而頻率較低的2暢66GHz面向的是普通消費(fèi)者。2022/12/26上海交通大學(xué)6115.5Intel612022/12/26上海交通大學(xué)621.Corei7處理器

Corei7就是此前Intel公司一直力推的Nehalem處理器。早在2006年,在推出Core2處理器時(shí),Intel公司就宣布了每年更新CPU的Tick‐Tock計(jì)劃。Tick代表CPU制作工藝上的改進(jìn),而Tock則代表CPU架構(gòu)上的更新。對于Corei7處理器來說,比較關(guān)鍵的技術(shù)應(yīng)用包括原生4核心甚至原生8核心處理器設(shè)計(jì),采用全新QPI總線,處理器擁有8MB三級緩存,支持第二代超線程技術(shù)———

處理器能以8線程運(yùn)行。TurboMode內(nèi)核加速,集成了內(nèi)存控制器,支持三通道DDR3內(nèi)存,有LGA1366接口(針腳設(shè)計(jì))等。同頻下Corei7比Core2Quad性能要高出很多。相比Core2,在功耗不變的前提下,Corei7處理器使視頻編輯、大型游戲和其他流行的互聯(lián)網(wǎng)及計(jì)算機(jī)應(yīng)用的速度可提升30%~40%。2022/12/26上海交通大學(xué)621.Corei7622022/12/26上海交通大學(xué)63Corei7處理器

Corei7處理器的基本特性如下。

1)原生4核心+全新緩存設(shè)計(jì)

Core2Quad系列四核處理器其實(shí)是把兩個(gè)Core2Duo處理器封裝在一起,并非原生的4核心設(shè)計(jì),通過狹窄的前端總線FSB來通信,其缺點(diǎn)是數(shù)據(jù)延遲問題比較嚴(yán)重,性能并不盡如人意。Corei7則采用原生4核設(shè)計(jì),使用先進(jìn)的QPI(QuickPathInterconnect,快速通路互連)總線進(jìn)行通信,傳輸速度是FSB的5倍。緩存方面也采用了三級內(nèi)含式Cache設(shè)計(jì),L1的設(shè)計(jì)和Core微架構(gòu)一樣;L2采用超低延遲的設(shè)計(jì),每個(gè)內(nèi)核為256KB(共256×4KB);L3采用共享式設(shè)計(jì),被片上所有內(nèi)核共享,容量為8MB。2022/12/26上海交通大學(xué)63Corei7處理器632022/12/26上海交通大學(xué)642)采用全新QPI總線

Corei7的Nehalem架構(gòu)最大的改進(jìn)是在前端總線(FSB)上,傳統(tǒng)的并行傳輸方式被徹底廢棄,轉(zhuǎn)而采用基于PCIExpress串行點(diǎn)對點(diǎn)傳輸技術(shù)的通用系統(tǒng)接口(CommonSystemInterface,CSI),被Intel公司稱為QuickPath

。QuickPath的傳輸速率為6.4Gbps,這樣一條32b的QuickPath帶寬就能達(dá)到25.6GBps。QuickPath的傳輸速率是1333MHz的FSB的5倍,前者雖然數(shù)據(jù)位寬較窄,但傳輸帶寬仍然是后者的2.5倍。它們分別用于雙處理器平臺(tái)和單處理平臺(tái)。2022/12/26上海交通大學(xué)642)采用全新QPI總642022/12/26上海交通大學(xué)65基本特性目前桌面級CPU的QPI總線為1條,服務(wù)器級別的Nehalem處理器則會(huì)配備2條甚至4條QPI總線。2022/12/26上海交通大學(xué)65基本特性目前桌面級CPU652022/12/26上海交通大學(xué)66基本特性QPI總線能夠有效地提高系統(tǒng)性能。QPI總線可以將處理器的每個(gè)核心分隔為獨(dú)立的小塊,每個(gè)核心之間也可以通過QPI總線進(jìn)行連接。其實(shí)它和AMDHyperTransport技術(shù)類似,也是一種點(diǎn)對點(diǎn)總線,同樣具有非常高的帶寬。第一批Nehalem處理器使用了20b的連接位寬,Corei7Extreme965的QPI總線數(shù)據(jù)傳輸率為6.4GTps,處理器和北橋之間的帶寬單向?yàn)椋保?8GBps,雙向?yàn)椋玻?6GBps;Corei7940/920的速度為4.8GTps,單向?yàn)椋?6GBps,雙向?yàn)椋保?2GBps。而FSB技術(shù)在1333MHz下,帶寬不過10.6GBps,只有Corei7940/920的一半。2022/12/26上海交通大學(xué)66基本特性QPI總線能夠662022/12/26上海交通大學(xué)673)集成內(nèi)存控制器

在Corei7中擁有集成內(nèi)存控制器(IntegratedMemoryController,IMC),可以支持三通道的DDR3內(nèi)存,運(yùn)行在DDR31333,內(nèi)存位寬從128位提升到192位,這樣總共的峰值帶寬就可以達(dá)到32GBps,是Core2的2~4倍。處理器采用了集成內(nèi)存控制器后,就能直接與物理存儲(chǔ)器陣列相連接,從而極大程度地減少了內(nèi)存延遲的現(xiàn)象。2022/12/26上海交通大學(xué)673)集成內(nèi)存控制器672022/12/26上海交通大學(xué)68基本特性

Corei7將內(nèi)存控制器整合到了內(nèi)部,而不再由北橋芯片控制,支持三通道DDR3內(nèi)存規(guī)格,徹底拋棄DDR2。通過內(nèi)存控制器的設(shè)計(jì),Nehalem處理器達(dá)到了酷睿2處理器的4倍內(nèi)存帶寬,使得每個(gè)核心可以支持最大10個(gè)未解決的數(shù)據(jù)緩存命中失敗和總共16個(gè)命中失敗,比酷睿2的單核心8個(gè)未解決的數(shù)據(jù)緩存命中失敗和總共14個(gè)命中失敗提高了不少。Corei7內(nèi)存控制器能直接與物理存儲(chǔ)器陣列相連接,從而極大程度地減少了內(nèi)存延遲的現(xiàn)象。早在2003年,AMD公司在K8中就已經(jīng)集成了內(nèi)存控制器,大幅提升了內(nèi)存性能。2022/12/26上海交通大學(xué)68基本特性Corei7682022/12/26上海交通大學(xué)69基本特性而Intel公司即便是2006年推出的Core2處理器,也沒有集成內(nèi)存控制器,所以在內(nèi)存性能上一直遜色于Athlon64X2與Phenom。Intel公司在Corei7設(shè)計(jì)中集成了內(nèi)存控制器。其三通道內(nèi)存默認(rèn)運(yùn)行在DDR31066,也可以很容易地運(yùn)行在DDR31333,運(yùn)行在DDR31333內(nèi)存的位寬從128位提升到192位,總峰值帶寬可以達(dá)到32GBps,是Core2的2~4倍。用戶只要將三條DDR3內(nèi)存插入三條藍(lán)色的DIMM內(nèi)存插槽之中,就可以開啟三通道。同時(shí),三通道內(nèi)存的支持對32b系統(tǒng)的支持。2022/12/26上海交通大學(xué)69基本特性而Intel公692022/12/26上海交通大學(xué)704)同步多線程技術(shù)

原生4核Corei7有8個(gè)邏輯內(nèi)核。超線程技術(shù)(Hyper‐Threading)最早出現(xiàn)在130nm的Pentium4上,超線程技術(shù)就是利用特殊的硬件指令,把兩個(gè)邏輯核心模擬成兩個(gè)物理芯片,讓單個(gè)處理器都能使用線程級并行計(jì)算,進(jìn)而兼容多線程操作系統(tǒng)和軟件,減少了CPU的閑置時(shí)間,提高了CPU的運(yùn)行效率。2022/12/26上海交通大學(xué)704)同步多線程技術(shù)702022/12/26上海交通大學(xué)71基本特性超線程技術(shù)使得Pentium4單核CPU也擁有較出色的多任務(wù)性能,可能由于帶寬的緣故,實(shí)際帶來的性能提升并不明顯,因此后來的酷睿2處理器直接拋棄了超線程技術(shù)。而引入了QPI和集成內(nèi)存控制器之后的Corei7,帶來驚人的帶寬,不用再擔(dān)心傳輸帶寬所產(chǎn)生的瓶頸,所以重新啟用了超線程技術(shù)?,F(xiàn)在通過改進(jìn)后的超線程技術(shù)再次回歸到Corei7處理器上。2022/12/26上海交通大學(xué)71基本特性超線程技術(shù)使得P712022/12/26上海交通大學(xué)72基本特性超線程技術(shù)又稱為同步多線程技術(shù)(SimultaneousMult‐Threading,SMT),同步多線程是2way的,每核心可以同時(shí)執(zhí)行2個(gè)線程。對于執(zhí)行引擎來說,在多線程任務(wù)的情況下,就可以掩蓋單個(gè)線程的延遲。SMT的好處是只需要消耗很小的核心面積代價(jià),就可以在多任務(wù)的情況下提供顯著的性能提升,比起完全再添加一個(gè)物理核心來說要?jiǎng)澦愕枚?。比起Pentium4的超線程技術(shù)(Hyper‐Threading),Corei7的優(yōu)勢是有更大的緩存和更大的內(nèi)存帶寬,這樣就更能夠有效地發(fā)揮多線程的作用。按照Intel公司的說法,Nehalem的SMT可以在增加很少能耗的情況下,讓性能提升20%~30%。2022/12/26上海交通大學(xué)72基本特性超線程技術(shù)又稱為722022/12/26上海交通大學(xué)735)自動(dòng)超頻,核心加速

Corei7引入了全新的加速模式(TurboMode)。TurboMode,顧名思義,就是加速模式,它是基于Nehalem架構(gòu)的電源管理技術(shù),通過分析當(dāng)前CPU的負(fù)載情況,智能地完全關(guān)閉一些暫時(shí)不用的核心,把能源留給正在使用的核心,并使其運(yùn)行在更高的頻率,進(jìn)一步提升性能;相反,需要多個(gè)核心時(shí),動(dòng)態(tài)開啟相應(yīng)的核心,智能調(diào)整頻率。這樣,在不影響CPU的TDP情況下,能把核心工作頻率調(diào)得更高。2022/12/26上海交通大學(xué)735)自動(dòng)超頻,核心加速732022/12/26上海交通大學(xué)74基本特性例如,如果游戲只用到一個(gè)核心,TurboMode就會(huì)把其他三個(gè)核心自動(dòng)關(guān)閉,把正在運(yùn)行游戲的那個(gè)核心的頻率提高,也就是自動(dòng)超頻,在不浪費(fèi)能源的情況下獲得更好的性能。在Core2時(shí)代,即使是運(yùn)行只支持單核的程序,其他核心仍會(huì)全速運(yùn)行,既得不到性能的提升,又造成了能源的浪費(fèi)。2022/12/26上海交通大學(xué)74基本特性例如,如果游戲只742022/12/26上海交通大學(xué)75基本特性TurboMode是一種基于Nehalem架構(gòu)的電源管理技術(shù)。在BIOS中,TurboMode是默認(rèn)開啟的,通過自動(dòng)調(diào)高CPU的倍頻提高性能。在Intel原廠X58主板上,低負(fù)載時(shí)默認(rèn)調(diào)高1、2個(gè)倍頻。例如,Corei7920的默認(rèn)頻率為2暢66GHz,在TurboBoost默認(rèn)開啟的情況下,運(yùn)行SuperPI是以單核2.8GHz來執(zhí)行,這樣單線程性能也會(huì)得到提升。2022/12/26上海交通大學(xué)75基本特性TurboMo752022/12/26上海交通大學(xué)766)文本處理再提速和完整的SSE4

多媒體指令支持

SSE4.1+SSE4.2組成完整的SSE4(StreamingSIMDExtensions4,流式單指令多數(shù)據(jù)流擴(kuò)展)指令集共包含54條指令,其中的47條指令已在45nm的Core2上實(shí)現(xiàn),稱為SSE4.1。SSE4.1指令的引入進(jìn)一步增強(qiáng)了CPU在視頻編碼/解碼、圖形處理以及游戲等多媒體應(yīng)用上的性能。其余的7條指令在Corei7中也得以實(shí)現(xiàn),稱為SSE4.2。SSE4.2是對SSE4.1的補(bǔ)充,主要針對的是對XML文本的字符串操作、存儲(chǔ)校驗(yàn)CRC32的處理等。2022/12/26上海交通大學(xué)766)文本處理再提速和完762022/12/26上海交通大學(xué)777)新的主板芯片組

Intel公司每發(fā)布一新系列CPU,都推出一新主板芯片組,由于Corei7封裝接口改成了LGA1366,為此也推出了新的主板芯片組X58Express以及X58系列主板。由于Bloomfield處理器上整合了支持三通道DDR3內(nèi)存的控制器,X58芯片組的功能簡化了不少,最大的改進(jìn)點(diǎn)是提供了兩片PCIExpress2.0×16顯卡,同時(shí)也可以拆分成4×8的配置。該芯片組采用傳統(tǒng)的南北橋設(shè)計(jì),在北橋芯片與Corei7處理器之間,采用全新的QPI(QuickPathInterconnect)總線連接,帶寬高達(dá)25.6GBps。南橋芯片并沒有重大更新,搭配了P45時(shí)代ICH10家族中的ICH10R,并加入了AHCI,強(qiáng)化了喚醒、管理和安全功能。2022/12/26上海交通大學(xué)777)新的主板芯片組772022/12/26上海交通大學(xué)78基本特性在顯卡支持方面,X58Express芯片組支持PCIE2.0規(guī)范,并首次正式支持NVIDISLI/QuadSLI以及AMD的CrossFire/QuadCrossFire。目前ODM合作伙伴微星、華碩、技嘉、映泰、富士康、精英等都有X58系列主板上市。與Intel原廠X58主板所不同的是,這些大廠的X58產(chǎn)品都通過NVIDIA授權(quán)加入了對SLI的支持2022/12/26上海交通大學(xué)78基本特性在顯卡支持方面,782022/12/26上海交通大學(xué)792.Corei5和Corei32009年年中Intel公司闡述了新的消費(fèi)級處理器品牌體系,并正式宣布了Corei5和Corei3兩個(gè)子品牌系列,還簡單介紹了它們的應(yīng)用范圍。

Corei5及Corei3處理器在架構(gòu)上有著極為明顯的差異性,具體如下:●Corei5核心為原生四核處理器,并不具備圖形處理能力,其研發(fā)代號為Lynnfield,采用了Nehalem架構(gòu)?!馛orei3處理器是一款雙核CPU,其內(nèi)置了圖形核心,具備了圖形處理能力。這款處理器的研發(fā)代號為Clarkdale,采用了Westmere架構(gòu)。2022/12/26上海交通大學(xué)792.Corei5792022/12/26上海交通大學(xué)80Corei5和Corei3

Intel公司公布的新處理器品牌體系———Corei7以及兩個(gè)子系列Corei5、Corei3,該新體系的幾個(gè)要點(diǎn)是:①以Core(酷睿)為核心,面向高、中、低端市場分別衍生出Corei7、Corei5、Corei3。②Core2Duo(酷睿2雙核)、Core2Quad(酷睿2四核)、Core2Extreme(酷睿2至尊版)將逐漸淡出,也預(yù)示著Core2時(shí)代的終結(jié)。③Pentium(奔騰)、Celeron(賽揚(yáng))、Atom(凌動(dòng))繼續(xù)存在,面向入門級桌面市場和上網(wǎng)筆記本式計(jì)算機(jī)、智能手機(jī)等移動(dòng)領(lǐng)域。④Centrino(迅馳)也還在,不過從2010年起市場定位有所變化,不再代表移動(dòng)處理器。2022/12/26上海交通大學(xué)80Corei5和Cor802022/12/26上海交通大學(xué)813.QPI總線

1)什么是QPI

Intel公司的QPI(QuickPathInterconnect)是一種快速通道互連技術(shù)。官方名字為CSI(CommonSystemInterface,公共系統(tǒng)界面),用來實(shí)現(xiàn)芯片之間的直接互連,而不是通過FSB連接到北橋,它是針對AMD的HT總線而提出的。無論是速度、每個(gè)針腳的帶寬、功耗等一切規(guī)格都要超越HT總線。2022/12/26上海交通大學(xué)813.QPI總線812022/12/26上海交通大學(xué)822)QPI技術(shù)的特點(diǎn)

(1)帶寬更大

QPI最大的改進(jìn)是采用單條點(diǎn)對點(diǎn)模式,QPI的輸出傳輸能力非常驚人,在4.8~6.4GBps之間。一個(gè)連接的每個(gè)方向的位寬可以是5b、10b、20b。因此每一個(gè)方向的QPI全寬度連接可以提供12~16GBps的帶寬,那么每一個(gè)QPI連接的帶寬為24~32GBps。2022/12/26上海交通大學(xué)822)QPI技術(shù)的特點(diǎn)822022/12/26上海交通大學(xué)83QPI總線

(2)效率更高

QPI的另一個(gè)亮點(diǎn)就是支持多條系統(tǒng)總線連接,Intel稱之為multi‐FSB

。系統(tǒng)總線將會(huì)被分成多條連接,并且頻率不再是單一固定的,也無須經(jīng)過FSB進(jìn)行連接。根據(jù)系統(tǒng)各個(gè)子系統(tǒng)對數(shù)據(jù)吞吐量的需求,每條系統(tǒng)總線的連接速度也可同,這種特性無疑要比AMD目前的Hypertransport總線更具彈性。2022/12/26上海交通大學(xué)83QPI總線(2)效832022/12/26上海交通大學(xué)84QPI總線

3)QPI與FSB的區(qū)別

前端總線(FrontSideBus,F(xiàn)SB)是將CPU連接到北橋芯片的系統(tǒng)總線,它是CPU和外界交換數(shù)據(jù)的主要通道。前端總線的數(shù)據(jù)傳輸能力對計(jì)算機(jī)整體性能影響很大,如果沒有足夠帶寬的前端總線,即使配備再強(qiáng)勁的CPU,用戶也不會(huì)感覺到計(jì)算機(jī)整體速度的明顯提升。2022/12/26上海交通大學(xué)84QPI總線3)QP842022/12/26上海交通大學(xué)85QPI總線

Intel處理器主流的前端總線頻率有800MHz、1066MHz、1333MHz幾種,而在2007年11月,Intel公司再度將處理器的前端總線頻率提升至1600MHz(默認(rèn)外頻400MHz),比2003年最高的800MHzFSB總線頻率整整提升了一倍。當(dāng)前端總線為1333MHz時(shí),處理器與北橋之間的帶寬為10.67GBps,而將前端總線提升到1600MHz,帶寬就能達(dá)到12.8GBps,增加了20%。2022/12/26上海交通大學(xué)85QPI總線Intel852022/12/26上海交通大學(xué)86QPI總線雖然Intel處理器的前端總線頻率看起來已經(jīng)很高,但與同時(shí)不斷提升的內(nèi)存頻率、高性能顯卡(特別是雙顯卡系統(tǒng)或多顯卡系統(tǒng))相比,CPU與芯片組存在的前端總線瓶頸仍未根本改變。例如,1333MHz的FSB所提供的內(nèi)存帶寬是1333MHz×64b/8=10667MBps=10.67GBps,與雙通道的DDR2667內(nèi)存剛好匹配,但如果使用雙通道的DDR2800、DDR21066的內(nèi)存,這時(shí)FSB的帶寬就小于內(nèi)存的帶寬,更不用說和未來的三通道和更高頻率的DDR3內(nèi)存搭配了(Nehalem平臺(tái)三通道DDR31333內(nèi)存的帶寬可達(dá)32GBps)。

2022/12/26上海交通大學(xué)86QPI總線雖然Inte862022/12/26上海交通大學(xué)87QPI總線與AMD公司的HyperTransport(HT)總線技術(shù)相比,F(xiàn)SB的帶寬瓶頸也很明顯。HT作為AMDCPU上廣為應(yīng)用的一種端到端的總線技術(shù),它可在內(nèi)存控制器、磁盤控制器以及PCI‐E總線控制器之間提供更高的數(shù)據(jù)傳輸帶寬。HT1.0在雙向32b模式的總線帶寬為12.8GBps,可匹敵目前最新的FSB帶寬。2004年,AMD公司推出的HT2.0規(guī)格,最大帶寬又由HT1.0的12.8GBps提高到了22.4GBps。而最新的HT3.0又將工作頻率從HT2.0最高的1.4GHz提高到了2.6GHz,提升幅度幾乎又達(dá)到了一倍。2022/12/26上海交通大學(xué)87QPI總線與AMD公87QPI總線這樣,HT3.0在2.6GHz高頻率32b高位寬運(yùn)行模式下,即可提供高達(dá)41.6GBps的總線帶寬(即使在16b的位寬下也能提供20.8GBps的總線帶寬),相比FSB優(yōu)勢明顯,應(yīng)付未來兩年內(nèi)內(nèi)存、顯卡和處理器的升級需要也沒有問題。而將FSB頻率進(jìn)一步提高到2133MHz,也難以應(yīng)付未來DDR3內(nèi)存及多顯卡系統(tǒng)所帶來的帶寬需求。因此,推出新的總線技術(shù)勢在必行。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論