探尋多核心CPU進(jìn)化與發(fā)展_第1頁(yè)
探尋多核心CPU進(jìn)化與發(fā)展_第2頁(yè)
探尋多核心CPU進(jìn)化與發(fā)展_第3頁(yè)
探尋多核心CPU進(jìn)化與發(fā)展_第4頁(yè)
探尋多核心CPU進(jìn)化與發(fā)展_第5頁(yè)
已閱讀5頁(yè),還剩8頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、要想提高CPU的運(yùn)算能力,有兩種途徑:一種是提高每一個(gè)運(yùn)算部件的效率,制造出更強(qiáng)大的核心,以質(zhì)取勝;另一種是增加運(yùn)算部件的數(shù)量,在CPU內(nèi)放置更多的核心,以量取勝。這兩種思路,引領(lǐng)著通用CPU在幾十年的發(fā)展道路上快速成長(zhǎng),它們?yōu)榱颂嵘\(yùn)算能力這個(gè)同樣的目標(biāo),又互相支撐、促進(jìn)和競(jìng)爭(zhēng),同時(shí)衍生出更多富有創(chuàng)新價(jià)值的設(shè)計(jì)探尋多核心CPU進(jìn)化與發(fā)展作者: Frame選擇更多的核心,還是更強(qiáng)的核心,已經(jīng)不只是用戶的任務(wù),而成為整個(gè)CPU業(yè)界關(guān)注的焦點(diǎn)。在傳統(tǒng)思路的基礎(chǔ)上,我們也看到了越來(lái)越多的架構(gòu)革新。對(duì)用戶來(lái)說(shuō),采用哪種方式提升性能并不重要,因?yàn)閷?duì)于運(yùn)算能力增強(qiáng)的渴望,是永無(wú)止境的。站在應(yīng)用的角度上講,

2、CPU用戶需要更強(qiáng)大的處理能力,制造商在相同成本上提供更出色的性能,就能獲得市場(chǎng)。以性能價(jià)格比來(lái)衡量一套系統(tǒng)或?qū)Ρ榷嗵紫到y(tǒng),是永遠(yuǎn)沒(méi)有錯(cuò)的。下文正是根據(jù)不同廠商提供的不同產(chǎn)品,為大家?guī)?lái)更多思想上的啟示,讓大家更明確地認(rèn)識(shí)和選擇適合自己的CPU產(chǎn)品。一、更多的核心 本世紀(jì)初,Intel明確表示,多核心CPU解決方案是摩爾定律發(fā)展的必然產(chǎn)物。Intel反復(fù)表明著自己的鮮明觀點(diǎn):主頻不變的情況下,從單核增加到多核,功耗增加是線性的,更容易控制,摩爾定律晶體管增加的趨勢(shì)完全可以轉(zhuǎn)換到集成多核心上來(lái)。同時(shí)AMD也在努力著,花費(fèi)巨大代價(jià)設(shè)計(jì)出原生多核特別是原生4核,以及AMD努力推廣,都表明了它鮮明的立

3、場(chǎng)與發(fā)展方向。在各個(gè)市場(chǎng)層面,IBM與SUN,Intel和AMD,還有更多廠商,無(wú)一例外都在積極實(shí)踐著多核心CPU的制造和應(yīng)用。在桌面級(jí)市場(chǎng)上,多核心CPU同樣正在以驚人的速度普及。毋庸置疑,以多核心作為未來(lái)CPU的發(fā)展趨勢(shì)是明智之舉。但就目前的發(fā)展水平和市場(chǎng)情況來(lái)看,多核心CPU正在面臨種種考驗(yàn)和壓力,多核之路的確坎坷不平。1、 設(shè)計(jì)思想這里提及的多核心,實(shí)際上是我們現(xiàn)在能夠看到實(shí)際產(chǎn)品的對(duì)等多核心CPU,如Athlon64 X2、Core 2 Duo和Core 2 Quad等CPU。所謂多核心CPU技術(shù),是在同一個(gè)硅晶片(Die)上集成了多個(gè)獨(dú)立物理核心,在實(shí)際工作中多顆核心協(xié)同工作,以達(dá)

4、到性能倍增的目的。多核心技術(shù)在應(yīng)用上的優(yōu)勢(shì)有兩個(gè)方面,一方面是為用戶帶來(lái)更強(qiáng)大的計(jì)算性能,更重要的一方面則是可滿足用戶同時(shí)進(jìn)行多任務(wù)處理和多任務(wù)計(jì)算環(huán)境的要求。單核心CPU在面對(duì)多個(gè)任務(wù)時(shí),必須為不同的任務(wù)分配CPU資源,我們可以形象理解為:?jiǎn)魏诵腃PU將CPU資源變成時(shí)間片,多個(gè)任務(wù)采用時(shí)間片輪轉(zhuǎn)的方式共享資源。面對(duì)日益增長(zhǎng)的CPU主頻和晶體管規(guī)模,芯片巨頭Intel逐漸意識(shí)到:這樣繼續(xù)下去,自己的制造技術(shù)將不能應(yīng)對(duì)迅猛增長(zhǎng)的功耗和發(fā)熱。AMD方面,受制于較短的CPU流水線和相對(duì)緩慢的工藝更新,也面臨著主頻難以提升的窘境。形成鮮明對(duì)比的是,IBM早在2001年成功產(chǎn)出了世界上第一款雙核處理器

5、POWER 4,POWER4處理器擁有2個(gè)64位PowerPC 核心。應(yīng)該說(shuō)多核之門由IBM打開,Intel與AMD迅速邁進(jìn),加速了整個(gè)業(yè)界的多核進(jìn)程。但是多核處理器僅是解決方案的一部分,更大的問(wèn)題在于軟件開發(fā)沒(méi)有跟上硬件開發(fā)的進(jìn)展。2、 性能特性在現(xiàn)在單線程應(yīng)用廣泛的情況下,程序絕大多數(shù)情況下只能使用到一個(gè)核心。這是由于CPU在工作時(shí)是受軟件高度控制的。它要處理的問(wèn)題是軟件提出的,問(wèn)題到了CPU中變成具體線程,如果軟件編寫時(shí)使用單線程,它在被CPU執(zhí)行時(shí)只能調(diào)用一個(gè)線程。多余的那個(gè)內(nèi)核和其他線程由于沒(méi)有權(quán)限執(zhí)行而浪費(fèi)。盡管利用并行CPU提高總體軟件性能的概念至少已經(jīng)出現(xiàn)近40年了,但是在開發(fā)

6、工具方面,使這種方法進(jìn)入商業(yè)市場(chǎng)的東西卻非常少??晒┏绦騿T迅速開發(fā)出來(lái)的程序還是單線程的。在廣為關(guān)注的游戲編程方面,并行多線程編程是非常困難的,在桌面級(jí)多核CPU誕生的最初幾年里,所有游戲開發(fā)商都把并行游戲編程視為噩夢(mèng)。在單線程編程軟件下,我們的CPU普遍遇到上圖這種環(huán)境。雙核心CPU的一個(gè)核心運(yùn)行系統(tǒng)檢查和一些后臺(tái)程序,另一個(gè)核心運(yùn)行前臺(tái)任務(wù)。這樣使用似乎合理,但是我們仔細(xì)思考后就會(huì)發(fā)現(xiàn),Core1基本是空閑的,因?yàn)楹笈_(tái)程序在任何時(shí)刻,都只會(huì)消耗微小的CPU資源。而在實(shí)際應(yīng)用中,不可否認(rèn)有一些并行多線程編程程序?qū)Χ嗪诵淖龀隽朔浅:玫膬?yōu)化,如上圖。它們可以將自己分身,放在不同的核心上同時(shí)運(yùn)行,

7、這樣提供了非??捎^的性能增益。在優(yōu)化最合理的情況下,多核心CPU甚至可以做到性能線性增長(zhǎng),也就是說(shuō)每增加一個(gè)核心都能帶來(lái)等同于第一個(gè)核心那樣強(qiáng)大的性能。3、性能指標(biāo)針對(duì)此情況,我們必須要引入加速比的定義,才可以為大家更清楚地解釋多核心CPU帶來(lái)的性能提升。加速比定義為串行算法在單CPU上的運(yùn)行時(shí)間與并行算法在多CPU上的并行運(yùn)行時(shí)間之比。加速比可以告訴我們,性能是否與核心數(shù)目的增長(zhǎng)同步。下圖能夠簡(jiǎn)單表示多核心CPU的加速比情況。圖中P代表性能,N代表核心數(shù)目。正如上面所介紹,如果得到了有效的多線程優(yōu)化,性能將會(huì)基本呈線性增長(zhǎng),更多的核心自然帶來(lái)更高的性能,用戶每次增加核心數(shù)目,都能感覺到性能的

8、大幅度增長(zhǎng)。而運(yùn)行單線程軟件時(shí),無(wú)論使用多少個(gè)核心,性能和單核心基本沒(méi)有區(qū)別。圖上圖,在某專業(yè)服務(wù)器上,多CPU共同處理一個(gè)任務(wù)的表現(xiàn),縱軸為加速比,在這個(gè)實(shí)例中,我們可以對(duì)上文所提到的加速比概念更加明晰。由于程序做出了有效優(yōu)化,圖中的多CPU服務(wù)器性能優(yōu)異。如上圖,我們不能忽視,在大規(guī)模并行運(yùn)算領(lǐng)域,增加大量的CPU,是提高系統(tǒng)運(yùn)算能力的關(guān)鍵。這條路在今天繼續(xù)發(fā)揮巨大作用,但由于應(yīng)用環(huán)境不同,我們不能簡(jiǎn)單地以大規(guī)模并行運(yùn)算的發(fā)展來(lái)預(yù)測(cè)多核CPU的未來(lái)進(jìn)程。多核心CPU的另外一個(gè)重要優(yōu)勢(shì)是在繁多的程序壓力下,能提供非??焖俚捻憫?yīng)能力。而在單核心CPU上,由于多個(gè)程序共享CPU資源,往往造成響應(yīng)

9、不及時(shí),如果遇到異常情況,系統(tǒng)可能在一段時(shí)間內(nèi)由于CPU資源被占用而完全失去響應(yīng)能力。4、實(shí)際效能在對(duì)等多核心的組織形式方面,Intel和AMD執(zhí)行著各自不同的多核架構(gòu)。在2005年,我們看到了Smithfield登場(chǎng),這款被用來(lái)替換掉Tejas的處理器實(shí)際上是兩枚Presoctt粘在一同一枚管芯達(dá)成的雙核方案,顯然當(dāng)時(shí)Intel把更多精力放在下一代雙核心Conroe身上。這時(shí)AMD雙核心Athlon 64 X2架構(gòu)使用了Direct Connect Architecture,增添了“系統(tǒng)請(qǐng)求接口”(System Request Interface,SRI)和“交叉開關(guān)”(Crossbar S

10、witch)。它們的作用是對(duì)兩個(gè)核心的任務(wù)進(jìn)行仲裁、及實(shí)現(xiàn)核與核之間的通信。隨后Intel原生的雙核心Conroe架構(gòu)誕生了,它與雙核心Athlon 64 X2的爭(zhēng)斗一直延續(xù)到今天。為了繼續(xù)壓制AMD,Intel在有了第一次“粘貼”的經(jīng)驗(yàn)下,很快推出了四核心CPU,如下圖,它的構(gòu)成方式同樣很簡(jiǎn)單。兩顆核心封裝在一個(gè)芯片上,卻需要通過(guò)前端總線并繞行北橋芯片進(jìn)行通信。但圖片告訴我們的不只是Core 2 Quad的核心構(gòu)成方式,Intel用數(shù)據(jù)證明,4顆核心(2個(gè)雙核CPU)封裝在一起并沒(méi)有爭(zhēng)用總線資源。如圖,1333MHz前端總線可以提供8.5GB/s帶寬,而Core 2 Quad在數(shù)據(jù)密集型操作

11、中,最多使用了其中的5 GB/s帶寬。AMD方面,為了應(yīng)對(duì)對(duì)手的4核CPU,在Core 2 Quad之后發(fā)布了AMD 4X4平臺(tái),它使用2顆雙核CPU通過(guò)HyperTransport總線直接通信,但由于沒(méi)有封裝在一個(gè)芯片上,會(huì)帶來(lái)很多麻煩。在經(jīng)歷了諸多磨難后,終于在2007年9月發(fā)布了遲到的“原生4核”CPU,它同樣使用了Direct Connect Architecture,顯著提高了多核心效率?,F(xiàn)在讓我們看看桌面市場(chǎng)上,各款多核心CPU的表現(xiàn),因?yàn)橐懻摷軜?gòu)不同架構(gòu)帶來(lái)的影響,所以我們把對(duì)比重點(diǎn)放在加速比方面,得分會(huì)因具體CPU性能而異,但架構(gòu)特性會(huì)明顯體現(xiàn)。這里我們使用的軟件是CINEB

12、ENCH 9.5,它對(duì)多核心做出了非常好的優(yōu)化,而且結(jié)果方便分析。CINEBENCH的渲染任務(wù)可以在同一臺(tái)計(jì)算機(jī)上測(cè)試多達(dá)16個(gè)處理器的性能,讓系統(tǒng)性能達(dá)到極限。CPU型號(hào)C2D-E6300A64 X2 5000+C2D-QX6850AMD FX74Yorkfield 2.33GHz單核得分313385387457429多核得分579712123414631371加速比1.851.853.193.203.20我們看到,經(jīng)過(guò)優(yōu)化設(shè)計(jì)的Core 2 Duo和Athlon 64 X2表現(xiàn)優(yōu)秀,形象地說(shuō):1+1=1.85,這個(gè)加速幅度是比較大的,達(dá)到了較高的利用率。Core 2 Quad雖然沒(méi)有爭(zhēng)用系

13、統(tǒng)總線資源,但是由于核心的交換效率和交換延遲,和兩個(gè)CPU分置的AMD 4X4平臺(tái)基本相當(dāng)。AMD FX74由于采用的高效的互連總線,加速比讓我們滿意,但兩顆CPU的功耗和平臺(tái)成本總體高于Core 2 Quad。Intel的45納米Penryn家族Yorkfield仍然使用了兩個(gè)雙核CPU使用前端總線連接的形式,在芯片組的支持下,達(dá)到了3.20的加速比。我們沒(méi)有獲得準(zhǔn)確的原生四核設(shè)計(jì)的AMD K10 Barcelona系列得分,但它的加速比應(yīng)該高于使用HyperTransport總線連接的AMD 4X4平臺(tái)。二、更強(qiáng)的核心 單核CPU是否走到了盡頭?廣大的用戶是否只能購(gòu)買更多的核心,并期待得到

14、完美的優(yōu)化,才能得到滿意的性能?線性增長(zhǎng)的不僅是性能,還有功耗和發(fā)熱,誰(shuí)來(lái)為這些“副產(chǎn)品”買單?1、設(shè)計(jì)思想向著性能增長(zhǎng)這同一個(gè)目標(biāo),更多芯片廠商做出了不懈探索。為了證明更強(qiáng)的核心仍然是我們追求的重要目標(biāo),打開多核心CPU之門的IBM,做出了近乎于背道而馳的舉動(dòng)新一代高性能芯片POWER 6,維持上一代芯片雙核心設(shè)計(jì),而增強(qiáng)了單個(gè)核心的性能。IBM POWER 6處理器,繼續(xù)駐足雙核,但是重新擎起性能的“殺手锏”頻率。據(jù)IBM介紹,伴隨芯片主頻的提升,散熱問(wèn)題會(huì)變得越來(lái)越嚴(yán)重,一方面這將消耗更多的電能,另一方面,散熱問(wèn)題也會(huì)限制芯片的制造材質(zhì)。這個(gè)觀點(diǎn)已被業(yè)界一致認(rèn)同,并為多核心CPU做了強(qiáng)勁

15、的催化劑,但POWER 6告訴我們,更強(qiáng)大的核心性能完全有待挖掘,應(yīng)用新技術(shù)和新思路,我們可以讓單個(gè)核心繼續(xù)高速發(fā)展。2、性能特性對(duì)于競(jìng)爭(zhēng)對(duì)手對(duì)更多線程處理能力的追求,IBM有不同看法,多線程技術(shù)雖可提高同一時(shí)間內(nèi)并行處理任務(wù)的效率和能力,但是卻需要軟件開發(fā)商提供相關(guān)軟件的支持。以IBM AS400來(lái)說(shuō),早在1995年就實(shí)現(xiàn)了雙線程,但是IBM當(dāng)時(shí)在改造支持雙線程的系統(tǒng)軟件上花了很多功夫。在運(yùn)算性能需求更多的商業(yè)領(lǐng)域,目前很多企業(yè)的應(yīng)用卻還非常需要單線程技術(shù),單線程編程的軟件仍然占到絕大多數(shù)。在這類應(yīng)用中,如果提高了CPU的核心頻率,將給用戶帶來(lái)非常實(shí)際立竿見影的性能提升。在這個(gè)角度上POWE

16、R 6等一些單核心性能強(qiáng)大的CPU設(shè)計(jì)更符合市場(chǎng)實(shí)際,貼近用戶需求。3、性能指標(biāo)讓我們?cè)俅位氐郊铀俦鹊亩x上,但這次我們把頻率分段,簡(jiǎn)單探討頻率的提升讓我們獲得的實(shí)際性能。如上圖,P代表性能,F(xiàn)代表運(yùn)行頻率。在排除其他因素的干擾下,一個(gè)對(duì)性能需求強(qiáng)大的程序,在CPU頻率不斷增長(zhǎng)的情況下,性能呈現(xiàn)非常穩(wěn)定的線性增長(zhǎng)而不間斷。這個(gè)程序不需要做多線程優(yōu)化,即使它已經(jīng)是一個(gè)經(jīng)過(guò)多線程編程的程序,同樣在單個(gè)CPU上可以獲得如圖的性能提升。單核心CPU對(duì)于性能的提高簡(jiǎn)單得多,在用戶實(shí)際應(yīng)用中,也容易得多?;氐筋l率的最初定義我們可以發(fā)現(xiàn),CPU的主頻表示在CPU內(nèi)數(shù)字脈沖信號(hào)震蕩的速度,它決定了CPU的運(yùn)行

17、速度。在核心架構(gòu)相同情況下,頻率的提升比任何優(yōu)化都要來(lái)得更直接、更實(shí)際。但是芯片廠商不得不面對(duì)單核心頻率、規(guī)模和集成度提升帶來(lái)的巨大壓力。功耗和發(fā)熱的控制幾乎完全建立在芯片制造工藝的提升上,IBM此次舉動(dòng),也是建立在攻破65納米SOI絕緣硅、10層金屬互連工藝、高K金屬介質(zhì)、三維芯片堆疊和Airgap等技術(shù)的基礎(chǔ)之上,顯然這個(gè)代價(jià)是巨大的。更強(qiáng)大的內(nèi)核與更多的內(nèi)核數(shù)量并不矛盾,任何廠商每一次新核心的設(shè)計(jì)都是以單核為原本,在提高了單核性能的基礎(chǔ)上,可以增添內(nèi)核數(shù)量,Penryn是這樣,K10的單核改進(jìn)更加明顯。這其中包括Intel在多媒體方面增益顯著的全新的SSE4指令集,AMD公布的未來(lái)讓單核

18、心性能最大化甚至可以與RISC架構(gòu)抗衡的SSE5指令集對(duì)于處理器的發(fā)展趨勢(shì)而言,多核化與高主頻不是互相矛盾的選項(xiàng)。實(shí)際上,未來(lái)的處理器設(shè)計(jì)趨勢(shì),將是在上述選項(xiàng)中選擇若干項(xiàng),然后再結(jié)合成本因素,最終選擇出一個(gè)平衡和優(yōu)化的方案。如上圖,Intel很早就意識(shí)到,提升User Experience(用戶體驗(yàn))是永恒不變的目標(biāo),同時(shí)提高主頻或者說(shuō)制造更強(qiáng)大的核心,永遠(yuǎn)是正確的選擇。三、異構(gòu)多核心 我們需要更多的核心,還是更強(qiáng)的核心?在這兩種選擇之上,我們還能有別的思路來(lái)拓展性能,實(shí)現(xiàn)飛躍嗎?相對(duì)于對(duì)等多核心概念,越來(lái)越多的廠商和技術(shù)人員開始涉足異構(gòu)多核心。簡(jiǎn)而言之就是一塊芯片可以集成多個(gè)核心,但這些核心

19、不是完全一樣的。異構(gòu)多核心芯片上集成有主要核心、輔助核心,甚至有專門負(fù)責(zé)處理某種問(wèn)題的核心我們以幾個(gè)生動(dòng)的例子讓大家更清晰地了解這種思路。1、Cell芯片IBM為索尼PS3游戲機(jī)定制的Cell是一枚擁有9個(gè)硬件核心的多核處理器,它的多核結(jié)構(gòu)同以往的多核心產(chǎn)品完全不同。在Cell芯片中,只有一個(gè)核心擁有完整的功能,被稱為主處理器,其余8個(gè)核心都是專門用于浮點(diǎn)運(yùn)算的協(xié)處理器。9個(gè)CPU內(nèi)核采用“1+8模式”,一個(gè)Power架構(gòu)RISC型64位CPU內(nèi)核“PPE”和8個(gè)浮點(diǎn)處理用的32位8路SIMD型CPU內(nèi)核“SPE”(Synergistic Processing Element)。Power微處

20、理器內(nèi)核是Cell處理器的大腦,是運(yùn)行設(shè)備的主操作系統(tǒng),并為8個(gè)“協(xié)處理器”分配任務(wù)。圖為Cell的核心電路分布,從圖中可以清晰看到Cell的9個(gè)內(nèi)核。PPE可同時(shí)執(zhí)行2個(gè)線程的SMT架構(gòu),協(xié)處理核心SPE可同時(shí)執(zhí)行2條指令超標(biāo)量,并配備有128位×128個(gè)的通用寄存器。1個(gè)SPE的最大單精度浮點(diǎn)運(yùn)算速度為32GFLOPS,8個(gè)SPE合計(jì)為256GFLOPS(2560億次浮點(diǎn)運(yùn)算每秒),接近超級(jí)計(jì)算機(jī)的水準(zhǔn),遠(yuǎn)遠(yuǎn)超越目前所有的X86和RISC處理器。作為對(duì)比,Intel的4路Montecito安騰(雙內(nèi)核)系統(tǒng)也僅獲得45Gigaflops的浮點(diǎn)性能。Cell只花費(fèi)了2.34億個(gè)晶體

21、管,功耗在80-100W左右,能源利用效率比現(xiàn)在設(shè)計(jì)最佳的RISC和X86處理器都高出數(shù)十倍,這足以說(shuō)明Cell專用、多核設(shè)計(jì)思想的優(yōu)越性。Cell的成功,讓我們看到了異構(gòu)多核心強(qiáng)大的力量,也促使我們把目光放得更遠(yuǎn)。2、傳統(tǒng)多核再次演變Many Core計(jì)劃如果說(shuō)Cell的出色設(shè)計(jì)給我們指明了新的方向,Intel和AMD的未來(lái)計(jì)劃則更能引起PC消費(fèi)市場(chǎng)的關(guān)注,并且明確地為我們演繹了通用處理器(以X86架構(gòu)為代表)和專用處理器(以DSP數(shù)字信號(hào)處理器為代表)在多媒體專用任務(wù)方面的效能競(jìng)爭(zhēng)。如上圖,在處理某一專用任務(wù)時(shí),按照現(xiàn)在的發(fā)展速度,通用CPU在2015年前后消耗75W電力,也只能

22、達(dá)到DSP大約60%的效能。而DSP由于使用專用邏輯電路,在這一任務(wù)上使用2W的電力,也能大幅度超越通用CPU。同時(shí)由于DSP芯片構(gòu)成構(gòu)造相對(duì)簡(jiǎn)單,頻率提升也要容易很多。在圖形芯片GPU方面,AMD新一代GPURadeon HD 2000系列芯片已經(jīng)為DSP做出了非常成功的實(shí)踐。AMD集成在2400、2600圖形芯片當(dāng)中的UVD,即通用視頻解碼器,主要負(fù)責(zé)硬件解碼H.264、VC-1等HD視頻。UVD區(qū)域在2400、2600系列圖形芯片當(dāng)中的面積只有4.7平方毫米,而雙核心CPU軟解H.264、VC-1等HD視頻所動(dòng)用到的晶體管面積有126平方毫米,同理CPU電力消耗更為龐大,如下圖。Many

23、 Core基于上述理論,將CPU分為兩個(gè)部分:傳統(tǒng)的X86架構(gòu)通用CPU是第一個(gè)部分,它執(zhí)行所有通用任務(wù),并負(fù)責(zé)對(duì)專用任務(wù)進(jìn)行分派;第二個(gè)部分是很多的DSP處理單元,用于某些特殊任務(wù)的處理。處理器將高負(fù)載的專用任務(wù)轉(zhuǎn)交給DSP執(zhí)行之后,主核心的運(yùn)算壓力就大大減輕,系統(tǒng)整體效能將獲得明顯提升。在2005年的IDF技術(shù)峰會(huì)上,Intel對(duì)外公布了Many Core超多核發(fā)展藍(lán)圖。隨著時(shí)間推移,Many Core計(jì)劃越來(lái)越明晰,我們可以肯定它將成為Intel未來(lái)的X86處理器架構(gòu)。第一代Many Core架構(gòu)處理器可能采用“3個(gè)通用X86核心+16個(gè)DSP內(nèi)核

24、”的組合,如下圖。大約到2010年,我們有望看到第一代Many Core處理器出臺(tái),第一代Many Core并沒(méi)有做出整體架構(gòu)的重大調(diào)整,從布局和核心重要性上說(shuō),這對(duì)Intel只是一次試水。第一代Many Core計(jì)劃以Intel四核CPU為基礎(chǔ),將其中的一個(gè)單核置換為16個(gè)體積小巧的DSP內(nèi)核,實(shí)現(xiàn)了戰(zhàn)略計(jì)劃的平穩(wěn)過(guò)度,也符合Intel制定的時(shí)間表。Many Core計(jì)劃將在2015年過(guò)渡到第二代,這個(gè)過(guò)度同樣會(huì)非常平滑,中間會(huì)有很多過(guò)程。現(xiàn)在計(jì)劃的第二代Many Core計(jì)劃中,DSP核心將取代傳統(tǒng)的通用X86核心地位,成為芯片主體,如下圖

25、。第二代Many Core處理器,將擁有8個(gè)通用X86核心、64個(gè)專用DSP邏輯。Intel從這往后將逐步引入Many Core Array架構(gòu),不斷增強(qiáng)DSP的數(shù)量以及執(zhí)行能力,通用核心的地位將隨著時(shí)間推移不斷減弱,直到最后完全可能實(shí)現(xiàn)以DSP占主導(dǎo)地位的專用化運(yùn)算模式。3、HyperTransport協(xié)處理器系統(tǒng)Torrenza計(jì)劃面對(duì)Intel如此強(qiáng)大長(zhǎng)遠(yuǎn)的計(jì)劃,AMD會(huì)有什么反應(yīng)呢?HyperTransport協(xié)處理器系統(tǒng)很自然地浮出水面。從名稱上我們可以得知,Many Core是一種芯片架構(gòu),而HyperTransport協(xié)處理器系統(tǒng)則需要其他

26、因素的配合。AMD的這項(xiàng)計(jì)劃將利用現(xiàn)有的HyperTransport總線連接架構(gòu),對(duì)多路服務(wù)器系統(tǒng)進(jìn)行拓展。傳統(tǒng)的AMD多路CPU架構(gòu)如圖:HyperTransport總線在整個(gè)架構(gòu)中連接起多顆CPU,多路CPU架構(gòu)能夠?yàn)橛脩籼峁┮粋€(gè)非常高效的運(yùn)算平臺(tái)。但面對(duì)專用協(xié)處理器的優(yōu)異特性,AMD決定將其中一顆CPU置換為一個(gè)協(xié)處理器。AMD沒(méi)有自己開發(fā)這顆協(xié)處理器,而是開放了Torrenza計(jì)劃,希望以此為契機(jī),建立一個(gè)以AMD為中心的企業(yè)生態(tài)圈。這樣將利益與伙伴共享,同時(shí)也降低了研發(fā)新架構(gòu)的投入,分擔(dān)風(fēng)險(xiǎn)。AMD給出的具體解決方案如上圖,將八路Opteron中的一顆Opteron處理器置換成矢量協(xié)

27、處理器,以此實(shí)現(xiàn)矢量計(jì)算性能的大幅度增長(zhǎng),而Opteron平臺(tái)本身不需要作任何形式的變動(dòng)。在未來(lái),這種拓展架構(gòu)也可以延伸到PC領(lǐng)域,例如在PC中掛接基于HyperTransport總線的浮點(diǎn)協(xié)處理器、物理協(xié)處理器、視頻解碼器、專門針對(duì)Java程序的硬件解釋器,甚至可以是由nVIDIA或ATI開發(fā)的圖形處理器。為達(dá)成上述目標(biāo),AMD必須設(shè)計(jì)出一個(gè)高度穩(wěn)定的統(tǒng)一接口方便用戶進(jìn)行擴(kuò)展,而借助各種各樣的協(xié)處理器,AMD64系統(tǒng)的性能將獲得空前強(qiáng)化。AMD在完成對(duì)ATI收購(gòu)之后又發(fā)布了Fusion“融合”計(jì)劃,在CPU內(nèi)整合GPU。另外,最近AMD還發(fā)布了Steam產(chǎn)品,即通用GPU(GPGPU),使用

28、顯卡進(jìn)行通用計(jì)算。AMD這三項(xiàng)計(jì)劃實(shí)際上是統(tǒng)一的“加速計(jì)算”,即Fusion和Steam都是Torrenza平臺(tái)的一部分。在已經(jīng)實(shí)施的Torrenza計(jì)劃中,AMD開放最新的處理器架構(gòu)、HT總線插槽技術(shù)、以便伙伴廠商可以共同開發(fā)協(xié)處理器,最終合作形成更優(yōu)化且高度整合的應(yīng)用方案。在異構(gòu)多核心飛速前進(jìn)的路途中,Intel和AMD兩個(gè)巨頭的產(chǎn)品計(jì)劃中,更多地體現(xiàn)了它們的企業(yè)文化和整體戰(zhàn)略。四、SoC走上前臺(tái) 片上系統(tǒng)(SoC:System-on-a-chip)指的是在單個(gè)芯片上集成一個(gè)完整的系統(tǒng),對(duì)所有或部分必要的電子電路進(jìn)行包分組的技術(shù)。所謂完整的系統(tǒng)一般包括CPU、存儲(chǔ)器、以及外圍電路等。 So

29、C是與其它技術(shù)并行發(fā)展的,如絕緣硅(SOI),它可以提供增強(qiáng)的時(shí)鐘頻率,從而降低微芯片的功耗。片上系統(tǒng)技術(shù)通常應(yīng)用于小型的,日益復(fù)雜的客戶電子設(shè)備。例如,聲音檢測(cè)設(shè)備的片上系統(tǒng)是在單個(gè)芯片上為所有用戶提供包括音頻接收端、模數(shù)轉(zhuǎn)換器(ADC)、微處理器、必要的存儲(chǔ)器以及輸入輸出邏輯控制等設(shè)備,此外系統(tǒng)芯片還應(yīng)用于單芯片無(wú)線產(chǎn)品。雖然在這個(gè)領(lǐng)域,Intel還是新手,但它在2007春季IDF上已經(jīng)擬定了自己的計(jì)劃Tolapai與Silverthorne。媒體與分析人士認(rèn)為,作為半導(dǎo)體界巨人的Intel從未涉足過(guò)SoC領(lǐng)域,SoC可能是Intel公司長(zhǎng)期技術(shù)策略最為新奇的組成部分,在某種程度上標(biāo)志著Intel公司的新航程。當(dāng)然我們要看到,Intel在很久以前就已經(jīng)研發(fā)出了Xscale架構(gòu)的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論