版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、英特爾與AMD處理器系統(tǒng)架構(gòu)的分析、探討:長(zhǎng)期以來(lái),我們討論計(jì)算機(jī)性能總是將注意力放在各個(gè)子系統(tǒng)的技術(shù)參數(shù)上。例如微處理器的速度、內(nèi)存規(guī)范、用何種等級(jí)的GPU等,而沒(méi)有意識(shí)到這些部件的協(xié)同效率會(huì)對(duì)系統(tǒng)產(chǎn)生怎樣的影響,對(duì)于系統(tǒng)連接的探討也僅限于總線技術(shù)層面。這種慣有的模式導(dǎo)致了人們對(duì)計(jì)算平臺(tái)的技術(shù)水準(zhǔn)難以產(chǎn)生明確的認(rèn)知,同時(shí)也產(chǎn)生了一個(gè)概念上的模糊空間,讓用戶在廠商的宣傳中無(wú)所適從。本文所要探討的對(duì)象便在于此:計(jì)算機(jī)的連接架構(gòu)。一輛法拉利跑車可以輕松達(dá)到300公里以上的時(shí)速,但在普通公路上它卻可能無(wú)法超過(guò)80公里道路不夠?qū)掗?、路上的行車和彎道太多等都是影響速度的因素。如果想讓它發(fā)揮應(yīng)有的潛能,那
2、么就應(yīng)該提供一個(gè)專用的賽道。其實(shí)對(duì)于計(jì)算機(jī)系統(tǒng),情況同樣如此。計(jì)算機(jī)系統(tǒng)的性能取決于微處理器、內(nèi)存、圖形、硬盤等子系統(tǒng),但即便配備頂尖的硬件,也未必能保證它們以最高的效率運(yùn)行。事實(shí)上,微處理器、內(nèi)存、圖形、硬盤只能決定自身的性能,它們的協(xié)作效率則由總線技術(shù)以及連接架構(gòu)所掌管總線技術(shù)決定帶寬,類似于道路的寬敞以及平整程度,允許數(shù)據(jù)在上面跑得多快;連接架構(gòu)則定義了兩點(diǎn)間的連接方式,是直道或者彎道,路徑最短則最優(yōu),數(shù)據(jù)傳達(dá)的效率自然最高。誰(shuí)在說(shuō)謊?“微架構(gòu)”與“連接架構(gòu)”的迷思英特爾宣稱Core架構(gòu)遠(yuǎn)遠(yuǎn)領(lǐng)先于對(duì)手,理由是指令性能更優(yōu)越;AMD也聲稱K8架構(gòu)更科學(xué),理由是更高效的內(nèi)存調(diào)用和更富彈性的連
3、接。雙方的宣傳都給出足夠多的理由,并且有充分的技術(shù)解釋。對(duì)于這種各執(zhí)一詞的說(shuō)法,如果你對(duì)處理器技術(shù)稍有了解,便會(huì)知道雙方的論點(diǎn)都沒(méi)錯(cuò),但這就導(dǎo)致一個(gè)矛盾的問(wèn)題:究竟哪一個(gè)平臺(tái)在架構(gòu)上更具優(yōu)勢(shì)?事實(shí)上,英特爾與AMD都沒(méi)有對(duì)公眾做出詳盡的解釋,他們給用戶留下一個(gè)模糊的認(rèn)知空間,回避了對(duì)方之長(zhǎng),宣揚(yáng)自身的優(yōu)點(diǎn)。公正的說(shuō)法應(yīng)該是:英特爾“Core”處理器的微架構(gòu)勝于對(duì)手,而AMDK8處理器家族則擁有更勝一籌的連接架構(gòu)。在這里,你會(huì)發(fā)現(xiàn)處理器架構(gòu)的概念一分為二:其一是“微架構(gòu)”,其二就是“連接架構(gòu)”,兩者是完全不同的概念,它們從不同的角度影響著系統(tǒng)的性能與擴(kuò)展性?!拔⒓軜?gòu)”通常是我們?cè)诤饬课⑻幚砥髟O(shè)計(jì)
4、細(xì)節(jié)時(shí)最先接觸到的概念,它描述的是處理器最基礎(chǔ)的指令執(zhí)行部分,包括執(zhí)行的方式和運(yùn)算單元的構(gòu)成等它就好比是法拉利跑車的引擎和車體框架,引擎決定了跑車所具有的速度,車體框架則讓跑車能夠在高速狀態(tài)下保持穩(wěn)正常來(lái)說(shuō),處理器的微架構(gòu)通常都是非常穩(wěn)定的,壽命可在5年以上,而每一種微架構(gòu)往往都對(duì)應(yīng)著一個(gè)處理器家族一例如PentiumIIPentiumIII都基于P6微架構(gòu),Pentium4家族基于Netburst微架構(gòu),現(xiàn)行的Core2Duo/Quad則基于“Core”微架構(gòu);AMDAthlon64/X2、Opteron系列、Turion64/X2系列則隸屬于K8微架構(gòu)。在x86領(lǐng)域,英特爾的Core微架構(gòu)
5、無(wú)疑是佼佼者,它的特點(diǎn)在于具有四發(fā)射能力,即每個(gè)周期可以同時(shí)對(duì)4條x86指令進(jìn)行解碼,Core微架構(gòu)還結(jié)合了微指令融合和宏指令融合兩項(xiàng)優(yōu)化技術(shù),同時(shí)可以對(duì)多達(dá)56條指令進(jìn)行處理。顯然,在頻率相同的情況下,處理器的指令并行度越高,實(shí)際性能就越強(qiáng)。正因?yàn)檫@方面的優(yōu)勢(shì),Core2Duo處理器才能夠在較低的頻率下保有超越高頻Pentium4的卓越性能。相比之下,AMDK8微架構(gòu)實(shí)際上只是承襲于K7體系,它同時(shí)只能對(duì)3條指令進(jìn)行解碼,也沒(méi)有任何指令優(yōu)化技術(shù),K8與K7的主要區(qū)別僅在于集成內(nèi)存控制器和64位支持一若單單從指令執(zhí)行的角度來(lái)衡量,我們可以認(rèn)為K8與K7隸屬于相同的技術(shù)體系,兩者都只能同時(shí)解碼3
6、條指令,并行能力遠(yuǎn)遜于英特爾的“Core”以及PentiumM家族所采用的“P6增強(qiáng)”微架構(gòu)。但是,AMDK8家族擁有更出色的連接架構(gòu)一微架構(gòu)決定了芯片的指令執(zhí)行效能,而連接架構(gòu)則決定系統(tǒng)輸送指令的能力。如開篇所述,連接架構(gòu)就好比是道路,車再好道路不行也跑不快;同理,倘若指令輸送能力無(wú)法跟上,處理器的執(zhí)行性能再高都無(wú)濟(jì)于事,因?yàn)樗坏貌焕速M(fèi)很多的時(shí)間在等待上面,導(dǎo)致有效工作時(shí)間的減少(類似于堵車等待,拖慢了平均速度)。AMD的K7和K8在微架構(gòu)方面變化極小,指令解碼能力沒(méi)有獲得增強(qiáng),運(yùn)算單元的數(shù)量也未增加,但K8的指令執(zhí)行性能卻遠(yuǎn)高于K7,關(guān)鍵原因就在于K8系列擁有更出色的連接架構(gòu)?,F(xiàn)在情況就
7、變得明朗了:英特爾Core平臺(tái)擁有出色微架構(gòu),但連接架構(gòu)落后于對(duì)手;AMDK8平臺(tái)微架構(gòu)落后,但它擁有一套非常先進(jìn)的連接架構(gòu)。這種情況導(dǎo)致競(jìng)爭(zhēng)雙方各有長(zhǎng)處和短處。對(duì)于微架構(gòu),之前就有過(guò)很多探討,這里就不作過(guò)多的論述,本文的重點(diǎn)在于PC的連接架構(gòu),我們要解決一些問(wèn)題:連接架構(gòu)對(duì)系統(tǒng)性能和擴(kuò)展力有何種程度的影響?PC的連接架構(gòu)將向什么樣的趨勢(shì)發(fā)展?來(lái)自80286時(shí)代的架構(gòu)一前端總線+北橋芯片+南橋I/O芯片對(duì)于英特爾平臺(tái),前端總線、北橋芯片、南橋芯片的概念從80286時(shí)代至今就沒(méi)有多少變化。處理器通過(guò)前端總線與北橋芯片連接,北橋芯片包括圖形接口控制器和內(nèi)存控制器兩個(gè)邏輯單元,北橋芯片通過(guò)特定的總線
8、與南橋芯片連接,南橋芯片則負(fù)責(zé)I/O擴(kuò)展,包括存儲(chǔ)、網(wǎng)絡(luò)、音頻、內(nèi)部擴(kuò)展總線(PCI、PCIExpressx1)、外部連接總線(并口、串口、USB)在過(guò)去二十年中,技術(shù)提升僅限于各個(gè)子系統(tǒng)的規(guī)格,例如總線的速度、內(nèi)存標(biāo)準(zhǔn)、圖形接口標(biāo)準(zhǔn)、磁盤接口標(biāo)準(zhǔn)等等,但都沒(méi)有對(duì)這套架構(gòu)作什么本質(zhì)性改變。盡管各個(gè)子系統(tǒng)的規(guī)格升級(jí)能夠讓系統(tǒng)性能獲得顯著的提升,但僵化的連接架構(gòu)同時(shí)也產(chǎn)生明顯的瓶頸,通訊延遲較長(zhǎng)的缺點(diǎn)體現(xiàn)得非常明顯。英特爾965系列芯片組基于傳統(tǒng)的南北橋連接架構(gòu),這套連接在PC誕生之后就沒(méi)有獲得本質(zhì)性的改變首先,我們來(lái)看處理器與內(nèi)存的連接。如圖2,處理器必須通過(guò)“前端總線”與北橋芯片相連,然后再經(jīng)
9、由單/雙通道“內(nèi)存總線”才能與內(nèi)存系統(tǒng)實(shí)現(xiàn)數(shù)據(jù)交換,那么這一數(shù)據(jù)交換工序就涉及到兩條不同類型的總線只有當(dāng)前端總線的帶寬高于內(nèi)存總線時(shí),處理器才能夠充分利用內(nèi)存資源。在與AMD平臺(tái)的對(duì)比測(cè)試中,Core2Duo平臺(tái)內(nèi)存性能居于明顯的下風(fēng)(搭載相同的內(nèi)存系統(tǒng)時(shí)),原因就在于此。而由于技術(shù)上的限制,前端總線難有大幅度提升的空間,這就注定內(nèi)存瓶頸難以消除。第二個(gè)缺陷在于內(nèi)存的訪問(wèn)延遲由于需要前端總線和北橋芯片的中轉(zhuǎn),處理器的內(nèi)存延遲較長(zhǎng),導(dǎo)致處理器必須浪費(fèi)很多時(shí)間在數(shù)據(jù)等待上,處理器即便擁有一流的微架構(gòu),也難以充分發(fā)揮潛能。計(jì)算機(jī)傳統(tǒng)的連接架構(gòu),存在內(nèi)存訪問(wèn)延遲長(zhǎng)、總線帶寬瓶頸等弊端對(duì)服務(wù)器來(lái)說(shuō),這套
10、連接架構(gòu)就顯得更加糟糕:倘若服務(wù)器中包含兩枚以上的處理器,那么它們都必須經(jīng)過(guò)前端總線訪問(wèn)內(nèi)存控制器,并共同分享內(nèi)存資源,借此才能夠?qū)崿F(xiàn)多處理器的任務(wù)協(xié)同。而在實(shí)際環(huán)境下,多處理器共享內(nèi)存經(jīng)常會(huì)遭遇資源沖突現(xiàn)象,即兩個(gè)處理器同時(shí)要求對(duì)某個(gè)內(nèi)存區(qū)域進(jìn)行讀寫操作,一旦遇上這種情況,其中的一枚處理器就必須停下等待,然后依順序完成。系統(tǒng)中處理器的數(shù)量越多,沖突幾率就越高,性能提升幅度也越來(lái)越小,一旦達(dá)到極限值后繼續(xù)增加處理器數(shù)量,反而會(huì)導(dǎo)致系統(tǒng)性能的大幅度下滑。英特爾自身的Xeon平臺(tái)一直未能突破八路朝向高性能計(jì)算機(jī)邁進(jìn)(IBMEAX系列芯片組除外),主要原因就在于連接架構(gòu)的限制。Xeon平臺(tái)的連接架構(gòu)
11、,處理器間無(wú)法直接通訊,共享內(nèi)存又會(huì)遭遇資源沖突的難題英特爾現(xiàn)時(shí)的Core2Duo計(jì)算平臺(tái),乃至未來(lái)的45納米“Penyrn”平臺(tái)都沒(méi)有脫離這套守舊的體系,連接架構(gòu)依然沿用“CPU-北橋(內(nèi)存控制器+圖形接口控制器)+南橋(I/O)”的傳統(tǒng)模式,數(shù)據(jù)交換的效率不高,這就限制了Core平臺(tái)性能的進(jìn)一步發(fā)揮一當(dāng)然換個(gè)角度來(lái)看,我們可以認(rèn)為Core平臺(tái)顯然具有很高的性能增長(zhǎng)潛力。Core2Duo當(dāng)前的性能水平,大概只發(fā)揮了Core架構(gòu)70%80%的潛力而已。修建PC中的“高速公路”一集成內(nèi)存控制器+芯片直連總線AMD在開發(fā)K8處理器時(shí),即參照RISC計(jì)算平臺(tái)的經(jīng)驗(yàn),對(duì)平臺(tái)的連接架構(gòu)進(jìn)行改良。K8連接
12、架構(gòu)有兩個(gè)基本的關(guān)鍵點(diǎn):一是將內(nèi)存控制器集成于處理器內(nèi)部,處理器核心與內(nèi)存控制器通過(guò)超高速、低延時(shí)的內(nèi)部總線連接;其二就是引入通用的HyperTransport總線技術(shù),實(shí)現(xiàn)處理器與處理器、處理器與I/O芯片組之間的高速直連。這兩項(xiàng)技術(shù)有效改變了傳統(tǒng)連接方案的弊病,讓處理器得以充分發(fā)揮自身潛能而不會(huì)被內(nèi)存系統(tǒng)拖后腿,同時(shí)也有利于構(gòu)建更強(qiáng)大的多路并行計(jì)算系統(tǒng)。首先我們來(lái)看集成內(nèi)存控制器會(huì)帶來(lái)哪些增益。情況非常明顯,現(xiàn)在內(nèi)存控制器與CPU核心緊密地結(jié)合在一起,兩者通過(guò)芯片內(nèi)總線實(shí)現(xiàn)數(shù)據(jù)交換芯片內(nèi)總線可以輕而易舉地達(dá)到百GB/s級(jí)別的速度,并且訪問(wèn)延遲極低,一舉克服了傳統(tǒng)平臺(tái)前端總線的制約。以此為依
13、托,內(nèi)存系統(tǒng)的性能可以得到最高限度的利用,處理器獲得數(shù)據(jù)的能力大幅度增強(qiáng),從而可以將更多的時(shí)間放在指令執(zhí)行而非數(shù)據(jù)等待上面。根據(jù)從K7到K8的過(guò)渡經(jīng)驗(yàn)來(lái)看,集成內(nèi)存控制器設(shè)計(jì)讓內(nèi)存訪問(wèn)延遲降低了50%,而K8的指令效能比K7高出25%以上,其中的關(guān)鍵點(diǎn)便是該技術(shù)的引入。將內(nèi)存控制器集成于處理器內(nèi),可有效提升內(nèi)存性能,對(duì)整機(jī)性能的提升也相當(dāng)可觀在多路服務(wù)器領(lǐng)域,集成內(nèi)存控制器的設(shè)計(jì)更是獲得廣泛的認(rèn)同。這一設(shè)計(jì)讓每顆處理器都擁有屬于自己的內(nèi)存系統(tǒng),不會(huì)再有任何因資源分享造成的性能降低或存取沖突之類的問(wèn)題,系統(tǒng)的多路擴(kuò)展也變得更加容易。不過(guò),將內(nèi)存控制器集成之后,前端總線的概念就不復(fù)存在,為了解決處
14、理器與I/O芯片的信息交換問(wèn)題,AMD引入了HyperTranport總線技術(shù),不過(guò)HyperTranport更大的意義體現(xiàn)在多處理器的擴(kuò)展AMDK8微架構(gòu)中包含三個(gè)獨(dú)立的HyperTranport控制器,可支持三路HyperTranport總線輸出,這三路總線可以根據(jù)需要同其他的處理器和I/O控制芯片連接,進(jìn)而建立起一套完整的高性能計(jì)算單元。結(jié)合上述兩項(xiàng)技術(shù),K8微架構(gòu)非常適合用于構(gòu)建超級(jí)計(jì)算機(jī)系統(tǒng),其中最著名的案例當(dāng)屬IBM為美國(guó)“洛斯阿拉莫斯”國(guó)家實(shí)驗(yàn)室設(shè)計(jì)制造的“RoadRunner”、克雷(Cray)的“RedStorm”,等等,在超級(jí)計(jì)算機(jī)500強(qiáng)排行榜上,AMDOpteron平臺(tái)
15、占有相當(dāng)重要的地位。借助HyperTransport直連總線,Opteron平臺(tái)可實(shí)現(xiàn)高度彈性的擴(kuò)展,并可用于構(gòu)建超級(jí)計(jì)算機(jī)系統(tǒng)當(dāng)然,PC不必考慮多路擴(kuò)展的問(wèn)題,先進(jìn)連接架構(gòu)的優(yōu)勢(shì)更多體現(xiàn)在內(nèi)存性能以及可升級(jí)性。我們知道,芯片組中規(guī)格最經(jīng)常變動(dòng)的就是內(nèi)存支持,現(xiàn)在內(nèi)存控制器由處理器所整合,芯片組的功能僅剩下圖形接口控制器/整合圖形和I/O擴(kuò)展,這兩個(gè)部分的功能都非常穩(wěn)定,沒(méi)有迫切升級(jí)的必要,而且處理器與芯片組連接的HyperTranport總線也是非常穩(wěn)定。換句話說(shuō),計(jì)算機(jī)的主板就變成一個(gè)規(guī)格穩(wěn)定的承載平臺(tái),用戶如果要進(jìn)行硬件升級(jí),只要更換處理器或升級(jí)內(nèi)存即可。AMDK8平臺(tái)一開始并沒(méi)有很好地
16、利用這一優(yōu)勢(shì),它額外設(shè)計(jì)了如Socket754、Socket939等不同的插槽,直到SocketAM2到來(lái)之后,K8平臺(tái)才充分利用到該連接架構(gòu)可升級(jí)性強(qiáng)的優(yōu)勢(shì),如我們既可以用單核Athlon64、也可以換為雙核Athlon64X2甚至四核Athlon64X4,即將出臺(tái)的SocketAM2+接口也保持向下兼容。從用戶的角度來(lái)看,選擇AMD平臺(tái)可以讓計(jì)算機(jī)擁有更長(zhǎng)的生命周期,相比之下,英特爾當(dāng)前的Core2Duo平臺(tái)就缺乏這個(gè)優(yōu)勢(shì)。盡管AMD擁有先進(jìn)的連接架構(gòu),但K8平臺(tái)在單機(jī)性能上已被Core2Duo所大幅度拋下,這便是受到K8微架構(gòu)落后之累。而Core2Duo平臺(tái)固然連接架構(gòu)因循守舊,但在Co
17、re微架構(gòu)的幫助下,能獲得全方位的性能領(lǐng)先。不過(guò),來(lái)自市場(chǎng)的反饋并不如英特爾所愿:Core2Duo平臺(tái)增長(zhǎng)速度不如預(yù)期,處于叫好不叫座的局面,AMD性能落后的Athlon64/X2系列則勢(shì)頭未減,很大程度上就在于K8平臺(tái)先進(jìn)的連接架構(gòu),更長(zhǎng)的生命周期保障以及豐富的芯片組/主板支援很容易就會(huì)讓人產(chǎn)生好感;而英特爾平臺(tái)高中低端涇渭分明,若你現(xiàn)在購(gòu)買了低端平臺(tái),那么就只能局限于低端的處理器和內(nèi)存系統(tǒng),日后要通過(guò)升級(jí)來(lái)大幅提升性能幾乎不可能英特爾似乎持有保守僵化的觀念,這不僅體現(xiàn)在市場(chǎng)定位上,產(chǎn)品技術(shù)策略同樣如此。AMD在多路系統(tǒng)的輝煌成功讓英特爾意識(shí)到K8直連架構(gòu)的優(yōu)越性,為此英特爾決定于2008年
18、中期后開始引入類似的設(shè)計(jì)。即將內(nèi)存控制器集成于CPU內(nèi)部,同時(shí)以一條“CSI(全稱為CommonSerialInterconnect)”高速直連總線建立多處理器之間,以及處理器與I/O芯片之間的互聯(lián),事實(shí)上,這其實(shí)只是K8連接架構(gòu)的翻版,但在效率一流的Core微架構(gòu)的輔助下,英特爾仍有能力實(shí)現(xiàn)平臺(tái)性能的大幅度提升,AMD固然可以拿出更有噱頭的Fusion混合處理器、Torrenza協(xié)處理器平臺(tái)等更先進(jìn)的連接架構(gòu),但如果不及時(shí)拿出可以同Core抗衡的新一代微架構(gòu),AMD就很難在平臺(tái)性能方面獲得領(lǐng)先,更何況它的生產(chǎn)工藝整整比英特爾落后了一代。強(qiáng)者的到來(lái)協(xié)處理器與混合處理器集成內(nèi)存控制器、芯片間高速
19、互聯(lián)總線等特性代表了PC連接架構(gòu)優(yōu)化的開始,但它遠(yuǎn)不是終結(jié)。上述兩項(xiàng)技術(shù)都是以處理器作為系統(tǒng)中樞,圖形和其他PCIExpress擴(kuò)展只是作為常規(guī)的I/O組件,在過(guò)去幾年這套架構(gòu)大概是沒(méi)什么問(wèn)題。但隨著DirectX10和統(tǒng)一渲染架構(gòu)的引入,GPU具備越來(lái)越強(qiáng)的可塑性,除了3D圖形渲染之后,GPU所擁有的強(qiáng)大浮點(diǎn)性能可以用來(lái)完成諸如物理計(jì)算、流處理、科學(xué)計(jì)算、影像解碼加速、圖像處理加速等等許多要求高計(jì)算性能的場(chǎng)合,但如此一來(lái),GPU便要與處理器交換大量的數(shù)據(jù),盡管PCIExpressxl6總線(芯片組-GPU)和HyperTransport總線(CPU-芯片組)都足夠快,但數(shù)據(jù)中轉(zhuǎn)過(guò)程必然導(dǎo)致存
20、在總線訪問(wèn)延遲較長(zhǎng)的弊端。1.全方位出擊一AMDTorrenza協(xié)處理器與Fusion混合處理器架構(gòu)AMD再度發(fā)起了連接架構(gòu)的革新,它首先提出Torrenza協(xié)處理器平臺(tái),該平臺(tái)仍然以HyperTransport為連接中樞,所不同的是應(yīng)用范圍被擴(kuò)大了,它可以用于連接浮點(diǎn)協(xié)處理器、多媒體協(xié)處理器以及圖形模塊。這樣,這類協(xié)處理器就能夠通過(guò)HyperTransport直接與處理器進(jìn)行高速通訊,協(xié)處理器所處的地位與主處理器完全對(duì)等。其中意義最大的當(dāng)屬圖形系統(tǒng),AMD通過(guò)收購(gòu)ATI成功地獲得了高端圖形業(yè)務(wù),這樣,它可以直接推出采用HyperTransport接口的高端顯卡一AMD現(xiàn)在已經(jīng)推出HyperT
21、ransport3.0標(biāo)準(zhǔn),數(shù)據(jù)傳輸頻率可達(dá)到2.6GHz若仍采用16位接口,那么GPU與處理器之間可以10.4GB/S的超高速進(jìn)行低延時(shí)的數(shù)據(jù)交換,有效提升圖形系統(tǒng)與主處理器的協(xié)作緊密程度,倘若我們此時(shí)借助GPU來(lái)完成一些通用計(jì)算任務(wù),它也能夠更加輕松地完成。在這里,我們也不難發(fā)現(xiàn)PCIExpress總線不再必要,它的作用被削弱為一些無(wú)關(guān)緊要的系統(tǒng)I/O。AMDTorrenza協(xié)處理器平臺(tái),主處理器與協(xié)處理器同樣借助HyperTransport總線實(shí)現(xiàn)對(duì)等的高速直連Torrenza是一套開放且極具彈性的平臺(tái),中高端GPU可以做成外置的圖形模塊,而入門級(jí)別的GPU則可以直接集成于處理器內(nèi)部,這
22、便是AMD提出的“Fusion”混合處理器計(jì)劃。Fusion的構(gòu)想也許有些石破天驚,如圖7所示,我們可以看到,GPU與CPU功能直接耦合,兩者共享二級(jí)緩存和內(nèi)存控制器,等同于將雙核處理器中的一個(gè)CPU核心,直接更換為GPU單元。在Fusion架構(gòu)中,GPU與CPU擁有等同的權(quán)力,它可以根據(jù)需要獲得既定的二級(jí)緩存資源,也可以同內(nèi)存系統(tǒng)進(jìn)行高速通訊。事實(shí)上,此時(shí)顯存與主內(nèi)存也合而為一。這套連接架構(gòu)最大的優(yōu)點(diǎn)就在于具有極高的資源利用效率,假設(shè)系統(tǒng)搭載的是雙通道DDR2800,那么CPU與GPU都能獲得12.8GB/S的內(nèi)存帶寬,加上有高速二級(jí)緩存的幫助,GPU性能可以獲得最大限度的保障。相較而言,現(xiàn)
23、行K8整合平臺(tái)都是將GPU集成于北橋芯片內(nèi),北橋再通過(guò)HyperTransport總線與CPU核心相連,然后通過(guò)CPU獲得內(nèi)存控制器的分享權(quán),這套架構(gòu)很難保證集成圖形能夠具有多么出色的內(nèi)存性能。事實(shí)上,AMD在設(shè)計(jì)K8微架構(gòu)時(shí)根本沒(méi)有考慮到這一點(diǎn),導(dǎo)致初期整合芯片組難以獲得內(nèi)存資源,圖形性能極差,雖然AMD現(xiàn)在解決了這一問(wèn)題,但集成圖形的內(nèi)存效率仍談不上出色,與Fusion混合處理器根本不是一個(gè)層面的產(chǎn)品。AMDFusion混合處理器,CPU與GPU地位相等,兩者都可直接與內(nèi)存控制器通訊,實(shí)現(xiàn)內(nèi)存性能的最佳化Fusion方案在成本方面也有明顯的優(yōu)勢(shì)。由于功耗的原因,F(xiàn)usion只能整合入門級(jí)的
24、GPU,但也足夠90以上的人群使用;而Fusion的圖形性能將直逼中端顯卡,購(gòu)買一塊獨(dú)立顯卡不再那么必要;同時(shí),由于芯片組的職能遭到削弱,單芯片設(shè)計(jì)將進(jìn)一步流行,整機(jī)成本也都可以進(jìn)一步降低;另外,系統(tǒng)中現(xiàn)在只要Fusion混合處理器,一枚I/O芯片就可擁有完整的計(jì)算功能,整機(jī)可以輕松做到小型化,這些因素都能夠顯著降低整機(jī)的成本。Fusion同時(shí)也具有更長(zhǎng)的生命周期,若用戶覺得有升級(jí)的必要,那么只要更換一枚處理器,就可以同時(shí)升級(jí)CPU、圖形和內(nèi)存支持。從這些情況來(lái)看,F(xiàn)usion在移動(dòng)領(lǐng)域、中低端消費(fèi)市場(chǎng)、商用領(lǐng)域顯然都擁有突出的優(yōu)勢(shì),其中移動(dòng)領(lǐng)域更是Fusion的重中之重一在理想條件下,AMD
25、可以做到在25W功耗內(nèi)實(shí)現(xiàn)CPU、GPU和內(nèi)存控制器功能,從而在平臺(tái)功耗方面戰(zhàn)勝對(duì)手,為進(jìn)入超輕薄和商用機(jī)型領(lǐng)域徹底掃除障礙!無(wú)論從何種角度考慮,F(xiàn)usion所代表的連接架構(gòu)都擁有足夠多的技術(shù)噱頭,即便AMD未來(lái)得及對(duì)CPU微架構(gòu)做出質(zhì)的改變,整體性能落后于對(duì)手,F(xiàn)usion依然能夠扮演AMD在移動(dòng)市場(chǎng)的殺手角色。Fusion的出臺(tái)意味著計(jì)算機(jī)圖形系統(tǒng)也擁有先進(jìn)的連接架構(gòu)。而在CPU方面,AMD同樣沒(méi)有停步,很早就有關(guān)于AMDK9/K10架構(gòu)的研發(fā)消息,但至今AMD一直守口如瓶。我們過(guò)去曾經(jīng)獲得這樣的消息:K9/K10將直接集成PCIExpress控制器,將I/O設(shè)備與處理器更緊密地聯(lián)結(jié)為一體
26、,這樣做的技術(shù)難度并不大,至少原ATI就掌握了單芯片40個(gè)PCIExpress通道的技術(shù)能力,將其整合于處理器內(nèi)完全可行。不過(guò),我們不應(yīng)指望集成PCIExpress控制器能帶來(lái)多明顯的性能改善,它的價(jià)值更多體現(xiàn)在降低平臺(tái)成本,因?yàn)樾酒M的職能進(jìn)一步縮減,只要一枚擁有完整I/O功能的南橋即可。由于南橋的磁盤接口、音頻、網(wǎng)絡(luò)、USB2.0等功能都不會(huì)頻繁升級(jí),一塊主板即可應(yīng)對(duì)整個(gè)架構(gòu)生命的始終,當(dāng)然這得在處理器接口保持穩(wěn)定的前提下。如果你看到這一趨勢(shì),便會(huì)發(fā)現(xiàn)AMD平臺(tái)的開放性大打折扣,除了像NVIDIA這樣擁有高端圖形技術(shù)的芯片組廠商可以依靠SLI來(lái)維持高端市場(chǎng)外,主流和低端市場(chǎng)將逐漸歸AMD自
27、家的芯片組掌控,VIA、SiS這樣的三方廠商將不斷失去機(jī)會(huì)。也正是看到這一趨勢(shì),NVIDIA現(xiàn)在積極開發(fā)通用處理器技術(shù),借此打造包含處理器、圖形和芯片組的一體化平臺(tái),AMD與英特爾也都在創(chuàng)建這樣的平臺(tái),看來(lái)未來(lái)計(jì)算機(jī)市場(chǎng)的競(jìng)爭(zhēng)也更多會(huì)是平臺(tái)的對(duì)決,而計(jì)算機(jī)工業(yè)也很有可能重返封閉時(shí)代。2.“給跑車裝上多個(gè)發(fā)動(dòng)機(jī)”英特爾的協(xié)處理器平臺(tái)英特爾所倡導(dǎo)的協(xié)處理器架構(gòu)便是披露已久的ManyCore計(jì)劃。ManyCore的關(guān)鍵點(diǎn)是在處理器內(nèi)集成數(shù)量龐大的加速單元,例如浮點(diǎn)加速器、多媒體加速器、Java解釋器、Flash加速器等等,這些加速單元圍繞著若干枚CPU核心,接受來(lái)自CPU的任務(wù)分派并將結(jié)果傳回一與AMDTorrenza/Fusion的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 花店裝修及花架展示合同
- 2025年度個(gè)人二手車交易合同(二手車拍賣平臺(tái)合作版)4篇
- 旅游人才培訓(xùn)與交流合同
- 新房屋租賃合同
- 2025年度房屋租賃合同電子版規(guī)范范本3篇
- 2025年度貴金屬質(zhì)押融資貸款合同
- 2025年度足浴店智能化改造與管理系統(tǒng)轉(zhuǎn)讓合同
- 2025年度電梯門套定制化設(shè)計(jì)與施工服務(wù)合同
- 2025年度航空貨運(yùn)裝卸作業(yè)合同范本
- 2025年度新能源公司股權(quán)轉(zhuǎn)讓協(xié)議控股權(quán)全面移交合同
- 勵(lì)志課件-如何做好本職工作
- 2024年山東省濟(jì)南市中考英語(yǔ)試題卷(含答案解析)
- 2024年社區(qū)警務(wù)規(guī)范考試題庫(kù)
- 2024年食用牛脂項(xiàng)目可行性研究報(bào)告
- 靜脈治療護(hù)理技術(shù)操作標(biāo)準(zhǔn)(2023版)解讀 2
- 2024年全國(guó)各地中考試題分類匯編(一):現(xiàn)代文閱讀含答案
- 2024-2030年中國(guó)戶外音箱行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略分析報(bào)告
- GB/T 30306-2024家用和類似用途飲用水處理濾芯
- 家務(wù)分工與責(zé)任保證書
- 武強(qiáng)縣華浩數(shù)控設(shè)備科技有限公司年產(chǎn)9000把(只)提琴、吉他、薩克斯等樂(lè)器及80臺(tái)(套)數(shù)控雕刻設(shè)備項(xiàng)目環(huán)評(píng)報(bào)告
- 消防安全隱患等級(jí)
評(píng)論
0/150
提交評(píng)論