高級計算機系統(tǒng)結構綜述匯總_第1頁
高級計算機系統(tǒng)結構綜述匯總_第2頁
高級計算機系統(tǒng)結構綜述匯總_第3頁
高級計算機系統(tǒng)結構綜述匯總_第4頁
高級計算機系統(tǒng)結構綜述匯總_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、目錄1 .概述31.1 計算機系統(tǒng)結構的發(fā)展31.3 計算機系統(tǒng)的層次結構32 .計算機指令集結構42.1 指令結構的分類42.2 指令集結構的功能設計53 .流水線技術63.1 流水線的基本概念63.2 流水線的相關與沖突83.3 向量處理機94 .指令并行104.1 指令的靜態(tài)調度與動態(tài)調度104.2 動態(tài)分支預測技術105 .存儲器的層次結構115.1 存儲器的結構115.2 Cache的基本知識125.3 主存與虛擬存儲器136 .輸入/輸出系統(tǒng)136.1 總線136.2 通道處理機147 .計算機系統(tǒng)結構的發(fā)展趨勢147.1 高性能計算機體系結構147.2 高性能計算的發(fā)展方向15參

2、考文獻17高級計算機系統(tǒng)結構綜述摘要:計算機體系結構是一門連接硬件與軟件的學科,在不斷的深入研究過程中,一直在追求計算機的功能、性能、功率以及花費的高度協(xié)調,以期達到各方面的最佳狀態(tài),在花費、能量、可用性的抑制下,實現(xiàn)計算機的多功能、高性能、低功率、少花費的新時代。本篇綜述主要講述計算機指令集結構設計,流水線技術,指令級并行,存儲器層次結構,輸入/輸出系統(tǒng)以及計算機系統(tǒng)結構的發(fā)展趨勢。關鍵字:高級計算機系統(tǒng)結構,流水線技術,指令級并行,存儲器層次結構,輸入/輸出系統(tǒng)OverviewofadvancedcomputerarchitectureAbstract:Thecomputerarchite

3、ctureisasubjectwhichconnectshardwareandsoftware.Intheprocessofcontinuousin-depthstudy,ithasbeenpursuingthefunction,performance,powerandcostofthecomputer,inordertoachievethebeststateineveryaspect,andrealizetheneweraofmulti-function,highperformance,lowpowerandlowcost.Thispapermainlyfocusesonthecompute

4、rinstructionsetarchitecture,pipelinetechnology,instructionlevelparallelism,memoryhierarchy,input/outputsystemandthedevelopmenttrendofcomputerarchitecture.Keywordsadvancedcomputerarchitecture,pipelinetechnology,instructionlevelparallelism,memoryhierarchy,input/outputsystem.1 .概述1.1 計算機系統(tǒng)結構的發(fā)展世界上第一臺電子

5、數(shù)字計算機是1946年在美國賓夕法尼亞大學制成的,這是科學史上一次劃時代的創(chuàng)新,它奠定了電子計算機的發(fā)展基礎。提高計算機速度始終是發(fā)展計算機性能的一個突出問題,器件的發(fā)展對推動計算機的發(fā)展起了重大作用。然而機器速度提高的速率越來越慢,這一事實促使人們對計算機系統(tǒng)結構做更多的研究工作更多潛力。VLSI技術的發(fā)展,帶來了集成度高、體積小、功耗低、可靠性高、價格便宜的器件,使得計算機系統(tǒng)可以通過采用更加復雜的系統(tǒng)結構來創(chuàng)造出性能更高、工作可靠、價格合理的高性能計算機。20世紀60年代初期,隨著晶體管和磁芯存儲器的出現(xiàn),處理單元和存儲器實現(xiàn)小型化,并行計算機開始出現(xiàn)。到了20世紀60年代末期,單一處理

6、器中可以集成多個功能單元,產(chǎn)生了流水線技術。在70年代初,與向量計算機同時出現(xiàn)了并行處理機,這類計算機同向量計算機的應用領域很多是相同的,但專業(yè)性更強。20世紀80年代開始,微處理器技術高速發(fā)展。此時,微處理器隨著機器的字長從4位、8位、16位一直增加到32位、64位,其性能也隨之顯著提高。另外,80年代在單處理機中提高指令執(zhí)行的并行度方面也有新發(fā)展。簡化指令系統(tǒng)計算機(RISC)簡化了指令系統(tǒng)使能充分發(fā)揮流水線的作用,超長指令字(VLIWI計算機和超級標量機的目標更提高了一步。從20世紀90年代末開始,以前發(fā)展的主要幾種體系逐步走向融合,同時隨著新技術的出現(xiàn)又為新的架構帶來了新的革命。200

7、6年,處理器開始從單核轉向多核處理器發(fā)展,多核處理器已不再局限于高端服務器,開始向PC機普及,多核處理器使PC機變成并行式計算機。多核技術在高性能計算中也已獲得了廣泛應用。1.3 計算機系統(tǒng)的層次結構計算機是一個十分復雜的硬、軟件結合而成的整體。它通常是多層次結構的,每一級各對應一類機器,各有自己的機器語言。在這里,“機器”的定義是能存儲、執(zhí)行程序的算法和數(shù)據(jù)結構的集合體。各級機器的算法和數(shù)據(jù)結構的實現(xiàn)方法不同:M0由硬件實現(xiàn),M1由微程序(固件)實現(xiàn),M2-M5由軟件實現(xiàn)。由軟件實現(xiàn)的機器稱為虛擬機器,以區(qū)別由硬件或固件實現(xiàn)的實際機器。各級的程序被翻譯成比它低一級的語言的程序,或由低一級的程

8、序解釋。如下圖所示:局級語百機器M4.具有L4機器語言(高級語言)f匯編語言機器M3具有L3機器語言(匯編語言)if操作系統(tǒng)機器M2,具有L2機器語言(作業(yè)控制語言等)1傳統(tǒng)機器M1具有L1機器語言(微機器令系統(tǒng))微程序機器M0具有L0機器語言(微指令系統(tǒng))圖1.1計算機系統(tǒng)的層次結構圖應用語言機器M5 具有L5機器語言(應用語言)_ 應用語言程序經(jīng)應用程序包翻譯成高級語言程序高級語言程序經(jīng)編譯程序翻譯成匯編語百匯編語言程序經(jīng)匯編程序翻譯成機器語言程序般機器語言程序解釋作業(yè)控制語句等用微指令程序解釋機器指令微指令由硬件直接執(zhí)行2 .計算機指令集結構2.1 指令結構的分類根據(jù)CPUfr用來存儲操

9、作數(shù)的存儲單元的類型,可將指令集結構分為堆棧型指令集結構、累加器型指令集結構和通用寄存器型指令集結構。1 .堆棧型指令集結構:堆棧型是一種表示計算的簡單模型,指令短小,不能隨機訪問堆棧,從而很難生成有效代碼。同時,由于堆棧是瓶頸,所以很難被高效地實現(xiàn)。2 .累加器型指令集結構:累加器型減少了機器的內(nèi)部狀態(tài),由于累加器是唯一的暫存器,指令短小,這種機器的存儲器通信開銷最大。3 .通用寄存器型指令集結構:寄存器型易于生成高效的目標代碼,所有操作數(shù)均需命名,且要顯式表示,因而指令比較長?,F(xiàn)代大多數(shù)機器均采用通用寄存器型指令集結構,因為寄存器和cpirt部其他存儲單元一樣,要比存儲器快。其次是對編譯器

10、而言,可以更加容易、有效地分配和使用寄存器。根據(jù)通用寄存器型指令集結構,又可進一步分為以下三種類型:寄存器-寄存器型(R及具優(yōu)點是簡單,指令字長固定,是一種簡單的代碼生成模型,各種指令的執(zhí)行時鐘周期數(shù)相近。缺點與指令中含存儲器操作數(shù)的指令集結構相比指令條數(shù)多,因而其目標代碼量較大。寄存器-存儲器型(RM其優(yōu)點是可以直接對存儲器操作數(shù)進行訪問,而不必先用load指令進行加載。容易對指令進行編碼,且其目標代碼量較小。缺點是指令中的操作數(shù)類型不同。在一條指令中同時對一個寄存器操作數(shù)和存儲器操作數(shù)進行編碼,將限制指令所能夠表示的寄存器個數(shù)。指令的執(zhí)行時鐘周期數(shù)因操作數(shù)的來源(寄存器或存儲器)不同而差別

11、比較大。存儲器-存儲器型(MM具優(yōu)點是一種最緊密的編碼方式,無需“浪費”寄存器保存變量。缺點是指令字長多種多樣。每條指令的執(zhí)行時鐘周期數(shù)也大不一樣,對存儲器的頻繁訪問將導致存儲器訪問瓶頸問題。這種類型的指令集結構現(xiàn)在已不用了。2.2 指令集結構的功能設計在設計指令集結構時,有兩種截然不同的設計策略,產(chǎn)生了兩類不同的計算機系統(tǒng):CISC即復雜指令集計算機。它是增強指令功能,把越來越多的功能交由硬件來實行,并且指令的數(shù)量也是越來越多。CISC通過只執(zhí)行在程序中經(jīng)常使用的指令來簡化處理器的結構,而特殊操作則以子程序的方式實現(xiàn),它們的特殊使用通過處理器額外的執(zhí)行時間來彌補。RISC即精簡指令集計算機。

12、它是盡可能的把指令集簡化,不僅指令的條數(shù)少,而且指令的功能也比較簡單。RISC包含許多應用程序中很少使用的特定指令,執(zhí)行數(shù)字存在內(nèi)存而非暫存器的運算。相比之下,比較復雜的指令集較容易使工作更完善,內(nèi)存及快取的效率較高,以及較為簡單的程式碼。3 .流水線技術3.1 流水線的基本概念流水線技術是將一個重復的時序過程分解成為若干個子過程,而每一個子過程都可有效地在其專用功能段上與其他子過程同時執(zhí)行。流水線中的每個子過程及其功能部件稱為流水線的級或段,段與段相互連接形成流水線。流水線的段數(shù)稱為流水線的深度。流水線技術具有以下特點(1)流水過程由多個相聯(lián)系的子過程組成,每個過程稱為流水線的“級”或“段”

13、。(2)每個子過程由專用的功能段實現(xiàn)。(3)各個功能段所需時間應盡量相等。流水線需要有“通過時間”,在此之后流水過程才進入穩(wěn)定工作狀態(tài),每一個時鐘周期流出一個結果。(4)流水技術適合于大量重復的時序過程,只有在輸入端能連續(xù)地提供任務,流水線的效率才能充分發(fā)揮。從不同的角度和觀點,可以把流水線分成多種不同的種類。如下圖所示:圖2.1流水線分類圖單功能流水線:只能完成一種固定功能的流水線多功能流水線:流水線的各段可以進行不同的連接,從而使流水線在不同的時間,或者在同一時間完成不同的功能。靜態(tài)流水線:在同一時間內(nèi),流水線的各段只能按同一種功能的連接方式工作。動態(tài)流水線:在同一時間內(nèi),當某些段正在實現(xiàn)

14、某種運算時,另一些段卻在實現(xiàn)另一種運算。部件級流水線(運算操作流水線):把處理機的算術邏輯部件分段,以便為各種數(shù)據(jù)類型進行流水操作處理機級流水線(指令流水線):把解釋指令的過程按照流水方式處理。處理機間流水線(宏流水線):由兩個以上的處理機串行地對同一數(shù)據(jù)流進行處理,每個處理機完成一項任務。標量流水處理機:處理機不具有向量數(shù)據(jù)表示,僅對標量數(shù)據(jù)進行流水處理。向量流水處理機:處理機具有向量數(shù)據(jù)表示,并通過向量指令對向量的各元素進行處理。線性流水線:流水線的各段串行連接,沒有反饋回路。非線性流水線:流水線中除有串行連接的通路外,還有反饋回路。順序流水線:流水線輸出端任務流出的順序與輸入端任務流入的

15、順序完全相同。每一個任務在流水線的各段中是一個跟著一個順序流動的。亂序流水線:流水線輸出端任務流出的順序與輸入端任務流入的順序可以不同,允許后進入流水線的任務先完成(從輸出端流出)。3.2 流水線的相關與沖突相關是指兩條指令之間存在某種依賴關系。如果兩條指令相關,則他們就有可能不能在流水線中重疊執(zhí)行或者只能部分重疊執(zhí)行,1 .結構相關:當指令在重疊執(zhí)行過程中,硬件資源滿足不了指令重疊執(zhí)行的要求,發(fā)生資源沖突時將產(chǎn)生“結構相關”;2 .數(shù)據(jù)相關:當一條指令需要用到前面指令的執(zhí)行結果,而這些指令均在流水線中重疊執(zhí)行時,就可能引起“數(shù)據(jù)相關”;3 .控制相關:當流水線遇到分支指令和其他會改變PC值的

16、指令時就會發(fā)生“控制相關”。流水線沖突是指對于具體的流水線來說,由于相關的存在,使得指令流中的下一條指令不能在指定的時鐘周期執(zhí)行。流水線沖突有三種類型:1 .結構沖突:因硬件資源滿足不了指令重疊執(zhí)行的要求而發(fā)生的沖突。解決方法:流水化功能單元;資源重復;暫停流水線。2 .數(shù)據(jù)沖突:當指令在流水線中重疊執(zhí)行時,因需要用到前面指令的執(zhí)行結果而發(fā)生的沖突。3 .控制沖突:流水線遇到分支指令和其他會改變PC值的指令所引起的沖突。(可?。┙鉀Q數(shù)據(jù)沖突有四中方法1 .定向技術:在某條指令產(chǎn)生一個結果之前,其他指令并不真正需要該計算結果,如果將該計結果從其產(chǎn)生的地方直接送到其他指令需要它的地方,就可以避免暫

17、停;2 .暫停技術:設置一個“流水線互鎖”的功能部件,一旦流水線互鎖檢測到數(shù)據(jù)相關,流水線暫停執(zhí)行發(fā)生數(shù)據(jù)相關指令后續(xù)的所有指令,直到該數(shù)據(jù)相關解決為止。;3 .采用編譯器調度。當流水線中出現(xiàn)沖突時,編譯器通過重新排列代碼的順序來消除流水線中的暫停,這種技術稱為流水線調度4 .重新組織代碼順序。流水線設計者有時會允許結構沖突的存在,原因:一是為了減少硬件開銷,二是為了減少功能單元的延遲。3.3向量處理機在流水線處理機中,設置向量數(shù)據(jù)表示和相應的向量指令,稱為向量處理機。不具有向量數(shù)據(jù)表示和相應的向量指令的流水線處理機,稱為標量處理機。向量處理方式有以下三種方式:1 .水平處理方式:向量計算是按

18、行的方式從左到右橫向地進行,組成循環(huán)程序進行處理,不適合向量處理機的并行處理。2 .垂直處理方式:適合對向量進行流水處理,向量運算指令的源/目向量都放在存儲器內(nèi),使得流水線運算部件的輸入、輸出端直接與存儲器相聯(lián),構成MME(存儲器-存儲器)的運算流水線。3 .分組處理方式:把向量分成若干組,組內(nèi)按縱向方式處理,一次處理各組,每組向量運算的源/目向量都在向量寄存器中,流水線的運算部件輸入、輸出端與向量寄存器相聯(lián),構成RRS(寄存器一寄存器)運算流水線。提高向量處理機性能有多種方法,許多新型向量處理機系統(tǒng)則采用了多處理機系統(tǒng)結構:1. 設置多個功能部件,使它們并行工作。2. 采用鏈接技術,加快一串

19、向量指令的執(zhí)行。3. 采用循環(huán)開采技術,加快循環(huán)處理。4. 采用多處理機系統(tǒng),進一步提高性能。4 .指令并行4.1 指令的靜態(tài)調度與動態(tài)調度當指令之間不存在相關時,它們可以在流水線中重疊起來并行執(zhí)行。這種指令序列中存在的潛在并行性稱為指令級并行。靜態(tài)調度方法:依靠編譯器對代碼進行靜態(tài)調度,以減少相關和沖突。它不是在程序執(zhí)行的過程中、而是在編譯期間進行代碼調度和優(yōu)化。靜態(tài)調度通過把相關的指令拉開距離來減少可能產(chǎn)生的停頓。動態(tài)調度方法:在程序的執(zhí)行過程中,依靠專門硬件對代碼進行調度,減少數(shù)據(jù)相關導致的停頓。Tomasulo算法是一種比較典型的動態(tài)調度算法,其算法的核心思想是記錄和檢測指令相關,操作

20、數(shù)一旦就緒就立即執(zhí)行,把發(fā)生RAM突的可能性減少到最小,通過寄存器換名來消除WAM突和WAW突。Tomasulo算法的基本思想是:只要操作數(shù)有效,就將其取到保留站,避免指令流出時才到寄存器中取數(shù)據(jù),這就使得即將執(zhí)行的指令從相應的保留站中取得操作數(shù),而不是從寄存器中。指令的執(zhí)行結果也是直接送到等待數(shù)據(jù)的其他保留站中去。因而,對于連續(xù)的寄存器寫,只有最后一個才真正更新寄存器中的內(nèi)容。一條指令流出時,存放操作數(shù)的寄存器名被換成為對應于該寄存器保留站的名稱(編號)。指令流出邏輯和保留站相結合實現(xiàn)寄存器換名,從而完全消除了數(shù)據(jù)寫后寫和先讀后寫相關這類名相關。4.2 動態(tài)分支預測技術在程序運行時,根據(jù)分支

21、指令過去的表現(xiàn)來預測其將來的行為。如果分支行為發(fā)生了變化,預測結果也跟著改變。預測分支是否成功和盡快找到分支目標地址(或指令),從而避免因控制相關而造成流水線停頓是動態(tài)分支預測技術的目的。如何記錄分支的歷史信息以及如何根據(jù)這些信息來預測分支的去向(甚至取到指令)是其要解決的兩個關鍵問題。采用分支歷史表BHT,采用分支目標緩沖器BTB以及基于硬件的前瞻執(zhí)行是三種動態(tài)分支預測技術,最常用到的是基于硬件的前瞻執(zhí)行。前瞻執(zhí)行的基本思想:對分支指令的結果進行猜測,并假設這個猜測總是對的,然后按這個猜測結果繼續(xù)取、流出和執(zhí)行后續(xù)的指令。只是執(zhí)行指令的結果不是寫回到寄存器或存儲器,而是放到一個稱為ROB勺緩

22、沖器中。等到相應的指令得到“確認”(即確實是應該執(zhí)行的)后,才將結果寫入寄存器或存儲器。對Tomasulo算法加以擴充,就可以支持前瞻執(zhí)行了。允許指令亂序執(zhí)行,但必須順序確認。前瞻執(zhí)行通過RO改現(xiàn)了指令的順序完成,能夠實現(xiàn)精確異常,且很容易地推廣到整數(shù)寄存器和整數(shù)功能單元上,但所需的硬件太復雜。5 .存儲器的層次結構5.1 存儲器的結構對于通用計算機而言,存儲層次至少應具有三級:最高層為CPLW存器,中間為主存,最底層為輔存。在較高檔的計算機中還可根據(jù)具體的功能分工細劃如下圖,存儲層次中越往上,存儲介質的訪問速度越慢,價格也越高,相對的存儲容量也越小。CPU寄存器主存輔存圖5.1計算機系統(tǒng)存儲

23、層次圖單級存儲器的主要矛盾是速度越快,每位價格就越高。容量越大,每位價格就越低。容量越大,速度越慢。因此采取多級存儲層次方法來解決此類矛盾?!癈ach-主存”層次:在CPUffi主存之間增加一級速度快、但容量較小而每位價格較貴的高速緩沖存儲器。借助于輔助軟硬件,它與主存構成一個有機的整體,以彌補主存速度的不足。圖5.2"Cach)主存”層次“主存-輔存”層次:在主存外面增加一個容量更大、每位價格更便宜、但速度更慢的存儲器。它們依靠輔助軟硬件的作用,構成一個整體。以彌補主存容量的不足。輔助軟硬圖5.3“主存輔存”層次5.2 Cache的基本知識其地址映象規(guī)則有如下三種:1 .全相聯(lián)映象

24、:主存中的任一塊可以被放置到Cache中的任意一個位置,空間利用率最高,沖突概率最低,實現(xiàn)最復雜。Cache空間的利用率較高,塊沖突概率較低,因而Cache的失效率也低。2 .直接映象:主存中的每一塊只能被放置到Cache中唯一的一個位置。Cache空間的利用率較低,塊沖突概率較高,因而Cache的失效率也高。3 .組相聯(lián)映象:主存中的每一塊可以被放置到Cache中唯一的一個組中的任何一個位置,組相聯(lián)是直接映像和全相聯(lián)的一種折中。查找算法是為了解決當CPUJ問Cache時,確定Cache中是否有要訪問的塊,以及確定其位置。替換算法是為了解決當新調入一塊,而Cache又已被占滿,應該替換那一塊。

25、有隨機法,先進先出法以及最近最少使用法LRU5.3 主存與虛擬存儲器延遲和帶寬是貯存的主要性能指標。可以有以下三種存儲器組織技術來提高主存性能:增加存儲器的寬度。這樣也就增加CPLW存儲器之間的連接通路的寬度,CPUF口Cache之間就有了一個多路選擇器,擴充主存的最小增量增加了相應的倍數(shù),而且寫入有可能變得復雜。采用簡單的多體交叉存儲器。在存儲系統(tǒng)中采用多個DRAM并利用它們潛在的并行性。獨立存儲體。設置多個存儲控制器,使多個體能獨立操作,以便能同時進行多個獨立的訪存。虛擬存儲器是“主存-輔存”層次進一步發(fā)展的結果,可以分為頁式和段式的存儲器管理方式具有多次性,對換性,虛擬性的特點。6 .輸

26、入/輸出系統(tǒng)6.1 總線輸入/輸出系統(tǒng)簡稱I/O系統(tǒng),I/O系統(tǒng)是用于實現(xiàn)數(shù)據(jù)輸入、輸出及數(shù)據(jù)存儲的系統(tǒng)。它包括I/O設備以及I/O設備與處理機的連接。在計算機系統(tǒng)中,各子系統(tǒng)之間可以通過總線相互連接。因為它是由不同的外設分時共享的,形成了信息交換的瓶頸,從而限制了系統(tǒng)中總的I/O吞吐量??偩€按用途分類可分為1 .CPU存儲器總線。CP必儲器總線比較短,通常具有較高的速度,并且要和存儲器系統(tǒng)的速度匹配來優(yōu)化帶寬。2.1 /O總線。I/O總線要連接許多不同類型、不同帶寬的設備,因而比較長,并且應遵循總線標準。按設備定時方式分類,總線可分為同步總線。所有設備通過統(tǒng)一的總線系統(tǒng)時鐘進行同步。優(yōu)點是成

27、本低,速度快,因為它不需要設備之間互相確定時序的邏輯。缺點是總線操作必須以相同的速度運行。異步總線。設備之間沒有統(tǒng)一的系統(tǒng)時鐘,設備自己內(nèi)部定時。設備之間的信息傳送用總線發(fā)送器和接收器控制。容易適應更廣泛的設備類型,擴充總線時不用擔心時鐘時序和時鐘同步問題。但在傳輸時,異步總線需要額外的同步開銷。CPUt外部設備進行輸入/輸出的方式在計算機的發(fā)展過程中經(jīng)歷了不同的方式。在早期的計算機系統(tǒng)中,是采用程序I/O方式;當在系統(tǒng)中引入中斷機制后,I/O方式使發(fā)展為中斷驅動方式;此后,隨著DMA空制器的出現(xiàn),又使I/O方式在傳輸單位上發(fā)生了變化,即從以字節(jié)為單位的傳輸擴大到以數(shù)據(jù)塊為單位進行傳輸,從而大

28、大地改善了塊設備的I/O性能;而通道的引入,又使對I/O操作的組織和數(shù)據(jù)的傳送都能獨立地進行而無需CPU勺干預。6.2通道處理機通道處理機(簡稱通道)專門負責整個計算機系統(tǒng)的輸入/輸出工作,只能執(zhí)行有限的一組輸入/輸出指令。其對外設的控制通過輸入/輸出接口和設備控制器進行控制。根據(jù)信息傳送方式的不同通道分為三種類型:字節(jié)多路通道:一種簡單的共享通道,主要為多臺低速或中速的外圍設備服務。傳送過程:通道每連接一個外圍設備,只傳送一個字節(jié),然后又與另一臺設備連接,并傳送一個字節(jié)。數(shù)組多路通道:適于為高速設備服務。傳送過程:每連接一臺高速設備,一般傳送一個數(shù)據(jù)塊,傳送完成后,又與另一臺高速設備連接,再

29、傳送一個數(shù)據(jù)塊。選擇通道:為多臺高速外圍設備服務。傳送過程:在選擇通道中,通道每連接一個外圍設備,就把這個設備的n個字節(jié)全部傳送完成,然后再與另一臺設備相連接。通道完成一次數(shù)據(jù)傳輸?shù)墓ぷ鬟^程:在用戶程序中使用訪管指令進入管理程序,由CPU!過管理程序組織一個通道程序,并啟動通道。通道處理機執(zhí)行CPM它組織的通道程序,完成指定的數(shù)據(jù)I/O工作。通道程序結束后向CPU發(fā)中斷請求。CPU向應這個中斷請求后,第二次進入操作系統(tǒng),調用管理程序對I/O中斷請求進行處理。7.計算機系統(tǒng)結構的發(fā)展趨勢7.1 高性能計算機體系結構高性能計算(highperformancecomputer,HPC)是計算機集群系

30、統(tǒng),它通過各種互聯(lián)技術將多個計算機系統(tǒng)連接在一起,利用所有被連接系統(tǒng)的綜合計算能力來處理大型計算問題。高性能計算方法的基本原理就是將問題分為若干部分,而相連的每臺計算機均可同時參與問題的解決,從而顯著縮短了解決整個問題的計算時間。解決大型計算問題需要功能強大的計算機系統(tǒng),隨著高性能計算的出現(xiàn),使這一類應用從昂貴的大型外部計算機系統(tǒng)演變?yōu)椴捎蒙逃梅掌鳟a(chǎn)品和軟件的高性能計算機集群體。因此,高性能計算系統(tǒng)已經(jīng)成為解決大型問題計算機系統(tǒng)的發(fā)展方向。高性能計算機具有以下技術:對稱多處理(symmetricalmultiprocessing,SMP)技術是相對非對稱多處理技術而言的、應用十分廣泛的并行技

31、術。非一致訪問分布共享存儲技術(nonuniformmemoryaccess,NUMA)中,每個處理器與本地存儲器和高速緩存相連,多個處理器通過處理器、存儲器互聯(lián)網(wǎng)絡相連。集群(Cluster)是一組相互獨立的計算機,利用高速通信網(wǎng)絡組成一個單一的計算機系統(tǒng),并以單一系統(tǒng)的模式加以管理。網(wǎng)格技術有可能成為實現(xiàn)Petaflops的另一條途徑。7.2 高性能計算的發(fā)展方向混合體系統(tǒng)結構已成為HPC®展趨勢建在東京技術研究所的TSUBAME用的就是混合體系,除了使用1036個AMDK核Opteron外,360塊加速卡為系統(tǒng)貢獻了24%勺性能,僅增加了1%勺功耗。而舊M將在2008年完成的名為RoadRuner的1600萬億次HPC中,總共采用了16000個Opteron和Cell兩種架構的處理器。多核微處理器和面向領域的混合體系結構已經(jīng)成為HPC®展的趨勢。集群將成為超級計算系統(tǒng)的主流集群架構的超級計算系統(tǒng),特別是以采用普通商用芯片和內(nèi)聯(lián)技術組成的系統(tǒng),迅速成為目前高性能計算架構的主流。它大受歡迎的主要原因在于其經(jīng)濟有效性和公開性。它一般采用廉價的不同IA服務器為運算節(jié)點,小規(guī)模的系統(tǒng)一般采用以太網(wǎng)進行內(nèi)聯(lián),規(guī)模大一點和性能要求較高的多采用InfiniBand、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論