系統結構1-并行概念_第1頁
系統結構1-并行概念_第2頁
系統結構1-并行概念_第3頁
系統結構1-并行概念_第4頁
系統結構1-并行概念_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

上海超級計算中心2007年7月計算機系統結構講座

并行計算基本概念什么是并行計算機?AparallelcomputerisacollectionofprocessingelementsthatcooperatetosolvelargeproblemsfastDavidE.Culler U.C.Berkeley四個要素有許多處理單元 →計算結點,存儲空間,I/O…形成一個整體 →互連網絡,通信機制…解決一個大的問題 →并行算法,并行編程,作業(yè)調度…解決得快 →算法優(yōu)化,編譯優(yōu)化,負載均衡…開發(fā)并行程序4步曲DecompositionofcomputationintasksAssignmentoftaskstoprocessesOrchestrationofdataaccess,comm,synch.MappingprocessestoprocessorsSequentialcomputationProcessesp0p1p2p3AssignmentTasksDecompositionP0ProcessorsP1P2P3Mappingp0p1p2p3ParallelprogramOrchestration并行機的分類從指令系統和處理器結構來分標量計算機(ScalarComputer)向量計算機(VectorComputer)從程序設計的角度來分單指令流多數據流計算機(SIMD)多指令流多數據流計算機(MIMD)從體系結構的角度來分共享存儲多處理機(SMP)分布存儲多處理機(DMP)分布共享存儲多處理機(DSM)P1SwitchMainmemoryPn(Interleaved)(Interleaved)2nd-level$SharedCacheP1$Interconnectionnetwork$PnMemMemDistributedMemory(NUMA)Scale并行機的分類P1$Interconnectionnetwork$PnMemMemCentralizedMemoryDanceHall,UMAUMA—SMP集中存儲器結構,共享存儲器結構每個處理器訪問存儲器的延遲相等,稱為

UMA——UniformMemoryAccess

(DanceHall)必須解決Cache一致性問題按UMA結構建造的計算機稱為SMP機SMP——Shared-memoryMultiProcessor ——SymmetricMultiProcessorSymmetric每個處理器的地位相等訪問存儲器的延遲相等訪問I/O的延遲相等使用共享區(qū)實現進程間的通信使用鎖實現進程間的同步P1$Interconnectionnetwork$PnMemMemCentralizedMemoryDanceHall,UMA不需要考慮程序和數據的放置公共的程序和數據結構便于共享存儲器管理和負載均衡非常方便實現了單一系統映象(SSI—SingleSystemImage),易于編程在小規(guī)??茖W計算及事務處理等諸多領域獲得了廣泛的應用UMA—SMPSMP面臨的挑戰(zhàn)總線結構在長度、頻率上都受到限制,且一次只能實現一個連接即使是交叉開關,模塊數也受到限制兩個瓶頸——對共享存儲器的訪問

對I/O資源的訪問SMP最大弱點——難以擴展UMA—SMPNUMAP1$Interconnectionnetwork$PnMemMemDistributedMemory(NUMA)分布存儲器結構處理器訪問不同存儲器的延遲不相等,稱為

NUMA——NonUniformMemoryAccess按NUMA結構建造的計算機稱為MPP機MPP——MassivelyParallelProdessing使用消息實現進程間的通信和同步盡管可以實現全局統一編址,處理器訪問遠地存儲器只能通過消息來實現NUMA解決了可擴展性,但共享存儲特性實際上是多了一個層次Cc-NUMAP1$Interconnectionnetwork$PnMemMemDistributedSharedMemory(cc-NUMA)在NUMA結構上,增加了Cache一致性管理,稱為

cc-NUMA——CacheCoherence-NonUniformMemoryAccess按cc-NUMA結構建造的計算機稱為DSM機Cache一致性管理可以由軟件實現可以由硬件實現進程間的通信和同步又可以回到SMP模式全局統一編址,處理器可以訪問任意存儲器克服了UMA難以擴展的弱點遠程訪問的數據能進入本地Cache,并保持多副本一致性,繼承了SMP的可編程性可擴展的SMP——SSMP:ScalableShared-memoryMultiProcessor遠程存儲器訪問的延遲仍是一個重要問題采用頁面遷移和復制技術(如Origin2000)設置NodeCache(NUMA-Q)SGIAltix4700512CPU規(guī)模的SSMPCc-NUMACluster什么是Cluster商品化結點商品化互連Linux消息傳送倒底屬于那一種系統結構?屬于NUMA結構Cluster與MPP的區(qū)別?Cluster只能是從I/O總線實現互連MPP必定是從專門設計的網絡接口進行互連的,網絡接口的帶寬通常與內存帶寬在一個數量級上P1$Interconnectionnetwork$PnMemMemDistributedMemory(NUMA)Cluster,MPP,Constellation視結點情況而定結點是商品化主板,就是Cluster結點是SMP,就是Constellation結點CPU是向量處理器,就是PVP,歸入MPP類TOP500中只剩下3種系統結構ClusterMPPConstellationP1$Interconnectionnetwork$PnMemMemDistributedM

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論