




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第1講-高性能計算與高性能計算機2023/5/182為什么要開設這門課程本課程主要涉及高性能計算和并行程序設計,其核心是并行技術并行技術與當今計算機研究和應用的熱點緊密相連:1、多核技術(INTEL、AMD、IBM、SONY、SUN、NVIDIA)。當你有了16個核的處理器怎么有效利用?2、集群技術。集群系統(tǒng)如今隨處可見,如何有效使用它?并行是唯一途徑。3、超級計算機。超級計算機用于求解富有挑戰(zhàn)性的計算問題.有效的大規(guī)模并行軟件是發(fā)揮其性能的關鍵4、云計算、網格計算、服務計算、高性能計算、物聯(lián)網技術5、大數(shù)據6、……2023/5/183為什么要并行計算?有限時間內解決復雜計算問題汽車碰撞實驗:32CPU4小時(一個工況)藥物篩選:64CPU,500萬化合物,一年蛋白質折疊,256CPU、2個月只能算一個納秒過程宇宙大尺度結構模擬:256CPU,6個月過去:大量應用需求的驅動需求驅動和技術推動2023/5/184為什么要并行計算?
今天:計算機技術發(fā)展的推動芯片上晶體管數(shù)目每18個月增長一倍?工藝:90nm65nm32nm,逼近極限主頻:從到,步履艱難功耗:單芯片百瓦功耗,mini型“核反應堆”2023/5/185并行計算平民化的到來!
每個程序員面臨的多核并行計算時代在單個芯片上內置多個處理單元-“核”每個處理器視為小型的并行計算機雙核四核多核
并行計算已經成為必然!2023/5/186如何進行并行(多核)計算?思路最關鍵,并行思想,并行算法新的工具和實現(xiàn)方法MPI/OpenMP,GoggleHadoop,IntelC++,WindowsHPC等好的編程方法針對硬件結構,重視程序性能2023/5/187現(xiàn)實的情況●1、需要通過顯式并行的硬件系統(tǒng)走向普及:集群計算機、多核處理器●2、然而大家對于并行計算方法和工具了解和認識不足。為此,開設這門課程希望把并行計算作為一種通用計算技術介紹給大家2023/5/188課程目的澄清對并行計算的認識:
●不是少數(shù)人的專利●高性能計算隨著機群系統(tǒng)、多核處理器的出現(xiàn)將逐漸普及到桌面系統(tǒng)了解高性能計算的前沿技術發(fā)展情況鍛煉基本的資料檢索、文獻閱讀、歸納整理和口頭報告的能力實實在在體驗并行軟件開發(fā)
●并行編程語言-實現(xiàn)●并行程序性能與優(yōu)化-分析●并行算法設計-設計●并行程序開發(fā)流程-獨立開展2023/5/189教材和主要參考書教材:暫無(提供電子教案)參考書:[1]并行計算導論,張林波等
,北京:清華大學出版社,2006[2]并行計算:結構、算法、編程(修訂版),陳國良等,北京:高教出版社,2003[3]并行程序設計(第二版),BarryWilkinson等,陸鑫達等譯,北京:機械工業(yè)出版社,2005[4]MPI并行程序設計實例教程,張武生等
,北京:清華大學出版社,2009[5]多核程序設計,陳天洲等,北京:清華大學出版社,2007[6]并行計算應用與實戰(zhàn),王鵬等,北京:機械工業(yè)出版社,20092023/5/1810課程安排理論并行計算機系統(tǒng)及其結構模型(當代對稱多處理機、大規(guī)模并行處理機、機群系統(tǒng))并行計算機系統(tǒng)的性能評測以及并行算法的設計基礎、一般設計策略和一般設計過程介紹幾種常見的分布式并行算法
實踐典型并行計算機系統(tǒng)—PC機群的搭建消息傳遞(MessagePassingInterface,MPI)并行程序設計具體內容安排第一講高性能計算與高性能計算機第二講并行計算機系統(tǒng)及其結構模型第三講PC機群的搭建(自學)第四講并行算法設計的關鍵技術第五講MPI并行程序設計語言第六講并行算法設計實例2023/5/1811第一講高性能計算與高性能計算機1.高性能計算的意義2.高性能計算的發(fā)展與現(xiàn)狀3.高性能計算的典型應用4.高性能計算的挑戰(zhàn)與機遇2023/5/18121.高性能計算的意義(1)1.1高性能計算的內在含義1.2高性能計算的應用需求1.3高性能計算的戰(zhàn)略地位2023/5/18131.高性能計算的意義(2)1.1高性能計算的內在含義計算和計算科學所有的學科都轉向定量化和精確化三大科學:理論科學、實驗科學和計算科學計算科學是一個交叉學科,用計算的方法來解決應用問題。適用于理論模型復雜或尚未建立、實驗費用昂貴或無法進行。計算物理、計算化學、計算生物學、計算地質學、計算氣象學。并行計算是跟上摩爾定律的重要手段。2023/5/18141.高性能計算的意義(3)高性能計算的含義高性能計算簡稱HPC(HighPerformanceComputing),泛指量大、快速、高效的運算。高性能計算主要包括:向量計算并行計算分布式計算網格計算………..2023/5/18151.高性能計算的意義(4)高性能計算的量綱前綴縮寫基冪含意數(shù)值KiloK103Thousand千MegaM106Million兆,百萬GigaG109Billion千兆,10億TeraT1012Trillion垓,萬億PetaP1015Quadrillion千萬億ExaE1018Quitillion百億億Flops:每秒所執(zhí)行的浮點運算次數(shù)(floating-pointoperationspersecond)目前的PC機運算速度通常在GFlops量級,高性能計算機運算速度則在TFlops至PFlops量級。2023/5/18161.高性能計算的意義(5)1.2高性能計算的應用需求應用需求計算密集型應用(Computing-intensive):大型科學工程計算,數(shù)值模擬等。應用領域:石油、氣象、CAD、核能、制藥、環(huán)境監(jiān)測分析、系統(tǒng)仿真等。數(shù)據密集型應用(Data-intensive):數(shù)字圖書館,數(shù)據倉庫,數(shù)據挖掘,計算可視化等。應用領域:圖書館、銀行、證券、稅務、決策支持系統(tǒng)等。通信密集型應用(Network-intensive):協(xié)同工作,網格計算,遙控和遠程診斷等。應用領域:網站、信息中心、搜索引擎、電信、流媒體等。2023/5/18171.高性能計算的意義(6)千萬億次超級計算機的應用需求應用領域應用需求計算能力需求存儲容量需求生物醫(yī)學蛋白質電子態(tài)的計算藥物發(fā)明中的篩選過程蛋白質折疊100Tflops800Tflops1Pflops30TB200TB1PB航空航天制造發(fā)動機燃燒模擬和機翼設計模擬500Tflops100TB氣候環(huán)境短期天氣預報長期天氣預報局部突發(fā)性災難預報(如洪水、海嘯)20Tflops200Tflops1Pflops10TB100TB500TB核能領域完全等離子分析(包括電子結構分析)核武器數(shù)值模擬天然氣燃燒500Tflops1Pflops1Pflops1PB1PB1PB納米技術復合材料的結構分析和功能預測新材料發(fā)明200Tflops1Pflops400TB2PB天體物理學超新星三維模擬1Pflops1PB國防和國家安全密碼破譯先進武器模擬1Pflops1Pflops1PB1PB2023/5/18181.高性能計算的意義(7)1.3高性能計算的戰(zhàn)略地位從戰(zhàn)略高度上講高性能計算技術是一個國家綜合國力的體現(xiàn)。高性能高計算是支撐國家實力持續(xù)發(fā)展的關鍵技術之一。高性能計算國防安全、高科技發(fā)展和國民經濟建設中占有重要的戰(zhàn)略地位。
重大挑戰(zhàn)問題:飛機設計、藥物設計、全球氣候預測、人類基因、海洋環(huán)流新材料、生物分子結構、半導體建模、超導建模等。2023/5/18191.高性能計算的意義(8)高性能計算在發(fā)達國家的戰(zhàn)略地位(1)美國有關發(fā)展高性能計算的建議報告從1982年到2005年,美國國防部、能源部、國家科學院、國家科學基金委以及美國總統(tǒng)信息技術顧問委員會、美國信息技術咨詢委員會、美國國家競爭力委員會等提出的有關信息技術和計算機的建議報告中,大都涉及到了高性能超級計算機的內容。2023/5/18201.高性能計算的意義(9)高性能計算在發(fā)達國家的戰(zhàn)略地位(2)清單(按年代排序)1982年,美國國家科學院:《關于科學研究及工程中的大規(guī)模計算》1993年,美國國家科學院:《從臺式計算機到萬億次計算機:充分發(fā)揮美國在高性能計算領域領導權》1995年,美國國家科學院:《特別工作組關于未來國家科學基金委超級計算中心計劃報告》1996年,美國總統(tǒng)信息技術顧問委員會:《信息技術研究:為了未來》2000年,美國國家科學院:《促使信息技術更好》2001年,美國國家科學院:《無處不在》2002年,美國國防部:《適用于國家安全部門的高性能計算》2003年,美國能源部:《基于科學的大規(guī)模模擬》
2003年,美國國家科學基金委:《通過計算機基礎結構變革科學與工程》
2003年,美國國家科學基金委:《信息時代的知識丟失》2004年,美國國家競爭力委員會:《促使美國變革并提高競爭力》
2004年,美國跨機構:《聯(lián)邦高端計算計劃-高端計算復興特別工作組》2005年,美國國家科學院:《超級計算機未來》
2005年,美國總統(tǒng)信息技術顧問委員會:《計算科學:確保美國競爭力》2023/5/18211.高性能計算的意義(10)高性能計算在發(fā)達國家的戰(zhàn)略地位(3)美國發(fā)展有關高性能計算的行動計劃1993年,美國科學工程技術聯(lián)邦協(xié)調理事會:《HPCC(HighperformanceComputing&Communication)GrandChallenge》計劃,提出發(fā)展萬億次(Tera=1012)計算機計劃。1996年,美國能源部和LawrenceLivermore、LosAlamos、Sandia三大核武器國家實驗室:《ASIC(AcceleratedStrategicComputingInitiative)》計劃,提出發(fā)展千萬億次(Pera=1015)計算機的目標。1997年,HPCC包括了HECC(HighEndComputing&Communication),被擴展為CIC(Computing,Information,Communication)計劃。1998年度的CIC藍皮書,將千萬億次計算機硬件和軟件研制列入了計劃中。2002年啟動HPCS計劃,希望確定未來10到20年超級計算機的體系結構。2023/5/18221.高性能計算的意義(11)高性能計算在發(fā)達國家的戰(zhàn)略地位(4)美國1996年提出的ASCI(AcceleratedStrategicComputingInitiative)計劃。通過數(shù)值模擬,評估核武器的性能、安全性、可靠性等。高分辨率、高逼真度、三維、全物理、全系統(tǒng)的規(guī)模和能力。計劃研制5代計算平臺,目前,前四代已完成,第五代平臺正在研制。隨著第一個十年研究結束,已經開始為下一個十年發(fā)展制訂規(guī)劃。2023/5/18231.高性能計算的意義(12)高性能計算在發(fā)達國家的戰(zhàn)略地位(5)—ASCI高性能計算機BlueMountainOptionRed2023/5/18241.高性能計算的意義(13)高性能計算在發(fā)達國家的戰(zhàn)略地位(6)美國2002年啟動的千萬億次超級計算機研究HPCS計劃從2002年起的兩年多時間里,ES占據TOP1位置Cluster并不是HPC的最終體系結構美國DARPA于2002年啟動高生產率計算系統(tǒng)(HighProductivityComputingSystems)HPCS計劃希望確定未來10年甚至20年的高性能計算機體系結構高生產率而非峰值計算能力作為評價指標高性能計算的一個新的創(chuàng)新時代的開始2023/5/18251.高性能計算的意義(14)高性能計算在我國的戰(zhàn)略地位(1)2006年2月,國務院發(fā)布《國家中長期科學和技術發(fā)展規(guī)劃綱要(2006~2020年)》指出加速發(fā)展高性能計算對提高我國國防建設與國家安全、國家經濟建設、國家重大工程和基礎科學研究等尖端科技領域的核心支撐能力,具有十分重要的戰(zhàn)略意義。提出要全面提升我國的自主創(chuàng)新能力,以期將我國在2020年前建設成為一個創(chuàng)新型國家。2023/5/18261.高性能計算的意義(15)高性能計算在我國的戰(zhàn)略地位(2)中國高性能計算發(fā)展大事記1983年,由國防科技大學研制的銀河I型億次巨型機系統(tǒng)的成功問世,標志著我國具備了研制高端計算機系統(tǒng)的能力。1992年,曙光投入200萬元研制曙光一號。隨后,曙光一號、曙光1000、曙光2000、曙光3000、曙光4000相繼問世。1994年,銀河I的換代產品銀河II在國家氣象局正式投入運行,其系統(tǒng)性能達每秒10億次,大大縮短了我國與先進國家的差距。1997年,銀河III并行巨型計算機在北京通過國家鑒定,峰值性能為每秒130億浮點運算。1999年,首臺“神威I”計算機通過了國家級驗收,并在國家氣象中心投入運行。2000年,由1024個CPU組成的銀河Ⅳ超級計算機系統(tǒng)問世,峰值性能達到每秒萬億次浮點運算。2002年,世界上第一個萬億次機群系統(tǒng)聯(lián)想深騰1800出世,獲得2004年國家科技進步二等獎。2003年,聯(lián)想深騰6800問世把世界機群計算推向新的高峰。2004年,曙光4000A成功研制,使中國成為繼美國、日本之后第三個能研制10萬億次商品化高性能計算機的國家(進入TOP500前10位)。2005年,中國高性能計算機性能TOP100排行榜揭曉,曙光位居第一。天梭榮獲國家科學技術進步二等獎。2006年,曙光高性能計算機被胡錦濤總書記點評為“中國七大標志性自主創(chuàng)新成果之一”,曙光4000系列高性能計算機榮獲國家科學技術進步二等獎。2007年12月,中國首臺采用國產高性能通用處理器芯片“龍芯2F”的萬億次高性能計算機“KD-50-I”研制成功。2008年6月24日,中國科學院計算技術研究所、曙光公司和上海超級計算中心在中科院計算所聯(lián)合舉行了曙光5000落戶上海超級計算中心的簽約儀式。2023/5/18271.高性能計算的意義(16)高性能計算在我國的戰(zhàn)略地位(3)—國產高性能計算平臺神威-I銀河-II曙光-5000聯(lián)想-68002023/5/18282.高性能計算的發(fā)展與現(xiàn)狀(1)2.1高性能計算機的發(fā)展2.2高性能計算機的現(xiàn)狀2.3高性能計算面臨的主要問題2023/5/18292.高性能計算的發(fā)展與現(xiàn)狀(2)2.1高性能計算機的發(fā)展歷史回顧2023/5/18302.高性能計算的發(fā)展與現(xiàn)狀(3)發(fā)展過程中的主流技術607080900010巨型機萌芽CDC6600向量機鼎盛CRAY-1,SX-3MPP發(fā)展CrayT3E,OptionRed機群發(fā)展NOW,IBMSP2,ASCIQ定制機器ESBlueGene2023/5/18312.高性能計算的發(fā)展與現(xiàn)狀(4)兩類構造高性能計算機的方式采用定制部件價格較高(小于1B$市場)對大規(guī)模或通信密集的任務進行了優(yōu)化設計并行向量機采用商用部件利用每年80B$的市場優(yōu)勢對一些計算密集任務有很好的性能MPP/機群2023/5/18322.高性能計算的發(fā)展與現(xiàn)狀(5)并行向量機構造方式PVP采用全定制部件定制的高性能向量處理器(Gflops)節(jié)點內多體交叉共享存儲(GB)定制的高帶寬低延遲互連(交叉開關)2023/5/18332.高性能計算的發(fā)展與現(xiàn)狀(6)機群構造方式機群是一組獨立的計算機(節(jié)點)的集合體:機群的各節(jié)點都是一個完整的系統(tǒng):工作站,PC機或SMP互連通常使用高速互連網絡,如Myrinet、Infiniband等各節(jié)點可以協(xié)同工作并表現(xiàn)為一個單一的、集中的計算資源CPUMemoryI/OChannel...CPUMemoryI/OChannelCPUMemoryI/OChannelCPUMemoryI/OChannelCPUMemoryI/OChannelSystemAreaNetwork&StorageAreaNetwork2023/5/18342.高性能計算的發(fā)展與現(xiàn)狀(7)2006年TOP500預測:達到Petascale2023/5/18352.高性能計算的發(fā)展與現(xiàn)狀(8)2.2高性能計算機的現(xiàn)狀從Top500看高性能計算機現(xiàn)狀(2009年)最快的高性能計算機:最普遍的高性能計算機:機群(410臺)安裝高性能計算機最多的國家:美國(291臺),亞洲(49臺,日本15臺,中國21臺,印度6臺),歐洲(145臺)生產高性能計算機的企業(yè):HP(212臺),IBM(188臺)高性能計算機中使用最多的微處理器:Intel系列(399臺),IBM(55臺),AMD(43臺)高性能計算機使用最廣泛的領域:企業(yè)與研究結構進入500強的最低性能:,半年前為500強的總性能為:,半年前為2023/5/18362.高性能計算的發(fā)展與現(xiàn)狀(9)2.2高性能計算機的現(xiàn)狀從Top500看高性能計算機現(xiàn)狀(2013年)最快的高性能計算機:,前十名中:美國5臺,中國2臺,德國2臺,日本1臺;已經有26套系統(tǒng)的最大性能邁入了PFlops(每秒千萬億次)級別;中國上榜超算66套,之前兩次分別為72套、68套,基本保持穩(wěn)定,而且始終僅次于美國位列世界第二(日本30套/-2)。有了天河2,中國不但在數(shù)量上,性能上也超越日本,成為世界第二。Intel處理器還是絕對主流,份額高達%。88%的系統(tǒng)所用處理器擁有六個或更多核心,67%的不少于八核心。500套系統(tǒng)總性能223PFlops,比半年前的162PFlops增長了%,比一年前的123PFlops則增長了%。天河2一套就占了總性能的%,幾乎五分之一!美國252套占了一半還多,比上次有多了2套。歐洲112套,比上次增加7套,還是不如亞洲119套(少了4套)。英國、法國、德國分別有29、23、19套。2023/5/18372.高性能計算的發(fā)展與現(xiàn)狀(10)近幾年來Top1機器2001年,為IBMASCIWHITE,LINPACK峰值為12TFLOPS,處理器數(shù)目為8192。2002年—2004年上半年,為NECEarth-Simulator,LINPACK峰值為40TFLOPS,處理器數(shù)目為5120。2004年下半年—2007年11月,為IBMBlueGene,LINPACK峰值為478TFLOPS,處理器數(shù)目為212992。2008年6月,Top1為IBMRoadrunner(走鵑),LINPACK峰值為,處理器核數(shù)目為122400。2009年6月,Top1為IBMRoadrunner(走鵑),LINPACK峰值為,處理器核數(shù)目為129600。2023/5/18382023/5/18392.高性能計算的發(fā)展與現(xiàn)狀(New)天河2號2023/5/18402.高性能計算的發(fā)展與現(xiàn)狀(New)天河2號2023/5/18412.高性能計算的發(fā)展與現(xiàn)狀(New)天河2號2023/5/18422.高性能計算的發(fā)展與現(xiàn)狀(11)IBMRoadrunner走鵑(1)2023/5/18432.高性能計算的發(fā)展與現(xiàn)狀(12)IBMRoadrunner(2)基本參數(shù)(2008年6月)6,480AMDOpteron處理器,51.8TB內存(in3,240LS21刀片)12,960IBMCell處理器,51.8TB內存(in6,480QS22刀片)216Systemx3755I/O節(jié)點
26288-portISR2012Infiniband4xDDRswitches296機架
2.35MWpower2023/5/18442.高性能計算的發(fā)展與現(xiàn)狀(13)IBMRoadrunner(3)混合(Hybrid)設計(2008年6月)通用處理器+專用處理器采用兩種不同架構的處理器:1.8GAMDOpteron雙核處理器(X86架構)6912個處理器(6480個用于計算節(jié)點,432個用于系統(tǒng)操作和通信節(jié)點)共13824個cores(12960+864)3.2GIBMPowerXCell8i異構多核處理器數(shù)學運算比Opteron快30倍1個通用核(PowerProcessingElement
:PPE),8個專用核(SynergisticProcessingElement:SPE)(共有9個處理器核)12960個PPEcores和103680個SPEcores共116640個cores(12960+103680)系統(tǒng)共有130464個cores(13824+116640)2023/5/18452.高性能計算的發(fā)展與現(xiàn)狀(14)IBMRoadrunner(4)刀片式機群架構(2008年6月)每個Triblade包含4個刀片,一個LS21Opteron刀片,一個擴展連接刀片,兩個QS22Cell刀片。LS21包含2個1.8GHz雙核Opterons,16GB內存。QS22包含2個3.2GHz
PowerXCell8i處理器,8GB內存。2023/5/18462.高性能計算的發(fā)展與現(xiàn)狀(15)IBMRoadrunner(5)一個Triblade包含4個刀片一個BladeCenterH框包含3個Triblade一個機架(rack)包含4個BladeCenterH一個連接單元CU(ConnectedUnit)包含15個機架Roadbunner包含18個CU,通過兩級Infiniband互連2023/5/18472.高性能計算的發(fā)展與現(xiàn)狀(16)ASCIBlueGene/L設計特點采用專門的System-on-a-chip技術減少功耗、體積、復雜度和設計難度實現(xiàn)低延遲、高帶寬存儲系統(tǒng)MPP結構可擴展到
~100k處理器采用三種互連網絡:Gbit以太網用于節(jié)點內部3DTorus用于節(jié)點間樹用于多播通信2023/5/18482.高性能計算的發(fā)展與現(xiàn)狀(17)ASCIBlueGene/L構造圖BlueGene/LComputeASIC
2023/5/18492.高性能計算的發(fā)展與現(xiàn)狀(18)最快的并行向量計算機—ES體系結構:并行向量機峰值速度/存儲器:40Tflops/10TB節(jié)點數(shù)/處理器數(shù)/處理器峰值:640/5120/8Gflops占地:六個籃球場大3層建筑安裝時間:2002年2月主要用途:全球氣候變化預測、地震預報、原子能等2023/5/18502.高性能計算的發(fā)展與現(xiàn)狀(19)TOP500中的機群機群系統(tǒng)在高性能計算機中所占比例迅速增加TOP500中目前有400個機群系統(tǒng)TOP500中最普通的并行機體系結構導致了高性能計算機的“平民化”2023/5/18512.高性能計算的發(fā)展與現(xiàn)狀(20)中國的高端高性能機群2008年11月,第32屆HPCTop500榜曙光5000A排名第10,LINPACK峰值TFLOPS聯(lián)想DeepComp7000排名第19,LINPACK峰值2009年06月,第33屆HPCTop500榜曙光5000A排名第15,LINPACK峰值聯(lián)想DeepComp7000排名第31,LINPACK峰值2023/5/18522.高性能計算的發(fā)展與現(xiàn)狀(21)中國的高端高性能機群—曙光5000機群特點(三高一低)高性能—超高運算速度,230Tflops高效能—超高系統(tǒng)效率,大于70%高密度—單節(jié)點4路16核刀片低功耗—230萬億次峰值功率700KW2023/5/18532.高性能計算的發(fā)展與現(xiàn)狀(22)中國的個人高性能計算機—基于龍芯2號國產萬億次高性能計算機KD-50-I基本參數(shù)計算單元:336個主頻750MHz的龍芯2F,總的峰值計算速度1.008TFlops服務節(jié)點:2個Opteron雙核處理器,主頻2.2GHz內存容量:每計算單元內存1GB,服務節(jié)點內存8GB,共344GB磁盤容量:876GB系統(tǒng)互聯(lián)網絡:千兆以太網特點(三低一高)低功耗—
整機功耗小于6KW低占地面積—
占地平方米,高度米低成本—
整機成本不超過80萬高計算性能—
峰值性能達1TFlops以上2023/5/18542.高性能計算的發(fā)展與現(xiàn)狀(23)從Top500看高性能計算機的趨勢(1)關于計算機結構:機群系統(tǒng)仍將是高性能計算機最常用的結構MPP仍然是一個重要結構,尤其是作為PFlops超級計算機的主要結構PVP是另一種獲得超高性能的重要結構,但不是主流2023/5/18552.高性能計算的發(fā)展與現(xiàn)狀(24)從Top500看高性能計算的趨勢(2)關于微處理器:主要是采用CMOS工藝的商用微處理器多核處理器占統(tǒng)治地位Intel處理器家族仍將是高性能計算機中占統(tǒng)治地位的處理器基于RISC的IBMPower體系也會有一席之地AMD有一定地位(HyperTransport加快了處理器間的通信速度,簡化了一致性協(xié)議的實現(xiàn))專用的處理器仍然存在,但逐漸減少適用于最高端系統(tǒng)(Roadrunner)向量處理器片上系統(tǒng)2023/5/18562.高性能計算的發(fā)展與現(xiàn)狀(25)2.3高性能計算面臨的主要問題Memorywall:存儲器訪問能力與處理部件計算能力的不平衡處理器速度每年提高59%,高性能計算速度提高更快。存儲器速度每年提高7%。處理器性能與數(shù)據訪問帶寬和延遲之間的差距越來越大。必須從系統(tǒng)存儲體系結構上創(chuàng)新,改進時延機制,以提供更高的帶寬和更低的延遲。目前對三類超級計算機(定制、混合與商業(yè))的主要區(qū)別在于針對不同的存儲訪問模式所能提供的有效本地和全局存儲訪問帶寬。2023/5/18572.高性能計算的發(fā)展與現(xiàn)狀(26)Programmingwall:系統(tǒng)規(guī)模增大到10萬個以上處理器,系統(tǒng)結構復雜(數(shù)據共享與消息通信模式交織),為超級計算機編寫高效健壯程序越來越復雜,越來越困難。高性能機器上的程序設計語言、庫和應用開發(fā)環(huán)境的進展比廣泛應用的工業(yè)軟件差很多沒有廣泛應用的并行程序設計模型軟件的研制周期大于硬件的研制周期高端計算的真正危機在于軟件2023/5/18582.高性能計算的發(fā)展與現(xiàn)狀(27)Powerwall:單個芯片的功耗急劇升高,導致整個系統(tǒng)的總功耗越來越高占地均在數(shù)百~數(shù)千平方米,功耗在數(shù)兆瓦綜合成本急劇增加,高達數(shù)億美元如ASCI系統(tǒng)和ES系統(tǒng)峰值(Tflops)占地(m2)功耗(KW)Glops/m2Glops/KW時間BlueGene/L36723015001595652452005ASCI.Purple77.826247800124.729.972005RedStorm43.52791700155.9125.592005Earth-Simulator403060800013.0752002ASCI.Q301858710016.144.2320042023/5/18592.高性能計算的發(fā)展與現(xiàn)狀(28)功耗-工業(yè)界普遍關注的問題“HidinginPlainSight,GoogleSeeksMorePower”,byJohnMarkoff,June14,2006NewGooglePlantinTheDulles,Oregon,fromNYT,June14,2006Google策略在靠近河邊的平原上建立機房水力發(fā)電全世界共有>500,000臺服務器2023/5/18603.高性能計算的典型應用(1)3.1高性能計算的應用領域3.2高性能計算的代表應用實例3.2.1國產并行計算機在淮河流域防洪防污中的應用
3.2.2高性能計算在石油與天然氣中的應用
3.2.3高性能計算在數(shù)字化大橋中的應用
2023/5/18613.高性能計算的典型應用(2)3.1高性能計算的應用領域氣候能量的燃燒、熔化和裂變技術(軍事國防)生物社會經濟發(fā)展天體物理學數(shù)學能源及材料……“E3”報告62(WeatherModelingandForecasting)
考慮3000*3000平方公里的范圍,垂直方向的考慮高度為11公里。將3000*3000*11立方公里的區(qū)域分成立方公里的小區(qū)域,則將近有1011個不同的小區(qū)域。另外還需考慮時間因素,將時間參數(shù)量化。假定考慮48小時天氣預報。
天氣預報63每一小區(qū)域的計算包括參數(shù)的初始化及與其它區(qū)域的數(shù)據交換。若每一小區(qū)域計算的操作指令為100條,則整個范圍一次計算的指令為1011*100=1013,兩天的計算次數(shù)將近100次,因此,指令總數(shù)為1015條。用一臺10億次/秒(PIII500)計算,將大約需要280小時。若我們用100個10億次/秒的處理器構成一臺并行處理機,每個處理器計算的區(qū)域為109個,不同的處理器通過通信來傳輸參數(shù),若個處理器的計算能力得到充分利用,則整個問題的計算時間不超過3小時。說明兩點(1)并行計算機可以解決原先不能解決的問題;(2)可進行更準確的天氣預報。64要開采石油,必須鉆井。據說打這樣一口井,花費是非常高的,差不多要幾百萬甚至上千萬,如果選擇的鉆井地點有偏差,那么投入的人力、財力、物力就會全部浪費,損失巨大。因此提前的精確測算就顯得格外重要。石油勘探靠什么呢?現(xiàn)在據我門所知還在依靠人工地震,就是在認為可能的地方進行人工爆破,然后搜集爆破后的反應,記錄它的反射弧,再把這些數(shù)據送到計算機上進行處理,地質專家再根據得出的結論分析石油的分布,爭取打下去就有石油開采出來。石油部門是我國最早應用計算機的部門。石油勘探2023/5/18653.高性能計算的典型應用(3)高性能計算的應用領域(1)從傳統(tǒng)應用到新興應用歷史上,物理和工程科學是計算和計算機科學應用驅動者?,F(xiàn)今,像生物科學(從基于實驗發(fā)展為基于計算、從個體研究發(fā)展為跨學科研究、從注意數(shù)值技術發(fā)展為生物醫(yī)學計算方法等)等是計算和計算機科學的受益者。將來,社會科學和人文科學則是計算和計算機科學的主要消費者。2023/5/18663.高性能計算的典型應用(4)高性能計算的應用領域(2)傳統(tǒng)的科學與工程計算科學工程計算的共性:在過去20年,計算物理是應用的主要驅動力,這類應用具有如下共同特點:應用程序常常由定義在R3×t子空間的一組PDE所描述。多物理模擬的不同物理區(qū)域的計算方法各不相同。很多應用均主要集中在大學和研究所。研究側重點離散化PDE及其相應的線性/非線性方程的求解。強調并行機的速度和問題求解精度。很少關心相關的I/O操作。并行化方法與編程模型并行化方法:最常使用區(qū)域分解法。編程模型:最常使用數(shù)據并行。2023/5/18673.高性能計算的典型應用(5)高性能計算的應用領域(3)與社會相關的新興應用新應用的共性:最近幾年,與社會相關的應用急劇增加與傳統(tǒng)的計算應用分享市場空間,其共性是:應用問題常常由圖來定義,而不是離散的R3空間。計算過程中的交互常是全局性的,而不是通過邊界來交換信息的。新出現(xiàn)的應用,無相應的使用經驗和成熟的軟件。很多應用常集中在與社會相關的國計民生方面。研究側重點建立誠信機制:包括硬件、軟件、人機界面、安全協(xié)議的使用等。巨量的數(shù)據,而不是科學計算,將是此類應用的主要處理對象,I/O是最為關心的。數(shù)據的安全、屬主、管理等帶來一系列技術、法律和人道等問題。2023/5/18683.高性能計算的典型應用(6)高性能計算的應用領域(4)應用實例社會科學社會經濟學:利用宏觀經濟理論和計算經濟學(行為方程)來模擬經濟活動,施行動態(tài)調整平衡,預測貨幣政策變化所帶來的經濟含義,修正改變金融政策來防止經濟動蕩。社會行為科學:當社會和行為科學家面臨巨大的數(shù)據需要理解和保護這些數(shù)據時,社會科學家和計算科學家加強合作是最有利的;社會科學家可幫助計算科學家理解在社會生態(tài)系統(tǒng)中怎樣運用計算機科學;行為科學家也能幫助計算機科學家開發(fā)良好的人機交互模型;心理學家和語言學家同計算機科學家合作,能聯(lián)合開發(fā)易于理解、使用和語言翻譯的計算機程序,等等。主體經濟學:通過相互作用主體(包括個體、社會群體、機構、生物實體、物質實體等)動態(tài)系統(tǒng)建模來研究經濟現(xiàn)象和規(guī)律,以達到理解以往的經驗和規(guī)范作用,定量分析和發(fā)展理論以及改進方法等之目的。2023/5/18693.高性能計算的典型應用(7)高性能計算的應用領域(5)應用實例物理科學挖掘資料發(fā)現(xiàn)新星球(褐矮星):美國國家虛擬觀測站的計算機科學家用計算機搜索(約2分鐘)兩個天文數(shù)據庫中數(shù)百萬天體的資料時發(fā)現(xiàn)了它,它是研究人員在演示軟件的可行性時無意發(fā)現(xiàn)的,是天文界驚人的精確發(fā)現(xiàn)。超新星建模:伽利略觀察巨大星球爆炸500年后,人們對超新星(比太陽至少大10倍)中心坍塌的爆炸機制仍不清楚。最近許多物理學家和計算科學家用一維、二維、三維程序來模擬此現(xiàn)象,有可能提高對此現(xiàn)象的認識和增加對宇宙特性的理解。暗物質與暗能量:最近宇宙科學家發(fā)現(xiàn)宇宙在加速膨脹,這與愛因斯坦廣義相對論理論物質行為相反,宇宙科學家猜想,除暗物質外,宇宙也可能包含暗能量,此能量將引力作為排斥力,從而導致加速膨脹,美國芝加哥大學天文學家用擴展版FLASH程序模擬了宇宙的能力。2023/5/18703.高性能計算的典型應用(8)高性能計算的應用領域(6)應用實例工程與制造微氣泡和船舶降阻:很久以來,研究人員已經知道其體積約在50~500微米之間的微氣泡,在一些情形下可減少船舶80%的阻力、減少燃料消耗、增加航程。但是人們還不能確定最佳微氣泡系統(tǒng)的特性,該在哪里加入、加入多少和加入多大的氣泡。美國布朗大學通過
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 農村個人房屋售賣合同范本
- 買賣注冊公司合同范本
- 出租鋼琴合同范例
- 倒板合同范本
- 出口經營合同范本
- 個人租車協(xié)議合同范本
- 醫(yī)療器械借用合同范本
- 制做安裝合同范本
- 別墅門訂購合同范本
- 二手機械車位轉讓合同范本
- GB/T 7631.5-1989潤滑劑和有關產品(L類)的分類第5部分:M組(金屬加工)
- GB/T 41326-2022六氟丁二烯
- GB/T 19470-2004土工合成材料塑料土工網
- GB/T 18913-2002船舶和航海技術航海氣象圖傳真接收機
- 高中教師先進事跡材料范文六篇
- 烹飪專業(yè)英語課件
- 3d3s基本操作命令教程課件分析
- 人教版三年級語文下冊晨讀課件
- 傳染病防治法培訓講義課件
- 河南大學版(2020)信息技術六年級下冊全冊教案
- 法律方法階梯實用版課件
評論
0/150
提交評論