


版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
面向多領(lǐng)域的高性能計(jì)算機(jī)應(yīng)用綜述內(nèi)容摘要:在現(xiàn)代科學(xué)研究和工程理論中,通常使用數(shù)學(xué)方程式來(lái)表示某些天然科學(xué)規(guī)律,普通計(jì)算已經(jīng)難以知足愈發(fā)復(fù)雜的計(jì)算公式,利用超等計(jì)算機(jī)進(jìn)行科學(xué)計(jì)算能夠極大地提升運(yùn)算效率。高性能計(jì)算機(jī)能夠到達(dá)每秒億億次的浮點(diǎn)運(yùn)算速度,已經(jīng)成功應(yīng)用于生物計(jì)算與精準(zhǔn)醫(yī)療、全數(shù)字設(shè)計(jì)與制作、地球科學(xué)與環(huán)境工程、智慧城市云計(jì)算和材料科學(xué)與工程等領(lǐng)域,并獲得相當(dāng)結(jié)果。簡(jiǎn)單介紹了高性能計(jì)算機(jī),并總結(jié)其在不同領(lǐng)域的應(yīng)用現(xiàn)在狀況與結(jié)果。本文關(guān)鍵詞語(yǔ):科學(xué)計(jì)算;大數(shù)據(jù)處理;超等計(jì)算機(jī);模仿仿真;并行計(jì)算1引言在現(xiàn)代科學(xué)研究和工程理論中,通常使用數(shù)學(xué)方程式來(lái)表示某些天然科學(xué)規(guī)律,產(chǎn)生了諸多復(fù)雜繁瑣的數(shù)學(xué)計(jì)算問(wèn)題[1]?;谄胀ㄓ?jì)算工具來(lái)解決這些問(wèn)題,將消耗損費(fèi)大量人力物力,以至無(wú)法得到精確結(jié)果。而科學(xué)計(jì)算[2],利用計(jì)算機(jī)仿真、重現(xiàn)、預(yù)測(cè)或探尋求索天然萬(wàn)物運(yùn)動(dòng)規(guī)律和演變特性的全經(jīng)過(guò),通過(guò)研究合理的計(jì)算方法,設(shè)計(jì)高效的并行算法,研制適宜的應(yīng)用程序,能精確、高效地模仿各領(lǐng)域研究經(jīng)過(guò),分析計(jì)算結(jié)果。然而,普通計(jì)算機(jī)的科學(xué)計(jì)算能力往往是有限的,現(xiàn)有的計(jì)算能力無(wú)法高效地解決某些基礎(chǔ)學(xué)科和工程技術(shù)部門(mén)的科學(xué)計(jì)算問(wèn)題,如長(zhǎng)期天氣預(yù)報(bào)、石油勘探、飛機(jī)整體氣動(dòng)力等等。與此同時(shí),地震檢測(cè)儀、粒子碰撞器、天文望遠(yuǎn)鏡以及高通量分析裝配等大型科學(xué)儀器的研制和發(fā)展[3],產(chǎn)生了大量非構(gòu)造化或半構(gòu)造化的數(shù)據(jù),使得“大數(shù)據(jù)〞趨勢(shì)變得越來(lái)越突出[4]。如今,很多科學(xué)發(fā)現(xiàn)和見(jiàn)解由大量數(shù)據(jù)集驅(qū)動(dòng),“大數(shù)據(jù)〞被以為是除了實(shí)驗(yàn)、理論和計(jì)算方法之外的第四種科學(xué)范式[5]。數(shù)據(jù)生成的容量、速度和多樣性構(gòu)成了分析大數(shù)據(jù)的重要挑戰(zhàn)。為提升科學(xué)計(jì)算能力,解決大數(shù)據(jù)問(wèn)題,高性能計(jì)算(HPC)[6]技術(shù)迅猛發(fā)展。高性能計(jì)算機(jī)代表用于解決計(jì)算密集型科學(xué)和工程問(wèn)題的高端計(jì)算基礎(chǔ)設(shè)備。我們國(guó)家的高性能計(jì)算早已突破每秒浮點(diǎn)運(yùn)算千萬(wàn)億次的壁壘,并繼續(xù)解決性能、可擴(kuò)展性、可編程性、能效和可靠性等問(wèn)題,探尋求索新的支持技術(shù)以到達(dá)e級(jí)計(jì)算能力。當(dāng)前,高性能計(jì)算機(jī)已在多個(gè)領(lǐng)域得到了成功的應(yīng)用[7],但仍存在大量可供多個(gè)研究機(jī)構(gòu)使用的空閑節(jié)點(diǎn)。本文簡(jiǎn)介了一些高性能計(jì)算機(jī)系統(tǒng)及其性能,針對(duì)近年來(lái)在高性能計(jì)算機(jī)上的各大領(lǐng)域應(yīng)用實(shí)例進(jìn)行總結(jié),并對(duì)在其他領(lǐng)域的應(yīng)用做出了瞻望,以促進(jìn)更高層次效、全面地使用高性能計(jì)算機(jī)。2高性能計(jì)算機(jī)系統(tǒng)概述中國(guó)首臺(tái)千萬(wàn)億次超等計(jì)算機(jī),是“天河一號(hào)〞。“天河一號(hào)〞超等計(jì)算機(jī)使用由中國(guó)自行研發(fā)的“龍〞芯片,其峰值計(jì)算速度能夠到達(dá)1.206TFlop/s,同時(shí)Linpack實(shí)測(cè)性能到達(dá)了0.563TFlop/s,該超等計(jì)算機(jī)位居當(dāng)時(shí)公布的中國(guó)超等計(jì)算機(jī)前100強(qiáng)之首,中國(guó)成為了繼美國(guó)之后世界上第二個(gè)能夠自立研制千萬(wàn)億次超等計(jì)算機(jī)的國(guó)家。天河一號(hào)采取6144個(gè)英特爾通用多核處理器和5120個(gè)AMD圖形加速處理器,其內(nèi)存總?cè)萘?8TB。至于點(diǎn)對(duì)點(diǎn)通信的帶寬就到達(dá)了40Gbps,而其用于分享的磁盤(pán)總?cè)萘縿t到達(dá)1PB。該超等計(jì)算機(jī)系統(tǒng)部署于天津?yàn)I海新區(qū)的國(guó)家超等計(jì)算天津中心作為業(yè)務(wù)主機(jī)。2013年,由國(guó)防科學(xué)技術(shù)大學(xué)研制的“天河二號(hào)〞大型超等計(jì)算機(jī)以每秒33.86千萬(wàn)億次的浮點(diǎn)運(yùn)算速度成為全球最快的超等計(jì)算機(jī),位列國(guó)際大型超等計(jì)算機(jī)TOP500榜首。隨后,“天河二號(hào)〞實(shí)現(xiàn)了世界最快超算“六連冠〞。天河二號(hào)采取基于加速器的架構(gòu)[8]。在可承受的總成本、功率預(yù)算、支持可靠性、可用性和可效勞性(RAS)的能力、應(yīng)用開(kāi)發(fā)和移植的復(fù)雜性下提供高的計(jì)算性能。天河二號(hào)的硬件系統(tǒng)由五個(gè)子系統(tǒng)構(gòu)成,包含計(jì)算系統(tǒng)、通信系統(tǒng)、存儲(chǔ)系統(tǒng)、監(jiān)控診斷系統(tǒng)和效勞系統(tǒng)。它由16000個(gè)節(jié)點(diǎn)構(gòu)成,每個(gè)節(jié)點(diǎn)有2顆基于IvyBridge-EXeonE52692處理器和3顆XeonPhi,每個(gè)節(jié)點(diǎn)的內(nèi)存是64GB。所有的計(jì)算節(jié)點(diǎn)都通過(guò)專(zhuān)有的高速互連系統(tǒng)連接。還提供了一個(gè)效勞子系統(tǒng)的4096個(gè)節(jié)點(diǎn),以加快高吞吐量的計(jì)算任務(wù),如大數(shù)據(jù)處理。存儲(chǔ)子系統(tǒng)包含256個(gè)I/O節(jié)點(diǎn)和64個(gè)容量為12.4PB的存儲(chǔ)效勞器。天河二號(hào)文件系統(tǒng)命名為h2fs,采取麒麟操作系統(tǒng)、基于SLURM的全局資源管理。支持大多數(shù)現(xiàn)代編程語(yǔ)言,包含C、C++、Java、Python等。采取的是新型異構(gòu)多態(tài)體系構(gòu)造(Multipurpose-Heterogeneous)[9]。天河二號(hào)的系統(tǒng)配置列于表1中?!疤旌佣?hào)〞集科學(xué)計(jì)算、大數(shù)據(jù)分析和云計(jì)算于一體,被以為是知足工業(yè)和社會(huì)需求的戰(zhàn)略基礎(chǔ)設(shè)備。以超等計(jì)算機(jī)為支撐的高性能計(jì)算應(yīng)用正加速向各個(gè)領(lǐng)域浸透。Table1SystemindicatorsofTianhe-2表1天河二號(hào)系統(tǒng)指標(biāo)width=375,height=252,dpi=110在國(guó)內(nèi)早期的高性能計(jì)算機(jī)研究中,2004年6月超等計(jì)算機(jī)曙光4000A研制成功,落戶上海超等計(jì)算中心,標(biāo)記著繼美國(guó)和日本之后,中國(guó)是第三個(gè)能研制10萬(wàn)億次高性能計(jì)算機(jī)的國(guó)家。曙光能夠每秒運(yùn)算11萬(wàn)億次,進(jìn)入全球超等計(jì)算機(jī)前十名。經(jīng)過(guò)十多年發(fā)展,曙光E級(jí)高性能計(jì)算機(jī)系統(tǒng)項(xiàng)目如今是國(guó)家“十三五〞期間高性能計(jì)算的重點(diǎn)專(zhuān)項(xiàng),其最顯著的特點(diǎn)是突破了制約E級(jí)計(jì)算發(fā)展的各個(gè)關(guān)鍵技術(shù),通過(guò)這樣原型機(jī)的研制去驗(yàn)證E級(jí)的技術(shù)路線,為將來(lái)真正實(shí)現(xiàn)國(guó)產(chǎn)E級(jí)系統(tǒng)做技術(shù)鋪墊。width=642,height=303,dpi=110Figure1StructureofSugon’sCPU圖1曙光CPU構(gòu)造在2016年法蘭克福世界超算大會(huì)上,“神威·太湖之光〞超等計(jì)算機(jī)系統(tǒng)成為新的榜首,速度較第二名“天河二號(hào)〞快出近兩倍,效率提升三倍。神威·太湖之光超等計(jì)算機(jī)由40個(gè)運(yùn)算機(jī)柜和8個(gè)網(wǎng)絡(luò)機(jī)柜構(gòu)成。每個(gè)運(yùn)算機(jī)柜包括4塊由32塊運(yùn)算插件構(gòu)成的超節(jié)點(diǎn)。每個(gè)插件由4個(gè)運(yùn)算節(jié)點(diǎn)板構(gòu)成,一個(gè)運(yùn)算節(jié)點(diǎn)板又含2塊“申威26010〞高性能處理器。一臺(tái)機(jī)柜就有1024塊處理器,整臺(tái)“神威·太湖之光〞共有40960塊處理器。每個(gè)單個(gè)處理器有260個(gè)核心,主板為雙節(jié)點(diǎn)設(shè)計(jì),每個(gè)CPU固化的板載內(nèi)存為32GBDDR3-2133。在2018年的法蘭克福世界超算大會(huì)上,美國(guó)能源部橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室(ORNL)推出的新超等計(jì)算機(jī)“Summit〞以每秒12.23億億次的浮點(diǎn)運(yùn)算速度,接近每秒18.77億億次峰值速度奪冠,“神威·太湖之光〞屈居第二。3高性能計(jì)算機(jī)各大領(lǐng)域應(yīng)用實(shí)例分析為充足發(fā)揮高性能計(jì)算機(jī)的優(yōu)勢(shì),極大限度地知足客戶需求,自超等計(jì)算機(jī)在中國(guó)開(kāi)始發(fā)展以來(lái),相關(guān)團(tuán)隊(duì)都致力于擴(kuò)展高性能計(jì)算在各個(gè)領(lǐng)域的利用,迎合各領(lǐng)域應(yīng)用的計(jì)算要求,協(xié)助用戶配置應(yīng)用環(huán)境,建立高效模型,設(shè)計(jì)合理并行算法,以實(shí)現(xiàn)各領(lǐng)域的科學(xué)計(jì)算和大數(shù)據(jù)處理在高性能計(jì)算機(jī)上的應(yīng)用。3.1生物計(jì)算與精準(zhǔn)醫(yī)療根據(jù)廣州國(guó)家超等計(jì)算中心的內(nèi)部統(tǒng)計(jì)[10],生物醫(yī)學(xué)相關(guān)應(yīng)用如今是超等計(jì)算中心的重要客戶。生物醫(yī)學(xué)研究重要包含生物大分子的構(gòu)造模仿與功能建模,藥物設(shè)計(jì)與挑選,蛋白質(zhì)序列分析,基因序列分析與比對(duì),基因調(diào)控網(wǎng)絡(luò)的分析與建模,醫(yī)療衛(wèi)生的雙數(shù)據(jù)分析及生物醫(yī)學(xué)文獻(xiàn)發(fā)掘等。生物醫(yī)學(xué)數(shù)據(jù)繁多,且一直呈指數(shù)增加。如世界最大的生物數(shù)據(jù)保存者之一,歐洲生物信息學(xué)研究所(EBI),存儲(chǔ)跨越20PB的數(shù)據(jù),而且近期每年的數(shù)據(jù)量都增長(zhǎng)一倍[11]。數(shù)據(jù)源的異質(zhì)性,包含基因組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)、微陣列數(shù)據(jù)、文獻(xiàn)等,使其愈加復(fù)雜。針對(duì)典型類(lèi)型的大數(shù)據(jù)——基因組大數(shù)據(jù),在大數(shù)據(jù)框架(如Hadoop和Spark)的幫助下,云計(jì)算已經(jīng)在大數(shù)據(jù)處理中發(fā)揮著積極作用。如今,HPC在中國(guó)的快速發(fā)展使得以不同的方式解決基因組大數(shù)據(jù)挑戰(zhàn)成為可能。Yang等人[12]強(qiáng)調(diào)了在現(xiàn)代超等計(jì)算機(jī)上加強(qiáng)大數(shù)據(jù)支持的需要性,提出只需單個(gè)命令或單個(gè)shell腳本就能使當(dāng)下的大數(shù)據(jù)應(yīng)用在高性能計(jì)算機(jī)上運(yùn)行,而且支持多個(gè)用戶同時(shí)處理多個(gè)任務(wù)的Orion作為高性能計(jì)算機(jī)的大數(shù)據(jù)平臺(tái)。該平臺(tái)能夠根據(jù)大數(shù)據(jù)處理需求,合理分配所需的資源量,并使用HPC系統(tǒng)軟件棧自動(dòng)建立和配置可回收的Hadoop/Spark集群。以華大基因提供的基因組學(xué)大數(shù)據(jù)作為案例研究,測(cè)試基因組分析流水線SOAPGaea的FASTQ過(guò)濾、讀取對(duì)齊、反復(fù)刪除和質(zhì)量控制四個(gè)經(jīng)過(guò),證明了Orion平臺(tái)的高效性。為更好地了解基因的精細(xì)構(gòu)造、分析基因型與表現(xiàn)型的關(guān)系、繪制基因圖譜,DNA序列分析成為生物醫(yī)學(xué)中的主要課題[12]。DNA序列的排序是對(duì)DNA序列分析的基礎(chǔ)[13]。通常先使用測(cè)序儀得到生物體基因組的一些片段,再利用計(jì)算機(jī)對(duì)片段進(jìn)行denovo拼接,進(jìn)而得到DNA序列的排列順序。而隨著測(cè)序儀的發(fā)展,基因組的數(shù)據(jù)量增大,分析復(fù)雜性提升,普通計(jì)算工具分析數(shù)據(jù)會(huì)消耗大量時(shí)間和空間。張峰等人[14]基于高性能計(jì)算機(jī),使用一種新型序列拼接工具SGA(StringGraphAssernbler),對(duì)任務(wù)之間數(shù)據(jù)耦合度小的分批構(gòu)建FM-Index,采取粗粒度的多進(jìn)程并行;對(duì)任務(wù)之間數(shù)據(jù)耦合度較大的FM-Index合并經(jīng)過(guò),采取多線程的細(xì)粒度并行。這種多進(jìn)程與多線程的混合并行策略,使用并行計(jì)算代替通信開(kāi)銷(xiāo),測(cè)試小規(guī)模數(shù)據(jù)時(shí),將索引構(gòu)建時(shí)間的最佳性能提升了3.06倍。葉志強(qiáng)等人[15]在基因組排序時(shí),引入隨機(jī)listranking算法,基于高性能計(jì)算機(jī),使用MPI并行實(shí)現(xiàn)Pregel框架的線性化步驟,利用節(jié)點(diǎn)之間的通信和計(jì)算能力,減少了線性化步驟時(shí)間。SNP(單核苷酸多態(tài)性)檢測(cè)是DNA序列分析的關(guān)鍵步驟[16]。它將對(duì)齊的read、參考序列和被編排的數(shù)據(jù)庫(kù)(如數(shù)據(jù)庫(kù)SNPP)作為輸入,通過(guò)站點(diǎn)檢測(cè)對(duì)齊的read和引用站點(diǎn)的信息,生成SNP站點(diǎn)的列表。SNP檢測(cè)工具SoAPSNP能夠用一個(gè)多星期的時(shí)間來(lái)分析一個(gè)覆蓋20倍的人類(lèi)基因組。崔英博等人[17]通過(guò)從新設(shè)計(jì)SOAPSNP的關(guān)鍵數(shù)據(jù)構(gòu)造以降低內(nèi)存操作的開(kāi)銷(xiāo),設(shè)計(jì)CPU與XeonPhi協(xié)作的協(xié)調(diào)并行框架,以獲得更高層次的硬件利用率。并提出了一種基于讀取的窗口劃分策略(RWD),在多個(gè)節(jié)點(diǎn)上提升吞吐量和并行規(guī)模,開(kāi)發(fā)了SOAPSNP的并行版本MSNP,在沒(méi)有任何精度損失的情況下,利用高性能計(jì)算機(jī)的一個(gè)節(jié)點(diǎn)實(shí)現(xiàn)了45倍的加速。方翔等人[18]利用高性能計(jì)算機(jī),構(gòu)建了由基因組與轉(zhuǎn)錄組測(cè)序數(shù)據(jù)分析、蛋白質(zhì)構(gòu)造預(yù)測(cè)和分子動(dòng)力學(xué)模仿三個(gè)功能模塊構(gòu)成的生物信息平臺(tái)分析水產(chǎn)病原,對(duì)約氏黃桿菌等多種水生動(dòng)物病原進(jìn)行生物信息學(xué)分析。從生物醫(yī)學(xué)文獻(xiàn)中提取有價(jià)值的信息的一種主流方法是在非構(gòu)造化文本上應(yīng)用文本發(fā)掘方法。然而,大量的文獻(xiàn)需要分析,這對(duì)文本發(fā)掘的處理效率提出了宏大的挑戰(zhàn)。彭紹亮等人[19]將針對(duì)疾病實(shí)體辨別的軟件DNorm參加可高效辨別基因、蛋白質(zhì)、藥物、基因通路等實(shí)體關(guān)系的文本發(fā)掘工具PWTEES流水線中,擴(kuò)大了PWTEES的功能。使用LINNAEUS導(dǎo)入MEDLIN數(shù)據(jù)庫(kù)提供的內(nèi)容摘要,并在個(gè)人賬戶目錄下,動(dòng)態(tài)使用計(jì)算節(jié)點(diǎn),編譯安裝配置了非關(guān)系型數(shù)據(jù)庫(kù)(MySQL),將大量非構(gòu)造化數(shù)據(jù)(文獻(xiàn))轉(zhuǎn)為構(gòu)造化數(shù)據(jù)。將平常在普通效勞器上需100天能完成的文本發(fā)掘經(jīng)過(guò)縮短為1小時(shí),并利用200個(gè)進(jìn)程并行發(fā)掘7萬(wàn)篇頭頸癌相關(guān)文獻(xiàn)中的關(guān)鍵命名實(shí)體,得到了80%以上的并行效率。Xing等人[20]開(kāi)發(fā)了一個(gè)可運(yùn)行的框架PARABTM,它能夠在超等計(jì)算機(jī)上實(shí)現(xiàn)并行文本發(fā)掘。以GNormPlus、tmVar2.0、Dnorm三種命名實(shí)體辨別任務(wù)為例,對(duì)多個(gè)數(shù)據(jù)集上PARABTM的性能進(jìn)行了評(píng)價(jià)。結(jié)果表示清楚,使用PARABTM并行處理策略中的短板匹配負(fù)載平衡算法(Short-Boardloadbalancingalgorithm),最大水平地提升了生物醫(yī)學(xué)命名實(shí)體辨別的處理速度。3.2全數(shù)字設(shè)計(jì)與制作數(shù)字設(shè)計(jì)與制作是一種以計(jì)算機(jī)系統(tǒng)為中心的集成制作方法。隨著制作工廠中計(jì)算機(jī)系統(tǒng)數(shù)量和質(zhì)量的提升,數(shù)字化趨勢(shì)迅速。越來(lái)越多的自動(dòng)化工具被用于制作工廠,有需要對(duì)所有機(jī)器、工具和輸入材料進(jìn)行建模、模仿和分析,以優(yōu)化制作經(jīng)過(guò)。而模仿能夠建模和測(cè)試一個(gè)系統(tǒng)行為特性,讓工程師能夠用更低耗、更快速同時(shí)更安全的方式來(lái)分析所做的設(shè)計(jì)會(huì)產(chǎn)生什么樣的影響。模仿的應(yīng)用范圍廣泛,涵蓋了產(chǎn)品設(shè)計(jì)、經(jīng)過(guò)設(shè)計(jì)以及企業(yè)資源布置[21]。在模仿經(jīng)過(guò)中,利用超等計(jì)算機(jī)強(qiáng)大的計(jì)算能力,使工程師能在幾分鐘或幾小時(shí)內(nèi)仿真和測(cè)試數(shù)千種設(shè)計(jì)方案。利用數(shù)字化的方式,能夠?qū)Ξa(chǎn)品進(jìn)行構(gòu)造力學(xué)分析、流體力學(xué)分析、電磁設(shè)計(jì)和多物理場(chǎng)模仿等多種計(jì)算仿真。在計(jì)算流體力學(xué)CFD(CcomputationalFluidDynamics)領(lǐng)域的一大熱門(mén)研究問(wèn)題就是怎樣在當(dāng)下主流的眾核異構(gòu)高性能計(jì)算機(jī)平臺(tái)上進(jìn)行超大規(guī)模計(jì)算。楊梅芳等人[22]在高性能計(jì)算機(jī)的單個(gè)節(jié)點(diǎn)上,利用超然沖壓發(fā)動(dòng)機(jī)燃燒數(shù)值模仿軟件LESAP模仿一個(gè)實(shí)際發(fā)動(dòng)機(jī)燃燒化學(xué)反應(yīng)和超聲速流動(dòng)的問(wèn)題,采取OpenMP4.0編程標(biāo)準(zhǔn),向量化SIMD,優(yōu)化數(shù)據(jù)傳輸經(jīng)過(guò),平衡基于網(wǎng)格塊劃分的負(fù)載技術(shù),實(shí)現(xiàn)了軟件面向CPU+MIC異構(gòu)平臺(tái)的移植,到達(dá)了3.07倍的性能加速比。王勇獻(xiàn)等人[23]面向高性能計(jì)算機(jī)探尋求索了高階精度CFD流場(chǎng)數(shù)值模仿程序的高效并行性。在高性能異構(gòu)并行計(jì)算平臺(tái)上進(jìn)行了多個(gè)算例的數(shù)值模仿的結(jié)果顯示最大CFD規(guī)模到達(dá)1228億個(gè)網(wǎng)格點(diǎn),共使用約59萬(wàn)CPU+MIC處理器核,實(shí)現(xiàn)了移植后的性能大幅度提升。通過(guò)將算法移植到超等計(jì)算機(jī)進(jìn)行大規(guī)模并行,能夠?qū)崿F(xiàn)高效的流體力學(xué)分析。而文獻(xiàn)[24-26]都是針對(duì)空氣動(dòng)力學(xué)中的詳細(xì)分類(lèi)利用高性能計(jì)算機(jī)進(jìn)行模仿以驗(yàn)證有效性的研究。利用數(shù)字化設(shè)計(jì),能夠快速低成當(dāng)?shù)貙?duì)設(shè)計(jì)性能進(jìn)行分析評(píng)估。在圖像模仿中,Metropolis光傳輸算法能夠利用雙向路徑跟蹤構(gòu)建出由眼睛到光源的路徑,是MonteCarlo方法的變體。然后,使用Metropolis算法靜態(tài)計(jì)算圖像中光線的恰當(dāng)?shù)纳⑸錉顩r,由一條已發(fā)現(xiàn)的光到眼睛的路徑,能搜索到鄰近路徑。簡(jiǎn)單地說(shuō),Metropolis光傳輸算法能夠生成一條路徑并存儲(chǔ)其上的節(jié)點(diǎn),同時(shí)能通過(guò)添加額外節(jié)點(diǎn)來(lái)調(diào)整并生成新的路徑。隨著對(duì)照片級(jí)真實(shí)感圖像的要求越來(lái)越高,為Metropolis光傳輸算法開(kāi)發(fā)高效且高度可擴(kuò)展的光線跟蹤器變得越來(lái)越主要。重要是渲染圖像通常需要花費(fèi)大量時(shí)間,開(kāi)發(fā)高效且高度可擴(kuò)展的光線跟蹤器的困難來(lái)自不規(guī)則的存儲(chǔ)器訪問(wèn)形式、光攜帶路徑的不平衡工作量以及復(fù)雜的數(shù)學(xué)模型和復(fù)雜的物理經(jīng)過(guò)。Wu等人[27]提出了一種基于物理的高度可擴(kuò)展的并行光線追蹤器,并在高性能計(jì)算機(jī)上進(jìn)行了實(shí)現(xiàn),利用多達(dá)26400個(gè)CPU內(nèi)核,證明了其可擴(kuò)展性,能夠從復(fù)雜的3D場(chǎng)景生成真切圖像。模仿高場(chǎng)非部分載流子傳輸同樣需要3DMonteCarlo模仿方法,通過(guò)適當(dāng)?shù)牧孔有Uw散射效應(yīng),半經(jīng)典的MC模仿能夠給出精確的結(jié)果。但是,MC方法中3D模仿和量子校正都需要宏大的計(jì)算資源[28],由效率出發(fā)超等計(jì)算機(jī)的計(jì)算能力就至關(guān)主要了。文獻(xiàn)[29]中,通過(guò)在高性能計(jì)算機(jī)上使用IntelMIC協(xié)處理器,進(jìn)一步提升了之前工作中開(kāi)發(fā)的3D并行的繼承MC模仿器的并行效率。對(duì)于高性能計(jì)算機(jī)在全數(shù)字設(shè)計(jì)和制作領(lǐng)域的集成應(yīng)用,國(guó)家超等計(jì)算廣州中心推出了天河星光云超算平臺(tái),以云效勞的方式提供CAE計(jì)算和HPC訪問(wèn),大大降低了數(shù)字設(shè)計(jì)的門(mén)檻,支持產(chǎn)品設(shè)計(jì)的全工作流。當(dāng)前基于該平臺(tái)支撐的項(xiàng)目有諸如國(guó)產(chǎn)大飛機(jī)、高鐵等,都是國(guó)家工業(yè)生產(chǎn)中主要項(xiàng)目[30]。3.3地球科學(xué)與環(huán)境工程基于該應(yīng)用領(lǐng)域,超等計(jì)算機(jī)的重要作用在于變更對(duì)天然界中諸如地理狀態(tài)、海洋、大氣等各種元素的模仿方式。以超算為平臺(tái),不僅能模仿出地球上每個(gè)時(shí)期的狀態(tài),以至是對(duì)宇宙中的各種同樣能進(jìn)行模仿分析,讓地球科學(xué)和環(huán)境工程的研究范圍不再限于此時(shí)此地,而是更廣闊的空間。在宇宙學(xué)的層面,早在2015年就利用高性能計(jì)算機(jī)模仿出宇宙大爆炸后1600萬(wàn)年之后至今約137億年的暗物質(zhì)和中微子的演化經(jīng)過(guò),并將進(jìn)一步尋找宇宙界限的報(bào)告[31]。中微子固然是天然界中的基本粒子之一,在宇宙大爆炸約1s后與其他等離子體物質(zhì)退耦,構(gòu)成看不見(jiàn)的宇宙背景,通過(guò)物理實(shí)驗(yàn)和實(shí)際的天文觀測(cè)都無(wú)法精到準(zhǔn)確測(cè)量中微子的質(zhì)量。在高性能計(jì)算機(jī)平臺(tái)上,利用3萬(wàn)億粒子來(lái)對(duì)宇宙中的中微子和暗物質(zhì)的分布和演化進(jìn)行模仿,創(chuàng)始了宇宙學(xué)中獨(dú)立測(cè)量中微子質(zhì)量的道路。在地球外圍層面上,大氣變化同樣是一個(gè)關(guān)注點(diǎn)。Xue等人[32]提出了一種基于高性能計(jì)算機(jī)的全球性大氣動(dòng)態(tài)模仿的混合算法。通過(guò)使用更靈敏的域分區(qū)方案來(lái)支持節(jié)點(diǎn)中任意數(shù)量的CPU和加速器,算法能夠充足利用超算的優(yōu)良性能。當(dāng)使用8664個(gè)節(jié)點(diǎn),包含了近170萬(wàn)個(gè)核心時(shí),能夠有效地利用節(jié)點(diǎn)內(nèi)的三個(gè)MIC卡,對(duì)兩個(gè)IvyBridgeCPU(24個(gè)內(nèi)核)實(shí)現(xiàn)4.35倍的加速。基于成功的計(jì)算-通信重疊,算法分別在弱和強(qiáng)縮放測(cè)試中實(shí)現(xiàn)了93.5%和77%的并行效率。相較于廣袤無(wú)邊的宇宙,大部分人們對(duì)于腳下的土地愈加關(guān)心。天然災(zāi)禍如地震、泥石流等,可能會(huì)造成宏大的生命產(chǎn)業(yè)損失,而地下油氣資源又是經(jīng)濟(jì)社會(huì)發(fā)展所必須的,利用超等計(jì)算機(jī)去探尋求索大地也是發(fā)展所需要的。中石油集團(tuán)開(kāi)發(fā)的用于石油油氣勘探的GeoEast系統(tǒng)已經(jīng)經(jīng)過(guò)了十幾年的發(fā)展更新,在數(shù)據(jù)模型、數(shù)據(jù)分享、一體化運(yùn)行形式、三維可視化、交互應(yīng)用框架、地震地質(zhì)建模、網(wǎng)絡(luò)運(yùn)行環(huán)境和并行處理方面獲得了多項(xiàng)創(chuàng)新與重大技術(shù)突破,是地震數(shù)據(jù)處理解釋一體化系統(tǒng)。當(dāng)前GeoEastV3.0版本軟件總體到達(dá)國(guó)際同類(lèi)軟件先進(jìn)水平,為推動(dòng)中國(guó)石油勘探開(kāi)發(fā)領(lǐng)域不斷獲得新結(jié)果發(fā)揮了主要作用[33]。但是,這樣的一體化系統(tǒng)在使用中勢(shì)必會(huì)產(chǎn)生大量的數(shù)據(jù),這就對(duì)計(jì)算機(jī)的性能有了要求。因而,在GeoEast系統(tǒng)出名世界的經(jīng)過(guò)中,高性能計(jì)算機(jī)在幕后是功臣之一,保證了系統(tǒng)的順利運(yùn)行,助力石油勘探工作[34]。而文獻(xiàn)[35]專(zhuān)注于地震模仿,提出了針對(duì)英特爾至強(qiáng)處理器的對(duì)于軟件SeisSol的優(yōu)化,以適用于高性能計(jì)算機(jī)的計(jì)算環(huán)境中,通過(guò)全摩擦滑動(dòng)和地震波的耦合仿真實(shí)現(xiàn)了空前復(fù)雜的地震模型。移植到高性能計(jì)算機(jī)的SeisSol提供近乎最佳的弱縮放,在8192個(gè)節(jié)點(diǎn)上到達(dá)8.6DP-PFLOPS,在所利用的整個(gè)高性能計(jì)算機(jī)上能到達(dá)18~20DP-PFLOPS,成功模仿了1992年蘭德斯地震。3.4智慧城市云計(jì)算城市發(fā)展經(jīng)太多年的調(diào)整,已經(jīng)在經(jīng)濟(jì)上有了相當(dāng)進(jìn)展,當(dāng)前從怎樣讓人們生活愈加便捷出發(fā),很多地區(qū)開(kāi)始建設(shè)智慧城市。智慧城市(SmartCity)是指利用各種或創(chuàng)新意念,集成城市的構(gòu)成系統(tǒng)效勞,以提升資源運(yùn)用的效率,優(yōu)化城市管理和效勞,進(jìn)而能夠提升居民生活質(zhì)量。智慧城市的發(fā)展不僅僅僅是對(duì)生活的改變,還能促進(jìn)生產(chǎn)方式的改變,解決在城市擴(kuò)張及經(jīng)濟(jì)高速發(fā)展中產(chǎn)生的一系列“城市病〞問(wèn)題。智慧城市,代表的是城市的智慧,由智慧,能夠衍生出智能中、知識(shí)和數(shù)字等更廣泛的內(nèi)涵[36]。迄今為止,廣州、北京、上海、寧波、無(wú)錫、深圳、武漢、fo山等國(guó)內(nèi)城市已紛紛啟動(dòng)“智慧城市〞戰(zhàn)略,相關(guān)規(guī)劃、項(xiàng)目和活動(dòng)漸次推出。高性能計(jì)算機(jī)云平臺(tái)應(yīng)運(yùn)而生,為智慧城市建立堅(jiān)實(shí)、先進(jìn)的基石。智慧城市由于其性能需求,對(duì)依靠的平臺(tái)的計(jì)算能力的要求會(huì)更高層次,而超算的計(jì)算能力就能為智慧城市的建設(shè)提供相當(dāng)助力。在2014年,就有中國(guó)首臺(tái)千萬(wàn)億次超等計(jì)算機(jī)“天河一號(hào)〞在智慧城市中應(yīng)用的報(bào)道,以其在天津?yàn)I海區(qū)的應(yīng)用為例,“天河一號(hào)〞的建筑信息領(lǐng)域的大數(shù)據(jù)平臺(tái)通過(guò)對(duì)建筑信息建模,實(shí)現(xiàn)對(duì)建筑物從規(guī)劃、設(shè)計(jì)、建造到后期物業(yè)管理理的全程數(shù)字化。除此之外,城市規(guī)劃、氣象預(yù)測(cè)、生物醫(yī)療、設(shè)備制作、汽車(chē)碰撞模仿等行業(yè),也能更多地通過(guò)“天河一號(hào)〞,實(shí)現(xiàn)大批量數(shù)據(jù)計(jì)算、分析和存儲(chǔ)[37]。而高性能計(jì)算機(jī)的連續(xù)計(jì)算速度進(jìn)一步到達(dá)了億億次,所能提供的效勞質(zhì)量也更高層次,麒麟云平臺(tái)被部署在1920個(gè)節(jié)點(diǎn)(15個(gè)機(jī)柜),其中64個(gè)節(jié)點(diǎn)(兩個(gè)機(jī)框)作為云平臺(tái)控制節(jié)點(diǎn),其余節(jié)點(diǎn)為運(yùn)行虛擬機(jī)的計(jì)算節(jié)點(diǎn)和分布式存儲(chǔ)的存儲(chǔ)節(jié)點(diǎn)。為方便管理,將計(jì)算節(jié)點(diǎn)進(jìn)行分區(qū)管理,512個(gè)節(jié)點(diǎn)(4個(gè)機(jī)柜)為一區(qū),用于知足生產(chǎn)環(huán)境、適配環(huán)境、測(cè)試環(huán)境需要。分布式存儲(chǔ)沒(méi)有分區(qū),所有節(jié)點(diǎn)構(gòu)成一個(gè)全局的分布式存儲(chǔ)池,但在使用時(shí)可按需劃分指定容量的區(qū)域供不同用處使用[38]。這種云超算效勞采取麒麟安全云系統(tǒng)實(shí)現(xiàn)虛擬化技術(shù),將虛擬機(jī)資源遠(yuǎn)程推送給用戶使用[39]??赏ㄟ^(guò)互聯(lián)網(wǎng)遠(yuǎn)程管理虛擬機(jī)資源,使高性能計(jì)算機(jī)云平臺(tái)資源能夠被更多人使用,超算的計(jì)算能力能夠更好地推動(dòng)社會(huì)各個(gè)領(lǐng)域發(fā)展。2017年OpenStack的第15個(gè)版本中,麒麟云團(tuán)隊(duì)在核心功能解決的Bug數(shù),以及Commits的數(shù)量均進(jìn)入全球前20,麒麟云的發(fā)展是非常迅速的,與開(kāi)源社區(qū)嚴(yán)密結(jié)合,奉獻(xiàn)突出[40]。3.5材料科學(xué)與工程在材料科學(xué)與工程的研究中,量子力學(xué)、經(jīng)典動(dòng)力學(xué)、統(tǒng)計(jì)力學(xué)是三大基礎(chǔ)且重要的研究方向。研究人員致力于材料參數(shù)的建模、多標(biāo)準(zhǔn)平臺(tái)開(kāi)發(fā)和新材料的設(shè)計(jì)、開(kāi)發(fā)和優(yōu)化。分子動(dòng)力學(xué)模仿在材料科學(xué)、生物化學(xué)和生物物理學(xué)等領(lǐng)域得到了廣泛的應(yīng)用。分子動(dòng)力學(xué)(MD)是研究分子和分子的物理運(yùn)動(dòng)的計(jì)算機(jī)模仿方法,它提供分子標(biāo)準(zhǔn)上的微觀取樣?;谀芰考?xì)化的輔助建模AMBER(AssistedModelBuildingwithEnergyRefinement)[41]是用于MD模仿的使用最廣泛的軟件包之一。然而,對(duì)于具有百萬(wàn)原子級(jí)的系統(tǒng)的AMBERMD模仿的速度仍然需要改良。彭紹亮等人[42]在單CPU上的細(xì)粒度OpenMP并行、單節(jié)點(diǎn)CPU/MIC并行優(yōu)化和多節(jié)點(diǎn)多MIC協(xié)作并行加速方面進(jìn)行了改良。在高性能計(jì)算機(jī)上實(shí)現(xiàn)AMBER的并行加速策略,與原程序相比,實(shí)現(xiàn)了25~33倍的最高加速比。同時(shí),對(duì)于計(jì)算資源的限制,分子動(dòng)力學(xué)軟件GROMACS不能大規(guī)模地進(jìn)行滿意的操作。Wang等人[43]提出了一種利用卸載形式加速GROMACS的方法。為了提升GROMACS的效率,提出了異步化、數(shù)據(jù)重組和數(shù)組重用等一系列方法。在這種形式下,GROMACS能夠與CPU和IntelXeonPHITM多個(gè)集成內(nèi)核(MIC)協(xié)處理器同時(shí)有效地配置,充足利用高性能計(jì)算機(jī)資源。
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年CDMA第三代蜂窩移動(dòng)通信系統(tǒng)合作協(xié)議書(shū)
- 兩萬(wàn)合同范本
- 司法拍賣(mài)土地合同范本
- 修補(bǔ)圍網(wǎng)合同范例
- 政府委托代建合同范本
- 合影攝影合同范本
- 立法調(diào)研專(zhuān)項(xiàng)委托合同范本
- 宜城市個(gè)人攤位出租合同范本
- 債券質(zhì)押貸款合同范本
- 合同范本模板購(gòu)買(mǎi)
- 成功人士的七個(gè)習(xí)慣課件
- 粵教版必修二《向心力》評(píng)課稿
- 中國(guó)建筑史PPT(東南大學(xué))完整全套教學(xué)課件
- 2022年水利監(jiān)理規(guī)劃
- 哈弗汽車(chē)品牌全案策略及營(yíng)銷(xiāo)推廣方案
- 04J008 擋土墻(重力式 衡重式 懸臂式)
- (學(xué)校教育論文)人工智能下的教育變革研究
- 2023年湖南工程職業(yè)技術(shù)學(xué)院?jiǎn)握泄P試職業(yè)技能考試題庫(kù)及答案解析
- 春天的氣息-教學(xué)設(shè)計(jì)教案
- NB/T 10740-2021露天煤礦大型卡車(chē)運(yùn)行日常安全檢查規(guī)程
- GB/T 41855-2022小型游樂(lè)設(shè)施轉(zhuǎn)椅
評(píng)論
0/150
提交評(píng)論