版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
MLPerfStorage評測工具解讀焱融科技/CTO&聯(lián)合創(chuàng)始人MLPerfStorageBenchmarkMLPerfStorage測試結(jié)果解讀AI業(yè)務(wù)特點和對存儲的挑戰(zhàn)..MLPerfStorageBenchmarkMLCommons是什么組織?MLPerf是由圖靈獎得主大衛(wèi)·帕特森(DavidPatterson)聯(lián)合谷歌、斯坦福大學(xué)、哈佛大學(xué)等頂尖為全球AI領(lǐng)域的“奧運會”。MLCommons的基礎(chǔ)源于2018年的MLPerf基準2.通過公平和有實際意義的衡量標(biāo)準加速AI進步MLPerfStorage的核心目標(biāo)和關(guān)鍵成果MLPerfStorage工作組的主要目標(biāo)是創(chuàng)建一個測試基準,用來評估特定的硬件。存儲測試基準路標(biāo)MLPerfStorage是第一個測量機器學(xué)習(xí)(ML)工作負載存儲性能的基準測試套件MLPerfStorageBenchmark工作原理MLPerfStorage通過對多種AI工作負載在各種加速器上的I/O型進行混合匹配。MLPerfStorage可以在PyTorch和Tensorflow上評測MLPerf訓(xùn)練和HPC工作負載的存儲系統(tǒng)性能,并且無需使用昂捕獲了神經(jīng)網(wǎng)絡(luò)訓(xùn)練的完整真實行為。MLPerfStorageBenchmarkv1.0種類型的加速器?!皌hinktime”MLPerfStorageBenchmarkv1.0模型TaskDatasetReferenceNetworkSamplesizeFrameworkReferenceQualitysegmentation(medical)Synthetic-fromKiTS193D-Unet146MBPyTorchmaximizeMB/s,and#ofacceleratorswith>90%acceleratorutilizationclassificationSynthetic–fromImageNetResNet50150KBTensorflowmaximizeMB/s,and#ofacceleratorswith>90%acceleratorutilizationScientific(cosmology)Synthetic–fromCosmoflowN-bodysimulationParameterprediction2MBTensorflowmaximizeMB/s,and#ofacceleratorswith>70%acceleratorutilization1.能夠模擬NVIDIAA100或者H1003.每個樣本的計算時間相差兩個數(shù)量級MLPerfStorageBenchmark概念加速器數(shù)量(ACC)一個ACC代表一個加速器數(shù)量(ACC)一個ACC代表一個GPU在滿足AU的前期下,ACC數(shù)量越ACC數(shù)量成正比MLPerfStorage通過DLIO生成每個MLPerfStorage基準測試都需要至少5倍內(nèi)存大小的數(shù)據(jù)集AU表示加速器處于活動狀態(tài)時間AU=(total_compute_time/total_benchmark_runing_time)*100基準測試運行5個epoch,AU最終要取5個epoch的平均值,并且5個epoch的結(jié)果誤差不超過5%MLPerfStorageBenchmarkv1.0結(jié)果分類closeddivision在同一類測試環(huán)境中進行測試,不同存儲產(chǎn)品是可以進行橫向比較opendivision鼓勵創(chuàng)新,可以修改benchmark工具,以便于獲取更好的性能和測試效果avaliable現(xiàn)實生產(chǎn)環(huán)境中可用的產(chǎn)品,已經(jīng)發(fā)布的成熟產(chǎn)品preview實驗性的產(chǎn)品,或者開發(fā)中的原型,未發(fā)布MLPerfStorageBenchmarkv2.0v2.0subgroupsv2.0roadmap12345MDTESTVDBENCHIO500帶寬、IOPS和延遲的測試工具,模擬各類并發(fā)文件系統(tǒng)元數(shù)據(jù)性能測試工具,模擬各類元數(shù)據(jù)操作帶寬和IOPS的測試工具,在高性能領(lǐng)域應(yīng)用廣泛模擬業(yè)務(wù)場景的測試工具IOR+MDTEST,模擬超算的復(fù)雜業(yè)務(wù)場景,最全面的文件系統(tǒng)測試集合?。?!MLPerfStorage測試結(jié)果解讀MLPerfStorage測試結(jié)果分析18000016000014000012000010000080000MB/sMB/s40000200000MBMB/sACC(Accelerator)3D-Unet700006000050000400003000020000100000 MBMB/sACC(Accelerator)CosmoFlow12000010000080000600004000020000096270540ACC(Accelerator)ResNet503D-Unet每GPU需要2.9GBps的讀帶寬千卡集群需要2.9TBps讀帶寬cosmoFlow每GPU需要600MBps的讀帶寬千卡集群需要600GBps讀帶寬ResNet50每GPU需要200MBps的讀帶寬千卡集群需要200GBps讀帶寬不同GPU類型對存儲的性能要求3D-Unet模型訓(xùn)練性能數(shù)據(jù)600005000030000200001000001GPU10GPU20GPU 5606724960270047026127807026379361012802914V100A100H100坐標(biāo)軸標(biāo)題如果是B200,存儲帶寬又需要多少?并且GPU的演進還在繼續(xù)...模型驗證Pre-Process?CheckpointNVIDIA存儲性能推薦/dgx-superpod/reference-architecture-scalable-infrastructure-h100/latest/storage-architecture.html容量文件數(shù)量6.7PB65億28PB57億7.6PB370億1.1PB36億500TB18億1.1PB1.4億AI未來對存儲性能要求的AI未來對存儲性能要求的定期的checkpoint產(chǎn)生瞬硬件升級彈性擴展軟件升級硬件升級彈性擴展軟件升級2倍以上帶寬性能提升F8000X全閃存儲2倍以上帶寬性能提升F8000X全閃存儲帶寬成本下降60%帶寬成本下降60%/400GbEEthernetRoCE支持E3.S/U.2PCIe5.0TLC和QLCNVMeSSD第4代AMD7543CPUNVIDIAHDR200InfiniBand支持U.2PC/200GbEEthernetRoCEQLCNVMeSSDNFSClientNFSNFSClientNFSClientNFSClientNFSClient !Disks傳統(tǒng)NAS升級為并行文件系統(tǒng)TCP/IP升級為RDMANFS協(xié)議升級為POSIX私有協(xié)議posixclientposixclientposixclient-posixclientposixclientposixclient--------->posixclientPFSServerPFSPFSServerPFSServerPFSServerScaleout-Scaleout--------->PFSServer1000500100050024250121251000存儲集群讀帶寬(存儲集群讀帶寬(GBps)800600400200066331個SU2個SU4個SU8個SU計算集群規(guī)模605040存儲集群規(guī)模存儲集群規(guī)模30200?元數(shù)據(jù)處理能力也可以隨MDS集群規(guī)模擴大而提升// file2↓ file file2↓ file2 file2口MDS1口MDS2 ↓ file file2口MDS4Mast
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 學(xué)校安全重點部位實驗室檢查記錄表
- 高一化學(xué)教案:專題第二單元第三課時燃料燃燒釋放的熱量
- 2024高中物理章末質(zhì)量評估一含解析粵教版選修1-1
- 2024高中語文開學(xué)第一課學(xué)生觀后感范文800字少年強中國強素材
- 2024高中語文精讀課文二第4課1貝多芬:扼住命運的咽喉一課堂練習(xí)含解析新人教版選修中外傳記蚜
- 2024高考化學(xué)一輪復(fù)習(xí)第十二章物質(zhì)結(jié)構(gòu)與性質(zhì)第一講原子結(jié)構(gòu)與性質(zhì)規(guī)范演練含解析新人教版
- 2024高考歷史一輪復(fù)習(xí)方案專題十五西方人文精神的起源和發(fā)展專題整合備考提能教學(xué)案+練習(xí)人民版
- 2025新人教版英語七年級下單詞表(小學(xué)部分)
- (2篇)2024初中英語教師工作總結(jié)初中英語教師述職報告
- 倉庫管理制度通知
- 基本藥物制度政策培訓(xùn)課件
- 2025年中國華能集團限公司校園招聘高頻重點提升(共500題)附帶答案詳解
- 數(shù)字媒體技術(shù)應(yīng)用基礎(chǔ)知識單選題及答案解析
- 面部抗皺培訓(xùn)課件
- GB/T 45002-2024水泥膠砂保水率測定方法
- 2025年高考歷史復(fù)習(xí)之小題狂練300題(選擇題):世界多極化與經(jīng)濟全球化(20題)
- ISO 56001-2024《創(chuàng)新管理體系-要求》專業(yè)解讀與應(yīng)用實踐指導(dǎo)材料之1:0 引言(雷澤佳編制-2025B0)
- 生產(chǎn)安全事故事件管理知識培訓(xùn)課件
- 項目施工單位與當(dāng)?shù)卣按迕竦膮f(xié)調(diào)措施
- 浙江省寧波市寧??h2023-2024學(xué)年三年級上學(xué)期語文期末試卷
- 廣東省廣州海珠區(qū)2023-2024學(xué)年八年級上學(xué)期期末數(shù)學(xué)試卷(含答案)
評論
0/150
提交評論