醫(yī)療中心計算平臺需求說明_第1頁
醫(yī)療中心計算平臺需求說明_第2頁
醫(yī)療中心計算平臺需求說明_第3頁
醫(yī)療中心計算平臺需求說明_第4頁
醫(yī)療中心計算平臺需求說明_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

醫(yī)療中心計算平臺需求說明現(xiàn)狀與背景生命科學(xué)作為目前最重要的科學(xué)分支之一,高性能計算在生命科學(xué)的研究和發(fā)展中起到非常重要的作用。隨著信息技術(shù)的飛速發(fā)展,大數(shù)據(jù)開始沖擊著各個行業(yè),尤其是在生物醫(yī)領(lǐng)域,基因測序技術(shù)的革新使得測序速度快、低成本、高通量,與此同時產(chǎn)生了海量的數(shù)據(jù),已然進(jìn)入大數(shù)據(jù)行列,因此更加迫切需要高性能計算技術(shù)來處理這些信息,助力生物醫(yī)藥的快速發(fā)展。醫(yī)療中心擬建設(shè)生信計算平臺,為生信計算相關(guān)科學(xué)研究提供高性能的算力及大容量、高性能存儲資源,滿足醫(yī)院科研創(chuàng)新和關(guān)鍵技術(shù)研究需要,提升科研能力,以期能夠在人才、基礎(chǔ)科學(xué)研究、應(yīng)用科技創(chuàng)新、科技成果轉(zhuǎn)化等方面引領(lǐng)醫(yī)療中心的戰(zhàn)略建設(shè)。高性能硬件平臺的系統(tǒng)在部署時,采用物理機(jī)部署高性能計算節(jié)點(diǎn),搭建集群管理軟件,方便管理和擴(kuò)容。為確保平臺能順利搭建,需在建設(shè)周期內(nèi)安裝部署調(diào)測相關(guān)硬件設(shè)備,滿足業(yè)務(wù)發(fā)展的需要,總體目標(biāo)如下:1、搭建滿足具備高性能計算能力以及可靠性基礎(chǔ)硬件設(shè)施。2、實(shí)現(xiàn)所有資源統(tǒng)一管理、統(tǒng)一維護(hù)、避免資源浪費(fèi)。計算資源需求分析1)生信領(lǐng)域CPU節(jié)點(diǎn)需求分析:近20年來,隨著人類基因組計劃的相繼完成和各種模式生物的基因組計劃的順利實(shí)施,以及基因測序技術(shù)的不斷進(jìn)步,生命科學(xué)研究得到了巨大的發(fā)展。同時,海量的有關(guān)生物序列的數(shù)據(jù)不斷涌現(xiàn)。這些數(shù)據(jù)具有豐富的內(nèi)涵,其中蘊(yùn)含著大量的人類尚且不知道的生物學(xué)奧秘。生物信息學(xué)是研究生物信息的采集、處理、存儲、傳播、分析和解釋等各方面的一門學(xué)科,與以觀察和實(shí)驗為主的傳統(tǒng)生物學(xué)研究不同,它通過綜合利用生物學(xué)、計算機(jī)科學(xué)和信息技術(shù)而揭示大量而復(fù)雜的生物數(shù)據(jù)所蘊(yùn)含的生物學(xué)奧秘。針對高通量測序數(shù)據(jù)的各組學(xué)的生物信息分析,依賴于高性能的設(shè)備,在生物信息分析過程中對設(shè)備的性能要求很高。本次配置常規(guī)CPU計算節(jié)點(diǎn)、胖節(jié)點(diǎn)。2)人工智能GPU節(jié)點(diǎn)需求分析:利用GPU開展深度學(xué)習(xí)方面相關(guān)科學(xué)研究工作。該領(lǐng)域是機(jī)器學(xué)習(xí)領(lǐng)域中的一個新的方向,由于在諸多應(yīng)用中,尤其是圖像識別、計算機(jī)視覺和語音識別等方面有著比傳統(tǒng)機(jī)器學(xué)習(xí)更好的學(xué)習(xí)效果,越來越受到科研人員和企業(yè)工作者的青睞。影像數(shù)據(jù)對深度學(xué)習(xí)的理論研究解決了深度學(xué)習(xí)在訓(xùn)練過程中所遇到的梯度消失或者爆炸,容易過擬合等理論問題,互聯(lián)網(wǎng)大數(shù)據(jù)和數(shù)據(jù)共享平臺的發(fā)展解決了數(shù)據(jù)不充足的問題,而由于深度學(xué)習(xí)的網(wǎng)絡(luò)模型復(fù)雜、參數(shù)多、收斂困難和樣本數(shù)量龐大等特點(diǎn),相比于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的另一個重要區(qū)別就是需要海量的計算,這就對深度學(xué)習(xí)硬件系統(tǒng)的計算能力提出了更高的要求。為滿足這些需求特配置GPU計算節(jié)點(diǎn)。3)分布式存儲系統(tǒng)需求分析:在生信計算領(lǐng)域的高性能計算,既有大文件存儲場景(要求高聚合帶寬),又有小文件存儲場景(要求高IOPS)。隨著相關(guān)儀器設(shè)備和數(shù)據(jù)獲取手段進(jìn)步,產(chǎn)生的原始數(shù)據(jù)量也迅速增長,需要容量巨大的存儲系統(tǒng)。此外,數(shù)據(jù)處理過程中產(chǎn)生的臨時數(shù)據(jù)和最終結(jié)果也隨之不斷增長。數(shù)據(jù)處理中,數(shù)據(jù)處理節(jié)點(diǎn)需要不斷的讀寫存儲,來讀取原始數(shù)據(jù)和保存處理結(jié)果。這就要求存儲系統(tǒng)不僅要有巨大的存儲容量,還要有良好的擴(kuò)展性和聚合帶寬。為滿足這些需求,分別配置大容量分布式存儲及高性能存儲。4)計算網(wǎng)絡(luò)需求分析:高性能計算集群是一個通過內(nèi)部互聯(lián)網(wǎng)絡(luò)將松散的計算節(jié)點(diǎn)有效整合起來的系統(tǒng)架構(gòu),內(nèi)部互聯(lián)網(wǎng)絡(luò)是高性能計算集群的核心技術(shù)之一。集群系統(tǒng)內(nèi)部互聯(lián)網(wǎng)絡(luò)主要用于以MPI為代表的并行計算程序節(jié)點(diǎn)間的數(shù)據(jù)網(wǎng)絡(luò)通信,即作為計算網(wǎng)絡(luò)使用。不同計算方法和計算程序的數(shù)據(jù)通信特征不盡相同,從類型看,有的數(shù)據(jù)交換以小數(shù)據(jù)包為主,有的大數(shù)據(jù)包交換較多。小數(shù)據(jù)包交換較多時,計算性能和效率對計算網(wǎng)絡(luò)的延遲非常敏感,大數(shù)據(jù)包交換較多時,計算網(wǎng)絡(luò)的帶寬有關(guān)鍵性影響;從數(shù)據(jù)通信的頻率看,有的計算方法和程序數(shù)據(jù)通信不頻繁,對計算網(wǎng)絡(luò)的性能要求不高,有的數(shù)據(jù)通信密集,對計算網(wǎng)絡(luò)的性能要求很高??偟膩碚f,高性能計算機(jī)計算網(wǎng)絡(luò)的性能對并行計算程序的并行加速比和并行擴(kuò)展性有重要的影響。計算網(wǎng)絡(luò)需要有高帶寬、低延遲的特點(diǎn)。本次高速計算網(wǎng)絡(luò)及存儲網(wǎng)絡(luò)采用200Gb/sHDRInfiniBand網(wǎng)絡(luò)。詳細(xì)清單如下項目類別數(shù)量(臺/套)項目管理登錄節(jié)點(diǎn)1CPU計算節(jié)點(diǎn)4胖節(jié)點(diǎn)3GPU計算節(jié)點(diǎn)12GPU計算節(jié)點(diǎn)24高性能分布式存儲4大容量分布式存儲9千兆交換機(jī)1萬兆交換機(jī)1高速網(wǎng)絡(luò)交換機(jī)1集群管理與作業(yè)調(diào)度系統(tǒng)1集成實(shí)施服務(wù)1為確保集群管理軟件能夠進(jìn)行正常權(quán)限管理、配額管理、以及計費(fèi)管理,投標(biāo)人所投高性能分布式存儲、大容量分布式存儲、集群管理與作業(yè)調(diào)度系統(tǒng)應(yīng)為統(tǒng)一品牌??紤]生物信息學(xué)領(lǐng)域計算特點(diǎn),對算力集群的大規(guī)模數(shù)據(jù)處理能力、高效的計算能力、可擴(kuò)展性和靈活性、可靠性和穩(wěn)定性均有要求。具備在高性能計算和生物信息學(xué)領(lǐng)域的深厚技術(shù)背景和實(shí)踐經(jīng)驗尤為重要。為保證所投產(chǎn)品在生物信息領(lǐng)域的運(yùn)用,投標(biāo)人需提供分布式存儲生產(chǎn)廠商生物信息相關(guān)的測試報告,報告應(yīng)涵蓋二代測序或三代測序相關(guān)的測試內(nèi)容。技術(shù)要求4.1、管理登錄節(jié)點(diǎn)序號技術(shù)要求1機(jī)型:2U。2處理器:配置≥2顆CPU,核心數(shù)≥12核,每顆CPU主頻≥2.0GHz,L3緩存≥30M。3內(nèi)存:配置≥16條16GBDDR54800內(nèi)存,支持≥32個內(nèi)存插槽,支持內(nèi)存ECC保護(hù)、內(nèi)存鏡像、內(nèi)存熱備。4硬盤:配置≥2塊480GSATASSD,系統(tǒng)盤做Raid1。5M.2擴(kuò)展:主板板載2個M.2接口并提供主板實(shí)物照片及證明文件。6Riad卡:配置4GBCache、12GbRAID控制器,支持RAID0/1/5/10/50。7網(wǎng)絡(luò):配置≥1張雙口1GRJ45網(wǎng)卡,配置≥1張雙口10G光纖網(wǎng)卡(含SFP+多模光模塊),配置≥1單端口100GHDRHCA卡。8GPU卡:配置2張雙寬GPU卡,F(xiàn)P64≥9.7TFPLOPS,同時支持混合精度計算(含F(xiàn)P64、FP32、FP16、INT8)算力。9系統(tǒng)風(fēng)扇:配置6個熱插拔風(fēng)扇模組,支持N+2冗余。10PCIE擴(kuò)展:支持8個PCIe5.0槽位,至少6個PCIe5.0x16。11電源:配置熱插拔鉑金1+1冗余電源,單個電源功率不低于1300W白金電源。12可靠性檢測報告:提供產(chǎn)品可靠性測試報告,溫度測試,濕度測試,低氣壓試驗、鹽霧試驗、振動試驗、重啟試驗、運(yùn)輸包裝試驗等,提供第三方評測機(jī)構(gòu)簽字蓋章的測試報告作為證明。4.2、CPU計算節(jié)點(diǎn)序號技術(shù)要求1機(jī)型:2U。2處理器:配置≥2顆CPU,核心數(shù)≥32核,每顆CPU主頻≥2.1GHz,L3緩存≥60M,含超融合云平臺軟件授權(quán)許可。3內(nèi)存:配置≥16條32GBDDR54800內(nèi)存,支持≥32個內(nèi)存插槽,支持內(nèi)存ECC保護(hù)、內(nèi)存鏡像、內(nèi)存熱備。4硬盤:配置≥2塊960GSATASSD(讀寫混合型),配置≥2塊1.92TSATASSD,配置≥4塊8T7.2kSATAHDD。5Riad卡:配置4GBCache、12GbRAID控制器,支持RAID0/1/5/10/50。6網(wǎng)絡(luò):配置≥1張雙口1GRJ45網(wǎng)卡,配置≥1張雙口10G光纖網(wǎng)卡(含SFP+多模光模塊),配置≥1單端口100GHDRHCA卡。7電源:配置熱插拔鉑金1+1冗余電源,單個電源功率不低于1300W白金電源。8自主知識產(chǎn)權(quán):云平臺為國產(chǎn)自研產(chǎn)品,即不基于OpenStack、CloudStack等開源項目進(jìn)行商業(yè)化二次開發(fā)。9超融合產(chǎn)品通過《信息技術(shù)云計算超融合系統(tǒng)通用技術(shù)要求》標(biāo)準(zhǔn)符合性測試,測評等級為擴(kuò)展級或擴(kuò)展及以上。10云主機(jī)管理:支持在3臺,5分鐘內(nèi)完成200臺云主機(jī)批量創(chuàng)建云主機(jī)(規(guī)格4C8G)。云平臺支持在線跨大版本升級,升級過程≤15分鐘,升級過程不影響云主機(jī)業(yè)務(wù)。11啟動方式:支持云主機(jī)的啟動順序調(diào)整,支持網(wǎng)絡(luò)、硬盤和光驅(qū)3種啟動方式,支持在圖形界面對啟動順序進(jìn)行調(diào)整,支持網(wǎng)絡(luò)啟動優(yōu)先、硬盤啟動優(yōu)先等設(shè)置。12雙棧網(wǎng)絡(luò):支持云主機(jī)配置IPv4、IPv6或雙棧(IPv4+IPv6)類型的網(wǎng)絡(luò),并可使用多種網(wǎng)絡(luò)服務(wù)。13VPC路由器:支持配置OSPF動態(tài)路由協(xié)議,實(shí)現(xiàn)和物理交換機(jī)建立OSPF鄰接關(guān)系。14數(shù)據(jù)冗余模式:支持多副本與EC糾刪碼兩種數(shù)據(jù)保護(hù)方式。15故障域收斂:支持磁盤分組、節(jié)點(diǎn)分區(qū)等技術(shù),縮小故障域,進(jìn)一步保障數(shù)據(jù)安全。16QoS:配置基于LUN的QoS設(shè)置功能,同時支持?jǐn)?shù)據(jù)修復(fù)QoS設(shè)置。當(dāng)磁盤或節(jié)點(diǎn)故障時,可靈活調(diào)整數(shù)據(jù)修復(fù)性能與前端業(yè)務(wù)性能的優(yōu)先級。17熱度分級:塊存儲支持基于IO熱度的分級功能,可自動將高頻訪問的數(shù)據(jù)遷移至高性能介質(zhì)層級中,提升系統(tǒng)整體性能。各性能介質(zhì)層級的容量均可計入存儲池總?cè)萘?,不接受SSD緩存加速方式。18一致性組:配置卷的一致性組功能,可將多個卷加入同一個一致性組中,支持對一致性組創(chuàng)建主機(jī)映射、快照等功能。19云平臺升級:支持云平臺從低版本到高版本的無縫升級,支持任意跨多版本升級,半小時內(nèi)完成,中標(biāo)7天內(nèi)提供測試,擴(kuò)展不受副本限制,可按節(jié)點(diǎn)擴(kuò)展。20監(jiān)控告警:支持對云主機(jī)、路由器、鏡像、系統(tǒng)數(shù)據(jù)目錄、物理機(jī)、三層網(wǎng)絡(luò)、云盤、虛擬IP、主存儲、監(jiān)聽器和項目資源等多種監(jiān)控對象的單個資源或全部資源進(jìn)行監(jiān)控:支持創(chuàng)建告警器自定義告警級別,方便云平臺用戶關(guān)注最緊急的告警消息。21監(jiān)控大屏:支持對云主機(jī)、VPC路由器、物理機(jī)、三層網(wǎng)絡(luò)、云盤、虛擬IP、主存儲、監(jiān)聽器等多種監(jiān)控對象的單個資源或全部資源進(jìn)行監(jiān)控。22平臺功能:支持第三方用戶/平臺在云平臺上通過AccessKey訪問云資源,支持配置AccessKeyID和AccessKeySecret作為用戶身份標(biāo)識信息,提供應(yīng)用中心管理功能,支持添加包括存儲、數(shù)據(jù)庫、安全、IaaS、PaaS、SaaS類型在內(nèi)的應(yīng)用插件,支持一鍵設(shè)置安全場景。4.3、胖節(jié)點(diǎn)序號技術(shù)要求1采用第四代處理器,機(jī)型:4U,附帶導(dǎo)軌,可放入42U標(biāo)準(zhǔn)機(jī)柜,機(jī)箱長不超過800mm。2處理器:配置≥4顆CPU,核心數(shù)≥32核,每顆CPU主頻≥2.4GHz,L3緩存≥60M。3內(nèi)存:配置≥24條64GBDDR54800內(nèi)存,最大顆支持64個DDR5內(nèi)存插槽,支持內(nèi)存ECC、內(nèi)存鏡像、內(nèi)存熱備等多種保護(hù)模式。4硬盤:配置≥2塊960GSATASSD,配置≥1塊1.92TSATASSD。5硬盤擴(kuò)展:前置支持≥48個2.5寸硬盤擴(kuò)展,后置支持≥2個2.5及4個3.5擴(kuò)展,內(nèi)置≥2個M.2擴(kuò)展。6Riad卡:配置4GBCache、12GbRAID控制器,支持RAID0/1/5/10/50。7網(wǎng)絡(luò):配置≥1張雙口1GRJ45網(wǎng)卡,配置≥1張雙口10G光纖網(wǎng)卡(含SFP+多模光模塊),配置≥1單端口100GHDRHCA卡。8最大可配置21個PCIe擴(kuò)展插槽,包括1個OCP插槽。9維護(hù):支持ID燈及按鍵,隱藏式標(biāo)簽抽條,2個VGA接口,4個USB3.0,1個TypeC接口。10電源模塊:配置≥4個電源功率不低于1300W白金電源,并可最大支持N+N冗余供電。11集成系統(tǒng)管理芯片:支持iKVM和KVMOverIP高級管理功能,本地固件更新、錯誤日志,提供系統(tǒng)狀況的可視顯示;配置獨(dú)立的遠(yuǎn)程管理控制端口,支持遠(yuǎn)程監(jiān)控圖形界面,可實(shí)現(xiàn)與操作系統(tǒng)無關(guān)的遠(yuǎn)程對設(shè)備的完全控制,包括遠(yuǎn)程的開機(jī)、關(guān)機(jī)、重啟、虛擬設(shè)備掛載等操作;可實(shí)現(xiàn)監(jiān)控設(shè)備內(nèi)部主要部件的狀態(tài),包括CPU、內(nèi)存、硬盤、風(fēng)扇、電源、功率、溫度等信息;可實(shí)現(xiàn)遠(yuǎn)程Web界面下查詢及配置BIOS選項,支持黑盒子功能。12產(chǎn)品環(huán)境適應(yīng)性檢測:所投產(chǎn)品通過貯存溫度測試、工作溫度上下限測試、變交濕熱測試、鹽霧測試等。13產(chǎn)品性能檢測:所投產(chǎn)品通過性能測試,測試內(nèi)容包括整型性能測試、浮點(diǎn)性能測試、LMbench測試、Stream測試、Iozone測試、數(shù)據(jù)盤讀寫性能測試、SpecPower測試、Netperf測試等。14產(chǎn)品可靠性檢測:所投產(chǎn)品外觀設(shè)計合理,穩(wěn)定可靠,提供第三方評測機(jī)構(gòu)簽字蓋章的測試報告,內(nèi)容包括外觀和結(jié)構(gòu)試驗、噪聲試驗和電源能耗試驗報告。4.4、GPU計算節(jié)點(diǎn)1序號技術(shù)要求1機(jī)型:2U。2處理器:配置≥2顆CPU,核心數(shù)≥96核,每顆CPU主頻≥2.4GHz,L3緩存≥384M。3內(nèi)存:配置≥24條96GBDDR54800內(nèi)存,支持≥24個內(nèi)存插槽,支持內(nèi)存ECC保護(hù)、內(nèi)存鏡像、內(nèi)存熱備。4硬盤:配置≥2塊960GSATASSD,系統(tǒng)盤做Raid1。5Riad卡:配置4GBCache、12GbRAID控制器,支持RAID0/1/5/10/50。6網(wǎng)絡(luò):配置≥1張雙口1GRJ45網(wǎng)卡,配置≥1張雙口10G光纖網(wǎng)卡(含SFP+多模光模塊),配置≥1單端口100GHDRHCA卡。7系統(tǒng)風(fēng)扇:配置6個熱插拔風(fēng)扇模組,支持N+2冗余。8GPU卡擴(kuò)展:最大支持4雙寬GPU/8單寬GPU。9電源:配置熱插拔鉑金1+1冗余電源,單個電源功率不低于2200W白金電源。10安全:用戶可以設(shè)定想要阻止訪問BMC的黑名單,或者設(shè)定允許訪問BMC的白名單,提升安全性。11智能管控:BMC監(jiān)控CPU、內(nèi)存、HDD、PCIE設(shè)備和風(fēng)扇功耗,通過BMCWEB設(shè)定整機(jī)功耗封頂值,當(dāng)實(shí)際功耗超過封頂值,自動對CPU做降功耗處理從而實(shí)現(xiàn)整機(jī)功耗剎車功能;CPLD可實(shí)時偵測BMC相關(guān)信號以判斷BMC是否響應(yīng)正常,如果不正常一定時間后自動恢復(fù)BMC。4.5、GPU計算節(jié)點(diǎn)2序號技術(shù)要求1機(jī)型:2U。2處理器:配置≥2顆CPU,核心數(shù)≥96核,每顆CPU主頻≥2.4GHz,L3緩存≥384M。3內(nèi)存:配置≥16條64GBDDR54800內(nèi)存,支持≥24個內(nèi)存插槽,支持內(nèi)存ECC保護(hù)、內(nèi)存鏡像、內(nèi)存熱備。4硬盤:配置≥2塊960GSATASSD,系統(tǒng)盤做Raid1。5Riad卡:配置4GBCache、12GbRAID控制器,支持RAID0/1/5/10/50。6網(wǎng)絡(luò):配置≥1張雙口1GRJ45網(wǎng)卡,配置≥1張雙口10G光纖網(wǎng)卡(含SFP+多模光模塊),配置≥1單端口100GHDRHCA卡。7GPU卡:配置1張雙寬GPU卡,單塊GPU卡計算核心數(shù)量≥18176,單塊GPU卡顯存容量≥48GB。8系統(tǒng)風(fēng)扇:配置6個熱插拔風(fēng)扇模組,支持N+2冗余。9GPU卡擴(kuò)展:最大支持4雙寬GPU/8單寬GPU。10電源:配置熱插拔鉑金1+1冗余電源,單個電源功率不低于2200W白金電源。11安全:用戶可以設(shè)定想要阻止訪問BMC的黑名單,或者設(shè)定允許訪問BMC的白名單,提升安全性。12智能管控:BMC監(jiān)控CPU、內(nèi)存、HDD、PCIE設(shè)備和風(fēng)扇功耗,通過BMCWEB設(shè)定整機(jī)功耗封頂值,當(dāng)實(shí)際功耗超過封頂值,自動對CPU做降功耗處理從而實(shí)現(xiàn)整機(jī)功耗剎車功能;CPLD可實(shí)時偵測BMC相關(guān)信號以判斷BMC是否響應(yīng)正常,如果不正常一定時間后自動恢復(fù)BMC。4.6、高性能分布式存儲序號技術(shù)要求1產(chǎn)品形態(tài):支持3~4096節(jié)點(diǎn)的彈性無縫擴(kuò)展,單一存儲空間容量可擴(kuò)展至EB級。支持文件存儲、對象存儲、塊存儲、大數(shù)據(jù)存儲服務(wù)。2產(chǎn)品自研能力:具有完全自主知識產(chǎn)權(quán),廠商具備存儲產(chǎn)品軟硬件平臺設(shè)計開發(fā)能力、服務(wù)器生產(chǎn)制造能力。3處理器:配置≥2顆CPU,核心數(shù)≥12核,每顆CPU主頻≥2.1GHz。4內(nèi)存配置≥4條16GDDR4。5存儲空間:配置≥24個2.5寸熱插拔硬盤槽位,系統(tǒng)盤:≥2塊960GB2.5SATASSD,數(shù)據(jù)盤:≥16塊7.68T2.5U.2NvmeSSD。6存儲協(xié)議:LinuxPOSIX、NFS、SMB、FTP、S3、HDFS。7網(wǎng)絡(luò):配置≥1張雙口1GRJ45網(wǎng)卡,配置≥1張雙口10G光纖網(wǎng)卡(含SFP+多模光模塊),配置≥1單端口100GHDRHCA卡。8產(chǎn)品架構(gòu):采用Scale-Out分布式集群存儲架構(gòu),支持全局單一文件系統(tǒng)和統(tǒng)一命名空間,不接受IO節(jié)點(diǎn)+擴(kuò)展柜或JBOD的模式,同時支持全對稱式、非對稱式部署兩種方式,全冗余架構(gòu),無單點(diǎn)故障,支持多種網(wǎng)絡(luò)類型,包括1GbE、10GbE、25GbE、100GbInfiniband等。9存儲協(xié)議:本次采用POSIX協(xié)議接口部署,在計算節(jié)點(diǎn)部署POSIX內(nèi)核態(tài)安裝包,POSIX接口數(shù)據(jù)共享訪問延遲低于10ms。支持單個客戶端掛載多套存儲集群文件系統(tǒng)。10目錄QoS功能:可設(shè)置目錄承載的最大帶寬及IOPS,保證關(guān)鍵業(yè)務(wù)的性能資源。11MPI-IO融合:分布式存儲支持MPI-IO。12回收站功能:支持?jǐn)?shù)據(jù)回收站功能,回收站過期時間支持不少于25天。13數(shù)據(jù)策略:支持在線修改糾刪碼、數(shù)據(jù)副本配置功能。14IO可視化:本地存儲系統(tǒng)支持部署IO可視化分析工具,提供IO讀寫分布統(tǒng)計、IO塊大小統(tǒng)計、隨機(jī)程度統(tǒng)計、客戶端帶寬IOPS、獨(dú)立緩存節(jié)點(diǎn)特性等分析等。15分級存儲:支持?jǐn)?shù)據(jù)再快速和低速存儲介質(zhì)上流動,可以根據(jù)文件名、文件大小、訪問時間、修改時間等設(shè)置數(shù)據(jù)遷移策略。16數(shù)據(jù)遷移:產(chǎn)品原生支持?jǐn)?shù)據(jù)遷移功能(子模塊),與產(chǎn)品同品牌,非第三方OEM軟件產(chǎn)品或功能,遷移過程可視化。17運(yùn)維管理:提供GUI管理界面,支持運(yùn)維可視化,無需第三方軟件或插件,即可支持同一Web界面管理多套存儲集群。4.7、大容量分布式存儲序號技術(shù)要求1本次配置分布式存儲劃分為2個存儲池。其中3節(jié)點(diǎn)用于HPC集群,6節(jié)點(diǎn)用戶GPU集群。2產(chǎn)品形態(tài):支持3~4096節(jié)點(diǎn)的彈性無縫擴(kuò)展,單一存儲空間容量可擴(kuò)展至EB級。支持文件存儲、對象存儲、塊存儲、大數(shù)據(jù)存儲服務(wù)。3產(chǎn)品自研能力:具有完全自主知識產(chǎn)權(quán),廠商具備存儲產(chǎn)品軟硬件平臺設(shè)計開發(fā)能力、服務(wù)器生產(chǎn)制造能力。4處理器:配置≥2顆CPU,核心數(shù)≥12核,每顆CPU主頻≥2.1GHz。5內(nèi)存配置≥4條16GDDR4。6存儲空間:配置≥36個3.5寸熱插拔硬盤槽位,≥4個2.5寸后置熱插拔硬盤槽位。系統(tǒng)盤:≥2塊480G2.5SATASSD,元數(shù)據(jù)盤:≥2塊960GB2.5SATASSD,緩存盤:≥2塊3.84TNVME硬盤,數(shù)據(jù)盤:≥32塊18TB3.5寸7.2KSATA硬盤。7存儲協(xié)議:LinuxPOSIX、NFS、SMB、FTP、S3、HDFS。8網(wǎng)絡(luò):配置≥1張雙口1GRJ45網(wǎng)卡,配置≥1張雙口10G光纖網(wǎng)卡(含SFP+多模光模塊),配置≥1單端口100GHDRHCA卡。9產(chǎn)品架構(gòu):采用Scale-Out分布式集群存儲架構(gòu),支持全局單一文件系統(tǒng)和統(tǒng)一命名空間,不接受IO節(jié)點(diǎn)+擴(kuò)展柜或JBOD的模式,同時支持全對稱式、非對稱式部署兩種方式,全冗余架構(gòu),無單點(diǎn)故障,支持多種網(wǎng)絡(luò)類型,包括1GbE、10GbE、25GbE、100GbInfiniband等。10存儲快照:支持文件/目錄級快照,存儲系統(tǒng)支持快照≥20000;存儲系統(tǒng)的Web界面可實(shí)現(xiàn)快照的回滾,以上功能提供Web界面功能截圖證明,投標(biāo)時提供第三方檢測機(jī)構(gòu)提供的測試報告掃描件。11回收站功能:支持?jǐn)?shù)據(jù)回收站功能,回收站過期時間支持不少于25天,投標(biāo)時提供Web界面功能截圖作為證明。12數(shù)據(jù)策略:支持在線修改糾刪碼、數(shù)據(jù)副本配置功能。13遠(yuǎn)程復(fù)制:支持文件級遠(yuǎn)程復(fù)制(非分布式塊級),基于目錄級異步復(fù)制,支持1對1復(fù)制、1對多復(fù)制、多對1復(fù)制、雙向復(fù)制;支持Failover、Failback,實(shí)現(xiàn)遠(yuǎn)程容災(zāi)備份;可實(shí)時顯示復(fù)制進(jìn)度,復(fù)制占用帶寬,可對復(fù)制網(wǎng)絡(luò)帶寬進(jìn)行限制。14分級存儲:支持?jǐn)?shù)據(jù)再快速和低速存儲介質(zhì)上流動,可以根據(jù)文件名、文件大小、訪問時間、修改時間等設(shè)置數(shù)據(jù)遷移策略。15數(shù)據(jù)遷移:產(chǎn)品原生支持?jǐn)?shù)據(jù)遷移功能(子模塊),與產(chǎn)品同品牌,非第三方OEM軟件產(chǎn)品或功能,遷移過程可視化。16運(yùn)維管理:提供GUI管理界面,支持運(yùn)維可視化,無需第三方軟件或插件,即可支持同一Web界面管理多套存儲集群。17第三方系統(tǒng)兼容性:兼容OpenStack、Kubernetes、VMware等主流架構(gòu)云、容器和虛擬化平臺;本地存儲系統(tǒng)兼容紅旗、中科方德等常見國產(chǎn)OS操作系統(tǒng)。4.8、千兆交換機(jī)序號技術(shù)要求1配置48個10/100/1000M自適應(yīng)電口,4個1G/10GSFP+光口,交換容量≥672Gbps/6.72Tbps、包轉(zhuǎn)發(fā)率≥207Mpps/260Mpps。4.9、萬兆交換機(jī)序號技術(shù)要求1配置48個10GSFP+接口、8個100GQSFP28接口,交換容量≥4.8Tbps,包轉(zhuǎn)發(fā)速率≥2000Mpps。配置滿足本項目的所需的線纜。4.10、高速交換機(jī)序號技術(shù)要求1≥40個200GB端口IB交換機(jī),配齊本次所需IB光纜。4.11、集群管理與作業(yè)調(diào)度系統(tǒng)序號技術(shù)要求1商業(yè)版產(chǎn)品:軟件界面必須實(shí)現(xiàn)完全中文化。2API接口:提供開發(fā)接口API及文檔,允許在該套系統(tǒng)基礎(chǔ)上做二次開發(fā)。提供API示例文檔。3物理視圖:提供設(shè)備詳細(xì)狀態(tài)監(jiān)控視圖,分類展示該節(jié)點(diǎn)的靜態(tài)信息和運(yùn)行狀態(tài)。靜態(tài)配置信息包括CPU型號、內(nèi)存大小、管理IP、操作系統(tǒng)版本等,動態(tài)信息包括磁盤分區(qū)狀態(tài)、網(wǎng)卡狀態(tài)、進(jìn)程狀態(tài)、IPMI傳感器狀態(tài)、GPU/MIC狀態(tài)等。支持iKVM遠(yuǎn)程管理。4支持圖形可視化方式集中展現(xiàn)集群中所有服務(wù)器的關(guān)鍵指標(biāo),如CPU利用率、內(nèi)存利用率、網(wǎng)絡(luò)可用性、電源狀態(tài)、溫度等,支持指標(biāo)快速切換。5數(shù)據(jù)分析:支持節(jié)點(diǎn)健康度按照(關(guān)機(jī)時間,管理網(wǎng)不可用,告警數(shù)量)進(jìn)行統(tǒng)計分析節(jié)點(diǎn)用量統(tǒng)計分析(相對一分鐘負(fù)載,內(nèi)存利用率,磁盤利用率,磁盤增長量,功耗)。6監(jiān)控首頁:支持集群負(fù)載,集群功耗,健康度,共享存儲等統(tǒng)計分析。7GPU監(jiān)控:支持監(jiān)控GPU資源總量/使用量、核心平均利用率、顯存平均利用率、溫度、顯存頻率、核心頻率、型號、SN號、負(fù)載進(jìn)程、功耗、風(fēng)扇轉(zhuǎn)速、PCIE寬度、PCIEgen、PCIE接收與發(fā)送速率、GPU驅(qū)動版本等指標(biāo)。8大規(guī)模監(jiān)控:集群管理和作業(yè)調(diào)度軟件針對HPC深度優(yōu)化,具有支持大規(guī)模調(diào)度能力,支持3000節(jié)點(diǎn)或以上調(diào)度。9集群配置管理運(yùn)維工具:提供一套基于命令行的集群環(huán)境配置工具軟件,實(shí)現(xiàn)一鍵配置所有節(jié)點(diǎn)的SSH無密碼訪問、RSH無密碼訪問、網(wǎng)絡(luò)連通檢測、IPMI配置、NFS配置、添加及刪除用戶、同步文件,實(shí)現(xiàn)所有節(jié)點(diǎn)并行執(zhí)行命令等功能,方便集群運(yùn)維管理。10軟件環(huán)境自動化部署工具:提供一套自動化部署工具,工具具有常用MPI、數(shù)學(xué)函數(shù)庫、GPU開發(fā)環(huán)境、HPC基準(zhǔn)測試程序、常用開源HPC應(yīng)用軟件的一鍵部署功能,可選擇性或一鍵安裝。11日志管理:提供平臺操作日志管理功能,允許管理員查看登陸用戶的歷史操作記錄。12調(diào)度系統(tǒng):支持基于支持PBS和SLURM雙擎計算調(diào)度系統(tǒng)。13作業(yè)優(yōu)先級策略:支持基于隊列、用戶、用戶組等多個維度的優(yōu)先級定義策略,根據(jù)作業(yè)的靜態(tài)(如資源請求、所屬用戶等)和動態(tài)指標(biāo)(如入隊時間、公平共享份額等),通過不同的權(quán)重設(shè)置,靈活控制作業(yè)優(yōu)先級。14作業(yè)回填策略:支持作業(yè)回填,有效平衡大作業(yè)和小作業(yè)的調(diào)度,提高集群作業(yè)吞吐量;支持作業(yè)多級搶占,支持對被搶占作業(yè)進(jìn)行“掛起”、“重新入隊”等處理操作;允許作業(yè)獨(dú)占計算節(jié)點(diǎn),支持集群、隊列、作業(yè)三級的的節(jié)點(diǎn)獨(dú)占策略設(shè)置。15瞬時提交性能:支持大批量作業(yè)的實(shí)時調(diào)度,支持最大瞬時大規(guī)模作業(yè)(超過1000+個)的同時提交。16殘留進(jìn)程和非法進(jìn)程清理:支持對作業(yè)殘留進(jìn)程和非法作業(yè)(即未提交調(diào)度系統(tǒng)、手動運(yùn)行的作業(yè))進(jìn)程的自動清理。支持基于節(jié)點(diǎn)、用戶、進(jìn)程等不同維度的白名單和黑名單設(shè)置,支持多維復(fù)合過濾條件設(shè)置,支持對殘留作業(yè)進(jìn)程、非法作業(yè)進(jìn)程的自動清理。17用戶資源配置:支持基于Web的用戶管理,設(shè)置不同用戶的用戶類型、用戶優(yōu)先級、資源配額、可訪問隊列等。18應(yīng)用特征采集:支持應(yīng)用特征分析工具,結(jié)合軟硬件平臺,用于分析軟件及硬件的調(diào)優(yōu)。19應(yīng)用瓶頸分析:通過應(yīng)用特征的實(shí)時監(jiān)控可以更加清晰的了解應(yīng)用程序在運(yùn)行時所需要的硬件資源,從而可以給出針對不同應(yīng)用程序的更優(yōu)的解決方案,同時可以了解硬件環(huán)境的實(shí)時運(yùn)行現(xiàn)狀,發(fā)現(xiàn)某些程序在運(yùn)行時的瓶頸所在,更好的優(yōu)化并行應(yīng)用程序。20應(yīng)用分析示例:提供軟件運(yùn)行特征示例截圖。提供硬件CPU利用率、CPU軟中斷、網(wǎng)絡(luò)監(jiān)控、系統(tǒng)服務(wù)監(jiān)控、應(yīng)用程序監(jiān)控、用戶組監(jiān)控、微架構(gòu)&GPU監(jiān)控、統(tǒng)計分析等。項目實(shí)施、售后服務(wù)和質(zhì)量要求為使項目按質(zhì)、按量、按時及有序?qū)嵤?,供?yīng)商應(yīng)建立完善、穩(wěn)定的協(xié)調(diào)機(jī)制、制定包括但不限于安裝、調(diào)試、培訓(xùn)等方面的規(guī)劃計劃,從各方面創(chuàng)造良好的服務(wù)環(huán)境,確保項目的順利實(shí)施。(一)項目實(shí)施要求1、人員組織管理(1)項目經(jīng)理配備:負(fù)責(zé)本項目的項目經(jīng)理,5年或以上工作經(jīng)驗,具備信息系統(tǒng)項目管理師證書,需掌握計算機(jī)系統(tǒng)、網(wǎng)絡(luò)、安全等方面的知識,能夠快速熟悉并掌握醫(yī)院的業(yè)務(wù)運(yùn)作模式,承擔(dān)起項目質(zhì)量、安全、管理的責(zé)任。負(fù)責(zé)處理項目日常事務(wù)工作,在項目計劃、組織和控制活動中做好領(lǐng)導(dǎo)工作,起到上傳下達(dá)的作用,配合協(xié)調(diào)采購安裝、軟件廠商部署、調(diào)試事宜,確保項目按照約定工期完成,達(dá)到項目順利完成的目的。(2)技術(shù)人員配備:負(fù)責(zé)本項目的技術(shù)人員,3年或以上工作經(jīng)驗,具備系統(tǒng)集成項目管理工程師或系統(tǒng)架構(gòu)設(shè)計師或者軟件測評師一項或多項證書,必須熟悉系統(tǒng)軟件、集群管理等,具備相關(guān)的網(wǎng)絡(luò)、集成等知識,確保項目按照約定工期完成,達(dá)到項目順利完成的目的。(3)在系統(tǒng)實(shí)施期間,承諾的項目經(jīng)理及實(shí)施人員未經(jīng)采購人同意不得調(diào)整,如中途更換項目經(jīng)理,必須征得采購人同意。如在項目實(shí)施過程中出現(xiàn)資源、進(jìn)度、質(zhì)量協(xié)調(diào)控制不力的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論