聯(lián)邦學(xué)習(xí)算力加速方案_第1頁(yè)
聯(lián)邦學(xué)習(xí)算力加速方案_第2頁(yè)
聯(lián)邦學(xué)習(xí)算力加速方案_第3頁(yè)
聯(lián)邦學(xué)習(xí)算力加速方案_第4頁(yè)
聯(lián)邦學(xué)習(xí)算力加速方案_第5頁(yè)
已閱讀5頁(yè),還剩33頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

聯(lián)邦學(xué)習(xí)算力加速方案演講人:趙榮

星云Clustar

產(chǎn)品總監(jiān)01 背景介紹聯(lián)邦學(xué)習(xí)的工作流程參與方

B數(shù)據(jù)對(duì)齊(隱私安全求交)模型訓(xùn)練模型更新模型更新子模型

B子模型

A模型訓(xùn)練加密加密同態(tài)加密參數(shù)聚合同態(tài)加密參數(shù)聚合全局模型參與方A聯(lián)邦學(xué)習(xí)算力性能挑戰(zhàn)聯(lián)邦學(xué)習(xí)聯(lián)邦學(xué)習(xí)是一種在保護(hù)數(shù)據(jù)隱私安全的前提下,聯(lián)合多方進(jìn)行共同建模的分布式機(jī)器學(xué)習(xí)框架。在訓(xùn)練過(guò)程中,通過(guò)對(duì)模型參數(shù)進(jìn)行加密、傳遞、運(yùn)算、解密,實(shí)現(xiàn)整體模型表現(xiàn)的提升。計(jì)算挑戰(zhàn)在聯(lián)邦學(xué)習(xí)過(guò)程中,為了支持參數(shù)和數(shù)據(jù)可以在密態(tài)下進(jìn)行無(wú)損的計(jì)算,需使用同態(tài)加密技術(shù)(加密后的數(shù)據(jù)為2048bit大整數(shù)),而同態(tài)加密技術(shù)會(huì)帶來(lái)計(jì)算量和傳輸量的劇增。解決方案

->

異構(gòu)硬件加速》重點(diǎn)考慮異構(gòu)硬件特性定制:根據(jù)場(chǎng)景和算法定制架構(gòu)和計(jì)算引擎,計(jì)算效率高。并行:

可在算法、多引擎、pipeline處理等多個(gè)層面優(yōu)化并行度。延遲:高帶寬傳輸,純硬件電路,無(wú)指令執(zhí)行概念。部署:可在云或本地切換部署解決方案并根據(jù)應(yīng)用需求擴(kuò)展。異構(gòu)算力芯片比較CPUGPUFPGAASICThroughputLowHighHighVery

highLatencyHighHighLowLowPowerHighHighLowVery

lowPrice

at

scaleHighHighHighLowFlexibilityVery

highHighVery

HighLowGPU和FPGA各有優(yōu)勢(shì),綜合考慮GPU&FPGA哪個(gè)方案更有性?xún)r(jià)比?異構(gòu)算力方案比較重點(diǎn)考慮:將復(fù)雜運(yùn)算轉(zhuǎn)移至硬件設(shè)備執(zhí)行,大幅提升并行處理效率,支持高并發(fā)、低延遲FPGAGPU特性資源豐富,算力強(qiáng)大,可以有效完成復(fù)雜度較高的運(yùn)算?;赟IMT(單指令多線(xiàn)程)架構(gòu),其主體由多個(gè)相同的流式多處理器組成。因此具有高并發(fā)度的特點(diǎn)。內(nèi)存分級(jí)機(jī)制,可以大幅提高數(shù)據(jù)讀寫(xiě)和處理速率。具有很強(qiáng)的可編程性,可以根據(jù)不同需求快速實(shí)現(xiàn)算法的硬件實(shí)現(xiàn),GPU在通用計(jì)算領(lǐng)域的作用比較重要。? 結(jié)構(gòu)固定,存在內(nèi)存墻? 高性能的Cache存在“數(shù)據(jù)局部性”? 大數(shù)據(jù)量批處理時(shí)增加額外Latency? 全定制的緩存結(jié)構(gòu)和數(shù)據(jù)位寬? X5

倍的片內(nèi)緩存容量? 最大吞吐,最小延遲,高度PipelineGPUFPGA特性可編程邏輯電路,F(xiàn)PGA內(nèi)部資源游離分配,可以根據(jù)設(shè)計(jì)人員的需要進(jìn)行編程并行性,可編程定制不同功能的程邏輯電路,數(shù)百萬(wàn)個(gè)LUT進(jìn)行大規(guī)模并行計(jì)算高速性能,快速的時(shí)鐘速度和響應(yīng)時(shí)間,因此可以處理高速數(shù)據(jù)流和實(shí)時(shí)信號(hào)低功耗&可重構(gòu)VS02 算力方案結(jié)合算力產(chǎn)品-全棧產(chǎn)品介紹星云隱私計(jì)算算力方案數(shù)據(jù)市場(chǎng)星云安全數(shù)據(jù)網(wǎng)絡(luò)(SDN)數(shù)據(jù)網(wǎng)絡(luò) 離線(xiàn)/在線(xiàn)服務(wù)價(jià)值運(yùn)營(yíng)RDMAFPGAGPU聯(lián)邦學(xué)習(xí)多方安全計(jì)算聯(lián)合建模匿蹤查詢(xún)星云隱私計(jì)算平臺(tái)聯(lián)合查詢(xún)/統(tǒng)計(jì)

聯(lián)合推理可信執(zhí)行環(huán)境 同態(tài)加密效果安全效率實(shí)時(shí)審計(jì)星云數(shù)融天鑒系統(tǒng)事后審計(jì)

數(shù)據(jù)收集密鑰管理金融行業(yè)數(shù)據(jù)源企業(yè)一般企業(yè)星云隱私計(jì)算加速方案星云隱私計(jì)算平臺(tái)星云隱私計(jì)算一體機(jī)效率產(chǎn)品-異構(gòu)加速產(chǎn)品簡(jiǎn)介底層特性簡(jiǎn)介業(yè)界首個(gè)FPGA隱私計(jì)算高性能算力加速卡模冪/模乘算子、同態(tài)加密算子、密態(tài)加法(包含3種不同類(lèi)型加法)、密態(tài)乘法(3種不同類(lèi)型乘法)、密態(tài)矩陣運(yùn)算算子、RSA交集(3種不同類(lèi)型RSA交集)、密鑰交換算子支持寬泛的數(shù)據(jù)位寬計(jì)算256bit、512bit、768bit、1024bit、2048bit、3072bit、4096bit具有全量的算子底層實(shí)現(xiàn)支持多種同態(tài)計(jì)算算子支持寬泛的數(shù)據(jù)位寬計(jì)算支持單批200w以上的算子:同態(tài)加密算子、RSA交集(3種不同類(lèi)型算子)、模冪算子支持單批100w以上的算子:密態(tài)加法(3種不同類(lèi)型算子)、密態(tài)乘法(3種不同類(lèi)型算子)、密態(tài)矩陣運(yùn)算算子、RSA交集(3種不同類(lèi)型算子)、模乘算子軟件特性簡(jiǎn)介顯著的性能比提升功耗比提升對(duì)單個(gè)算子有7到30倍的性能提升(對(duì)比20核心CPU

)端到端性能可提升高達(dá)10倍友好易用的應(yīng)用層開(kāi)發(fā)支持所有算子模塊化并集成API

實(shí)現(xiàn),支持云端和本地部署底層驅(qū)動(dòng)高度集成,可實(shí)現(xiàn)即插即用支持Python

、Java直接調(diào)用廣泛的應(yīng)用場(chǎng)景支持聯(lián)邦學(xué)習(xí)計(jì)算任務(wù)(訓(xùn)練/預(yù)測(cè))及其他涉及密態(tài)運(yùn)算任務(wù)場(chǎng)景,包括:橫向聯(lián)邦學(xué)習(xí)場(chǎng)景縱向聯(lián)邦學(xué)習(xí)場(chǎng)景同態(tài)加密場(chǎng)景密態(tài)計(jì)算場(chǎng)景效率產(chǎn)品-異構(gòu)算力整體方案實(shí)現(xiàn)數(shù)據(jù)對(duì)齊模型訓(xùn)練模型推理0端到端時(shí)間100100x非加密機(jī)器學(xué)習(xí) 聯(lián)邦學(xué)習(xí)Cryptographic

Operations1Paillier

Encryption

w/

Obfuscation2Ciphertext

Addition3Ciphertext

Multiplication4Ciphertext

Matrix

Multiplication……基于FATE,在聯(lián)邦學(xué)習(xí)全生命周期,我們總結(jié)了16種常用的密態(tài)運(yùn)算操作抽取了公共算子,作為高性能引擎在FPGA

上實(shí)現(xiàn):模冪

&

模乘軟硬結(jié)合,動(dòng)態(tài)拼裝成10余種密態(tài)運(yùn)算操作加密運(yùn)算導(dǎo)致性能大幅下降GPUFPGAASIC從軟件(GPU)到電路設(shè)計(jì)(FPGA),再到全定制化芯片7.3268.58.30 5 10 15 20 25 30對(duì)單個(gè)算子有7到30倍的性能提升(對(duì)比20核心CPU

)…Matrix

Multiplication

Ciphertext

Multiplication

Ciphertext

addition

Homomophic

Encryption單任務(wù)3-5倍的端到端性能提升Logistic

Regression:

4.5XLogistic

Regression:

5.3X多任務(wù)5-7倍的端到端性能提升Logistic

Regression:

6.1X雙任務(wù)4-6倍的端到端性能提升效率產(chǎn)品

異構(gòu)加速硬件架構(gòu)實(shí)現(xiàn)架構(gòu)實(shí)現(xiàn)->

異構(gòu)硬件加速在服務(wù)器中掛載一塊或多塊FPGA或GPU加速卡在硬件電路中實(shí)現(xiàn)復(fù)雜的聯(lián)邦學(xué)習(xí)運(yùn)算,進(jìn)行高定制架構(gòu)實(shí)現(xiàn)通過(guò)硬件接口,如PCIe、Nvlink,實(shí)現(xiàn)上位機(jī)和硬件加速卡的數(shù)據(jù)交換充分利用加速卡內(nèi)部計(jì)算和存儲(chǔ)資源,實(shí)現(xiàn)計(jì)算高吞吐、高并發(fā)硬件結(jié)構(gòu)效率產(chǎn)品

異構(gòu)加速整體架構(gòu)實(shí)現(xiàn)實(shí)現(xiàn)說(shuō)明對(duì)聯(lián)邦學(xué)習(xí)中最常用的復(fù)雜算子進(jìn)行定性分析和硬件優(yōu)化。近似Numpy的異構(gòu)加速算子接口,便于用戶(hù)對(duì)機(jī)器學(xué)習(xí)任務(wù)的加速。用戶(hù)可指定使用GPU或FPGA執(zhí)行計(jì)算。高效的存儲(chǔ)、計(jì)算、數(shù)據(jù)傳輸系統(tǒng),對(duì)異構(gòu)系統(tǒng)的高效運(yùn)轉(zhuǎn)起到了協(xié)同優(yōu)化的作用。自主研發(fā)的軟硬交互系統(tǒng),基于硬件驅(qū)動(dòng)設(shè)計(jì),可以實(shí)現(xiàn)對(duì)硬件的高性能穩(wěn)定調(diào)用。應(yīng)用除了Python算子,同步支持JAVA算子調(diào)用。架構(gòu)層除了FATE以外還可支持其他開(kāi)源框架。效率產(chǎn)品—異構(gòu)加速算子層APIcfg: 任務(wù)配置信息para:

計(jì)算參數(shù)在CPU中的地址data1:

計(jì)算源數(shù)據(jù)1在CPU中的地址data2:

計(jì)算源數(shù)據(jù)2在CPU中的地址data3:

計(jì)算源數(shù)據(jù)3在CPU中的地址result:

計(jì)算結(jié)果在CPU中的地址DATA(

Space_Si

z

e-16KB-Par

a_Dat

a_Si

z

e)PARAM(

Par

a_Dat

a_Si

ze)CMD

(

16KB)Task15Task14Task0Task1Task2Space_Size(eg:

1024MB)Src_DDRaddr=0x00000000Addr=Space_Size(eg:addr=0x03FFFFFFF)->

API調(diào)用簡(jiǎn)單、高效!->

FPGA算子層獨(dú)立,支持不同的聯(lián)邦學(xué)習(xí)平臺(tái)!效率產(chǎn)品—算子層算子模式及數(shù)據(jù)格式4pai

l

l

er

加密6密態(tài)加法27密態(tài)乘法2nhphqqqp2q2pqdataset

a10pai

l

l

i

er

解密9矩陣乘法1模冪NEdataset

aNEdataset

adataset

bNdataset

adataset

bNdataset

adataset

edataset

b軟件定義的算子模式2模乘Ndataset

adataset

bRow/numberNdataset

adataset

bNEdataset

bNdataset

adataset

bN{

bl

ock1_s

i

ze,

bl

ock2_s

i

ze,

–,

bl

ockm_s

i

ze}{

dat

a

s

et

bl

ock1,

dat

a

setbl

ock2,

–,

dat

a

s

et

bl

ockm}abmod

Na^emod

N(1+be)*a^emod

Ne*a+babamatrix

bmatrix12密態(tài)加法1a+b15非混淆加密(1+be)mod

N16密文求和a數(shù)據(jù)a由多個(gè)bl

ock組成算子編號(hào)算子名稱(chēng)算子公式數(shù)據(jù)格式參考pai

l

l

i

er

解密公式struct

fpga_config{uint8_t

operate_mode;

//指定本次任務(wù)的操作模式size_t

batch_size;

//指定本次任務(wù)中每批數(shù)據(jù)個(gè)數(shù)size_t

para_data_size;

//指定本次任務(wù)參數(shù)數(shù)據(jù)量大小size_t

data1_size;size_t

data2_size;size_t

data3_size;//指定本次任務(wù)data1數(shù)據(jù)量大小//指定本次任務(wù)data2數(shù)據(jù)量大小//指定本次任務(wù)data3數(shù)據(jù)量大小uint8_t

para_bitlen;

//指定本次任務(wù)中參數(shù)的數(shù)據(jù)位寬uint8_t

data1_bitlen;

//指定本次任務(wù)中data1的數(shù)據(jù)位寬uint8_t

data2_bitlen;

//指定本次任務(wù)中data2的數(shù)據(jù)位寬uint8_t

data3_bitlen;

//指定本次任務(wù)中data3的數(shù)據(jù)位寬uint32_t

task_space_size_req;

//指定本次任務(wù)請(qǐng)求的task

spacesizeuint32_t

pisum_block_num;

//pisum模式數(shù)據(jù)拆分成多少個(gè)blockuint32_t

pisum_cfg;

//pisum模式數(shù)據(jù)拆分后每塊數(shù)據(jù)size固定否};數(shù)據(jù)類(lèi)型說(shuō)明效率產(chǎn)品—底層算子功能支持說(shuō)明ID算子功能操作數(shù)最小位寬(bit)操作數(shù)最大位寬(bit)單批任務(wù)最大數(shù)據(jù)量(組)1模冪計(jì)算2564096200W2模乘計(jì)算2564096100W3RSA數(shù)據(jù)求交5124096200W4Paillier同態(tài)加密5124096200W5RSA加密計(jì)算2564096200W6密態(tài)計(jì)算_乘累加256409669W7密態(tài)計(jì)算_乘加2564096100W8密態(tài)計(jì)算_點(diǎn)乘2564096100W9密態(tài)計(jì)算_矩陣乘2564096100W10Paillier同態(tài)解密2564096200W11DH密鑰協(xié)商7682048200W12密態(tài)計(jì)算_加法10244096100W13RSA哈希模冪2564096200W14密態(tài)計(jì)算_乘法2564096200W15非混淆加密5124096200W16密態(tài)求和10244096200W算子說(shuō)明聯(lián)邦學(xué)習(xí)16種常用算子支持不同算子混合運(yùn)算內(nèi)部320個(gè)并行計(jì)算引擎單批大數(shù)據(jù)量到百萬(wàn)級(jí)支持16個(gè)任務(wù)進(jìn)程并行效率產(chǎn)品—異構(gòu)算力使用方法Clustar中間層SDK加速卡硬件安裝加速卡驅(qū)動(dòng)安裝聯(lián)邦框架適配部署上層業(yè)務(wù)啟動(dòng)調(diào)用算子加速加速卡返回算力結(jié)果PCIE接口通訊交互加速卡并行計(jì)算加速卡使用特點(diǎn):硬件安裝部署簡(jiǎn)單提供配套驅(qū)動(dòng)SDK上層應(yīng)用調(diào)用方便高效的通訊交互業(yè)務(wù)層硬件加速卡(搭載FPGA芯片/GPU芯片)聯(lián)邦算法SBTLRFederated

Learning算子服務(wù)引擎(FPGA/GPU)系統(tǒng)硬件驅(qū)動(dòng)聯(lián)邦學(xué)習(xí)系統(tǒng)軟硬件框圖算子調(diào)用APIPHEDenseNetResNetVGG產(chǎn)品展示(一):專(zhuān)注隱私計(jì)算“

算力+”探索超強(qiáng)計(jì)算力高性能服務(wù)器隱私計(jì)算專(zhuān)用極大縮短交付周期軟硬兼容一站式采購(gòu)降低整體CTO成本降低最高40%4年超長(zhǎng)維保加速卡主動(dòng)散熱款(帶風(fēng)扇)加速卡被動(dòng)散熱款(無(wú)風(fēng)扇)算子性能:對(duì)比單核提升70-100倍功耗:節(jié)省3.5倍模型訓(xùn)練:多核端到端性能提升可達(dá)7倍隱私計(jì)算加速卡 隱私計(jì)算硬件加速一體機(jī)業(yè)界首個(gè)FPGA隱私計(jì)算加速卡高性能算力強(qiáng)勁接入產(chǎn)品展示1-1:自研FPGA硬件加速卡-外觀加速卡外觀設(shè)計(jì)

側(cè)視圖加速卡外觀設(shè)計(jì)

正視圖加速卡PCBA電路板加速卡外觀設(shè)計(jì)

正視圖產(chǎn)品展示1-2:自研FPGA硬件加速卡-參數(shù)規(guī)格Clustar-P300(數(shù)據(jù)中心款)計(jì)算力INT8

TOPs(峰值)33.3尺寸(PCIE插卡)高度Full (120mm)長(zhǎng)度?長(zhǎng) (240mm)寬度雙插槽

(40mm)存儲(chǔ)器片外內(nèi)存類(lèi)型DDR4,支持2400MT/s,支持ECC糾錯(cuò)片外內(nèi)存容量64

GB片外總帶寬77

GB/s內(nèi)部

SRAM

容量54

MB內(nèi)部

SRAM

總帶寬38

TB/s接口PCI

ExpressGen

3

x16PCI

傳輸帶寬理論峰值32GB/s網(wǎng)絡(luò)接口2x

QSFP28

(100GbE)邏輯資源查找表

(LUT)1,341,000功耗和散熱功耗120W散熱被動(dòng)散熱(無(wú)源)供電PCIE

12V

+

AUX

12VClustar-P300工作站款)計(jì)算力INT8

TOPs(峰值)33.3尺寸(PCIE插卡)高度Full (120mm)長(zhǎng)度全長(zhǎng) (300mm)寬度雙插槽

(40mm)存儲(chǔ)器片外內(nèi)存類(lèi)型DDR4,支持2400MT/s,支持ECC糾錯(cuò)片外內(nèi)存容量64

GB片外總帶寬77

GB/s內(nèi)部

SRAM

容量54

MB內(nèi)部

SRAM

總帶寬38

TB/s接口PCI

ExpressGen

3

x16PCI

傳輸帶寬理論峰值32GB/s網(wǎng)絡(luò)接口2x

QSFP28

(100GbE)邏輯資源查找表

(LUT)1,341,000功耗和散熱功耗120W散熱主動(dòng)散熱(有源)供電PCIE

12V

+

AUX

12V產(chǎn)品展示1-3:隱私計(jì)算一體機(jī)隱私計(jì)算集群方案 隱私計(jì)算一體機(jī)CPI系列-

2U/4U塔式服務(wù)器CHX系列-信創(chuàng)系列海量數(shù)據(jù)交易支持億級(jí)用戶(hù)數(shù)據(jù)集、PB級(jí)數(shù)據(jù)的橫縱聯(lián)邦訓(xùn)練、匿蹤查詢(xún)和聯(lián)合統(tǒng)計(jì)任務(wù),

支撐上層海量數(shù)據(jù)交易。安全可靠可支持全內(nèi)存加密,抵抗物理攻擊,保護(hù)數(shù)據(jù)安全;可支持可信鏈技術(shù),逐級(jí)認(rèn)證管理,保證系統(tǒng)安全;平臺(tái)多層級(jí)認(rèn)證,全流程管理、存證;訪問(wèn)控制,提高管理安全性。??基于主流服務(wù)器深度優(yōu)化,融合高性能網(wǎng)絡(luò)加速、隱私計(jì)算算力加速卡、高可靠性隱私計(jì)算平臺(tái)??蓴U(kuò)展架構(gòu),為數(shù)據(jù)中心、數(shù)據(jù)交易所等客戶(hù)在數(shù)據(jù)要素流通場(chǎng)景提供一站式、集群化的基礎(chǔ)設(shè)施解決方案。支持億級(jí)用戶(hù)數(shù)據(jù)集、PB

級(jí)數(shù)據(jù)在線(xiàn)交易。高效網(wǎng)絡(luò)可支持RDMA網(wǎng)絡(luò)加速技術(shù),延遲減少到原來(lái)的25%;分布式集群通信效率10倍以上性能提升;支持卡間和服務(wù)器間組網(wǎng)優(yōu)化技術(shù)。超低TCO基于獨(dú)有的隱私計(jì)算加速能力,同等密態(tài)算力條件下,功耗僅為通用CPU運(yùn)算的1/6,大幅降低運(yùn)營(yíng)成本;基于軟硬一體的平臺(tái)和硬件優(yōu)化能力,實(shí)現(xiàn)雙卡、四卡、八卡加速組合,實(shí)現(xiàn)服務(wù)器采購(gòu)成本的大幅降低。產(chǎn)品展示1-3-a:隱私計(jì)算一體機(jī)-CPI系列可靠安全、靈活配置、軟硬結(jié)合、開(kāi)箱即用的一站式軟硬件結(jié)合產(chǎn)品高性能CPI系列隱私計(jì)算一體機(jī)超強(qiáng)計(jì)算性能加速卡大幅提升

10

余種密態(tài)算子能力,算子性能比

CPU

平均提升

70-100

倍隱私計(jì)算場(chǎng)景端到端

9-10

倍性能提升,支持億級(jí)數(shù)據(jù)場(chǎng)景建設(shè)異構(gòu)算力靈活配置,單臺(tái)服務(wù)器可支持多達(dá)

8

張隱私算力加速卡一體機(jī)集成產(chǎn)品成本減少最高

40%硬件服務(wù)器數(shù)量?jī)H為通用

CPU

服務(wù)器的

25%-50%核心部件標(biāo)準(zhǔn)超長(zhǎng)維保支撐,維保時(shí)間延長(zhǎng)

30%+異構(gòu)算力搭載優(yōu)化,單臺(tái)服務(wù)器可靈活搭載隱私加速卡,大幅降低采購(gòu)費(fèi)用動(dòng)態(tài)負(fù)載均衡,資源彈性調(diào)整,節(jié)省運(yùn)維成本???應(yīng)用端支持點(diǎn)對(duì)點(diǎn)分布式安全計(jì)算,具備底層技術(shù)、架構(gòu)設(shè)計(jì)、算法、異構(gòu)算力和產(chǎn)品功能和多層級(jí)流程管理,完全可控支持

Intel

SGX

Intel

TME

安全特性,通過(guò)內(nèi)存內(nèi)的應(yīng)用隔離,提供更細(xì)微的數(shù)據(jù)保護(hù),通過(guò)全內(nèi)存加密,抵抗物理攻擊支持

BMC、BIOS

雙鏡像機(jī)制,在檢測(cè)到固件被破壞后進(jìn)行恢復(fù),支持

BMC

安全啟動(dòng),防止

BMC

被惡意篡改支持

UEFI

安全引導(dǎo)和

BIOS

分級(jí)密碼保護(hù),保證系統(tǒng)啟動(dòng)及管理安全內(nèi)部存儲(chǔ)連接數(shù)據(jù)傳輸速率相比于

6

Gbps

SAS解決方案提高

1

倍支持SSD功耗比傳統(tǒng)機(jī)械硬盤(pán)低

80%,可支持大盤(pán)本地存儲(chǔ)可以滿(mǎn)足客戶(hù)數(shù)據(jù)存放長(zhǎng)達(dá)

6

個(gè)月的監(jiān)管需求?萬(wàn)兆網(wǎng)絡(luò)支持可支持理論最大內(nèi)存帶寬是

400GB/S可搭載

RDMA

網(wǎng)絡(luò)加速技術(shù),網(wǎng)絡(luò)延遲減少到原來(lái)的

25%,

分布式集群通信效率

10

倍以上性能提升可支持

PCIE

4.0X16

接口,帶寬可達(dá)

64GB/s極低的整體

TCO可靠的隱私安全保護(hù)超強(qiáng)的存儲(chǔ)優(yōu)化超高的通信效率??一站式解決隱私計(jì)算平臺(tái)的軟硬兼容問(wèn)題,支持整機(jī)柜自動(dòng)化部署節(jié)點(diǎn)間資源動(dòng)態(tài)調(diào)度,集群化管理、運(yùn)維,集成管理模塊能夠持續(xù)監(jiān)控系統(tǒng)參數(shù),故障自動(dòng)告警計(jì)算/存儲(chǔ)解耦、資源池化

,可支持靈活拓?fù)?,支持拓?fù)洳婚_(kāi)箱通過(guò)軟件切換水平線(xiàn)性擴(kuò)容,根據(jù)業(yè)務(wù)量變化,靈活便捷調(diào)整集群規(guī)模,水平線(xiàn)性擴(kuò)縮容。靈活部署/拓展基于主流服務(wù)器廠商,

集成隱私計(jì)算平臺(tái)應(yīng)用平臺(tái),深度優(yōu)化隱私計(jì)算安全算子、存儲(chǔ)、網(wǎng)絡(luò)加速、調(diào)度等資源,實(shí)現(xiàn)更優(yōu)性能的加速卡多組合全新隱私計(jì)算一體機(jī)系列,助力企業(yè)快速開(kāi)展隱私計(jì)算業(yè)務(wù)場(chǎng)景探索,支持專(zhuān)用的加密芯片,抵抗物理攻擊,為隱私計(jì)算相關(guān)場(chǎng)景提供更加安全可靠、高性?xún)r(jià)比的解決方案CPI

系列產(chǎn)品展示1-3-a:CPI系列硬件配置名稱(chēng)規(guī)格參數(shù)規(guī)格2U/4U機(jī)架服務(wù)器處理器支持1到2個(gè)英特爾?至強(qiáng)系列可擴(kuò)展處理器;支持單顆8核(頻率2.8-3.6GHz-12Mb)16線(xiàn)程、16核(頻率2.4-3.4GHz-24Mb)32線(xiàn)程靈活配置

;3條UPI互連鏈路,單條鏈路高速率11.2GT/s

;最大熱設(shè)計(jì)功率135W內(nèi)存默認(rèn)配置:8*DDR4

32GB

RDIMM,3200MHz,256GB;最大支持32根內(nèi)存,可靈活擴(kuò)展,內(nèi)存保護(hù)支持ECC,

內(nèi)存鏡像,

內(nèi)存等級(jí)保護(hù),最大支持4TB存儲(chǔ)存儲(chǔ)默認(rèn)配置:2*960G

2.5英寸

SATA

SSD

;3*4T

7.2K

3.5英寸

SATA

HDD

RAID5;最大可支持16個(gè)2.5或8個(gè)3.5寸

SAS/SATA硬盤(pán)網(wǎng)絡(luò)接口存儲(chǔ)控制器RAID卡控制器、SAS卡控制器;可選配支持RAID0、1、10、5、50、6、60等,支持Cache超級(jí)電容保護(hù),提供RAID狀態(tài)遷移、RAID配置記憶加速卡網(wǎng)絡(luò)接口可選OCP3.0模塊100Gb/s,

200Gb/s

;支持1組雙口標(biāo)準(zhǔn)

1Gb/10Gb/25Gb/40G/100Gb

網(wǎng)卡PCIe插槽默認(rèn)最低配置:2*FHFL雙寬

PCIe4.0x16

+

外接1*PCIE

4.0x8插槽;最大可選8*FHFL雙寬

PCIe4.0x16

+4*PCIE

4.0x16FHFL單寬插槽加速卡默認(rèn)最低配置:P300

訓(xùn)練加速卡默認(rèn)配置1張;最大可選單臺(tái)8張,雙邊16張加速卡電源支持N+N冗余模式標(biāo)準(zhǔn)電源;可選2000W/2200W/3000W

輸出功率電源產(chǎn)品展示1-3-b:隱私計(jì)算一體機(jī)-CXH系列高性能CXH系列隱私計(jì)算一體機(jī)開(kāi)箱即用、軟硬結(jié)合、安全合規(guī)、靈活配置的國(guó)產(chǎn)化一站式軟硬件結(jié)合產(chǎn)品基于主流國(guó)產(chǎn)化服務(wù)器廠商,

集成隱私計(jì)算平臺(tái),支持專(zhuān)用內(nèi)存加密技術(shù)和虛擬化加密技術(shù),有效抵抗物理攻擊和應(yīng)用資源完全隔離更安全,為隱私計(jì)算相關(guān)場(chǎng)景提供更加安全可靠、高性?xún)r(jià)比的解決方案。基于主流國(guó)產(chǎn)化服務(wù)器廠商,

集成隱私計(jì)算平臺(tái)和安全數(shù)據(jù)網(wǎng)絡(luò),支持專(zhuān)用內(nèi)存加密技術(shù)和虛擬化加密技術(shù),有效抵抗物理攻擊和應(yīng)用資源完全隔離更安全,為隱私計(jì)算相關(guān)場(chǎng)景提供更加安全可靠、高性?xún)r(jià)比的解決方案。CXH系列超強(qiáng)計(jì)算性能加速卡大幅提升

10

余種密態(tài)算子能力,算子性能比

CPU

平均提升

70-100

倍隱私計(jì)算場(chǎng)景端到端

5-7

倍性能提升,支持億級(jí)數(shù)據(jù)場(chǎng)景建設(shè)異構(gòu)算力靈活配置,單臺(tái)服務(wù)器可支持多達(dá)

3張隱私算力加速卡一體機(jī)集成產(chǎn)品成本減少最高

40%硬件服務(wù)器數(shù)量?jī)H為通用

CPU

服務(wù)器的

25%-50%核心部件標(biāo)準(zhǔn)超長(zhǎng)維保支撐,維保時(shí)間延長(zhǎng)

30%+異構(gòu)算力搭載優(yōu)化,單臺(tái)服務(wù)器可靈活搭載隱私加速卡,大幅降低采購(gòu)費(fèi)用動(dòng)態(tài)負(fù)載均衡,資源彈性調(diào)整,節(jié)省運(yùn)維成本應(yīng)用端支持點(diǎn)對(duì)點(diǎn)分布式安全計(jì)算,具備底層技術(shù)、架構(gòu)設(shè)計(jì)、算法、異構(gòu)算力和產(chǎn)品功能和多層級(jí)流程管理,完全可控處理器安全可靠

CPU

內(nèi)置安全處理器,提供芯片級(jí)根信任固化處理器芯片內(nèi)部的引導(dǎo)芯片提供比

TPM

更高級(jí)別的安全機(jī)制國(guó)密算法進(jìn)行加密、層次化逐級(jí)認(rèn)證,保障系統(tǒng)安全啟動(dòng)關(guān)鍵部件采用加固、冗余方式,

保障系統(tǒng)安全可靠運(yùn)行具備超大內(nèi)存帶寬,可進(jìn)行強(qiáng)大的數(shù)據(jù)分析,加速內(nèi)存密集型應(yīng)用性能可搭載RDMA網(wǎng)絡(luò)加速技術(shù),網(wǎng)絡(luò)延遲減少到原來(lái)的

25%,

分布式集群通信效率10

倍以上性能提升集成多達(dá)

128

Lanes

PCIE

3.0極低的整體

TCO可靠的隱私安全保護(hù)超高的通信效率一站式解決隱私計(jì)算平臺(tái)的軟硬兼容問(wèn)題,支持整機(jī)柜自動(dòng)化部署的高可用性支持采取自動(dòng)化與統(tǒng)一化管理,簡(jiǎn)化運(yùn)維節(jié)點(diǎn)間資源動(dòng)態(tài)調(diào)度,集群化管理、運(yùn)維,集成管理模塊能夠持續(xù)監(jiān)控系統(tǒng)參數(shù),故障自動(dòng)告警水平線(xiàn)性擴(kuò)容,根據(jù)業(yè)務(wù)量變化,靈活便捷調(diào)整集群規(guī)模靈活部署/拓展產(chǎn)品展示1-3-b:CXH系列硬件配置名稱(chēng)規(guī)格參數(shù)規(guī)格2U機(jī)架服務(wù)器處理器支持1到2顆

HYGON

7200系列處理器,雙處理器最高支持

48

個(gè)物理核心;支持單顆24核(頻率2.2GHz-64Mb)48線(xiàn)程、48核(頻率2.2GHz-64Mb)96線(xiàn)程靈活配置

單顆最高可支持24核最高頻率3.3GHz

,最大熱設(shè)計(jì)功率180W內(nèi)存默認(rèn)配置:8*DDR4

32GB

RDIMM,2666MHz,256GB;

最大支持32根內(nèi)存,內(nèi)存速度最高達(dá)

2666MT/s,內(nèi)存容量可擴(kuò)展至

4TB存儲(chǔ)默認(rèn)配置:2*960G

2.5英寸

SATA

SSD

RAID1,3*4T

7.2K

3.5英寸

SATA硬盤(pán)

RAID5

,最大可支持12個(gè)2.5+4個(gè)3.5寸

SAS/SATA硬盤(pán)存儲(chǔ)控制器RAID卡控制器、SAS卡控制器;可選配支持RAID0、1、10、5、50、6、60等,支持Cache超級(jí)電容保護(hù),提供RAID狀態(tài)遷移、RAID配置記憶加速卡網(wǎng)絡(luò)接口默認(rèn)配置:雙口10G

網(wǎng)卡

,可選支持?jǐn)U展雙口

10G

SFP+、雙口

25G、40G

QSFP+和

100G

等多種網(wǎng)絡(luò)PCIe插槽默認(rèn)最低配置:1*FHFL雙寬

PCIe3.0x16

插槽,最大可選3*FHFL雙寬

PCIe3.0x16

插槽,最大可擴(kuò)展

10

個(gè)

PCIe

插槽加速卡默認(rèn)最低配置:P300

訓(xùn)練加速卡默認(rèn)配置1張;最大可選單臺(tái)3張,雙邊6張加速卡電源支持N+N冗余模式標(biāo)準(zhǔn)電源;可選2000W/2200W/3000W

輸出功率電源產(chǎn)品展示1-3-c:隱私計(jì)算一體機(jī)-CXK系列開(kāi)箱即用、軟硬結(jié)合、安全合規(guī)、靈活配置的國(guó)產(chǎn)化一站式軟硬件結(jié)合產(chǎn)品基于主流國(guó)產(chǎn)化服務(wù)器廠商,

集成隱私計(jì)算平臺(tái),主要面向政府、金融、能源、運(yùn)營(yíng)商、電力、醫(yī)療等行業(yè)打造,促進(jìn)多源數(shù)據(jù)安全、高效協(xié)同、數(shù)據(jù)要素價(jià)值的激活的軟硬一體解決方案。信創(chuàng)CXK系列隱私計(jì)算一體機(jī)超強(qiáng)性能?強(qiáng)算力:鯤鵬920處理器,最高集成64核,內(nèi)置多種硬件加速引擎,SPECint?_rate_base2006

評(píng)估跑分930+,比業(yè)界原紀(jì)錄高出25%大內(nèi)存容量:支持最多32個(gè)DDR4內(nèi)存插槽,提供最高8TB內(nèi)存??內(nèi)存帶寬高:內(nèi)存通道數(shù)量從6通道提升到8通道,內(nèi)存速率從2666MHz提升至2933MHz,,總帶寬從1.02T提升到1.5T比特每秒,帶寬提升46%IO帶寬高:PCIe

3.0升級(jí)到PCIe

4.0,速率翻番,提供40個(gè)lanes,每個(gè)lane速率提升至16Gbps,總帶寬為

640Gbps,

IO總帶寬比業(yè)界主流提升66%網(wǎng)絡(luò)帶寬高:集成100G

RoCE以太網(wǎng)卡功能,從業(yè)界主流的25G提升至100G,網(wǎng)絡(luò)帶寬提升4倍??

應(yīng)用端支持點(diǎn)對(duì)點(diǎn)分布式安全計(jì)算,具備底層技術(shù)、架構(gòu)設(shè)計(jì)、算法、異構(gòu)算力和產(chǎn)品功能和多層級(jí)流程管理,完全可控安全、可供應(yīng):采用華為全自研計(jì)算芯片,整機(jī)器件全國(guó)產(chǎn)化-可靠與質(zhì)量保障:減振、散熱等高可靠設(shè)計(jì)在相同功耗下性能可以提高30%,較業(yè)界主流高30%(基于SPECint2006)-單顆芯片集成了CPU、南橋、網(wǎng)卡、SAS存儲(chǔ)控制器等4顆芯片的功能,業(yè)界集成度第一,能夠釋放出服務(wù)器更多槽位,用于擴(kuò)展更多加速部件功能,大幅提高系統(tǒng)的集成度領(lǐng)先的吞吐可靠的隱私安全保護(hù)高效能超強(qiáng)的集成能力???一站式解決平臺(tái)的軟硬兼容問(wèn)題,支持高密、存儲(chǔ)和高性能等機(jī)型,覆蓋數(shù)據(jù)中心需求支持采取自動(dòng)化與統(tǒng)一化管理,簡(jiǎn)化運(yùn)維節(jié)點(diǎn)間資源動(dòng)態(tài)調(diào)度,集群化管理、運(yùn)維,集成管理模塊能夠持續(xù)監(jiān)控系統(tǒng)參數(shù),故障自動(dòng)告警根據(jù)業(yè)務(wù)量變化,靈活便捷調(diào)整集群規(guī)模,水平線(xiàn)性擴(kuò)容縮容靈活部署/拓展CXK系列產(chǎn)品展示1-3-c:CXK系列硬件配置名稱(chēng)規(guī)格參數(shù)規(guī)格2U機(jī)架服務(wù)器處理器支持2個(gè)鯤鵬920處理器,單顆最高可支持64核最高頻率2.6GHz

,最大熱設(shè)計(jì)功率180W內(nèi)存默認(rèn)配置:32個(gè)DDR4-2933

DIMM插槽存儲(chǔ)默認(rèn)配置:最多16個(gè)3.5英寸或27個(gè)2.5英寸SAS/SATA

HDD硬盤(pán)、SAS/SATA

SSD硬盤(pán)或16個(gè)2.5英寸NVMe

SSD硬盤(pán)存儲(chǔ)控制器支持RAID

0,

1,

5,

6,

10,

50,

60,支持超級(jí)電容掉電保護(hù)網(wǎng)絡(luò)接口2個(gè)板載網(wǎng)絡(luò)插卡,每個(gè)插卡支持4*GE電口或者4*10GE光口或者4*25GE光口PCIe插槽最多8個(gè)PCIe

4.0

x8或3個(gè)PCIe

4.0

x16

+

2個(gè)PCIe

4.0

x8標(biāo)準(zhǔn)插槽電源支持100~240V

AC,240V

DC,2個(gè)熱插拔900W或2000W交流電源模塊,

支持1+1冗余支持產(chǎn)品展示1-4:隱私計(jì)算一體機(jī)-支持列表ID服務(wù)器廠商平臺(tái)/型號(hào)1InspurNF5468M52InspurNF5280M53InspurNF5570M54InspurSA5280M65InspurNF5468M66H3CR4900

G57H3CR5300

G58H3CR4930

G59Sugon7340

H010HuaweiTaiShan11AmaxXP-48201G12DellPowerEdge

R73013DellPowerEdge

R74014DellPowerEdge

R940xa15HPEProLiant

DL380

G1016SuperMicroSYS-4028GR-TR17SuperMicroSYS-4029GP-TRT18SuperMicroSYS-7049GP-TRT一體機(jī)產(chǎn)品系列軟件配置星云數(shù)融天樞隱私計(jì)算平臺(tái)安全可靠的全棧式平臺(tái)提供平臺(tái)層、數(shù)據(jù)層、模型層、功能流程管理,支持審計(jì),完全可控;支持聯(lián)邦學(xué)習(xí)、多方案安全計(jì)算、匿蹤查詢(xún)、隱私求交等多項(xiàng)能力;提供一站式、流程化易用性能力,高效搭建隱私場(chǎng)景星云數(shù)融天樞安全數(shù)據(jù)網(wǎng)絡(luò)(可選)多方雙向賦能,聚焦數(shù)據(jù)流通和價(jià)值運(yùn)營(yíng)平臺(tái)提供數(shù)據(jù)網(wǎng)絡(luò)服務(wù),保證數(shù)據(jù)要素互聯(lián)互通,全面化數(shù)據(jù)要素市場(chǎng)建設(shè),提供豐富建模流程管理工具,支持輸出結(jié)果的跟蹤、統(tǒng)計(jì)與監(jiān)控支持多維度賬單管理,保證數(shù)據(jù)授權(quán)交易管理的合作信任機(jī)制和價(jià)值實(shí)現(xiàn);支持靈活擴(kuò)充計(jì)算節(jié)點(diǎn),平臺(tái)簡(jiǎn)單易上手,提供全流程交互式建模隱私計(jì)算全棧生態(tài)能力構(gòu)建:強(qiáng)兼容可信聯(lián)邦學(xué)習(xí)多方安全計(jì)算 匿蹤查詢(xún)半同態(tài)加密全同態(tài)加密聯(lián)合訓(xùn)練聯(lián)合推理基礎(chǔ)運(yùn)算邏輯運(yùn)算查詢(xún)服務(wù)隱私求交數(shù)據(jù)處理特征工程模型測(cè)試橫/縱向統(tǒng)計(jì)聯(lián)合比較查詢(xún)統(tǒng)計(jì)管理駕駛艙服務(wù)API接口服務(wù)SDK服務(wù)在線(xiàn)實(shí)時(shí)服務(wù)調(diào)用統(tǒng)計(jì)服務(wù)審計(jì)服務(wù)隱私計(jì)算開(kāi)源框架中間件/數(shù)據(jù)庫(kù)開(kāi)源組件計(jì)算框架華為鯤鵬中科曙光浪潮信息新華三集團(tuán)全同態(tài)FPGA加速卡加速網(wǎng)絡(luò)全同態(tài)專(zhuān)用ASIC芯片基礎(chǔ)服務(wù)器隱私計(jì)算核心外設(shè)信貸風(fēng)控 營(yíng)銷(xiāo)推薦客戶(hù)風(fēng)險(xiǎn)評(píng)估金融行業(yè)醫(yī)療行業(yè)醫(yī)學(xué)研究

基因研究

輔助診斷智慧城市

普惠金融

碳中和政務(wù)/能源/互聯(lián)網(wǎng)應(yīng)用場(chǎng)景中臺(tái)能力軟件生態(tài)操作系統(tǒng)基礎(chǔ)設(shè)施03 性能展示異構(gòu)算力加速聯(lián)邦學(xué)習(xí)全生命周期樣本對(duì)齊模型訓(xùn)練模型推理RSA-PSIVLRSBTSBTPerformance

of

five

deep

learning

applicationsPerformance

of

VLR

with

varying

networking

bandwidthIntel(R)

Xeon(R)

Silver

4114

CPU

@2.20GHz隱私計(jì)算ARM一體機(jī)—加速端到端性能高效能基于鯤鵬920

7260處理器

vs

業(yè)界最高端處理器的對(duì)比數(shù)據(jù)對(duì)比來(lái)源華為實(shí)驗(yàn)室測(cè)試數(shù)據(jù),結(jié)果在不同環(huán)境中可能有偏差930+ 25%SPECint?_rate_base2006

評(píng)估跑分內(nèi)存帶寬:I/O

總帶寬:網(wǎng)絡(luò)帶寬:高性能高吞吐高集成1

顆 =

4

顆芯片(CPU,南橋、網(wǎng)卡、SAS控制器)46%66%4x30%搭載華為鯤鵬920處理器平臺(tái)基于搭載華為鯤鵬920芯片服務(wù)器(性能可比Intel至強(qiáng)8180),大幅提高系統(tǒng)的集成度,提升算力能力網(wǎng)絡(luò)帶寬從業(yè)界主流的25G提升至100G,IO帶寬讓每個(gè)lane速率提升至16Gbps,單顆芯片4顆芯片的功能500s0FPGA

489.2s ARMLR端到端/每輪CPU:2.6GHz

48核MEM:128G2h0性能提升比較訓(xùn)練時(shí)間AR

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論