版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
M300正面交鋒英偉達(dá),能否復(fù)制6年P(guān)U突圍戰(zhàn)的成功?回顧CU領(lǐng)域中MD與英特爾自6年開始的爭鋒歷程MD曾憑借領(lǐng)先的制程一舉顛覆英特爾一家獨大的局面,成為其CU業(yè)務(wù)和股價的拐點。在0年7月,MD和英特爾的股價首次出現(xiàn)倒掛而到了2年2月5日MD的市值達(dá)5億美元,首度超越英特爾的市值。目前,MD也試圖在數(shù)據(jù)中心的I應(yīng)用,特別是訓(xùn)練端里,以新產(chǎn)品M0跟英偉達(dá)正面交鋒,到底MD這次能否復(fù)制他們在CU一役中的成功?圖表:6至今MD及英特爾股價對比圖及主要事件(美元):彭博終端、 AD、英特爾、6年上半年,MD發(fā)布了企業(yè)端CU技術(shù)路線圖,其中明確表示了制程上的突破,基于臺積電7m的CU將于9年推出。隨后6月,MD發(fā)表了Zen架構(gòu),涵蓋C端及服務(wù)器端CU產(chǎn)品并在27年宣布以Zen架構(gòu)重新整合其C及服務(wù)器產(chǎn)品。在該Zen架構(gòu)技術(shù)路線圖中MD進(jìn)一步明確了9年將有7m產(chǎn)品推出0年將向更先進(jìn)制程邁進(jìn)。反觀彼時的英特爾,由于在制造更先進(jìn)制程芯片的過程中遭遇技術(shù)困難,m芯片良率不佳,導(dǎo)致原定于6年下半年的m(相當(dāng)于臺積電m)量產(chǎn)多翻推遲至9年下半年。目前,MD的Zen架構(gòu)已發(fā)展到臺積電5m制程,而年新版技術(shù)路線圖進(jìn)一步更新了其進(jìn)入臺積電m制程的計劃。圖表:MD在6年發(fā)表的企業(yè)端U技術(shù)路線,明確指出臺積電m制程PU將于/9年推出:Videcdz、:7年D示n構(gòu)U在0越m 圖表:2年MD表示Zn架構(gòu)PU將在4年發(fā)展到:AMD官網(wǎng)、 :AMD官網(wǎng)、6年6月,MD宣布推出Zenx-4微架構(gòu)。對比彼時英特爾的kake架構(gòu),Zen的CU部分面積較小緩存空間有所提升且散熱片間距加寬默認(rèn)頻率更高功耗更低,價格也較低。隨后在7年初上市,同樣基于Zen架構(gòu)的Ren7系列C端CU,采用了m制程及8核6線程工藝,對標(biāo)同為m制程的英特爾酷睿-0(基于6年6月推出的rodwel-E升級架構(gòu)從此時開始MD的C端產(chǎn)品已逐漸逼近英特爾,而蠶食份額的趨勢也初見苗頭服務(wù)器端方面MD于同年也推出了同樣基于Zen架構(gòu)PCCU產(chǎn)品對標(biāo)英特爾XenC(同為m制程PC憑借高性能表現(xiàn)及高能耗效率,也開始在數(shù)據(jù)中心的市場份額上攻城略地。在英特爾正深陷良率等問題不斷推遲1nm量產(chǎn)的同時MD聯(lián)手臺積電在制程上不斷取得突破在C及服務(wù)器端的制程上紛紛彎道超車英特爾為市場份額的提升開了綠燈。8年MD推出了采用當(dāng)時GoalFondry1m半節(jié)點制程的Ze架構(gòu)并基于此推出C端Ren52600及Ren7200CPU首度在制程上超越當(dāng)時還是4m的英特爾,加速搶占英特爾的U市場份額。隨后在9年MD在C和服務(wù)器端的制程均更上一層樓MD推出了基于臺積電7m制(相當(dāng)于lm制程的Zen2架構(gòu)當(dāng)中包括Ren9系列的C端U及PCRome服務(wù)器端CU。Zen2架構(gòu)采用了hpet小芯片設(shè)計,通過CU和核心分離,解決超多核心并行問題的同時也降低了生產(chǎn)成本,并達(dá)到降低延遲的效果。而在差不多時間里,英特爾的IceLkeC產(chǎn)品也終于上市量產(chǎn),該產(chǎn)品采用了英特爾早在5年發(fā)表的lm制程。英特爾雖勉強追趕上MD在C端的制程進(jìn)度,但在制程上的落后也并沒有改善。ItlXeonE5Brz/SilrtlXeonE7Gl/PliItlXeonE5Brz/SilrtlXeonE7Gl/PlinmMDNlsPlfrm系列代號SklkeSPSklkeSPADEPCen架構(gòu)Sklae制程核心線程8核心,/6線程8核心,/6線程面積mm2mm2工藝節(jié)點 m m PCH eisrgPCH eisrgPCH S二級PCH eisrgPCH eisrgPCH S三級緩三級緩存(每核心) 8B,mm2 8B,.mm2最大核心數(shù)682最大線程數(shù)最大核心數(shù)682最大線程數(shù)264
ScktPGA
ScktPGA
SP3GAsckt散熱散熱片間距(m) 8 2x金屬片間距(m)2最大三級緩存.5B3.5B34BL3標(biāo)準(zhǔn)tSRM(mm).06.08DDR4內(nèi)存支持6通道DDR46通道DDR48通道DDR4金屬片層數(shù)2/iM3/iM熱設(shè)計功耗-W-0W01W:AMD官網(wǎng)、英特爾官網(wǎng)、 :AMD官網(wǎng)、英特爾官網(wǎng)、0年7月底英特爾宣布將推遲l(對標(biāo)臺積電m制程至2年以后反觀MD在Q2財報中C端業(yè)務(wù)營收大漲%,并進(jìn)一步上調(diào)了全年營收預(yù)期。當(dāng)月MD股價大漲%并首度超越英特爾的股價同年0月MD宣布收購頭部可編程邏輯器(FG生產(chǎn)商賽靈(Xnx并于2Q1完成并表對比英特爾在5年收購了FGA生產(chǎn)商(tera,收購賽靈思能為MD帶來FGA、可編程oC及自適應(yīng)計算加速平臺產(chǎn)品并將MD的產(chǎn)品矩陣擴充至與英特爾看齊為MD數(shù)據(jù)中心及嵌入式業(yè)務(wù)如虎添翼。1年MD推出了基于臺積電7m制程的Zen3架構(gòu)并推出了CMian服務(wù)器CU對比姍姍來遲的英特爾此時才推出采用l10m制程的第三代Xen可擴展CU。2年,MD基于臺積電m制程的Ren7000系列產(chǎn)品順利量產(chǎn),再次拉開與英特爾C端制程的距離(當(dāng)時英特爾仍處于Inel7階段,對標(biāo)臺積電7m。圖表:MD與英特爾C端制程發(fā)展進(jìn)度對比及相關(guān)產(chǎn)品舉例,8年MDPC端制程首度超越英特爾*注:計劃中進(jìn)度,公司還未推出相關(guān)產(chǎn)品:AD官網(wǎng)、英特爾官網(wǎng)、圖表:MD與英特爾服務(wù)器制程發(fā)展進(jìn)度對比及相關(guān)產(chǎn)品舉例,9年MD服務(wù)器制程首度超越英特爾*注:計劃中進(jìn)度,公司還未推出相關(guān)產(chǎn)品(其中SapieRaids已推出,EmldRids未推出):AD官網(wǎng)、英特爾官網(wǎng)、Q,MD在臺式機和筆記本的CU份額僅為%%。而Zen架構(gòu)及相關(guān)產(chǎn)品推出后,MD開始逐步蠶食英特爾的C份額,并在8年制程反超英特爾后,份額提升加速。MD的服務(wù)器CU在Q1份額僅為%,市場基本被英特爾所壟斷,但7年P(guān)C推出后,服務(wù)器CU的份額也開始一路上漲。至Q,MD在C端(臺式機/筆記本CU份額分別攀升到0.%/24.%為史上最高但隨后Q3出現(xiàn)回落截止Q,MD臺式機筆記本CU份額為19.%/16.2%,服務(wù)器端CU市場份額為%;英特爾臺式機筆記本CU份額為0.%/83.8%;服務(wù)器端CU市場份額為%。MD管理層在2Q3財報電話會表示,主要鑒于C市場疲軟,客戶大幅調(diào)整供應(yīng)鏈中的庫存導(dǎo)致該季度C端營收同比由Q2的增長%大幅降低至下滑%MD的下游客戶先前積累了較多MD產(chǎn)品庫存,因此在需求走弱后先消化額外庫存,導(dǎo)致MD的份額短暫下滑,但隨后在4即開始恢復(fù)。另外,MD在服務(wù)器端也受到宏觀環(huán)境影響速下調(diào),在Q3開始份額增長也放緩。圖表:1MD與英特爾在C端PU市場份額 圖表:1MD與英特爾在服務(wù)器端PU市場份額:MercuryResearch、 :MercuryResearch、目前MD的M0CUGU正準(zhǔn)備進(jìn)軍I訓(xùn)練市場與英偉達(dá)GaeHopper正面交鋒M0或成為MD與英偉達(dá)在I競爭的拐點能否重演6年與英特爾在CU角逐中的成功?MD于CS223介紹了新一代Instnct0加速器結(jié)合CU與GU,同時聚焦I語言大模型訓(xùn)練端及推理端對標(biāo)英偉達(dá)GraceHoprGraceCU+HopprH0GPU,一改過去MD的GU產(chǎn)品主要應(yīng)用在圖像處理及I推理領(lǐng)域的局限。我們認(rèn)為0應(yīng)該是除了谷歌的TU之外能與英偉達(dá)在I訓(xùn)練端上匹敵的產(chǎn)品在規(guī)格及性能方面全面追擊英偉達(dá)raceHoper,重點發(fā)力數(shù)據(jù)中心的HC及I領(lǐng)域。公司早前在Q4財報電話會里提及,0已開始送樣給重要客戶,而正式推出將會在下半年4年將看到明顯貢獻(xiàn)MD的宿敵英特爾也不甘示弱在2年的C英特爾公布了其結(jié)合x86CPU與XeGU的FaconShores芯片組,該產(chǎn)品原定于4年上市,但在3年3月被公司宣布將推遲至5年以后,具體架構(gòu)信息暫未公布。我們將從芯片架構(gòu)和制程算力內(nèi)存帶寬價格和軟件生態(tài)對MDM0和英偉達(dá)GaeHopper兩者競爭優(yōu)勢展開對比:芯片架構(gòu)CUGU仿生人腦結(jié)構(gòu)制程看齊英偉達(dá)0是MD首款結(jié)合了Zen4CU與CNDA3GU的產(chǎn)品,也是市場上首款“CUGU內(nèi)存一體化產(chǎn)品。采用D堆疊技術(shù)和Chpet設(shè)計,配備了9個基于m制程的芯片組(據(jù)Cgamers推測包括3個CU和6個GU置于4個基于6m制程的芯片組之上因此在制程上,MI00屬臺積電5m,相較MI00系列的m實現(xiàn)了躍遷,并與英偉達(dá)GraceHoper的m制程(屬臺積電m體系)看齊。0晶體管數(shù)量達(dá)到0億,多于英偉達(dá)H100的00億,以及前代250X的2億晶體管數(shù)量。CDNA3架構(gòu)是MI00的核心DN,300配備了4個Zen4數(shù)據(jù)中心CU核心和18GBHM3內(nèi)存,并以位寬總線配置運行。圖表:MDMI0使用Dilt結(jié)構(gòu) 圖表:MI0產(chǎn)品示意圖 :AD官網(wǎng)、 :CES22、圖表:英偉達(dá)reoper架構(gòu)示意圖:英偉達(dá)官網(wǎng)、圖表:英特爾lnShores芯片組結(jié)合6PU與eGP,預(yù)計5年或以后上市:英特爾官網(wǎng)、算力:MI30的性能逼近英偉達(dá)GaeHopper。MD上代X(發(fā)布于1年1月F2算力達(dá)9TFLO雖已超越英偉達(dá)0的5TFLO(發(fā)布于年6月,但其發(fā)布時間在英偉達(dá)之后。MD暫時未公布0與英偉達(dá)GraeHopper在算力上的對比,但相較上一代的X,300在I上的算力(TFLO)預(yù)計能提升8倍,能耗性能(TFLO/watt)將優(yōu)化5倍。因此,此次I0的性能提升后有望逼近GraceHoper水平。另外,raceHoper支持8位浮點精度,而X僅支持6位及以上,但0或?qū)⒃贗訓(xùn)練中支持4位和8位浮點精度,可進(jìn)一步節(jié)省算力。圖表:MD宣稱M0I性能將是MIX的8倍,能耗性能將為MX的5倍:CES22、圖表:MDInsinctMI系列PU發(fā)展歷程產(chǎn)品名稱MI0MI0MI0MI0MIXMI0MI0發(fā)布時間22.1峰值算力(OPS)P6:2.82P2:1.41P6:2.49P2:1.75P6:14P2:2.1P6:3.1P2:4.3P6:33P2:4.87P6:11P2:2.6NA工藝制程及芯片面積m,3mm2m,31mm2m,70mm2m,74mm2m,74mm2m,74mm2m,117mm2晶體管數(shù)量(億)60內(nèi)存容量6BHB22BHB22BHB28BHB2e8BHB2e4BHBe8BHB3內(nèi)存帶寬24B/s24B/s29B/s77B/s77B/s2138B/sNA熱設(shè)計功耗DP(W):AD官網(wǎng)、英偉達(dá)官網(wǎng)、圖表:英偉達(dá)及MD主要PU相關(guān)產(chǎn)品參數(shù)對比產(chǎn)品名稱A10PCI|SXM英偉達(dá)H0PCI|SXM|NVLMIXMDMI0發(fā)布時間2.1峰值算力(OPS)P6:32|24P2:1.5P4:1.5P:,6|,5|,96P6:1,1|,99|,8P2:5||34P4:5||34P6:3P2/6:4.9P2/64tix:9.7NA工藝制程及芯片面積m,8mm2m,84mm2m,74mm2m,117mm2晶體管數(shù)量(億)60內(nèi)存容量0BHBe||88BHB38BHB2e8BHB3內(nèi)存帶寬9|,09B/s|.5TBs|.TBs3高達(dá).2TBs2NAItronet0B/sNVinkor2PUs4B/sPCIeGn40|9|00B/sNVik5BsPCIeGe5PCIeGn4PCIe熱設(shè)計功耗DP(W)0|4003|0|23-00:AD官網(wǎng)、英偉達(dá)官網(wǎng)、內(nèi)存帶寬MI30通“統(tǒng)一內(nèi)存架構(gòu)(UnifiedMemo便利GU-CU間數(shù)據(jù)傳輸,效果類比英偉達(dá)NLink技術(shù)。0的3DChplet架構(gòu)使其內(nèi)部CU和U可共享同一內(nèi)存空間針對相同數(shù)據(jù)同時展開計算實現(xiàn)“o-cp(即CU執(zhí)行計算時無需先將數(shù)據(jù)從某處內(nèi)存復(fù)制到另一個特定內(nèi)存區(qū)域便利單節(jié)點內(nèi)GU-CU之間的數(shù)據(jù)傳輸,減少內(nèi)存帶寬的占用。而英偉達(dá)GraceHoper則通過NLnk-C2C實現(xiàn)GU-CU高速互聯(lián),雙方作為內(nèi)存共享對等體可以直接訪問對方的對應(yīng)內(nèi)存空間,支持90G/s的互聯(lián)速度。盡管MD暫未公布0的傳輸帶寬,但其創(chuàng)新的統(tǒng)一內(nèi)存架構(gòu)實現(xiàn)了GU-CU在物理意義上真正的內(nèi)存統(tǒng)一。MD雖未公布MI00HBM的更多信息,但最新代HM3內(nèi)存帶寬約為1G/s與英偉達(dá)NLnkC2C90G/s帶寬相近因此內(nèi)GU-CU的統(tǒng)一架構(gòu)可繞過傳統(tǒng)連接協(xié)議速度的障礙,突破GU-CU之間的數(shù)據(jù)傳輸速度限制滿足未來I訓(xùn)練和推理中由模型大小和參數(shù)提升帶來的海量數(shù)據(jù)計算和傳輸需要但值得一提的是英偉達(dá)GraceHoper還通過Linkwtch實現(xiàn)多達(dá)6個GU的互聯(lián),支持高達(dá)10TB的高帶寬內(nèi)存訪問,可有效解決GU大規(guī)模并行運算中“單節(jié)點本地內(nèi)存不足”的痛點,在內(nèi)存帶寬表現(xiàn)上或更勝一籌。圖表:MI0向第三代統(tǒng)一內(nèi)存架構(gòu)轉(zhuǎn)實現(xiàn)了PU和PU的內(nèi)存共享:CES2、圖表:英偉達(dá)reoper通過VLC和Linkwih實現(xiàn)GPU和GPPU互連900G/s
900G/s
900G/s:英偉達(dá)官網(wǎng)、價格高性價比策略或為MD在與英偉達(dá)的競爭中再添一碼盡管MD尚未公布定價管理層在F2Q1財報電話會中表示數(shù)據(jù)中心產(chǎn)品將延續(xù)往日的高性價比定價風(fēng)格,重點關(guān)注先把市場打開。成本效益乃云廠商的重中之重,加上單一依賴一個廠商也并非他們所愿。公司預(yù)計0將于今年底前推出,并將搭載于勞倫斯利弗莫爾國家實驗室的百億級超級計算機ICaptan及其他大型云端客戶I模型中公司預(yù)計0營收將在2Q4開始放量,4年持續(xù)爬升。圖表:英偉達(dá)四代Vink產(chǎn)品:英偉達(dá)官網(wǎng)、軟件生態(tài):對比英偉達(dá)的CUD(ComputeUnifiedDevicerchitetue)生態(tài)圈,MD的ROC(RadeonOpenComputecosytem或是其打破英偉達(dá)獨大局勢的一大障礙。英偉達(dá)于7年發(fā)布CUDA生態(tài)系統(tǒng),開發(fā)人員可以通過CUDA部署GU進(jìn)行通用計算(GGU。通過先發(fā)優(yōu)勢和長期耕耘,UDA生態(tài)圈已較為成熟,為英偉達(dá)GU開發(fā)優(yōu)化和部署多種行業(yè)應(yīng)用提供了獨特的護(hù)城河。MD的ROm發(fā)展目標(biāo)是去建立可替代CUDA的生態(tài)而ROm于6年4月發(fā)布相比7年發(fā)布的CUDA起步較晚。全球CUDA開發(fā)者0年達(dá)0萬,223年已達(dá)0萬,包括dbe等大型企業(yè)客戶而ROm的客戶主要為研究機構(gòu)多應(yīng)用于HC對任何一種計算平臺和編程模型來說,軟件開發(fā)人員、學(xué)術(shù)機構(gòu)和其他開發(fā)者與其學(xué)習(xí)、磨合和建立生態(tài)圈都需要時間,更多的開發(fā)者意味著不斷迭代的工具和更廣泛的多行業(yè)應(yīng)用,進(jìn)一步為選擇CUDA提供了更為充分的理由,正向循環(huán)、不斷完善的生態(tài)也將進(jìn)一步提高其用戶粘性。ROCm暫時或難以匹敵CUDA的主要原因包括:1)ROCm僅支持Instinct系列(即RadeonPro系列)GPU的部分SKUs,包括RadeonProW6800和RadeonProV620,近期方擴展至RadeonRX6900XT,RadeonRX6600,以及已有9年歷史的RadeonR9Fury,而CUDA廣泛支持英偉達(dá)多條產(chǎn)品線;2)CUDA1.0即支持Linux、ows,而ROCm長期只支持Linux(甚至是特定的Linux內(nèi)核版本),在今年4月剛剛宣布登錄ows,但僅支持RadeonProW6800,RadeonRX6900XT和RadeonRX6600;3)英偉達(dá)擁有豐富的CUDA軟件庫,以便利開發(fā)者利用GPU構(gòu)建新應(yīng)用或加速現(xiàn)有應(yīng)用,覆蓋廣泛終端應(yīng)用場景,包括資源受限的物聯(lián)網(wǎng)設(shè)備、自動駕駛及超級計算機等領(lǐng)域,而ROCm軟件庫則僅包括CUDA中的一些部分,例如部分?jǐn)?shù)學(xué)函數(shù)、并行算法庫Trust(ROCm中為ParallelSTL)以及深度學(xué)習(xí)庫中的cuDNN(ROCm中為MIOpen)。針對這樣的現(xiàn)狀,AMD在豐富其軟件生態(tài)也持續(xù)有積極動作。雖然目前僅有部分SKU支持ows系統(tǒng),但主流Radeon顯卡用戶可以開始試用過去僅專業(yè)顯卡才能使用的AMDROCm(5.6.0Alpha)。23Q1公司宣布其ROCm系統(tǒng)融入PyTorch2.0框架,目前TensorFlow和Caffe深度學(xué)習(xí)框架也已加入第五代ROCm。ROCm也能對應(yīng)到CUDA的部分內(nèi)容,例如ROCm的HIP對應(yīng)CUDAAPI,只需要替換源碼中的CUDA為HPI就可以完全移植。圖表:英偉達(dá)DXI生態(tài)圈及相客戶矩陣資料來源:英偉達(dá)官網(wǎng)、圖表:英偉達(dá)DA軟件庫及應(yīng)用場景種類軟件包組成功能應(yīng)用數(shù)學(xué)庫cBAS、cFT、cuRAND、cSARSE、cTENSOR、AmgXcSOVER、為分子動力學(xué)、計算流體學(xué)、計算化學(xué)、醫(yī)學(xué)成像和地震勘探等領(lǐng)域的計算密集型應(yīng)用奠定基礎(chǔ)并行算法庫Tst用于C++中的多項運算并在研究自然科學(xué)物流、旅行規(guī)劃等領(lǐng)域的關(guān)系時與圖形一起使用圖像和視頻庫vJPEGNVDA性能基元NVDA視頻編解碼器SDK、NVIDA光流SDK用于通過CUDA和GPU的專用硬件組件來進(jìn)行圖像和視頻的解碼、編碼和處理通信庫NVSHE、NCCL性能經(jīng)過優(yōu)化的多GPU和多節(jié)點通信基元深度學(xué)習(xí)庫NVDAcuDNNNVDAsTNVIDARiv、NVDADeStrmSDK、NVDADALI用于利用CUDA和專用硬件組件的深度學(xué)習(xí)應(yīng)用合作伙伴庫OeCVFmegAraFie、AGA、ISLotrn數(shù)值庫、Gnck、CHOLOD、itnOcanSDK、CUVIib包含GPU加速的開放源代碼庫等覆蓋矩陣信號圖像、音頻、視頻等多種數(shù)據(jù)類型處理:英偉達(dá)官網(wǎng)、IPAAPIOmDA圖表:IPAAPIOmDAVC A函數(shù)庫 OC庫、C庫Pfilr OmPPfilr OmPfilrAGB OmGBVIAmi OmSIsT sleirctGPURsT sleAckr OmckrccN IOn:CSDN、圖表:Om軟件堆棧架構(gòu):CSDN、MD強調(diào)I為公司第一戰(zhàn)略重點定位微軟或入局助其一臂之力塑造I訓(xùn)練端競爭格局AD管理層在2Q1財報電話會中強調(diào)I為目前公司第一戰(zhàn)略重點公司正致力于構(gòu)建更加多元的I整合產(chǎn)品矩陣包括融合RenI的Ren740系列CU自適應(yīng)數(shù)據(jù)中心平臺ersal、Aveo加速器、第四代CGeoa處理器,以及目前公布即將上市的InstnctI300。Ren700處理器配備8顆Zen4核心和MDRDNA3顯卡內(nèi)置的RenI每秒可完成高達(dá)2兆次I運算用于改善視頻背景中的模糊自動對焦及降噪功能ersalIEde系列將協(xié)助開發(fā)者加速傳感器系統(tǒng)和I算法迭代優(yōu)化I性能功耗比包括自動駕駛工業(yè)及醫(yī)療保健場景中的實時系統(tǒng)以及航空航天與國防場景中的多任務(wù)負(fù)載等MDAleo70I推理加速器采用XNA架構(gòu),峰值I算力達(dá)O,而其TDP僅W且其兼容esorFow和Porch框架適用于視頻分析和自然語言處理應(yīng)用根據(jù)S203中的展示在智慧城市智慧零售等應(yīng)用中veoV70的能效對比英偉達(dá)在1年推出的T4推理加速器高逾%(英偉達(dá)在今年的TC里發(fā)布了新一代的4推理加速器。另外根據(jù)彭博社5月4日的報道微軟將注資MD并開展合作推動其在I處理器領(lǐng)域的發(fā)展。該報道稱,目前合作研發(fā)的微軟I芯片名為“雅典娜”(thn),旨在為chtGT等大型語言模型(L)的訓(xùn)練及推理提供英偉達(dá)芯片以外的替代方案隨后5月5日微軟發(fā)言人Frakhw表示MD參“雅典娜項目的報道不實但并未明確微軟與MD的合作關(guān)系我們認(rèn)為大型云計算供應(yīng)商擁有財力物力面對較高的外購成本和較有限的靈活性,選擇自己設(shè)計I芯片也并非意外。微軟與OpnI的合作中應(yīng)用到大量的英偉達(dá)芯片,而若與MD開展戰(zhàn)略合作,或?qū)⑷〈糠钟ミ_(dá)芯片的需求。云廠商自研芯片為大勢所趨除微軟外谷歌及亞馬遜等頭部云廠商也在推進(jìn)I芯片自研進(jìn)程谷歌于6年推出基于IC專用芯片的I推理芯片esorrocessngUnit(TU),在7年迅速發(fā)展到第二代并擁有I訓(xùn)練功能,TU目前已發(fā)展到第四代,并應(yīng)用于aLM等大語言模型的訓(xùn)練但谷歌并沒有發(fā)售T僅通過GogeCoudatfom對外進(jìn)行算力租賃服務(wù)亞馬遜則分別在9和0年推出I模型推理端芯片Inerentia以及訓(xùn)練端芯片ranium并整合到其WS中云廠商推進(jìn)芯片自研首先出于節(jié)約外采芯片成本、降低芯片能耗(IC基于專用性能耗更低)以削減TCO的考量。其次,公司推動自研芯片,自主可控。另外,芯片自研可集成公司本身擁有軟件生態(tài)圈深化競爭壁壘,如谷歌的TU即為其esoFow深度學(xué)習(xí)框架量身打造,在其中充分發(fā)揮其性能。圖表:MD的I產(chǎn)品矩陣布局:AD財報、圖表:MDRzn0系列處理器,融合Rzn:AD官網(wǎng)、綜上所述,MD的M0也許是谷歌TU之外,最有潛力在I訓(xùn)練端中與英偉達(dá)匹敵的芯片但生態(tài)系統(tǒng)或是MD打破英偉達(dá)獨大局勢的一大障礙?0在規(guī)格及性能上接近英偉達(dá)的GraceHoper其CUGU架構(gòu)更加符合人腦信息處理流程并能順應(yīng)多模態(tài)模型發(fā)展趨勢。0通過CU與GU統(tǒng)一內(nèi)存的架構(gòu),跟英偉達(dá)NLnk的傳輸性能可比,并逐步攻克CIe總線瓶頸限制數(shù)據(jù)傳輸速率的問題。然而,MD對英偉達(dá)市場份額的挑戰(zhàn)并非一蹴而就。一方面,英偉達(dá)GU芯片的算力壁壘以及I訓(xùn)練端的深入布局一時難以撼動另一方面MD的軟件生態(tài)也限制其與客戶系統(tǒng)的融合及滲透應(yīng)用場景人腦神經(jīng)網(wǎng)絡(luò)的運作模式始終是人工智能追求的終極形態(tài)MD對芯片與人類大腦的操作理解較為超前。早在01年,MD產(chǎn)品構(gòu)想中就以CU和GU分別類比人類左右腦,并基于此提出了CU+GU的異構(gòu)產(chǎn)品策略。類比人腦,MD認(rèn)為左腦更像CU,負(fù)責(zé)對信息的邏輯處理,如串行運算、數(shù)字和算術(shù)、分析思維理解、分類、整理等,而右腦更像GU,負(fù)責(zé)并行計算、多模態(tài)、創(chuàng)造性思維和想象等。人類大腦神經(jīng)網(wǎng)絡(luò)的運作模式,始終是人工智能追求的終極形態(tài),因此,我們認(rèn)為CUGU的異構(gòu)集成,對比人類可實現(xiàn)左右腦協(xié)同工作,整體調(diào)動神經(jīng)網(wǎng)絡(luò),或?qū)⒊蔀镮芯片的主流技術(shù)方向目前MD的英偉達(dá)的GraceHoper和英特爾的Faconhres在此均有布局。GU的算力高,并針對并行計算,但須由CU進(jìn)行控制調(diào)用,發(fā)布指令在I訓(xùn)練端,CU可負(fù)責(zé)控制及發(fā)出指令指示GU處理數(shù)據(jù)和完成復(fù)雜的浮點運算(如矩陣運算。在面對不同模態(tài)數(shù)據(jù)的推理時,我們認(rèn)為,CU與U的分工也各有不同,因此,同部署CU和GU能提供最大的運算支撐例如在處理語音語言和文本數(shù)據(jù)的推理時,I模型需逐個識別目標(biāo)文字計算有序因此或更適合使用擅長串行運算的CU進(jìn)行運算支持;但在處理圖像、視頻等數(shù)據(jù)的推理時(對比人類的操作,每一個像素是同時進(jìn)入眼睛需要大規(guī)模并行運算或更適宜由GU負(fù)責(zé)例如英偉達(dá)L4GU可將I視頻性能提高0倍,據(jù)英偉達(dá)測試,4與基于CU的傳統(tǒng)基礎(chǔ)設(shè)施相比能源效率提高9%。圖表:1年MD已提出PU概念,將結(jié)合PU與PU在左右腦層的分工區(qū)別和組合構(gòu)想:AD推特官方、圖表:人類大腦不同部分功能及對應(yīng)芯種類:HaiR.rmbin–evirnmtcnctistotmoldnmicsndscialitectin:pincilesfumnbinfctin[J.Nuo,1,4):133-3、BiFct、圖表:人腦處理信與人工智能訓(xùn)練和理的流程對比:CSDN、谷歌官網(wǎng)、VasaniA,SazerN,PmarN,tl.Attntinislloue[J].Advncsinurlinfmtinrcessingsstms,1,3.、以GaeHopper為例,可以具體觀察CUGU異構(gòu)的優(yōu)勢所在。英偉達(dá)通過NLnk-C2C技術(shù)使CGU構(gòu)成一個完整的系統(tǒng),并實現(xiàn)內(nèi)存相互訪問,無需沿循“U-內(nèi)存主板-顯存-G基于主板CIe的迂回路線從而減少CU計算損耗并大幅提升功耗、延時和帶寬。U在視頻處理、圖像渲染等方面的優(yōu)勢毋庸置疑,但并非所有工作負(fù)載都是單純的GUbund,因此我們認(rèn)為,其CU部分或主要用于發(fā)出指令,以及在推理階段處理,尤其是文本、音頻等信息。圖表:英偉達(dá)reoper與6+opper的最終用戶應(yīng)用程序性能擬:英偉達(dá)官網(wǎng)、PC需求持續(xù)下行欲見底,發(fā)力云端I欲與英偉達(dá)一決高下MD營收及利潤均超預(yù)期,但較低指引觸發(fā)股價下跌。MD2Q1營收為3億美元,同比下滑%-GAPES為0美元同比下滑%均略超彭博一致預(yù)期的億美元和8美元,-GAP毛利率同比下降3ct至%。公司指引二季度營收約為3億美元同比下降%但環(huán)比基本持平其中客戶端數(shù)據(jù)中心以及游戲業(yè)務(wù)營收同比將繼續(xù)下滑但嵌入式業(yè)務(wù)營收將增長-GP毛利率預(yù)計保持在%水平全年指引營收將會由數(shù)據(jù)中心和嵌入式業(yè)務(wù)的同比增長所拉動,而-GP毛利率也將在下半年擴大雖然Q1營收及利潤表現(xiàn)均超市場預(yù)期但二季度較悲觀的營收指引導(dǎo)致盤后股價下跌。:MD及GP元 圖表:MD季度分業(yè)務(wù)營收占比
心 端 戲 務(wù) NnGAP
心 端 游戲 嵌入式業(yè)務(wù)*注:公司自22起采用新的業(yè)務(wù)劃分方式進(jìn)行財報披露AMD財報、
*注:公司自22起采用新的業(yè)務(wù)劃分方式進(jìn)行財報披露;賽靈思在2Q1開始并表:AD財報、圖表:MD季度分業(yè)務(wù)營收同比增速 圖表:MD季度分業(yè)務(wù)營收環(huán)比增速 *注:公司自22起采用新的業(yè)務(wù)劃分方式進(jìn)行財報披露;賽靈思在2Q1開始并表AMD財報、
*注:公司自22起采用新的業(yè)務(wù)劃分方式進(jìn)行財報披露;賽靈思在2Q1開始并表:AD財報、MD23Q1營收下滑主要鑒于C出貨量持續(xù)下行,公司控制出貨量以消耗下游庫存,致客戶端營收同比大幅下滑。Q1營收9億美元,同比降幅達(dá)%,對比一季度IDC數(shù)據(jù),個人電腦Q1出貨量同比下滑%,行業(yè)的不景氣也影響了主要競爭對手英特爾相關(guān)C業(yè)務(wù),營收下滑%。全球C出貨量的底部目前雖還未出現(xiàn)但下半年有望迎來修復(fù)。MD管理層預(yù)計今年整體C銷售將下跌%,即約6億部。競爭對手英特爾也表示,3年全年C出貨量預(yù)計為7億未來將提高并穩(wěn)定至每年3億部MD也表示正致力于平衡出貨量與需求,并認(rèn)為二季度和下半年C市場將回暖。彭博數(shù)據(jù)顯示,3年初戴爾、華碩、聯(lián)想等主要C廠商存貨周轉(zhuǎn)天(2.8/12.1/5.1相較2年下半(2.5/13.9/53.3可以看到一些廠商的存貨周轉(zhuǎn)天數(shù)雖已開始出現(xiàn)下降但根據(jù)IDC數(shù)據(jù)C出貨量環(huán)比依然下滑。圖表:全球C出貨量及同比和環(huán)比變(單位:百萬臺):IDC、圖表:部分主要C廠商的存貨周轉(zhuǎn)天,3年初較2年有所下降:彭博、C方面,MDQ1推出Ren700X3D系列處理器(包括0和,而也于4月初推出,配備MD3D-Cache堆棧緩存技術(shù),擁有更高的數(shù)據(jù)獲取速率及緩存容量。移動設(shè)備方面,筆記本電腦系列MDRen9的HXCU在電子設(shè)備測評平臺NotbokCheck中獲CU性能測試排名第一。另外,Ren7040系列henixCU處理器已量產(chǎn),相關(guān)筆記本產(chǎn)品將在5月中下旬開始陸續(xù)上市。以上產(chǎn)品均基于en4架構(gòu)和臺積電5m制程。圖表:根據(jù)obookhek3年1月的測評,Rzn9XU多核性能表現(xiàn)在市面上多款U中最佳注:綠色數(shù)字表示以ADRzen960HX為基礎(chǔ)的性能評分提升幅度:NotbkCheck、MD數(shù)據(jù)中心業(yè)務(wù)Q1營收5億美元,同比2.3億美元基本持平。公司表示,二季度數(shù)據(jù)中心業(yè)務(wù)應(yīng)錄得增長,但也需取決于宏觀環(huán)境。數(shù)據(jù)中心經(jīng)營利潤率%,同比降幅達(dá)pct經(jīng)營利潤率下滑主要由于公司發(fā)力產(chǎn)品矩陣及研發(fā)費用投入根據(jù)公司管理層,Q1云巨頭進(jìn)一步擴大了MD產(chǎn)品部署,微軟ure、谷歌云及甲骨文云等客戶的28個新項目搭載了PC系列CU處理器。截至目前,已公開的由MD產(chǎn)品驅(qū)動的項目超過0個。公司早前在2Q4財報電話會也表示,數(shù)據(jù)中心CU第四代PC系列新產(chǎn)品ergamo預(yù)計于Q2末上市PCGeo-X處理器也將于本年內(nèi)上市而公司也認(rèn)為ergamo將會成為下半年營收的重要貢獻(xiàn)。ergmoCU基于臺積電5m制程工藝,采用ZenC架構(gòu),具有多達(dá)8個內(nèi)核,針對吞吐量提升進(jìn)行了優(yōu)化。第四代PC家族的另一位新成員Geoa-X與前代PC中的Ma-X同樣采用D-Cache技術(shù)Ma-X基于Zen3架構(gòu)最大緩存為而基于Zen4架構(gòu)的Geo-X在同為5核心的情況下最大三級緩存超過1G。另外,公司在今年一月發(fā)布的InstnctMI00CUGU劍指人工智能和高性能計算,該產(chǎn)品預(yù)計下半年開始放量,或可成為英偉達(dá)在AI訓(xùn)練端的有力競爭者。圖表:MDEPC系列PU產(chǎn)品路線圖CES22、圖表:MDEPCPU產(chǎn)品矩陣系列名稱VierinSinaBermoGnoXGnoaMinXMinRmeNals系列編號C*C*C4C4C4C4C4C3C2C1發(fā)布年份+CPU架構(gòu)n*n5n4nCn4en4n3n3n2n1制程mCmCmCmCmCmCmCmCmo插座5/665553333插槽A 6)A4A6A6A6A4A4A4A4最大核心數(shù)**最大線程數(shù)**最大三級緩存2B4B8B6B6B4BCilt設(shè)計8 s2sDe2sDe8s8s4s)1)2s1)8s1)2)2 /+1D+1D1)+1D+1D1)+1D+1D+1D)內(nèi)存支持**存儲器通道D2)s)s2s2s2s8s8s8s8sPCIeGn支持DD6n50n58n58n58n48n48n44n3最大熱設(shè)計功耗DWPW)WWPW)WWWWWW*注:具體參數(shù)官方尚未確認(rèn)Wccfc、圖表:MD發(fā)布PC處理器系列新產(chǎn)品rgm,預(yù)計3年第二季度末上市CES22、圖表:MD發(fā)布PC處
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年鋼筋工程專項勞務(wù)分包協(xié)議范本版B版
- 2024年高科技設(shè)備回購擔(dān)保及研發(fā)支持合同2篇
- 2025年度大件運輸許可電子檔案管理規(guī)范3篇
- 2024年設(shè)備技術(shù)轉(zhuǎn)讓協(xié)議2篇
- 2024年甲乙雙方標(biāo)準(zhǔn)建設(shè)工程施工合同示范文本的簽訂
- 2025年度離婚后子女撫養(yǎng)費及監(jiān)護(hù)權(quán)支付協(xié)議3篇
- 2025年度賓館客戶關(guān)系管理系統(tǒng)開發(fā)與實施合同3篇
- 2025年度化妝品店鋪轉(zhuǎn)讓及銷售渠道拓展合同3篇
- 2025年度按揭中二手房買賣合同范本:全裝修交付版3篇
- 2024年版地方政府土地征收補償合同標(biāo)準(zhǔn)文本
- DB11T 880-2020 電動汽車充電站運營管理規(guī)范
- 人工智能視域下數(shù)字媒體技術(shù)類課程學(xué)生創(chuàng)造力培養(yǎng)研究
- 工業(yè)機器人論文3000字(合集4篇)
- 第三章《地球的面貌》-2024-2025學(xué)年七年級上冊地理單元測試卷(湘教版2024)
- 2024年四川省成都市青羊區(qū)數(shù)學(xué)六上期末考試試題含解析
- 十七個崗位安全操作規(guī)程手冊
- 就業(yè)招聘服務(wù)行業(yè)經(jīng)營模式分析
- 港口液體危化品裝卸管理人員理論考試題庫-下(判斷題)
- 2024關(guān)于家長會家長代表發(fā)言稿(30篇)
- 中醫(yī)內(nèi)科學(xué):中醫(yī)內(nèi)科學(xué)肢體經(jīng)絡(luò)病證考試題(題庫版)
- 高中生物學(xué)科思維導(dǎo)圖(人教版必修一)
評論
0/150
提交評論