AI時代的算力領(lǐng)軍人2024_第1頁
AI時代的算力領(lǐng)軍人2024_第2頁
AI時代的算力領(lǐng)軍人2024_第3頁
AI時代的算力領(lǐng)軍人2024_第4頁
AI時代的算力領(lǐng)軍人2024_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告1相關(guān)研究AR-2024/07/07封測產(chǎn)業(yè)鏈機遇-2024/06/30新范式-2024/06/18GPU+DPU+CPU全面布局,AI軟硬件一體化龍頭優(yōu)勢領(lǐng)先。英偉達成立于1993年,構(gòu)建以CUDA生態(tài)為核心,將底層GPU+DPU+CPU進行整合,提供數(shù)據(jù)中心的全領(lǐng)域加速計算方案,在持續(xù)推進的AI浪潮中,成為了軟硬件一體化的云計算解決方案領(lǐng)導(dǎo)者。公司業(yè)務(wù)布局包括數(shù)據(jù)中心、游戲、專業(yè)可視化、汽車四大板塊,數(shù)據(jù)中心業(yè)務(wù)伴隨著AI浪潮高速成長,2025財年第一季度實現(xiàn)營收225.63億美元,同比增長426.68%,同時公司其他幾大業(yè)務(wù)板塊業(yè)績也在穩(wěn)步提升,為公司整體營收和利潤帶來正向貢獻。2024財年公司實現(xiàn)營收609.22億美元,同比+125.85%,實現(xiàn)凈利潤297.60億美元,同比+581.32%;2025財年第一季度公司業(yè)績進一步提速,實現(xiàn)營收260.44億美元,同比+262.12%,凈利潤為148.81億美元,同比+628.39%。AI浪潮仍處于訓(xùn)練階段,伴隨下游客戶需求增長,公司業(yè)績有望持續(xù)提升。云商資本開支不斷上修,反映出下游對AI的需求強勁。此前市場擔憂AI訓(xùn)練的需求會隨著大模型訓(xùn)練告一段落而放緩,而2024年以來北美四大云商紛紛上修全年資本開支指引,2024年一季度四大云商合計資本開支476億美元,同比增長38.98%,反映出客戶對訓(xùn)練算力的需求仍在超預(yù)期。當前階段來看,訓(xùn)練側(cè)的OpenAI等公司推出的大模型參數(shù)仍在呈指數(shù)級增長,而Sora等應(yīng)用領(lǐng)域的模型推出,以及蘋果接入GPT-4o等則反映出AI應(yīng)用落地節(jié)奏的加速,有望帶來新一輪的推理側(cè)算力需求。目前來看,AI進展仍處于早期階段,生成式人工智能的推進將給英偉達帶來持續(xù)增長的下游需求。GB200等產(chǎn)品大幅加強了英偉達在AI算力領(lǐng)域的領(lǐng)先優(yōu)勢。此前英偉達在算力領(lǐng)域的核心優(yōu)勢在于強大的硬件性能以及完善的軟件生態(tài)壁壘。2023年以來,AMD、Intel等芯片設(shè)計公司,以及谷歌、微軟、Meta、亞馬遜等英偉達的下游客戶紛紛增強加速卡領(lǐng)域的布局,例如AMD加大ROCm生態(tài)的投入,并且推出MI300X等更高性價比的產(chǎn)品,意圖搶占英偉達的市場份額。而英偉達的H200、Blackwell平臺以及GB200等產(chǎn)品則進一步加強了英偉達的領(lǐng)先優(yōu)勢。英偉達通過H200等產(chǎn)品給客戶提供更多更具性價比的選擇的同時,又通過GB200在服務(wù)器架構(gòu)上的優(yōu)化,解決了GPU之間的互聯(lián)瓶頸,大幅提升了英偉達服務(wù)器的推理和訓(xùn)練能力,也改善了英偉達的產(chǎn)業(yè)鏈上下游話語權(quán)。展望未來,我們認為英偉達在算力領(lǐng)域的優(yōu)勢和壁壘有望被不斷鞏固。投資建議:AI浪潮正在加速,云廠商在訓(xùn)練側(cè)的需求持續(xù)提升,并且后續(xù)的推理場景有望帶來更大的算力市場空間。英偉達在AI領(lǐng)域的布局領(lǐng)先,同時與競爭對手的差距逐步擴大。在生成式人工智能給英偉達數(shù)據(jù)中心業(yè)務(wù)帶來持續(xù)成長動力的同時,公司的其他三大業(yè)務(wù)板塊也在穩(wěn)步增長。展望未來,公司業(yè)績有望持續(xù)提升,建議積極關(guān)注。風險提示:AI行業(yè)需求波動的風險;行業(yè)競爭格局變化的風險;產(chǎn)品研發(fā)進度不及預(yù)期的風險;宏觀經(jīng)濟及下游需求恢復(fù)不及預(yù)期的風險。重點公司盈利預(yù)測、估值與評級EPS(美元)FYFY2026EFYFY2024APE(倍)FYFY2026EFY2024AFY2025EFY2025E英偉達行業(yè)深度研究/電子本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告21英偉達:人工智能時代AI算力領(lǐng)軍者 31.1業(yè)務(wù)持續(xù)轉(zhuǎn)型升級,全面擁抱人工智能 31.2AI芯片驅(qū)動高速增長,軟硬件結(jié)合構(gòu)建競爭壁壘 2AI開啟大算力時代,加速卡需求井噴 72.1生成式AI帶動加速卡需求快速增長 72.2各環(huán)節(jié)廠商入局,“一超多強”時代開啟 3軟硬件生態(tài)領(lǐng)先,加速卡龍頭地位穩(wěn)固 3.1加速卡全性能領(lǐng)先,GB200拉開差距 3.2GPU+CPU+DPU全布局,從加速卡向系統(tǒng)巨頭升級 3.3軟件生態(tài)至關(guān)重要,CUDA優(yōu)勢長期存在 4其他業(yè)務(wù)板塊穩(wěn)健增長 214.1游戲業(yè)務(wù):收入保持穩(wěn)定,技術(shù)業(yè)內(nèi)領(lǐng)先 214.2專業(yè)可視化業(yè)務(wù):加強AI導(dǎo)入,應(yīng)用場景廣闊 224.3汽車:擁有完整解決方案,與客戶深度合作 235投資建議 256風險提示 27插圖目錄 28表格目錄 28行業(yè)深度研究/電子本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告31英偉達:人工智能時代AI算力領(lǐng)軍者NVIDIA成立于1993年,通過構(gòu)建以CUDA生態(tài)為核心,將底層GPU+DPU+CPU進行整合,提供數(shù)據(jù)中心的全領(lǐng)域加速計算方案,并結(jié)合AI+云計算的時代背景,成為人工智能時代軟硬件一體化AI+云計算解決方案領(lǐng)導(dǎo)者。其發(fā)展歷程主要可分為以下幾個階段:(1993-1998)起步發(fā)展階段:NVIDIA在成立之初通過生產(chǎn)3D圖形芯片布局游戲和多媒體市場。1997年4月,公司推出全球首款128bit的3D處理器RIVA128,這是第一款支持微軟Direct3D加速的圖形芯片,也是當時市場上唯一真正具有真正3D加速能力的2D+3DAGP顯卡,上市四個月出貨量突破100萬片。1998年,英偉達正式與臺積電簽約建立合作伙伴關(guān)系。1999年公司推出的RIVATNT2在制程工藝升級的同時核心頻率和顯存容量皆有極大提升,并以價格優(yōu)勢擴大市場份額,幫助公司成為行業(yè)龍頭。(1999-2005)快速成長階段:英偉達于1999年納斯達克在上市,發(fā)行價為12美元,發(fā)行數(shù)量為350萬股。同年推出Geforce256,這是全球真正意義上第一塊GPU獨立顯卡。2000年3月,英偉達成功拿到微軟首款XBOX游戲機的圖形處理器訂單,保持圖形處理領(lǐng)域的領(lǐng)先優(yōu)勢,游戲產(chǎn)業(yè)和英偉達顯卡技術(shù)進步互相促進。(2005-2016)轉(zhuǎn)型拓展階段:2006年,英偉達推出CUDA軟件平臺,展示GPU強大的并行處理能力,把顯卡的邊界從游戲和3D圖像處理擴展到通用加速計算的領(lǐng)域。在此階段英偉達全面完善產(chǎn)品線,產(chǎn)品覆蓋高中低端下游各應(yīng)用市場,如GeForce系列顯卡針對PC游戲市場,Tesla和Quadro系列GPU被廣泛應(yīng)用于機器學習、數(shù)據(jù)科學、計算機視覺等領(lǐng)域,DRIVE高級駕駛輔助系統(tǒng)助力公司布局自動駕駛領(lǐng)域。(2016-至今)AI加速階段:2016年公司推出全球首款一體化深度學習超級計算機——DGX-1,搭載8塊P100加速器的超算,可強力支持人工智能應(yīng)用程序,正式開啟人工智能時代。2018年,英偉達推出“Turing(圖靈)”GPU架提供支持。近年來隨著AI算力迭代升級,公司借助NVIDIAOmniverse平臺,廣泛覆蓋人工智能、加速計算、元宇宙、游戲、機器人、自動駕駛等領(lǐng)域,為公司的長遠發(fā)展拓展更多可能。行業(yè)深度研究/電子本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告4圖1:英偉達發(fā)展歷程資料來源:英偉達官網(wǎng),民生證券研究院整理產(chǎn)品線方面,英偉達在數(shù)據(jù)中心、游戲、專業(yè)可視化、汽車四大業(yè)務(wù)板塊均有業(yè)務(wù)布局。1)數(shù)據(jù)中心業(yè)務(wù):公司已完成CPU+GPU+DPU三芯的硬件布局,通過底層硬件架構(gòu)和CUDA生態(tài)整合,構(gòu)建全領(lǐng)域加速計算平臺。近幾年公司業(yè)績增長主要由數(shù)據(jù)中心貢獻,公司也將加快技術(shù)迭代速度,重塑AI時代的數(shù)據(jù)中心。2)游戲業(yè)務(wù):公司提供用于PC的GeForceRTX和GeForceGTX顯卡、用于其他游戲機的GeForceNOW云游戲、用于在電視播放高質(zhì)量流媒體的SHIELD,并與游戲方合作提供開發(fā)服務(wù)。截至2024年3月,公司在游戲GPU領(lǐng)域的市占率超過80%。3)專業(yè)可視化業(yè)務(wù):NVIDIARTXGPU和EGX平臺為客戶提供涵蓋專業(yè)圖形渲染、云端XR應(yīng)用、AI數(shù)據(jù)科學與大數(shù)據(jù)研究的專業(yè)可視化業(yè)務(wù),可應(yīng)用在汽車、建筑、醫(yī)療、影視媒體等多場景。4)汽車業(yè)務(wù):DRIVEOrinSoC芯片能夠為自動駕駛功能、置信度視圖、數(shù)字儀表盤以及AI座艙提供強力支持,Hyperion架構(gòu)將AI計算與完整的傳感器套件集成整合,能加速自動駕駛的開發(fā)、測試和驗證過程。軟件方面,英偉達擁有完善的底層基礎(chǔ)框架和上層應(yīng)用工具。CUDA、DOCA等底層應(yīng)用框架降低芯片產(chǎn)品的編程難度,更好實現(xiàn)全平臺融合,GeforceNow、Omniverse、AIEnterprise、Drive等應(yīng)用平臺助力公司開拓不同商務(wù)場景,英偉達與不同終端客戶的深度合作可以讓英偉達及時預(yù)測技術(shù)發(fā)展的方向,為公司的可持續(xù)發(fā)展提供助力。行業(yè)深度研究/電子本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告5圖2:英偉達軟硬件產(chǎn)品線英偉達業(yè)務(wù)結(jié)構(gòu)可分為數(shù)據(jù)中心、游戲、專業(yè)可視化、汽車和機器人四大板塊。數(shù)據(jù)中心營收占比較高,且近幾年公司業(yè)績增長主要由數(shù)據(jù)中心板塊貢獻,而游戲和可視化業(yè)務(wù)保持穩(wěn)定。數(shù)據(jù)中心FY25Q1營收225.63億美元,占比86.63%,同比增長426.68%。游戲業(yè)務(wù)FY25Q1營收26.47億美元,占比10.16%,同比增長18.17%。專業(yè)可視化業(yè)務(wù)FY25Q1營收4.27億美元,占比1.64%,同比增長44.75%。汽車和機器人業(yè)務(wù)FY25Q1營收3.29億美元,占比1.27%,同比增長11.15%。從FY22Q1到FY25Q1,數(shù)據(jù)中心業(yè)務(wù)營收占比從36.18%提升到86.92%,上升50.74pct;游戲業(yè)務(wù)營收占比從48.76%減少到10.16%,下降38.60pct。專業(yè)可視化業(yè)務(wù)營收從FY22Q1的3.72億美元增加到4.27億美元,汽車業(yè)務(wù)營收從FY22Q1的1.54億美元增加到3.29億美元,隨著AI技術(shù)的不斷發(fā)展,數(shù)據(jù)中心對公司的重要性不斷提升,該業(yè)務(wù)的營收金額和營收占比有望持續(xù)圖3:FY2022-FY2025Q1公司各業(yè)務(wù)營業(yè)收入(億美圖4:FY2022-FY2025Q1公司各業(yè)務(wù)收入占比(%)數(shù)據(jù)中心游戲?qū)I(yè)可視化汽車其他數(shù)據(jù)中心游戲?qū)I(yè)可視化汽車其他數(shù)據(jù)中心游戲?qū)I(yè)可視化汽車其他300250200500250200500資料來源:Bloomberg,民生證券研究院資料來源:Bloomberg,民生證券研究院行業(yè)深度研究/電子本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告6得益于人工智能和高性能計算前所未有的需求水平,英偉達2024財年總營收達到609.22億美元,同比增長125.85%,凈利潤為297.60億美元,同比增長581.32%。2024年一季度公司推出的Blackwell平臺以萬億參數(shù)規(guī)模推動AI計算的新時代,該季度營收為260.44億美元,同比增長262.12%,凈利潤為億美元,同比增長628.39%。展望2024年,隨著Blackwell在二季度開始量產(chǎn),并與客戶構(gòu)建數(shù)據(jù)中心,豐富的軟硬件生態(tài)系統(tǒng)會加快公司技術(shù)更新的速度,業(yè)績有望繼續(xù)增長。圖5:FY2018-FY2025Q1公司總營收及同比(億美圖6:FY2018-FY2025Q1公司凈利潤及同比(億美總收入總收入——YoY0凈利潤凈利潤——YoY0資料來源:Wind,民生證券研究院資料來源:Wind,民生證券研究院受益于產(chǎn)品技術(shù)升級,近年來公司毛利率不斷改善。近年來公司不斷升級芯片架構(gòu),并布局加速計算、人工智能等領(lǐng)域,帶動毛利率穩(wěn)健提升并領(lǐng)先可比公司。2023財年公司毛利率為58.68%,同比下降7.56pcts,原因是PC需求衰退以及當年全球經(jīng)濟下滑。2024財年公司毛利率為73.56%,同比提升14.88pcts,F(xiàn)Y2025Q1公司毛利率為75.77%,主要原因為數(shù)據(jù)中心業(yè)務(wù)發(fā)展帶動,公司推出H100、B100等高端產(chǎn)品。圖7:FY2018-FY2025Q1英偉達與可比公司毛利率(%)—o—AMD——IntelNvidiaFY2018FY2019FY2020FY2021FY2022FY2023FY2024FY2025Q1行業(yè)深度研究/電子本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告72AI開啟大算力時代,加速卡需求井噴近年來生成式AI步入快速發(fā)展期。1950年開始生成式AI出現(xiàn)早期萌芽,此后AIGC處于漫長的沉淀積累期,決策式AI占據(jù)主流。隨著2014年生成式對抗網(wǎng)絡(luò)等深度學習算法的提出,AIGC步入快速發(fā)展期,生成內(nèi)容的豐富度和精度都有了較大的提升。英偉達CEO黃仁勛在GTC2023大會上將ChatGPT比作AI的“iPhone“時刻,AI時代加速來臨,推動生成式AI加速發(fā)展。多模態(tài)大模型有望帶動算力需求的進一步增長。伴隨著大模型的主要交互方式從文字升級為圖片、音頻以及視頻,大模型對訓(xùn)練和推理的算力需求將進一步提升。谷歌發(fā)布的Gemini模型開啟了大模型的多模態(tài)時代,2024年2月16日,谷歌發(fā)布Gemini1.5,模型能力可以支持100萬Token上下文的穩(wěn)定處理。同一時間,OpenAI發(fā)布了sora模型,在文生視頻領(lǐng)域獲得了重要突破,60秒的視頻長度和對真實世界物理引擎的更優(yōu)理解,有望帶動大模型視頻生成行業(yè)的快速發(fā)展。大模型向視頻等交互模式的升級有望帶動訓(xùn)練側(cè)算力需求的進一步提升,同時這些表現(xiàn)驚人的模型或?qū)⒓铀偕墒紸I在應(yīng)用側(cè)的落地,加速推理側(cè)算力需求的增長。英偉達在4Q23業(yè)績交流會上表示,目前來自推理側(cè)的需求占比已經(jīng)達到40%,伴隨模型能力的進一步提升,推理側(cè)算力需求的占比有望持續(xù)提升。圖8:AI模型發(fā)展歷程OpenAI成立于2015年,從非盈利組織逐步轉(zhuǎn)變?yōu)樯虡I(yè)驅(qū)動。公司在2018-2020三年時間內(nèi)連續(xù)推出了GPT-1、GPT-2和GPT-3三款產(chǎn)品,后在2022年底推出ChatGPT,面向公眾提供生成式AI服務(wù),引起全球AI浪潮。2023年OpenAI推出萬億參數(shù)量級的GPT-4,能力再上一個臺階。2024年2月,公司推出的Sora文生視頻模型相較此前的同類型模型有著全方位的能力提升,引發(fā)全球轟動。公司計劃后續(xù)將推出GPT-5大模型,預(yù)計參數(shù)數(shù)量將達到10萬億量級,有望進一步提升全球算力需求。行業(yè)深度研究/電子本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告8谷歌早在2023年2月就推出了對標GPT的Bard大語言模型,此后在2023年5月發(fā)布了PaLM2模型。谷歌最重要的大模型產(chǎn)品是在2022年12月推出的Gemini1.0家族,該模型是一款具有突破性意義的多模態(tài)AI大模型,可以處理文本、代碼、圖像、音頻、視頻,Gemini有三個子模型,其中Nano被用于谷歌的Pixel8Pro智能手機中。2024年2月,谷歌發(fā)布了Gemini1.5模型。相較于此前Gemini1.0Pro版本,Gemini1.5pro將上下文處理能提從3.2萬Tokens提升至100萬以上,處理能力涵蓋包括1小時的視頻、11小時的音頻、超過3萬行代碼或超過70萬字的代碼庫。同月,谷歌又推出了Gemma開源大模型,更加輕量化,保持免費且允許商用。Meta是全球最重要的開源大模型廠商,主要目的為用開源的方式快速搭建自身的生態(tài),從而在未來更方便地獲取數(shù)據(jù)和推廣應(yīng)用。Meta最重要的大模型產(chǎn)品是LLaMa模型家族,眾多大模型廠商在LLaMa模型的基礎(chǔ)上進行訓(xùn)練和微調(diào),生成自己的大模型。2023年7月,公司推出LLaMa2模型,訓(xùn)練數(shù)據(jù)集達到2萬億token,涵蓋7B、13B和70B三個模型。據(jù)Meta,公司計劃在2024年7月發(fā)布LLaMa3模型,全球開源大模型能力有望全面提升。圖9:大語言模型發(fā)展時間線資料來源:中國人民大學高瓴人工智能學院,民生證券研究院整理根據(jù)大模型的運算原理,訓(xùn)練和推理所需的算力與模型參數(shù)成正比例關(guān)系,GPT5有望帶動大模型訓(xùn)練和推理需求的進一步增長。此前市場擔憂在大模型在參數(shù)指數(shù)級提升的情況下,模型能力提升的邊際效應(yīng)是否會減弱,甚至停止,而驗證的方法就是看2024年將要推出的GPT5的能力是否出現(xiàn)質(zhì)變。Altman近期在采訪中表示,GPT5的能力相較于GPT4將會是一個重大進步,并且他認為目前的大模型能力仍然處于初級階段,在未來5-10年內(nèi),模型的能力提升仍將保持一條陡峭的曲線。伴隨十萬億參數(shù)量級的GPT5推出,全球最強的大模型能力和參數(shù)再上一個臺階,意味著用于訓(xùn)練大模型的算力需求也將隨之提升,同時H200、B100等加速卡依次推向市場,或?qū)釉茝S商新一輪的算力軍備競賽。本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告9圖10:大模型訓(xùn)練和推理所需算力成本公式資料來源:民生證券研究院整理我們復(fù)盤了北美云廠商過去4年的Capex走勢,雖增速逐年放緩但整體保持逐年增長趨勢,但伴隨AI的強勢增長,結(jié)合已發(fā)布2024年第一季度財報四家公司的指引,2024年北美云商資本開支有望重回高速增長態(tài)勢。云廠商目前已成為英偉達下游加速卡最大的需求來源,由于全球經(jīng)濟疲軟,2023年云廠商資本開支增速有所放緩,前三季度Meta、谷歌、亞馬遜三家云廠商合計資本開支均為負增長,但受益于AI帶來加速卡的大量需求,2023年四季度開始云廠商快速加大資本開支,據(jù)Bloomberg,2023年四季度北美四大云廠商合計資本開支為483.67億美元,同比增長23.84%,在2023年前三個季度合計資本開支持續(xù)同比下滑的情況下大幅轉(zhuǎn)正。2024年第一季度北美四大云廠商合計資本開支為476億美元,同比增長38.98%,展望2024年,多家云廠商分別上修全年資本開支指引,云廠商Capex有望重回高增。2024年第一季度微軟、谷歌的Capex分別同比高增79%和91%,并指引24年后續(xù)季度Capex超過Q1,則我們預(yù)計微軟和谷歌24年Capex分別超過560億美元和480億美元,同比分別增長36%和49%;Meta2024年第一季度的Capex雖然同比略有下滑5%,但公司上調(diào)全年Capex至350-400億美元(前次指引為300-370億美元因此Meta24年Capex指引中值較23年增長33%;Amazon指引2024年第一季度為2024年公司資本開支最低的一個季度,后續(xù)幾個季度仍將保持增長。本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告10圖11:2020-2024年第一季度北美云商資本開支(含融資租賃億美元)mn微軟n6005004003002000目前英偉達的競爭對手主要有兩類,一類是芯片設(shè)計公司,包括AMD、Intel等,另一類是下游客戶,包括谷歌等北美云商,以及中國的互聯(lián)網(wǎng)公司。目前來看AMD等芯片設(shè)計公司的加速卡能力在算力、內(nèi)存、片間互聯(lián)能力等方面相較于云商和互聯(lián)網(wǎng)公司的產(chǎn)品具有較大的優(yōu)勢,是英偉達的主要競爭對手。同樣處于圖形GPU賽道的龍二AMD,是目前英偉達在加速卡環(huán)節(jié)最核心的競爭對手。2023年12月,AMD正式推出MI300X和MI300A兩款芯片,憑借更強的算力,更大的內(nèi)存容量,以及更優(yōu)惠的價格,預(yù)計獲得下游客戶青睞。算力方面,MI300X的XCD加速模塊采用5nm工藝,共計擁有1530億個晶體管,TF32浮點運算性能為653.7TFlops,F(xiàn)P16和BF16運算性能為1307.4TFlops,F(xiàn)P8和INT8運算性能為2614.9TFlops,均為英偉達H100的1.3倍。內(nèi)存方面,MI300X的內(nèi)存配置是英偉達H100的2.4倍,峰值存儲帶寬是其2.4倍,在運行Bloom時的推理速度是H100的1.6倍,運行Llama2時的推理速度是其1.4倍。功耗方面,MI300X的整體功耗控制在750W,相較英偉達H100更具優(yōu)勢。此外,在價格方面,LisaSu表示MI300系列芯片購買和運營成本將會低于英偉Intel的推理卡Goya在2019年發(fā)布,目前公司已經(jīng)完善了訓(xùn)練卡和推理卡的布局,并開始逐步形成銷售。2024年4月9日,英特爾推出最新AI芯片Gaudi3。與上一代產(chǎn)品相比,英特爾Gaudi3將帶來4倍的BF16AI計算能力提升,以及1.5倍的內(nèi)存帶寬提升。Gaudi3預(yù)計可大幅縮短70億和130億參數(shù)行業(yè)深度研究/電子本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告11Llama2模型,以及1750億參數(shù)GPT-3模型的訓(xùn)練時間。此外,在Llama7B、70B和Falcon180B大語言模型(LLM)的推理吞吐量和能效方面也展現(xiàn)了出色性能。Gaudi3提供開放的、基于社區(qū)的軟件和行業(yè)標準以太網(wǎng)網(wǎng)絡(luò),允許企業(yè)靈活地從單個節(jié)點擴展到擁有數(shù)千個節(jié)點的集群、超級集群和超大集群,支持大規(guī)模的推理、微調(diào)和訓(xùn)練。英特爾在Vision2024大會上宣布,公司的Gaudi3將于2024年第二季度面向OEM廠商出貨。國內(nèi)方面,昇騰加速卡處于領(lǐng)先水平。昇騰基于華為自主研發(fā)的達芬奇架構(gòu),支持全棧全場景的AI計算。910B對標英偉達A100,蓉和咨詢CEO吳梓豪預(yù)計2024年出貨量將超過40萬片。根據(jù)集成電路IC,910C芯片目前處于芯片級測試階段,預(yù)計在今年第四季度推出樣機,對標英偉達H200產(chǎn)品。華為也在開發(fā)者大會上發(fā)布了昇騰AI云服務(wù)。昇騰Al云服務(wù)單集群提供20OOPFlops算力,千卡訓(xùn)練30天長穩(wěn)率達到90%,為業(yè)界提供穩(wěn)定可靠的AI算力。表1:AMD和Intel最新一代加速卡的性能參數(shù)對比GB9 谷歌采取自研加速卡為主,同時采購部分英偉達加速卡的策略。谷歌研發(fā)TPU的時間始于2013年,相較于其他云廠商有近10年的時間優(yōu)勢。由于谷歌在加速卡領(lǐng)域布局早,產(chǎn)品完善度高,谷歌或為2024年北美四大云廠商中采購英偉達加速卡最少的廠商。2023年12月,谷歌推出面向云端的AI加速卡TPUv5p,相較于TPUV4,TPUv5p提供了二倍的浮點運算能力和三倍內(nèi)存帶寬提升;集群方面,TPUv5ppod由8960顆芯片組成,使用最高帶寬的芯片間連接(每芯片4,800Gbps)進行互連;從訓(xùn)練效果來看,相較于上一代產(chǎn)品,TPUv5p訓(xùn)練大型LLM的速度提升了2.8倍。Meta自2021年以來便將企業(yè)發(fā)展的重點放在元宇宙和AI領(lǐng)域,并且修改了公司名稱。2023年,Meta宣布自研MTIAv1芯片。2024年4月,Meta發(fā)布最新版本MTIAv2加速卡,新一代MTIA加速卡在算力、內(nèi)存容量、內(nèi)存帶寬等方面更加平衡,采用臺積電5nm工藝制造,Int8稀疏算力可以達到708TOPS,HBM內(nèi)存容量達到128GB。目前Meta仍主要采購英偉達等廠商的加速卡用于Llama等模型的訓(xùn)練,后續(xù)Meta有望采用自研加速卡對大語言模型進行訓(xùn)練。微軟Azure的企業(yè)數(shù)量已經(jīng)達到25萬家,是目前采購英偉達加速卡最為激進的云廠商,但考慮到采購英偉達加速卡的高昂成本,微軟也宣布了自研加速卡的行業(yè)深度研究/電子本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告12計劃。微軟的Maia100在2023年推出,專為Azure云服務(wù)設(shè)計。Maia100采用臺積電5nm工藝,單芯片擁有1050億個晶體管,F(xiàn)P8算力可以達到1600TFLOPS,同時支持FP4運算,算力達到3200TFLOPS,是目前廠商自研加速卡中算力最強大的產(chǎn)品。除了微軟自身以外,OpenAI也在嘗試采用微軟的加速卡,強大的下游客戶支持有望為微軟自研加速卡的進步帶來重要動力。亞馬遜同樣在自研加速卡方面加大投入,并且已經(jīng)完善了訓(xùn)練和推理的兩方面布局。2023年,亞馬遜推出了用于訓(xùn)練的Trainium2加速卡,以及用于推理的Graviton4加速卡,補全了亞馬遜在訓(xùn)練和推理領(lǐng)域加速卡的布局。亞馬遜的Trainium2加速卡Int8算力達到861TOPS,相較上一代產(chǎn)品性能提升4倍,在云廠商自研加速卡中表現(xiàn)優(yōu)秀。同時公司的產(chǎn)品可以在新一代EC2UltraClusters中擴展多達10萬顆Trainium2加速卡,與AmazonEFAPB級網(wǎng)絡(luò)互聯(lián),提供高達65EFlops算力,為云端大模型的訓(xùn)練和推理提供強大的算力保障。表2:英偉達客戶在加速卡領(lǐng)域的布局情況----5--5-4--------7--資料來源:各公司官網(wǎng),Semianalysis等,民注:未標注的數(shù)據(jù)為沒有在公開渠道披露的信息行業(yè)深度研究/電子本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告133軟硬件生態(tài)領(lǐng)先,加速卡龍頭地位穩(wěn)固英偉達具有在訓(xùn)練側(cè)和推理側(cè)完善的產(chǎn)品布局,并將加快芯片架構(gòu)更新速度,從兩年一更新加速至一年一更新。訓(xùn)練卡方面,自H系列以來,英偉達在100系列的基礎(chǔ)上,會進一步增加200系列產(chǎn)品,從而給客戶更多的產(chǎn)品選擇和更好的性價比,例如H200加速卡在HBM代際和容量方面相較于H100均有較大提升,但價格方面提升幅度相對較少。推理卡方面,2024年英偉達的產(chǎn)品出貨以L40和L40S為主,并且推出了L20、L2等產(chǎn)品供客戶選擇。針對中國市場,英偉達還推出了H20系列加速卡,用于中國市場的推廣,H20在算力方面相對較弱,但是其擁有強大的HBM內(nèi)存,互聯(lián)帶寬和軟件生態(tài),并且價格相較于H100有明顯優(yōu)惠,在下游客戶中仍然具有一定的接受程度。圖12:英偉達歷代訓(xùn)練卡和推理卡一覽資料來源:芯語,民生證券研究院整理AMD等廠商推出的MI300等強有力的產(chǎn)品,對英偉達的市場份額產(chǎn)生了一定的爭奪,但英偉達很快發(fā)布了H200、BlackwellGPU等系列的產(chǎn)品,與其競爭對手又拉開了一個身位。以AMD的MI300X為例,這顆加速卡在Int8、FP16、FP32算力方面均為H100的1.3倍,互聯(lián)帶寬方面達到了接近于NVLink4.0的896GB/s雙向互聯(lián),F(xiàn)P64算力和HBM容量更是達到了H100的2倍以上,同時MI300X在功耗方面相較于H100也更具優(yōu)勢,價格相較英偉達的H100也有較大的讓步。一系列的本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告14堆料和價格優(yōu)惠使得下游云廠商考慮轉(zhuǎn)用一部分AMD的產(chǎn)品,微軟更是在公開場合表達了對AMD加速卡的支持。英偉達推出的H200很大程度上是對競爭對手的回應(yīng),相較于H100,H200將此前的HBM3提升為HBM3E,同時將HBM容量從上一代的80GB提升至141GB。在價格方面,H200相較于H100的漲價幅度較小,體現(xiàn)出較高的性價比,該款加速卡現(xiàn)已向全球系統(tǒng)制造商和云服務(wù)提供商供貨,將推動AI技術(shù)的發(fā)展。英偉達的下一代BlackwellGPU系列產(chǎn)品,在算力、內(nèi)存和互聯(lián)帶寬的AI三要素領(lǐng)域與競爭對手的差距進一步拉開,鞏固了英偉達的領(lǐng)先地位。1)從算力來看,B系列加速卡使得英偉達與其競爭對手重新拉開了差距。仍然以AMD為例,AMD的MI300X共計擁有1530億個晶體管,F(xiàn)P8和INT8運算性能為2614.9TFlops。而此次BlackwellGPU推出了全新的FP4算力精度并達到了驚人的10PFlops,INT8算力相較H100提升了一倍以上。2)從存儲容量來看,BlackwellGPU單卡內(nèi)存容量高達192GB,和MI300X的內(nèi)存帶寬一致,并且升級到了HBM3E,在性價比上全面提升。3)從互聯(lián)帶寬來看,NVLink速率升級使得英偉達在片間互聯(lián)速率相較于其他廠商的競爭優(yōu)勢明顯提升。900GB/s的NVLink互聯(lián)帶寬是此前市場上的最高水平,但差距并未明顯拉開,AMD的InfinityFabric帶寬也可以達到896GB/s。而此次NVLink升級后,雙向互聯(lián)帶寬達到了1.8TB/s,相較市場上其他的廠商拉開了一倍以上的差距。表3:B100、B200、H100、H200、MI300X參數(shù)對比 FP8/INT8算力(TFlops) 資料來源:英偉達,AMD,民生證券研究院注:表格中均為未經(jīng)過結(jié)構(gòu)化稀疏的算力GB200DGXNVL72給英偉達算力性能帶來的提升主要來自性價比和片間互聯(lián)能力方面。從性價比來看,NVL72的集群規(guī)模增大,一方面節(jié)省了除算力芯片以外的系統(tǒng)成本,另一方通過提升產(chǎn)品性能,間接提升了下游客戶購買的算力性價比。從片間互聯(lián)能力來看,市場上主流的AI服務(wù)器仍然是傳統(tǒng)的8卡服務(wù)器架構(gòu),而伴隨Blackwell平臺推出的最多可以支持576卡互聯(lián),片間互聯(lián)數(shù)量和帶寬的提升極大改善了英偉達平臺的推理和訓(xùn)練性能。本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告15H100支持8卡900GB/s的NVLink帶寬無損互聯(lián),而GB200支持72卡1.8TB/s的NVLink帶寬無損互聯(lián)。在傳統(tǒng)H100的8卡服務(wù)器架構(gòu)中,單臺服務(wù)器內(nèi)的八張加速卡的最大互聯(lián)帶寬為900GB/s,如果一層交換機采用NVLink交換機,則最多可以支持256卡互聯(lián),但由于服務(wù)器連接到一層交換機的光模塊帶寬限制,256張加速卡之間的互聯(lián)帶寬實際會下降到100GB/s(按照一臺服務(wù)器插8張400G光模塊計算而在DGXNVL72架構(gòu)中,由于72張加速卡之間采用高速銅纜互聯(lián),不受光模塊帶寬限制,可以支持72卡的1.8TB/s的NVLink帶寬無損互聯(lián),并且未來最多可以支持8個Rack之間的576卡互聯(lián)。圖13:256卡的H100數(shù)據(jù)中心圖14:英偉達DGXNVL72參數(shù)資料來源:sysgen,民生證券研究院憑借架構(gòu)優(yōu)勢,GB200NVL72的推理性能達到H100的30倍,相較其他競爭對手領(lǐng)先優(yōu)勢則更為顯著。按照每10億個參數(shù)的大模型大約需要占用4GB的顯存容量計算,當前GPT4已經(jīng)達到萬億參數(shù)量級,運行時至少需要幾十張GPU同時進行推理工作,GB200NVL72在單個Rack內(nèi)部可以實現(xiàn)萬億參數(shù)量級的大模型推理工作,大大降低了大模型在通信環(huán)節(jié)的算力資源占用,使得GB200NVL72的推理性能達到H100的30倍。圖15:GB200的推理實時吞吐量達到H100的30倍圖16:GB200NVL72、72*H100、72*x86CPU之間的吞吐量對比資料來源:英偉達,民生證券研究院本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告16英偉達在數(shù)據(jù)中心市場已完成CPU+GPU+DPU三大類芯片的硬件布局,并計劃加快原計劃的每種芯片兩年左右的迭代周期,GPU加速到以一年為周期推出。圖17:英偉達GPU+DPU+CPU產(chǎn)品路線圖為搭配高性能GPU和滿足現(xiàn)代數(shù)據(jù)中心海量的計算需求,英偉達推出GraceCPU。GraceCPU是首款面向AI基礎(chǔ)設(shè)施和高性能計算的數(shù)據(jù)中心專屬CPU,由兩個CPU芯片通過NVLink-C2C技術(shù)互聯(lián)組成。單個socket內(nèi)含144個核心并提供1TB/s的內(nèi)存帶寬,性能是當今領(lǐng)先服務(wù)器芯片內(nèi)存帶寬和能效的兩倍。GraceCPU在數(shù)據(jù)中心的應(yīng)用主要有AI、數(shù)據(jù)分析、超大規(guī)模云應(yīng)用以及高性能計算(HPC)。本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告17表4:GraceCPU和HopperGPU參數(shù)對比浮點算力在GH200GraceHopper芯片中,GPU與CPU通過NVLink-C2C互聯(lián)連接,以優(yōu)秀的內(nèi)存和帶寬大幅提升加速計算能力。其中NVLink-C2C是專門用于超級芯片的高帶寬、低延遲互連,通過每秒900GB/s或更高的互連帶寬提供高達25倍的能效,比PCIeGen5的面積效率高90倍。NVLink-C2C的搭配使外部的應(yīng)用程序能超額訂閱GH200的GPU內(nèi)存,并在該帶寬下直接使用GraceCPU內(nèi)存。因此GH200可以更快部署在標準服務(wù)器中,并在加速計算和生成式AI方面展現(xiàn)技術(shù)優(yōu)勢。圖18:GraceHopper超級芯片結(jié)構(gòu)示意圖資料來源:英偉達官網(wǎng),民生證券研究院整理本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告18高性能計算和生成式AI時代的到來對服務(wù)商提出更高計算能力、效率和可拓展性的需求。因此,英偉達通過自身研發(fā)及收購Mellanox等公司實現(xiàn)交換機、網(wǎng)卡、DPU、互連等網(wǎng)絡(luò)產(chǎn)品的全覆蓋,為客戶提供基于InfiniBand和以太網(wǎng)網(wǎng)絡(luò)技術(shù)的端到端解決方案。2020年4月47日,英偉達宣布完成對Mellanox的收購。Mellanox是一家以色列面向服務(wù)器、存儲和超聚合基礎(chǔ)設(shè)施的端到端以太網(wǎng)和InfiniBand智能互聯(lián)解決方案與服務(wù)的領(lǐng)先供應(yīng)商。作為高性能互聯(lián)技術(shù)的早期創(chuàng)新者,Mellanox率先推出了InfiniBand互聯(lián)技術(shù),該技術(shù)與其高速以太網(wǎng)產(chǎn)品均應(yīng)用于全球過半的高速超級計算機和許多領(lǐng)先的超大規(guī)模數(shù)據(jù)中心。NVIDIA和Mellanox強強聯(lián)合,將能夠優(yōu)化整體計算、網(wǎng)絡(luò)和存儲堆棧的數(shù)據(jù)中心級工作負載,從而助力客戶實現(xiàn)更高的性能和利用率,并降低運營成本。目前英偉達在網(wǎng)絡(luò)的產(chǎn)品矩陣有交換機、網(wǎng)卡、DPU和互連等。交換機包括InfiniBand和以太網(wǎng)兩大類交換機,可無縫連接主機上的GPU設(shè)備,為企業(yè)級數(shù)據(jù)中心和高性能計算提供卓越的網(wǎng)絡(luò)能力。Connect-X系列智能網(wǎng)卡可為云數(shù)據(jù)中心、電信運營商等工作負載提供硬件加速,并降低能耗成本。BlueField-3DPU為企業(yè)在加速計算和AI應(yīng)用提供安全的硬件加速設(shè)施。直連式銅纜和光互連可適應(yīng)各種數(shù)據(jù)中心的連接速度和距離,通過提供高帶寬、低延遲的連接提高計算網(wǎng)絡(luò)圖19:英偉達網(wǎng)絡(luò)產(chǎn)品線GPU的軟件生態(tài)主要包括一些開源或?qū)S械钠脚_和工具,它們允許開發(fā)者利用GPU進行高效的并行計算。在GPU市場中,成熟的軟件生態(tài)已成為各廠商之間難以逾越的護城河。相較于不斷迭代的微架構(gòu)技術(shù),生態(tài)所帶來的用戶粘性在長本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告19期競爭中顯得更為關(guān)鍵。目前英偉達的CUDA、AMD的ROCm、微軟的DirectX以及OpenCL、OpenGL、Vulkan等已成為主流的開發(fā)平臺,為開發(fā)者提供高效、便捷的GPU計算解決方案,隨著技術(shù)的不斷發(fā)展和應(yīng)用場景的不斷拓寬,這些平臺將繼續(xù)發(fā)揮重CUDA是英偉達于2006年推出的一種異構(gòu)計算平臺,開發(fā)人員能夠通過CUDA對GPU進行通用計算(GPGPU)的部署。在CUDA編程模型中,Host代表主機部分,主要由CPU和主機內(nèi)存組成;而Device代表設(shè)備部分,主要由GPU和顯存構(gòu)成。Host與Device之間通過PCIExpress總線進行高效的數(shù)據(jù)傳輸和通信。這種架構(gòu)使得CUDA能夠充分利用GPU的并行計算能力,實現(xiàn)高性能的并行計算任務(wù)。圖20:CUDA生態(tài)示意圖資料來源:搜狐,民生證券研究院CUDA在Host運行的函數(shù)庫包括了Libraries、Runtime和Driver三大部分。其中,Libraries通常是一些成熟的高效函數(shù)庫,RuntimeAPI則簡化了應(yīng)用開發(fā)過程,提供了便捷的接口和組件,讓開發(fā)者能夠輕松地調(diào)用并自動管理GPU資源。應(yīng)用程序可以通過調(diào)用CUDALibraries或者CUDARuntimeAPI來實現(xiàn)所需功能的控制GPU資源的能力。當涉及到Device端的計算任務(wù)時,CUDA使用內(nèi)核函數(shù)進行并行計算和數(shù)據(jù)處理,從而充分發(fā)揮GPU的性能優(yōu)勢。CUDA生態(tài)支持多種編程語言。目前的CUDA12.0支持C、C++、Fortran、Python等多種編程語言,還支持眾多第三方工具鏈。此外,英偉達在CUDA平臺上提供了CUDA-X,CUDA-X是一個功能強大且靈活的軟件加速庫集合,開發(fā)人員可以通過CUDA-X快速將這些庫部署到多種設(shè)備內(nèi)的NVIDIAGPU上,包括臺式機、工作站、服務(wù)器、云計算和物聯(lián)網(wǎng)(IoT)設(shè)備。CUDA平臺對開發(fā)者友好程度高,其提供的一系列容器部署流程簡化以及集群環(huán)境擴展應(yīng)用程序的工具使得CUDA技術(shù)能夠適用于更廣泛的領(lǐng)域。本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告20圖21:CUDA-X平臺憑借先發(fā)優(yōu)勢和長期技術(shù)積累,CUDA生態(tài)圈已經(jīng)具有更高的成熟度和穩(wěn)定性。這使得開發(fā)者能夠借助已有的資源和文檔進行開發(fā)和部署,減少學習曲線和風險,并為英偉達GPU的開發(fā)、優(yōu)化和部署多種行業(yè)應(yīng)用提供了獨特的先發(fā)競爭優(yōu)勢。全球范圍內(nèi),截至2020年,CUDA開發(fā)者數(shù)量達到了200萬,并于2023年增長到400萬,其中包括Adobe等大型企業(yè)客戶。較高的需求粘性也使得CUDA的使用者更傾向于使用熟悉的、更兼容的軟件,因此更多開發(fā)者選擇或持續(xù)使用CUDA。本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告214其他業(yè)務(wù)板塊穩(wěn)健增長英偉達的游戲顯卡產(chǎn)品主要有GeForceRTX30系列和GeForceRTX40系GEFORCERTX40系列GPU由更高效的NVIDIAAdaLovelace架構(gòu)提供動力支持。公司主推的GeForceRTX4090D擁有24GB的G6X顯存,搭配的新型SM多單元流處理器可將性能功耗比最高提升至2倍。第四代TensorCore與DLSS3結(jié)合將圖像渲染性能提升至4倍,第三代RTCore將光線追蹤性能提升至2倍。綜上,該顯卡在性能、效率和AI驅(qū)動的圖形效果方面均比上代實現(xiàn)大幅增長。GEFORCERTX30系列采用第2代NVIDIAAmpere架構(gòu),配置有第2代RTCore、第3代TensorCore和SM多單元流處理器,為游戲用戶帶來逼真的光線追蹤效果和先進的AI性能,NVIDIAReflex的搭配降低系統(tǒng)延遲,將帶來超凡的游戲體驗。圖22:GEFORCERTX40系列的規(guī)格圖23:GEFORCERTX30系列的規(guī)格FY1Q25英偉達游戲業(yè)務(wù)實現(xiàn)營收26.47億美元,同比增長18.17%,環(huán)比下降7.61%。在2024年第一季度,英偉達推出適用于Windows的全新AI性能優(yōu)化和集成,可在AIPC和工作上提供最佳性能。公司還宣布“星球大戰(zhàn):亡命之徒(StarWarsOutlaws)”和“黑神話:悟空(BlackMythWukong)”等采用RTX技術(shù)的重磅游戲。行業(yè)深度研究/電子本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告22圖24:英偉達游戲業(yè)務(wù)收入、同比增速及占比(億美元,%)英偉達通過RTX服務(wù)器、數(shù)據(jù)中心工作站和虛擬GPU等系列產(chǎn)品將AI與專業(yè)可視化技術(shù)結(jié)合,為客戶提供涵蓋專業(yè)圖形渲染、云端XR應(yīng)用、AI數(shù)據(jù)科學與大數(shù)據(jù)研究等專業(yè)視覺解決方案,并可應(yīng)用在建筑、醫(yī)療、影視媒體等多種應(yīng)用場景。公司新推出的RTX2000AdaGPU搭配第三代RTCore和第四代TensorCore,在提升光線追蹤性能的同時為AI加速工具的導(dǎo)入提供接口。16GB現(xiàn)存可為關(guān)鍵任務(wù)提供更高的計算精度與可靠性。該芯片可助力客戶在建筑設(shè)計、工業(yè)設(shè)計、內(nèi)容設(shè)計、醫(yī)療數(shù)據(jù)處理等場景提高效率,提升用戶體驗。圖25:英偉達加速視覺計算平臺圖26:RTX2000AdaGPU產(chǎn)品的規(guī)格FY1Q25英偉達專業(yè)可視化業(yè)務(wù)實現(xiàn)營收4.27億美元,同比增長44.75%,環(huán)比下降7.61%,同比回歸正增長態(tài)勢。在2024年第一季度,公司推出NVIDIARTX500和1000GPU加強AI應(yīng)用,并通過NVIDIAOmniverseCloudAPI來支持工業(yè)數(shù)字孿生軟件工具,如擴大與西門子的合作伙伴關(guān)系,以及Apple行業(yè)深度研究/電子本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告23VisionPro的新框架。圖27:英偉達專業(yè)可視化業(yè)務(wù)收入、同比增速及占比(億美元,%)4180%130%80%30%-20%-70%英偉達可提供完整的自動駕駛汽車硬件,軟件和基礎(chǔ)設(shè)施。其中自動駕駛DRIVE平臺提供從汽車系統(tǒng)到數(shù)據(jù)中心的端到端解決方案,其架構(gòu)包含傳感器、DRIVEAGX計算平臺、以及實現(xiàn)強大的自動駕駛和智能駕艙功能所需的軟件工具。在數(shù)據(jù)中心層面,英偉達提供必要的硬件和軟件支持包括用于感知的深度神經(jīng)網(wǎng)絡(luò)的NVIDIADGX,以及用于生成數(shù)據(jù)集和驗證自動駕駛堆棧的DRIVESim。圖28:英偉達端到端自動駕駛汽車開發(fā)平臺在DRIVE平臺中,NVIDIADRIVEOrin系統(tǒng)級芯片(SoC)起到核心計算行業(yè)深度研究/電子本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告24模擬作用。該芯片可提供每秒254萬億次的運算性能,并能夠為自動駕駛功能、置信度視圖、數(shù)字儀表盤以及AI座艙提供強力支持。借助Orin芯片的構(gòu)建和擴展功能,開發(fā)者利用一次投資便可從L2+級系統(tǒng)順利升級至L5級全自動駕駛汽車DRIVEThor作為新一代車載計算平臺,是公司在智能駕駛領(lǐng)域的主推產(chǎn)品。該平臺在單個安全可靠的系統(tǒng)中整合高級駕駛員輔助功能和車載信息娛樂功能。借助全新的CPU和GPU技術(shù),計算系統(tǒng)可在降低系統(tǒng)成本的同時提供高達2000萬億次的浮點運算性能。Thor平臺計劃于2025年量產(chǎn),會為公司帶來汽車業(yè)務(wù)新的業(yè)績增長點。圖29:NVIDIADRIVEOrin系統(tǒng)級芯片圖30:NVIDIADRIVEThor平臺FY1Q25英偉達汽車業(yè)務(wù)實現(xiàn)營收3.29億美元,環(huán)比增長17.08%,同比增長11.15%,增長勢頭明顯。在2024年第一季度,公司與比亞迪、小鵬汽車、廣汽等車企合作,為全新的移動出行提供最佳解決方案。美國和中國的電動汽車制造商也在研究將Orin芯片應(yīng)用于歐洲市場的車型。圖31:英偉達汽車業(yè)務(wù)收入、同比增速及占比(億美元,%) 0行業(yè)深度研究/電子本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告255投資建議AI浪潮不僅沒有放緩,反而在持續(xù)加速。生成式AI出現(xiàn)后,人工智能獲得快速發(fā)展,以ChatGPT為分水嶺,此后AI大模型的成長節(jié)奏顯著提速。2023年的GPT4、LLaMA、Gemini等重要模型出現(xiàn),大模型的能力已經(jīng)有了質(zhì)變,此前市場所擔憂的是2024年以后,算力的需求是否會伴隨著各家廠商大模型的逐步成型而放緩,然而我們從云廠商的資本開支來看,下游客戶對算力的需求不僅沒有放緩,反而在持續(xù)加速。我們認為這背后有兩大原因:1)首先大模型產(chǎn)業(yè)傾向于成為“贏者通吃”的行業(yè),持續(xù)擴大的模型參數(shù)和訓(xùn)練樣本量使得云和大模型廠商不得不持續(xù)加大算力投入;2)其次展望未來,目前算力需求的核心下游仍然是訓(xùn)練,伴隨著后續(xù)AI應(yīng)用的落地,推理側(cè)的算力需求有望帶來加速卡更大的市場空間。我們認為,算力的強勁需求或許并不會在大模型訓(xùn)練告一段落以后就開始放緩,反而可能伴隨大模型發(fā)展加速,以及應(yīng)用側(cè)的落地而進一步提速。需要重視英偉達在AI算力領(lǐng)域的話語權(quán)提升。根據(jù)半導(dǎo)體研究機構(gòu)TechInsights數(shù)據(jù),2023年全球數(shù)據(jù)中心GPU總出貨量達到了385萬顆,英偉達的市場份額為98%,并通過CUDA生態(tài)構(gòu)建了強大的軟件生態(tài)壁壘。盡管在2023年以來,AMD、Intel等芯片設(shè)計公司,以及谷歌、微軟、Meta、亞馬遜等英偉達的下游客戶也在增強AI加速卡領(lǐng)域的布局,但我們看到的現(xiàn)象是,英偉達的產(chǎn)品節(jié)奏迭代速度在加快,一方面通過H200、B200等系列的加速卡給客戶提供了更多更高性價比的選擇,拉開了和競爭對手的性能差距,另一方面通過GB200NVL36/72的Rack架構(gòu),從兩個維度提升了英偉達的競爭力:1)GB200NVL72的推理性能達到H100的30倍,大幅提升了英偉達的產(chǎn)品在推理領(lǐng)域的競爭優(yōu)勢,有望使得英偉達在推理領(lǐng)域的份額持續(xù)提升;2)GB200Rack形態(tài)的服務(wù)器增強了英偉達在服務(wù)器產(chǎn)業(yè)鏈的設(shè)計話語權(quán),在硬件領(lǐng)域進一步提升了公司的壁壘。我們看到,與上一代的GH200不同,GB200從推出以后就受到了下游客戶的推崇,各大云廠商均下單了大量服務(wù)器,反映出英偉達在該產(chǎn)品定義中的前瞻性。伴隨著AI下游需求的持續(xù)增長,以及PC等市場逐步復(fù)蘇,公司業(yè)績有望持續(xù)增長。數(shù)據(jù)中心業(yè)務(wù)來看,F(xiàn)Y1Q24英偉達實現(xiàn)營收225.63億元,同比增長426.68%,從當前下游客戶的需求來看,后續(xù)該板塊業(yè)務(wù)有望維持高速增長。其他業(yè)務(wù)來看,游戲業(yè)務(wù)FY1Q24營收26.47億美元,同比增長18.17%;專業(yè)可視化業(yè)務(wù)FY1Q24營收4.27億美元,同比增長44.75%;汽車和機器人業(yè)務(wù)FY1Q24營收3.29億美元,同比增長11.15%,均有不同程度的同比增長。公司下游PC等市場有望持續(xù)復(fù)蘇,據(jù)IDC預(yù)計,2024年中國PC出貨量同比增長3.8%,重回增長節(jié)奏。英偉達在數(shù)據(jù)中心領(lǐng)域競爭優(yōu)勢明顯,充分受益于AI浪潮,其他業(yè)務(wù)板塊業(yè)績穩(wěn)步增長。我們看好英偉達在AI領(lǐng)域的前瞻布局和市場地位,建議積極關(guān)注。行業(yè)深度研究/電子本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告26表5:行業(yè)重點關(guān)注個股 行業(yè)深度研究/電子本公司具備證券投資咨詢業(yè)務(wù)資格,請務(wù)必閱讀最后一頁免責聲明證券研究報告276風險提示1)AI行業(yè)需求波動的風險。目前英偉達主要的收入來源來自AI帶來的數(shù)據(jù)中心業(yè)務(wù)收入,當前云廠商仍處于AI快速投入的階段,下游需求十分旺盛。如果生成式人工智能大模型的參數(shù)量增速開始放緩,或云廠商大模型的訓(xùn)練告一段落,則可能放緩加速卡的下游需求。目前來看,AI應(yīng)用仍處于早期階段,推理側(cè)需求量較難判斷,如果AI訓(xùn)練對算力的需求放緩,而推理側(cè)需求沒有及時起量,則加速卡下游需求可能出現(xiàn)一段時間的空窗期,從而對英偉達業(yè)績產(chǎn)生不利影響。2)行業(yè)競爭格局變化的風險。當前英偉達在AI加速卡領(lǐng)域處于顯著領(lǐng)先的地位,擁有絕大多數(shù)的市占率,而目前來看,芯片設(shè)計公司如AMD、Intel等紛紛加強在加速卡領(lǐng)域的投入,英偉達的下游云廠商客戶也在持續(xù)研發(fā)AI芯片,英偉達在加速卡領(lǐng)域的競爭格局從此前的一家獨大逐步轉(zhuǎn)變?yōu)槎鄰姼偁?,可能對公司的市占率產(chǎn)生一定的不利影響。另一方面,英偉達在AI訓(xùn)練領(lǐng)域的話語權(quán)強大,而進入到AI推理領(lǐng)域,公司

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論