GPU行業(yè)深度報(bào)告:AI與自動(dòng)駕駛打造GPU強(qiáng)力增長引擎_第1頁
GPU行業(yè)深度報(bào)告:AI與自動(dòng)駕駛打造GPU強(qiáng)力增長引擎_第2頁
GPU行業(yè)深度報(bào)告:AI與自動(dòng)駕駛打造GPU強(qiáng)力增長引擎_第3頁
GPU行業(yè)深度報(bào)告:AI與自動(dòng)駕駛打造GPU強(qiáng)力增長引擎_第4頁
GPU行業(yè)深度報(bào)告:AI與自動(dòng)駕駛打造GPU強(qiáng)力增長引擎_第5頁
已閱讀5頁,還剩30頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

正文目錄TOC\o"1-2"\h\z\u一、 數(shù)字經(jīng)濟(jì)、AI、智能駕駛視角下看算力需求 5演變趨勢:從通用計(jì)算到智能計(jì)算,從分散獨(dú)立到云網(wǎng)邊協(xié)同 5戰(zhàn)略地位:算力屬于基礎(chǔ)設(shè)施建設(shè),是智能時(shí)代發(fā)展的物理承載 6應(yīng)用驅(qū)動(dòng):數(shù)字經(jīng)濟(jì)搭建整體框架,AI大模型、智能駕駛持續(xù)拉升 7優(yōu)化路徑:提升芯片性能及創(chuàng)新存算架構(gòu)是研究主流 10二、 算力需求視角下看GPU發(fā)展的必然趨勢 12性能:GPU技術(shù)發(fā)展迅速,高并發(fā)計(jì)算能力契合算力需求 12靈活性:GPU可編程優(yōu)勢明顯,通用靈活性適配AI應(yīng)用端拓展 15三、 GPU市場:供給推動(dòng)市場,技術(shù)及產(chǎn)能是核心驅(qū)動(dòng)力 18需求端:移動(dòng)端兜底,自動(dòng)駕駛及數(shù)據(jù)中心建設(shè)貢獻(xiàn)增量 18供給端:英偉達(dá)獨(dú)占鰲頭,國內(nèi)技術(shù)追趕空間廣闊 24GPU產(chǎn)業(yè)鏈概況及國內(nèi)重點(diǎn)公司介紹 31風(fēng)險(xiǎn)提示 35圖表目錄圖1:算力建設(shè)已成為經(jīng)濟(jì)發(fā)展的重要競爭策略 5圖2:各類高性能計(jì)算、智能計(jì)算可以通過云邊端架構(gòu)形成算力網(wǎng)絡(luò) 6圖3:人工智能三要素為算法、算力、數(shù)據(jù) 6圖4:算力發(fā)展的核心要素、產(chǎn)品及應(yīng)用 6圖5:全球數(shù)據(jù)產(chǎn)生量高速增長 7圖6:全球算力規(guī)模將高速增長 7圖7:2017-2023年中國數(shù)字經(jīng)濟(jì)規(guī)模變化 8圖8:我國在用數(shù)據(jù)中心機(jī)架規(guī)模保持增長 8圖9:AI大模型尺寸快速增長 9圖10:大模型時(shí)代的GPU算力快速增長 9圖11:智能駕駛車輛的滲透率 10圖12:L5智能駕駛算力需求超1000TOPS 10圖13:我國智能駕駛市場算力需求測算 10圖14:算力性能主要受處理器性能及數(shù)據(jù)傳輸制約 11圖15:2016-2018年,CPU性能每年提升僅3.5 12圖16:CPU架構(gòu) 13圖17:GPU架構(gòu)擁有更多的邏輯核心 13圖18:第一款以GPU命名的芯片GEFORCE256 14圖19:GPU經(jīng)典工作流程 14圖20:V100混合精度運(yùn)算速度提高了9倍 15圖21:英偉達(dá)第四代FP8TENSORCORE 15圖22:常用的主流計(jì)算平臺(tái)靈活性及性能的比較 16圖23:芯片研發(fā)成本 17圖24:不同部署位置的AI芯片要求 17圖25:英偉達(dá)CUDA-XAI生態(tài)支持多種框架、云計(jì)算服務(wù)、部署 18圖26:GPU市場下游需求 19圖27:PC市場處于下行周期(含平板) 19圖28:PC端桌面顯卡出銷量及同比 19圖29:全球移動(dòng)游戲市場占比增加(十億美元) 20圖30:基于終端感知的混合AI 21圖31:部分AI模型可從云端分流到終端 21圖32:車載芯片的演變 21圖33:中央計(jì)算平臺(tái)須采用高算力芯片以進(jìn)行整車功能、算力/存儲(chǔ)等資源部署 22圖34:2025年芯片平均算力將超2000TOPS 23圖35:2025年全球高性能計(jì)算市場規(guī)模達(dá)199億美元 23圖36:TOP500超算中心56算力由GPU提供 23圖37:AI服務(wù)器對(duì)于GPU需求更高 24圖38:2025年全球AI服務(wù)器市場規(guī)模激增至1350億美元 24圖39:全球GPU市場格局變化 25圖40:國內(nèi)部分GPU廠商市場布局 25圖41:英偉達(dá)游戲產(chǎn)品矩陣 25圖42:英偉達(dá)游戲業(yè)務(wù)營收增長 26圖43:2023Q2全球PC顯卡市場份額 26圖44:英偉達(dá)數(shù)據(jù)中心產(chǎn)品矩陣 27圖45:英偉達(dá)第四代NVLINK能為H100提升1.5倍帶寬 28圖46:英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)營收增長 29圖47:高性能計(jì)算芯片下游需求 29圖48:英偉達(dá)自動(dòng)駕駛產(chǎn)品矩陣 30圖49:英偉達(dá)THOR芯片計(jì)算性能提升 30圖50:英偉達(dá)智能駕駛業(yè)務(wù)營收增長 31圖51:2023年度H1中國市場乘用車自動(dòng)駕駛計(jì)算方案市場份額 31圖52:GPU產(chǎn)業(yè)中下游分別為芯片設(shè)計(jì)、制造、封裝與測試 32圖53:公司營收及同比增速 33圖54:公司歸母凈利潤及同比增速 33圖55:公司營收及同比增速 34圖56:公司歸母凈利潤及同比增速 34表格1:我國出臺(tái)多項(xiàng)算力建設(shè)政策支持?jǐn)?shù)字經(jīng)濟(jì)發(fā)展 8表格2:不同語言模型的算力需求及參數(shù)數(shù)量 9表格3:英偉達(dá)GPU架構(gòu)調(diào)整演進(jìn)方向 14表格4:GPU、DSA、ASIC比較(以CPU為基準(zhǔn)) 17表格5:SOC推動(dòng)高性能GPU移動(dòng)端應(yīng)用 20表格6:目前主流的車規(guī)級(jí)芯片架構(gòu) 23表格7:游戲產(chǎn)品增強(qiáng)技術(shù) 25表格8:國內(nèi)廠商桌面級(jí)顯卡產(chǎn)品參數(shù)對(duì)比 26表格9:英偉達(dá)H100產(chǎn)品技術(shù) 27表格10:國內(nèi)廠商高性能計(jì)算GPU產(chǎn)品參數(shù)對(duì)比 28表格11:國內(nèi)部分車型搭載芯片型號(hào) 30表格12:國內(nèi)重點(diǎn)GPU公司及技術(shù) 32表格13:景嘉微定向增發(fā)擬建設(shè)項(xiàng)目 33表格14:相關(guān)公司可比估值 34一、數(shù)字經(jīng)濟(jì)、AI、智能駕駛視角下看算力需求演變趨勢:從通用計(jì)算到智能計(jì)算,從分散獨(dú)立到云網(wǎng)邊協(xié)同1964年戈登CPU的競爭焦點(diǎn)。圖1:算力建設(shè)已成為經(jīng)濟(jì)發(fā)展的重要競爭策略資料來源:數(shù)字電子技術(shù),資源服務(wù)可以分為云計(jì)算、混合計(jì)算及算力網(wǎng)絡(luò)??茖W(xué)、工程計(jì)算。這類計(jì)算主要利用超級(jí)計(jì)算機(jī)實(shí)現(xiàn)并行計(jì)算,是一種算法優(yōu)化和支持人工智能、智慧城市等新興領(lǐng)域。AI領(lǐng)域模型訓(xùn)練WorldWide萬維網(wǎng)任務(wù)的分解及高效調(diào)度。圖2:各類高性能計(jì)算、智能計(jì)算可以通過云邊端架構(gòu)形成算力網(wǎng)絡(luò)資料來源:華為官網(wǎng),金融界,戰(zhàn)略地位:算力屬于基礎(chǔ)設(shè)施建設(shè),是智能時(shí)代發(fā)展的物理承載整體架構(gòu)層面,算法、算力及數(shù)據(jù)是實(shí)現(xiàn)人工智能的三要素,其中算力是構(gòu)筑智能時(shí)代的物理基礎(chǔ)。人工智能離不開算力、算法及數(shù)據(jù),其發(fā)展需要在建立在龐大的數(shù)據(jù)集、優(yōu)秀的深度學(xué)習(xí)算法及強(qiáng)大的計(jì)算能力基礎(chǔ)之上,而算力作為底層基礎(chǔ)設(shè)施,是開啟智能時(shí)代的關(guān)鍵因素,其核心于智能芯片的技術(shù)進(jìn)步。圖3:人工智能三要素為算法、算力、數(shù)據(jù)圖4:算力發(fā)展的核心要素、產(chǎn)品及應(yīng)用資料來源:中國科普網(wǎng), 資料來源:中國電子商會(huì),算力荒”IDC顯示,2018201933ZB、41ZB2020年全球數(shù)據(jù)60ZB46%求宏觀算力快速發(fā)展,NTCysd2021-202840%的速度增長,20287510EFlops。圖5:全球數(shù)據(jù)產(chǎn)生量高速增長 圖6:全球算力規(guī)模將高速增長0

全球數(shù)據(jù)量變化趨勢(ZB,左軸同比增長(,右軸)2015201620172018201920202025E

100%80%60%40%20%0%

0

全球算力規(guī)模(Eflops,左軸同比增速(,右軸)2023E2024E2025E2026E2027E2028E

60%50%40%30%20%10%0%資料來源:IDC, 資料來源:NTCysd,應(yīng)用驅(qū)動(dòng):數(shù)字經(jīng)濟(jì)搭建整體框架,AIAI率先落地,成為拉動(dòng)算力需求的核心驅(qū)動(dòng)力。全球正加快數(shù)字經(jīng)濟(jì)建設(shè),算力發(fā)展成為主要戰(zhàn)略競爭點(diǎn)之一。目前,全球正處于經(jīng)濟(jì)數(shù)字化轉(zhuǎn)型階段GDP的核心戰(zhàn)略,具體數(shù)據(jù)來看,202047個(gè)國家數(shù)字經(jīng)濟(jì)增32.6GDP43.7%3%2022國數(shù)字經(jīng)濟(jì)規(guī)模已達(dá)50.2億元,數(shù)字基礎(chǔ)設(shè)施規(guī)模能級(jí)大幅提升,在用數(shù)據(jù)中心算例總規(guī)模超180EFlops,位居世界第二。圖7:2017-2023年中國數(shù)字經(jīng)濟(jì)規(guī)模變化 圖8:我國在用數(shù)據(jù)中心機(jī)架規(guī)模保持增長市場規(guī)模(萬億元,左軸同比增長(,右軸)60504030201002017201820192020202120222023E

20%16%12%8%4%0%

0

數(shù)量(萬架,左軸)同比增長(,右軸201720182019202020212022

50%40%30%20%10%0%資料來源:中國信通院,國家網(wǎng)信辦《數(shù)字中國發(fā)展報(bào)告(2022年)》,中商產(chǎn)業(yè)研究院,

資料來源:工信部,表格1:我國出臺(tái)多項(xiàng)算力建設(shè)政策支持?jǐn)?shù)字經(jīng)濟(jì)發(fā)展時(shí)間 文件 算力建設(shè)內(nèi)容時(shí)間 文件 算力建設(shè)內(nèi)容2021.05

新體系算力樞紐實(shí)施方案》

量供給、數(shù)據(jù)高效率流通的大數(shù)據(jù)發(fā)展高地。2021.072021.112021.122021.12

劃(2021-2023)》規(guī)劃》劃》劃》

3碳、算力規(guī)模與數(shù)字經(jīng)濟(jì)增長相適應(yīng)的新型數(shù)據(jù)中心發(fā)展格局。2025(每秒百億億次浮點(diǎn)運(yùn)算)300,27。推進(jìn)云網(wǎng)協(xié)同和算網(wǎng)融合發(fā)展。加快構(gòu)建算力、算法、數(shù)據(jù)、應(yīng)用資源協(xié)同的全國一體化大數(shù)據(jù)中心體系。3。系統(tǒng)優(yōu)化算力基礎(chǔ)設(shè)施布局,促進(jìn)東西部算力高效2023.02 《數(shù)字中國建設(shè)整體布局規(guī)劃》資料來源:國務(wù)院,工信部,

能計(jì)算中心、邊緣數(shù)據(jù)中心等合理梯次布局。AI大模型的快速擴(kuò)張是算力需求的關(guān)鍵驅(qū)動(dòng)力。AIAI膨脹,GPUOpenAI175B相比Small(Flops)1400倍;而據(jù)Semianalysis最1201.8萬億參175B10倍。圖9:AI大模型尺寸快速增長 圖10:大模型時(shí)代的GPU算力快速增長 資料來源:《ASurveyofLarge-ScaleDeepLearningServingSystemOptimization:ChallengesandOpportunities》,

資料來源:《ASurveyofLarge-ScaleDeepLearningServingSystemOptimization:ChallengesandOpportunities》,表格2:不同語言模型的算力需求及參數(shù)數(shù)量模型 總計(jì)算力(模型 總計(jì)算力(PFlops- 總計(jì)算力(Flops) 參數(shù)量(百萬)day)Small2.08E+001.80E+2060Base7.64E+006.60E+20220T5 Large2.67E+012.31E+217703B1.04E+029.00E+21300011B3.82E+023.30E+2211000Base1.89E+001.64E+20109Large6.16E+005.33E+20355Base1.74E+011.50E+21125Large4.93E+014.26E+21355Small2.60E+002.25E+20125Medium7.42E+006.41E+20356GPT-3 Large1.58E+011.37E+21760XL2.75E+012.28E+211320175B3.64E+033.14E+23174600資料來源:OpenAI《LanguageModelsareFew-ShotLearners》,汽車智能化功能升級(jí),智能駕駛將貢獻(xiàn)算力需求的全新增量。L3L5級(jí)14%、1%203040%、12%。而L330-60TOPS、100TOPS,未來隨著智能駕駛汽車滲透率的提升,將會(huì)持續(xù)帶動(dòng)智能駕駛市場整體算202520301.9萬、19TOPS,2021-2025CAGR。圖11:智能駕駛車輛的滲透率 圖12:L5智能駕駛算力需求超1000TOPS

L3L4/L5L3L4/L5

0

400040003201000100L1 L2 L3 L4 L5資料來源:華經(jīng)產(chǎn)業(yè)研究院, 資料來源:億歐智庫,地平線官網(wǎng),圖13:我國智能駕駛市場算力需求測算0

算力需求(萬TOPS) 同比增長()2020 2021 2022E 2023E 2024E 2025E

350%300%250%200%150%100%50%0%資料來源:中汽協(xié),華經(jīng)產(chǎn)業(yè)研究院,億歐智庫,優(yōu)化路徑:提升芯片性能及創(chuàng)新存算架構(gòu)是研究主流系統(tǒng)算力主要受處理器性能與數(shù)據(jù)傳輸能力影響,當(dāng)數(shù)據(jù)處理能力與傳輸能力不匹配時(shí),計(jì)算能力由兩者中較低者決定。處理性能主要與指令復(fù)雜程度、頻率、并行度有關(guān),一般來說,指令越復(fù)雜、計(jì)算頻率越高、并行程度越大,處理器性能就越好;而數(shù)據(jù)傳輸?shù)哪芰εc處理器內(nèi)部存算架構(gòu)有關(guān),在計(jì)算機(jī)體系里,根據(jù)訪問延遲及容量大小將存儲(chǔ)結(jié)構(gòu)分為寄存器、緩存、內(nèi)存、外存與遠(yuǎn)程存儲(chǔ),而這種存算分離的架構(gòu)形式,通常使得數(shù)據(jù)傳輸成為限制系統(tǒng)算力的因素。圖14:算力性能主要受處理器性能及數(shù)據(jù)傳輸制約資料來源:SDNLAB,指令的復(fù)雜程度。指令系統(tǒng)是連接計(jì)算機(jī)軟件和硬件的橋梁,一般來說,指令的復(fù)CPUGPUFPGADSACPU硬件加速平臺(tái),用于執(zhí)行各類復(fù)雜指令。CPU數(shù)據(jù)傳輸能力。數(shù)據(jù)傳輸能力并不直接影響處理器性能,但復(fù)雜的存儲(chǔ)分層結(jié)構(gòu)會(huì)據(jù)傳輸能力的優(yōu)化方向主要包括近存計(jì)算及存算一體化架構(gòu)。二、算力需求視角下看GPU發(fā)展的必然趨勢性能:GPU橫向比較,GPUCPU而言,更符合深度學(xué)習(xí)算法的高度并行計(jì)算需求。一方面,CPU性能提升已達(dá)到瓶頸,與高速增長的算力需求脫節(jié)。CPU作為第一代高效計(jì)算平臺(tái),目前無論從不管是從架構(gòu)/微架構(gòu)設(shè)計(jì)、工藝、多核并行等各種角度出發(fā),其性能都難以提升,2016年之后,CPU性能每年提升僅3.5%。隨著數(shù)字經(jīng)濟(jì)、AI大模型、智能駕駛等算力需求的推動(dòng),CPU性能已無法滿足上層軟件算力需求。15:2016-2018CPU3.5資料來源:computerarchitecture:Aquantitativeapproach,CPUSIMD架CPUMIMD可以用來處理復(fù)雜的控制邏輯、預(yù)測分支、亂序執(zhí)行、多級(jí)流水等,而GPU為數(shù)據(jù)級(jí)并行的SIMD架構(gòu),其核心多但性能弱,用于優(yōu)化具有簡單控制邏輯的數(shù)據(jù)并行任務(wù)。GPUGPU,不僅能夠更快的完成數(shù)據(jù)的讀取與寫入,還能實(shí)行多條指令并行計(jì)算。圖16:CPU架構(gòu) 圖17:GPU架構(gòu)擁有更多的邏輯核心資料來源:Imagination官網(wǎng), 資料來源:Imagination官網(wǎng),縱向比較,GPU架構(gòu)技術(shù)仍在演進(jìn),其高性能計(jì)算與智能計(jì)算能力不斷優(yōu)化GPUProcessingUnit),1999GeForce256圖形處理芯片時(shí)首GPU的概念,GeForce256T&LCPU的依賴。GPU組成中通常包含一VRAM、一個(gè)顯存速率以及一個(gè)顯存位寬。圖第一款以GPU命名的芯片GeForce256 圖19:GPU經(jīng)典工作流程資料來源:電動(dòng)星球News, 資料來源:電子發(fā)燒友,GPUGPUGPUGPGPU。2008-202282010GPUFermi2017HopperGPUAI大模型訓(xùn)練與推理環(huán)節(jié)。表格3:英偉達(dá)GPU架構(gòu)調(diào)整演進(jìn)方向構(gòu)架代號(hào) 時(shí)間 納米制程 核心參數(shù) 特點(diǎn) 代表型號(hào)構(gòu)架代號(hào) 時(shí)間 納米制程 核心參數(shù) 特點(diǎn) 代表型號(hào)Fermi2010 完整GPU架構(gòu) Quadro700030億晶體管 個(gè)Cuda內(nèi)核Kepler28nm 15個(gè)SMFermi2010 完整GPU架構(gòu) Quadro700030億晶體管 個(gè)Cuda內(nèi)核Kepler28nm 15個(gè)SM,每個(gè)SM包括 支持GPUDirect技 K80201271億晶體管 192個(gè)FP32和64個(gè)FP64 術(shù) K40MMaxwell28nm 24個(gè)SM,每個(gè)SM包括 M50002014 -80億晶體管 128個(gè)FP32與4個(gè)FP64 M4000PascalP10016nm 56個(gè)MM包括642016 NVlink一代 GTX1080152億晶體管 個(gè)FP32與32個(gè)FP64P6000Volta80個(gè)M每個(gè)M包括32 推出Tenor內(nèi)核,12nm V1002017 個(gè)FP64、64個(gè)INT32、64 滿足深度學(xué)習(xí)與AI211億晶體管個(gè)FP32、8個(gè)Tensor內(nèi)核運(yùn)算TiTanVTU10272SM,每個(gè)Turing 2018 SM64INT32、64個(gè)FP32、8個(gè)Tensor內(nèi)核二代Tensor內(nèi)核T42080TIRTX500012nm186億晶體管Ampere 2020Hopper

7nm283億晶體管4nm800億晶體管

A100108SMSM32FP6464INT32、64FP32、4Tensor內(nèi)核H100132SMSM64FP6464INT32、128FP32、4Tensor內(nèi)核

Tensor結(jié)構(gòu)稀疏性MIG1.04nm工藝Tensor內(nèi)核結(jié)構(gòu)稀疏性矩陣MIG2.0

A100A303090H100資料來源:英偉達(dá)官網(wǎng)歷代架構(gòu)白皮書,AI模型推理的關(guān)鍵張量核心。英偉達(dá)架構(gòu)上推出,在后續(xù)推出的TuringAmpereHopperV100P1009核心其FP8性能較AmpereFP616倍,AIAmpere30倍。圖20:V100混合精度運(yùn)算速度提高了9倍圖21:英偉達(dá)第四代FP8Tensorcore 資料來源:微型計(jì)算機(jī)雜志, 資料來源:英偉達(dá)官網(wǎng),靈活性:GPUAIGPU擁有相對(duì)較優(yōu)的性能及靈活性。CPU、FPGA、GPU、DSACPU為軟件加速CPU平臺(tái)的硬件實(shí)現(xiàn)與軟件編程完全解耦,靈活性最高;ASIC圖22:常用的主流計(jì)算平臺(tái)靈活性及性能的比較資料來源:SDNLAB,ASICDSADSAASICASICASICASICDSAASICDSA的應(yīng)用領(lǐng)域,與芯片高企的研發(fā)成本相矛盾。5ASICDSAAI應(yīng)用領(lǐng)域,ASICDSAAI應(yīng)用及算法迭代優(yōu)化的速度。特點(diǎn)算力通用性()芯片圖23:芯片研發(fā)成本 表格4:GPU、DSA、ASIC特點(diǎn)算力通用性()芯片600500

研發(fā)成本(百萬美元)

CPU(基100 1 極度靈活的可編程能力準(zhǔn))0

65nm40nm28nm22nm16nm10nm7nm5nm

GPU 10DSA5(TPU)ASIC 1

>10倍>100倍>100倍

用廣泛能力性能極致但無靈活性,應(yīng)用拓展力不強(qiáng)資料來源:軟硬件融合, 資料來源:騰訊云,ASICDSA芯片與算力融合的宏架構(gòu)趨勢相矛盾。數(shù)字經(jīng)濟(jì)的建DSAASIC芯片難以成為數(shù)字經(jīng)濟(jì)時(shí)代的整體解決方案。圖24:不同部署位置的AI芯片要求資料來源:集微咨詢,CUDA、OpenCLGPU賦能,GPU性能提升潛力大、應(yīng)用拓展力強(qiáng)。GPUMXNet在內(nèi)的所有深度學(xué)習(xí)框架;另一方面,隨著深度學(xué)習(xí)算法和模型的收斂,GPU可以通過對(duì)算法進(jìn)行手工優(yōu)化實(shí)現(xiàn)CUDA10-20%的性能提升。圖25:英偉達(dá)CUDA-XAI生態(tài)支持多種框架、云計(jì)算服務(wù)、部署資料來源:英偉達(dá)官網(wǎng),三、GPU市場:供給推動(dòng)市場,技術(shù)及產(chǎn)能是核心驅(qū)動(dòng)力3.1需求端:移動(dòng)端兜底,自動(dòng)駕駛及數(shù)據(jù)中心建設(shè)貢獻(xiàn)增量GPU下游目前主要應(yīng)用于移動(dòng)端、數(shù)據(jù)中心服務(wù)器以及車規(guī)級(jí)芯片。其中,移動(dòng)端應(yīng)PCGPUGPU,主要用于加速圖形處理,以提高計(jì)算機(jī)游戲的圖GPU度學(xué)習(xí)、計(jì)算機(jī)視覺和自然語言處理等人工智能應(yīng)用;數(shù)據(jù)中心服務(wù)器又可以分為高GPU用于數(shù)據(jù)中心建設(shè);在汽車領(lǐng)域,GPU主要應(yīng)用于車端及其配套設(shè)施智能芯片,負(fù)責(zé)處理來自攝像頭、普通雷達(dá)、激光雷達(dá)等傳感器數(shù)據(jù),實(shí)現(xiàn)智能駕駛。圖26:GPU市場下游需求資料來源:英偉達(dá)官網(wǎng),高通官網(wǎng),中商產(chǎn)業(yè)研究院,觀研報(bào)告,1)GPU移動(dòng)端主要市場,智能手機(jī)及可穿戴設(shè)備有望滲透。GPU作為圖尤其是個(gè)人電腦市場下滑的影響,PC端顯卡需求處于下行區(qū)間,據(jù)JonPeddieResearch數(shù)據(jù)統(tǒng)計(jì),2023PC630萬塊,同比下降52.9%。圖27:PC市場處于下行周期(含平板) 圖28:PC端桌面顯卡出銷量及同比0

出貨量(百萬臺(tái),左軸同比增速(,右軸)2017 2019 2021 2023E

20%15%10%5%0%-5%-10%-15%

銷量(百萬塊,左軸同比增速(,右軸)60504030201002014 2016 2018 2020 2022

0-0.1-0.2-0.3-0.4-0.5-0.6資料來源:Canalys, 資料來源:JonPeddieResearch,AIGPUEZOO202103553%GPUGPU性能要求將逐漸增加,目前高通、AMDARM擴(kuò)量。圖29:全球移動(dòng)游戲市場占比增加(十主要內(nèi)容聯(lián)合GPU品牌SoC廠商億美元) 表格5:SoC推動(dòng)高性能GPU主要內(nèi)容聯(lián)合GPU品牌SoC廠商250200150100

主機(jī)游戲 移動(dòng)游數(shù)字版/盒裝PC游戲 網(wǎng)頁游

三星電子 Exynos AMD高通 驍龍 自研

級(jí)圖形技術(shù)和解決方案。高通人工智能引擎,AdrenoGPU25,能效提升451047710477919302020 2021 2022 2023E

雙方合作將NVIDIA圖形聯(lián)發(fā)科 天璣 英偉達(dá)解決方案引入安卓海思 麒麟 - -資料來源:NEWZOO, 資料來源:福布斯中國,中國日?qǐng)?bào)網(wǎng),AIAIAI技術(shù)的快速發(fā)展,以及計(jì)算需求的提升,AIAI架構(gòu)可以根據(jù)模AIXR等便攜設(shè)AIGPU需求的提升。圖30:基于終端感知的混合AI 圖31:部分AI模型可從云端分流到終端資料來源:高通《混合AI是AI的未來》, 資料來源:高通《混合AI是AI的未來》,GPU車載芯片的架構(gòu)模式經(jīng)歷分布式架構(gòu)向混CPUGPU來輔助計(jì)算;而中央計(jì)算架構(gòu)圖32:車載芯片的演變資料來源:博世官網(wǎng),有駕官網(wǎng),ECUECU構(gòu)復(fù)雜,不利于汽車架構(gòu)及功能擴(kuò)展。ECU數(shù)量,根據(jù)汽車各部分功能進(jìn)行劃分,如博世將汽車控制(每個(gè)功能域設(shè)置域CANFD域由于要滿足人機(jī)交互、機(jī)器視覺等需求,其算力要求較高,通常通過DPU(CPU+GPU+FPGA)架構(gòu)來滿足算力需求。ECU圖33:中央計(jì)算平臺(tái)須采用高算力芯片以進(jìn)行整車功能、算力/存儲(chǔ)等資源部署資料來源:汽車測試網(wǎng),GPUGPU需V2XAIGPUORINCPU+GPU+ACCELGPUDLA提供。根據(jù)測算,預(yù)2023GPU24億美元。圖34:2025年芯片平均算力將超2000算力(TOPS)架構(gòu)產(chǎn)品廠商算力(TOPS)架構(gòu)產(chǎn)品廠商250020001500

市場加權(quán)平均算力(TOPS)

英偉達(dá) ORIN CPU+GPU+ACCEL 254INT8地平線 征程5 CPU+BPU+DSP+ISP 1281000

芯擎科技 龍鷹一號(hào) CPU+GPU+NPU -5000

2023E 2024E 2025E

Mobileye

EyeQULTRACPU+GPU+VPU+ISP 176(未量產(chǎn))研究所

特斯拉 FSD CPU+GPU+NPU 144資料來源:有駕,自動(dòng)駕駛與AI,地平線官網(wǎng),GPUGPUHyperion研究顯示,2025199億美元,2022-2025CAGR5.5%top50050056%GPU2023年全球高性能計(jì)算中GUP21億美元。圖352025年全球高性能計(jì)算市場規(guī)模達(dá)199億美元

圖36:TOP500超算中心56算力由GPU提供0

HPC市場規(guī)模(億美元,左軸同比增速(,右軸)2020 2021 20222023E2024E2025E

20%16%12%8%4%0%-4%資料來源:Hyperion, 資料來源:官網(wǎng),不同于高性能計(jì)算中心,智算中心是利是用先進(jìn)的人工智能算法和芯片進(jìn)行智能算法模型訓(xùn)練和推理。總量方面,根據(jù)IDC及數(shù)據(jù)預(yù)測,2023年全球AI服務(wù)器市場規(guī)模將達(dá)到211億美元,同比增長15%,而據(jù)AletheiaCapital最新報(bào)告分析,2025年AI服務(wù)器市場規(guī)模將激增至1350億美元,2023-2025CAGR高達(dá)152%;價(jià)值方面,由于智能算法具有計(jì)算難度小、計(jì)算量大等特點(diǎn),對(duì)于計(jì)算任務(wù)的高并發(fā)能力及吞吐量要求較高,因此對(duì)于GPU的需求更大,據(jù)統(tǒng)計(jì),機(jī)器學(xué)習(xí)型AI服務(wù)器中,GPU成本占比約為72.8%。未來,隨著智算中心建設(shè)有序推進(jìn),GPU有望迎來量價(jià)齊升,預(yù)計(jì)2023年AI服務(wù)器領(lǐng)域GUP市場空間約為187.8億美元。37:AIGPU

圖38:2025年全球AI服務(wù)器市場規(guī)模激增至1350億美元

其他 網(wǎng)絡(luò) 存儲(chǔ)器 內(nèi)存 GPU CPU73%25%73%25%27%基礎(chǔ)型 推理型 高性能型 機(jī)器學(xué)型資料來源:IDC,ARK,華經(jīng)情報(bào)網(wǎng),樂晴智庫,注:高性能及機(jī)器學(xué)習(xí)型服務(wù)器中存儲(chǔ)器、網(wǎng)絡(luò)合并為其他項(xiàng)

資料來源:AletheiaCapital3.2供給端:英偉達(dá)獨(dú)占鰲頭,國內(nèi)技術(shù)追趕空間廣闊英偉達(dá)市場份額獨(dú)占鰲頭,國際呈現(xiàn)三強(qiáng)格局,國內(nèi)廠商加速布局。英偉達(dá)憑借技術(shù)及產(chǎn)能優(yōu)勢,在移動(dòng)端、AI服務(wù)器、自動(dòng)駕駛領(lǐng)域具有較大話語權(quán)。國際市場方面,根據(jù)JonPeddieResearch調(diào)查數(shù)據(jù)顯示,2023年第一季度,全球桌面級(jí)顯卡銷量約為630萬塊,其中英偉達(dá)顯卡銷量約為529萬張,以84%的市場份額占據(jù)領(lǐng)先地位,此外銷量位居前三的GUP供應(yīng)商還包括AMD及Intel,其銷量分別為76萬張、25萬張;國內(nèi)市場方面,我國廠商GPU市場份額較小,正處于技術(shù)追趕及自主研發(fā)環(huán)節(jié),目前國產(chǎn)GPU在數(shù)據(jù)中心、人工智能以及通用計(jì)算型GPU領(lǐng)域均實(shí)現(xiàn)產(chǎn)品布局,未來隨著國內(nèi)數(shù)據(jù)中心、智能駕駛及終端側(cè)GPU市場需求的提升,國產(chǎn)GPU市場份額有望實(shí)現(xiàn)滲透。圖39:全球GPU市場格局變化 圖40:國內(nèi)部分GPU廠商市場布局Intel AMD NVIDIA75%86%75%86%84%80%60%40%20%0%22Q1

22Q4

23Q1資料來源:JonPeddieResearch, 資料來源:公司官網(wǎng),GeForceGeForce2RTX40SMCoreAI增強(qiáng)圖形渲染,多項(xiàng)技術(shù)業(yè)界領(lǐng)先。技術(shù) 功能圖41:英偉達(dá)游戲產(chǎn)品矩陣 表格7:游戲產(chǎn)品增強(qiáng)技術(shù)技術(shù) 功能BatteryBoost 提升游戲時(shí)電腦續(xù)航時(shí)間DLSS 幫助玩家增強(qiáng)圖形設(shè)置并提升分辨率GameWorks

游戲開發(fā)者帶來視覺計(jì)算領(lǐng)域的頂尖技術(shù)G-SYNC 減少顯示器卡頓現(xiàn)象和輸入延遲GPUBoost GPUWhisperMode 智能調(diào)整游戲幀速率資料來源:英偉達(dá)官網(wǎng), 資料來源:英偉達(dá)官網(wǎng),12產(chǎn)品支持包括智能座艙、桌面辦公、筆記本、服務(wù)器等應(yīng)用在內(nèi)的各個(gè)領(lǐng)域以及Linux、ows、Android等系統(tǒng);而摩爾線程首款桌面級(jí)游戲顯卡MTTS80,在1.8GHz的主頻下,能夠提供14.4TFLOPS的單精度浮點(diǎn)算力,根據(jù)PassMark的測試結(jié)果,MTTS80顯卡的性能已達(dá)到英偉達(dá)中端顯卡GeForceGTX750Ti的性能水平。表格8:國內(nèi)廠商桌面級(jí)顯卡產(chǎn)品參數(shù)對(duì)比摩爾線程資料來源:公司官網(wǎng),站長之家,注:FP32(單精度浮點(diǎn)算力,單位:TFLOPS)、INT8(整型算力,單位:TOPS)202424.9億美元,同比增長22%PC財(cái)年英偉達(dá)22.438%,隨著疫情影響退出,游戲業(yè)務(wù)迎來回JonPeddieResearchGPU2023第二季度英偉達(dá)以68%PC圖42:英偉達(dá)游戲業(yè)務(wù)營收增長 圖43:2023Q2全球PC顯卡市場份額0

游戲業(yè)務(wù)(億美元,左軸)同比增長(,右軸)2021 2022 2023Q1

80%60%40%20%0%-20%-40%-60%

NVIDIA18%14%68%AMD18%14%68%Intel資料來源:英偉達(dá)官網(wǎng), 資料來源:JonPeddieResearch,GUPGPUGPU2022H1004N工藝,集成最高184329216CUDA576核心,AIFP16TF32FP64A10032000TFLOPS、1000TFLOPS60TFLOPS。技術(shù) 功能圖44:英偉達(dá)數(shù)據(jù)中心產(chǎn)品矩陣 表格9:英偉達(dá)H100產(chǎn)品技術(shù)技術(shù) 功能Transformer引擎 加速AI模型訓(xùn)練NVLinkSwitch系統(tǒng)

縱向擴(kuò)展互聯(lián)技術(shù),跨服務(wù)器拓展GPUNVIDIA機(jī)密計(jì)算 保護(hù)使用中的數(shù)據(jù)和應(yīng)用MIGDPX指令

GPU全獨(dú)立的實(shí)例,并擁有自己的內(nèi)存、緩存和計(jì)算核心速度資料來源:英偉達(dá)官網(wǎng), 資料來源:英偉達(dá)官網(wǎng),此外,英偉達(dá)還在軟件及技術(shù)產(chǎn)品方面提供支持,通過其豐富的產(chǎn)品矩陣搭建數(shù)據(jù)中心一站式解決方案。AI及高性能計(jì)算市場計(jì)算需求的不斷增長,GPU之NVLinkGPU系統(tǒng)配置高更的寬帶及增強(qiáng)的可擴(kuò)展能力,NVLinkSwitchNVLink的高級(jí)通信能力構(gòu)建,可為計(jì)算密集型工作負(fù)載提供更高帶寬和更低延遲,從而顯著增強(qiáng)服務(wù)器內(nèi)GPU通信能力。圖45:英偉達(dá)第四代NVLink能為H100提升1.5倍帶寬資料來源:英偉達(dá)官網(wǎng),GPU布局者較多,產(chǎn)品性能逐漸向英偉達(dá)靠攏。以英偉達(dá)最新GPU為參考,H100SXM4N工藝,其單精度浮點(diǎn)算力已673958的AIHPC307倍;而目前國內(nèi)算力較高的產(chǎn)品為壁仞科技推出的B10P7nm240TFLPS,1920TOPS,BR100A1003倍以上,向H100產(chǎn)品靠攏。表格10:國內(nèi)廠商高性能計(jì)算GPU產(chǎn)品參數(shù)對(duì)比廠商 產(chǎn)品 算力 制程 顯存 架構(gòu)廠商 產(chǎn)品 算力 制程 顯存 架構(gòu)英偉達(dá)

H100SXMH100PCLe

FP32:67INT8:3958FP32:51INT8:3026

4nm 帶寬:3.35TB/s Hopper4nm 帶寬:2TB/s Hopper位寬:256位摩爾線程

MTTS3000 FP32:15.2 -FP32:10.6

帶寬:448GB/s

MUSA(自研)MTTS2000

INT8:42.4

- 位寬:256位 MUSA(自研)瀚博半導(dǎo)體 載天VA10 INT8:400+ - - VUCA(自研)FP32:24寒武紀(jì) MLU370-X8

INT8:256

7nm 帶寬:614.4GB/s -壁仞科技 壁礪?100P

FP32:240INT8:1920

7nm

位寬:4096位帶寬:1.64TB/s

BIRENSUPA(自研)壁礪?104P壁礪?104S

FP32:256INT8:1024FP32:170.5INT8:682

7nm7nm

位寬:2048位帶寬:819GB/s位寬:2048位帶寬:819GB/s

BIRENSUPA(自研)BIRENSUPA(自研)資料來源:英偉達(dá)、摩爾線程等公司官網(wǎng),注:英偉達(dá)產(chǎn)品參數(shù)采用稀疏技術(shù)顯示,在不采用稀疏技術(shù)的情況下,規(guī)格降低一半注:FP32(單精度浮點(diǎn)算力,單位:TFLOPS)、INT8(整型算力,單位:TOPS)盈利能力及產(chǎn)能方面,數(shù)據(jù)中心業(yè)務(wù)營收已超游戲業(yè)務(wù),成為英偉達(dá)最高收入來源,但其產(chǎn)能受限于臺(tái)積電工藝,短期供需缺口較大。據(jù)英偉達(dá)2024財(cái)年Q2報(bào)告,其數(shù)據(jù)中心營收已達(dá)到103.2億美元,同比增長171%,約占總營收比例為76%;產(chǎn)能方面,英偉達(dá)H100均由臺(tái)積電代工,其產(chǎn)能受到臺(tái)積電工藝限制,據(jù)英偉達(dá)預(yù)計(jì),H100芯片2023年全年全球范圍出貨量約為55萬顆,但據(jù)GPUUtils數(shù)據(jù)統(tǒng)計(jì),保守估計(jì)情況下,H100的供給缺口將達(dá)到43萬顆。壁仞科技BR100P系列芯片同樣由臺(tái)積電代工,預(yù)計(jì)于2023年量產(chǎn),若量產(chǎn)計(jì)劃順利推進(jìn),自主研發(fā)有望滲透。圖46:英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)營收增長 圖47:高性能計(jì)算芯片下游需求0

數(shù)據(jù)中心(億美元,左軸同比增長(,右軸)2021 2022 2023Q1

180%160%140%120%100%80%60%40%20%0%資料來源:英偉達(dá)官網(wǎng), 資料來源:GPUUtils官網(wǎng),公司官網(wǎng),3)智能駕駛。Thor英20229Thor,ThorCPUGPU2000Orin8加固自動(dòng)駕駛領(lǐng)域護(hù)城河。圖48:英偉達(dá)自動(dòng)駕駛產(chǎn)品矩陣 圖49:英偉達(dá)Thor芯片計(jì)算性能提升算力2000250200025013020001500100050002018PARKER

2020XAVIER

2022ORIN

2024THOR資料來源:英偉達(dá)官網(wǎng), 資料來源:英偉達(dá)官網(wǎng),目前,國內(nèi)大多數(shù)智能駕駛車型選用英偉達(dá)產(chǎn)品,地平線與華為自研市場份額正在逐步擴(kuò)大。ORIN產(chǎn)品,比5MaxORIN芯片,除此之外華為在自動(dòng)駕駛領(lǐng)域同樣具有布局,華為610、MDC810已經(jīng)量產(chǎn),MDC610平200TOPSORIN產(chǎn)品差距較小。表格11:國內(nèi)部分車型搭載芯片型號(hào)車企 車型搭載芯片車企 車型搭載芯片芯片制造商 備注G9ORIN英偉達(dá) 兩組ORIN芯片G6ORIN英偉達(dá)P7Xavier新款P7升級(jí)為兩組英偉達(dá)ORIN芯英偉達(dá)片L7MaxORIN英偉達(dá)L7PRO征程5地平線L8MaxORIN英偉達(dá)理想L8PRO征程5地平線L9MaxORIN英偉達(dá)L9PRO征程5地平線---ES6 ORIN

搭載四顆OrinX芯片,總算力高達(dá)1016TOPS蔚來ET7ORIN英偉達(dá)AQUILA自動(dòng)駕駛系統(tǒng)ET5ORIN英偉達(dá)AQUILA自動(dòng)駕駛系統(tǒng)威馬M7ORIN英偉達(dá)-極狐 阿爾法S-華為HI MDC610 華

單組算力為200TOPS,綜合算力為400TOPS吉利 極氪001 EyeQ5H Mobileye 單顆EyeQ5H的算力為24Tops資料來源:蔚來官網(wǎng),汽車之家,20242季度營收較一季度出現(xiàn)下15%2.53億美元。市場結(jié)構(gòu)上,2023H1中國市場乘用車自動(dòng)駕駛計(jì)算方案市場份額中,英偉達(dá)仍以52.57%的份額占據(jù)第一,地平線以30.71%的市場份額占據(jù)第二,華為海思則占據(jù)4.05%的市場份額。圖50:英偉達(dá)智能駕駛業(yè)務(wù)營收增長

H1計(jì)算方案市場份額智能駕駛(億美元,左軸同比增長(,右軸)1098765432102021 2022 2023Q1

120%100%80%60%40%20%0%

31%

52%

英偉達(dá)地平線德州儀器Mobileye華為海思資料來源:英偉達(dá)官網(wǎng), 資料來源:高工智能汽車,GPUGPU4nm7nmCoWoS富微電及賽微電子等具有布局。202210.7%的6.5%圖52:GPU產(chǎn)業(yè)中下游分別為芯片設(shè)計(jì)、制造、封裝與測試資料來源:公司官網(wǎng),超能網(wǎng),集微網(wǎng),公司主要GPU產(chǎn)品市值(億元)技術(shù)背景主要應(yīng)用領(lǐng)域景嘉微JM5/7/9/7200343.04完全自主知識(shí)產(chǎn)權(quán)航天軍工、通用計(jì)算海光信息公司主要GPU產(chǎn)品市值(億元)技術(shù)背景主要應(yīng)用領(lǐng)域景嘉微JM5/7/9/7200343.04完全自主知識(shí)產(chǎn)權(quán)航天軍工、通用計(jì)算海光信息海光81001349.98AMDx86授權(quán)服務(wù)器、通用計(jì)算壁仞科技BR100、BR104未上市 Imagination授權(quán)IP+ 服務(wù)器、信創(chuàng)自主研發(fā)凌久電子GP101、GP102未上市 完全自主知識(shí)產(chǎn)權(quán) 桌面、軍工芯原股份VivanteGPUIP收購自美國圖芯322.34 IP(Vivante)芯動(dòng)科技風(fēng)華1號(hào)/2號(hào)Imagination授權(quán)IP+未上市 服務(wù)器表格12:國內(nèi)重點(diǎn)GPU公司及技術(shù)自主研發(fā)摩爾線程

MTTS80/60/30/10MTTS3000

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論