GPU行業(yè)市場分析_第1頁
GPU行業(yè)市場分析_第2頁
GPU行業(yè)市場分析_第3頁
GPU行業(yè)市場分析_第4頁
GPU行業(yè)市場分析_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

GPU行業(yè)市場分析一、數(shù)字經(jīng)濟、AI、智能駕駛視角下看算力需求1.1演變趨勢:從通用計算到智能計算,從分散獨立到云網(wǎng)邊協(xié)同宏觀角度下,數(shù)字經(jīng)濟建設(shè)及人工智能發(fā)展掀起了新一代算力革命,算力基建成為國家數(shù)字化轉(zhuǎn)型和經(jīng)濟發(fā)展的重要競爭策略。從1964年戈登·摩爾提出著名的摩爾定律后,CPU性能的發(fā)展便遵循這一規(guī)律,但目前數(shù)字經(jīng)濟與人工智能的高速發(fā)展,基于CPU的摩爾定律已經(jīng)失效,如何突破“算力墻”,滿足新時代各種算力需求,成為各國主要的競爭焦點。微觀角度下,算力形式逐漸由通用計算過渡為高性能計算,從分散獨立的端計算向云網(wǎng)邊協(xié)同計算演變。當前,常見的高性能計算可以分為科學、工程計算與智能計算;算力資源服務(wù)可以分為云計算、混合計算及算力網(wǎng)絡(luò)。1)科學、工程計算。這類計算主要利用超級計算機實現(xiàn)并行計算,是一種算法優(yōu)化和硬件集群結(jié)合的計算模式。高性能計算由于具有較高的性能、效率及計算精度,可以廣泛的用于大規(guī)模復雜科學計算,比如工程模擬仿真、航空航天、地震預測等,同時也能支持人工智能、智慧城市等新興領(lǐng)域。2)智能計算。智能計算以智能芯片為計算算力底座,可以較好的滿足AI領(lǐng)域模型訓練所需的智能運算需求,因此用于支持專一的人工智能應用場景?;谥悄苡嬎愦罱ǖ娜斯ぶ悄苡嬎阒行模ㄟ^將各種交叉技術(shù)集成,廣泛的應用于智能語音處理、機器視覺、自然語言(文本)處理等不用的領(lǐng)域。3)云計算、混合計算、算力網(wǎng)絡(luò)屬于新型算力資源服務(wù)模式。云計算通過WorldWideWeb(萬維網(wǎng))向用戶提供包括服務(wù)器、存儲、數(shù)據(jù)庫等在內(nèi)的各項計算服務(wù),因為萬維網(wǎng)以網(wǎng)頁為核心,因此云計算主要面向消費互聯(lián)網(wǎng);而算力網(wǎng)絡(luò)主要以算法及算力協(xié)同為核心,通過協(xié)同聯(lián)動云計算、邊緣計算、端計算及通信網(wǎng)絡(luò),能夠?qū)崿F(xiàn)對復雜計算任務(wù)的分解及高效調(diào)度。1.2戰(zhàn)略地位:算力屬于基礎(chǔ)設(shè)施建設(shè),是智能時代發(fā)展的物理承載整體架構(gòu)層面,算法、算力及數(shù)據(jù)是實現(xiàn)人工智能的三要素,其中算力是構(gòu)筑智能時代的物理基礎(chǔ)。人工智能離不開算力、算法及數(shù)據(jù),其發(fā)展需要在建立在龐大的數(shù)據(jù)集、優(yōu)秀的深度學習算法及強大的計算能力基礎(chǔ)之上,而算力作為底層基礎(chǔ)設(shè)施,是開啟智能時代的關(guān)鍵因素,其核心于智能芯片的技術(shù)進步。實際發(fā)展層面,全球數(shù)據(jù)量正以指數(shù)級速度增長,“算力荒”問題日益凸顯。據(jù)IDC數(shù)據(jù)顯示,2018年至2019年全球大數(shù)據(jù)存儲量分別為33ZB、41ZB,而2020年全球數(shù)據(jù)量達到了60ZB,同比增長46%;龐大的數(shù)據(jù)集必然依賴強大的數(shù)據(jù)處理能力,進而要求宏觀算力快速發(fā)展,NTCysd預計2021-2028年全球算力規(guī)模將以超過40%的速度增長,2028年將達到7510EFlops。1.3應用驅(qū)動:數(shù)字經(jīng)濟搭建整體框架,AI大模型、智能駕駛持續(xù)拉升市場方面,數(shù)字經(jīng)濟建設(shè)、AI大模型、智能駕駛成為開啟智能時代的確定性研究方向。其中,數(shù)字經(jīng)濟建設(shè)搭建數(shù)字化布局整體框架,并提供政策支持;AI大模型及智能駕駛率先落地,成為拉動算力需求的核心驅(qū)動力。1)全球正加快數(shù)字經(jīng)濟建設(shè),算力發(fā)展成為主要戰(zhàn)略競爭點之一。目前,全球正處于經(jīng)濟數(shù)字化轉(zhuǎn)型階段,據(jù)中國信通院發(fā)布的《全球數(shù)字經(jīng)濟白皮書》顯示,數(shù)字經(jīng)濟已經(jīng)成為各國發(fā)展GDP的核心戰(zhàn)略,具體數(shù)據(jù)來看,2020年全球47個國家數(shù)字經(jīng)濟增加值達到32.6萬億美元,占GDP比重為43.7%,同比名義增長3%。此外,數(shù)字經(jīng)濟已經(jīng)成為我國穩(wěn)增長促轉(zhuǎn)型的重要引擎,出臺多項政策支持算力發(fā)展,截至2022年我國數(shù)字經(jīng)濟規(guī)模已達50.2億元,數(shù)字基礎(chǔ)設(shè)施規(guī)模能級大幅提升,在用數(shù)據(jù)中心算例總規(guī)模超180EFlops,位居世界第二。2)AI大模型的快速擴張是算力需求的關(guān)鍵驅(qū)動力。由于AI大模型通常需要在大規(guī)模無標注的數(shù)據(jù)集上進行重復的訓練,因此相比于傳統(tǒng)的小模型在應用場景上更具有普適性。但與此同時,數(shù)據(jù)集的快速增長以及模型不斷迭代優(yōu)化使得AI大模型尺寸快速膨脹,GPU算力也遵循著同樣的增長規(guī)律。據(jù)OpenAI數(shù)據(jù)顯示,GPT-3175B相比于GPT-3Small,總計算力(Flops)及參數(shù)量增長了約1400倍;而據(jù)Semianalysis最新分析指出,GPT-4模型尺寸進一步擴張,在其120層模型中總共包含了1.8萬億參數(shù),約GPT-3175B參數(shù)量的10倍。3)汽車智能化功能升級,智能駕駛將貢獻算力需求的全新增量。汽車正逐漸步入智能化時代,傳感器數(shù)量的增加及交互能力的提升,將帶來數(shù)據(jù)的幾何式增長,這必然要求車端擁有強大的數(shù)據(jù)分析和處理能力。據(jù)預測,2025年我國L3、L5級別智能駕駛滲透率將分別達到14%、1%,到2030年兩者將分別達到40%、12%。而L3級別及以上智能駕駛汽車,不僅需要處理人機交互等指令,還需要與外界環(huán)境、云數(shù)據(jù)中心進行交互。據(jù)分析,L3、L5級別智能駕駛算力需求將分別達到30-60TOPS、100TOPS,未來隨著智能駕駛汽車滲透率的提升,將會持續(xù)帶動智能駕駛市場整體算力需求的增加,預計2025、2030年智能駕駛市場算力需求達到1.9萬、19萬TOPS,2021-2025CAGR達112%。1.4優(yōu)化路徑:提升芯片性能及創(chuàng)新存算架構(gòu)是研究主流系統(tǒng)算力主要受處理器性能與數(shù)據(jù)傳輸能力影響,當數(shù)據(jù)處理能力與傳輸能力不匹配時,計算能力由兩者中較低者決定。處理性能主要與指令復雜程度、頻率、并行度有關(guān),一般來說,指令越復雜、計算頻率越高、并行程度越大,處理器性能就越好;而數(shù)據(jù)傳輸?shù)哪芰εc處理器內(nèi)部存算架構(gòu)有關(guān),在計算機體系里,根據(jù)訪問延遲及容量大小將存儲結(jié)構(gòu)分為寄存器、緩存、內(nèi)存、外存與遠程存儲,而這種存算分離的架構(gòu)形式,通常使得數(shù)據(jù)傳輸成為限制系統(tǒng)算力的因素。1)指令的復雜程度。指令系統(tǒng)是連接計算機軟件和硬件的橋梁,一般來說,指令的復雜程度于處理器運算性能有關(guān),指令越復雜,其性能就越好。典型的處理器平臺大致可以分為CPU、協(xié)處理器、GPU、FPGA、DSA、ASIC,其中CPU為通用軟件平臺,支持包括整形計算類、浮點類、數(shù)據(jù)傳輸類、控制類等在內(nèi)的通用指令,而其余處理器為硬件加速平臺,用于執(zhí)行各類復雜指令。2)計算頻率。一般來說,處理器計算的速度于頻率呈現(xiàn)正相關(guān)關(guān)系,計算頻率越高,速度越快。以CPU為例,執(zhí)行一條指令需要依次經(jīng)過取址、譯碼、地址生成、取操作數(shù)、執(zhí)行、寫回階段,每個階段需要消耗一個時鐘周期,上個階段執(zhí)行完畢后才會進入到下個階段。在此基礎(chǔ)上,時鐘周期的設(shè)定便取決于各階段用時最大者,而提高時鐘頻率大致有兩種方法:一是通過超流水線架構(gòu)提高處理器主頻,通過增加多級流水從而細化每個階段;一是通過優(yōu)化工藝技術(shù)降低各階段邏輯門處理延遲。3)并行度。并行度是指在計算機體系中,指令并行執(zhí)行的最大數(shù)目,并行度越大,意味著系統(tǒng)能夠同時處理更多指令,其運算速度越快。常用的并行設(shè)計包括指令并行、處理器核并行、芯片級并行及服務(wù)器并行。4)數(shù)據(jù)傳輸能力。數(shù)據(jù)傳輸能力并不直接影響處理器性能,但復雜的存儲分層結(jié)構(gòu)會使得系統(tǒng)功耗、延遲及訪問寬帶增加,從而限制算力的提升。優(yōu)秀的計算系統(tǒng)應使得處理器性能與數(shù)據(jù)傳輸能力盡可能匹配,以減少“木桶效應”對于算力的限制。目前,數(shù)據(jù)傳輸能力的優(yōu)化方向主要包括近存計算及存算一體化架構(gòu)。二、算力需求視角下看GPU發(fā)展的必然趨勢2.1性能:GPU技術(shù)發(fā)展迅速,高并發(fā)計算能力契合算力需求1)橫向比較,GPU較CPU而言,更符合深度學習算法的高度并行計算需求。一方面,CPU性能提升已達到瓶頸,與高速增長的算力需求脫節(jié)。CPU作為第一代高效計算平臺,目前無論從不管是從架構(gòu)/微架構(gòu)設(shè)計、工藝、多核并行等各種角度出發(fā),其性能都難以提升,2016年之后,CPU性能每年提升僅3.5%。隨著數(shù)字經(jīng)濟、AI大模型、智能駕駛等算力需求的推動,CPU性能已無法滿足上層軟件算力需求。另一方面,GPU較CPU具備更多的算術(shù)邏輯單元、控制單元與內(nèi)存緩存,其SIMD架構(gòu)與深度學習算法需求更吻合。CPU為線程級并行的MIMD架構(gòu),其核心少但性能強,可以用來處理復雜的控制邏輯、預測分支、亂序執(zhí)行、多級流水等,而GPU為數(shù)據(jù)級并行的SIMD架構(gòu),其核心多但性能弱,用于優(yōu)化具有簡單控制邏輯的數(shù)據(jù)并行任務(wù)。而神經(jīng)網(wǎng)絡(luò)算法數(shù)據(jù)要求量大,并行計算程度高,與GPU高并行計算能力、高內(nèi)存帶寬相適配。神經(jīng)網(wǎng)絡(luò)的訓練環(huán)節(jié)需要處理大量的數(shù)據(jù),并且其結(jié)構(gòu)非常統(tǒng)一,每一層成千上萬個相同的人工神經(jīng)元都在執(zhí)行相同的計算操作,具有高效并行計算能力與內(nèi)存帶寬的GPU,不僅能夠更快的完成數(shù)據(jù)的讀取與寫入,還能實行多條指令并行計算。2)縱向比較,GPU架構(gòu)技術(shù)仍在演進,其高性能計算與智能計算能力不斷優(yōu)化GPU最早作為顯卡的核心零部件,專用于圖形渲染及處理。GPU(GraphicProcessingUnit),即圖形處理單元,英偉達公司在1999年發(fā)布GeForce256圖形處理芯片時首先提出GPU的概念,GeForce256作為專門負責計算機圖形顯示的計算機零部件,通過T&L及其他多項技術(shù)引擎,減少了顯卡對于CPU的依賴。GPU組成中通常包含一個顯存、一個主頻、一個VRAM、一個顯存速率以及一個顯存位寬。GPU架構(gòu)迭代頻繁,已從從專用圖形處理器發(fā)展為高效的通用計算平臺,向外拓展人工智能計算及高性能計算領(lǐng)域。當GPU引入可編程特性,將圖形硬件的流水線作為流處理器來解釋,基于GPU的通用計算也開始出現(xiàn),即GPGPU。英偉達產(chǎn)品在2008-2022年內(nèi),架構(gòu)迭代調(diào)整了8次,其在2010年推出具有完整GPU架構(gòu)的Fermi,在2017年Volta架構(gòu)中首次推出Tensor內(nèi)核以支持深度學習算法,而目前Hopper架構(gòu)的GPU已廣泛的應用于AI大模型訓練與推理環(huán)節(jié)。英偉達Tensor核心持續(xù)升級,智能計算及高性能計算能力得到不斷優(yōu)化,已成為AI模型推理的關(guān)鍵張量核心。英偉達Tensor核心最初在Volta架構(gòu)上推出,在后續(xù)推出的Turing、Ampere、Hopper上不斷優(yōu)化,Tensor核心能夠加速矩陣運算,大幅增加浮點計算吞吐量。具體來看,擁有Tensor核心的V100相比于P100其混合精度運算速度提高了9倍,而英偉達推出的第四代Tensor核心其FP8性能較AmpereFP6提高16倍,而在AI大型語言模型推理方面,性能比Ampere高出30倍。2.2靈活性:GPU可編程優(yōu)勢明顯,通用靈活性適配AI應用端拓展GPU擁有相對較優(yōu)的性能及靈活性。常用的計算平臺包括CPU、FPGA、GPU、DSA以及ASIC,一般情況下隨著芯片性能的提升,其靈活性會逐漸下降。CPU為軟件加速平臺,通過標準化的指令集使得CPU平臺的硬件實現(xiàn)與軟件編程完全解耦,靈活性最高;ASIC為專用集成電路,是一種為專門目的而設(shè)計的集成電路,不支持硬件編程,靈活性最差。1)ASIC、DSA設(shè)計成本高、周期長,其靈活性難以滿足應用層及宏架構(gòu)趨勢的需求。DSA與ASIC屬于專用領(lǐng)域定制類型芯片,其中ASIC屬于完全定制性化芯片,其晶體管根據(jù)算法定制,流片量產(chǎn)后算法便不可編輯;DSA在ASIC基礎(chǔ)上回調(diào),保留一定編程能力,但其功能覆蓋的領(lǐng)域成具有較大的局限性。ASIC與DSA的通用性是限制其應用的關(guān)鍵因素。首先,通用性限制了ASIC與DSA的應用領(lǐng)域,與芯片高企的研發(fā)成本相矛盾。據(jù)估計,5nm制程的芯片研發(fā)成本已經(jīng)超5億美元,高企的研發(fā)成本需要具有充分量產(chǎn)能力芯片來攤薄,而ASIC與DSA芯片均為面向特定領(lǐng)域?qū)S眯酒?,不同領(lǐng)域則面臨重新設(shè)計的問題,尤其是在AI應用領(lǐng)域,ASIC與DSA的研發(fā)周期和成本并不能滿足其AI應用及算法迭代優(yōu)化的速度。其次,專用性使得ASIC與DSA芯片與算力融合的宏架構(gòu)趨勢相矛盾。數(shù)字經(jīng)濟的建設(shè)需用云、網(wǎng)、邊各部分資源協(xié)同融合,從而組成龐大的算力網(wǎng)絡(luò),然而不同計算引擎、平臺、設(shè)備以及數(shù)據(jù)中心的芯片應用場景具有較大的差異,這使得DSA、ASIC芯片難以成為數(shù)字經(jīng)濟時代的整體解決方案。2)CUDA、OpenCL技術(shù)持續(xù)為GPU賦能,GPU性能提升潛力大、應用拓展力強。一方面,CUDA生態(tài)為GPU提供各種數(shù)據(jù)接口(API)、算法庫與工具、跨平臺支持以及大規(guī)模集群計算支持,CUDA使得開發(fā)人員能夠使用流行的編程語言對英偉達GPU進行編程,同時還集成包括TensorFlow、PyTorch和MXNet在內(nèi)的所有深度學習框架;另一方面,隨著深度學習算法和模型的收斂,GPU可以通過對算法進行手工優(yōu)化實現(xiàn)資源的高效調(diào)度,充分釋放出硬件的性能,每一代CUDA升級都會帶來約10-20%的性能提升。三、GPU市場:供給推動市場,技術(shù)及產(chǎn)能是核心驅(qū)動力3.1需求端:移動端兜底,自動駕駛及數(shù)據(jù)中心建設(shè)貢獻增量GPU下游目前主要應用于移動端、數(shù)據(jù)中心服務(wù)器以及車規(guī)級芯片。其中,移動端應用又可以分為PCGPU、手機GPU,主要用于加速圖形處理,以提高計算機游戲的圖像質(zhì)量及性能,目前隨著深度學習及人工智能的發(fā)展,移動端GPU也可以用于加速深度學習、計算機視覺和自然語言處理等人工智能應用;數(shù)據(jù)中心服務(wù)器又可以分為高性能計算服務(wù)器與智能計算服務(wù)器,由于GPU具有高并發(fā)的計算能力,因此被廣泛的用于數(shù)據(jù)中心建設(shè);在汽車領(lǐng)域,GPU主要應用于車端及其配套設(shè)施智能芯片,負責處理來自攝像頭、普通雷達、激光雷達等傳感器數(shù)據(jù),實現(xiàn)智能駕駛。1)個人電腦為GPU移動端主要市場,智能手機及可穿戴設(shè)備有望滲透。GPU作為圖形處理加速硬件,其最常見的應用即為個人電腦、智能手機等游戲設(shè)備,不限于創(chuàng)建圖像、圖像處理、計算攝影、手勢識別的視覺處理需求。但目前隨著消費電子需求減弱,尤其是個人電腦市場下滑的影響,PC端顯卡需求處于下行區(qū)間,據(jù)JonPeddieResearch數(shù)據(jù)統(tǒng)計,2023年第一季度全球PC桌面顯卡銷量約630萬塊,同比下降52.9%。手機游戲圖顯需求及終端AI架構(gòu),有望打造移動端GPU增長新引擎。一方面,手機端游戲市場規(guī)模逐漸增大,NEWZOO數(shù)據(jù)顯示,2022年全球移動游戲市場規(guī)模已達1035億美元,約占游戲市場總規(guī)模53%;另一方面,手機端GPU光線追蹤技術(shù)尚未普及,未來隨著手機端游戲圖形渲染需求的提升,對GPU性能要求將逐漸增加,目前高通、聯(lián)發(fā)科、英偉達、AMD、ARM等著名芯片廠商均開始布局手機GPU,有望加速移動端GPU擴量。移動端作為AI架構(gòu)的終端設(shè)備,有望承載部分AI計算功能。隨著AI技術(shù)的快速發(fā)展,以及計算需求的提升,AI處理須分布在云端及終端進行,這種混合AI架構(gòu)可以根據(jù)模型和查詢需求的復雜度等因素,選擇不同方式在云端和終端側(cè)之間分配處理負載。未來,隨著終端側(cè)AI處理需求的提升,將對終端設(shè)備,包括手機、電腦、汽車、XR等便攜設(shè)備以及物聯(lián)網(wǎng)設(shè)備的AI計算及推理性能提出新的需求,有望帶動移動端GPU需求的提升。2)自動駕駛貢獻GPU全新增量,藍海廣闊。車載芯片的架構(gòu)模式經(jīng)歷分布式架構(gòu)向混合式架構(gòu)轉(zhuǎn)變,未來將向中心計算架構(gòu)演進。計算架構(gòu)將隨著自動駕駛升級進行優(yōu)化,不同的計算架構(gòu),對于車載芯片的要求具有差異。分布式架構(gòu)計算需求小,僅通過CPU控制;混合式架構(gòu)為實現(xiàn)部分自動駕駛功能將引入GPU來輔助計算;而中央計算架構(gòu)中,汽車端計算將升級為更加通用的計算平臺,進而保證了整車架構(gòu)的穩(wěn)定性和功能的擴展性。分布式計算架構(gòu)中,每個ECU負責特定的功能如燈光控制、門控制、車輪控制等等,隨著汽車功能的增多,分布式架構(gòu)需要配置更多的ECU及線束,將會使得汽車內(nèi)部架構(gòu)復雜,不利于汽車架構(gòu)及功能擴展。混合式計算架構(gòu)減少了ECU數(shù)量,根據(jù)汽車各部分功能進行劃分,如博世將汽車控制分五個功能域(動力域、底盤域、車身域、座艙域、自動駕駛域),每個功能域設(shè)置域控制器,再通過以太網(wǎng)和CANFD相連。不同功能域所需算力不同,座艙域及自動駕駛域由于要滿足人機交互、機器視覺等需求,其算力要求較高,通常通過DPU(CPU+GPU+FPGA)架構(gòu)來滿足算力需求。中央計算架構(gòu)或汽車云計算架構(gòu),將功能域深度融合,升級為更加通用的計算平臺,將顯著增加車端的計算需求。在這種架構(gòu)中,區(qū)域控制器平臺相當于局部中央計算平臺,與混合式架構(gòu)區(qū)域控制器的不同在于,中央計算架構(gòu)中的區(qū)域控制器需要獨自處理局部區(qū)域傳感器、執(zhí)行器、ECU等部件傳回的數(shù)據(jù),而混合式架構(gòu)中的區(qū)域控制器需將這部分數(shù)據(jù)傳輸至中央計算平臺處理;同時還需承擔控制和協(xié)調(diào)本區(qū)域執(zhí)行單元及網(wǎng)絡(luò)協(xié)議轉(zhuǎn)換的責任。國內(nèi)外廠商車載芯片多數(shù)采用含GPU架構(gòu),隨著智能駕駛升級,有望拉升車端GPU需求。智能駕駛時代,車端芯片承載的功能增加,不僅需要處理各環(huán)節(jié)傳感器收集的環(huán)境數(shù)據(jù)、地圖定位數(shù)據(jù)、V2X信息通信數(shù)據(jù),還需要通過各種智能算法規(guī)劃最佳決策,同時控制執(zhí)行單元。隨著AI技術(shù)的進步,基于深度學習算法的智能駕駛方案成為汽車制造商的布局重點。目前國內(nèi)芯片制造廠商普遍采用GPU加速深度學習算法,例如英偉達ORIN采用CPU+GPU+ACCEL架構(gòu),其算力由GPU及DLA提供。根據(jù)測算,預計2023年全球自動駕駛領(lǐng)域GPU市場空間將達到24億美元。3)受益于數(shù)字經(jīng)濟及人工智能,數(shù)據(jù)中心市場GPU加速放量。高性能計算中心及智算中心建設(shè)屬于數(shù)字經(jīng)濟建設(shè)重要的一環(huán),二者的建設(shè)將帶動GPU市場增長。據(jù)Hyperion研究顯示,2025年全球高性能計算市場規(guī)模將達到199億美元,2022-2025年CAGR約為5.5%,此外,根據(jù)超算top500統(tǒng)計,全球前500超級計算機中56%算力由GPU提供,GPU需求將隨著高性能計算市場增長同步提升,預計2023年全球高性能計算中心GUP市場空間約為21億美元。不同于高性能計算中心,智算中心是利是用先進的人工智能算法和芯片進行智能算法模型訓練和推理??偭糠矫?,根據(jù)IDC及中商情報網(wǎng)數(shù)據(jù)預測,2023年全球AI服務(wù)器市場規(guī)模將達到211億美元,同比增長15%,而據(jù)AletheiaCapital最新報告分析,2025年AI服務(wù)器市場規(guī)模將激增至1350億美元,2023-2025CAGR高達152%;價值方面,由于智能算法具有計算難度小、計算量大等特點,對于計算任務(wù)的高并發(fā)能力及吞吐量要求較高,因此對于GPU的需求更大,據(jù)統(tǒng)計,機器學習型AI服務(wù)器中,GPU成本占比約為72.8%。未來,隨著智算中心建設(shè)有序推進,GPU有望迎來量價齊升,預計2023年AI服務(wù)器領(lǐng)域GUP市場空間約為187.8億美元。3.2供給端:英偉達獨占鰲頭,國內(nèi)技術(shù)追趕空間廣闊英偉達市場份額獨占鰲頭,國際呈現(xiàn)三強格局,國內(nèi)廠商加速布局。英偉達憑借技術(shù)及產(chǎn)能優(yōu)勢,在移動端、AI服務(wù)器、自動駕駛領(lǐng)域具有較大話語權(quán)。國際市場方面,根據(jù)JonPeddieResearch調(diào)查數(shù)據(jù)顯示,2023年第一季度,全球桌面級顯卡銷量約為630萬塊,其中英偉達顯卡銷量約為529萬張,以84%的市場份額占據(jù)領(lǐng)先地位,此外銷量位居前三的GUP供應商還包括AMD及Intel,其銷量分別為76萬張、25萬張;國內(nèi)市場方面,我國廠商GPU市場份額較小,正處于技術(shù)追趕及國產(chǎn)替代環(huán)節(jié),目前國產(chǎn)GPU在數(shù)據(jù)中心、人工智能以及通用計算型GPU領(lǐng)域均實現(xiàn)產(chǎn)品布局,未來隨著國內(nèi)數(shù)據(jù)中心、智能駕駛及終端側(cè)GPU市場需求的提升,國產(chǎn)GPU市場份額有望實現(xiàn)滲透。1)游戲市場。產(chǎn)品及技術(shù)方面,GeForce是英偉達游戲業(yè)務(wù)的核心產(chǎn)品,增強技術(shù)協(xié)同打造游戲生態(tài)圈。英偉達在游戲顯卡入門級到專業(yè)級領(lǐng)域布局廣泛,目前GeForce系列游戲已成為全球最大的游戲平臺,擁有超過2億的游戲玩家,其最新產(chǎn)品GeForceRTX40系列,采用新型SM多單元流處理器及第四代TensorCore,可以通過AI增強圖形渲染,多項技術(shù)業(yè)界領(lǐng)先。國內(nèi)的桌面級顯卡的主要研究廠商包括芯動科技、摩爾線程以及凌久電子,部分產(chǎn)品已對標國際中高端產(chǎn)品。其中,芯動科技先后推出“風華1號”、“風華2號”GPU,其產(chǎn)品支持包括智能座艙、桌面辦公、筆記本、服務(wù)器等應用在內(nèi)的各個領(lǐng)域以及Linux、Windows、Android等系統(tǒng);而摩爾線程首款桌面級游戲顯卡MTTS80,在1.8GHz的主頻下,能夠提供14.4TFLOPS的單精度浮點算力,根據(jù)PassMark的測試結(jié)果,MTTS80顯卡的性能已達到英偉達中端顯卡GeForceGTX750Ti的性能水平。盈利能力方面,英偉達2024財年第二季度游戲業(yè)務(wù)實現(xiàn)營收24.9億美元,同比增長22%。疫情期間由于PC出貨量的下滑,對于公司游戲業(yè)務(wù)影響較大,2023財年英偉達游戲業(yè)務(wù)實現(xiàn)營收22.4億美元,同比下滑38%,隨著疫情影響退出,游戲業(yè)務(wù)迎來回暖。權(quán)威機構(gòu)JonPeddieResearchGPU市場統(tǒng)計數(shù)據(jù)顯示,2023第二季度英偉達以68%的PC顯卡市場份額占據(jù)市場第一。2)數(shù)據(jù)中心市場。英偉達憑借GUP硬件實力以及數(shù)據(jù)中心強大產(chǎn)品矩陣,占據(jù)市場領(lǐng)導地位。GPU硬件產(chǎn)品方面,英偉達高性能計算GPU經(jīng)歷數(shù)十代產(chǎn)品迭代升級,其技術(shù)指標全面升級,公司于2022年發(fā)行的H100芯片,采用臺積電4N工藝,集成最高可達18432個單精度和9216個雙精度的CUDA核心以及576個第四代Tensor核心,為高性能計算及AI研究提供強大的支持,在算力上,H100的FP16、TF32以及FP64性能達到了其上一代產(chǎn)品A100的3倍,分別為2000TFLOPS、1000TFLOPS和60TFLOPS。此外,英偉達還在軟件及技術(shù)產(chǎn)品方面提供支持,通過其豐富的產(chǎn)品矩陣搭建數(shù)據(jù)中心一站式解決方案。未來,隨著AI及高性能計算市場計算需求的不斷增長,GPU之間以及數(shù)據(jù)中心之間的通信傳輸需求也在增加,而英偉達NVLink技術(shù)可為GPU系統(tǒng)配置高更的寬帶及增強的可擴展能力,NVLinkSwitch系統(tǒng)基于NVLink的高級通信能力構(gòu)建,可為計算密集型工作負載提供更高帶寬和更低延遲,從而顯著增強服務(wù)器內(nèi)及服務(wù)器之間GPU通信能力。國產(chǎn)廠商在高性能計算GPU布局者較多,產(chǎn)品性能逐漸向英偉達靠攏。以英偉達最新發(fā)布的數(shù)據(jù)中心GPU為參考,H100SXM采用臺積電4N工藝,其單精度浮點算力已達到67TFLOPS,整型算力已達到3958TOPS,相比英偉達前序產(chǎn)品A100,H100的AI推理性能及HPC性能分別提升30倍與7倍;而目前國內(nèi)算力較高的產(chǎn)品為壁仞科技推出的BR100P,采用臺積電7nm工藝,峰值狀態(tài)下單精度浮點算力達240TFLOPS,整型算力達1920TOPS,BR100芯片性能相比于英偉達A100性能提升3倍以上,向H100產(chǎn)品靠攏。盈利能力及產(chǎn)能方面,數(shù)據(jù)中心業(yè)務(wù)營收已超游戲業(yè)務(wù),成為英偉達最高收入來源,但其產(chǎn)能受限于臺積電工藝,短期供需缺口較大。據(jù)英偉達2024財年Q2報告,其數(shù)據(jù)中心營收已達到103.2億美元,同比增長171%,約占總營收比例為76%;產(chǎn)能方面,英偉達H100均由臺積電代工,其產(chǎn)能受到臺積電工藝限制,據(jù)英偉達預計,H100芯片2023年全年全球范圍出貨量約為55萬顆,但據(jù)GPUUtils數(shù)據(jù)統(tǒng)計,保守估計情況下,H100的供給缺口將達到43萬顆。壁仞科技BR100P系列芯片同樣由臺積電代工,預計于2023年量產(chǎn),若量產(chǎn)計劃順利推進,國產(chǎn)替代有望滲透。3)智能駕駛。產(chǎn)品及技術(shù)方面,英偉達Thor芯片領(lǐng)先市場,同時搭建完整的自動駕駛生態(tài)網(wǎng)絡(luò)。英偉達于2022年9月宣布其車規(guī)級超級芯片Thor,Thor基于英偉達最新CPU與GPU打造,可提供每秒2000萬億次浮點運算性能,相比于前序產(chǎn)品Orin,性能提升8倍。此外,英偉達圍繞自動駕駛搭建完整的合作網(wǎng)絡(luò)與生態(tài),通過包括自動駕駛汽車、卡車、出租車、Tier1供應商、仿真測試、傳感器、軟件、地圖在內(nèi)的合作網(wǎng)絡(luò),以及從原始數(shù)據(jù)采集到驗證的自動駕駛技術(shù)、數(shù)據(jù)中心硬件、軟件及工作流在內(nèi)的生態(tài)環(huán)境,全方位加固自動駕駛領(lǐng)域護城河。目前,國內(nèi)大多數(shù)智能駕駛車型選用英偉達產(chǎn)品,地平線與華為自研市場份額正在逐步擴大。國內(nèi)蔚來、小鵬、理想等造車新勢力車型普遍選用英偉達ORIN產(chǎn)品,比如,在理想的入門級車型中搭載的智能駕駛芯片為地平線征程5,而在其高配置Max車型中則搭載英偉達ORIN芯片,除此之外華為在自動駕駛領(lǐng)域同樣具有布局,華為提供自動駕駛的全棧解決方案,其發(fā)布的昇騰610、MDC810已經(jīng)量產(chǎn),MDC610平臺,單組算力為200TOPS,與英偉達ORIN產(chǎn)品差距較小。盈利能力及產(chǎn)能方面,英偉達智能駕駛業(yè)務(wù)2024財年2季度營收較一季度出現(xiàn)下滑,但同比增加15%,總營收達2.53億美元。市場結(jié)構(gòu)上,2023年度H1中國市場乘用車自動駕駛計算方案市場份額中,英偉達仍以52.57%的份額占據(jù)第一,地平線以30.71%的市場份額占據(jù)第二,華為海思則占據(jù)4.05%的市場份額。3.3GPU產(chǎn)業(yè)鏈概況及國內(nèi)重點公司介紹GPU產(chǎn)業(yè)鏈上中下游分別為芯片設(shè)計、芯片制造及芯片封裝與測試。產(chǎn)業(yè)鏈上游,GPU設(shè)計基本以英偉達、超微半導體、英特爾三強壟斷,中下游臺積電憑借先進的4nm、7nm工藝及CoWoS封裝技術(shù)產(chǎn)能領(lǐng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論