版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
GPU行業(yè)研究報(bào)告:AI與自動(dòng)駕駛打造GPU強(qiáng)力增長引擎一、數(shù)字經(jīng)濟(jì)、AI、智能駕駛視角下看算力需求1.1演變趨勢(shì):從通用計(jì)算到智能計(jì)算,從分散獨(dú)立到云網(wǎng)邊協(xié)同宏觀角度下,數(shù)字經(jīng)濟(jì)建設(shè)及人工智能發(fā)展掀起了新一代算力革命,算力基建成為國家數(shù)字化轉(zhuǎn)型和經(jīng)濟(jì)發(fā)展的重要競爭策略。從1964年戈登·摩爾提出著名的摩爾定律后,CPU性能的發(fā)展便遵循這一規(guī)律,但目前數(shù)字經(jīng)濟(jì)與人工智能的高速發(fā)展,基于CPU的摩爾定律已經(jīng)失效,如何突破“算力墻”,滿足新時(shí)代各種算力需求,成為各國主要的競爭焦點(diǎn)。微觀角度下,算力形式逐漸由通用計(jì)算過渡為高性能計(jì)算,從分散獨(dú)立的端計(jì)算向云網(wǎng)邊協(xié)同計(jì)算演變。當(dāng)前,常見的高性能計(jì)算可以分為科學(xué)、工程計(jì)算與智能計(jì)算;算力資源服務(wù)可以分為云計(jì)算、混合計(jì)算及算力網(wǎng)絡(luò)。1)科學(xué)、工程計(jì)算。這類計(jì)算主要利用超級(jí)計(jì)算機(jī)實(shí)現(xiàn)并行計(jì)算,是一種算法優(yōu)化和硬件集群結(jié)合的計(jì)算模式。高性能計(jì)算由于具有較高的性能、效率及計(jì)算精度,可以廣泛的用于大規(guī)模復(fù)雜科學(xué)計(jì)算,比如工程模擬仿真、航空航天、地震預(yù)測(cè)等,同時(shí)也能支持人工智能、智慧城市等新興領(lǐng)域。2)智能計(jì)算。智能計(jì)算以智能芯片為計(jì)算算力底座,可以較好的滿足AI領(lǐng)域模型訓(xùn)練所需的智能運(yùn)算需求,因此用于支持專一的人工智能應(yīng)用場(chǎng)景?;谥悄苡?jì)算搭建的人工智能計(jì)算中心,通過將各種交叉技術(shù)集成,廣泛的應(yīng)用于智能語音處理、機(jī)器視覺、自然語言(文本)處理等不用的領(lǐng)域。3)云計(jì)算、混合計(jì)算、算力網(wǎng)絡(luò)屬于新型算力資源服務(wù)模式。云計(jì)算通過WorldWideWeb(萬維網(wǎng))向用戶提供包括服務(wù)器、存儲(chǔ)、數(shù)據(jù)庫等在內(nèi)的各項(xiàng)計(jì)算服務(wù),因?yàn)槿f維網(wǎng)以網(wǎng)頁為核心,因此云計(jì)算主要面向消費(fèi)互聯(lián)網(wǎng);而算力網(wǎng)絡(luò)主要以算法及算力協(xié)同為核心,通過協(xié)同聯(lián)動(dòng)云計(jì)算、邊緣計(jì)算、端計(jì)算及通信網(wǎng)絡(luò),能夠?qū)崿F(xiàn)對(duì)復(fù)雜計(jì)算任務(wù)的分解及高效調(diào)度。1.2戰(zhàn)略地位:算力屬于基礎(chǔ)設(shè)施建設(shè),是智能時(shí)代發(fā)展的物理承載整體架構(gòu)層面,算法、算力及數(shù)據(jù)是實(shí)現(xiàn)人工智能的三要素,其中算力是構(gòu)筑智能時(shí)代的物理基礎(chǔ)。人工智能離不開算力、算法及數(shù)據(jù),其發(fā)展需要在建立在龐大的數(shù)據(jù)集、優(yōu)秀的深度學(xué)習(xí)算法及強(qiáng)大的計(jì)算能力基礎(chǔ)之上,而算力作為底層基礎(chǔ)設(shè)施,是開啟智能時(shí)代的關(guān)鍵因素,其核心于智能芯片的技術(shù)進(jìn)步。實(shí)際發(fā)展層面,全球數(shù)據(jù)量正以指數(shù)級(jí)速度增長,“算力荒”問題日益凸顯。據(jù)IDC數(shù)據(jù)顯示,2018年至2019年全球大數(shù)據(jù)存儲(chǔ)量分別為33ZB、41ZB,而2020年全球數(shù)據(jù)量達(dá)到了60ZB,同比增長46%;龐大的數(shù)據(jù)集必然依賴強(qiáng)大的數(shù)據(jù)處理能力,進(jìn)而要求宏觀算力快速發(fā)展,NTCysd預(yù)計(jì)2021-2028年全球算力規(guī)模將以超過40%的速度增長,2028年將達(dá)到7510EFlops。1.3應(yīng)用驅(qū)動(dòng):數(shù)字經(jīng)濟(jì)搭建整體框架,AI大模型、智能駕駛持續(xù)拉升市場(chǎng)方面,數(shù)字經(jīng)濟(jì)建設(shè)、AI大模型、智能駕駛成為開啟智能時(shí)代的確定性研究方向。其中,數(shù)字經(jīng)濟(jì)建設(shè)搭建數(shù)字化布局整體框架,并提供政策支持;AI大模型及智能駕駛率先落地,成為拉動(dòng)算力需求的核心驅(qū)動(dòng)力。1)全球正加快數(shù)字經(jīng)濟(jì)建設(shè),算力發(fā)展成為主要戰(zhàn)略競爭點(diǎn)之一。目前,全球正處于經(jīng)濟(jì)數(shù)字化轉(zhuǎn)型階段,據(jù)中國信通院發(fā)布的《全球數(shù)字經(jīng)濟(jì)白皮書》顯示,數(shù)字經(jīng)濟(jì)已經(jīng)成為各國發(fā)展GDP的核心戰(zhàn)略,具體數(shù)據(jù)來看,2020年全球47個(gè)國家數(shù)字經(jīng)濟(jì)增加值達(dá)到32.6萬億美元,占GDP比重為43.7%,同比名義增長3%。此外,數(shù)字經(jīng)濟(jì)已經(jīng)成為我國穩(wěn)增長促轉(zhuǎn)型的重要引擎,出臺(tái)多項(xiàng)政策支持算力發(fā)展,截至2022年我國數(shù)字經(jīng)濟(jì)規(guī)模已達(dá)50.2億元,數(shù)字基礎(chǔ)設(shè)施規(guī)模能級(jí)大幅提升,在用數(shù)據(jù)中心算例總規(guī)模超180EFlops,位居世界第二。2)AI大模型的快速擴(kuò)張是算力需求的關(guān)鍵驅(qū)動(dòng)力。由于AI大模型通常需要在大規(guī)模無標(biāo)注的數(shù)據(jù)集上進(jìn)行重復(fù)的訓(xùn)練,因此相比于傳統(tǒng)的小模型在應(yīng)用場(chǎng)景上更具有普適性。但與此同時(shí),數(shù)據(jù)集的快速增長以及模型不斷迭代優(yōu)化使得AI大模型尺寸快速膨脹,GPU算力也遵循著同樣的增長規(guī)律。據(jù)
OpenAI
數(shù)據(jù)顯示,GPT-3175B相比于GPT-3Small,總計(jì)算力(Flops)及參數(shù)量增長了約1400倍;而據(jù)Semianalysis最新分析指出,GPT-4模型尺寸進(jìn)一步擴(kuò)張,在其120層模型中總共包含了1.8萬億參數(shù),約GPT-3175B參數(shù)量的10倍。3)汽車智能化功能升級(jí),智能駕駛將貢獻(xiàn)算力需求的全新增量。汽車正逐漸步入智能化時(shí)代,傳感器數(shù)量的增加及交互能力的提升,將帶來數(shù)據(jù)的幾何式增長,這必然要求車端擁有強(qiáng)大的數(shù)據(jù)分析和處理能力。據(jù)華經(jīng)產(chǎn)業(yè)研究院預(yù)測(cè),2025年我國L3、L5級(jí)別智能駕駛滲透率將分別達(dá)到14%、1%,到2030年兩者將分別達(dá)到40%、12%。而L3級(jí)別及以上智能駕駛汽車,不僅需要處理人機(jī)交互等指令,還需要與外界環(huán)境、云數(shù)據(jù)中心進(jìn)行交互。據(jù)分析,L3、L5級(jí)別智能駕駛算力需求將分別達(dá)到30-60TOPS、100TOPS,未來隨著智能駕駛汽車滲透率的提升,將會(huì)持續(xù)帶動(dòng)智能駕駛市場(chǎng)整體算力需求的增加,預(yù)計(jì)2025、2030年智能駕駛市場(chǎng)算力需求達(dá)到1.9萬、19萬TOPS,2021-2025CAGR達(dá)112%。1.4優(yōu)化路徑:提升芯片性能及創(chuàng)新存算架構(gòu)是研究主流系統(tǒng)算力主要受處理器性能與數(shù)據(jù)傳輸能力影響,當(dāng)數(shù)據(jù)處理能力與傳輸能力不匹配時(shí),計(jì)算能力由兩者中較低者決定。處理性能主要與指令復(fù)雜程度、頻率、并行度有關(guān),一般來說,指令越復(fù)雜、計(jì)算頻率越高、并行程度越大,處理器性能就越好;而數(shù)據(jù)傳輸?shù)哪芰εc處理器內(nèi)部存算架構(gòu)有關(guān),在計(jì)算機(jī)體系里,根據(jù)訪問延遲及容量大小將存儲(chǔ)結(jié)構(gòu)分為寄存器、緩存、內(nèi)存、外存與遠(yuǎn)程存儲(chǔ),而這種存算分離的架構(gòu)形式,通常使得數(shù)據(jù)傳輸成為限制系統(tǒng)算力的因素。1)指令的復(fù)雜程度。指令系統(tǒng)是連接計(jì)算機(jī)軟件和硬件的橋梁,一般來說,指令的復(fù)雜程度于處理器運(yùn)算性能有關(guān),指令越復(fù)雜,其性能就越好。典型的處理器平臺(tái)大致可以分為CPU、協(xié)處理器、GPU、FPGA、DSA、ASIC,其中CPU為通用軟件平臺(tái),支持包括整形計(jì)算類、浮點(diǎn)類、數(shù)據(jù)傳輸類、控制類等在內(nèi)的通用指令,而其余處理器為硬件加速平臺(tái),用于執(zhí)行各類復(fù)雜指令。2)計(jì)算頻率。一般來說,處理器計(jì)算的速度于頻率呈現(xiàn)正相關(guān)關(guān)系,計(jì)算頻率越高,速度越快。以CPU為例,執(zhí)行一條指令需要依次經(jīng)過取址、譯碼、地址生成、取操作數(shù)、執(zhí)行、寫回階段,每個(gè)階段需要消耗一個(gè)時(shí)鐘周期,上個(gè)階段執(zhí)行完畢后才會(huì)進(jìn)入到下個(gè)階段。在此基礎(chǔ)上,時(shí)鐘周期的設(shè)定便取決于各階段用時(shí)最大者,而提高時(shí)鐘頻率大致有兩種方法:一是通過超流水線架構(gòu)提高處理器主頻,通過增加多級(jí)流水從而細(xì)化每個(gè)階段;一是通過優(yōu)化工藝技術(shù)降低各階段邏輯門處理延遲。3)并行度。并行度是指在計(jì)算機(jī)體系中,指令并行執(zhí)行的最大數(shù)目,并行度越大,意味著系統(tǒng)能夠同時(shí)處理更多指令,其運(yùn)算速度越快。常用的并行設(shè)計(jì)包括指令并行、處理器核并行、芯片級(jí)并行及服務(wù)器并行。4)數(shù)據(jù)傳輸能力。數(shù)據(jù)傳輸能力并不直接影響處理器性能,但復(fù)雜的存儲(chǔ)分層結(jié)構(gòu)會(huì)使得系統(tǒng)功耗、延遲及訪問寬帶增加,從而限制算力的提升。優(yōu)秀的計(jì)算系統(tǒng)應(yīng)使得處理器性能與數(shù)據(jù)傳輸能力盡可能匹配,以減少“木桶效應(yīng)”對(duì)于算力的限制。目前,數(shù)據(jù)傳輸能力的優(yōu)化方向主要包括近存計(jì)算及存算一體化架構(gòu)。二、算力需求視角下看GPU發(fā)展的必然趨勢(shì)2.1性能:GPU技術(shù)發(fā)展迅速,高并發(fā)計(jì)算能力契合算力需求1)橫向比較,GPU較CPU而言,更符合深度學(xué)習(xí)算法的高度并行計(jì)算需求。一方面,CPU性能提升已達(dá)到瓶頸,與高速增長的算力需求脫節(jié)。CPU作為第一代高效計(jì)算平臺(tái),目前無論從不管是從架構(gòu)/微架構(gòu)設(shè)計(jì)、工藝、多核并行等各種角度出發(fā),其性能都難以提升,2016年之后,CPU性能每年提升僅3.5%。隨著數(shù)字經(jīng)濟(jì)、AI大模型、智能駕駛等算力需求的推動(dòng),CPU性能已無法滿足上層軟件算力需求。另一方面,GPU較CPU具備更多的算術(shù)邏輯單元、控制單元與內(nèi)存緩存,其SIMD架構(gòu)與深度學(xué)習(xí)算法需求更吻合。CPU為線程級(jí)并行的
MIMD
架構(gòu),其核心少但性能強(qiáng),可以用來處理復(fù)雜的控制邏輯、預(yù)測(cè)分支、亂序執(zhí)行、多級(jí)流水等,而GPU為數(shù)據(jù)級(jí)并行的SIMD架構(gòu),其核心多但性能弱,用于優(yōu)化具有簡單控制邏輯的數(shù)據(jù)并行任務(wù)。而神經(jīng)網(wǎng)絡(luò)算法數(shù)據(jù)要求量大,并行計(jì)算程度高,與GPU高并行計(jì)算能力、高內(nèi)存帶寬相適配。神經(jīng)網(wǎng)絡(luò)的訓(xùn)練環(huán)節(jié)需要處理大量的數(shù)據(jù),并且其結(jié)構(gòu)非常統(tǒng)一,每一層成千上萬個(gè)相同的人工神經(jīng)元都在執(zhí)行相同的計(jì)算操作,具有高效并行計(jì)算能力與內(nèi)存帶寬的GPU,不僅能夠更快的完成數(shù)據(jù)的讀取與寫入,還能實(shí)行多條指令并行計(jì)算。2)縱向比較,GPU架構(gòu)技術(shù)仍在演進(jìn),其高性能計(jì)算與智能計(jì)算能力不斷優(yōu)化GPU最早作為顯卡的核心零部件,專用于圖形渲染及處理。GPU(GraphicProcessingUnit),即圖形處理單元,英偉達(dá)公司在1999年發(fā)布GeForce256圖形處理芯片時(shí)首先提出GPU的概念,GeForce256作為專門負(fù)責(zé)計(jì)算機(jī)圖形顯示的計(jì)算機(jī)零部件,通過T&L及其他多項(xiàng)技術(shù)引擎,減少了顯卡對(duì)于CPU的依賴。GPU組成中通常包含一個(gè)顯存、一個(gè)主頻、一個(gè)VRAM、一個(gè)顯存速率以及一個(gè)顯存位寬。GPU架構(gòu)迭代頻繁,已從從專用圖形處理器發(fā)展為高效的通用計(jì)算平臺(tái),向外拓展人工智能計(jì)算及高性能計(jì)算領(lǐng)域。當(dāng)GPU引入可編程特性,將圖形硬件的流水線作為流處理器來解釋,基于GPU的通用計(jì)算也開始出現(xiàn),即GPGPU。英偉達(dá)產(chǎn)品在2008-2022年內(nèi),架構(gòu)迭代調(diào)整了8次,其在2010年推出具有完整GPU架構(gòu)的Fermi,在2017年Volta架構(gòu)中首次推出Tensor內(nèi)核以支持深度學(xué)習(xí)算法,而目前Hopper架構(gòu)的GPU已廣泛的應(yīng)用于AI大模型訓(xùn)練與推理環(huán)節(jié)。英偉達(dá)Tensor核心持續(xù)升級(jí),智能計(jì)算及高性能計(jì)算能力得到不斷優(yōu)化,已成為AI模型推理的關(guān)鍵張量核心。英偉達(dá)Tensor核心最初在Volta架構(gòu)上推出,在后續(xù)推出的Turing、Ampere、Hopper上不斷優(yōu)化,Tensor核心能夠加速矩陣運(yùn)算,大幅增加浮點(diǎn)計(jì)算吞吐量。具體來看,擁有Tensor核心的V100相比于P100其混合精度運(yùn)算速度提高了9倍,而英偉達(dá)推出的第四代Tensor核心其FP8性能較AmpereFP6提高16倍,而在AI大型語言模型推理方面,性能比Ampere高出30倍。2.2靈活性:GPU可編程優(yōu)勢(shì)明顯,通用靈活性適配AI應(yīng)用端拓展GPU擁有相對(duì)較優(yōu)的性能及靈活性。常用的計(jì)算平臺(tái)包括CPU、FPGA、GPU、DSA以及ASIC,一般情況下隨著芯片性能的提升,其靈活性會(huì)逐漸下降。CPU為軟件加速平臺(tái),通過標(biāo)準(zhǔn)化的指令集使得CPU平臺(tái)的硬件實(shí)現(xiàn)與軟件編程完全解耦,靈活性最高;ASIC為專用集成電路,是一種為專門目的而設(shè)計(jì)的集成電路,不支持硬件編程,靈活性最差。1)ASIC、DSA設(shè)計(jì)成本高、周期長,其靈活性難以滿足應(yīng)用層及宏架構(gòu)趨勢(shì)的需求。DSA與ASIC屬于專用領(lǐng)域定制類型芯片,其中ASIC屬于完全定制性化芯片,其晶體管根據(jù)算法定制,流片量產(chǎn)后算法便不可編輯;DSA在ASIC基礎(chǔ)上回調(diào),保留一定編程能力,但其功能覆蓋的領(lǐng)域成具有較大的局限性。ASIC與DSA的通用性是限制其應(yīng)用的關(guān)鍵因素。首先,通用性限制了ASIC與DSA的應(yīng)用領(lǐng)域,與芯片高企的研發(fā)成本相矛盾。據(jù)估計(jì),5nm制程的芯片研發(fā)成本已經(jīng)超5億美元,高企的研發(fā)成本需要具有充分量產(chǎn)能力芯片來攤薄,而ASIC與DSA芯片均為面向特定領(lǐng)域?qū)S眯酒?,不同領(lǐng)域則面臨重新設(shè)計(jì)的問題,尤其是在AI應(yīng)用領(lǐng)域,ASIC與DSA的研發(fā)周期和成本并不能滿足其AI應(yīng)用及算法迭代優(yōu)化的速度。其次,專用性使得ASIC與DSA芯片與算力融合的宏架構(gòu)趨勢(shì)相矛盾。數(shù)字經(jīng)濟(jì)的建設(shè)需用云、網(wǎng)、邊各部分資源協(xié)同融合,從而組成龐大的算力網(wǎng)絡(luò),然而不同計(jì)算引擎、平臺(tái)、設(shè)備以及數(shù)據(jù)中心的芯片應(yīng)用場(chǎng)景具有較大的差異,這使得DSA、ASIC芯片難以成為數(shù)字經(jīng)濟(jì)時(shí)代的整體解決方案。2)CUDA、OpenCL技術(shù)持續(xù)為GPU賦能,GPU性能提升潛力大、應(yīng)用拓展力強(qiáng)。一方面,CUDA生態(tài)為GPU提供各種數(shù)據(jù)接口(API)、算法庫與工具、跨平臺(tái)支持以及大規(guī)模集群計(jì)算支持,CUDA使得開發(fā)人員能夠使用流行的編程語言對(duì)英偉達(dá)GPU進(jìn)行編程,同時(shí)還集成包括TensorFlow、PyTorch和MXNet在內(nèi)的所有深度學(xué)習(xí)框架;另一方面,隨著深度學(xué)習(xí)算法和模型的收斂,GPU可以通過對(duì)算法進(jìn)行手工優(yōu)化實(shí)現(xiàn)資源的高效調(diào)度,充分釋放出硬件的性能,每一代CUDA升級(jí)都會(huì)帶來約10-20%的性能提升。三、GPU市場(chǎng):供給推動(dòng)市場(chǎng),技術(shù)及產(chǎn)能是核心驅(qū)動(dòng)力3.1需求端:移動(dòng)端兜底,自動(dòng)駕駛及數(shù)據(jù)中心建設(shè)貢獻(xiàn)增量GPU下游目前主要應(yīng)用于移動(dòng)端、數(shù)據(jù)中心服務(wù)器以及車規(guī)級(jí)芯片。其中,移動(dòng)端應(yīng)用又可以分為PCGPU、手機(jī)GPU,主要用于加速圖形處理,以提高計(jì)算機(jī)游戲的圖像質(zhì)量及性能,目前隨著深度學(xué)習(xí)及人工智能的發(fā)展,移動(dòng)端GPU也可以用于加速深度學(xué)習(xí)、計(jì)算機(jī)視覺和自然語言處理等人工智能應(yīng)用;數(shù)據(jù)中心服務(wù)器又可以分為高性能計(jì)算服務(wù)器與智能計(jì)算服務(wù)器,由于GPU具有高并發(fā)的計(jì)算能力,因此被廣泛的用于數(shù)據(jù)中心建設(shè);在汽車領(lǐng)域,GPU主要應(yīng)用于車端及其配套設(shè)施智能芯片,負(fù)責(zé)處理來自攝像頭、普通雷達(dá)、激光雷達(dá)等傳感器數(shù)據(jù),實(shí)現(xiàn)智能駕駛。1)個(gè)人電腦為GPU移動(dòng)端主要市場(chǎng),智能手機(jī)及可穿戴設(shè)備有望滲透。GPU作為圖形處理加速硬件,其最常見的應(yīng)用即為個(gè)人電腦、智能手機(jī)等游戲設(shè)備,不限于創(chuàng)建圖像、圖像處理、計(jì)算攝影、手勢(shì)識(shí)別的視覺處理需求。但目前隨著消費(fèi)電子需求減弱,尤其是個(gè)人電腦市場(chǎng)下滑的影響,PC端顯卡需求處于下行區(qū)間,據(jù)JonPeddieResearch數(shù)據(jù)統(tǒng)計(jì),2023年第一季度全球PC桌面顯卡銷量約630萬塊,同比下降52.9%。手機(jī)游戲圖顯需求及終端AI架構(gòu),有望打造移動(dòng)端GPU增長新引擎。一方面,手機(jī)端游戲市場(chǎng)規(guī)模逐漸增大,NEWZOO數(shù)據(jù)顯示,2022年全球移動(dòng)游戲市場(chǎng)規(guī)模已達(dá)1035億美元,約占游戲市場(chǎng)總規(guī)模53%;另一方面,手機(jī)端GPU光線追蹤技術(shù)尚未普及,未來隨著手機(jī)端游戲圖形渲染需求的提升,對(duì)GPU性能要求將逐漸增加,目前高通、聯(lián)發(fā)科、英偉達(dá)、AMD、ARM等著名芯片廠商均開始布局手機(jī)GPU,有望加速移動(dòng)端GPU擴(kuò)量。移動(dòng)端作為AI架構(gòu)的終端設(shè)備,有望承載部分AI計(jì)算功能。隨著AI技術(shù)的快速發(fā)展,以及計(jì)算需求的提升,AI處理須分布在云端及終端進(jìn)行,這種混合AI架構(gòu)可以根據(jù)模型和查詢需求的復(fù)雜度等因素,選擇不同方式在云端和終端側(cè)之間分配處理負(fù)載。未來,隨著終端側(cè)AI處理需求的提升,將對(duì)終端設(shè)備,包括手機(jī)、電腦、汽車、XR等便攜設(shè)備以及物聯(lián)網(wǎng)設(shè)備的AI計(jì)算及推理性能提出新的需求,有望帶動(dòng)移動(dòng)端GPU需求的提升。2)自動(dòng)駕駛貢獻(xiàn)GPU全新增量,藍(lán)海廣闊。車載芯片的架構(gòu)模式經(jīng)歷分布式架構(gòu)向混合式架構(gòu)轉(zhuǎn)變,未來將向中心計(jì)算架構(gòu)演進(jìn)。計(jì)算架構(gòu)將隨著自動(dòng)駕駛升級(jí)進(jìn)行優(yōu)化,不同的計(jì)算架構(gòu),對(duì)于車載芯片的要求具有差異。分布式架構(gòu)計(jì)算需求小,僅通過CPU控制;混合式架構(gòu)為實(shí)現(xiàn)部分自動(dòng)駕駛功能將引入GPU來輔助計(jì)算;而中央計(jì)算架構(gòu)中,汽車端計(jì)算將升級(jí)為更加通用的計(jì)算平臺(tái),進(jìn)而保證了整車架構(gòu)的穩(wěn)定性和功能的擴(kuò)展性。分布式計(jì)算架構(gòu)中,每個(gè)ECU負(fù)責(zé)特定的功能如燈光控制、門控制、車輪控制等等,隨著汽車功能的增多,分布式架構(gòu)需要配置更多的ECU及線束,將會(huì)使得汽車內(nèi)部架構(gòu)復(fù)雜,不利于汽車架構(gòu)及功能擴(kuò)展?;旌鲜接?jì)算架構(gòu)減少了ECU數(shù)量,根據(jù)汽車各部分功能進(jìn)行劃分,如博世將汽車控制分五個(gè)功能域(動(dòng)力域、底盤域、車身域、座艙域、自動(dòng)駕駛域),每個(gè)功能域設(shè)置域控制器,再通過以太網(wǎng)和CANFD相連。不同功能域所需算力不同,座艙域及自動(dòng)駕駛域由于要滿足人機(jī)交互、機(jī)器視覺等需求,其算力要求較高,通常通過DPU(CPU+GPU+FPGA)架構(gòu)來滿足算力需求。中央計(jì)算架構(gòu)或汽車云計(jì)算架構(gòu),將功能域深度融合,升級(jí)為更加通用的計(jì)算平臺(tái),將顯著增加車端的計(jì)算需求。在這種架構(gòu)中,區(qū)域控制器平臺(tái)相當(dāng)于局部中央計(jì)算平臺(tái),與混合式架構(gòu)區(qū)域控制器的不同在于,中央計(jì)算架構(gòu)中的區(qū)域控制器需要獨(dú)自處理局部區(qū)域傳感器、執(zhí)行器、ECU等部件傳回的數(shù)據(jù),而混合式架構(gòu)中的區(qū)域控制器需將這部分?jǐn)?shù)據(jù)傳輸至中央計(jì)算平臺(tái)處理;同時(shí)還需承擔(dān)控制和協(xié)調(diào)本區(qū)域執(zhí)行單元及網(wǎng)絡(luò)協(xié)議轉(zhuǎn)換的責(zé)任。國內(nèi)外廠商車載芯片多數(shù)采用含GPU架構(gòu),隨著智能駕駛升級(jí),有望拉升車端GPU需求。智能駕駛時(shí)代,車端芯片承載的功能增加,不僅需要處理各環(huán)節(jié)傳感器收集的環(huán)境數(shù)據(jù)、地圖定位數(shù)據(jù)、V2X信息通信數(shù)據(jù),還需要通過各種智能算法規(guī)劃最佳決策,同時(shí)控制執(zhí)行單元。隨著AI技術(shù)的進(jìn)步,基于深度學(xué)習(xí)算法的智能駕駛方案成為汽車制造商的布局重點(diǎn)。目前國內(nèi)芯片制造廠商普遍采用GPU加速深度學(xué)習(xí)算法,例如英偉達(dá)ORIN采用CPU+GPU+ACCEL架構(gòu),其算力由GPU及DLA提供。根據(jù)測(cè)算,預(yù)計(jì)2023年全球自動(dòng)駕駛領(lǐng)域GPU市場(chǎng)空間將達(dá)到24億美元。3)受益于數(shù)字經(jīng)濟(jì)及人工智能,數(shù)據(jù)中心市場(chǎng)GPU加速放量。高性能計(jì)算中心及智算中心建設(shè)屬于數(shù)字經(jīng)濟(jì)建設(shè)重要的一環(huán),二者的建設(shè)將帶動(dòng)GPU市場(chǎng)增長。據(jù)Hyperion研究顯示,2025年全球高性能計(jì)算市場(chǎng)規(guī)模將達(dá)到199億美元,2022-2025年CAGR約為5.5%,此外,根據(jù)超算top500統(tǒng)計(jì),全球前500超級(jí)計(jì)算機(jī)中56%算力由GPU提供,GPU需求將隨著高性能計(jì)算市場(chǎng)增長同步提升,預(yù)計(jì)2023年全球高性能計(jì)算中心GUP市場(chǎng)空間約為21億美元。不同于高性能計(jì)算中心,智算中心是利是用先進(jìn)的人工智能算法和芯片進(jìn)行智能算法模型訓(xùn)練和推理??偭糠矫?,根據(jù)IDC及中商情報(bào)網(wǎng)數(shù)據(jù)預(yù)測(cè),2023年全球AI服務(wù)器市場(chǎng)規(guī)模將達(dá)到211億美元,同比增長15%,而據(jù)AletheiaCapital最新報(bào)告分析,2025年AI服務(wù)器市場(chǎng)規(guī)模將激增至1350億美元,2023-2025CAGR高達(dá)152%;價(jià)值方面,由于智能算法具有計(jì)算難度小、計(jì)算量大等特點(diǎn),對(duì)于計(jì)算任務(wù)的高并發(fā)能力及吞吐量要求較高,因此對(duì)于GPU的需求更大,據(jù)統(tǒng)計(jì),機(jī)器學(xué)習(xí)型AI服務(wù)器中,GPU成本占比約為72.8%。未來,隨著智算中心建設(shè)有序推進(jìn),GPU有望迎來量價(jià)齊升,預(yù)計(jì)2023年AI服務(wù)器領(lǐng)域GUP市場(chǎng)空間約為187.8億美元。3.2供給端:英偉達(dá)獨(dú)占鰲頭,國內(nèi)技術(shù)追趕空間廣闊英偉達(dá)市場(chǎng)份額獨(dú)占鰲頭,國際呈現(xiàn)三強(qiáng)格局,國內(nèi)廠商加速布局。英偉達(dá)憑借技術(shù)及產(chǎn)能優(yōu)勢(shì),在移動(dòng)端、AI服務(wù)器、自動(dòng)駕駛領(lǐng)域具有較大話語權(quán)。國際市場(chǎng)方面,根據(jù)JonPeddieResearch調(diào)查數(shù)據(jù)顯示,2023年第一季度,全球桌面級(jí)顯卡銷量約為630萬塊,其中英偉達(dá)顯卡銷量約為529萬張,以84%的市場(chǎng)份額占據(jù)領(lǐng)先地位,此外銷量位居前三的GUP供應(yīng)商還包括AMD及Intel,其銷量分別為76萬張、25萬張;國內(nèi)市場(chǎng)方面,我國廠商GPU市場(chǎng)份額較小,正處于技術(shù)追趕及國產(chǎn)替代環(huán)節(jié),目前國產(chǎn)GPU在數(shù)據(jù)中心、人工智能以及通用計(jì)算型GPU領(lǐng)域均實(shí)現(xiàn)產(chǎn)品布局,未來隨著國內(nèi)數(shù)據(jù)中心、智能駕駛及終端側(cè)GPU市場(chǎng)需求的提升,國產(chǎn)GPU市場(chǎng)份額有望實(shí)現(xiàn)滲透。1)游戲市場(chǎng)。產(chǎn)品及技術(shù)方面,GeForce是英偉達(dá)游戲業(yè)務(wù)的核心產(chǎn)品,增強(qiáng)技術(shù)協(xié)同打造游戲生態(tài)圈。英偉達(dá)在游戲顯卡入門級(jí)到專業(yè)級(jí)領(lǐng)域布局廣泛,目前GeForce系列游戲已成為全球最大的游戲平臺(tái),擁有超過2億的游戲玩家,其最新產(chǎn)品GeForceRTX40系列,采用新型SM多單元流處理器及第四代TensorCore,可以通過AI增強(qiáng)圖形渲染,多項(xiàng)技術(shù)業(yè)界領(lǐng)先。國內(nèi)的桌面級(jí)顯卡的主要研究廠商包括芯動(dòng)科技、摩爾線程以及凌久電子,部分產(chǎn)品已對(duì)標(biāo)國際中高端產(chǎn)品。其中,芯動(dòng)科技先后推出“風(fēng)華1號(hào)”、“風(fēng)華2號(hào)”GPU,其產(chǎn)品支持包括智能座艙、桌面辦公、筆記本、服務(wù)器等應(yīng)用在內(nèi)的各個(gè)領(lǐng)域以及Linux、Windows、Android等系統(tǒng);而摩爾線程首款桌面級(jí)游戲顯卡MTTS80,在1.8GHz的主頻下,能夠提供14.4TFLOPS的單精度浮點(diǎn)算力,根據(jù)PassMark的測(cè)試結(jié)果,MTTS80顯卡的性能已達(dá)到英偉達(dá)中端顯卡GeForceGTX750Ti的性能水平。盈利能力方面,英偉達(dá)2024財(cái)年第二季度游戲業(yè)務(wù)實(shí)現(xiàn)營收24.9億美元,同比增長22%。疫情期間由于PC出貨量的下滑,對(duì)于公司游戲業(yè)務(wù)影響較大,2023財(cái)年英偉達(dá)游戲業(yè)務(wù)實(shí)現(xiàn)營收22.4億美元,同比下滑38%,隨著疫情影響退出,游戲業(yè)務(wù)迎來回暖。權(quán)威機(jī)構(gòu)JonPeddieResearchGPU市場(chǎng)統(tǒng)計(jì)數(shù)據(jù)顯示,2023第二季度英偉達(dá)以68%的PC顯卡市場(chǎng)份額占據(jù)市場(chǎng)第一。2)數(shù)據(jù)中心市場(chǎng)。英偉達(dá)憑借GUP硬件實(shí)力以及數(shù)據(jù)中心強(qiáng)大產(chǎn)品矩陣,占據(jù)市場(chǎng)領(lǐng)導(dǎo)地位。GPU硬件產(chǎn)品方面,英偉達(dá)高性能計(jì)算GPU經(jīng)歷數(shù)十代產(chǎn)品迭代升級(jí),其技術(shù)指標(biāo)全面升級(jí),公司于2022年發(fā)行的H100芯片,采用臺(tái)積電4N工藝,集成最高可達(dá)18432個(gè)單精度和9216個(gè)雙精度的CUDA核心以及576個(gè)第四代Tensor核心,為高性能計(jì)算及AI研究提供強(qiáng)大的支持,在算力上,H100的FP16、TF32以及FP64性能達(dá)到了其上一代產(chǎn)品A100的3倍,分別為2000TFLOPS、1000TFLOPS和60TFLOPS。此外,英偉達(dá)還在軟件及技術(shù)產(chǎn)品方面提供支持,通過其豐富的產(chǎn)品矩陣搭建數(shù)據(jù)中心一站式解決方案。未來,隨著AI及高性能計(jì)算市場(chǎng)計(jì)算需求的不斷增長,GPU之間以及數(shù)據(jù)中心之間的通信傳輸需求也在增加,而英偉達(dá)NVLink技術(shù)可為GPU系統(tǒng)配置高更的寬帶及增強(qiáng)的可擴(kuò)展能力,NVLinkSwitch系統(tǒng)基于NVLink的高級(jí)通信能力構(gòu)建,可為計(jì)算密集型工作負(fù)載提供更高帶寬和更低延遲,從而顯著增強(qiáng)服務(wù)器內(nèi)及服務(wù)器之間GPU通信能力。國產(chǎn)廠商在高性能計(jì)算GPU布局者較多,產(chǎn)品性能逐漸向英偉達(dá)靠攏。以英偉達(dá)最新發(fā)布的數(shù)據(jù)中心GPU為參考,H100SXM采用臺(tái)積電4N工藝,其單精度浮點(diǎn)算力已達(dá)到67TFLOPS,整型算力已達(dá)到3958TOPS,相比英偉達(dá)前序產(chǎn)品A100,H100的AI推理性能及HPC性能分別提升30倍與7倍;而目前國內(nèi)算力較高的產(chǎn)品為壁仞科技推出的BR100P,采用臺(tái)積電7nm工藝,峰值狀態(tài)下單精度浮點(diǎn)算力達(dá)240TFLOPS,整型算力達(dá)1920TOPS,BR100芯片性能相比于英偉達(dá)A100性能提升3倍以上,向H100產(chǎn)品靠攏。盈利能力及產(chǎn)能方面,數(shù)據(jù)中心業(yè)務(wù)營收已超游戲業(yè)務(wù),成為英偉達(dá)最高收入來源,但其產(chǎn)能受限于臺(tái)積電工藝,短期供需缺口較大。據(jù)英偉達(dá)2024財(cái)年Q2報(bào)告,其數(shù)據(jù)中心營收已達(dá)到103.2億美元,同比增長171%,約占總營收比例為76%;產(chǎn)能方面,英偉達(dá)H100均由臺(tái)積電代工,其產(chǎn)能受到臺(tái)積電工藝限制,據(jù)英偉達(dá)預(yù)計(jì),H100芯片2023年全年全球范圍出貨量約為55萬顆,但據(jù)GPUUtils數(shù)據(jù)統(tǒng)計(jì),保守估計(jì)情況下,H100的供給缺口將達(dá)到43萬顆。壁仞科技BR100P系列芯片同樣由臺(tái)積電代工,預(yù)計(jì)于2023年量產(chǎn),若量產(chǎn)計(jì)劃順利推進(jìn),國產(chǎn)替代有望滲透。3)智能駕駛。產(chǎn)品及技術(shù)方面,英偉達(dá)Thor芯片領(lǐng)先市場(chǎng),同時(shí)搭建完整的自動(dòng)駕駛生態(tài)網(wǎng)絡(luò)。英偉達(dá)于2022年9月宣布其車規(guī)級(jí)超級(jí)芯片Thor,Thor基于英偉達(dá)最新CPU與GPU打造,可提供每秒2000萬億次浮點(diǎn)運(yùn)算性能,相比于前序產(chǎn)品Orin,性能提升8倍。此外,英偉達(dá)圍繞自動(dòng)駕駛搭建完整的合作網(wǎng)絡(luò)與生態(tài),通過包括自動(dòng)駕駛汽車、卡車、出租車、Tier1供應(yīng)商、仿真測(cè)試、傳感器、軟件、地圖在內(nèi)的合作網(wǎng)絡(luò),以及從原始數(shù)據(jù)采集到驗(yàn)證的自動(dòng)駕駛技術(shù)、數(shù)據(jù)中心硬件、軟件及工作流在內(nèi)的生態(tài)環(huán)境,全方位加固自動(dòng)駕駛領(lǐng)域護(hù)城河。目前,國內(nèi)大多數(shù)智能駕駛車型選用英偉達(dá)產(chǎn)品,地平線與華為自研市場(chǎng)份額正在逐步擴(kuò)大。國內(nèi)蔚來、小鵬、理想等造車新勢(shì)力車型普遍選用英偉達(dá)ORIN產(chǎn)品,比如,在理想的入門級(jí)車型中搭載的智能駕駛芯片為地平線征程5,而在其高配置Max車型中則搭載英偉達(dá)ORIN芯片,除此之外華為在自動(dòng)駕駛領(lǐng)域同樣具有布局,華為提供自動(dòng)駕駛的全棧解決方案,其發(fā)布的昇騰610、MDC810已經(jīng)量產(chǎn),MDC610平臺(tái),單組算力為200TOPS,與英偉達(dá)ORIN產(chǎn)品差距較小。盈利能力及產(chǎn)能方面,英偉達(dá)智能駕駛業(yè)務(wù)2024財(cái)年2季度營收較一季度出現(xiàn)下滑,但同比增加15%,總營收達(dá)2.53億美元。市場(chǎng)結(jié)構(gòu)上,2023年度H1中國市場(chǎng)乘用車自動(dòng)駕駛計(jì)算方案市場(chǎng)份額中,英偉達(dá)仍以52.57%的份額占據(jù)第一,地平線以30.71%的市場(chǎng)份額占據(jù)第二,華為海思則占據(jù)4.05%的市場(chǎng)份額。3.3GPU產(chǎn)業(yè)鏈概況及國內(nèi)重點(diǎn)公司介紹GPU產(chǎn)業(yè)鏈上中下游分別為芯片設(shè)計(jì)、芯片制造及芯片封裝與測(cè)試。產(chǎn)業(yè)鏈上游,GPU設(shè)計(jì)基本以英偉達(dá)、超微半導(dǎo)體、英特爾三強(qiáng)壟斷,中下游臺(tái)積電憑借先進(jìn)的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024版通訊器材購銷合同3篇
- 2025年度大型活動(dòng)場(chǎng)地租賃及服務(wù)合同4篇
- 2025年P(guān)VC管道產(chǎn)品檢測(cè)與質(zhì)量保證服務(wù)合同范本3篇
- 2025年消防給水系統(tǒng)設(shè)備及工程安全防護(hù)合同3篇
- 2025年度餐飲股份合作人力資源合作協(xié)議3篇
- 2024版跨國投資風(fēng)險(xiǎn)共保協(xié)議版B版
- 二零二五版國有控股企業(yè)股權(quán)置換與混合所有制改革合同3篇
- 2025年度消防安全通道維護(hù)外包服務(wù)合同3篇
- 2024移動(dòng)支付技術(shù)服務(wù)合同
- 2024版暫定協(xié)議總價(jià)協(xié)議樣本版B版
- 《消防設(shè)備操作使用》培訓(xùn)
- 新交際英語(2024)一年級(jí)上冊(cè)Unit 1~6全冊(cè)教案
- 2024年度跨境電商平臺(tái)運(yùn)營與孵化合同
- 2024年電動(dòng)汽車充電消費(fèi)者研究報(bào)告-2024-11-新能源
- 湖北省黃岡高級(jí)中學(xué)2025屆物理高一第一學(xué)期期末考試試題含解析
- 上海市徐匯中學(xué)2025屆物理高一第一學(xué)期期末學(xué)業(yè)水平測(cè)試試題含解析
- 稻殼供貨合同范本
- 《采氣樹基礎(chǔ)知識(shí)》課件
- 超齡員工用工免責(zé)協(xié)議書
- 機(jī)械工程師招聘筆試題及解答(某大型國企)
- 軟件運(yùn)維考核指標(biāo)
評(píng)論
0/150
提交評(píng)論