版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
電子行業(yè)市場(chǎng)分析研究1.ChatGPT快速迭代,OpenAI模型演進(jìn),下游應(yīng)用百花齊放GPT-4是一個(gè)大型的多模態(tài)模型,相比上一代ChatGPT新增了圖像功能,同時(shí)具備更精準(zhǔn)的語(yǔ)言理解能力。GPT的升級(jí)背后是OpenAI的大語(yǔ)言模型的進(jìn)一步演進(jìn),同時(shí)帶動(dòng)下游應(yīng)用的拓展,涌現(xiàn)出新一批應(yīng)用場(chǎng)景。1.1.GPT迭代更新,人工智能掀起科技潮。GPT升級(jí)至四代,模型能力高速提升。ChatGPT是由OpenAI開(kāi)發(fā)的自然語(yǔ)言生成模型,采用Transformer神經(jīng)網(wǎng)絡(luò)架構(gòu)(又稱(chēng)GPT-3.5架構(gòu)),基于大量的語(yǔ)料庫(kù)使用指示學(xué)習(xí)和人工反饋的強(qiáng)化學(xué)習(xí)(RLHF)來(lái)指導(dǎo)模型訓(xùn)練。模型可理解并生成對(duì)各種主題的類(lèi)似人類(lèi)的響應(yīng),是AIGC技術(shù)進(jìn)展的成果。2023年3月15日,OpenAI正式官宣了多模態(tài)大模型GPT-4,ChatGPT4將輸入內(nèi)容擴(kuò)展到2.5萬(wàn)字內(nèi)的文字和圖像,較ChatGPT能夠處理更復(fù)雜、更細(xì)微的問(wèn)題。ChatGPT提供變革性的用戶體驗(yàn),用戶數(shù)量飆升。ChatGPT發(fā)布后爆火,僅用5天時(shí)間用戶量便破百萬(wàn),推出2個(gè)月后用戶量破億,訪問(wèn)量從1830萬(wàn)增長(zhǎng)到6.72億,成為史上用戶增長(zhǎng)速度最快的消費(fèi)級(jí)應(yīng)用程序。最新版的GPT-4在ChatGPT的GPT-3.5基礎(chǔ)上主要提升了語(yǔ)言模型方面的能力,并添加了多模態(tài)功能,可以接受圖像輸入并理解圖像內(nèi)容,可接受的文字輸入長(zhǎng)度也增加到3.2萬(wàn)token,在不同語(yǔ)言情景和內(nèi)部對(duì)抗性真實(shí)性評(píng)估的表現(xiàn)都顯著優(yōu)于GPT-3.5,在各種專(zhuān)業(yè)和學(xué)術(shù)基準(zhǔn)上已經(jīng)表現(xiàn)出人類(lèi)水平,為用戶提供變革性的使用體驗(yàn)。ChatGPT帶動(dòng)AI潮流,多種相關(guān)產(chǎn)品推出。辦公領(lǐng)域,微軟將GPT-4整合到Office應(yīng)用程序,TeamsPremium中接入ChatGPT提供人工智能生成章節(jié)和字幕實(shí)時(shí)翻譯等功能;編程領(lǐng)域中,VivaSales將利用ChatGPT為電子郵件中客戶問(wèn)題生成回復(fù)建議,Stripe使用GPT-4掃描商業(yè)網(wǎng)站并向客戶支持人員提供摘要;軟件領(lǐng)域,Duolingo將GPT-4構(gòu)建到新的語(yǔ)言學(xué)習(xí)訂閱層中,國(guó)內(nèi)百度“文心一言”也正式推出,AI的潮流開(kāi)始遍布國(guó)內(nèi)外多行業(yè)。1.2.OpenAI模型演進(jìn),人工智能向應(yīng)用拓展OpenAI模型可以完成絕大多數(shù)文本和圖像任務(wù),具有成熟的生產(chǎn)力。根據(jù)OpenAI的官方介紹,GPT-4可以接受文本和圖像的信息,并允許用戶指定任何圖像或語(yǔ)言任務(wù),處理超過(guò)25000個(gè)單詞的文本。除了在各種標(biāo)準(zhǔn)考試和不同語(yǔ)言情景下都有突出的表現(xiàn)外,在圖像的處理分析上,GPT-4能夠直接閱讀并分析帶有圖片的論文,承擔(dān)文本、音頻、圖像的生成和編輯任務(wù),并能與用戶一起迭代創(chuàng)意和技術(shù)寫(xiě)作任務(wù),例如創(chuàng)作歌曲、編寫(xiě)劇本或?qū)W習(xí)用戶的寫(xiě)作風(fēng)格等。AIGC發(fā)展改革生產(chǎn)力,已具備多領(lǐng)域應(yīng)用能力。AIGC可以利用大量無(wú)標(biāo)注數(shù)據(jù)進(jìn)行自監(jiān)督學(xué)習(xí)再利用少量的標(biāo)注數(shù)據(jù)進(jìn)行遷移學(xué)習(xí),能夠持續(xù)生成規(guī)模大、質(zhì)量高、單位成本低的內(nèi)容,在生產(chǎn)力上具有革命性的增長(zhǎng)。在應(yīng)用方面,按場(chǎng)景分類(lèi)AIGC已經(jīng)較為成熟地應(yīng)用于文本和代碼撰寫(xiě)、圖像識(shí)別和生成,在影視、傳媒、電商、C端娛樂(lè)領(lǐng)域規(guī)模應(yīng)用,未來(lái)將逐步拓展到視頻和游戲等其他領(lǐng)域,為各個(gè)行業(yè)和領(lǐng)域的創(chuàng)新和發(fā)展提供更多可能性。1.3.OpenAI賦能下游應(yīng)用,AI+降本增效以AzureOpenAI為例:AI技術(shù)模型全覆蓋。AI技術(shù)模型全家桶,包含GPT4.0以及后續(xù)版本、DALL-E2、Codex、Embeddings神經(jīng)網(wǎng)絡(luò)、VALL-E、認(rèn)知學(xué)習(xí)成長(zhǎng)、機(jī)器學(xué)習(xí)等,可實(shí)現(xiàn)4種用途:1)企業(yè)及客戶可利用AzureOpenAI全家桶構(gòu)建自己的大型預(yù)訓(xùn)練AI模型;2)利用全家桶對(duì)AI模型進(jìn)行數(shù)據(jù)和參數(shù)的微調(diào)與提升;3)通過(guò)內(nèi)置全家桶檢測(cè)錯(cuò)誤與潛在風(fēng)險(xiǎn);4)利用全家桶實(shí)現(xiàn)角色訪問(wèn)控制和企業(yè)級(jí)云安全合規(guī)。OpenAI+傳統(tǒng)搜索引擎=AI智能搜索引擎。ChatGPT能生成和理解類(lèi)人類(lèi)思維方式與上下文聯(lián)系的結(jié)果,而傳統(tǒng)的搜索引擎只是給出網(wǎng)頁(yè)的鏈接,需要用戶自己閱讀、點(diǎn)擊和判定。無(wú)論是知識(shí)的獲取效率、回答問(wèn)題的深度,還是交互的延展性,ChatGPT都對(duì)傳統(tǒng)搜索引擎是一種顛覆式進(jìn)化。OpenAI+辦公軟件,以O(shè)ffice全家桶與微軟TeamspremiumChatGPT為例。ChatGPT+Office三大件Word、Excel、PowerPoint可完成從文字創(chuàng)作到可視化全程服務(wù)。ChatGPT可以根據(jù)用戶的描述需求自動(dòng)撰寫(xiě)文檔內(nèi)容,縮短文檔的創(chuàng)作時(shí)間;根據(jù)已形成文檔內(nèi)容智能推薦文檔格式、排版等;并根據(jù)用戶描述制作個(gè)性化PPT,同時(shí)智能生成朗讀語(yǔ)言助力PPT演示。TeamsPremiumChatGPT同樣具有多樣智能服務(wù):1)自動(dòng)提供實(shí)時(shí)翻譯;2)自動(dòng)生成文本型會(huì)議紀(jì)要;3)自動(dòng)記錄發(fā)言人員對(duì)話和內(nèi)容;4)根據(jù)討論上下文自動(dòng)生成任務(wù)等。2.云服務(wù)器優(yōu)化配置算力資源,是主要算力供給方式云計(jì)算屬于分布式計(jì)算,滿足各類(lèi)算力需求。云計(jì)算可以通過(guò)網(wǎng)絡(luò)“云”將所運(yùn)行的巨大的數(shù)據(jù)計(jì)算處理程序分解成無(wú)數(shù)個(gè)小程序,再交由計(jì)算資源共享池進(jìn)行搜尋、計(jì)算及分析后,將處理結(jié)果回傳給用戶,通過(guò)這種方式可以實(shí)現(xiàn)隨時(shí)隨地、便捷地、隨需應(yīng)變地從可配置計(jì)算資源共享池中獲取所需的資源與架構(gòu),包括存儲(chǔ)、數(shù)據(jù)庫(kù)、服務(wù)器、應(yīng)用軟件及網(wǎng)絡(luò)等,靈活調(diào)配計(jì)算機(jī)相關(guān)算力存儲(chǔ)資源。AI語(yǔ)言模型擴(kuò)大算力需求,云計(jì)算進(jìn)一步發(fā)揮資源優(yōu)化配置功效。面對(duì)AI的需求提升,云計(jì)算可帶來(lái)4個(gè)方面的提升:1.資源共享和優(yōu)化:云計(jì)算允許多個(gè)用戶共享同一臺(tái)服務(wù)器或一組服務(wù)器的計(jì)算資源。這意味著,與每個(gè)用戶都擁有自己的獨(dú)立服務(wù)器相比,云計(jì)算可以通過(guò)提高資源利用率來(lái)減少服務(wù)器的總數(shù)量。2.彈性可伸縮:云計(jì)算服務(wù)提供了高度的彈性和可伸縮性,使得用戶可以根據(jù)實(shí)際需求調(diào)整所需的計(jì)算資源。在計(jì)算需求降低時(shí),用戶可以減少資源使用,從而減少服務(wù)器的數(shù)量。而在計(jì)算需求增加時(shí),用戶可以快速擴(kuò)展資源,而無(wú)需購(gòu)買(mǎi)新的服務(wù)器。3.成本效益:云計(jì)算通常采用按需付費(fèi)的模式,用戶只需支付實(shí)際使用的計(jì)算資源。這種支付模式降低了用戶購(gòu)買(mǎi)和維護(hù)服務(wù)器的成本,使得更多企業(yè)傾向于使用云計(jì)算服務(wù)而不是購(gòu)買(mǎi)自己的服務(wù)器。4.更快的創(chuàng)新和部署:云計(jì)算使得企業(yè)能夠更快地開(kāi)發(fā)和部署新的應(yīng)用程序和服務(wù)。這減少了對(duì)于購(gòu)買(mǎi)、配置和維護(hù)自有服務(wù)器的需求,從而抑制了服務(wù)器數(shù)量的增長(zhǎng)。云計(jì)算為AI提供算力支持,實(shí)現(xiàn)降本增效。由于ChatGPT等一系列大規(guī)模模型對(duì)算力要求較高,廠商自建足夠算力的數(shù)據(jù)中心需要耗費(fèi)巨大的成本以及昂貴的后續(xù)運(yùn)維成本,而云計(jì)算服務(wù)可以有效節(jié)省早期支出,并且大規(guī)模的算力集群還具有集群優(yōu)勢(shì)以提升計(jì)算性能。OpenAI的ChatGPT和其他關(guān)鍵AI產(chǎn)品依賴(lài)于微軟Azure云計(jì)算服務(wù),通過(guò)Azure的HPC、彈性、數(shù)據(jù)存儲(chǔ)和計(jì)算服務(wù)來(lái)完成模型計(jì)算和算法調(diào)試,沒(méi)有云計(jì)算,ChatGPT的訓(xùn)練時(shí)間將被一再拉長(zhǎng),運(yùn)用云計(jì)算后GPT-3等模型的訓(xùn)練成本下降了80%以上,從首次訓(xùn)練開(kāi)銷(xiāo)1200萬(wàn)美元降至140萬(wàn)美元。云算力市場(chǎng)規(guī)模持續(xù)擴(kuò)大,下游應(yīng)用滲透提升。云算力市場(chǎng)根據(jù)統(tǒng)計(jì),2021年以IaaS、PaaS、SaaS為代表的全球公有云市場(chǎng)規(guī)模達(dá)到3307億美元,增速達(dá)32.5%。其中,IaaS、PaaS、SaaS市場(chǎng)規(guī)模分別同比增長(zhǎng)42.7%、39.3%、23.6%至916億美元、869億美元、1522億美元。2021年亞馬遜、微軟、阿里云為全球IaaS前三廠商,占據(jù)69.54%市場(chǎng)份額,國(guó)內(nèi)廠商阿里云、華為云、騰訊三家合計(jì)占全球17%的市場(chǎng)份額。目前國(guó)內(nèi)游戲、視頻、電商和金融是主要應(yīng)用領(lǐng)域,醫(yī)療、傳統(tǒng)工業(yè)和政務(wù)領(lǐng)域滲透率逐步增加。AI與云計(jì)算結(jié)合,提升大數(shù)據(jù)分析計(jì)算能力。AI與云計(jì)算結(jié)合有助于通過(guò)自動(dòng)化冗余活動(dòng)、識(shí)別、排序和索引各種類(lèi)型的數(shù)據(jù)、管理云中的數(shù)據(jù)事務(wù)、識(shí)別整個(gè)云存儲(chǔ)基礎(chǔ)設(shè)施中的任何故障,幫助改善數(shù)據(jù)管理,優(yōu)化管理流程。例如阿里云推出的飛天智算平臺(tái)提供公共云和專(zhuān)有云兩種模式,為各類(lèi)科研和智能企業(yè)機(jī)構(gòu)提供強(qiáng)大的智能計(jì)算服務(wù),可將計(jì)算資源利用率提高3倍以上,AI訓(xùn)練效率提升11倍,推理效率提升6倍。云計(jì)算的本質(zhì)是將計(jì)算資源進(jìn)行集中管理和調(diào)度,從而滿足不同用戶的需求,而這些計(jì)算資源的核心就是服務(wù)器。因此,隨著云計(jì)算需求的提升,服務(wù)器數(shù)量的提升也是必然的趨勢(shì)。AI為云計(jì)算所帶來(lái)的巨大計(jì)算量,將直接帶動(dòng)服務(wù)器數(shù)量的提升。3.ChatGPT引爆算力需求,拉動(dòng)高端芯片市場(chǎng)擴(kuò)張3.1.人工智能架構(gòu)以AI芯片為基人工智能IT技術(shù)棧分為四層架構(gòu),算力是基礎(chǔ)。人工智能架構(gòu)由芯片層、框架層、模型層和應(yīng)用層四層架構(gòu)組成。其中,芯片層主要是指人工智能芯片,為整個(gè)架構(gòu)提供算力基礎(chǔ)支撐;框架層主要包括深度學(xué)習(xí)訓(xùn)練和推理框架平臺(tái)和數(shù)據(jù)平臺(tái)等;模型層主要是自然語(yǔ)言處理(NLP)、計(jì)算機(jī)視覺(jué)(CV)、音視頻、多模態(tài)等各種大模型;應(yīng)用層則是面向各種應(yīng)用場(chǎng)景的人工智能專(zhuān)業(yè)服務(wù)。下游應(yīng)用體驗(yàn)的升級(jí)需要大模型不斷調(diào)優(yōu)迭代,在深度學(xué)習(xí)框架內(nèi)進(jìn)行大規(guī)模模型的訓(xùn)練和推理,每一次都對(duì)芯片提供的算力基礎(chǔ)提出要求,AI芯片決定了平臺(tái)的基礎(chǔ)架構(gòu)和發(fā)展生態(tài)。AI芯片主要有CPU、GPU、FPGA及ASIC,以GPU為主的并行計(jì)算為AI提供了主要生產(chǎn)力1)CPU(中央處理器)擅長(zhǎng)邏輯控制,用于推理及預(yù)測(cè)。CPU主要由ALU(算術(shù)邏輯單元)、CU(控制單元)與Cache(臨時(shí)指令存儲(chǔ)器)構(gòu)成。其中,ALU由"AndGate"(與門(mén))和"OrGate"(或門(mén))構(gòu)成的算術(shù)邏輯單元,主要功能是進(jìn)行二位元的算術(shù)運(yùn)算,約占CPU空間20%;CU則負(fù)責(zé)程序的流程管理。CPU的執(zhí)行周期是從內(nèi)存中提取第一條指令、解碼并決定其類(lèi)型和操作數(shù),執(zhí)行,然后再提取、解碼執(zhí)行后續(xù)的指令,重復(fù)循環(huán)直到程序運(yùn)行完畢。CPU具備強(qiáng)大的調(diào)度、管理與協(xié)調(diào)能力,但受限于單行運(yùn)算導(dǎo)致算力較低。2)GPU圖形處理器,并行計(jì)算滿足強(qiáng)大算力需求。在結(jié)構(gòu)方面,與CPU相比,GPU中同樣具備ALU與CU等架構(gòu),但ALU數(shù)量與體積占比更多,且采用數(shù)量眾多的計(jì)算單元和超長(zhǎng)流水線,具備高并行結(jié)構(gòu),通過(guò)多核并行計(jì)算支撐大算力需求,且擁有更高浮點(diǎn)運(yùn)算能力,在處理圖形數(shù)據(jù)和復(fù)雜算法方面擁有比CPU更高的效率,滿足深度學(xué)習(xí)領(lǐng)域海量數(shù)據(jù)運(yùn)算的需求。但GPU管理控制能力弱,無(wú)法單獨(dú)工作,需由CPU進(jìn)行控制調(diào)用。3)FPGA半定制化芯片,無(wú)限次編程支持高靈活性。FPGA稱(chēng)為現(xiàn)場(chǎng)可編程門(mén)陣列,基本結(jié)構(gòu)包括可編程輸入輸出單元和可配置邏輯塊等?;谄浣Y(jié)構(gòu),用戶可根據(jù)自身的需求進(jìn)行重復(fù)編程重組電路,具有高度實(shí)時(shí)性和靈活性,可以同時(shí)進(jìn)行數(shù)據(jù)并行和任務(wù)并行計(jì)算,在處理特定應(yīng)用時(shí)有更加明顯的效率提升,可以實(shí)現(xiàn)底層硬件控制操作技術(shù),為算法的功能實(shí)現(xiàn)和優(yōu)化留出了更大空間。4)ASIC全定制化芯片,高速處理速度疊加低功耗表現(xiàn)。ASIC是為專(zhuān)門(mén)目的為設(shè)計(jì)的集成電路,為實(shí)現(xiàn)特定要求而定制的專(zhuān)用AI芯片,能夠在特定功能上進(jìn)行強(qiáng)化,具有更高處理速度與更低能耗。缺點(diǎn)是研發(fā)成本高、前期研發(fā)投入周期長(zhǎng),且由于定制化屬性,可復(fù)制性一般,缺乏一定靈活性。深度學(xué)習(xí)算法穩(wěn)定后,AI芯片可采用ASIC設(shè)計(jì)方法進(jìn)行全定制,使性能、功耗和面積等指標(biāo)面向深度學(xué)習(xí)算法做到最優(yōu)。3.2.GPT拉動(dòng)算力提升,帶動(dòng)高算力芯片市場(chǎng)量?jī)r(jià)齊升ChatGPT數(shù)據(jù)量擴(kuò)張,算力需求持續(xù)增加。歷代GPT的參數(shù)量呈現(xiàn)指數(shù)級(jí)增長(zhǎng),ChatGPT的總算力消耗約為3640PF-days(每秒計(jì)算一千萬(wàn)億次,需要計(jì)算3640天);GPT4在ChatGPT的基礎(chǔ)上增加了圖像、視頻等交互信息類(lèi)型,內(nèi)容容量擴(kuò)大到2.5萬(wàn)字,所需的算力規(guī)模遠(yuǎn)大于單純的文字交互。OpenAI首席執(zhí)行官SamAltman接受公開(kāi)采訪表示,GTP-5在2024年底至2025年發(fā)布,它的參數(shù)量為GTP-3的100倍,需要的計(jì)算量為GTP-3的200-400倍。隨著ChatGPT的用戶和應(yīng)用范圍的持續(xù)擴(kuò)大,數(shù)據(jù)處理的壓力增大,將提出龐大的算力需求。算力需求帶動(dòng)高算力芯片市場(chǎng),AI芯片市場(chǎng)規(guī)模持續(xù)擴(kuò)張。機(jī)器所產(chǎn)生的數(shù)據(jù)量在2018年首次超越人類(lèi)所創(chuàng)造的數(shù)據(jù)量,從2019年,每年幾乎以倍數(shù)的幅度來(lái)增加,從2020年到2025年,全球數(shù)據(jù)增量將達(dá)到157Zetabytes,5年GAGR高達(dá)89%。龐大的數(shù)據(jù)增量,必須運(yùn)用各種具備高速運(yùn)算的人工智能芯片來(lái)過(guò)濾、處理分析、訓(xùn)練及推理,這將持續(xù)帶動(dòng)AI芯片,尤其是高算力芯片需求。據(jù)統(tǒng)計(jì),2020年全球GPU行業(yè)市場(chǎng)規(guī)模達(dá)254.1億美元,預(yù)計(jì)2027年將達(dá)到1853.1億美元,復(fù)合年均增長(zhǎng)率32.82%,GPU市場(chǎng)保持高速增長(zhǎng)態(tài)勢(shì)。同時(shí)根據(jù)預(yù)測(cè),2025年我國(guó)AI芯片市場(chǎng)規(guī)模將達(dá)到1780億元,2019-2025GAGR可達(dá)42.9%。AI風(fēng)潮席卷,芯片價(jià)值量有望提升。AI技術(shù)的蓬勃發(fā)展和廣泛應(yīng)用,導(dǎo)致對(duì)高性能計(jì)算能力的需求空前旺盛。AI芯片作為行業(yè)的核心組件,其價(jià)格也隨之攀升,成為科技產(chǎn)業(yè)的新增長(zhǎng)點(diǎn)。隨著AI模型復(fù)雜度的增加和參數(shù)量的指數(shù)級(jí)擴(kuò)張,對(duì)計(jì)算能力的要求不斷提高。例如預(yù)計(jì)在2024年底至2025年發(fā)布的GPT-5,其參數(shù)量將是GPT-3的100倍,所需算力為GPT-3的200-400倍。由于高性能AI芯片在滿足這種日益增長(zhǎng)的算力需求方面具有不可替代的作用,算力快速增長(zhǎng)需求下,芯片供給的不確定性有望提升芯片價(jià)格提升。3.3.構(gòu)建推理/訓(xùn)練服務(wù)器需求計(jì)算模型,測(cè)算未來(lái)空間廣闊算力緊缺,ChatGPT頻繁下調(diào)提問(wèn)限制次數(shù)。鑒于使用人數(shù)過(guò)多,GPT-4提問(wèn)上限次數(shù)先后從每4小時(shí)的使用上限從100次下調(diào)到50次,近日ChatGPTPlus又一次將GPT-4提問(wèn)次數(shù)下調(diào)至每3小時(shí)25次,同時(shí)預(yù)告再會(huì)繼續(xù)下調(diào)提問(wèn)次數(shù)。GPT-4發(fā)揮預(yù)期效果需服務(wù)器數(shù)量與芯片所提供算力支撐。GPT4推理與運(yùn)算發(fā)揮預(yù)期能力所需服務(wù)器數(shù)量主要依賴(lài)于2個(gè)核心變量,模型參數(shù)與訓(xùn)練/推理Token量,不考慮GPT4當(dāng)前回答次數(shù)限制與圖像處理功能,在峰值容納一切原則下,計(jì)算框架大致如下:推理所需服務(wù)器=每秒處理峰值Token所需FLOPS/(一臺(tái)服務(wù)器提供的FLOPS*推理下FLOPS利用率);訓(xùn)練所需服務(wù)器=規(guī)定時(shí)長(zhǎng)內(nèi)訓(xùn)練完所有Token所需FLOPS/(一臺(tái)服務(wù)器提供的FLOPS*訓(xùn)練過(guò)程FLOPS利用率)OpenAI官方尚未完全公開(kāi)GPT4數(shù)據(jù),根據(jù)報(bào)告,此次GPT-4是模型參數(shù)數(shù)量為1萬(wàn)億(GPT3參數(shù)為1750億);據(jù)硅谷猜測(cè),GPT-4用于訓(xùn)練數(shù)據(jù)量為9萬(wàn)億Token?;谟ミ_(dá)A100進(jìn)行測(cè)算,GPT4發(fā)揮預(yù)期能力下推理過(guò)程所需服務(wù)器數(shù)量約為6652臺(tái)。我們通過(guò)單個(gè)模型參數(shù)單個(gè)token所需要的FLOP次數(shù)、模型參數(shù)、每秒處理token數(shù)量、服務(wù)器所需GPU數(shù)量(按照DGXA100進(jìn)行測(cè)算)、單個(gè)GPU峰值FLOP次數(shù)以及利用率為21.6%進(jìn)行測(cè)算,得到推理所需服務(wù)器結(jié)果。中關(guān)鍵假設(shè)為每秒處理token數(shù)量,其測(cè)算過(guò)程主要為每日提問(wèn)人數(shù)*每人提問(wèn)數(shù)量*每個(gè)問(wèn)題回答字?jǐn)?shù),同時(shí)按照中英文翻譯比重1.6:1為基準(zhǔn),在每個(gè)單詞token為1.3前提下計(jì)算,得到每秒處理177萬(wàn)token。且當(dāng)前數(shù)據(jù)建立在GPT4提問(wèn)次數(shù)受限的現(xiàn)實(shí)條件與OpenAI網(wǎng)站2月份日活數(shù)據(jù)下,等待GPT4發(fā)揮預(yù)期功能,開(kāi)放圖像處理能力,日活、提問(wèn)數(shù)量、回答字?jǐn)?shù)等假設(shè)量將迅速增長(zhǎng),所需服務(wù)器仍存在增長(zhǎng)空間。在6個(gè)月訓(xùn)練時(shí)間假設(shè)下GPT4訓(xùn)練需要服務(wù)器數(shù)量為1391臺(tái)。同樣根據(jù)通過(guò)單個(gè)模型單token所需要的FLOP次數(shù)、模型參數(shù)、每秒處理token數(shù)量、服務(wù)器所需GPU數(shù)量(按照DGXA100進(jìn)行測(cè)算)、單個(gè)GPU峰值FLOP次數(shù)以及利用率為46.2%進(jìn)行測(cè)算,得到推理結(jié)果。測(cè)算過(guò)程關(guān)鍵量仍在每秒訓(xùn)練Token量,這取決于訓(xùn)練時(shí)間。OpenAI在6至8個(gè)月之前就開(kāi)始訓(xùn)練GPT-4,在總數(shù)9萬(wàn)億Token量+6個(gè)月訓(xùn)練時(shí)間假設(shè)下,平均每秒訓(xùn)練量為578,704Token。根據(jù)一臺(tái)服務(wù)器每秒提供的FLOPS得出訓(xùn)練所需服務(wù)器數(shù)量。未來(lái)大規(guī)模參數(shù)模型持續(xù)疊加算力需求,算力供需缺口亟待高性能芯片補(bǔ)充??紤]過(guò)去5年中模型參數(shù)呈指數(shù)增長(zhǎng),LLM(大語(yǔ)言模型)每次迭代都意味著模型訓(xùn)練量與推理量的指數(shù)級(jí)增長(zhǎng)。隨著算力時(shí)代到來(lái),未來(lái)對(duì)服務(wù)器數(shù)量與芯片算力均存在巨大需求,市場(chǎng)空間難以探底。4.算力時(shí)代凸顯芯片價(jià)值,國(guó)產(chǎn)芯片仍處追趕階段4.1.AI服務(wù)器依賴(lài)高性能芯片供給算力時(shí)代依托AI服務(wù)器,浪潮信息服務(wù)器蟬聯(lián)國(guó)內(nèi)第一。根據(jù)報(bào)告,2021全年浪潮信息AI服務(wù)器中國(guó)市場(chǎng)占有率達(dá)52.4%。自2017年以來(lái),浪潮信息已連續(xù)5年保持中國(guó)AI服務(wù)器市場(chǎng)份額超過(guò)50%,全球范圍內(nèi),人工智能服務(wù)器市場(chǎng)規(guī)模達(dá)156億美元,約合人民幣1006億元,而浪潮信息市場(chǎng)占有率達(dá)20.9%,保持全球市場(chǎng)第一。AI服務(wù)器核心在于高性能芯片。參數(shù)規(guī)模、訓(xùn)練數(shù)據(jù)隨著模型多模態(tài)發(fā)展呈現(xiàn)量級(jí)增長(zhǎng),而消化、處理數(shù)據(jù)的能力,即算力,才是制約模型發(fā)揮與其能力的關(guān)鍵因素。在滿足算力的最終訴求下,相較于大量疊加服務(wù)器臺(tái)數(shù),提升算力芯片性能同樣不可或缺。以英偉達(dá)GPU芯片H100SXM為例,F(xiàn)P16TensorCore算力為1979TFLOPS,一臺(tái)搭載8片H100SXM的服務(wù)器算力是之前所假設(shè)的GPUA100服務(wù)器50倍。GPU占據(jù)AI芯片大類(lèi)市場(chǎng),全球應(yīng)用最為廣泛。AI芯片在不同領(lǐng)域?qū)τ谥笜?biāo)的需求不同。訓(xùn)練過(guò)程中,GPU由于具備并行計(jì)算高度適配神經(jīng)網(wǎng)絡(luò),支持高速解決巨額工作量;推理過(guò)程中僅稀疏結(jié)構(gòu)支持一項(xiàng)便能帶來(lái)2倍性能提升。由于GPU可兼容訓(xùn)練和推理,高度適配AI模型構(gòu)建,在全球AI芯片中應(yīng)用最為廣泛。2021年中國(guó)AI芯片市場(chǎng)中,GPU占比達(dá)到91.9%。據(jù)IDC數(shù)據(jù),預(yù)計(jì)到2025年GPU仍將占據(jù)AI芯片8成市場(chǎng)份額。英偉達(dá)主要GPU產(chǎn)品技術(shù)指標(biāo)表現(xiàn)領(lǐng)先,是全球GPU算力芯片龍頭。英偉達(dá)的GPGPU目前在全球應(yīng)用最為廣泛,其GPU產(chǎn)品的典型代表V100、A100、H100GPU分別采用Volta、Ampere、Hopper架構(gòu)。A100GPU,INT8算力達(dá)624TOPS;H100GPU,INT8算力達(dá)到1513TOPS。此外,2006年英偉達(dá)發(fā)布的CUDA平臺(tái)是現(xiàn)今全球應(yīng)用最為廣泛的AI開(kāi)發(fā)生態(tài)系統(tǒng)。通用GPU與CUDA生態(tài)系統(tǒng)奠定英偉達(dá)引領(lǐng)AI芯片的根基。當(dāng)前全球主流深度學(xué)習(xí)框架均使用CUDA平臺(tái),2021-2022年全球獨(dú)立GPU市場(chǎng)中英偉達(dá)份額基本維持在在80%左右。服務(wù)器同樣依賴(lài)芯片供給,把握芯片才能把握算力時(shí)代。數(shù)據(jù)顯示,2022年服務(wù)器CPU的市場(chǎng)份額中,英特爾占超七成,位列第一,AMD拿下約兩成,排名第二,兩家美企聯(lián)手占據(jù)9成市場(chǎng),而浪潮信息需要的AI服務(wù)器芯片也來(lái)自美企英偉達(dá)。盡管自2019年起,浪潮信息前五大供應(yīng)商的名字均隱去,但歷史數(shù)據(jù)顯示,英特爾仍穩(wěn)坐最大供應(yīng)商之席。上游芯片高度依賴(lài)外部企業(yè)成為浪潮信息發(fā)展的關(guān)鍵制約因素,尤其在美國(guó)商務(wù)部3月份將浪潮列入實(shí)體清單后,上游芯片進(jìn)行國(guó)產(chǎn)替代顯得更為緊迫。算力時(shí)代背景下,自主掌握高端芯片技術(shù)成為兵家必爭(zhēng)之地。4.2.主流芯片限制進(jìn)口,利好國(guó)產(chǎn)化芯片自主發(fā)展海外龍頭壟斷高端芯片技術(shù),國(guó)產(chǎn)芯片仍處追趕階段。以GPU細(xì)分賽道來(lái)看,目前國(guó)內(nèi)自研GPU的領(lǐng)軍企業(yè)主要是寒武紀(jì)、景嘉微、華為昇騰等,其中成立最早的是景嘉微,主打產(chǎn)品有JH920獨(dú)立顯卡。行業(yè)內(nèi)專(zhuān)家稱(chēng),從產(chǎn)品參數(shù)來(lái)看,景嘉微的JH920的性能與英偉達(dá)在2016年發(fā)布的GTX1050相仿,雖然僅相差6年,但考慮到模型與算力發(fā)展之迅速,整體而言國(guó)產(chǎn)GPU的現(xiàn)狀并不算樂(lè)觀,雖然在特殊領(lǐng)域可滿足部分的需求,但是在中高端領(lǐng)域及硬核的算力需求仍存著較長(zhǎng)的追趕道路。主流的AI芯片限制進(jìn)口,國(guó)內(nèi)AI產(chǎn)業(yè)發(fā)展面臨阻礙。2022年10月美國(guó)對(duì)中國(guó)半導(dǎo)體進(jìn)行三方面限制,在AI領(lǐng)域限制中國(guó)獲取等效8Int600TOPS算力的芯片。英偉達(dá)針對(duì)中國(guó)市場(chǎng)推出了符合新規(guī)的A800芯片,相比A100芯片,A800在搭載2個(gè)GPU的NVIDIA”NVLink”橋接器連接下,互聯(lián)標(biāo)準(zhǔn)由600GB/s降為400GB/s。面臨V100/A100/H100芯片都進(jìn)口受限,互聯(lián)標(biāo)準(zhǔn)下降,英偉達(dá)等頭部企業(yè)維持壟斷地位,國(guó)產(chǎn)大模型算力需求和國(guó)內(nèi)AI產(chǎn)業(yè)發(fā)展面臨阻礙。自主可控趨勢(shì)下,利好國(guó)內(nèi)服務(wù)器供應(yīng)廠商。近年來(lái)中美之間的貿(mào)易摩擦不斷升級(jí),導(dǎo)致雙方在技術(shù)領(lǐng)域的競(jìng)爭(zhēng)愈發(fā)激烈。例如美國(guó)政府對(duì)華為等中國(guó)科技企業(yè)實(shí)施了一系列制裁措施,試圖限制這些企業(yè)獲取關(guān)鍵技術(shù)和先進(jìn)芯片。這些制裁措施無(wú)疑給中國(guó)高端芯片產(chǎn)業(yè)的發(fā)展帶來(lái)了巨大壓力。目前自主可控進(jìn)程中,國(guó)內(nèi)企業(yè)在設(shè)計(jì)、制程、封裝和測(cè)試等各個(gè)環(huán)節(jié)取得了顯著進(jìn)步,部分產(chǎn)品性能已經(jīng)接近國(guó)際先進(jìn)水平。另一方面,國(guó)家和地方政府也在積極出臺(tái)各種政策措施,支持芯片產(chǎn)業(yè)的創(chuàng)新和發(fā)展,培育具有國(guó)際競(jìng)爭(zhēng)力的芯片企業(yè)。目前ChatGPT引爆的AI潮將拉動(dòng)云服務(wù)器數(shù)量的增長(zhǎng),其國(guó)內(nèi)相關(guān)供應(yīng)廠商將有望受益于下游AI+級(jí)應(yīng)用所帶來(lái)的算力需求增長(zhǎng),國(guó)內(nèi)云服務(wù)器與算力相關(guān)廠商有望直接受益。5.投資分析我們看好算力芯片及服務(wù)器需求劇增下相關(guān)零組件的成長(zhǎng)空間。CPU、GPU是服務(wù)器最主要的部件,是衡量服務(wù)器性能的首要指標(biāo),需具有大數(shù)據(jù)量的快速
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 大頭針制造機(jī)產(chǎn)業(yè)鏈招商引資的調(diào)研報(bào)告
- 特教生口語(yǔ)突破-探索有效訓(xùn)練方法
- 芯片集成電路產(chǎn)品供應(yīng)鏈分析
- 剃須凝膠產(chǎn)品供應(yīng)鏈分析
- 5G智能物流行業(yè)相關(guān)項(xiàng)目經(jīng)營(yíng)管理報(bào)告
- 商業(yè)戰(zhàn)略規(guī)劃服務(wù)行業(yè)相關(guān)項(xiàng)目經(jīng)營(yíng)管理報(bào)告
- 制藥廢水處理行業(yè)營(yíng)銷(xiāo)策略方案
- 電子教學(xué)學(xué)習(xí)機(jī)商業(yè)機(jī)會(huì)挖掘與戰(zhàn)略布局策略研究報(bào)告
- 表盤(pán)項(xiàng)目營(yíng)銷(xiāo)計(jì)劃書(shū)
- 美甲凝膠項(xiàng)目運(yùn)營(yíng)指導(dǎo)方案
- 2023-2024學(xué)年北京市海淀區(qū)首都師大二附中八年級(jí)(上)期中數(shù)學(xué)試卷【含解析】
- 中煤電力有限公司招聘筆試題庫(kù)2024
- 河北省石家莊市第四十四中學(xué)2022-2023學(xué)年八下期中數(shù)學(xué)試卷
- 2024年第九屆“學(xué)憲法、講憲法”試卷題庫(kù)
- 初中語(yǔ)文修改病句市公開(kāi)課一等獎(jiǎng)省賽課獲獎(jiǎng)?wù)n件
- 外研版(三起)(2024)三年級(jí)上冊(cè)英語(yǔ)全冊(cè)教學(xué)設(shè)計(jì)
- 2024年四川阿壩州汶川縣干部“團(tuán)聚工程”考調(diào)人員歷年(高頻重點(diǎn)復(fù)習(xí)提升訓(xùn)練)共500題附帶答案詳解
- DL∕T 1502-2016 廠用電繼電保護(hù)整定計(jì)算導(dǎo)則
- 生豬購(gòu)銷(xiāo)合同版
- 2022-2023學(xué)年廣東省深圳某中學(xué)八年級(jí)(上)期中數(shù)學(xué)試卷(學(xué)生版+解析版)
- 2024美團(tuán)商家入駐合作協(xié)議
評(píng)論
0/150
提交評(píng)論