2024 AI行業(yè)關(guān)鍵時刻:瓶頸與機遇并存_第1頁
2024 AI行業(yè)關(guān)鍵時刻:瓶頸與機遇并存_第2頁
2024 AI行業(yè)關(guān)鍵時刻:瓶頸與機遇并存_第3頁
2024 AI行業(yè)關(guān)鍵時刻:瓶頸與機遇并存_第4頁
2024 AI行業(yè)關(guān)鍵時刻:瓶頸與機遇并存_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

報告摘要:2025年,Al將迎來模型與應(yīng)用的雙向奔赴:-模型側(cè),模型將朝大小模型互補的方向演進,聚焦增強推理能力以突破當(dāng)前的ScalingLaw瓶頸。大型預(yù)訓(xùn)練市場逐漸收斂,由OpenAI、Meta的Llama、Mistral、阿里通義等主導(dǎo),更多中小廠商則專注于特定任務(wù)的微調(diào)與Agent業(yè)務(wù)。新興技術(shù)路徑如測試時訓(xùn)練、合成數(shù)據(jù)應(yīng)用及感知量化訓(xùn)練將推動模型能力提升,而多模態(tài)融合模型在實時交互、音頻與視覺生成領(lǐng)域展現(xiàn)出巨大潛力。-應(yīng)用側(cè),滲透率持續(xù)快速上升,ChatGPT活躍度持續(xù)攀升,視頻生成模型如Runway和可靈國際版表現(xiàn)穩(wěn)定。我們持續(xù)看好如下應(yīng)用方向:1)Al程序員在企業(yè)中得到廣泛應(yīng)用,顯著提升開發(fā)效率;2)數(shù)據(jù)重要性大幅提升推動SaaS平臺如Snowflake、Datadog和Databricks等業(yè)務(wù)高速增長;3)通用SaaS平臺如ServiceNow和Salesforce受益于大企業(yè)AI投入增加;4)Al搜索有望在2025年誕生超級APP;5)Al眼鏡作為綜合體驗最好的Al硬件新形態(tài),預(yù)計將在2025年迎來大規(guī)模出貨。-算力系統(tǒng),雖然英偉達最新的Blackwel1架構(gòu)算力芯片仍在云端具備絕對統(tǒng)治力,但是隨著系統(tǒng)復(fù)雜性的快速提升以及核心技術(shù)及零部件供給瓶頸,硬件迭代速度可能在未來趨緩。這將給AMD等競爭對手以及云廠商自研芯片帶來更多的發(fā)展機會。-電力基礎(chǔ)設(shè)施,隨著單數(shù)據(jù)中心規(guī)模的不斷擴大,局部供電壓力激增。獨立于傳統(tǒng)居民/工業(yè)電網(wǎng)的核電站成為潛在最優(yōu)解決方案。美國幾大云廠亞馬遜、谷歌、微軟都在積極尋求核電解決方案。核電的落地速度成為制約Al進一步發(fā)展的重要因素。-端側(cè)Al,隨著模型小型化趨勢及應(yīng)用場景的快速豐富,我們預(yù)計端側(cè)Al在2025年也將迎來大發(fā)展。在硬件、軟件、生態(tài)、云等所有環(huán)節(jié)都可控并有所參與的手機廠商更容易成功,其中蘋果、谷歌更為完整。蘋果在硬件、軟件、生態(tài)環(huán)境、云服務(wù)上具備極強競爭力。谷歌有原生安卓支持、Gemini強大的模型能力,但在硬件上自有品牌Pixel滲透率低,更多需要依賴三星端側(cè)硬件拓展用戶。-AIPC領(lǐng)域:1)未來X86筆電市場競爭將會更為激烈,英特爾和AMD產(chǎn)品在性能、續(xù)航、適配性、生態(tài)方面各有千秋。2)X86臺式機領(lǐng)域,由于功耗的重要性大幅降低,AMD有望依靠更出色的CPU性能提升市占率;3)AIPC的滲透,重點看ARM芯片。蘋果的優(yōu)勢最明顯,高通XElite短時間內(nèi)很難與蘋果競爭ARM架構(gòu)Al筆電的市場。未來英偉達&聯(lián)發(fā)科合作研發(fā)的處理器也會帶來更多看點。ARM架構(gòu)芯片的成熟有望推動ows操作系統(tǒng)向更適合Al的方向進化。芯片制程發(fā)展與良率不及預(yù)期中美科技領(lǐng)域政策惡化智能手機、PC銷量不及預(yù)期行業(yè)深度研究(深度)內(nèi)容目錄 3 3 31.3方向二:測試時訓(xùn)練 51.4方向三:合成數(shù)據(jù) 61.5方向四:模型量化逐漸失效 71.6方向五:多模態(tài)融合模型發(fā)展空間大 7二、Al應(yīng)用滲透率持續(xù)增長,落地場景多點開花 92.1Al應(yīng)用活躍度持續(xù)增長,應(yīng)用場景得到認可,進入快速獲客期 92.2Al程序員是確定性的強需求 2.3Al搜索是25年最有希望誕生超級APP的賽道 2.4Al為通用型和數(shù)據(jù)類SaaS平臺打開增長空間 2.5Al眼鏡是Al應(yīng)用落地的最佳硬件,25年將迎來發(fā)布潮和出貨量大增 3.1人工智能算力系統(tǒng)面臨諸多挑戰(zhàn) 3.2單卡算力升級速率落后于模型迭代速率,Blackwell延后預(yù)示系統(tǒng)摩爾進一步降速 3.3數(shù)據(jù)中心電力消耗呈指數(shù)級增長,核電或成最優(yōu)解決方案 四、大模型推理服務(wù)大規(guī)模部署,如何影響硬件市場? 4.1大模型性能提升,推動推理算力需求加速增長 4.2服務(wù)器推理:內(nèi)存墻難破,HBM容量仍為競爭要點 4.3端側(cè)推理:單用戶推理導(dǎo)致內(nèi)存端高成本,端云結(jié)合將是未來趨勢 21 5.1Al手機焦點在于旗艦機 5.2AlPC的競爭將會越發(fā)激烈 265.3Al設(shè)備產(chǎn)業(yè)鏈隨著Al加入將迎來更新?lián)Q代 6.1智能駕駛:模塊化方案與端到端方案之爭 6.2具身智能想要放量需要更實用的場景及更低的價格 風(fēng)險提醒 22行業(yè)深度研究(深度)2024年大模型廠商推出模型的速度仍在加快,大模型與小模型共存仍是解決模型能力上限和端側(cè)推理的方案,各大模型廠商也會推出幾B到TB級別的模型。隨著大型模型訓(xùn)練成本的不斷提升,且有更多像Meta、Mixtral、阿里通義等公司的開源,模型預(yù)訓(xùn)練市場的玩家會快速縮小,針對特定任務(wù)的微調(diào)或者是Agent業(yè)務(wù)將會是更多中小模型廠商發(fā)展的重點。在當(dāng)前算力和數(shù)據(jù)ScalingLaw放緩的情況下,找到新的ScalingLaw方向是明年模型發(fā)展的重點。1.1預(yù)訓(xùn)練和現(xiàn)實數(shù)據(jù)觸頂,后訓(xùn)練時代將開啟新的ScalingLaw方向從24年年初開始有論文提出模型能力提升速度隨著參數(shù)規(guī)模的擴大而放緩,到11月份OpenAl前首席科學(xué)家Ilya在公開場合表示簡單地增加數(shù)據(jù)和計算能力來擴大當(dāng)前模型規(guī)模的時代已經(jīng)結(jié)束。但是,預(yù)訓(xùn)練的scalinglaw放緩不代表大模型發(fā)展速度和算力需求的放緩,就像是芯片gate的實際尺寸停滯在20nm并不影響等效gate密度達到目前的3nm,廣義的摩爾定律甚至比20年前更快,大模型也需要找到具有更高的投入回報比的新1.2方向一:用推理代替思考OpenAl于2024年9月12日發(fā)布了新的Al模型系列o1,這是OpenAl首個具有"邏輯推理"能力的模型系列,特別擅長處理復(fù)雜的推理任務(wù),尤其是在科學(xué)、技術(shù)、工程和數(shù)學(xué)(STEM)領(lǐng)域的問題,在這些領(lǐng)域其評測分數(shù)都遠遠超過GPT-4o。o1模型將計算資源從大規(guī)模預(yù)訓(xùn)練數(shù)據(jù)集重新分配到訓(xùn)練和推理階段,增強了復(fù)雜推理能力,在費用和成本上也進行了重分配,使用o1-preview的API相比于GPT-4o輸入tokens價格是GPT-4o的5倍(每百萬tokens$15.00:$3.00),輸出tokens差距o1-preview的價格是GPT-4o的6倍(每百萬tokens$60.00:$10.00)。accuracyaccuracyo101CompetitionCode(Codeforces)60-ogpt4oPhD-LevelScienceQuestionsaccuracyaccuracypreviewhuman33行業(yè)深度研究(深度)圖表2:阿里通義Macro-01模型的原理Prompt:HowPrompt:Howmany'r'instrawberry?1.Determinethenumbe"strawberry"First,Iwillcounttheoccurrencesofthelett"strawberry"bygoingthrougheachcha-Thethirdletteris'r,thisisthefirstoccurrenceof'r.-Thefourthletteris-TheeighthletterisSo,therearethree'r'sintheword"strawberrTheword"strawberry"contains3instancesoftheletter'theletter'r'appearsexactlythreetimes.ThisconfiPrompt)234來源:Macro-o1論文、國金證券研究所在OpenAl發(fā)布o1之后,其他大模型公司包括國內(nèi)的Deepseek和阿里通義也發(fā)布了類似通過增強推理階段的計算資源來提高能力的模型,并且開始有論文揭露底層技術(shù)。阿里發(fā)布的Marco-01由思維鏈(CoT)微調(diào)、蒙特卡洛樹搜索(MCTS)、自反機制和創(chuàng)新性推理策略驅(qū)動,專門針對復(fù)雜的現(xiàn)實世界問題解決任務(wù)進行了優(yōu)化。同時,阿里在Open-o1數(shù)據(jù)集的基礎(chǔ)上進行了篩選,并且使用合成數(shù)據(jù)方法合成了一個新的Macro-o1數(shù)據(jù)庫,用來監(jiān)督微調(diào)。最終,在應(yīng)用了蒙特卡洛樹微調(diào)后,模型在評測上實現(xiàn)了大幅超過了基底模型Qwen2-7B的成績。圖表3:阿里通義Macro-01模型測試成績大幅領(lǐng)先基底模型MGSMBenchmark(English)ModelModelAccuracyAccuracy來源:Macro-o1論文、國金證券研究所表現(xiàn)與o1相當(dāng)或更優(yōu),但是仍未公布論文和技術(shù)詳細信息。44行業(yè)深度研究(深度)V2.5AIME(pass@1)美國數(shù)學(xué)競賽MATH-500美國數(shù)學(xué)競賽理工科博士生測試Codeforces世界級編程競賽LiveCodeBench世界級編程競賽自然語言解謎1.3方向二:測試時訓(xùn)練測試時訓(xùn)練(Test-TimeTraining)是24年11月份由MIT提出的另一條實現(xiàn)大模型ScalingLaw的路線,這是一種在推理過程中根據(jù)測試輸入動態(tài)更新模型參數(shù)的技術(shù)。它不同于標(biāo)準的微調(diào),因為它在極低數(shù)據(jù)的情況下運行,通常對單個輸入或一兩個上下文中的標(biāo)記示例使用無監(jiān)督或監(jiān)督目標(biāo)。相當(dāng)于對推理過程中的數(shù)據(jù)進行調(diào)整后合成測試時訓(xùn)練數(shù)據(jù)用來更新模型的參數(shù),這種方法對抽象推理的問題效果較好,MIT團隊在Llama3數(shù)的語言模型上應(yīng)用TTT,在ARC公共驗證集上實現(xiàn)了45%的準確率,比8B基礎(chǔ)模型提高了近157%。但是該方法仍在初期試驗階段,對計算資源要求也很高,所以論文的評估主要在ARC公共驗證集的一個子集上進行,并沒有提交到官方排行榜。55行業(yè)深度研究(深度)圖表5:測試時訓(xùn)練(TTT)合成數(shù)據(jù)的原理AccuracyAccuracyTrainingDatayoy?y?Horizontal?y?yoVerticaly?Yoy?Step-1:Step-2:Leave-one-outTasksRuleBasedAugmentationsyoy?y?x3來源:Test-TimeTraining論文、國金證券研究所1.4方向三:合成數(shù)據(jù)合成數(shù)據(jù)在LLM開發(fā)中的應(yīng)用正在迅速擴大,從預(yù)訓(xùn)練到微調(diào)階段都發(fā)揮著重要作用。它的模型訓(xùn)練和Alignment項目大量使用合成數(shù)據(jù);Anthropic公司在Claude系列模型中采用了ConstitutionalAl(CAI)方法,通過合成數(shù)據(jù)顯著提升了模型的穩(wěn)健性,使得Claude模型能夠更準確地識別和拒絕回答不確定的問題;阿里通義的Qwen系列則采取了一種獨特的方法,利用早期版本的Qwen模型來生成合成數(shù)據(jù),用于增強預(yù)訓(xùn)練數(shù)據(jù)集的質(zhì)量,同時在訓(xùn)練過程中創(chuàng)新性地使用合成數(shù)據(jù)生成多個候選響應(yīng),再通過獎勵模型篩選出最優(yōu)答案;Apple的AFM模型也在這一領(lǐng)域做出了重要嘗試,特別是在預(yù)訓(xùn)練階段使用合成數(shù)據(jù)來延長上下文長度,并且特別關(guān)注數(shù)學(xué)和代碼任務(wù)相關(guān)的高質(zhì)量合成數(shù)據(jù)生成。forAIToday'sAIS202020302020Source:Gartner來源:Gartner、國金證券研究所據(jù)Gartner預(yù)測,到2030年,合成數(shù)據(jù)將在Al模型中完全超過真實數(shù)據(jù)的使用,而合成數(shù)據(jù)的生成過程需要消耗大量計算資源。以使用OpenAl的模型為例,使用GPT-4生成十萬個JSON合成數(shù)據(jù)元素預(yù)計成本高達506美元,隨著現(xiàn)實世界數(shù)據(jù)被逐漸發(fā)掘用盡,合成數(shù)據(jù)消耗的推理資源會快速上升。66行業(yè)深度研究(深度)1.5方向四:模型量化逐漸失效量化是把模型里的數(shù)字用更少的位數(shù)表示,比如用整數(shù)代替小數(shù),這樣計算更快,占用的空間也更小。在模型推理時使用量化后的模型是主流的節(jié)約推理成本的方法,但是在24年11月,哈佛和斯坦福大學(xué)等頂尖學(xué)府學(xué)者發(fā)布的《ScalingLawsforPrecision》引起了大模型行業(yè)科學(xué)家的廣泛討論,研究發(fā)現(xiàn)在預(yù)訓(xùn)練階段使用更低精度的參數(shù)會會降低模型的有效參數(shù)數(shù)量,而推理量化后的模型的性能下降會隨著模型訓(xùn)練數(shù)據(jù)量的增加而增加,意味著數(shù)據(jù)太多反而對推理低精度模型有負面影響。論文還提出了感知量化訓(xùn)練技術(shù),是一種有效的模型量化技術(shù),模型仍然使用高精度(例如FP32或BF16)進行訓(xùn)練,但在每次前向和反向傳播過程中,都會模擬低精度量化的操作,感知到降低哪些部分的參數(shù)精度對模型效果的影響較小,可以在保持較高推理性能的同時降低模型的計算和存儲成本。圖表7:訓(xùn)練后量化和訓(xùn)練時量化效果對比MorepretrainingcomputeWorseatinferencetimeTraininglargermodelsinlower(1.76B)(1.17B)(880M)(440M)TrainingPrecision(Mo來源:ScalingLawsforPrecision、國金證券研究所1.6方向五:多模態(tài)融合模型發(fā)展空間大盡管各大廠商如Meta和阿里巴巴積極布局多模態(tài)大模型領(lǐng)域,分別推出了Llama3.2系列(包括其首個大型多模態(tài)模型)以及通義Qwen-VL升級版(Qwen-VL-Plus和Qwen-VL-Max),在圖像推理等能力上取得了顯著進展,但在整體架構(gòu)設(shè)計、性能效果以及支持的模態(tài)數(shù)量等方面,相較于OpenAl推出的GPT-4o仍存在明顯差距,比如Llama3.2仍然是將音頻模型疊加到大語言模型上獲得的多模態(tài)能力,而GPT-4o具備的以下能力仍然是多模態(tài)模型的標(biāo)桿:1.多模態(tài)理解與生成:支持文本、圖像、音頻、視頻理解,文本、圖像、音頻生成2.統(tǒng)一模型:使用單一神經(jīng)網(wǎng)絡(luò)處理所有模態(tài),而非多個獨立模型的管道3.端到端訓(xùn)練:跨文本、視覺和音頻進行端到端的聯(lián)合訓(xùn)練4.實時交互:音頻輸入響應(yīng)時間平均為320毫秒,接近人類對話反應(yīng)速度,支持近實時的語音對話和翻譯77來源:OpenAI、國金證券研究所多模態(tài)模型的發(fā)展可以給予Al應(yīng)用和Al硬件的落地更大的想象空間,比如可以根據(jù)上下文來理解和生成不同語氣語調(diào)的音頻;使用語音直接進行圖片編輯;在Al硬件上直接進行實時對話,將看到或者聽到的內(nèi)容實時翻譯成另一種語言;實時逐步的對眼前的題目進行解答等。行業(yè)深度研究(深度)2.1Al應(yīng)用活躍度持續(xù)增長,應(yīng)用場景得到認可,進入快速獲客期從Al應(yīng)用的日活躍度數(shù)據(jù)看,ChatGPT活躍度持續(xù)增長,其他Al聊天助手應(yīng)用也保持增長態(tài)勢,Al應(yīng)用滲透率不斷提升。從國內(nèi)市場看,頭部應(yīng)用如Kimi、文心一言、通義千問、豆包等的活躍度也在不斷提高,Al聊天助手應(yīng)用場景得到用戶認可,進入快速獲客期。圖表9:聊天助手類應(yīng)用周均日活變化2024-11-17-2024-11-23+5.5%WoW2024-11-17-2024-11-23-1.6%WoW2024-11-17-2024-11-23+7.3%WoW2024-11-17-2024-11-23+37.2%WoW2024-11-17-2024-11-23+6.0%WoW文心一言訪問量2024-11-17-2024-11-23+6.5%WoW躍問(階躍星辰)訪問量2024-11-17-2024-11-23-15.7%WoWChatGLM訪問量2024-11-17-2024-11-23+9.5%WoW2024-11-17-2024-11-23+5.5%WoWKimiChat訪問量2024-11-17-2024-11-23+8.7%WoW字節(jié)豆包訪問量2024-11-17-2024-11-23+9.7%WoW2024-11-17-2024-11-23+2.5%WoW視頻模型在快速發(fā)展階段,閉源模型如Runway和可靈的活躍度較為穩(wěn)定,新發(fā)模型對應(yīng)用活躍度仍然有較大的提升??焓值目伸`國際版實現(xiàn)了AI模型出海,屬于現(xiàn)在可用模型和Mochi1。視頻模型對算力需求的提升符合我們的預(yù)期,比如未量化版本的Mochi需要4個H100才能進行推理。99行業(yè)深度研究(深度)圖表10:視頻生成類應(yīng)用周均日活變化2024-11-17-2024-11-232024-11-17-2024-11-232024-11-17-2024-11-23-0.4%WoW-25.0%WoW-0.4%WoW字節(jié)即夢訪問量VEED訪問量2024-11-17-2024-11-232024-11-17-2024-11-232024-11-17-2024-11-23+6.2%WoW-8.4%WoW+3.2%WoW可靈網(wǎng)頁版訪問量可靈海外版訪問量2024-11-17-2024-11-232024-11-17-2024-11-232024-11-17-2024-11-23+3.6%WoW+24.1%WoW音樂和音頻模型應(yīng)用的市場空間仍有局限,部分新應(yīng)用曇花一現(xiàn),在爆發(fā)增長后用戶沒有留存,活躍度持續(xù)下滑如語音合成應(yīng)用Murf和音樂生成應(yīng)用Udio。但是部分應(yīng)用如音樂生成應(yīng)用Suno和語音視頻融合應(yīng)用Heygen的活躍度較為穩(wěn)定,用戶留存率較高。隨著多模態(tài)模型的發(fā)展,音樂和音頻應(yīng)用的市場空間會被進一步壓縮,創(chuàng)意和易用性是這類應(yīng)用發(fā)展和生存的關(guān)鍵。圖表11:音樂和音頻模型應(yīng)用周均日活變化:2024-11-17-2024-11-232024-11-17-2024-11-232024-11-17-2024-11-23-9.8%WoW+4.5%WoW2024-11-17-2024-11-232024-11-17-2024-11-232024-11-17-2024-11-23+13.9%WoW-0.4%WoW-3.6%WoW2024-11-17-2024-11-23-8.8%WoW2.2AI程序員是確定性的強需求■■WithoutgenerativeAl■WithgenerativeAl<1020-3045-5040200CodedocumentationCodegenera35-45來源:麥肯錫、國金證券研究所行業(yè)深度研究(深度)Al代碼生成已經(jīng)從概念驗證階段進入企業(yè)實際應(yīng)用階段,并在提升研發(fā)效率方面展現(xiàn)出明顯價值。根據(jù)麥肯錫的調(diào)查,使用生成式Al進行代碼文檔編寫時,可以節(jié)省約45%到50%的時間;在代碼生成任務(wù)中,節(jié)省時間在35%到45%之間;而代碼重構(gòu)的時間節(jié)省幅度較小,為20%到30%。對于高復(fù)雜性任務(wù),生成式Al的效果最弱,時間節(jié)省不足10%。整體來看,生成式Al在較簡單的任務(wù)上表現(xiàn)出顯著的效率提升,而在處理復(fù)雜任務(wù)時,優(yōu)勢相對較小。從海內(nèi)外科技公司來看,AI程序員的滲透率也在不斷提升,Google在財報會上公布,目前超過25%的新代碼是由Al輔助生成的,使用Al工具的開發(fā)者在軟件開發(fā)任務(wù)上的效率提升了21%。Meta內(nèi)部廣泛部署的CodeCompose工具為數(shù)萬名開發(fā)者提供代碼建議和片段,其建議的接受率達到22%,約8%的代碼來自于這些建議的采納。在中國市場,阿里巴巴的通義靈碼(TongyiLingma)工具獲得了20%的采用率,顯著提升了開發(fā)效率,特別在測試代碼實施方面減少了超過70%的工作量。百度的智能代碼助手Comate(基于文心一言大模型)更是貢獻了該公司27%的日常新增代碼。在大模型上加入搜索功能,可以豐富模型的知識庫,緩解模型無法獲取新知識和幻覺問題的出現(xiàn),是最有希望誕生超級APP的賽道。Perplexity作為主打Al搜索的應(yīng)用,活躍度數(shù)據(jù)再不斷提升,同時ChatGPT推出的Search功能助力其活躍度再創(chuàng)新高,說明Al搜索市場仍在快速發(fā)展期。Google作為傳統(tǒng)搜索引擎廠商,也在搜索中加入了AlOverview,對搜索結(jié)果進行總結(jié),同時在AIStudio中也提供了Al搜索功能,其日活躍度目前還未受到負面影響,但Al搜索工具都在積極替代瀏覽器默認搜索引擎,我們認為隨著Al搜索滲透率提高,傳統(tǒng)搜索引擎廠商會受到更嚴峻的挑戰(zhàn)。提升和商業(yè)成功的關(guān)鍵。數(shù)據(jù)的管理與安全SaaS平臺業(yè)務(wù)迎來高速增長期。例如,Snowflake產(chǎn)品收入達到9.003億美元,同比增長29%,產(chǎn)品收入超過100萬美元的客戶相比上一季度的510個增加到542個,同樣保持著高增長的還有Datadog和還未上市的Databricks。除了數(shù)據(jù)類SaaS平臺,通用類HorizontalSaaS平臺如ServiceNow、NowAssist和GenerativeAlContr人工智能技術(shù)。ApplicationApplicationKLAVIYOEQ\*jc3\*hps97\o\al(\s\up11(vent),SSe)EQ\*jc3\*hps97\o\al(\s\up11(b),g)EQ\*jc3\*hps97\o\al(\s\up11(rite),men)MailChimpConvertKity?TMINDBODYêdripPROCOREMiddlewarePLAIDAuthOSquareproject44MessageBirddataikuAzureattentivemongoDBODigitalOceanCLOUDFLAREshopifyINTERCOMAppDirectServiceTitanDATADOG來源:OpenView、國金證券研究所方案,這種創(chuàng)新能力幫助企業(yè)在競爭激烈的市場中保持領(lǐng)先地位,并通過提供更具的產(chǎn)品來擴大市場份額。對于細分領(lǐng)域定制化的VerticalSaaS,我們認為機會會遠小于通用型SaaS,垂類SaaS應(yīng)用本身市場空間有限,并且隨著AlAgent的成熟,其業(yè)務(wù)會行業(yè)深度研究(深度)2)創(chuàng)新型消費電子產(chǎn)品,如AlPin、RabbitR1等;3)眼鏡形態(tài)的Al硬件。Al賦能傳統(tǒng)消費電子,基于現(xiàn)有的成熟硬件,推動傳統(tǒng)硬件Al化,繼承傳統(tǒng)硬件原有的生態(tài),有助于Al應(yīng)用落地。對于創(chuàng)新型產(chǎn)品,可以探索新的硬件形態(tài),想象力豐富,但需要市場和消費者的驗證,無論是基于傳統(tǒng)的消費品嵌入電子硬件,還是針對Al應(yīng)用構(gòu)建Al專用硬件,對于用戶的使用習(xí)慣、接受程度都是一個很大的挑戰(zhàn)。FriendLimitlessAIPin來源:Friend、Limitless、Rabbit、AlPin官網(wǎng)、國金證券研究所AI眼鏡只具備音頻功能的棱鏡光波導(dǎo)來源:國金證券研究所從輸入輸出方式上看,眼鏡是最靠近人體三大重要感官的穿戴設(shè)備:嘴巴、耳朵和眼睛。嘴巴是語言輸出器官、耳朵是語言接受的器官、眼睛則是人類最重要的信息攝入器官,人類80%的信息來源于視覺。眼鏡是人類穿戴設(shè)備和電子設(shè)備中最靠近這三大感官的群體,是Al最好的硬件載體,可以非常直接和自然的實現(xiàn)聲音、語言、視覺的輸入和輸出。目前具備顯示功能的眼鏡重量仍然會遠遠超過日常佩戴的眼鏡,但是只具備視覺和音頻的眼鏡已經(jīng)可以做到接近日常佩戴眼鏡的重量。并且目前大模型發(fā)展的方向也是多模態(tài)和實時性,作為聊天助手返回的內(nèi)容主要還是文本,但是可以理解圖片、視頻、音頻,只具備視覺和音頻的眼鏡提供的交互方式契合大模型的使用方式,為目前Al應(yīng)用最好的載體。行業(yè)深度研究(深度)SpeakersSpeakers&MicsAIButtonActivateAlIndicatorDigitalCrownTwistorpresstocontrolmediaplay13MP,1080pvideo,4kDimentions5.9×6.3×2inches(15×16×5cm)38.7gConnectivity來源:Meta、Rokid、LookTech官網(wǎng)、國金證券研究所從具體產(chǎn)品看,Meta與Rayban聯(lián)名推出的眼鏡在2024年4月開放MetaAl功能有已經(jīng)有放量的趨勢,到2024年Q2有約80萬的出貨量。國內(nèi)廠商也在積極布局類似形態(tài)的Al眼鏡,2025年將進入Al眼鏡大量出貨元年,并且隨著光波導(dǎo)技術(shù)的成熟和模型多模態(tài)和實時性能力的進步,Al眼鏡會有更好的體驗。我們預(yù)計明年率先大量出貨的仍是不具備顯示功能的類MetaRayban形態(tài)眼鏡,隨著光波導(dǎo)中光機和波導(dǎo)片成本的下降和體積的縮小,后年具備顯示功能的Al眼鏡有大量出貨的機會。圖表17:MetaRayban季度出貨量(臺)450,000450,000400,000350,000300,000250,000200,00050.0000來源:IDC、國金數(shù)字未來實驗室、國金證券研究所行業(yè)深度研究(深度)3.1人工智能算力系統(tǒng)面臨諸多挑戰(zhàn)隨著人工智能的發(fā)展,模型的規(guī)模和復(fù)雜性呈現(xiàn)出指數(shù)級增長,自2012年AlexNet問世以來,算力需求迅速攀升。AlexNet作為深度學(xué)習(xí)在計算機視覺領(lǐng)域的開創(chuàng)性成果,訓(xùn)練時依賴于兩塊NVIDIAGTX580GPU,耗費約470petaFLOP,標(biāo)志著深度學(xué)習(xí)時代的來臨。而此后模型的擴展速度令人矚目:2020年推出的GPT-3模型擁有1750億參數(shù),訓(xùn)練消耗約3.14x10?petaFLOP,GPT-4進一步升級至1.8萬億參數(shù),依賴25000個A100GPU,計算需求達2.1x101°petaFLOP,耗時90至100天,硬件與能源的需求達到新高度。在最新的超大規(guī)模模型—GeminiUltra上,算力要求再度躍升至5x101°petaFLOP。谷歌為此部署了大量TPUv4和TPUv5e加速器,以應(yīng)對計算需求和硬件挑戰(zhàn)。GeminiUltra的訓(xùn)練使用了多個數(shù)據(jù)中心中跨集群的TPUv4加速器,配置在4096個芯片組成的SuperPod中。每個SuperPod通過高速互聯(lián)進行數(shù)據(jù)通信,并利用專用光開關(guān)在大約10秒內(nèi)動態(tài)重配置為3D環(huán)面拓撲。 Publicationdate隨著超大規(guī)模模型對硬件資源的需求不斷增加,系統(tǒng)故間成比例下降。谷歌通過減少搶占和重新規(guī)劃的比率盡量減少硬件故障的影響,但在如此規(guī)模的硬件部署中,故障不可避免。GeminiUltra的計算復(fù)雜性推動了多模態(tài)Al架構(gòu)和大規(guī)模硬件集群的極限,盡管當(dāng)前的硬件性能接近瓶頸,但要滿足這種龐大模型的訓(xùn)練需求仍需數(shù)月的時間和大量的能源投入。然而,單卡算力、互聯(lián)性能和能源供應(yīng)的發(fā)展速度已逐漸趨緩。即便硬件性能逐年提升,將面臨這些硬件和能源限制的制約,解決這些關(guān)鍵短板將成為Al系統(tǒng)持續(xù)迭代和優(yōu)化的核心挑戰(zhàn)。3.2單卡算力升級速率落后于模型迭代速率,Blackwell延后預(yù)示系統(tǒng)摩爾進一步降速在我們之前的報告中,我們已經(jīng)指出,當(dāng)前基于傳統(tǒng)摩爾定律的發(fā)展速度(即單芯片晶體管數(shù)量的擴展速度)已經(jīng)遠遠落后于人工智能模型對于算力的需求。最新的EpochAl數(shù)據(jù)表明,當(dāng)前一些知名模型的訓(xùn)練所需算力僅需據(jù)進行了更深入的分析后發(fā)現(xiàn),如今更為主流的多模態(tài)大模型(例如GeminiUItra和GPT-4)在算力需求方面的增長趨勢更為陡峭。這些模型的算力需求翻倍時間已經(jīng)縮短到不到六個月。與此形成鮮明對比的是,傳統(tǒng)摩爾定律所定義的晶體管數(shù)量翻倍周期是18個月,這意味著上述多模態(tài)大模型的算力需求增長速度已經(jīng)顯著超越了傳統(tǒng)芯片晶體管數(shù)量增長速度。換句話說,大模型算力需求的增長速度已經(jīng)明顯領(lǐng)先于傳統(tǒng)摩爾定律所能支撐的硬件性能提升速度。行業(yè)深度研究(深度)系統(tǒng)摩爾是業(yè)界為應(yīng)對摩爾定律放緩的解決方案。英偉達最新的Blackwell架構(gòu)的核心特HBI技術(shù)連接在一起,該技術(shù)基于NVLink5.0協(xié)議,提供高達10TB/s的帶寬。OrganicOrganic-SubstrateInterposer|SuperchipTheTwoLargestDiesPossible-UnifiedasOneGPU2reticlelimiteddiesoperateasOneUnifiedCUDAGFNVHBI10TB/sHighBandwidthInterfaceFullperformancewithnocompromises192GBHBM3e|8TB/secHBMBandwidth|1.8TB/sNVLinkofAIClass從單卡性能來看,以芯片面積增益進行歸一化計算后,空氣冷卻的B200在FP16FLOPS性能上每單位芯片面積僅提升了14%,這與人們對全新架構(gòu)的期望相去甚遠。這是因為大部分性能提升主要依賴于更大的芯片面積和量化優(yōu)化。由于計算芯片(die)的面積不斷擴大,封裝所需的中介層面積也相應(yīng)增加,導(dǎo)致整體成本上升。與采用完整硅中介層的CoWoS-S技術(shù)相比,CoWoS-L技術(shù)通過在有機基板中局部嵌入硅橋的方式,減少了硅的使用量,從而有效降低了成本。這也是Blackwell選擇采用的位置校準出現(xiàn)了偏差,尤其是在Blackwell所采用的接近兩倍光罩極限面積的中介層上,其工藝難度進一步增加,另外,計算die、CoWoS-L中局部硅橋、以及CoWoS-L中介層中的RDL部分三者的熱膨脹系數(shù)之間的差異也會導(dǎo)致封裝結(jié)構(gòu)出現(xiàn)彎曲,影響系統(tǒng)性發(fā)布會上英偉達表示GB200相較于H200在1.8T參數(shù)的GPT-MoE模型上的推理性能將提升30倍,然而,這一數(shù)據(jù)是基于一個非常特定的最佳場景得出的。需要明確的是,這一場景在理論上確實可以實現(xiàn),但并不能完全代表市場中的普遍應(yīng)用場景。解釋30倍性能提升的一個關(guān)鍵因素是將GB200NVL在FP4下的性能與H200和B200在FP8量化下行業(yè)深度研究(深度)Semianalysis模擬分析,這一情形下實際性能提升僅有18倍,如果在更貼近現(xiàn)實的情況下,性能提升幅度將更低。GPTGPT-MoE1.8TThroughputperGPUInference(seqlen=32k/1k,FTLThroughputperGPUTokensTokensperSecondTP2.EP16.PP2TP4.EP16Blackwell30XHoppereractivityperUserTokensperSecond我們認為Blackwell因設(shè)計問題延遲出貨已經(jīng)反映出了數(shù)據(jù)中心高性能計算芯片在制造段繼續(xù)迭代的瓶頸,盡管英偉達可以通過節(jié)點內(nèi)和節(jié)點外互聯(lián)提升總體系統(tǒng)性能,但我們認為單卡算力(計算性能/功耗)的提升仍舊是必要的,節(jié)點內(nèi)GPU間通信(NVLink)慢于片上通信,節(jié)點間通信(Infiniband/Ethernet)又顯著慢于節(jié)點內(nèi)通信,導(dǎo)致并行化帶來的算力提升是邊際遞減的,單卡PPA的提升仍是后續(xù)系統(tǒng)性能繼續(xù)提升的關(guān)鍵。>TP822.0>TP16>TP32TP64Interactivity(tokens/second/user)當(dāng)前市場對英偉達的預(yù)期相當(dāng)充分,根據(jù)彭博一致預(yù)期,市場預(yù)期英偉達FY2025Q4至研發(fā)部署對毛利率的壓制是有所認知的,但認為FY2026Q3對毛利率的壓力將有所緩解。行業(yè)深度研究(深度)來源:nextplatform、國金證券研究所從時間線上來看,F(xiàn)Y2026Q3英偉達或?qū)㈤_始出貨BlackwellUItra,BlackwellUltra即為Blackwell的HBM升級版本,技術(shù)上難度相對Blackwell并沒有顯著提高,市場預(yù)期FY2026Q3毛利率有所回升是合理的。我們不同于市場的觀點是,應(yīng)當(dāng)警惕下一代產(chǎn)品即Rubin不能如期發(fā)布的風(fēng)險,對英偉達的下一代產(chǎn)品來說,從芯片制造的角度,我們認為無論是從單位面積晶體管縮放還是先進封裝角度,實現(xiàn)大幅度性能提升的難度都不容小覷。3.3數(shù)據(jù)中心電力消耗呈指數(shù)級增長,核電或成最優(yōu)解決方案根據(jù)IDC數(shù)據(jù),24年云服務(wù)廠商數(shù)據(jù)中心容量達到28240兆瓦(MW),2028年將達到56756兆瓦(MW),CAGR為19%。24年云服務(wù)廠商數(shù)據(jù)中心預(yù)計消耗電力約達到563億千瓦時,按全球23年發(fā)電量29.92萬億千瓦時來算,云廠數(shù)據(jù)中心耗電量占比將達到0.2%,而如果按全部數(shù)據(jù)中心耗電量4170億千瓦時來計算,則這一比例達到1.4%。按2028年8568億千瓦時用電量來計算的話則占比達到2.9%。數(shù)據(jù)中心耗電量的快速上升將會影響到正常生活中的用電。且全球主要數(shù)據(jù)中心集中在中國、美國、歐洲等地區(qū),這些國家發(fā)電量僅為全球的一半左右,但數(shù)據(jù)中心用電量基本沒有減少,數(shù)據(jù)中心耗電量的比例在這些國家中的還會繼續(xù)上升。如果再進一步集中到這些國家中數(shù)據(jù)中心密集的地區(qū),則地區(qū)的用電壓力還會進一步提升。400002000002019202020212022202320242025202620272028數(shù)據(jù)中心容量(MW)—同比增速(%)25%20%-5%來源:IDC、國金數(shù)字未來實驗室、國金證券研究所為了應(yīng)對越來越高的能源需求,主要的云服務(wù)廠商都打算將能源供應(yīng)的責(zé)任放在核電站上。行業(yè)深度研究(深度)獨立于居民、工業(yè)用電的核電具備許多優(yōu)勢。1)盡管核電站的建設(shè)成本歷來較高,但其運營成本相對較低,單個反應(yīng)堆的發(fā)電容量通常超過800MW。此外,核電站發(fā)電過程中核能具有重要吸引力。2)與住宅或許多其他行業(yè)的用電需求不同,數(shù)據(jù)中心的用電需求在一天中的各個時間段相對穩(wěn)定。這種持續(xù)的用電需求非常契合核電站的運營特點,后者通常無法快速調(diào)整發(fā)電功率以應(yīng)對需求波動。核電站持續(xù)穩(wěn)定的發(fā)電能力能夠確保數(shù)據(jù)中心在全天候都能獲得足夠的電力,同時還為其提供了零碳排放的大規(guī)模能源來源。3)當(dāng)數(shù)據(jù)中心與發(fā)電源直接連接時,數(shù)據(jù)中心可以直接從發(fā)電廠獲取電力,而無需經(jīng)過更大的輸電網(wǎng)絡(luò)。盡管購電協(xié)議的存在并不要求發(fā)電廠和數(shù)據(jù)中心必須在同一地點,甚至不需要在同一時間發(fā)電和用電,但這種安排可以通過直接將需求增長與發(fā)電來源匹配電網(wǎng)成本。24年3月,亞馬遜斥資6.5億美元,從電力運營商Talen能源手里買下一座占地1200英畝的“核電數(shù)據(jù)中心園區(qū)”——數(shù)據(jù)中心就坐落在兩個核反應(yīng)堆邊上。除此之外,也在積極和ConstellationEnergy尋求更多核電站合作。24年9月,ConstellationEnergy宣布了一項為期20年的購電協(xié)議(PPA),將為微軟位于美國中大西洋地區(qū)的數(shù)據(jù)中心提供電力。這些電力將來自賓夕法尼亞州三哩島核電站的1號反應(yīng)堆。谷歌24年10數(shù)據(jù)中心所需的巨大能源。根據(jù)協(xié)議內(nèi)容,谷歌計劃在本十年內(nèi)開始使用首個核反應(yīng)堆,并在2035年前引入更多的核能設(shè)施。云廠時間核電站情況核電站容量谷歌2024年10月達成協(xié)議,待建地點未知累計500MW,2035年交付微軟2024年9月核電站重啟賓州三哩島核電站835MW亞馬遜2024年3月在建,進度過半賓州薩斯奎哈納核電站2024年10月簽署協(xié)議,待建弗吉尼亞州北安娜核電站5億美元合作開發(fā)SMR小型核反應(yīng)堆項目,累計300MW由亞馬遜投資的X-energy2024年10月簽署協(xié)議,待建華盛頓州開發(fā)4個SMR小型核反應(yīng)堆項目,累計960MW來源:eia、bbc、財聯(lián)社、亞馬遜官網(wǎng)、國金證券研究所但核能并非毫無風(fēng)險。除了核反應(yīng)堆安全問題之外,數(shù)據(jù)中心&核電站供電方式也存在新的問題。雖然新建核電站可以單獨供給數(shù)據(jù)中心,但已建成的核電站通常與電網(wǎng)相連,數(shù)據(jù)中心過度供電依舊會威脅電網(wǎng)的可靠性,產(chǎn)生的額外費用目前也沒有規(guī)定該由誰支付。這也是24年11月,美國聯(lián)邦能源管理委員會否決亞馬遜增加數(shù)據(jù)中心供電提案的主要考慮政治&安全因素,一些大國如中國、美國國內(nèi)核電站新建政策可能會收緊,但東南亞一些國家正在積極擴張核電。除了越南、緬甸、馬來西亞等已經(jīng)建設(shè)或考慮建設(shè)核電站的國家外,泰國于11月15日簽署核電站項目合作備忘錄,首次啟動核能發(fā)展,以推動清潔、低成本能源建設(shè)。該項目以SMR小型模塊化反應(yīng)堆技術(shù)為核心,旨在降低電價并減少碳排放。該技術(shù)具有高安全性、空間需求小等優(yōu)勢,并計劃將核電納入2037年國家清潔能源發(fā)展目標(biāo)。行業(yè)深度研究(深度)四、大模型推理服務(wù)大規(guī)模部署,如何影響硬件市場?4.1大模型性能提升,推動推理算力需求加速增長oadrscfttmth5buWmChaCFT+ActionlogVirtualcomputer2807wsw大模型服務(wù)已從聊天機器人進化為嚴肅生產(chǎn)力,十一月中,MacOSChatGPT客戶端已經(jīng)開始支持讀取用戶屏幕上的代碼并給出編程建議,這是OpenAI“WorkwithApps”功能在編程工具上的體現(xiàn),從名字上可以看出,該功能可能不僅面向編程工具,未來可能支持更多工具。Anthropic也已在十月中發(fā)布了其Claude3.5Sonnet更新版本,通過其“ComputerUSE”API,Claude被訓(xùn)練具備屏幕視覺理解能力,能夠“觀察”屏幕上發(fā)生的事情,并通過分析屏幕截圖理解用戶界面(UI)的布局和內(nèi)容。當(dāng)開發(fā)者將特定任務(wù)交付給Claude并授予其必要的權(quán)限時,它可以通過解析截圖計算光標(biāo)需要移動的具體像素距離(包括垂直和水平方向),以便精準定位到目標(biāo)區(qū)域進行操作。盡管作為第三方模型,WorkwithApps和ComputerUSE并沒有接入系統(tǒng)底層,大模型在Agent功能,輸入和輸出Token的數(shù)量將大大增加,單位Prompt所需的推理算力將顯著增長。160000000140000000160000000140000000800000006000000040000000200000000 一桌面端移動端總計來源:Similarweb、國金證券研究所根據(jù)我們追蹤的ChatGPT訪問量數(shù)據(jù),我們認為大模型正在被加速應(yīng)用,其生產(chǎn)力屬性已經(jīng)在消費級市場獲得了驗證,GPT-4o和Claude3.5的發(fā)布代表著大模型能力進入了一個新的階段,將驅(qū)動推理算力需求的大幅提升。2020行業(yè)深度研究(深度)GPT類模型通過給定前文來預(yù)測下一個token(即單詞或符號)進行訓(xùn)練。在生成文本時,需要首先輸入提示詞(prompt),然后模型預(yù)測下一個token,并將其添加到提示詞中,隨后再預(yù)測下一個token,重復(fù)這一過程直到完成生成。這一生成機制每次生成下一個token時,所有模型參數(shù)必須從內(nèi)存?zhèn)鬏數(shù)教幚砥?,而這些龐大的參數(shù)需要盡可能靠近計算單元存儲,以降低數(shù)據(jù)傳輸?shù)难舆t,必須確保這些參數(shù)能夠在需要時精準加載到芯片上。這種推理模式對硬件的內(nèi)存帶寬、容量以及數(shù)據(jù)傳輸效率提出了嚴苛要求,也成為當(dāng)前生成式AI技術(shù)突破的重要瓶頸之一。InstinctGPU相對于英偉達GPU一直提供更高的存儲容量和存儲帶寬,M1325X和Hopper架構(gòu)中存儲容量最大的H200相比,Instinct在顯存容量上具有1.8倍的優(yōu)勢,這意味著加載特定模型參數(shù)時所需的GPU數(shù)量減少了1.8倍,同時,AMD在帶寬上也具備1.25倍的優(yōu)勢,這表明在將模型參數(shù)傳輸至GPU的過程中所需時間更短。HBM3E,存儲容量將達到288GB,帶寬將達到和B200相同的8TB/s,而存儲容量將顯著高于B200的192GB。圖表30:M/355XHBM3E容量將達到288GB288GBHBM3EAMDIrstindAMDInstnd256GBHBM3E192GBHBM35.3TB/s6TB/s8TB/s來源:nextplatform、國金證券研究所InstinctGPU除了在存儲容量方面具有顯著優(yōu)勢,其相對英偉達GPU較低的定價更為低廉,三星于去年采購過一批M1300XGPU,單價約為一萬美金,相較于當(dāng)時H100三萬至四萬美金,有顯著的成本優(yōu)勢。根據(jù)我們的產(chǎn)業(yè)鏈調(diào)研,出于降低成本和尋找第二供應(yīng)商的考慮,海外云場正在積極嘗試使用AMDGPU集群。盡管AMD受制于軟件生態(tài)和互聯(lián)性能在訓(xùn)練領(lǐng)域尚難以于英偉達競爭,我們認為隨著推理算力需求大幅提升,AMD在該領(lǐng)域?qū)⒊掷m(xù)收益。4.3端側(cè)推理:單用戶推理導(dǎo)致內(nèi)存端高成本,端云結(jié)合將是未來趨勢Al手機和AIPC提供的端側(cè)Al允許用戶將數(shù)據(jù)留在本地,但端側(cè)Al的單用戶場景意味著BatchSize為1,這意味著每次從內(nèi)存加載模型參數(shù)到芯片上時,其成本只能分攤到單個token上,無法通過其他用戶的并發(fā)計算來緩解這一瓶頸,服務(wù)器端的推理我們先前已經(jīng)討論過,內(nèi)存墻仍然存在,但多個用戶的推理請求使內(nèi)存加載參數(shù)的成本分攤到多個token上,大幅降低單個token生成的開銷,對生成式模型的推理效率提升有顯著作用。從模型參數(shù)占據(jù)的存儲空間來看,當(dāng)前Al手機的內(nèi)存容量仍舊是嚴重不足的。以Llama7B模型為例,在FP16格式下,每個參數(shù)占據(jù)兩個字節(jié),對應(yīng)14GB的內(nèi)存容量,除此之外,手機RAM中還需要存儲應(yīng)用程序和操作系統(tǒng)相關(guān)數(shù)據(jù),在Al手機本地存儲并運行這一規(guī)模的端側(cè)模型還是頗有難度的。根據(jù)IDC數(shù)據(jù),端側(cè)Al需求尚未推動智能手機單機內(nèi)存容量顯著增長,我們認為這并非手機廠商沒有意識到端側(cè)Al的重要性,而是在端側(cè)實現(xiàn)高性能模型所需的存儲容量遠高于目前技術(shù)所能提供的,即便手機廠商將存儲容量從16GB提升至32GB能夠顯著增大可容納模型參數(shù)規(guī)模,但和超大云端模型當(dāng)前所能提供的性能相比,我們認為仍舊是不具有可比性的。行業(yè)深度研究(深度)圖表31:各價格段智能手機平均內(nèi)存容量87-65-0從消費者的角度來看,端側(cè)并非嚴肅生產(chǎn)力場景,用戶并不需要頻繁處理復(fù)雜任務(wù)。即使是在類似AIPC這樣的端側(cè)場景中,復(fù)雜任務(wù)往往可以通過網(wǎng)頁或客戶端接入云服務(wù)來完成,而非依賴本地化運行復(fù)雜內(nèi)容。因此,單純?yōu)榱吮镜鼗瘡?fù)雜任務(wù)而額外增加內(nèi)存開銷并不具備充分的合理性。我們認為,端側(cè)Al用戶的核心需求并不在于直接在本地處理復(fù)雜任務(wù),而是通過Al實現(xiàn)系統(tǒng)層面的非標(biāo)準化操作。例如,自動將個人住址信息填寫到電商應(yīng)用中。相比單純依靠提升Al能力來滿足這些需求,我們認為更優(yōu)的解決方案是將系統(tǒng)底層的數(shù)據(jù)接口和指令接口與Al模型深度集成。具體而言,Al模型可將用戶指令拆解為具體操作指令,并通過腳本直接與操作系統(tǒng)交互,從而以更高效、更經(jīng)濟的方式實現(xiàn)個性化功能。在本地模型性能顯著提升需要大量額外內(nèi)存容量,而端側(cè)Al用戶的核心需求能夠通過數(shù)據(jù)接口和腳本操作來滿足的背景下,我們認為端側(cè)Al硬件廠商大幅增加內(nèi)存容量并非明智之舉。當(dāng)前市場數(shù)據(jù)也驗證了這一觀點,在內(nèi)存技術(shù)尚未實現(xiàn)單位體積容量大幅提升或單位容量成本顯著下降的前提下,端側(cè)Al硬件廠商對內(nèi)存容量配置的謹慎態(tài)度可能將行業(yè)深度研究(深度)24年三季度,Al手機銷量達到1.47億臺,同比增長約8%,Al筆電銷量達約1450萬臺,同比增長110%。圖表32:全球A/手機&A/筆電銷量(臺)及增速AlAl手機&Al筆電增速2023Q3AI2024Q3AI2023Q3Al50,000,000100,000,000150,000,000來源:IDC、國金數(shù)字未來實驗室、國金證券研究所5.1Al手機焦點在于旗艦機來負責(zé)端側(cè)的推理,部分解放了GPU資源,使得手機可以更好的運轉(zhuǎn)。同時內(nèi)存升也是在進行端側(cè)推理卻不降低手機流暢性的必要條件。作為新加入者的Al功能,用戶對其的要求是不能影響以前的視屏、游戲、辦公等功能。因此,高配置、高價格的旗艦機在硬件需要提升帶來成本增長的情況下更能滿足消費者的需求,漲價也更容易被消費者接受。從價格上看,全球智能手機價格在21年后緩慢回升,且700美元以上的智能手機銷量在不斷提升,24年三季度銷量達到約7400萬臺,同比增長2%。10月安卓系廠商公布的數(shù)據(jù)表明了消費者對于新一代旗艦機的熱情。根據(jù)vivo官方公告,X200系列手機全渠道銷售金額已經(jīng)突破了20億元,這一數(shù)據(jù)打破了vivo歷史上所有新機銷售記錄,顯示了消費者對這一系列新品的熱烈歡迎。截至2024年10月19日,X200系列的銷量估計在29.4萬到46.5萬臺之間(按最低價與最高價估計)。11月9日,在小米直播中,小米集團總裁盧偉冰透露,小米15系列的銷量已破100萬臺,破百萬的速度要快于前代小米14系列。圖表33:全球智能手機銷量(臺)&平均價格(美元)20170320180120180220180320190220190320200220210220210320210420220120220220220320220420230120230220230362023042024012017032018012018022018032019022019032020022021022021032021042022012022022022032022042023012023022023036202304202401202403全球智能手機銷量(臺)&平均價格(美元)●銷量●平均價格400,000,000350.000.000300,000,000250,000,000200,000,000150,000,000100,000,00050.000.0000200來源:IDC、國金數(shù)字未來實驗室、國金證券研究所2323行業(yè)深度研究(深度)價格區(qū)間-全球智能手機銷量-季度90%80%70%50%40%30%20%24年三季度,在具備基礎(chǔ)Al功能的手機中,蘋果占約42%的份額,安卓系廠商占到約58%的份額。而在可以完成本地推理的Al手機中,蘋果24年三季度占據(jù)約60%的份額,安卓系廠商約占到40%。我們認為在2022年ChatGPT爆火后的兩年中,安卓系廠商和蘋果在推進將Al功能融入進自己的生態(tài)中。即使現(xiàn)在爆款的Al應(yīng)用還沒有出現(xiàn),但各家大廠已經(jīng)在硬件、軟件、生態(tài)上布局,目標(biāo)是當(dāng)爆款A(yù)l應(yīng)用真正出現(xiàn)時,自家的旗艦手機能夠支持這些應(yīng)用。圖表35:生成式A/手機銷量(臺)圖表36:A/手機銷量(臺)生成式生成式AI手機銷量(臺)--分品牌●Applerealme●Samsung●ASUS●HonorSonyOthers●Lenovo55,000,00050,000,00045,000,00040.000,00035,000,00030,000,00025,000,00020,000,00015.000,00010,000,0005,000,00002023Q32023Q42024Q12024Q22024Q3Al手機銷量(臺)--分品牌●OtherCompanies●Samsung●XiaomiOPPO●Honor●Apple●Huawei●Lenovo160,000,000140,000,000120,000,000100,000,00080,000,00060,000,00040.000.00020,000,00002023Q12023Q22023Q32023Q42024Q12024Q22024Q3國金數(shù)字未來實驗室、國金證券研究所硬件的提升是手機更新?lián)Q代中至關(guān)重要的一環(huán),但與以往不同的是,這次Al革命中,硬件、軟件、生態(tài)缺一不可。SoC端,23年以來,聯(lián)發(fā)科天璣系列芯片的崛起,為安卓系廠商旗艦機新增了一個選擇。以往,高端手機除了蘋果外,高通旗艦芯片幾乎是唯一選擇。但在2023年聯(lián)發(fā)科使用天璣9300的ARM公版4超大核+4大核的策略以來,聯(lián)發(fā)科憑借其優(yōu)異的性能使得今年vivo、OPPO等廠商選擇天璣9400作為旗艦機的SoC選擇。在目前的競爭中,蘋果A18Pro搭載了和A17Bionic相同的16核NPU,支持每秒高達35TOPS的計算能力。高通驍龍8Elite采用增強的HexagonNPU技術(shù),具備80TOPS算力,性能提升了45%,能效提升了45%,支持更長的token輸入、多模態(tài)Al助手的本地部署,綜合Al性能增強達到45%。天璣9400憑借全新第八代NPU890,不僅Al跑分再奪得蘇黎世理工學(xué)院的AlBenchmark測試第一,同時還首發(fā)帶來了天璣Al智能體化引擎,端側(cè)視頻生成及端側(cè)LoRA訓(xùn)練,全面提升了端側(cè)Al的體驗。我們認為,安卓系手機廠商在有了更多的旗艦SoC選擇后對于高通的依賴性將會有所降低,更有效的策略會促使廠商研發(fā)更能滿足消費者的產(chǎn)品。行業(yè)深度研究(深度)圖表37:手機旗艦SoCCPU能耗曲線(整數(shù))圖表38:手機旗艦SoCCPU能耗曲線(浮點)天璣9400-x?25來源:極客灣,國金證券研究所來源:極客灣,國金證券研究所圖表39:手機旗艦SoCCPU負載能耗曲線圖表40:手機旗艦SoCGPU負載能效曲線3DMarkSteelNomadLight(分)A代表蘋果,SD代表驍龍,D代表天璣LPDDR5X10667MT/sLPDDR5X853320主板功耗(W)來源:極客灣,國金證券研究所來源:極客灣,國金證券研究所正如前文提到的那樣,我們認為在未來,端云結(jié)合是更適合Al手機的方案。操作系統(tǒng)的提升是端側(cè)Al推理對使用體驗提升最直觀的場景,也是目前手機廠商關(guān)注的重點。在硬件支持端側(cè)推理后,蘋果著重強化了Siri的能力,規(guī)劃中Siri將扮演智能語音助手的職責(zé),幫助用戶用語音或簡短的文字操作手機。新Al技術(shù)加持后,Siri的交互更加自然靈Siri也能順暢理解,并能為連續(xù)的請求沿用語境場景。實際操作過程中,系統(tǒng)的反饋速度、對用戶要求的準確性都是影響體驗的關(guān)鍵因素,因此端側(cè)硬件的性能以及模型的能力都至關(guān)重要。小米也在不斷更新小愛同學(xué),讓其完成Al手機助手的職責(zé)。在娛樂場景可WatchthefilmOvisualsintheirmind.Thisconditioncaninfluenceone'screativity,memory,andevencareethatsymptomsmani來源:蘋果官網(wǎng)、國金證券研究所通常來說,端云結(jié)合的模式下,需要硬件(性能)、軟件(適配操作系統(tǒng))、生態(tài)環(huán)境(AI應(yīng)用的數(shù)量及質(zhì)量)、云(模型質(zhì)量及云服務(wù)質(zhì)量)等環(huán)節(jié)參與。我們認為全部環(huán)節(jié)都可控并參與的手機廠商更容易成功。蘋果、谷歌在某項上有些缺陷,但整體來看鏈路更為完整。蘋果在硬件、軟件、生態(tài)環(huán)境、云服務(wù)上能力都很強,但是在模型領(lǐng)域需要暫時和OpenAl合作。谷歌有原生安卓支持、Gemini強大的模型能力,但在硬件上自己的Pixel手機滲透率低,需要仰仗三星端側(cè)硬件拓展用戶。兩者相比的話,蘋果的Al服務(wù)現(xiàn)金化率我們認為將會更高。1)蘋果本身用戶群體更容易接受付費。iPhone的價格在所有大廠的智能手機中屬于偏高的檔次,蘋果的用戶付費能力也會更強一些。從蘋果FY23-24財報來看,服務(wù)收入為961.69億美元,同比增長約13%,收入占總收入的24.59%,是除iPhone外收入最高的產(chǎn)品。此次AppleIntelligence的訂閱費為20美元/月,與ChatGPT訂閱費一致,用戶平替的阻礙較小。谷歌的Gemini近期從免費變?yōu)槭杖?0美元/月的訂閱費,相對來說,用戶付費阻力更大一點。根據(jù)數(shù)據(jù),24年一季度雖然谷歌Play商店應(yīng)用總下載量(255億次)遠超過蘋果AppStore的84億次,但蘋果在2024年一季度的收入為246億美元,反而是谷歌同期112億美元收入的“近兩倍”。2)蘋果硬件軟件生態(tài)更為完整,同時與OpenAI的合作摩擦更少。作為谷歌Al的載體,三星即將收取Al服務(wù)費,這降低了用戶對Gemini的付費意愿。三星作為全球安卓手機市場的龍頭,對谷歌的態(tài)度處于合作&競爭并存的狀態(tài),這種合作形式不利于谷歌全額賺取5.2AIPC的競爭將會越發(fā)激烈24年三季度,全球Al筆電銷量達到約1400萬臺,同比增長105%,Al筆電滲透率達到了約30%,相比二季度提升了約5個百分點。其中英特爾核Al筆電銷量約為720萬臺,占比約50%,蘋果、AMD、高通核的Al筆電銷量分別為540萬、134萬、55萬臺,占比分別為37%、9%、4%。行業(yè)深度研究(深度)圖表42:全球A/筆電銷量(臺)及增速圖表43:全球A/筆電滲透率●出貨量(臺)●同比增速8,000,0006,000,0004,000,0002,000,0002023Q12023Q22023Q32023Q42024Q12024Q22024Q32023Q12023Q22023Q32023Q42024Q12024Q22024Q3全球AI筆電滲透率來源:IDC、國金數(shù)字未來實驗室、國金證券研究所來源:IDC、國金數(shù)字未來實驗室、國金證券研究所圖表44:圖表44:A/筆電SoC/CPU/APU銷量(個)NPUAIPC中SoC/APU/CPU銷量(個)6,000,00002023Q12023Q22023Q32023Q42024Q12024Q22024Q3來源:IDC、國金數(shù)字未來實驗室、國金證券研究所市場,同時和微軟的“Wintel”聯(lián)盟以及芯片先進制成使得英特爾的護城河足夠?qū)?。但在近些年移動互?lián)網(wǎng)(手機等移動設(shè)備)的發(fā)展過程中,英特爾錯失了手機CPU市場。再加上三星、臺積電工藝迅速提升而英特爾晶圓技術(shù)發(fā)展陷入停滯,除了傳統(tǒng)服務(wù)器&PCCPU業(yè)務(wù)外,英特爾近年來業(yè)務(wù)范圍和規(guī)模不斷縮小,導(dǎo)致收入與利潤水平不斷下滑。因此,在“最后的大本營”CPU處理器上,英特爾實際已經(jīng)不能再失敗。但與二十年前一家獨大不同的是,在X86架構(gòu)處理器上AMD已經(jīng)擺脫需要英特爾這個對手幫助存活的階段,開始搶占英特爾的份額。而在ARM架構(gòu)處理器上,蘋果依靠著M系列芯片出色的設(shè)計、臺積電先進工藝的加持以及強大的生態(tài)環(huán)境等優(yōu)勢,穩(wěn)定的占據(jù)ARM架構(gòu)PC的份額。雖然,在全球所有PC設(shè)備處理器市場中,英特爾依舊保持著領(lǐng)先地位,72%左右的市占率雖然相比之前有所下滑,但依舊遙遙領(lǐng)先份額緩慢上升的AMD(約16%份額)。但在Al筆電領(lǐng)域,份額下滑到約50%的英特爾將會遇到更多競爭。行業(yè)深度研究(深度)圖表45:全球PC處理器份額40%20%2023Q12023Q22023Q32023Q42024Q12024Q22024Q3在X86與ARM的競爭中,雖然ARM功耗低帶來續(xù)航的優(yōu)勢,但X86架構(gòu)下好用的各種APP為X86構(gòu)建起了軟件護城河。即使蘋果在努力擴大自己的軟件生態(tài),同時提升ARM轉(zhuǎn)譯X86能力,短時間內(nèi)仍不足以在MacOS跑通全部應(yīng)用,X86架構(gòu)將繼續(xù)享有軟件生態(tài)上的優(yōu)勢。在X86生態(tài)內(nèi),AMD是英特爾最大的對手。憑借著Al筆電中SoC優(yōu)異的性能,以近幾個月,英特爾、AMD分別推出UltraLake和RyzenAl系列芯片,兩家SoC廠商在蘋果以外的X86架構(gòu)Al筆電市場展開了競爭。AMD在芯片推出時間上占據(jù)了優(yōu)勢,但隨著英特爾采用臺積電3nm先進工藝,英特爾UItra200s系列芯片在功耗&性能上有所改善,搶占了大批OEM市場。高通XElite系列芯片近期表現(xiàn)不佳,XElite核筆電的價格偏高的同時,性能卻不如同為ARM架構(gòu)的蘋果。在適配性上,高通XElite芯片在轉(zhuǎn)譯32位X86軟件時性能下滑嚴重,同樣也讓想要良好軟件生態(tài)的用戶有所顧慮。英特爾LunarLake系列芯片在24Q2&24Q3都有不錯的銷量,四季度英特爾發(fā)布了新一代Ultra架構(gòu)芯片,在功耗上有明顯提升,我們認為英特爾核Al筆電四季度的銷量將會繼續(xù)增長。蘋果憑借M3芯片的強大性能維持銷量的穩(wěn)定,我們認為四季度M4核AIPC推出后,蘋果銷量將繼續(xù)增長。AMDRyzen300Al系列在8月正式發(fā)布,在芯片性能表現(xiàn)優(yōu)異的情況下我們認為4季度Ryzen300Al芯片的銷量占比將會提高。高通由于XElite在性能&價格等方面的劣勢暫時銷量較低。圖表46:英特爾核A/筆電中SoC銷量(個)圖表47:蘋果核A/筆電中SoC銷量(個)英特爾英特爾Al筆電中SoC銷量(個)3,000,0002,500,0002,000,000500,00002023Q42024Q12024Q22024Q3蘋果Al筆電中SoC銷量(個)02023Q12023Q22023Q32023Q42024Q12024Q22024Q3來源:IDC、國金數(shù)字未來實驗室、國金證券研究所來源:IDC、國金數(shù)字未來實驗室、國金證券研究所2828行業(yè)深度研究(深度)圖表48:AMD核A/筆電中SoC銷量(個)圖表49:高通核AI筆電中SoC銷量(個)高通Al高通Al筆電中SoC銷量(個)●Snapdragon●SnapdragonXElite●SnapdragonXPlus280,000260,000220,00080,00060,00020,00002023Q12023Q22023Q32023Q42024Q12024Q22024Q3AMDAl筆電中SoC銷量(個)Ryzen9AI●Ryzen7AI●Ryzen5AI●Ry600,000500,000400,000300,000200,0002023Q22023Q32023Q42024Q12024Q22024Q30-來源:IDC、國金數(shù)字未來實驗室、國金證券研究所來源:IDC、國金數(shù)字未來實驗室、國金證券研究所我們認為未來X86筆電市場競爭將會更為激烈,英特爾和AMD產(chǎn)品在性能、續(xù)航、適配性、生態(tài)方面各分秋色。而在X86臺式機領(lǐng)域,由于功耗的重要性大幅降低,AMD的CPU性能更為出色使得用戶更偏向于采用AMDCPU的個人臺式機或者工作站電腦。在ARM領(lǐng)域,蘋果的優(yōu)勢更為明顯。高通XElite目前性能僅與蘋果M1、M2芯片類似,同時在生態(tài)上遠遠落后于蘋果及X86架構(gòu)對手。短時間內(nèi)高通很難與蘋果競爭ARM架構(gòu)Al筆電的市

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論