DeepSeek十問十答分享說明_第1頁
DeepSeek十問十答分享說明_第2頁
DeepSeek十問十答分享說明_第3頁
DeepSeek十問十答分享說明_第4頁
DeepSeek十問十答分享說明_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

正文目錄DeepSeek十問十答 3問題#1:DeepSeek是否會抑制算力增長? 3問題#2:DeepSeek是否會改變Al算力的增長范式 4問題#3:DeepSeek會改變市場投資邏輯嗎? 5問題#4:DeepSeek是否會改變芯片市場格局? 6問題#5:DeepSeek真的那么便宜嗎? 7問題#6:DeepSeek到底有哪些創(chuàng)新? 8問題#7:DeepSeek會帶動中國科技資產(chǎn)價值重估嗎? 9問題#8:DeepSeek會推動端側(cè)智能發(fā)展嗎? 問題#9:DeepSeek會導(dǎo)致美國提升出口管制壓力嗎? 問題#10:DeepSeek會改變開源軟件生態(tài)嗎? 風險提示 圖表目錄圖表1:MAAMG季度資本開支 3圖表2:大模型對半導(dǎo)體需求增長快于摩爾定律 4圖表3:美股軟/硬件板塊股價漲跌幅 5圖表4:硬件/軟件ETF主要權(quán)重股估值和股價表現(xiàn) 5圖表5:Nvidia、AMD、Broadcom、Marvell、Intel數(shù)據(jù)中心及Al相關(guān)收入趨勢 6圖表6:DeepSeekAITCO 7 8圖表8:Nasdaqvs恒生科技一年前向PE 9圖表9:Nasdaqvs恒生科技一年前向PE 9圖表10:DeepSeek-R1模型已作為NVIDIANIM微服務(wù)發(fā)布 圖表11:DeepSeek或催化美國提升出口限制壓力 圖表12:開源模型性能進步速度快于閉源模型 圖表13:國內(nèi)外主流Al大模型對比 場、技術(shù)創(chuàng)新、端側(cè)智能、出口管制、投資邏輯、軟件生態(tài)、開源生態(tài)以及中國科技資產(chǎn)卡的H800GPU集群上訓(xùn)練約2個月,合計成本約557.6萬美金,相較而言,Llama3系列模型的計算預(yù)算則多達3930萬H100GPU小時,DeepSeek訓(xùn)練成本約相當于Llama3系列模型的7%。隨著Al技術(shù)成本的下降.其應(yīng)用范圍將大幅擴展.最終可能導(dǎo)致算力需求的大幅增長。微2Q242Q24合計同比(右軸)120%0注:預(yù)測數(shù)據(jù)來自Factset一致預(yù)期資料來源:Factset,AI算力大致分為1)用于研發(fā)通向通用人工智能(AGI)的前沿模型相關(guān)的探索性算力(AGI方向),2)面向一般消費者的應(yīng)用性算力(現(xiàn)有模型推理)。過去兩年,推動算力增長的主要動力是,探索性算力增速(25x/2年)遠高于摩爾定律(2倍/年),導(dǎo)致GPU需求激增。只要這個探索工作還在繼續(xù)產(chǎn)生正向回報,Al算力的增長范式短期或不會發(fā)生變化。DemseNet201在通用人工智能(AGI)愿景的驅(qū)動下,我們看到,主要科技巨頭仍然在加大投入,例如:1)1/24,Meta宣布計劃2025年資本支出達600-650億美元,主要用于Al基礎(chǔ)設(shè)施(訓(xùn)練集群和數(shù)據(jù)中心建設(shè))。2)1/21,OpenAl宣布和軟銀、Oracle啟動的“ProjectStargate”計劃投資超1000億美元建設(shè)Al基礎(chǔ)設(shè)施,顯示資本仍集中流向需要海量算力的前沿探索。根據(jù)Factset一致預(yù)期,微軟、谷歌、亞馬遜、Meta、蘋果等北美五大科技公司合計資本開支2025年有望繼續(xù)增長19.6%。其中很大部分投入是用在包括GPT-5、Llama4等在內(nèi)下一代模型的算力投資。另一方面,Agent等應(yīng)用目前仍處于探索的初期階段,大規(guī)模商用的時間點仍存在不確定性,所以我們認為目前Al算力的增長范式?jīng)]有變化。問題#3:DeepSeek會改變市場投資邏輯嗎?DeepSeek這次的“驚喜”讓我們認識到,1)未來大模型公司之間的競爭中,"算法效率"的重要性可能上升,投資重點可能從"算力軍備"轉(zhuǎn)向"算法效率"。Al競賽正從"算力軍備"轉(zhuǎn)向"算法效率"。未來的競爭重點或?qū)⒏嗟丶性谒惴▋?yōu)化和生態(tài)活力上。2)開源協(xié)議能使中小開發(fā)者基于前沿模型二次開發(fā),推動大模型創(chuàng)新從少數(shù)科技巨頭向分布式社區(qū)轉(zhuǎn)移,為中小軟件企業(yè)創(chuàng)造更多創(chuàng)新機會。從投資角度,我們認為2025年是AI發(fā)展進入商業(yè)化落地的一年。以AgentAl為代表的企業(yè)軟件有望迅速落地,提升企業(yè)工作效率,帶動美股軟件板塊表現(xiàn)或好于硬件。市位收盤價PE(百萬頭元)當?shù)刎泿?025E2026ESaleslorce4.57.97.2-1.62.6注:預(yù)測數(shù)據(jù)來自Factset一致預(yù)期,數(shù)據(jù)截至2根據(jù)JonPeddieResearch,3Q24英偉達在全球GPU市場份額達到90%。其中,H100進的GPU的用途,初期可能會被局限在探索下一代超大規(guī)模模型(FrontierModel)上。圖表圖表5:Nvidia、AMD、Broadcom、Marvell、Intel數(shù)據(jù)中心及Al相關(guān)收入趨勢(百萬美元)據(jù)DeepSeekV3技術(shù)報告,V3卡的H800GPU集群上訓(xùn)練約2個月,合計成本約557.6萬美金,相較而言,Llama3系列模型的計算預(yù)算則多達3930萬H100GPU小時,DeepSeek訓(xùn)練成本約相當于Llama3系列模型的7%。但是,SemiAnalysis在報告中指出,557.相當可觀。據(jù)SemiAnalysis估計,其GPU投資就超過5億美元??紤]到服務(wù)器資本支出、運營成本等因素,DeepSeek的總擁有成本(TCO)在4年內(nèi)可能達到25.73億美元。本降至OpenAl的1/50,這在實際應(yīng)用中可以帶來顯著的成本節(jié)約。然而,這種成本優(yōu)勢#4444#SS問題#6:DeepSeek到底有哪些創(chuàng)新?能和效率。R1-zero模型采用純強化學習(RL)訓(xùn)練,跳過監(jiān)督微調(diào),驗證了RL在Al訓(xùn)練中的優(yōu)先級和有效性。這些創(chuàng)新使DeepSeek在性能、效率和成本方面都取得了顯著進展,為AI技術(shù)的發(fā)展提供了新的方向。特別是在解決復(fù)雜數(shù)學、物理和推理問題時,其速度是ChatGPT的兩倍,且在編程問題上提供了迅速而全面的答案。1)采用混合專家(MoE)架構(gòu),動態(tài)調(diào)用子模型降低計算量;2)引入多頭潛在注意力(MLA)壓縮內(nèi)存,支持長文本處理;3)強化學習(RL):R1-zero模型跳過監(jiān)督微調(diào),通過純RL直接訓(xùn)練,驗證了RL的優(yōu)先級和有效性;4)蒸餾優(yōu)化:利用R1生成數(shù)據(jù)微調(diào)小模型,提升特定場景性能(如數(shù)學、代碼任務(wù))模型架構(gòu)創(chuàng)新、訓(xùn)練方法突破、蒸餾優(yōu)化、推理效率提升等。圣Multi-HeadLatentconcotenatefOo0OLatente?OutputHiddenu:OOOOopply問題#7:DeepSeek會帶動中國科技資產(chǎn)價值重估嗎?公司/指數(shù)名稱(百萬美元)(當?shù)刎泿?股價變動(%)MSFTUSMicrosoft3,085,5METAUSAMZNUSXiaomi9.213.4問題#8:DeepSeek會推動端側(cè)智能發(fā)展嗎?側(cè)設(shè)備上部署Al應(yīng)用,推動智能設(shè)備的智能化進程。微軟推出的專為NPU設(shè)計的DeepSeek-R1模型,支持Copilot+PC等設(shè)備,實現(xiàn)半連續(xù)運行的主動智能體驗,為智進過程,不會一蹴而就。模型能力提升只是其中一環(huán),還存在生態(tài)鏈協(xié)調(diào)等很多挑戰(zhàn),對2025年Al手機等端側(cè)智能的發(fā)展不應(yīng)抱過高預(yù)期。圖表10:圖表10:DeepSeek-R1模型已作為NVIDIANIM微服務(wù)發(fā)布SurteotteetandhineffoengyLMeacelinginroworingOkay,solreedtofoueoutwhichnuneiplbcs.sothefristdgltaftetleftmostdigtandmovetotherigitFor911,thetenthsdgits1,andfr9B,thap1_key=“SAPINEYREQUIRED_IF_E)coapletion=etient.chathodoln*deepseek-a1/deepseek-esseges[{"role°:"userEpkoreModdseprntsDosFonnseG.SarhAPICtlog資料來源:英偉達官網(wǎng),問題#9:DeepSeek會導(dǎo)致美國提升出口管制壓力嗎?1)芯片出口管制收緊:美國可能會加強對高端Al芯片的出口管制;2)開源限制:美國政府可能會限制科技公司開源大模型,以防止技術(shù)擴散;3)模型回傳限制:在2024年年底發(fā)布的出口管制政策中,美國政府已經(jīng)限制在新加坡等5)算力資源限制:除了芯片管制,還可能限制美國云服務(wù)提供商的高性能計算資源的使用。Oet7th,2022ExportControls(Bytes/s)問題#10:DeepSeek會改變開源軟件生態(tài)嗎?全球主要大模型公司中,OpenAl、Google、Anthropic、字節(jié)、百度等采用閉源模式,Meta、阿里等采用開源模式。如下圖所示,閉源模型一直保持對開源模型的性能優(yōu)勢。0OpesSouce(DoeintOutperfomPrwFCmaDPhan[DaeintOutpeformPc0opta四d這次DeepSeek通過開源接近最先進的閉源的高性能模型,可能降低Al技術(shù)的使用門檻。開源模式帶來邊際成本持續(xù)下降的技術(shù)紅利,為AI技術(shù)的真正普及奠定了基礎(chǔ)。此外,DeepSeek的做法也可能推動其它Al公司重新思考其商業(yè)模式。模態(tài)(輸入;輸出)美國OpenAlGPT-01300B閉源2024年12月美國OpenAlGPT-40未公開閉源2024年5月美國OpenAlGPT-4turbo未公開閉源2023年11月美國OpenAlSora木閉源2024年2月美國谷歌

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論