計算機行業(yè)深度分析:三大要素齊發(fā)力AI應用步入全面加速期_第1頁
計算機行業(yè)深度分析:三大要素齊發(fā)力AI應用步入全面加速期_第2頁
計算機行業(yè)深度分析:三大要素齊發(fā)力AI應用步入全面加速期_第3頁
計算機行業(yè)深度分析:三大要素齊發(fā)力AI應用步入全面加速期_第4頁
計算機行業(yè)深度分析:三大要素齊發(fā)力AI應用步入全面加速期_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

計算機tangyue券研究報告-行業(yè)深度分析強于大市(上調(diào))51%29%化形勢持續(xù)向好8%-3%-14%層的發(fā)展?jié)摿ω酱尫拧?。DeepSeek-R1發(fā)布后,大模型成本顯-3%-224.032024.072024.112025.03著下降,開源陣營在性能上實現(xiàn)超越。至此,AI應用集齊全面落地《計算機行業(yè)月報:DeepSeek-R1帶來AI理能力的提升路徑,DeepSeek首次公開驗證了強化學習對于大模技術突破,持續(xù)關注GPT-5的推出進程》型推理能力提升的有效性。2025-02-13《計算機行業(yè)深度分析:美國制裁密集出臺,全面圍堵對我國的AI算力供應能力》《計算機行業(yè)深度分析:美國制裁密集出臺,全面圍堵對我國的AI算力供應能力》2025-01-242025-01-24《計算機行業(yè)月報:AI模型成果密集發(fā)布,制裁或?qū)⑷嫔墶?025-01-10聯(lián)系人:李智《計算機行業(yè)月報:AI模型成果密集發(fā)布,制裁或?qū)⑷嫔墶?025-01-10聯(lián)系人:李智度訓練框架、DualPipe算法、跨節(jié)點All-to-All通信內(nèi)核等一系列電話態(tài)的發(fā)展,彌補了中國企業(yè)上云(特別是公有云本報告版權(quán)屬于中原證券股份有限公司www. 41.1.o1開啟邏輯推理能力提升的新路徑 41.2.DeepSeek首次公開驗證了強化學習對于大模型推理能力提升的有效性 5 72.1.DeepSeek開啟低成本路線 72.2.DeepSeek算力節(jié)省的關鍵點 82.3.兩大模型訓練路徑 2.4.DeepSeek運營成本及相關數(shù)據(jù)測算 3.1.開源大模型陣營首次在先進性上超越了閉源陣營 3.2.DeepSeek開源條款更加開放,有利推動模型的推廣和應用 3.3.DeepSeek將核心代碼悉數(shù)開源,極大地促進了AI技術的發(fā)展 20 4 5 6 7 7 8 8 9 10 10 13 14 14 18 19 22 23 23 24 5 6 7 12 12 16 18 20注推理、AI應用和液冷需求》中提出了“o1的問世”“性能雖然超過了OpenAI現(xiàn)有的模型,但是面臨了新訓練數(shù)據(jù)要是一種交流的工具,而不是一種思考的工具》(Languageisprimarilyatoocommunicationratherthanthought),論文中證明了負責語言的神經(jīng)和負債思破,已經(jīng)表現(xiàn)得比較出色,但是在推理和邏輯能力方面的表現(xiàn)仍圖1:人腦中負責語言和邏輯推理的神經(jīng)網(wǎng)絡碼、數(shù)學和類似領域的復雜問題。因而o1對于LLM實現(xiàn)AGI具有重要的意義,是OpenAI表1:OpenAI大模型產(chǎn)品-4K/16K-圖2:推理模型與語言模型在數(shù)學、科學、編碼方面的能力對比訓練方法的基礎上加入了多階段的訓練,包括在強化學),新得到的DeepSeek-R1具有了圖3:DeepSeek-R1的訓練流程為了能夠?qū)⑼评砟芰w移到不適合MoE架構(gòu)的場景,DeepSeek還用DeepSeek表2:硅基流動上DeepSeek主要模型情況及調(diào)用價格428DeepSeek-R1-Zero的AIME精度的能力。與監(jiān)督微調(diào)通過給模型大量人類標注數(shù)據(jù)進行學習我學習和獲得獎勵的方式,完成自主的學習。因而我們看到強化學習依賴于先驗知識,模型自我學習的過程中或能涌現(xiàn)出超越人類思維上限的推理能力2)無需標注數(shù)據(jù),監(jiān)督微調(diào)需要的人工標注數(shù)據(jù)往往需要耗費較長的時間周期和較高的成本,還容易因為標記者喜好產(chǎn)生訓練偏差。圖4:DeepSeek-R1-Zero在訓練中AIME精度提升情況圖5:DeepSeek-R1-Zero在訓練中的平均響應時長表3:DeepSeek的主要模型發(fā)布情況圖6:DeepSeek-R1與o1在調(diào)用成本差距(美元/百萬token)Cache)較大,DeepSeek通過將低秩近似方法引入鍵值緩存壓縮中,圖7:DeepSeek-V2中MLA對于降低KVCache和訓練成本的作用):),數(shù)據(jù)只選擇激活其中一部分專家模型,因而可以減少計算量圖8:DeepSeek-V3整體架構(gòu)架構(gòu)上展現(xiàn)出了軟硬協(xié)同優(yōu)化能力,這成為了他們超越國內(nèi)其他大模型團容易損失數(shù)據(jù)信息。為此,DeepSeek結(jié)合自身在GPU硬件架構(gòu)和訓練誤差方面強大的整合行,而一些關鍵操作則保持了原有數(shù)據(jù)格式,兼顧了訓練圖9:FP8混合精度訓練框架示意圖圖10:DualPipe算法示意圖(1)通過精細化模型和軟硬件結(jié)合的訓練構(gòu)架的構(gòu)建模型能力建設。DeepSeek在這個方向上展現(xiàn)出超強的能力和開創(chuàng)性,也很好契合我國圖11:DeepSeek-V3與Grok-3訓練小時數(shù)對比(萬GPU小時)圖12:頭部大模型的ChatbotArena成績但可以預見的是,無論從經(jīng)濟性上來說,還是從能源消耗等因素來看,簡單依靠大力出奇跡的發(fā)展路徑的瓶頸都顯而易見。而Dee型應用推廣和能力進一步提升,都創(chuàng)造了更多發(fā)展表4:OpenAI大模型產(chǎn)品競品推出情況模型Anthropic騰訊Anthropic表5:DeepSeek運營數(shù)據(jù)及測算342*1000*0.14+(608-342)*1000*0.55+168*資料來源:DeepSeek,中原證券研究所(圖13:DeepSeek在不同時段用于推理服務的節(jié)點數(shù)按照理論測算,DeepSeek會有日均47.5萬美元的利潤,對應的毛利率高達84.5%,但實際利潤會少于理論值,對比在理論收入測算中與實預計從2023年到2028年,OpenAI將蒙受440億美元的損失,其中2024年將損失50億美元,到2026年年度損失可能高達140億美元,到2029年OpenAI看,DeepSeek憑借強大的成本控制能力,已經(jīng)可以實現(xiàn)M論毛利率,都是超出市場預期的。圖14:2024年OpenAI支出預測服務接入后,在用餐時段或?qū)a(chǎn)生更多的服務需求。圖15:DeepSeek成本與理論收入測算除此以外,Anthropic、騰訊、華為目前也都Grok-3達到一般可用性后開源。這意味著xAI的開源節(jié)奏將會在發(fā)布模型的開源,整體模型能力也將落后于目前主億等多個參數(shù)大小尺寸,且模型效果始終在開源屆表6:主流開源大模型億以上商用需授權(quán)億Apache2.0億億億、570億參數(shù)支持32K上下文支持8192上下文,同時發(fā)布了90億和2億允許商用,要標注版權(quán),月模型Apache2.0億億Apache2.0Meta進一步允許使用其模型的輸出來改進其他),尼亞州法律管轄,加利福尼亞法院具司法管轄權(quán),或影響受貿(mào)易制裁的企業(yè)的使用。遵守Apache2.0,其中規(guī)模最大的720億參數(shù)模型為Qwen許可,30億模型為QwenResearch許可。以Qwen許可為例,允許商用但需要標注通義千問的貢獻,要求當產(chǎn)品擁有定法律管轄相關條款。MIT與Apache同屬于較寬松的開源協(xié)議,但是Apache要求在衍生作品中包含原始許可證、版權(quán)聲明和貢獻者聲明等,MI圖16:常見開源協(xié)議對比通過以上對比來看,DeepSeek在開源協(xié)議上保持了更加開放的友好,對于全球被許可人來說,也可以避免受到國際政治及法律變化的影響。在Deep-R1和DeepSeek-V3發(fā)布以后并提供MaaS服務,省去了開發(fā)者買卡、裝驅(qū)動、配加速了在大模型的應用落地,也可以很好地滿足更多私有化的行業(yè)需求。表7:各大廠商接入DeepSeek的情況DeepSeek-R1模型可以在AmazonWebServices上使用經(jīng)過硅基流動和華為云團隊連日攻堅,現(xiàn)在,雙方聯(lián)合首發(fā)并上線基于華為云昇騰云服務的百度智能云千帆平臺已正式上架DeepSeek-R1和Dee南京智算中心與寒武紀、蘇寧科技合作,成功上線全金山云中國移動通信集團青海有限公司基于寒武紀MLU590國產(chǎn)化算力資源池,已全面部署上線根據(jù)Canalys數(shù)據(jù),從2024年全球智能手機出貨量市場來看,安卓占據(jù)了約78%的市場份額,也極大地降低了手機廠商和應用廠商發(fā)展的門檻,促進了手機生態(tài)的成熟。因而,業(yè)界也對大模型開源生態(tài)的發(fā)展給與積極的響應。圖17:2024年全球智能手機出貨量市場份額在閉源生態(tài)發(fā)展的過程中,由于中國企業(yè)上云(特別是公有云)比例遠低于海外,AI的B端應用推廣也因此受限。而隨著最強大模型的開源傳統(tǒng)軟件開源的定義中,關注點在于源代碼的公開可獲取,來自全世界的開發(fā)者可以很容易地為軟件提供貢獻。而對于大模型來說,涉及到的核心要的代碼、模型參數(shù)、用于訓練的技術和方法、標記訓練數(shù)據(jù)天的代碼庫開源活動就此展開。從芯片級優(yōu)化到系統(tǒng)級設計,從算法到工程通過破譯英偉達后臺指令,并巧妙地使用,極致優(yōu)化了算法性能。在此次活動中,DeepSeek將其在節(jié)省算力和高效運算方面的核心技術毫無保留地進行悉數(shù)開源,在全球范圍內(nèi)引起了廣泛的關注和強烈的反響,其開源的誠意也贏得了全世界的贊表8:DeepSeek在“OpenSourceWeek”的開源情況核圖18:英偉達DeepSeek-R1推理輸出能力同時,考慮到DeepSeek可以通過低成本取得大廠閉源系統(tǒng)同等水平的大模型,那么DeepSeek也可以在前期實現(xiàn)更加純粹的和具有可持續(xù)性的開源、開放,從而加龐大AI開源生態(tài)體系,也借助這樣的開源實現(xiàn)群策群力,更快地走向AGI。也在考慮加大開源策略;連一向低調(diào)的火山引擎也開源了“大模型應用實驗型的算力主要集中在預訓練(Pre-training)階段,而未來模型在后訓練(Post-tra消耗的算力進一步加大,同時由于模型在推理階段需要進行更長時間的思考過程應用爆發(fā)期,B端AI應用成為了企業(yè)應對科技變革沖擊的重要手段,阿里、字節(jié)、小米等科技大廠也在加速AI投入,完成向下個時代的布局。機終端一類的應用落地形成日常調(diào)用,模型調(diào)用需求將在種類和頻次上獲得極大的提升。在數(shù)據(jù)端的長期積累和龐大的工程師團隊,在底層模型能力實現(xiàn)突破以后,我們在的發(fā)展目標,同時規(guī)劃智算、超算等高性能論總算力、智算算力、智算占比目標都名列前茅,也意圖將算力和人工智能作為新質(zhì)生產(chǎn)力來帶動河南的發(fā)展。圖19:各地算力規(guī)劃中關于總算力的相關目標(EFLOPS)圖20:各地算力規(guī)劃中關于智能算力的相關目標(EFLOPS)圖21:各地算力規(guī)劃中關于智能比例的相關目標部署和推理服務,成為河南省第一個提供該服務的城市級算力中心,河南空強于大市:未來6個月內(nèi)行業(yè)指數(shù)相對滬深300漲幅10%以上;同步大市:未來6個月內(nèi)行業(yè)指數(shù)相對滬深300漲幅-10%至10%之間;弱于大市:未來6個月內(nèi)行業(yè)指數(shù)相對滬深300跌幅10%以上。買入:未來6個月內(nèi)公司相對滬深300漲幅15%以上;增持:未來6個月內(nèi)公司相對滬深300漲幅5%至15%;謹慎增持:未來6個月內(nèi)公司相對滬深300漲幅-10%至5%;減持:未來6個月內(nèi)公司相對滬深300漲幅-15%至-10%;賣出:未來6個月內(nèi)公司相對滬深300跌幅15%以上。本報告署名分析師具有中國證券業(yè)協(xié)會授予的證券分析師執(zhí)業(yè)資格,本人任職符合監(jiān)管機構(gòu)相關合規(guī)要求。本人基于認真審慎的職業(yè)態(tài)度、專業(yè)嚴謹?shù)难芯糠椒ㄅc分析邏輯,獨立、客觀的制作本報告。本報告準確的反映了本人的研究觀點,本人對報告內(nèi)容和觀點負責,保證報告信息來源合法合規(guī)。中原證券股份有限公司具備證券投資咨詢業(yè)務資格。本報告由中原證券股份有限公司(以下簡稱“本公司”)制作并僅向本公司客戶發(fā)布,本公司不會因任何機構(gòu)或個人接收到本報告而視其為本公司的當然客戶。本報告中的信息均來源于已公開的資料,本公司對這些信息的準確性及完整性不作任何保證,也不保證所含的信息不會發(fā)生任何變更。本報告中的推測、預測、評估、建議均為報告發(fā)布日的判斷,本報告中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論