計(jì)算機(jī)行業(yè)深度分析-三大要素齊發(fā)力AI應(yīng)用步入全面加速期_第1頁
計(jì)算機(jī)行業(yè)深度分析-三大要素齊發(fā)力AI應(yīng)用步入全面加速期_第2頁
計(jì)算機(jī)行業(yè)深度分析-三大要素齊發(fā)力AI應(yīng)用步入全面加速期_第3頁
計(jì)算機(jī)行業(yè)深度分析-三大要素齊發(fā)力AI應(yīng)用步入全面加速期_第4頁
計(jì)算機(jī)行業(yè)深度分析-三大要素齊發(fā)力AI應(yīng)用步入全面加速期_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

本報(bào)告版權(quán)屬于中原證券股份有限公司計(jì)算機(jī)tangyue@021-證券研究報(bào)告證券研究報(bào)告-行業(yè)深度分析強(qiáng)于大市(上調(diào))——計(jì)算機(jī)滬深30051%40%29%19% 8%-3%-14%2024.032024.072024.112025.03-24%2024.032024.072024.112025.03《計(jì)算機(jī)行業(yè)月報(bào):DeepSeek-R1帶來AI技術(shù)突破,持續(xù)關(guān)注GPT-5的推出進(jìn)程》2025-02-13《計(jì)算機(jī)行業(yè)深度分析:美國制裁密集出臺,全面圍堵對我國的AI算力供應(yīng)能力》2025-01-24《計(jì)算機(jī)行業(yè)月報(bào):AI模型成果密集發(fā)布,制裁或?qū)⑷嫔墶?025-01-10聯(lián)系人:李智電話下降,開源陣營在性能上實(shí)現(xiàn)超越。至此,AI應(yīng)用集齊全面落地的三大關(guān)鍵要素,這一階段具有里程碑式意義。理能力的提升路徑,DeepSeek首次公度訓(xùn)練框架、DualPipe算法、跨節(jié)點(diǎn)All-to-All通信內(nèi)核等一系列追平了最先進(jìn)的閉源模型的能力,同時在成生態(tài)的發(fā)展,彌補(bǔ)了中國企業(yè)上云(特別是公有云本報(bào)告版權(quán)屬于中原證券股份有限公司 41.1.o1開啟邏輯推理能力提升的新路徑 41.2.DeepSeek首次公開驗(yàn)證了強(qiáng)化學(xué)習(xí)對于大模型推理能力提升的有效性 5 72.1.DeepSeek開啟低成本路線 72.2.DeepSeek算力節(jié)省的關(guān)鍵點(diǎn) 82.3.兩大模型訓(xùn)練路徑 2.4.DeepSeek運(yùn)營成本及相關(guān)數(shù)據(jù)測算 3.1.開源大模型陣營首次在先進(jìn)性上超越了閉源陣營 3.2.DeepSeek開源條款更加開放,有利推動模型的推廣和應(yīng)用 3.3.DeepSeek將核心代碼悉數(shù)開源,極大地促進(jìn)了AI技術(shù)的發(fā)展 20 22 23 4 5 6 7 7 8 8 9 10 10 13 14 14 18 19 22 23 23 24 5 6 7 12 12本報(bào)告版權(quán)屬于中原證券股份有限公司 16 18 20本報(bào)告版權(quán)屬于中原證券股份有限公司注推理、AI應(yīng)用和液冷需求》中提出了“o1的問世”“性能雖然超過了OpenAI現(xiàn)有的模型,但是面臨了新訓(xùn)練數(shù)據(jù)要是一種交流的工具,而不是一種思考的工具》(Languageisprimarilyatoocommunicationratherthanthought),論文中證明了負(fù)責(zé)語言的神經(jīng)和負(fù)債思破,已經(jīng)表現(xiàn)得比較出色,但是在推理和邏輯能力方面的表現(xiàn)仍圖1:人腦中負(fù)責(zé)語言和邏輯推理的神經(jīng)網(wǎng)絡(luò)本報(bào)告版權(quán)屬于中原證券股份有限公司碼、數(shù)學(xué)和類似領(lǐng)域的復(fù)雜問題。因而o1對于LLM實(shí)現(xiàn)AGI具有重要的意義,是OpenAI表1:OpenAI大模型產(chǎn)品-4K/16K-圖2:推理模型與語言模型在數(shù)學(xué)、科學(xué)、編碼方面的能力對比本報(bào)告版權(quán)屬于中原證券股份有限公司訓(xùn)練方法的基礎(chǔ)上加入了多階段的訓(xùn)練,包括在強(qiáng)化學(xué)),新得到的DeepSeek-R1具有了圖3:DeepSeek-R1的訓(xùn)練流程為了能夠?qū)⑼评砟芰w移到不適合MoE架構(gòu)的場景,DeepSeek還用DeepSeek表2:硅基流動上DeepSeek主要模型情況及調(diào)用價格428DeepSeek-R1-Zero的AIME精度的能力。與監(jiān)督微調(diào)通過給模型大量人類標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)我學(xué)習(xí)和獲得獎勵的方式,完成自主的學(xué)習(xí)。因而我們看到強(qiáng)化學(xué)習(xí)依賴于先驗(yàn)知識,模型自我學(xué)習(xí)的過程中或能涌現(xiàn)出超越人類思維上限的推理能力2)無需標(biāo)注數(shù)據(jù),監(jiān)督微調(diào)需要的人工標(biāo)注數(shù)據(jù)往往需要耗費(fèi)較長的時間周期和較高的成本,還容易因?yàn)闃?biāo)記者喜好產(chǎn)生訓(xùn)練偏差。圖4:DeepSeek-R1-Zero在訓(xùn)練中AIME精度提升情況圖5:DeepSeek-R1-Zero在訓(xùn)練中的平均響應(yīng)時長表3:DeepSeek的主要模型發(fā)布情況2024年12月發(fā)布的DeepSeek-V3在性能本報(bào)告版權(quán)屬于中原證券股份有限公司請閱讀最后一頁各項(xiàng)聲明本報(bào)告版權(quán)屬于中原證券股份有限公司圖6:DeepSeek-R1與o1在調(diào)用成本差距(美元/百萬token)Cache)較大,DeepSeek通過將低秩近似方法引入鍵值緩存壓縮中,圖7:DeepSeek-V2中MLA對于降低KVCache和訓(xùn)練成本的作用):),數(shù)據(jù)只選擇激活其中一部分專家模型,因而可以減少計(jì)算量本報(bào)告版權(quán)屬于中原證券股份有限公司圖8:DeepSeek-V3整體架構(gòu)架構(gòu)上展現(xiàn)出了軟硬協(xié)同優(yōu)化能力,這成為了他們超越國內(nèi)其他大模型團(tuán)容易損失數(shù)據(jù)信息。為此,DeepSeek結(jié)合自身在GPU硬件架構(gòu)和訓(xùn)練誤差方面強(qiáng)大的整合行,而一些關(guān)鍵操作則保持了原有數(shù)據(jù)格式,兼顧了訓(xùn)練本報(bào)告版權(quán)屬于中原證券股份有限公司圖9:FP8混合精度訓(xùn)練框架示意圖圖10:DualPipe算法示意圖(1)通過精細(xì)化模型和軟硬件結(jié)合的訓(xùn)練構(gòu)架的構(gòu)建模型能力建設(shè)。DeepSeek在這個方向上展現(xiàn)出超強(qiáng)的能力和開創(chuàng)性,也很好契合我國本報(bào)告版權(quán)屬于中原證券股份有限公司圖11:DeepSeek-V3與Grok-3訓(xùn)練小時數(shù)對比(萬GPU小時)圖12:頭部大模型的ChatbotArena成績但可以預(yù)見的是,無論從經(jīng)濟(jì)性上來說,還是從能源消耗等因素來看,簡單依靠大力出奇跡的發(fā)展路徑的瓶頸都顯而易見。而Dee型應(yīng)用推廣和能力進(jìn)一步提升,都創(chuàng)造了更多發(fā)展本報(bào)告版權(quán)屬于中原證券股份有限公司表4:OpenAI大模型產(chǎn)品競品推出情況模型Anthropic騰訊Anthropic根據(jù)DeepSeek在3月1日發(fā)布的《De表5:DeepSeek運(yùn)營數(shù)據(jù)及測算本報(bào)告版權(quán)屬于中原證券股份有限公司342*1000*0.14+(608-342)*1000*0.55+168*資料來源:DeepSeek,中原證券研究所(圖13:DeepSeek在不同時段用于推理服務(wù)的節(jié)點(diǎn)數(shù)按照理論測算,DeepSeek會有日均47.5萬美元的利潤,對應(yīng)的毛利率高達(dá)84.5%,但實(shí)際利潤會少于理論值,對比在理論收入測算中與實(shí)本報(bào)告版權(quán)屬于中原證券股份有限公司預(yù)計(jì)從2023年到2028年,OpenAI將蒙受440億美元的損失,其中2024年將損失50億美元,到2026年年度損失可能高達(dá)140億美元,到2029年OpenAI看,DeepSeek憑借強(qiáng)大的成本控制能力,已經(jīng)可以實(shí)現(xiàn)M論毛利率,都是超出市場預(yù)期的。圖14:2024年OpenAI支出預(yù)測服務(wù)接入后,在用餐時段或?qū)a(chǎn)生更多的服務(wù)需求。圖15:DeepSeek成本與理論收入測算本報(bào)告版權(quán)屬于中原證券股份有限公司除此以外,Anthropic、騰訊、華為目前也都Grok-3達(dá)到一般可用性后開源。這意味著xAI的開源節(jié)奏將會在發(fā)布模型的開源,整體模型能力也將落后于目前主谷歌:作為AI領(lǐng)域的老牌廠商,谷歌在2024年2月和6月分別推出了開源模型億等多個參數(shù)大小尺寸,且模型效果始終在開源屆本報(bào)告版權(quán)屬于中原證券股份有限公司表6:主流開源大模型億以上商用需授權(quán)億Apache2.0億億億、570億參數(shù)支持32K上下文支持8192上下文,同時發(fā)布了90億和2億允許商用,要標(biāo)注版權(quán),月本報(bào)告版權(quán)屬于中原證券股份有限公司模型Apache2.0Qwen許可,億支持128k上下文,激活370億參數(shù),訓(xùn)練億Apache2.0Meta:其在2023年2月推出Llama-1的時候僅可用于研究,而不能進(jìn)行商Meta進(jìn)一步允許使用其模型的輸出來改進(jìn)其他),尼亞州法律管轄,加利福尼亞法院具司法管轄權(quán),或影響受貿(mào)易制裁的企業(yè)的使用。遵守Apache2.0,其中規(guī)模最大的720億參數(shù)模型為Qwen許可,30億模型為QwenResearch許可。以Qwen許可為例,允許商用但需要標(biāo)注通義千問的貢獻(xiàn),要求當(dāng)產(chǎn)品擁有爭議適用于中國法律,杭州法院具司法管轄權(quán)。阿里在R1后開源的QwQ-32B選擇了定法律管轄相關(guān)條款。MIT與Apache同屬于較寬松的開源協(xié)議,但是Apache要求在衍生作品中包含原始許可證、版權(quán)聲明和貢獻(xiàn)者聲明等,MI本報(bào)告版權(quán)屬于中原證券股份有限公司圖16:常見開源協(xié)議對比通過以上對比來看,DeepSeek在開源協(xié)議上保持了更加開放的友好,對于全球被許可人來說,也可以避免受到國際政治及法律變化的影響。在Deep-R1和DeepSeek-V3發(fā)布以后并提供MaaS服務(wù),省去了開發(fā)者買卡、裝驅(qū)動、配加速了在大模型的應(yīng)用落地,也可以很好地滿足更多私有化的行業(yè)需求。表7:各大廠商接入DeepSeek的情況DeepSeek-R1模型可以在AmazonWebServices上使用經(jīng)過硅基流動和華為云團(tuán)隊(duì)連日攻堅(jiān),現(xiàn)在,雙方聯(lián)合首發(fā)并上線基于華為云昇騰云服務(wù)的本報(bào)告版權(quán)屬于中原證券股份有限公司百度智能云千帆平臺已正式上架DeepSeek-R1和Dee南京智算中心與寒武紀(jì)、蘇寧科技合作,成功上線全金山云中國移動通信集團(tuán)青海有限公司基于寒武紀(jì)MLU590國產(chǎn)化算力資源池,已全面部署上線根據(jù)Canalys數(shù)據(jù),從2024年全球智能手機(jī)出貨量市場來看,安卓占據(jù)了約78%的市場份額,也極大地降低了手機(jī)廠商和應(yīng)用廠商發(fā)展的門檻,促進(jìn)了手機(jī)生態(tài)的成熟。因而,業(yè)界也對大模型開源生態(tài)的發(fā)展給與積極的響應(yīng)。圖17:2024年全球智能手機(jī)出貨量市場份額在閉源生態(tài)發(fā)展的過程中,由于中國企業(yè)上云(特別是公有云)比例遠(yuǎn)低于海外,AI的本報(bào)告版權(quán)屬于中原證券股份有限公司B端應(yīng)用推廣也因此受限。而隨著最強(qiáng)大模型的開源傳統(tǒng)軟件開源的定義中,關(guān)注點(diǎn)在于源代碼的公開可獲取,來自全世界的開發(fā)者可以很容易地為軟件提供貢獻(xiàn)。而對于大模型來說,涉及到的核心要的代碼、模型參數(shù)、用于訓(xùn)練的技術(shù)和方法、標(biāo)記訓(xùn)練數(shù)據(jù)天的代碼庫開源活動就此展開。從芯片級優(yōu)化到系統(tǒng)級設(shè)計(jì),從算法到工程通過破譯英偉達(dá)后臺指令,并巧妙地使用,極致優(yōu)化了算法性能。在此次活動中,DeepSeek將其在節(jié)省算力和高效運(yùn)算方面的核心技術(shù)毫無保留地進(jìn)行悉數(shù)開源,在全球范圍內(nèi)引起了廣泛的關(guān)注和強(qiáng)烈的反響,其開源的誠意也贏得了全世界的贊表8:DeepSeek在“OpenSourceWeek”的開源情況核本報(bào)告版權(quán)屬于中原證券股份有限公司請閱讀最后一頁各項(xiàng)聲明本報(bào)告版權(quán)屬于中原證券股份有限公司圖18:英偉達(dá)DeepSeek-R1推理輸出能力同時,考慮到DeepSeek可以通過低成本取得大廠閉源系統(tǒng)同等水平的大模型,那么DeepSeek也可以在前期實(shí)現(xiàn)更加純粹的和具有可持續(xù)性的開源、開放,從而加龐大AI開源生態(tài)體系,也借助這樣的開源實(shí)現(xiàn)群策群力,更快地走向AGI。也在考慮加大開源策略;連一向低調(diào)的火山引擎也開源了“大模型應(yīng)用實(shí)驗(yàn)型的算力主要集中在預(yù)訓(xùn)練(Pre-training)階段,而未來模型在后訓(xùn)練(Post-tra消耗的算力進(jìn)一步加大,同時由于模型在推理階段需要進(jìn)行更長時間的思考過程應(yīng)用爆發(fā)期,B端AI應(yīng)用成為了企業(yè)應(yīng)對科技變革沖擊的重要手段,阿里、字節(jié)、小米等科技大廠也在加速AI投入,完成向下個時代的布局。機(jī)終端一類的應(yīng)用落地形成日常調(diào)用,模型調(diào)用需求將在種類和頻次上獲得極大的提升。本報(bào)告版權(quán)屬于中原證券股份有限公司在數(shù)據(jù)端的長期積累和龐大的工程師團(tuán)隊(duì),在底層模型能力實(shí)現(xiàn)突破以后,我們在的發(fā)展目標(biāo),同時規(guī)劃智算、超算等高性能論總算力、智算算力、智算占比目標(biāo)都名列前茅,也意圖將算力和人工智能作為新質(zhì)生產(chǎn)力來帶動河南的發(fā)展。圖19:各地算力規(guī)劃中關(guān)于總算力的相關(guān)目標(biāo)(EFLOPS)圖20:各地算力規(guī)劃中關(guān)于智能算力的相關(guān)目標(biāo)(EFLOPS)本報(bào)告版權(quán)屬于中原證券股份有限公司圖21:各地算力規(guī)劃中關(guān)于智能比例的相關(guān)目標(biāo)部署和推理服務(wù),成為河南省第一個提供該服務(wù)的城市級算力中心,河南空本報(bào)告版權(quán)屬于中原證券股份有限公司強(qiáng)于大市:未來6個月內(nèi)行業(yè)指數(shù)相對滬深300漲幅10%以上;同步大市:未來6個月內(nèi)行業(yè)指數(shù)相對滬深300漲幅-10%至10%之間;弱于大市:未來6個月內(nèi)行業(yè)指數(shù)相對滬深300跌幅10%以上。買入:未來6個月內(nèi)公司相對滬深300漲幅15%以上;增持:未來6個月內(nèi)公司相對滬深300漲幅5%至15%;謹(jǐn)慎增持:未來6個月內(nèi)公司相對滬深300漲幅-10%至5%;減持:未來6個月內(nèi)公司相對滬深300漲幅-15%至-10%;賣出:未來6個月內(nèi)公司相對滬深300跌幅15%以上。本報(bào)告署名分析師具有中國證券業(yè)協(xié)會授予的證券分析師執(zhí)業(yè)資格,本人任職符合監(jiān)管機(jī)構(gòu)相關(guān)合規(guī)要求。本人基于認(rèn)真審慎的職業(yè)態(tài)度、專業(yè)嚴(yán)謹(jǐn)?shù)难芯糠椒ㄅc分析邏輯,獨(dú)立、客觀的制作本報(bào)告。本報(bào)告準(zhǔn)確的反映了本人的研究觀點(diǎn),本人對報(bào)告內(nèi)容和觀點(diǎn)負(fù)責(zé),保證報(bào)告信息來源合法合規(guī)。中原證券股份有限公司具備證券投資咨詢業(yè)務(wù)資格。本報(bào)告由中原證券股份有限公司(以下簡稱“本公司”)制作并僅向本公司客戶發(fā)布,本公司不會因任何機(jī)構(gòu)或個人接收到本報(bào)告而視其為本公司的當(dāng)然客戶。本報(bào)告中的信息均來源于已公開的資料,本公司對這些信息的準(zhǔn)確性及完整性不作任何保證,也不保證所含的信息不會發(fā)生任何變更。本報(bào)告中的推測、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論