計(jì)算機(jī)行業(yè)深度分析-三大要素齊發(fā)力AI應(yīng)用步入全面加速期

上傳人：策*** IP屬地：山西上傳時間：2025-03-18 格式：DOCX 頁數(shù)：47 大?。?.02MB 積分：19.9 舉報(bào) 版權(quán)申訴

計(jì)算機(jī)行業(yè)深度分析-三大要素齊發(fā)力AI應(yīng)用步入全面加速期_第2頁

計(jì)算機(jī)行業(yè)深度分析-三大要素齊發(fā)力AI應(yīng)用步入全面加速期_第3頁

計(jì)算機(jī)行業(yè)深度分析-三大要素齊發(fā)力AI應(yīng)用步入全面加速期_第4頁

計(jì)算機(jī)行業(yè)深度分析-三大要素齊發(fā)力AI應(yīng)用步入全面加速期_第5頁

已閱讀5頁，還剩42頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

本報(bào)告版權(quán)屬于中原證券股份有限公司計(jì)算機(jī)tangyue@021-證券研究報(bào)告證券研究報(bào)告-行業(yè)深度分析強(qiáng)于大市(上調(diào))——計(jì)算機(jī)滬深30051%40%29%19% 8%-3%-14%2024.032024.072024.112025.03-24%2024.032024.072024.112025.03《計(jì)算機(jī)行業(yè)月報(bào)：DeepSeek-R1帶來AI技術(shù)突破，持續(xù)關(guān)注GPT-5的推出進(jìn)程》2025-02-13《計(jì)算機(jī)行業(yè)深度分析：美國制裁密集出臺，全面圍堵對我國的AI算力供應(yīng)能力》2025-01-24《計(jì)算機(jī)行業(yè)月報(bào)：AI模型成果密集發(fā)布，制裁或?qū)⑷嫔墶?025-01-10聯(lián)系人：李智電話下降，開源陣營在性能上實(shí)現(xiàn)超越。至此，AI應(yīng)用集齊全面落地的三大關(guān)鍵要素，這一階段具有里程碑式意義。理能力的提升路徑，DeepSeek首次公度訓(xùn)練框架、DualPipe算法、跨節(jié)點(diǎn)All-to-All通信內(nèi)核等一系列追平了最先進(jìn)的閉源模型的能力，同時在成生態(tài)的發(fā)展，彌補(bǔ)了中國企業(yè)上云（特別是公有云本報(bào)告版權(quán)屬于中原證券股份有限公司 41.1.o1開啟邏輯推理能力提升的新路徑 41.2.DeepSeek首次公開驗(yàn)證了強(qiáng)化學(xué)習(xí)對于大模型推理能力提升的有效性 5 72.1.DeepSeek開啟低成本路線 72.2.DeepSeek算力節(jié)省的關(guān)鍵點(diǎn) 82.3.兩大模型訓(xùn)練路徑 2.4.DeepSeek運(yùn)營成本及相關(guān)數(shù)據(jù)測算 3.1.開源大模型陣營首次在先進(jìn)性上超越了閉源陣營 3.2.DeepSeek開源條款更加開放，有利推動模型的推廣和應(yīng)用 3.3.DeepSeek將核心代碼悉數(shù)開源，極大地促進(jìn)了AI技術(shù)的發(fā)展 20 22 23 4 5 6 7 7 8 8 9 10 10 13 14 14 18 19 22 23 23 24 5 6 7 12 12本報(bào)告版權(quán)屬于中原證券股份有限公司 16 18 20本報(bào)告版權(quán)屬于中原證券股份有限公司注推理、AI應(yīng)用和液冷需求》中提出了“o1的問世”“性能雖然超過了OpenAI現(xiàn)有的模型，但是面臨了新訓(xùn)練數(shù)據(jù)要是一種交流的工具，而不是一種思考的工具》（Languageisprimarilyatoocommunicationratherthanthought），論文中證明了負(fù)責(zé)語言的神經(jīng)和負(fù)債思破，已經(jīng)表現(xiàn)得比較出色，但是在推理和邏輯能力方面的表現(xiàn)仍圖1：人腦中負(fù)責(zé)語言和邏輯推理的神經(jīng)網(wǎng)絡(luò)本報(bào)告版權(quán)屬于中原證券股份有限公司碼、數(shù)學(xué)和類似領(lǐng)域的復(fù)雜問題。因而o1對于LLM實(shí)現(xiàn)AGI具有重要的意義，是OpenAI表1：OpenAI大模型產(chǎn)品-4K/16K-圖2：推理模型與語言模型在數(shù)學(xué)、科學(xué)、編碼方面的能力對比本報(bào)告版權(quán)屬于中原證券股份有限公司訓(xùn)練方法的基礎(chǔ)上加入了多階段的訓(xùn)練，包括在強(qiáng)化學(xué)），新得到的DeepSeek-R1具有了圖3：DeepSeek-R1的訓(xùn)練流程為了能夠?qū)⑼评砟芰w移到不適合MoE架構(gòu)的場景，DeepSeek還用DeepSeek表2：硅基流動上DeepSeek主要模型情況及調(diào)用價格428DeepSeek-R1-Zero的AIME精度的能力。與監(jiān)督微調(diào)通過給模型大量人類標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)我學(xué)習(xí)和獲得獎勵的方式，完成自主的學(xué)習(xí)。因而我們看到強(qiáng)化學(xué)習(xí)依賴于先驗(yàn)知識，模型自我學(xué)習(xí)的過程中或能涌現(xiàn)出超越人類思維上限的推理能力2）無需標(biāo)注數(shù)據(jù)，監(jiān)督微調(diào)需要的人工標(biāo)注數(shù)據(jù)往往需要耗費(fèi)較長的時間周期和較高的成本，還容易因?yàn)闃?biāo)記者喜好產(chǎn)生訓(xùn)練偏差。圖4：DeepSeek-R1-Zero在訓(xùn)練中AIME精度提升情況圖5：DeepSeek-R1-Zero在訓(xùn)練中的平均響應(yīng)時長表3：DeepSeek的主要模型發(fā)布情況2024年12月發(fā)布的DeepSeek-V3在性能本報(bào)告版權(quán)屬于中原證券股份有限公司請閱讀最后一頁各項(xiàng)聲明本報(bào)告版權(quán)屬于中原證券股份有限公司圖6：DeepSeek-R1與o1在調(diào)用成本差距（美元/百萬token）Cache）較大，DeepSeek通過將低秩近似方法引入鍵值緩存壓縮中，圖7：DeepSeek-V2中MLA對于降低KVCache和訓(xùn)練成本的作用）：），數(shù)據(jù)只選擇激活其中一部分專家模型，因而可以減少計(jì)算量本報(bào)告版權(quán)屬于中原證券股份有限公司圖8：DeepSeek-V3整體架構(gòu)架構(gòu)上展現(xiàn)出了軟硬協(xié)同優(yōu)化能力，這成為了他們超越國內(nèi)其他大模型團(tuán)容易損失數(shù)據(jù)信息。為此，DeepSeek結(jié)合自身在GPU硬件架構(gòu)和訓(xùn)練誤差方面強(qiáng)大的整合行，而一些關(guān)鍵操作則保持了原有數(shù)據(jù)格式，兼顧了訓(xùn)練本報(bào)告版權(quán)屬于中原證券股份有限公司圖9：FP8混合精度訓(xùn)練框架示意圖圖10：DualPipe算法示意圖（1）通過精細(xì)化模型和軟硬件結(jié)合的訓(xùn)練構(gòu)架的構(gòu)建模型能力建設(shè)。DeepSeek在這個方向上展現(xiàn)出超強(qiáng)的能力和開創(chuàng)性，也很好契合我國本報(bào)告版權(quán)屬于中原證券股份有限公司圖11：DeepSeek-V3與Grok-3訓(xùn)練小時數(shù)對比（萬GPU小時）圖12：頭部大模型的ChatbotArena成績但可以預(yù)見的是，無論從經(jīng)濟(jì)性上來說，還是從能源消耗等因素來看，簡單依靠大力出奇跡的發(fā)展路徑的瓶頸都顯而易見。而Dee型應(yīng)用推廣和能力進(jìn)一步提升，都創(chuàng)造了更多發(fā)展本報(bào)告版權(quán)屬于中原證券股份有限公司表4：OpenAI大模型產(chǎn)品競品推出情況模型Anthropic騰訊Anthropic根據(jù)DeepSeek在3月1日發(fā)布的《De表5：DeepSeek運(yùn)營數(shù)據(jù)及測算本報(bào)告版權(quán)屬于中原證券股份有限公司342*1000*0.14+(608-342)*1000*0.55+168*資料來源：DeepSeek，中原證券研究所（圖13：DeepSeek在不同時段用于推理服務(wù)的節(jié)點(diǎn)數(shù)按照理論測算，DeepSeek會有日均47.5萬美元的利潤，對應(yīng)的毛利率高達(dá)84.5%，但實(shí)際利潤會少于理論值，對比在理論收入測算中與實(shí)本報(bào)告版權(quán)屬于中原證券股份有限公司預(yù)計(jì)從2023年到2028年，OpenAI將蒙受440億美元的損失，其中2024年將損失50億美元，到2026年年度損失可能高達(dá)140億美元，到2029年OpenAI看，DeepSeek憑借強(qiáng)大的成本控制能力，已經(jīng)可以實(shí)現(xiàn)M論毛利率，都是超出市場預(yù)期的。圖14：2024年OpenAI支出預(yù)測服務(wù)接入后，在用餐時段或?qū)a(chǎn)生更多的服務(wù)需求。圖15：DeepSeek成本與理論收入測算本報(bào)告版權(quán)屬于中原證券股份有限公司除此以外，Anthropic、騰訊、華為目前也都Grok-3達(dá)到一般可用性后開源。這意味著xAI的開源節(jié)奏將會在發(fā)布模型的開源，整體模型能力也將落后于目前主谷歌：作為AI領(lǐng)域的老牌廠商，谷歌在2024年2月和6月分別推出了開源模型億等多個參數(shù)大小尺寸，且模型效果始終在開源屆本報(bào)告版權(quán)屬于中原證券股份有限公司表6：主流開源大模型億以上商用需授權(quán)億Apache2.0億億億、570億參數(shù)支持32K上下文支持8192上下文，同時發(fā)布了90億和2億允許商用，要標(biāo)注版權(quán)，月本報(bào)告版權(quán)屬于中原證券股份有限公司模型Apache2.0Qwen許可，億支持128k上下文，激活370億參數(shù)，訓(xùn)練億Apache2.0Meta：其在2023年2月推出Llama-1的時候僅可用于研究，而不能進(jìn)行商Meta進(jìn)一步允許使用其模型的輸出來改進(jìn)其他），尼亞州法律管轄，加利福尼亞法院具司法管轄權(quán)，或影響受貿(mào)易制裁的企業(yè)的使用。遵守Apache2.0，其中規(guī)模最大的720億參數(shù)模型為Qwen許可，30億模型為QwenResearch許可。以Qwen許可為例，允許商用但需要標(biāo)注通義千問的貢獻(xiàn)，要求當(dāng)產(chǎn)品擁有爭議適用于中國法律，杭州法院具司法管轄權(quán)。阿里在R1后開源的QwQ-32B選擇了定法律管轄相關(guān)條款。MIT與Apache同屬于較寬松的開源協(xié)議，但是Apache要求在衍生作品中包含原始許可證、版權(quán)聲明和貢獻(xiàn)者聲明等，MI本報(bào)告版權(quán)屬于中原證券股份有限公司圖16：常見開源協(xié)議對比通過以上對比來看，DeepSeek在開源協(xié)議上保持了更加開放的友好，對于全球被許可人來說，也可以避免受到國際政治及法律變化的影響。在Deep-R1和DeepSeek-V3發(fā)布以后并提供MaaS服務(wù)，省去了開發(fā)者買卡、裝驅(qū)動、配加速了在大模型的應(yīng)用落地，也可以很好地滿足更多私有化的行業(yè)需求。表7：各大廠商接入DeepSeek的情況DeepSeek-R1模型可以在AmazonWebServices上使用經(jīng)過硅基流動和華為云團(tuán)隊(duì)連日攻堅(jiān)，現(xiàn)在，雙方聯(lián)合首發(fā)并上線基于華為云昇騰云服務(wù)的本報(bào)告版權(quán)屬于中原證券股份有限公司百度智能云千帆平臺已正式上架DeepSeek-R1和Dee南京智算中心與寒武紀(jì)、蘇寧科技合作，成功上線全金山云中國移動通信集團(tuán)青海有限公司基于寒武紀(jì)MLU590國產(chǎn)化算力資源池，已全面部署上線根據(jù)Canalys數(shù)據(jù)，從2024年全球智能手機(jī)出貨量市場來看，安卓占據(jù)了約78%的市場份額，也極大地降低了手機(jī)廠商和應(yīng)用廠商發(fā)展的門檻，促進(jìn)了手機(jī)生態(tài)的成熟。因而，業(yè)界也對大模型開源生態(tài)的發(fā)展給與積極的響應(yīng)。圖17：2024年全球智能手機(jī)出貨量市場份額在閉源生態(tài)發(fā)展的過程中，由于中國企業(yè)上云（特別是公有云）比例遠(yuǎn)低于海外，AI的本報(bào)告版權(quán)屬于中原證券股份有限公司B端應(yīng)用推廣也因此受限。而隨著最強(qiáng)大模型的開源傳統(tǒng)軟件開源的定義中，關(guān)注點(diǎn)在于源代碼的公開可獲取，來自全世界的開發(fā)者可以很容易地為軟件提供貢獻(xiàn)。而對于大模型來說，涉及到的核心要的代碼、模型參數(shù)、用于訓(xùn)練的技術(shù)和方法、標(biāo)記訓(xùn)練數(shù)據(jù)天的代碼庫開源活動就此展開。從芯片級優(yōu)化到系統(tǒng)級設(shè)計(jì)，從算法到工程通過破譯英偉達(dá)后臺指令，并巧妙地使用，極致優(yōu)化了算法性能。在此次活動中，DeepSeek將其在節(jié)省算力和高效運(yùn)算方面的核心技術(shù)毫無保留地進(jìn)行悉數(shù)開源，在全球范圍內(nèi)引起了廣泛的關(guān)注和強(qiáng)烈的反響，其開源的誠意也贏得了全世界的贊表8：DeepSeek在“OpenSourceWeek”的開源情況核本報(bào)告版權(quán)屬于中原證券股份有限公司請閱讀最后一頁各項(xiàng)聲明本報(bào)告版權(quán)屬于中原證券股份有限公司圖18：英偉達(dá)DeepSeek-R1推理輸出能力同時，考慮到DeepSeek可以通過低成本取得大廠閉源系統(tǒng)同等水平的大模型，那么DeepSeek也可以在前期實(shí)現(xiàn)更加純粹的和具有可持續(xù)性的開源、開放，從而加龐大AI開源生態(tài)體系，也借助這樣的開源實(shí)現(xiàn)群策群力，更快地走向AGI。也在考慮加大開源策略；連一向低調(diào)的火山引擎也開源了“大模型應(yīng)用實(shí)驗(yàn)型的算力主要集中在預(yù)訓(xùn)練（Pre-training）階段，而未來模型在后訓(xùn)練（Post-tra消耗的算力進(jìn)一步加大，同時由于模型在推理階段需要進(jìn)行更長時間的思考過程應(yīng)用爆發(fā)期，B端AI應(yīng)用成為了企業(yè)應(yīng)對科技變革沖擊的重要手段，阿里、字節(jié)、小米等科技大廠也在加速AI投入，完成向下個時代的布局。機(jī)終端一類的應(yīng)用落地形成日常調(diào)用，模型調(diào)用需求將在種類和頻次上獲得極大的提升。本報(bào)告版權(quán)屬于中原證券股份有限公司在數(shù)據(jù)端的長期積累和龐大的工程師團(tuán)隊(duì)，在底層模型能力實(shí)現(xiàn)突破以后，我們在的發(fā)展目標(biāo)，同時規(guī)劃智算、超算等高性能論總算力、智算算力、智算占比目標(biāo)都名列前茅，也意圖將算力和人工智能作為新質(zhì)生產(chǎn)力來帶動河南的發(fā)展。圖19：各地算力規(guī)劃中關(guān)于總算力的相關(guān)目標(biāo)（EFLOPS）圖20：各地算力規(guī)劃中關(guān)于智能算力的相關(guān)目標(biāo)（EFLOPS）本報(bào)告版權(quán)屬于中原證券股份有限公司圖21：各地算力規(guī)劃中關(guān)于智能比例的相關(guān)目標(biāo)部署和推理服務(wù)，成為河南省第一個提供該服務(wù)的城市級算力中心，河南空本報(bào)告版權(quán)屬于中原證券股份有限公司強(qiáng)于大市：未來6個月內(nèi)行業(yè)指數(shù)相對滬深300漲幅10％以上；同步大市：未來6個月內(nèi)行業(yè)指數(shù)相對滬深300漲幅－10％至10％之間；弱于大市：未來6個月內(nèi)行業(yè)指數(shù)相對滬深300跌幅10％以上。買入：未來6個月內(nèi)公司相對滬深300漲幅15％以上；增持：未來6個月內(nèi)公司相對滬深300漲幅5％至15%;謹(jǐn)慎增持：未來6個月內(nèi)公司相對滬深300漲幅－10％至5%;減持：未來6個月內(nèi)公司相對滬深300漲幅－15％至－10%;賣出：未來6個月內(nèi)公司相對滬深300跌幅15％以上。本報(bào)告署名分析師具有中國證券業(yè)協(xié)會授予的證券分析師執(zhí)業(yè)資格，本人任職符合監(jiān)管機(jī)構(gòu)相關(guān)合規(guī)要求。本人基于認(rèn)真審慎的職業(yè)態(tài)度、專業(yè)嚴(yán)謹(jǐn)?shù)难芯糠椒ㄅc分析邏輯，獨(dú)立、客觀的制作本報(bào)告。本報(bào)告準(zhǔn)確的反映了本人的研究觀點(diǎn)，本人對報(bào)告內(nèi)容和觀點(diǎn)負(fù)責(zé)，保證報(bào)告信息來源合法合規(guī)。中原證券股份有限公司具備證券投資咨詢業(yè)務(wù)資格。本報(bào)告由中原證券股份有限公司（以下簡稱“本公司”）制作并僅向本公司客戶發(fā)布，本公司不會因任何機(jī)構(gòu)或個人接收到本報(bào)告而視其為本公司的當(dāng)然客戶。本報(bào)告中的信息均來源于已公開的資料，本公司對這些信息的準(zhǔn)確性及完整性不作任何保證，也不保證所含的信息不會發(fā)生任何變更。本報(bào)告中的推測、

人人文庫> 全部分類> 應(yīng)用文書 > 研究報(bào)告

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

計(jì)算機(jī)行業(yè)深度分析-三大要素齊發(fā)力AI應(yīng)用步入全面加速期

文檔簡介

溫馨提示

最新文檔

評論

計(jì)算機(jī)行業(yè)深度分析-三大要素齊發(fā)力AI應(yīng)用步入全面加速期

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔