人工智能應(yīng)用專題(4):國內(nèi)AI大模型趨勢探討互聯(lián)網(wǎng)大廠AI進程梳理_第1頁
人工智能應(yīng)用專題(4):國內(nèi)AI大模型趨勢探討互聯(lián)網(wǎng)大廠AI進程梳理_第2頁
人工智能應(yīng)用專題(4):國內(nèi)AI大模型趨勢探討互聯(lián)網(wǎng)大廠AI進程梳理_第3頁
人工智能應(yīng)用專題(4):國內(nèi)AI大模型趨勢探討互聯(lián)網(wǎng)大廠AI進程梳理_第4頁
人工智能應(yīng)用專題(4):國內(nèi)AI大模型趨勢探討互聯(lián)網(wǎng)大廠AI進程梳理_第5頁
已閱讀5頁,還剩48頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

證券研究報告|2024年01月02日人工智能應(yīng)用專題(4):國內(nèi)AI大模型趨勢探討,互聯(lián)網(wǎng)大廠AI進程梳理行業(yè)研究·行業(yè)專題投資評級:超配(維持評級)聯(lián)系人:王穎婕聯(lián)系人:陳淑媛聯(lián)系人:劉子譚證券分析師:張倫可0755-81982651021-60375431chenshuyuaniuzitan@wangyingjie1@zhanglunke@S0980521120004請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容免責申明:1.

本內(nèi)容非原報告內(nèi)容;2.

報告來源互聯(lián)網(wǎng)公開數(shù)據(jù);如侵權(quán)請聯(lián)系客服微信,第一時間清理;3.

報告僅限社群個人學(xué)習(xí),如需它用請聯(lián)系版權(quán)方;4.

如有其他疑問請聯(lián)系微信行業(yè)報告資源群1.

進群福利:進群即領(lǐng)萬份行業(yè)研究、管理方案及其他學(xué)習(xí)資源,直接打包下載2.

每日分享:6份行研精選報告、3個行業(yè)主題3.

報告查找:群里直接咨詢,免費協(xié)助查找4.

嚴禁廣告:僅限行業(yè)報告交流,禁止一切無關(guān)信息微信掃碼,長期有效知識星球行業(yè)與管理資源專業(yè)知識社群:每月分享8000+份行業(yè)研究報告、商業(yè)計劃、市場研究、企業(yè)運營及咨詢管理方案等,涵蓋科技、金融、教育、互聯(lián)網(wǎng)、房地產(chǎn)、生物制藥、醫(yī)療健康等;已成為投資、產(chǎn)業(yè)研究、企業(yè)運營、價值傳播等工作助手。微信掃碼,行研無憂摘要?

大模型技術(shù)本質(zhì)上來源于科研創(chuàng)新與技術(shù)積累,我國大模型廠商根據(jù)自身特點演繹出不同的發(fā)展方向。大模型誕生與技術(shù)的積累與不斷創(chuàng)新,伴隨海外技術(shù)進步與大模型開源,我國大模型企業(yè)也在不斷追趕,包括根據(jù)其技術(shù)路徑自研或在其開源框架上優(yōu)化調(diào)整。?

有效數(shù)據(jù)集有限,優(yōu)質(zhì)數(shù)據(jù)集仍舊稀缺,關(guān)注具備高質(zhì)量內(nèi)容的平臺。大模型的未來發(fā)展依賴于訓(xùn)練數(shù)據(jù)集的質(zhì)量,而非僅僅是數(shù)量。AI技術(shù)把原先難以利用的非結(jié)構(gòu)數(shù)據(jù)帶入分析領(lǐng)域,內(nèi)容創(chuàng)作者所聚集的平臺成為高質(zhì)量數(shù)據(jù)的重要來源。?

大模型后續(xù)競爭格局B端與C端分化:C端更易于產(chǎn)生通用底座以及大一統(tǒng)的入口,通過豐富的插件、定制化功能、AIAgent滿足用戶的高度定制化和長尾需求。B端定制化模型或垂類模型性價比更高,不同B端行業(yè)可能用各自模型來滿足企業(yè)場景、業(yè)務(wù)流程、模型大小和性能的差異化需求。?

AIAgent框架帶來全鏈路、定制化的信息處理能力,成為生產(chǎn)環(huán)節(jié)的重要輔助,助力智能硬件“AllinOne”搶占終端流量入口。AIAgent需要標準定義和模型能力進化,同時GenerativeUI可能帶來人機交互方式的革新。?

月之暗面、清華GLM、百川智能:作為獨立的第三方模型廠商,創(chuàng)始人技術(shù)背景強,模型迭代速度快,產(chǎn)品布局AIGC等各個領(lǐng)域。?

互聯(lián)網(wǎng)大廠騰訊、字節(jié)、百度、阿里:結(jié)合自身業(yè)務(wù)場景進行模型和AI應(yīng)用的開發(fā),同時布局算力、平臺、大模型與應(yīng)用全環(huán)節(jié),關(guān)注AI生態(tài)建設(shè)。?

投資建議:國內(nèi)模型能力有望快速提升,帶動應(yīng)用百花齊放。建議積極布局大模型相關(guān)廠商和產(chǎn)業(yè)鏈機會。?

風(fēng)險提示:宏觀經(jīng)濟波動風(fēng)險,下游需求不及預(yù)期風(fēng)險,AI倫理風(fēng)險,核心技術(shù)水平升級不及預(yù)期的風(fēng)險等。2請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容目錄大模型的競爭格局演繹的關(guān)鍵因素獨立的模型團隊—月之暗面、清華GLM、百川智能互聯(lián)網(wǎng)大廠的模型和應(yīng)用進展—騰訊、字節(jié)、百度、阿里風(fēng)險提示010203043請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容大模型技術(shù)本質(zhì)上來源于科研創(chuàng)新與技術(shù)積累?

海外大廠核心大模型的能力遷移是國內(nèi)AI發(fā)展的重要考量??疾焓欠裼泻M獯髲S核心大模型研發(fā)的技術(shù)積累和知識遷移到國內(nèi),以及這些技術(shù)在本土的應(yīng)用情況和調(diào)整,對理解國內(nèi)外AI技術(shù)的差異和互動具有重要意義。?

國內(nèi)企業(yè)大模型技術(shù)路線有兩類:①自研效果復(fù)現(xiàn)類:參考GPT論文自研復(fù)現(xiàn)效果,前期耗時、后續(xù)Finetuning對于數(shù)據(jù)數(shù)量質(zhì)量也有一定要求,能力天花板高;②基于開源迭代類:訓(xùn)練更順暢但天花板低,依賴開源社區(qū),且開源模型如Llama2比較GPT3.5還是有差距。?

國內(nèi)企業(yè)大模型團隊發(fā)展路徑有兩類:①從搜廣推背景轉(zhuǎn)向大模型研發(fā),如百度和百川;②成立之初主要基于大模型研究路線和學(xué)術(shù)背景,如月之暗面的楊植麟團隊和清華的智譜團隊。圖1:不同公司/組織/院校近三年top-100AI發(fā)文數(shù)圖2:海外SuperGlue模型榜單排名(截至2023年12月)??資料來源:SergiCastellaiSapé,《Mustread:the100mostcitedAIpapersin2022》,ZetaAlpha,2023年3月2日,國信證券經(jīng)濟研究所整理資料來源:SuperGlue,參考文獻:ZDu、YQian等,《GLM:GeneralLanguageModelPretrainingwithAutoregressiveBlankInfilling》,ComputationandLanguage(cs.CL),2022,arXiv:2103.10360,國信證券經(jīng)濟研究所整理4請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容基于開源大模型框架進行優(yōu)化調(diào)整、應(yīng)用創(chuàng)新較易落地?

OpenAI的核心能力主要體現(xiàn)在三個方面:1)數(shù)據(jù)收集和處理的能力,包括數(shù)據(jù)來源,清洗方式,數(shù)據(jù)結(jié)構(gòu)等;2)模型結(jié)構(gòu),包括注意力、隱藏層等設(shè)計;3)訓(xùn)練方法,包括各類超參數(shù),學(xué)習(xí)率等。海外大模型開源后,我國大模型企業(yè)可在其框架上進行優(yōu)化調(diào)整,以百川智能為例:?

基于開源模型提升性能:據(jù)GitHub,百川智能通過對LLaMA框架進行修改以提升訓(xùn)練時的吞吐。此外,在LLaMA較為薄弱的中文語料方面,百川智能采用2000萬條以中英為主的多語言語料訓(xùn)練分詞模型,顯著提高中文的壓縮率。?

大模型+搜索增強解決方案服務(wù)B端場景:百川智能通過借助搜索增強,解決大模型在幻覺和時效性問題,提升了模型的可用性,并拓展了應(yīng)用領(lǐng)域,如金融、政務(wù)、司法、教育等行業(yè)的智能客服、知識問答、合規(guī)風(fēng)控、營銷顧問等。圖3:Baichuan-7B對LLaMA框架進行優(yōu)化后的性能提升圖4:在LLaMA上進行的研究工作的演化圖?資料來源:GitHubBaiChuan主頁,國信證券經(jīng)濟研究所整理資料來源:WayneXinZhao、KunZhou等,《ASurveyofLargeLanguageModels》,ComputationandLanguage,2023,arXiv:2303.18223,國信證券經(jīng)濟研究所整理5請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容高質(zhì)量訓(xùn)練數(shù)據(jù)促進大模型技術(shù)的提升,但優(yōu)質(zhì)數(shù)據(jù)集稀缺?

有效數(shù)據(jù)集有限,優(yōu)質(zhì)數(shù)據(jù)集仍舊稀缺。當前開源榜單公開訓(xùn)練數(shù)量級,現(xiàn)有常見的大模型訓(xùn)練數(shù)據(jù)集往往在幾十到幾百B的量級,優(yōu)質(zhì)的數(shù)據(jù)集可能就只有300-500Btoken,進化到多模態(tài)數(shù)據(jù)量有所增加,但總量也不多。有的模型會用萬億級別的數(shù)據(jù)token訓(xùn)練,但很多數(shù)據(jù)其實是無效的。?

大模型的未來發(fā)展依賴于訓(xùn)練數(shù)據(jù)集的質(zhì)量,而非僅僅是數(shù)量。根據(jù)ScalingLaw,Transformer架構(gòu)的語言模型性能在很大程度上取決于模型大小、數(shù)據(jù)集大小和訓(xùn)練計算量,性能與這三個因素之間存在冪律關(guān)系,且趨勢跨越多個數(shù)量級,而對其他架構(gòu)細節(jié)(如網(wǎng)絡(luò)深度或?qū)挾龋┑囊蕾囅鄬^小。未來的大模型可能會經(jīng)歷增長飛輪效應(yīng),但關(guān)鍵在于訓(xùn)練數(shù)據(jù)集的質(zhì)量。這強調(diào)了選擇和使用高質(zhì)量數(shù)據(jù)的重要性,而不僅僅是追求數(shù)量。單純的用戶數(shù)據(jù)上不一定會產(chǎn)生飛輪效應(yīng),比如某些用戶數(shù)據(jù)目前只具備統(tǒng)計學(xué)的能力,能夠發(fā)現(xiàn)邏輯、數(shù)學(xué)的問題還需要找邏輯、數(shù)學(xué)數(shù)據(jù)集去優(yōu)化。圖5:各大模型訓(xùn)練數(shù)據(jù)集對比圖6:ScalingLaw模型性能與模型參數(shù)、數(shù)據(jù)集和訓(xùn)練計算量成冪律關(guān)系??資料來源:Wayne?Xin?Zhao、Kun?Zhou等,?《ASurveyofLargeLanguageModels》,ComputationandLanguage,2023,arXiv:2303.18223,國信證券經(jīng)濟研究所整理資料來源:OpenAI官網(wǎng),國信證券經(jīng)濟研究所整理6請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容AI技術(shù)將更大范圍的數(shù)據(jù)帶入分析領(lǐng)域,關(guān)注稀缺內(nèi)容平臺?

AI技術(shù)把原先難以利用的非結(jié)構(gòu)數(shù)據(jù)(占比80%)帶入分析領(lǐng)域。AI浪潮下數(shù)據(jù)資產(chǎn)的重要性凸顯,Snowflake在財報會提到AI技術(shù)把原來客戶無法利用的非結(jié)構(gòu)化數(shù)據(jù)帶入分析領(lǐng)域構(gòu)成新的增量。一系列數(shù)據(jù)公司與產(chǎn)品受益,包括云數(shù)據(jù)倉庫領(lǐng)域(Snowflake)、非結(jié)構(gòu)化/向量數(shù)據(jù)庫(MangoDB、Pinecone)、云數(shù)據(jù)監(jiān)控(DataDog)和ML/AIOps領(lǐng)域(Databricks、AWSBedrock、Weights&Biases)。?

內(nèi)容創(chuàng)作者所聚集的平臺,如字節(jié)和騰訊視頻號成為高質(zhì)量數(shù)據(jù)的重要來源。隨著內(nèi)容創(chuàng)作者轉(zhuǎn)向音視頻平臺,這些平臺成為了聚集高質(zhì)量數(shù)據(jù)的熱點,如字節(jié)跳動和騰訊視頻號等平臺。部分觀點類數(shù)據(jù)可能具有一定時效性,如百度問答和知乎等平臺上的數(shù)據(jù)。圖7:各大模型訓(xùn)練數(shù)據(jù)集對比圖8:AI技術(shù)下數(shù)據(jù)分析各領(lǐng)域的增量?公司模型參數(shù)量10T數(shù)據(jù)規(guī)模阿里巴巴智源研究院騰訊M6?1.9?TB圖像和?292GB?文本悟道2.0混元1.75T4.9T1T2T百度文心260B45TB中科院自動化所智譜華章百川智能紫東·太初ChatGLM3百川100B1.42TB中文1.5B、3B和6B2B/7B/13B7B/20B2.6T上海人工智能實驗室書生2.3T(InternLM-20B)科大訊飛商湯科技春田知韻(抖音)阿里云星火170B1,04B7B數(shù)十億的語言數(shù)據(jù)集1.6?萬億?token?1300億InternLM豆包通義千問盤古7B3萬億tokens華為200B40TB中文文本、3B圖像?資料來源:各公司官網(wǎng)、國信證券經(jīng)濟研究所整理資料來源:KarlKeirstead等,《AISurveyofEnterpriseExecs–ShapingtheAINarrativeInto2024》,U.S.Software,2023,國信證券經(jīng)濟研究所整理7請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容大模型的競爭格局猜想—C端集中,B端差異化競爭?

C端:通用的大模型技術(shù)底座不會太多,可能只會有一個大一統(tǒng)的入口,通過豐富的插件、定制化功能、AIAgent滿足用戶的高度定制化和長尾需求。從大模型的迭代發(fā)展,我們看到底層技術(shù)基于Transformer架構(gòu)的統(tǒng)一化。隨著模型能力的增強,與硬件終端協(xié)同可能加劇流量入口的集成和統(tǒng)一。?

B端:不同行業(yè)具有各自垂類模型,不同大小的模型適用于不同場景。由于企業(yè)場景、業(yè)務(wù)流程差異化,不同的領(lǐng)域模型功能、數(shù)據(jù)集、模型大小和性能都有較大差別,定制化模型廠商或小模型性價比更高。目前出現(xiàn)很多競爭廠商在B端發(fā)力,比如Cohere、或者在Huggingface上用開源模型改造。圖9:近年來現(xiàn)有(大于10B)大語言模型的時間軸圖10:北美各大企業(yè)的AI應(yīng)用行業(yè)分布??資料來源:WayneXinZhao、KunZhou等,《ASurveyofLargeLanguageModels》,ComputationandLanguage,2023,arXiv:2303.18223,國信證券經(jīng)濟研究所整理資料來源:KarlKeirstead等,《AISurveyofEnterpriseExecs–ShapingtheAINarrativeInto2024》,U.S.Software,2023,國信證券經(jīng)濟研究所整理8請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容OpenAI商業(yè)模式:大模型技術(shù)領(lǐng)先,積極嘗試構(gòu)建生態(tài)壁壘?

通過先進的閉源實現(xiàn)商業(yè)化,通過開源前代模型構(gòu)建生態(tài):OpenAI的GPT技術(shù)路線是當前模型自研商家優(yōu)先選擇并跟隨的技術(shù)方向,而OpenAI憑借大模型的領(lǐng)先優(yōu)勢,后續(xù)更新到GPT5后,有可能將前代GPT3.5開源,通過更新一代、開源一代來實現(xiàn)自身戰(zhàn)略。領(lǐng)先模型閉源、服務(wù)B端客戶實現(xiàn)商業(yè)化,落后模型開源繁榮GPT生態(tài)與應(yīng)用建設(shè)。?

通過AIAgent的形態(tài)去構(gòu)建流量入口:OpenAI在AIAgent與流量入口領(lǐng)域有許多嘗試,比如插件生態(tài)、GPTs。GPTs出現(xiàn)打破過去的軟件孤島、復(fù)雜、不能滿足長尾需求的缺點,創(chuàng)建過程工具化標準化而且創(chuàng)建成果產(chǎn)品化。但是AIAgent必須要對個人有全鏈路的信息處理能力,當前GPTs實際上對個人信息的創(chuàng)建和積累是分裂的,比如單人創(chuàng)建不同的GPTs,其實它們之間互不相連,導(dǎo)致可能會產(chǎn)生訓(xùn)練和數(shù)據(jù)的浪費。圖11:OpenAI模型演進圖圖12:OpenAIGPTs應(yīng)用?DELL-E12021.01DELL-E22022.07DELL-E12023.09?資料來源:OpenAI官網(wǎng),參考文獻:WayneXinZhao、KunZhou等,《ASurveyofLargeLanguageModels》,ComputationandLanguage,2023,arXiv:2303.18223,國信證券經(jīng)濟研究所整理資料來源:Gptshunter官網(wǎng),國信證券經(jīng)濟研究所整理9請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容AIAgent:成為生產(chǎn)環(huán)節(jié)的定制化輔助,帶來人機交互的革新?

AIAgent框架為大模型提供結(jié)構(gòu)化思考方法,成為生產(chǎn)環(huán)節(jié)的重要輔助:大模型作為理解推理能力不斷增強,軟件生產(chǎn)進入低門檻、高定制化時代,面向用戶的長尾、個性化需求,Agent框架可以打造每個知識工作者的AI助理。?

AIAgent需要標準定義和模型能力進化,同時GenerativeUI可能帶來人機交互方式的革新:當前大模型對連續(xù)的復(fù)雜推理問題包括對多模態(tài)信息的交叉處理仍有不足,需要用更復(fù)雜、結(jié)構(gòu)化、多維度的數(shù)據(jù)來進一步學(xué)習(xí)。另一方面,Agent應(yīng)用對當前的人機交互方式帶來改變,演進成為同時適用于人類和AI操作的形式。?

案例:Agent以類人的方式與智能手機應(yīng)用進行交互,使用點擊和滑動等底層操作來操作圖形用戶界面(GUI)。利用大型語言模型的視覺能力以類似人類的方式操作智能手機應(yīng)用程序。在探索階段,智能體與智能手機應(yīng)用程序交互并從結(jié)果中學(xué)習(xí),以創(chuàng)建一個全面的參考文檔。在部署階段,智能體利用這個文檔匯編的信息來有效操作和導(dǎo)航應(yīng)用程序。圖13:用于操作智能手機應(yīng)用程序的多模態(tài)智能體框架概述圖14:多模態(tài)智能體框架在智能手機App操作中的多種應(yīng)用?資料來源:ChiZhang,ZhaoYang等,《AppAgent:MultimodalAgentsasSmartphoneUsers》,ComputerVisionandPatternRecognition(cs.CV),2023,arXiv:2312.13771,國信證券經(jīng)濟研究所整理?資料來源:ChiZhang,ZhaoYang等,《AppAgent:MultimodalAgentsasSmartphoneUsers》,ComputerVisionandPatternRecognition(cs.CV),2023,arXiv:2312.13771,國信證券經(jīng)濟研究所整理10請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容智能硬件“AllinOne”終端流量入口的搶占之路?

AIGC將帶來無限的內(nèi)容生產(chǎn)與供給,進而顛覆當前的信息分發(fā)方式:a16z曾說過“芯片將計算的邊際成本降到了零,互聯(lián)網(wǎng)將分發(fā)的邊際成本降到了零,現(xiàn)在AIGC實際上將創(chuàng)作的邊際成本降到零”。每個人都有機會獲得無限的娛樂內(nèi)容供給,互聯(lián)網(wǎng)常見的信息分發(fā)方式未來可能都面臨重組。人會從主動生產(chǎn)和管理信息,進化到與AI共同生產(chǎn)以及與AI輔助管控共存。?

智能終端充當人類和AI認知世界的延伸,依托大模型同時滿足生產(chǎn)力、社交娛樂等全面需求。相比軟件產(chǎn)品智能硬件終端更容易演化到allinone的形態(tài),從而搶占終端的流量入口。從蘋果生態(tài)來看,智能終端的壁壘同時取決于生態(tài)業(yè)務(wù)場景的廣度和深度,而AI大模型的技術(shù)同時帶來兩個維度的革新。圖15:蘋果MR眼鏡圖16:谷歌PixelAI手機圖17:AIPin資料來源:公司官網(wǎng)、國信證券經(jīng)濟研究所整理資料來源:公司官網(wǎng)、國信證券經(jīng)濟研究所整資料來源:公司官網(wǎng)、國信證券經(jīng)濟研究所整理理11請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容目錄大模型的競爭格局演繹的關(guān)鍵因素獨立的模型團隊—月之暗面、清華GLM、百川智能互聯(lián)網(wǎng)大廠的模型和應(yīng)用進展—騰訊、字節(jié)、百度、阿里風(fēng)險提示0102030412請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容獨立的模型團隊—月之暗面、清華GLM、百川智能13請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容月之暗面:清華系新星楊植麟領(lǐng)銜,團隊核心人員多為清華同門?

月之暗面(MoonshotAI)創(chuàng)始人楊植麟自2020年起便堅信“大模型是未來”,2020年下半年為華為的盤古大模型做核心技術(shù)研發(fā),2021年參與智源研究院的悟道大模型研發(fā)。2022年底楊植麟前往美國進行為期2個月的考察,美國民眾對于GPT的狂熱讓他更堅信此時正是成立大模型公司的合適時機,于是他在接下來的1個月內(nèi)完成首輪融資,拿到來自紅杉等頭部機構(gòu)6000萬美元的啟動資金,并于3個月內(nèi)組建起了大約40人的技術(shù)研發(fā)團隊。?

MoonshotAI于2023年3月成立,成立前其團隊主要通過與其他公司合作,以團隊提供技術(shù)、合作方提供算力的形式來完成大模型相關(guān)工作。創(chuàng)始團隊核心成員參與了GoogleGemini、GoogleBard、盤古NLP、悟道等多個大模型的研發(fā),多項核心技術(shù)被GooglePaLM、MetaLLaMa、StableDiffusion等主流產(chǎn)品采用。表1:MoonshotAI創(chuàng)始人團隊背景介紹姓名持股比例職位簡介本科畢業(yè)于清華大學(xué)計算機科學(xué)與技術(shù)系,博士畢業(yè)于CMU計算機系,師從蘋果AI研究負責人RuslanSalakhutdinov和谷歌首席科學(xué)家WilliamCohen;博士期間,先后以一作身份,發(fā)表Transformer-XL和XLNet兩項工作,谷歌學(xué)術(shù)被引次數(shù)近2萬;據(jù)GitHub個人資料,楊植麟曾效力于Google和MetaPlatforms人工智能實驗室,曾任循環(huán)智能聯(lián)合創(chuàng)始人。MoonshotAI創(chuàng)始人,CEO楊植麟78.97%本碩博均畢業(yè)于清華大學(xué)計算機系,師從清華大學(xué)計算機系副系主任、數(shù)據(jù)挖掘頂級專家唐杰教授,研究方向是異構(gòu)數(shù)據(jù)融合和知識圖譜構(gòu)建;曾作為核心開發(fā)者研發(fā)了全球知名的科技大數(shù)據(jù)分析平臺AMiner,產(chǎn)品服務(wù)于BATH等科技巨頭及國家科技部等政府科研管理機構(gòu)。MoonshotAI聯(lián)合創(chuàng)始人,CTO張宇韜周昕宇吳育昕5%與楊植麟一同畢業(yè)于清華大學(xué)計算機系,畢業(yè)后加入曠視,從事算法量產(chǎn)工作,旨在提升算法生產(chǎn)效率;就職期間,他和曠MoonshotAI聯(lián)合創(chuàng)始人視研究院基礎(chǔ)科研負責人張祥雨一同研究移動端模型,以共同一作的身份撰寫ShuffleNet論文,中標CVPR,這項工作為包括蘋果3D人臉解鎖在內(nèi)的各種手機毫秒級人臉解鎖技術(shù)的發(fā)展提供了關(guān)鍵支持。10%與楊植麟背景類似,先后畢業(yè)于清華大學(xué)與CMU,研究方向為計算機視覺中的檢測和識別問題;曾就職于MetaFAIR,和隊員MoonshotAI聯(lián)合創(chuàng)始人何愷明共同提出組歸一化(GroupNormalization)的方法,吳育昕創(chuàng)建的detectron2,成為Meta受歡迎的AI項目之一;谷歌學(xué)術(shù)被引次數(shù)超過1.9萬次。5.96%14資料來源:天眼查、國信證券經(jīng)濟研究所整理請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容2023年首次發(fā)布大模型產(chǎn)品KimiChat,長文本能力為核心能力?

基于千億大模型的智能助手KimiChat,核心能力為長文本能力(LongContext):2023年10月9日,MoonshotAI推出首款產(chǎn)品,擁有長達20萬漢字的上下文處理能力,據(jù)MoonshotAI官方,這是目前全球市場上能夠產(chǎn)品化使用的大模型服務(wù)中所能支持的最長上下文輸入長度。此外,KimiChat還可處理多種文檔格式(如PDF、Excel等),具備較強的多語言能力,以及調(diào)用搜索引擎獲取信息,旨在為用戶提供強大、智能的對話伙伴,并為其工作、學(xué)習(xí)、生活提供助力。表2:MoonshotAI推出的大模型產(chǎn)品KimiChat簡介核心優(yōu)勢應(yīng)用實例底層技術(shù)處理長文本:依靠長文本技術(shù),KimiChat擁有長達20萬漢字的上下文處理能力,這意味著其能夠覆蓋更多應(yīng)用場景,且可直接基于全文理解進行問答和信息處理,從而極大程度上解決大模型的“幻覺”問題。?

KimiChat根據(jù)提供的文章鏈接,快速總結(jié)分析公眾號長文;?

KimiChat根據(jù)提供的上市公司財報,快速總結(jié)要點;支持多語言:相比當前市面上以英文為基礎(chǔ)訓(xùn)練的大模型服務(wù),KimiChat在中文上具備顯著優(yōu)勢,實際使用效果能夠支持約?

可閱讀長篇中文小說(如《三體》),并梳理內(nèi)容概要、角20萬漢字的上下文,2.5倍于Claude-100k(實測約8萬字),色介紹等8倍于GPT-4-32k(實測約2.5萬字)。大語言模型、長文本處理技術(shù)、注意力機制長程注意力機制:KimiChat通過創(chuàng)新的網(wǎng)絡(luò)結(jié)構(gòu)和工程優(yōu)化,可在千億參數(shù)下實現(xiàn)無損的長程注意力機制,不依賴于滑動窗口、降采樣、小模型等對性能損害較大的方案。?

可基于長篇小說、游戲設(shè)定進行角色扮演,不會在多次對話后脫離設(shè)定?

可一次接收多篇上市公司財報并進行市場分析;?

可一次接收多份出差發(fā)票并整理相關(guān)信息可處理多種文檔格式:KimiChat可處理多種文檔格式(包括PDF、Excel、CSV等)?

可一次接收多份求職簡歷并根據(jù)用戶需求篩選排序出Top5求職者資料來源:MoonshotAI官網(wǎng)、國信證券經(jīng)濟研究所整理15請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容模型版本經(jīng)歷兩次更新,在多個場景下持續(xù)優(yōu)化模型效果?

KimiChat更新歷程:?

2023年11月15日,KimiChatV1.1面向全社會開放版本,模型版本更新至moonshot-v1-20231115,主要更新內(nèi)容包括(1)大幅解決模型在復(fù)雜場景下輸出重復(fù)的問題;(2)關(guān)閉頁面不再導(dǎo)致模型回復(fù)停止,同一對話下,各終端同步輸出內(nèi)容;?

2023年12月25日,KimiChat模型版本更新至moonshot-v1-20231225,主要更新包括(1)內(nèi)容生成長度提升(2)優(yōu)化首字回復(fù)速度(3)實現(xiàn)從掃描件(文檔、合同、白板等)提取文字的功能,目前已支持掃描文件以PDF格式上傳解析(4)微信小程序端上線“Kimi智能助手”圖18:KimiChat最新版本可從掃描件提取手寫文字并解析圖19:KimiChat上線微信小程序“Kimi智能助手”???資料來源:Moonshot?AI官網(wǎng),國信證券經(jīng)濟研究所整理資料來源:Moonshot?AI官方公眾號,國信證券經(jīng)濟研究所整理16請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容智譜:清華KEG孵化而來,團隊核心成員多有清華背景?智譜AI由清華大學(xué)計算機系教授唐杰領(lǐng)銜的清華KEG(知識工程實驗室)孵化而來,其團隊核心成員多有清華系背景。?

2019年成立以來,智譜AI始終堅持投身大模型技術(shù)研發(fā),愿景是“未來讓機器像人一樣思考”,并希望能對標OpenAI;?

2020年6月,GPT-3發(fā)布,智譜AI意識到GPT模型已實現(xiàn)越級提升;?

2022年8月,智譜AI推出自研大模型GLM-130B,結(jié)合了GPT的單向向后預(yù)測模型框架與BERT的雙向預(yù)測的模型框架;公司專注于ToB和ToG服務(wù),客戶主要是企業(yè)和政府機構(gòu)。?

2023年,智譜AI獲融資25億,估值超百億人民幣。?目前智譜的合作案例包括:1)G端,跟北京政府合作提供智能客服能產(chǎn)品;跟北京中醫(yī)院合作中醫(yī)藥在線問診模型構(gòu)建等;2)B端,跟中石油合作ERP改造企業(yè)工作流;跟美團合作對話、廣告、搜索等功能;3)C端,提供ChatGLM通用大模型入口。圖20:智譜股權(quán)圖表3:智譜AI創(chuàng)始人團隊背景介紹姓名

職位簡介畢業(yè)于清華大學(xué)計算機系,博士研究方向為知識圖譜。曾在KDD、ICML等國際頂會和期刊上發(fā)表多篇學(xué)術(shù)論文,榮獲2013年中國電子學(xué)會科學(xué)技術(shù)三等獎、2012年北京市科學(xué)技術(shù)三等獎及2009年王選新聞科學(xué)技術(shù)獎二等獎等多項重要獎項。張鵬

CEO劉德

董事長、

師從高文院士,曾任清華數(shù)據(jù)科學(xué)研究院科技大數(shù)據(jù)研究中心副兵經(jīng)理主任王紹蘭總裁清華創(chuàng)新領(lǐng)軍博士??資料來源:天眼查,國信證券經(jīng)濟研究所整理資料來源:天眼查、國信證券經(jīng)濟研究所整理請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容17模型迭代歷程:創(chuàng)新動力充足,多個模型持續(xù)迭代GLM:?

2021.9設(shè)計GLM算法,發(fā)布擁有自主知識產(chǎn)權(quán)的開源百億大模型GLM-10B;?

2022.8發(fā)布高精度千億大模型GLM-130B并開源,效果對標GPT-3175B,收到70余個國家、1000余個研究機構(gòu)的使用需求;?

2022.10發(fā)布開源的100+語言預(yù)訓(xùn)練模型mGLM-1BChatGLM:?

2023.3發(fā)布千億基座的對話模型ChatGLM及其單卡開源版本ChatGLM-6B,全球下載量超過800萬;為實現(xiàn)從GLM到ChatGLM的迭代,智譜AI加入了代碼訓(xùn)練、進行SFT(SupervisedFineTuning,有監(jiān)督微調(diào))、加入RLHF(ReinforcementLearningwithHumanFeedback,基于人類反饋的強化學(xué)習(xí));?

2023.6發(fā)布全面升級的ChatGLM2模型矩陣,據(jù)GitHub,主要更新包括(1)升級基座模型以提升模型在MMLU(+23%)、CEval(+33%)、GSM8K(+571%)、BBH(+60%)等數(shù)據(jù)集的性能表現(xiàn)(2)上下文長度從2k擴展至32k(3)推理速度提升42%;?

2023.8搭載ChatGLM2模型的AI生成式助手“智譜清言”上線;?

2023.10發(fā)布全面升級的ChatGLM3模型及相關(guān)系列產(chǎn)品,主要更新包括(1)升級基座模型以提升模型在MMLU(+36%)、CEval(+33%)、GSM8K(+179%)、BBH(+126%)等數(shù)據(jù)集的性能表現(xiàn)(2)在多模態(tài)理解、代碼增強、網(wǎng)絡(luò)搜索等功能上進行迭代更新(3)集成自研AgentTuning技術(shù),激活模型智能體能力(4)推出可手機部署的端測模型,支持包括Vivo、小米、三星在內(nèi)的多種手機以及車載平臺(5)推理速度提升2-3倍,以上更新同樣作用于智譜清言;CodeGeeX:?

2022.9發(fā)布代碼生成模型CodeGeeX;?

2023.7發(fā)布新一代代碼生成模型CodeGeeX2,主要更新包括(1)代碼能力大幅提升,據(jù)GitHub,六種編程語言能力均大幅提升(Python+57%,C+++71%,Java+54%,JavaScript+83%,Go+56%,Rust+321%);(2)支持編程語言數(shù)量大幅提升,達到100余種;18請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容大模型產(chǎn)品涵蓋AI開放平臺、智譜清言及一系列AIGC產(chǎn)品?

智譜AI合作研發(fā)大模型GLM-130B,并基于此推出對話模型ChatGLM,開源單卡版模型ChatGLM-6B,并推出AI提效助手智譜清言(ChatGLM)。AIGC模型及其產(chǎn)品矩陣包括高效率代碼模型CodeGeeX、多模態(tài)理解模型CogVLM和文生圖模型CogView等;建立大模型MaaS開放平臺,致力于AI生態(tài)建設(shè)。表4:智譜AI的大模型產(chǎn)品矩陣產(chǎn)品功能介紹應(yīng)用實例底層模型-為開發(fā)者提供開放平臺,使其通過API調(diào)用,實現(xiàn)基于ChatGLM系列模型(ChatGLM-130B、ChatGLM-6B、GLM-130B)、CodeGeeX代碼大模型、多模態(tài)大模型(CogView、CogVideo)快速搭建AI應(yīng)用。電子簽約SaaS提供商上上簽集成GLM-130B大模型與行業(yè)數(shù)據(jù),推出簽約智能產(chǎn)品Hubble哈勃。AI開放平臺基于ChatGLM2開發(fā)的千億參數(shù)對話模型,支持多輪對話,具備內(nèi)容創(chuàng)作、信息歸納總結(jié)、代碼生成等能力。ChatGLM3:具問答和對話功能的千億中英語言模型,不同于BERT、GPT-3以及T5的架構(gòu),是一個包含多目標函數(shù)的自回歸預(yù)訓(xùn)練模型。ChatGLM(智譜清言)代碼生成能力:支持100余種編程語言,幫助用戶快速準確生成代碼。CodeGeeX:千億級參數(shù)的多編程語言代碼生成大模型,在超過20種編程語言的大型代碼語料庫上進行預(yù)訓(xùn)練?;贑odeGeeX代碼大模型的全能的智能編程助手,可實現(xiàn)代碼的生成與補全、自動添加注釋、支持主流編程語言,并適配多種主流IDE。代碼翻譯以及智能問答等功能。CodeGeeX免費智能寫作工具,可生成AI原創(chuàng)內(nèi)容創(chuàng)意以及完成各種文本任務(wù),如文章、報告、新聞稿、營銷文案等。GLM(GeneralLanguageModel):通用語言模型,通過自回歸空白填充目標進行預(yù)訓(xùn)練,并可在各種自然語言理解和生成任務(wù)上進行微調(diào)??筛鶕?jù)不同創(chuàng)作模板完成不同類型的文案創(chuàng)作,如“元旦祝?!?、“文章潤色”等。寫作蛙基于GLM模型的智能對話機器人,可根據(jù)用戶定義可創(chuàng)造多種不同人設(shè),如“林妹妹”、的人設(shè)切換對話風(fēng)格、進行有情感地流暢表達?!皫ж浿鞑ァ钡取P〈魧υ扜LM?

CogView:全球首個中文的全領(lǐng)域文到圖生成模型,40億級參數(shù);?

CogVideo:是全球首個開源的大規(guī)模文本到視頻生成模型,90億級參數(shù)。CogView/Cog基于CogView/CogViedeo大模型的文(中文)生圖可根據(jù)用戶輸入的中文文字描述生成相關(guān)Video工具圖片/視頻。19資料來源:智譜AI官網(wǎng)、智譜官方公眾號、GitHub、國信證券經(jīng)濟研究所整理請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容百川智能:前搜狗CEO王小川帶領(lǐng),團隊核心成員多為知名科技公司AI頂尖人才?百川智能由前搜狗公司CEO王小川聯(lián)合前搜狗公司COO茹立云于2023年4月10日創(chuàng)立,團隊核心成員多為來自搜狗、百度、華為、微軟、字節(jié)、騰訊等知名科技公司的AI頂尖人才,截至2023年10月,團隊規(guī)模170余人,其中碩士及以上學(xué)歷員工占比近70%,研發(fā)人員占比超80%。融資方面,啟動資金5000萬美元來自創(chuàng)始人王小川及其業(yè)內(nèi)好友個人支持,2023年10月完成A1輪戰(zhàn)略融資,獲阿里、騰訊等科技巨頭及頂級投資機構(gòu)的3億美元融資金額,創(chuàng)下國內(nèi)大模型初創(chuàng)企業(yè)最快晉升獨角獸的記錄。?目前已有超過200家企業(yè)申請百川大模型開源和商業(yè)授權(quán),并已將百川模型投入實際生產(chǎn)場景。企業(yè)涵蓋互聯(lián)網(wǎng)、軟件和信息技術(shù)、金融、法律、教育、制造業(yè)、企業(yè)服務(wù)等眾多領(lǐng)域,客戶包括阿里云、騰訊、火山引擎、京東科技、順豐科技、浪潮、中國農(nóng)業(yè)銀行、蔚來汽車等。表5:百川智能創(chuàng)始人團隊背景介紹姓名持股比例

職位簡介畢業(yè)于清華大學(xué)計算機科學(xué)與技術(shù)專業(yè),擁有學(xué)士、碩士及EMBA學(xué)位;曾任搜狗CEO,搜狐高級副百川智能創(chuàng)始人,

總裁兼CTO;先后發(fā)明了有5億多用戶在使用的搜狗輸入法、搜狗搜索等互聯(lián)網(wǎng)標志性產(chǎn)品;曾帶王小川

76.43%CEO領(lǐng)搜狗公司發(fā)展語音、圖像、翻譯等AI技術(shù)并率先實用化,帶領(lǐng)搜狗公司成長為國內(nèi)用戶規(guī)模第四大互聯(lián)網(wǎng)公司,并赴美上市中國人工智能第一股。畢業(yè)于清華大學(xué)計算機系,獲學(xué)士、碩士、博士學(xué)位及長江商學(xué)院EMBA學(xué)位;曾任搜狗COO,葡萄百川智能聯(lián)合創(chuàng)始

智學(xué)創(chuàng)始人;曾帶領(lǐng)搜狗搜索在多個搜索領(lǐng)域取得不俗成績,如率先發(fā)布分類搜索、推出全新的茹立云

0.77%人知識庫搜索引擎知立方、搜狗語音助手等產(chǎn)品,并成為唯一一家能夠提供“通用搜索”、“微信公眾平臺搜索”及微信內(nèi)容差異化閱讀服務(wù)的搜索引擎。資料來源:天眼查、國信證券經(jīng)濟研究所整理20請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容成立8個月內(nèi)發(fā)布8款自研大模型,速度與性能俱佳模型研發(fā)方面,自成立以來,百川智能先后發(fā)布Baichuan-7B/13B,Baichuan2-7B/13B四款開源模型和Baichuan-53B、Baichuan2-53B、Baichuan2-192K、Baichuan2-Turbo四款閉源模型,并與國家級科研機構(gòu)鵬城實驗室共同發(fā)布基于國產(chǎn)算力訓(xùn)練的最長上下文窗口大模型“鵬城-百川·腦海33B”。表6:百川智能大模型基本信息及測評表現(xiàn)模型基本信息發(fā)布時間是否開源測評表現(xiàn)基于Transformer結(jié)構(gòu),在大約1.2萬億tokens上訓(xùn)練而成,參數(shù)量70億,支持中英雙語,上下文窗口長度為4096。國內(nèi)首個開源可商用模型,國內(nèi)外多榜單排名第一,在中文榜大幅度領(lǐng)先,英文榜首超LlaMA。Baichuan-7B2023.6.15是在Baichuan-7B的基礎(chǔ)上提升參數(shù)量到130億,在高質(zhì)量語料上訓(xùn)練1.4萬億tokens(同等級別開源模型中訓(xùn)練數(shù)據(jù)最多,超LLaMA-13B40%);同時開源預(yù)訓(xùn)練模型(Baichuan-13B-Base)和對齊模型(Baichuan-13B-Chat),服務(wù)于開發(fā)者與普通用戶。Baichuan-13B同等級開源模型中效果最好的可商用大語言模型,中文榜大幅領(lǐng)先LlaMA-13B,英文榜超越所有同等級開源模型。2023.7.11是得益于團隊的搜索引擎背景,Baichuan-53B采用高質(zhì)量知識數(shù)據(jù)進行預(yù)訓(xùn)練,并通過搜索增強(融合指令意圖理解、智能搜索和結(jié)果增強等關(guān)鍵組件)減少模型幻覺;此外,進行對齊調(diào)整以使模型同人類價值觀對齊,從而生成“更令人滿意”的回復(fù)內(nèi)容。Baichuan-53B2023.8.82023.9.62023.9.25否是否-Baichuan2-7B/13B包括Baichuan2-7B、Baichuan2-13B,基于2.6萬億高質(zhì)量多語言數(shù)據(jù)訓(xùn)練而成,在數(shù)學(xué)、代碼、安全、邏輯推理、語義理解等能力有顯著提升。在MMLU、CMMLU、GSM8K等幾大權(quán)威評估基準中,以絕對優(yōu)勢領(lǐng)先LLaMA2,性能大幅度優(yōu)于LLaMA2等同等級模型競品。對Baichuan-53B各項能力進行提升(邏輯推理+100%,數(shù)學(xué)+31%,語言理解+29%,文本創(chuàng)作+18%,知識問答+9%),重點升級邏輯推理與數(shù)學(xué)能力;通過高質(zhì)量數(shù)據(jù)體系和搜索增強極大降低模型幻覺;開放API接口,以方便企業(yè)與開發(fā)者將其集成至自己的應(yīng)用程序或服務(wù)中。在FacTool測評(查核大模型生成內(nèi)容的事實準確性)中,Baichuan2-53B的綜合得分為140.5,在主流基礎(chǔ)大模型中僅排在GPT-4之后,處于國內(nèi)領(lǐng)先水平。Baichuan2-53B上下文窗口長度高達192K,在長窗口文本生成質(zhì)量、長上下文理解以及長文本問答、摘要等方面全面領(lǐng)先Claude2;通過算法和工程優(yōu)化,實現(xiàn)窗口長度2023.10.30和模型性能之間的平衡;以API調(diào)用和私有化部署的方式提供給企業(yè)用戶。Baichuan2-192K在Dureader、NarrativeQA、LSHT、TriviaQA等10項中英文長文本問答、摘要的評測集上表現(xiàn)優(yōu)異,有7項取得SOTA,顯著超過其他長窗口模型。否否Baichuan2-Turbo融合長上下文窗口和搜索增強,鏈接大模型與領(lǐng)域知識、全網(wǎng)知識;支持多種文檔(PDF、Word)上傳及網(wǎng)址輸入;開放API。2023.12.19-21資料來源:百川智能官網(wǎng)、百川大模型官方公眾號、GitHub、國信證券經(jīng)濟研究所整理請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容目錄大模型的競爭格局演繹的關(guān)鍵因素獨立的模型團隊—月之暗面、清華GLM、百川智能互聯(lián)網(wǎng)大廠的模型和應(yīng)用進展—騰訊、字節(jié)、百度、阿里風(fēng)險提示0102030422請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容騰訊:混元大模型+應(yīng)用解析23請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容騰訊-基礎(chǔ)大模型:混元大模型?

混元大模型是騰訊自研的通用大語言模型。具有超千億的參數(shù)規(guī)模、超2萬億tokens的預(yù)訓(xùn)練語料。9月,騰訊混元大模型正式通過騰訊云對外開放。用戶可以直接調(diào)用API接口,或者將騰訊混元作為基底模型,在公有云上進行精調(diào)。?

10月,騰訊混元大模型迎來全新升級,并正式對外開放“文生圖”功能。根據(jù)公司介紹,升級后的騰訊混元中文效果整體超過GPT3.5,代碼能力大幅提升20%,達到業(yè)界領(lǐng)先水平。?

11月世界互聯(lián)網(wǎng)大會烏鎮(zhèn)峰會,騰訊集團副總裁蔣杰還展示了騰訊混元大模型的“文生視頻”能力。?

混元助手是基于騰訊混元大模型的多模態(tài)對話Bot產(chǎn)品。隨著9月騰訊混元大模型首批通過備案,混元助手以微信小程序的形式陸續(xù)面向公眾開放。在場景的AI聊天頁面之外,還在“靈感發(fā)現(xiàn)”頁面提供了多個場景化的應(yīng)用。除文生文外,混元助手已經(jīng)支持文生圖功能,尚不支持文生視頻和讀圖功能。圖21:騰訊混元助手小程序圖22:騰訊混元文生圖功能??24資料來源:騰訊云AI官網(wǎng),國信證券經(jīng)濟研究所整理資料來源:騰訊混元官網(wǎng),國信證券經(jīng)濟研究所整理請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容騰訊-MaaS:騰訊云TI平臺,打造行業(yè)大模型精選商店?

MaaS云服務(wù):騰訊于今年6月首次公布騰訊云行業(yè)大模型方案,依托騰訊云TI平臺,打造行業(yè)大模型精選商店,為客戶提供MaaS(Model-as-a-Service)一站式服務(wù)。?

中國銀聯(lián):在單據(jù)識別錄入場景,騰訊云TI-OCR訓(xùn)練平臺整合OCR大模型,支持銀聯(lián)快速自定義證件、票據(jù)、文本識別,實現(xiàn)業(yè)務(wù)流程自動化,提升效率并節(jié)約成本。?

上海仁濟醫(yī)院:運用騰訊云醫(yī)療行業(yè)大模型,以互聯(lián)網(wǎng)醫(yī)院適老化服務(wù)為重點,打造了高度擬人化的虛擬數(shù)字形象“小威護士”,有效提升患者就醫(yī)體驗。?

8月起,騰訊云TI平臺全面接入Llama2、Falcon、Dolly、Vicuna、Bloom、Alpaca等20多個主流模型。圖23:騰訊云MaaS全景圖???資料來源:騰訊云智能官網(wǎng),國信證券經(jīng)濟研究所整理25請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容騰訊-AI基建:自研紫霄芯片+HCC算力集群+向量數(shù)據(jù)庫?

騰訊自研芯片已經(jīng)量產(chǎn),包括用于AI推理的紫霄芯片:采用自研存算架構(gòu)和自研加速模塊,可以提供高達3倍的計算加速性能和超過45%的整體成本節(jié)省。目前在騰訊會議實時字幕上已實現(xiàn)全量上線,單卡紫霄機器負載可達到T4的4倍,并將超時率從0.005%降低至0。?

騰訊云在4月發(fā)布新一代HCC高性能計算集群:采用最新一代星星海自研服務(wù)器,搭載NVIDIAH800TensorCoreGPU,性能較前代提升3倍。通過對單機算力、網(wǎng)絡(luò)架構(gòu)和存儲性能進行協(xié)同優(yōu)化,能夠為大模型訓(xùn)練提供高性能、高帶寬、低延遲的智算能力支撐。?

騰訊云在7月發(fā)布AI原生的向量數(shù)據(jù)庫:之后經(jīng)過多次迭代升級,在優(yōu)化版的IVF索引支持下,從最初支持的十億向量規(guī)模到現(xiàn)在的千億規(guī)模和500萬QPS峰值能力。目前,騰訊云向量數(shù)據(jù)庫已經(jīng)在內(nèi)部服務(wù)于騰訊視頻、QQ瀏覽器、QQ音樂等40多個業(yè)務(wù),日請求量達1600億次,服務(wù)了包括博世、銷售易、搜狐、好未來、鏈家等在內(nèi)的超過1000家外部客戶。圖24:騰訊云新一代HCC集群圖25:紫霄芯片算力參數(shù)跟其他常見芯片的對比圖26:騰訊云向量數(shù)據(jù)庫資料來源:騰訊云官網(wǎng),國信證券經(jīng)濟研究所整理資料來源:騰訊云官網(wǎng),國信證券經(jīng)濟研究所整理請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容資料來源:騰訊云數(shù)據(jù)庫官網(wǎng),國信證券經(jīng)濟研究所整理26騰訊-SaaS產(chǎn)品:AI提供了生成式新功能和潛在銷售機會?

根據(jù)“騰訊混元”官方公眾號的10月推文,超過180個騰訊內(nèi)部業(yè)務(wù)已接入騰訊混元,包括騰訊會議、騰訊文檔、企業(yè)微信、騰訊廣告和微信搜一搜等。我們認為,SaaS產(chǎn)品在接入混元大模型后,不僅帶來了更豐富的AI功能,也提供了新的銷售機會,有望帶動SaaS產(chǎn)品用戶數(shù)和客單價的提升。?

騰訊會議:AI小助手,已經(jīng)上線部分功能。提供會前日程協(xié)調(diào)、會中問答、會后智能紀要、會議待辦項等新功能。其中,“智能錄制不限次(包括智能紀要)”已經(jīng)加入付費版本專屬權(quán)益,有望帶動騰訊會議付費率的提升。?

騰訊文檔:智能助手。支持數(shù)十種文本創(chuàng)作場景,提供文檔創(chuàng)作、文本潤色、文本校閱、表格公式及圖表生成等能力,提高創(chuàng)作效率,提升創(chuàng)作體驗。目前智能助手已經(jīng)率先嵌入智能文檔中,需要申請后參與試用;未來還將嵌入智能表格、PPT、思維導(dǎo)圖等文檔類型。參照NotionAI,智能助手有望帶動騰訊文檔付費率和客單價的提升。?

此外,騰訊企點、企業(yè)微信、AI代碼助手等SaaS產(chǎn)品同樣在AI加持下增添了更多新功能,提升了潛在銷售機會。圖27:騰訊會議AI小助手圖28:騰訊文檔智能助手??資料來源:騰訊云AI官網(wǎng),國信證券經(jīng)濟研究所整理資料來源:騰訊云AI官網(wǎng),國信證券經(jīng)濟研究所整理27請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容騰訊-廣告平臺:AI一方面增強廣告定向和歸因,另一方面通過AIGC提升廣告創(chuàng)作效率和效果?增強廣告定向和歸因的準確性:2022年6月,騰訊廣告對外公布了借助大模型降本增效的進展:首先以混元AI大模型助力系統(tǒng)深刻理解廣告內(nèi)容,其次以精排大模型提升廣告和用戶的匹配準確率。騰訊連續(xù)4個季度在業(yè)績公告中提及機器學(xué)習(xí)平臺升級和廣告AI模型。?AI智能化創(chuàng)作廣告素材:騰訊廣告以騰訊混元大模型為基礎(chǔ),結(jié)合廣告應(yīng)用場景,實現(xiàn)含文生圖及文生視頻在內(nèi)的多種智能化廣告素材創(chuàng)作能力,滿足千人千面。目前,騰訊廣告“AI創(chuàng)意工作臺”已覆蓋電商、文旅、閱讀資訊、游戲等多個行業(yè)場景,針對閱讀行業(yè)還在持續(xù)打磨古言、都市、玄幻等小說人物形象模型,已從9月份開始陸續(xù)為廣告主提供“素材創(chuàng)作”、“二次編輯&一鍵投放”、“商品生成”等核心能力。圖29:騰訊廣告AI創(chuàng)意工作臺圖30:使用AIGC素材的生成效率與效果更優(yōu)?資料來源:騰訊云AI官網(wǎng),國信證券經(jīng)濟研究所整理資料來源:騰訊云官網(wǎng),國信證券經(jīng)濟研究所整理28請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容騰訊-微信Agent:以微信為入口的Agents具備很強的想象空間?

騰訊Q3業(yè)績會議上提及過“智能代理”(smartagent)的概念,目前還非常早期,但想象空間很大。?

AIAgents,是一種能夠自主感知環(huán)境、進行規(guī)劃和決策、使用外部工具的人工智能體。相比于Copilot,AIAgents具備更強的自主性,在復(fù)雜任務(wù)中參與度更深。目前完全意義上的Agents尚不成熟,市面上工具更多是Copilot。?

假設(shè)后期技術(shù)能夠?qū)崿F(xiàn)AIAgents,以微信為入口的Agents具備很強的想象空間:1.微信+小程序提供流量入口和基礎(chǔ)設(shè)施,有機會將微信的流量進一步貨幣化;2.增強微信的基礎(chǔ)性APP地位;3.派生更多新的商業(yè)模式。圖31:LLM-basedAgent概念框架圖32:多模態(tài)智能體框架在智能手機App操作中的多種應(yīng)用??資料來源:復(fù)旦大學(xué)NLP團隊,國信證券經(jīng)濟研究所整理參考文獻:XiZ,ChenW,GuoX,etal.Theriseandpotentialoflargelanguagemodelbasedagents:Asurvey[J].arXivpreprintarXiv:2309.07864,2023.資料來源:ChiZhang,ZhaoYang等,《AppAgent:MultimodalAgentsasSmartphoneUsers》,ComputerVisionandPatternRecognition(cs.CV),2023,arXiv:2312.13771,國信證券經(jīng)濟研究所整理29請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容百度:文心大模型+應(yīng)用解析30請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容百度-基礎(chǔ)大模型:文心大模型4.0?文心大模型4.0具備強大的理解、生成、邏輯和記憶的能力。根據(jù)百度官方公眾號,文心一言于8月31日向全社會開放,至今已有超7000萬用戶。10月17日,在百度世界2023大會上,文心大模型4.0版本正式發(fā)布。文心4.0實現(xiàn)了基礎(chǔ)模型的全面升級,在理解、生成、邏輯和記憶能力上都有著顯著提升,其中邏輯的提升幅度達到理解的近3倍,記憶的提升幅度也達到了理解的2倍多。根據(jù)三季度業(yè)績會議,與3月的文心一言相比,當前版本的推理成本降低了98%,同等算力條件下QPS提升了50倍。圖33:文心產(chǎn)業(yè)級知識增強大模型???資料來源:百度文心一言官網(wǎng),國信證券經(jīng)濟研究所整理31請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容百度-核心廣告:預(yù)計在四季度貢獻數(shù)億增量收入?

核心廣告:文心大模型重構(gòu)廣告系統(tǒng),預(yù)計在四季度貢獻數(shù)億增量收入。?

1)9月7日,百度營銷發(fā)布全球首個AINative營銷平臺“輕舸”。根據(jù)業(yè)績會議,百度通過文心大模型重構(gòu)廣告系統(tǒng),提升廣告素材創(chuàng)作效率和定向能力,“輕舸”可以自然語言和表達、高效推送、隨時調(diào)度AI能力,大大提升投放效率,便利用戶投放。至今已有數(shù)千名廣告客戶采用新廣告系統(tǒng),采用這些新功能的廣告客戶在三季度實現(xiàn)了平均高個位數(shù)的轉(zhuǎn)化率提升。在四季度,AI相關(guān)舉措有望為百度廣告貢獻數(shù)億增量收入。?

2)公司正在測試采用新的對話形式替代原有的落地頁,不僅有望提升廣告轉(zhuǎn)化率,還將使公司有機會從CPC模式向CPS模式轉(zhuǎn)變。圖34:百度營銷平臺-輕舸???資料來源:百度輕舸官網(wǎng),國信證券經(jīng)濟研究所整理32請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容百度-智能云:貢獻API調(diào)用收入、大模型解決方案收入??智能云:伴隨著文心大模型4.0的發(fā)布,公司相信客戶對AI大模型的需求有望打開云業(yè)務(wù)新的增長空間。根據(jù)業(yè)績會議,目前來自生成式AI和LLM的收入還比較少,但增速快。大模型的2B收入貢獻分為幾個層面:1)API調(diào)用收入:文心4.0已開放面向企業(yè)客戶的API,目前文心大模型API的調(diào)用量呈指數(shù)級增長。2)大模型解決方案收入:百度具備完善的芯片、框架、模型、應(yīng)用四層技術(shù)棧,支持企業(yè)客戶基于文心大模型構(gòu)建企業(yè)級大模型和行業(yè)應(yīng)用,也支持企業(yè)客戶基于文心千帆平臺訓(xùn)練自己的大模型,無論客戶選擇何種方式,都將為百度帶來新的創(chuàng)收機會。目前大模型可應(yīng)用于電商、短視頻、教育、游戲、醫(yī)療、金融等六大行業(yè):1)電商行業(yè):通過使用大模型,可以幫助電商平臺提升用戶體驗、增加銷售額同時大大降低運營成本;2)短視頻行業(yè):可以實現(xiàn)內(nèi)容創(chuàng)作文本的輸出,提高短視頻內(nèi)容創(chuàng)作者的效率;3)教育行業(yè):可以幫助提升教育教學(xué)效果、個性化教育水平、輔助教育決策能力;4)游戲行業(yè):在研發(fā)端,可以提升游戲設(shè)計、游戲代碼開發(fā)的工作效率;在體驗端,可以輔助開發(fā)者提供游戲優(yōu)化方案,提升游戲體驗;5)醫(yī)療行業(yè):為醫(yī)生提供更加準確和全面的診斷和治療建議,以及幫助醫(yī)生進行疾病檢測和預(yù)測;6)金融行業(yè):幫助銀行和金融機構(gòu)進行風(fēng)險評估、市場預(yù)測和欺詐檢測等任務(wù)。圖35:百度智能云發(fā)布基于文心一言的“超級助理”圖36:百度千帆平臺架構(gòu)??資料來源:百度智能云官網(wǎng),國信證券經(jīng)濟研究所整理資料來源:百度智能云官網(wǎng),國信證券經(jīng)濟研究所整理33請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容百度-AI重構(gòu)旗下應(yīng)用,如百度文庫、地圖、網(wǎng)盤等??運用文心大模型的能力重構(gòu)旗下應(yīng)用,為用戶帶來全新AI原生體驗。百度目前已經(jīng)基于文心大模型重構(gòu)了百度文庫、地圖、網(wǎng)盤、如流等原有應(yīng)用,也推出了新的AI原生應(yīng)用百度GBI和Comate代碼助手。重構(gòu)后的AI原生應(yīng)用,在用戶量、活躍度等數(shù)據(jù)指標方面實現(xiàn)顯著增長。例如,百度文庫AI新功能累計使用用戶達3000萬,付費率明顯提升;百度網(wǎng)盤個人助理“云一朵”用戶累計突破2000萬。各應(yīng)用AI功能:“云一朵”可以幫助用戶答疑解惑、總結(jié)文檔和視頻、提供創(chuàng)作靈感;AI向?qū)Э梢蕴峁╊A(yù)估行程、沿途規(guī)劃、安排聚會地點等服務(wù);百度文庫AI助理可以進行內(nèi)容總結(jié)、創(chuàng)作、PPT編輯等。圖37:百度文庫AI重構(gòu)圖38:百度網(wǎng)盤AI重構(gòu)-云一朵、百度地圖AI向?qū)?悠悠??資料來源:百度官方公眾號,國信證券經(jīng)濟研究所整理資料來源:百度網(wǎng)盤官網(wǎng)、百度地圖官網(wǎng),國信證券經(jīng)濟研究所整理34請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容阿里巴巴:通義大模型+應(yīng)用解析35請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容阿里—AI組織架構(gòu):云智能團隊主導(dǎo),全鏈條布局AI?阿里云戰(zhàn)略為“AI驅(qū)動,公共云優(yōu)先”,達摩院和基礎(chǔ)設(shè)施事業(yè)部負責AI底層基礎(chǔ)設(shè)施及芯片研發(fā);集團層面,阿里巴巴成立了基礎(chǔ)設(shè)施委員會,由CEO吳泳銘直接統(tǒng)籌負責,協(xié)調(diào)全集團底層技術(shù)基礎(chǔ)設(shè)施的規(guī)劃與建設(shè),助力AI更好地在集團其他業(yè)務(wù)落地應(yīng)用。?根據(jù)IDC統(tǒng)計,2022年中國AI公有云服務(wù)市場還是呈現(xiàn)出80.6%的正增長,整體市場規(guī)模達79.7億元人民幣。2022年中國AI公有云服務(wù)市場份額,百度智能云占比28.9%,阿里云占比27.4%,華為云占比18.7%,騰訊云占比18.7%,其他云廠商占比6.4%。圖39:阿里AI組織架構(gòu)情況圖40:2022年中國AI公有云服務(wù)市場份額資料來源:雷鋒網(wǎng),國信證券經(jīng)濟研究所整理資料來源:IDC,國信證券經(jīng)濟研究所整理36請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容阿里—AI基礎(chǔ)設(shè)施:自研AI芯片+通義大模型,支持外部AI?芯片:平頭哥半導(dǎo)體(2018年9月成立),目前已有鎮(zhèn)岳、含光、倚天、羽陣等多款芯片產(chǎn)品,其中含光為AI芯片,均已在阿里云、淘寶電商等場景投入應(yīng)用。?通義大模型:包括統(tǒng)一底座“M6-OFA”,三大通用模型“通義-M6”“通義-AliceMind”“通義-視覺大模型”,以及行業(yè)層面的不同垂直領(lǐng)域?qū)I(yè)模型。?AI應(yīng)用情況:自2023年4月通義大模型重磅發(fā)布以來,阿里集團董事會主席蔡崇信再2023云棲大會表示,全國80%的科技企業(yè)和超過一半的AI大模型公司跑在阿里云上;據(jù)公司管理層在FY24Q2業(yè)績會議披露,AI在公有云收入占比達到2%。表7:百度阿里騰訊自研芯片情況圖41:阿里巴巴通義大模型系列發(fā)布公司自研芯片昆侖芯類別AI芯片百度鴻鵠語音交互芯片RISC-V處理器芯片AI芯片玄鐵系列含光800多模態(tài)AI處理器SoC原型曳影1520阿里倚天710羽陣600羽陣611鎮(zhèn)岳510滄海Arm服務(wù)器芯片RFID芯片RFID芯片SSD主控芯片視頻處理加速AI芯片騰訊紫霄玄靈智能網(wǎng)卡芯片資料來源:平頭哥半導(dǎo)體官網(wǎng)、昆侖芯科技官網(wǎng)、百度AI開放平臺、騰訊數(shù)字生態(tài)大會、國信證券經(jīng)濟研究所整理請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容資料來源:阿里云開發(fā)者社區(qū),國信證券經(jīng)濟研究所整理37阿里C端應(yīng)用—淘寶問問:三大基本模式支撐四大應(yīng)用場景?

淘寶問問是淘寶App推出的ToCAI應(yīng)用,可以根據(jù)用戶輸入信息,通過深度合成算法解答用戶問題,提供內(nèi)容建議及相關(guān)商品推薦,目前淘寶問問僅向C端使用者開放,底層模型為通義千問。?

自9月上線測試版以來,累計使用人次超500萬;淘寶問問處理的需求中25%是非購物類場景需求,未來有望開拓購物之外的更多使用場景,向泛生活消費類平臺轉(zhuǎn)型;?

未來有望以接口方式向B端商家開放,助力其將品牌內(nèi)容、商品優(yōu)勢更高效傳達給消費者,同時了解消費者更長尾的購物需求。表8:淘寶問問的交互方式、基本模式及應(yīng)用場景交互方式基本模式應(yīng)用場景購物場景:用戶已有購物需求,問問提供購買建議,如商品比對Copilot指令模式:通過場景推薦彈幕、選擇指定AI角色的交互方式,自動補全用戶需求,提供輕量級、伴隨式的搜索體驗關(guān)鍵詞搜索消費場景:問問主動刺激用戶潛在購物需求,如場景導(dǎo)購方案場景推薦彈幕Q&A問答模式:生成式AI疊加對話式交互,滿足消費者更長尾、個性化的需求生活場景:基于日常生活,同時提供生活技巧及購物建議,如婚禮策劃、烹飪指導(dǎo)選擇指定AI角色雙11大促模式:疊加大促營銷權(quán)益,形成精準購物建議陪伴場景:通過關(guān)鍵詞搜索的交互方式,問問作為用戶的交談對象,可滿足諸如“給我講一個笑話”的需求資料來源:淘寶APP、國信證券經(jīng)濟研究所整理38請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容阿里B端應(yīng)用—企業(yè)溝通軟件:釘釘全面走向智能化,已開啟商業(yè)化?

釘釘開放智能化底座AIPaaS給企業(yè)客戶,AIPaaS包含模型調(diào)度平臺、模型訓(xùn)練平臺和插件開發(fā)平臺三個部分,降低企業(yè)開發(fā)運維的門檻,幫助企業(yè)數(shù)據(jù)與大模型建立聯(lián)系。目前釘釘軟件的訂閱服務(wù)客戶已經(jīng)超過了10萬家,付費DAU達到2300萬。?

AI商業(yè)化情況:釘釘專業(yè)版年費9800元基礎(chǔ)上,增加10000元即可獲得20萬次大模型調(diào)用額度;在專屬釘釘年費基礎(chǔ)上,增加20000元即可獲得45萬次大模型調(diào)用額度,相當于一次調(diào)用平均只需不到5分錢。?

與釘釘對比,飛書智能伙伴是開放的AI服務(wù)框架,沒有固定的底層模型,更初階更靈活,支持內(nèi)容創(chuàng)作、內(nèi)容總結(jié)、數(shù)據(jù)分析、場景構(gòu)建等功能,目前開放試用,尚未商業(yè)化。圖42:釘釘AIPaaS平臺/飛書智能伙伴概覽資料來源:釘釘官網(wǎng),飛書公眾號,國信證券經(jīng)濟研究所整理39請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容阿里B端應(yīng)用:萬相臺無界版&阿里媽媽百靈,多種營銷場景智能化?萬相臺無界版和阿里媽媽百靈是阿里媽媽推出的兩大ToB一站式智能營銷投放產(chǎn)品,其中萬相臺無界版以GMV為導(dǎo)向,側(cè)重站內(nèi)投放;阿里媽媽百靈整合站內(nèi)外媒體資源,側(cè)重品牌營銷。二者依托阿里媽媽專屬AI大模型,將消費者觸達、營銷推廣等多種經(jīng)營場景智能化,助力商家降本增效。?具體案例:日系洗護類品牌Claynal就轉(zhuǎn)變了以品類詞為核心的投放方式,利用萬相臺無界版7大場景能力找到了全新爆款群,收藏加購成本降低了12%,ROI提升了近24%?據(jù)阿里2023年9月季度財報,淘天廣告收入增速快于GMV增速,主要由于萬相臺無界和阿里媽媽百靈提升商家投放效率與投放意愿。圖43:萬相臺無界版覆蓋六大智能經(jīng)營場景圖44:阿里媽媽百靈包含三大智能化營銷場景????資料來源:阿里媽媽官網(wǎng),國信證券經(jīng)濟研究所整理資料來源:阿里媽媽官網(wǎng),國信證券經(jīng)濟研究所整理40請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容阿里AIGC應(yīng)用—妙鴨相機:AI在影視行業(yè)的應(yīng)用探索的小荷尖?妙鴨相機是一款基于AI技術(shù)的寫真生成工具,由阿里大文娛的張月光帶隊開發(fā)。2023年6月,妙鴨相機內(nèi)測;7月中旬小程序正式上線;7月底妙鴨相機APP上線;上線即爆火,高峰期有4000-5000人排隊,需等待十幾個小時才能出片,后因用戶等待時長過長、數(shù)據(jù)收集條款侵犯用戶隱私等爭議熱度很快下降。?AI商業(yè)化情況:上線伊始,用戶需支付9.9元并上傳20張照片即可生成數(shù)字分身并開始生成AI寫真;9月,妙鴨相機宣布推出免費版本,與仍為9.9元的專家模式相比,免費版本等待生成時間較長且模板使用受限。專家模式下會贈送用戶10顆鉆石,后續(xù)如需體驗更多模板或下載高清原圖需付費購買更多鉆石。?在妙鴨相機之外,阿里大文娛已經(jīng)在多個影視工業(yè)化垂直賽道進行AI布局。近期阿里大文娛團隊通過自研大模型生成了超寫實數(shù)字人厘里,通過真人替身加后期光場制作的方式呈現(xiàn)在劇集《異人之下》之中。傳統(tǒng)特效技術(shù)通常需要至少一個月才能完成,使用數(shù)字人參演疊加后期制作只需要一周,對于影視行業(yè)帶來直接的降本增效。圖45:妙鴨相機區(qū)分體驗?zāi)J脚c專家模式圖46:妙鴨相機微信指數(shù)趨勢變化????資料來源:妙鴨相機小程序,國信證券經(jīng)濟研究所整理資料來源:微信指數(shù),國信證券經(jīng)濟研究所整理41請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容字節(jié)跳動:云雀大模型+應(yīng)用解析42請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容字節(jié)AI—產(chǎn)品與發(fā)展時間線:新AI部門Flow同時發(fā)力技術(shù)與產(chǎn)品2023年2月2023年4月18日2023年6月布局語言和圖像兩個方向的大模型。其中語言大模型由字節(jié)跳動搜索部門牽頭,團隊規(guī)模在十數(shù)人左右,圖片大模型團隊則由該公司產(chǎn)品研發(fā)與工程架構(gòu)部下屬的智能創(chuàng)作團隊牽頭,整體由朱文佳負責?;鹕揭嬖谄渑e辦的春季FORCE原動力“原動力大會”上發(fā)布了包括自研DPU在內(nèi)的一系列新云產(chǎn)品,并推出了升級版的機器學(xué)習(xí)平臺。內(nèi)部測試一款A(yù)I對話類產(chǎn)品“Grace”,也就是豆包的前身,但彼時這一內(nèi)部項目團隊隸屬字節(jié)跳動技術(shù)中臺,還沒有組建單獨的產(chǎn)品部門。同月,字節(jié)跳動旗下火山引擎發(fā)布大模型服務(wù)平臺“火山方舟”,可為開發(fā)者和企業(yè)提供模型訓(xùn)練、推理、評測、精調(diào)等全方位的平臺服務(wù)(MaaS,即Model-as-a-Service)。2023年8月17日開始對外測試其AI對話產(chǎn)品“豆包”。豆包是字節(jié)推出的大模型產(chǎn)品,可以通過網(wǎng)頁直接訪問,包括豆包本身以及其他多功能小助手,如聊天小寧、寫作助手、智能體創(chuàng)建助手、AI圖片生成、AI漫畫生成、英語學(xué)習(xí)助手、MUSE音樂電臺等。2023年8月Cici在海外多個市場上線。2023年8月31日字節(jié)云雀大模型成為首批通過《生成式人工智能服務(wù)管理暫行辦法》備案的大模型,可正式上線面向公眾提供服務(wù)。2023年9月11日“悟空搜索”的應(yīng)用程序更名為“小悟空”,其主要特色是提供“無廣告搜索”體驗。小悟空應(yīng)用內(nèi)集成了一系列基于大語言模型的AI工具,這些工具支持智能對話和輔助推薦功能。2023年11月22日2023年11月底飛書在北京舉辦發(fā)布會,正式推出了“飛書智能伙伴”和其他系列AI產(chǎn)品。成立了一個專注于AI創(chuàng)新業(yè)務(wù)的新部門Flow。該部門的技術(shù)負責人是字節(jié)跳動的副總裁洪定坤,業(yè)務(wù)負責人是大模型團隊朱文佳,整體團隊規(guī)模近150人。Flow將主要聚焦在AI應(yīng)用層、押注AI大模型方向,后續(xù)技術(shù)層面更大的模型、端到端的原生多模態(tài),業(yè)務(wù)層面關(guān)注豆包、CiCi等AI原生應(yīng)用的用戶拓展、DAU增長。資料來源:公司官網(wǎng)、國信證券經(jīng)濟研究所整理43請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容字節(jié)產(chǎn)品線與AI功能一覽表9:字節(jié)產(chǎn)品線傳統(tǒng)功能與AI功能產(chǎn)品名稱通用信息平臺短視頻分享應(yīng)用創(chuàng)建、編輯和共享短視頻PUGC視頻平臺一站式汽車信息與服務(wù)真實專業(yè)的汽車內(nèi)容和選車服務(wù)PUGC內(nèi)容互動社區(qū)企業(yè)協(xié)作與管理平臺面向網(wǎng)文熱愛者的免費閱讀平臺???推薦引擎搜索引擎關(guān)注訂閱和內(nèi)容運營???提供優(yōu)質(zhì)內(nèi)容多樣化創(chuàng)作???短視頻內(nèi)容社交服務(wù)????即時溝通傳統(tǒng)功能音視頻會議在線文檔云盤、工作臺等??海量正版小說免費閱讀體驗?瀏覽其他用戶上傳的視頻內(nèi)容?為汽車廠商提供高效解決方案AI功能利用AI技術(shù)根據(jù)用戶的興趣和偏好,為其個性化推薦新聞內(nèi)容???智能推薦AI視頻剪輯AI實時特效???個性化推薦用戶行為分析AI視頻壓縮????智能語音助手智能推薦智能車輛識別AI咨詢與服務(wù)????智能視頻剪輯視頻語音識別智能配樂和配音人像美化??智能語音識別和翻譯智能機器人助手,處理咨詢、問題??精準推薦智能分類?AI會議議程生成產(chǎn)品名稱巨量引擎小荷健康綜合的數(shù)字化營銷服務(wù)平臺健康知識及服務(wù)平臺相機自拍相機?視頻剪輯云上數(shù)據(jù)產(chǎn)品?傳統(tǒng)功能??智能投放、智能優(yōu)化數(shù)據(jù)統(tǒng)計、預(yù)算管理???特色案例、醫(yī)療科普在線問診、權(quán)威專家在線購藥、疫苗預(yù)約?海量酷炫貼紙、激萌表情包、實時美顏、趣味特效、視頻跟拍流行的濾鏡、美顏效果和海量拍照模板,潮流自拍??提詞器功能視頻剪輯、配音包含底層AI引擎、AI場景以及上層與其他產(chǎn)品線聯(lián)合行業(yè)解決方案??智能廣告生成,幫廣告主生成創(chuàng)意素材和文案,提高廣告質(zhì)量智能化的投放方案和策略:收集分析用戶行為數(shù)據(jù),對用戶進行畫像分析,利用機器學(xué)習(xí)算法為廣告主提供方案?智能問診:提供一對一的智能醫(yī)療問診服務(wù)智能咨詢智能數(shù)據(jù)分析:收集、分析和存儲用戶的健康數(shù)據(jù)和咨詢記錄,幫助用戶管理和跟蹤自己的健康狀態(tài)????語音識別和字幕生成精準剪輯AI人像美化智能配樂?人像分割:自動識別人臉和身體,進行精細的人像分割,?

AI配音使得用戶在照片中的人物更加鮮明AI美顏和潤色智能配色?AI繪畫?接入AI大模型,完成AI應(yīng)用開發(fā):幫助企業(yè)提升數(shù)據(jù)處理和查詢分析的效率AI功能????AI智能寫作AI自動生成視頻:?

接入大模型方法:一是直接接入幫助用戶快速生成完整的短視頻???字節(jié)跳動自研的云雀大模型,二是通過火山引擎發(fā)布的火山方舟MaaS平臺,接入第三方模型,比如智譜AI、百川智能、MiniMax等AI照片修復(fù):修復(fù)照片中的裂縫、劃痕和壞點等問題44資料來源:字節(jié)各產(chǎn)品官網(wǎng)、國信證券經(jīng)濟研究所整理請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容字節(jié)AI模型—圖像、語音、視頻等多模態(tài)模型具備優(yōu)勢??AI方面的積累主要集中在機器翻譯、智能語音、視頻圖像和多模態(tài)四個領(lǐng)域。正在自研原生多模態(tài),目前多模態(tài)模型主要是基于開源基礎(chǔ)的各個模態(tài)子模型:非自回歸模型DA-Transformer、端到端語音到文本翻譯模型ConST、多顆粒度的視覺語言模型X-VLM、圖片和文本統(tǒng)一生成模型DaVinci等。?多模態(tài)模型應(yīng)用廣泛:抖音、今日頭條、剪映等產(chǎn)品層面推出過繪畫類、特效類、視頻剪輯、視頻生成等AIGC功能。圖47:ChitChopAI繪畫功能測評圖48:抖音AI視頻生生成功能測評資料來源:ChitChop官網(wǎng)、國信證券經(jīng)濟研究所整理資料來源:抖音APP、國信證券經(jīng)濟研究所整理45請務(wù)必閱讀正文之后的免責聲明及其項下所有內(nèi)容火山機器學(xué)習(xí)平臺與自研DPU構(gòu)筑算力基石?

火山引擎:字節(jié)跳動旗下的云服務(wù)平臺,將字節(jié)跳動快速發(fā)展過程中積累的增長方法、技術(shù)能力和工具開放給外部企業(yè),提供云基礎(chǔ)、視頻與內(nèi)容分發(fā)、數(shù)智平臺VeDI、人工智能、開發(fā)與運維等服務(wù),幫助企業(yè)在數(shù)字化升級中實

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論