版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
年全球AIGC
產(chǎn)業(yè)全景報告2024Global
AIGC
Industry
Report報告背景2024年,生成式AI已全面進入應(yīng)用規(guī)?;茝V,探索新場景和商業(yè)模式的新發(fā)展階段
。
伴隨AI大模型的普及程度不斷加深
,
AIGC產(chǎn)業(yè)發(fā)展重點從去年關(guān)注度最高的模型層向場景應(yīng)用層轉(zhuǎn)變
。
AIGC為營銷、
傳媒、
金融、
醫(yī)療、教育、
娛樂、
辦公、
制造、
科學發(fā)現(xiàn)等多個領(lǐng)域帶來前所未有的變革。搭載大模型的AI
PC、AI手機、
智能汽車相繼推出,為用戶帶來更加便捷的使用體驗。此外,具身智能也成為今年關(guān)注度頗高的領(lǐng)域,未來AI模型與人形機器人將密切融合,產(chǎn)生更多應(yīng)用場景與商業(yè)機會。在此背景下,天津市人工智能學會、
至頂科技、
至頂智庫聯(lián)合發(fā)布《2024年全球AIGC產(chǎn)業(yè)全景報告》
,報告從人類語言和機
器語言的發(fā)展歷程出發(fā),全面展現(xiàn)全球AIGC產(chǎn)業(yè)的發(fā)展歷程
,對AIGC典型技術(shù)及產(chǎn)品成熟度進行研判
,對AIGC產(chǎn)業(yè)投融資情況進
行梳理,具體展現(xiàn)AIGC各細分場景的應(yīng)用情況,最后報告提出全球AIGC產(chǎn)業(yè)的八大前沿趨勢。
為政府部門、
行業(yè)從業(yè)者、
教育工
作者以及社會公眾更好了解2024年AIGC的發(fā)展進程提供參考。天津市人工智能學會、至頂科技、至頂智庫2024年11月?2024.11ZD
Insights
2報告目錄1.
產(chǎn)業(yè)概況篇2.
基礎(chǔ)設(shè)施篇3.
場景應(yīng)用篇4.
用戶調(diào)研篇5.
前沿趨勢篇開篇:伴隨人類語言的發(fā)展,機器語言演進到自然語言階段語言發(fā)展歷程分為三大階段。語言1.0時代:
從人類語言誕生到公元前16世紀殷商時期甲骨文的出現(xiàn),文字成為人類交流的重要方式;語言2.0時代:
從蔡倫發(fā)明造紙術(shù)到世界第一臺電子計算機誕生,語言開始通過各類機器實現(xiàn)傳播;語言3.0時代:
伴隨NLP及生成式AI等技術(shù)的快速發(fā)展與應(yīng)用落地,機器生成和創(chuàng)造語言的方式成為了可能。機器語言發(fā)展歷經(jīng)五大階段,從二進制代碼發(fā)展到自然語言時代,新的“機器語言”交互方式誕生。公元前16世紀:甲骨文公元前2900年:古埃及象形文字公元前3200-2600年:
楔形文字新石器時代中期以
后:中國象形文字公元前10萬年-公元前16世紀1946年:第一臺電子計算機1876年:貝爾發(fā)明第一部電話1837年:美國人摩爾斯和兩個英
國工程師庫克
、
懷斯頓
同時發(fā)明電報公元1041-1048年間:
畢
昇發(fā)明活字印刷術(shù)自然語言伴隨人工智能技術(shù)的發(fā)展
,使
用自然語言替代原有機器語言
編程的方式成為可能,開發(fā)者
可以使用自然語言編寫指令,
然后由大型語言模型將其轉(zhuǎn)換
為計算機可以執(zhí)行的代碼
。
未
來將使更多人無需學習復(fù)雜的
編程語法也能輕松創(chuàng)建程序。解釋型高級編程語言解釋型高級編程語言如
Python
、
Ruby
等
,不
需要預(yù)編譯,可以在運
行時解釋執(zhí)行,加快了
開發(fā)速度
。
通常具有豐
富的庫和框架,使得開
發(fā)者能夠更容易地實現(xiàn)
各種功能。2001年:Bengio等人提出前饋神經(jīng)網(wǎng)絡(luò)1969年:互聯(lián)網(wǎng)出現(xiàn)1950年:?2024.11ZD
Insights
2017年:Transformer架構(gòu)提出2022年:OpenAI發(fā)布ChatGPT人類語言3.0時代人類語言1.0時代人類語言2.0時代機器語言5.0時代機器語言1.0時代機器語言3.0時代機器語言4.0時代機器語言2.0時代自然語言公元105年-20世紀40年代公元105年:漢朝蔡倫發(fā)明造紙術(shù)資料來源:至頂智庫結(jié)合公開資料整理繪制。1972年高級編程語言公元前10萬年:人類原始語言誕生1940年代二進制代碼20世紀50年代至今1950年代助記符號艾倫·圖靈提出圖靈測試1990年代XCHANL2022年DECCLR4AIG
C
成熟度曲線AIG
C
領(lǐng)域最新進展AIG
C
產(chǎn)業(yè)投融資情況產(chǎn)業(yè)概況篇AIG
C
產(chǎn)業(yè)全景圖譜AIG
C
發(fā)展路線圖AIG
C
產(chǎn)業(yè)政策環(huán)境1.1
2024年全球AIGC產(chǎn)業(yè)全景圖譜天津市人工智能學會、
至頂科技、
至頂智庫聯(lián)合發(fā)布2024年全球AIGC產(chǎn)業(yè)全景圖譜。圖譜主要分為基礎(chǔ)設(shè)施層(AI服務(wù)器
、
AI計算集群
、AI芯片
、
MaaS平臺
、AI數(shù)據(jù)服務(wù))
;模型層
(通用大模型、行業(yè)大模型);場景應(yīng)用層(智能助手、金融、
醫(yī)療、
辦公、教育、
奧運、
智能汽車、
營銷、
影視、
法律、政務(wù))
。
圖譜中涉及各領(lǐng)域全球代表性企業(yè)和相關(guān)機構(gòu),為讀者提供更為詳實的
參考信息。相比去年,基礎(chǔ)設(shè)施層新增MaaS平臺和AI數(shù)據(jù)服務(wù);模型層新增通用大模型和行業(yè)大模型的類別劃
分;場景應(yīng)用層按細分場景進行劃分。2024年全球AIGC產(chǎn)業(yè)全景圖譜所涉及的企業(yè)數(shù)量分布24
17
15
14
14
6
7
7
10
8
5通用大模型行業(yè)大模型4151基礎(chǔ)設(shè)施層AI服務(wù)器AI計算集群AI芯片MaaS平臺AI數(shù)據(jù)服務(wù)6912
12
10
資料來源:至頂智庫整理繪制。
6場景應(yīng)用層模型層?2024.11ZD
Insights
智能助手金融醫(yī)療辦公教育奧運智能汽車營銷影視法律政務(wù)社會關(guān)注度4.39億數(shù)字人圖表說明:萌芽階段:
技術(shù)/產(chǎn)品處于早期,推出時間短,應(yīng)用
場景少,普及度不高。爬升階段:
技術(shù)/產(chǎn)品持續(xù)迭代,有相關(guān)應(yīng)用場景,
有一定普及度。成熟階段:
技術(shù)/產(chǎn)品成熟穩(wěn)定,應(yīng)用場景多,普及
度高。AI手機/PC/智能汽車:
特指搭載AI大模型的各類終端AIGC應(yīng)用的成熟度。社會關(guān)注度:選取2024年微信指數(shù)最高點數(shù)值,體現(xiàn)
社會對于某項技術(shù)/產(chǎn)品的關(guān)注程度。圖中圓圈大小
反映社會關(guān)注度高低。統(tǒng)計數(shù)據(jù)截至2024年11月。AIGC技術(shù)產(chǎn)品萌芽階段AIGC技術(shù)產(chǎn)品爬升階段AIGC技術(shù)產(chǎn)品成熟階段
圖表來源:至頂智庫結(jié)合公開資料及專家調(diào)研整理繪制。?2024.11ZD
Insights
1.2
至頂AIGC成熟度曲線(2024)社會關(guān)注度6.69億社會關(guān)注度
3億c
視頻生成
模型端側(cè)模型社會關(guān)注度
7200萬RAG
。
提示工程
。
微調(diào)?社會關(guān)注度
7446萬人形機器人智能汽車AI手機社會關(guān)注度
9.6萬社會關(guān)注度
11萬社會關(guān)注度
761萬社會關(guān)注度
33萬社會關(guān)注度
120萬社會關(guān)注度
630萬社會關(guān)注度
43萬社會關(guān)注度
1020萬圖像生成
模型社會關(guān)注度
7322萬.AI
Agent大語言模型合成數(shù)據(jù)AI
PC71.3規(guī)模定律(ScalingLaw)將持續(xù)推動AIGC產(chǎn)業(yè)發(fā)展規(guī)模定律是指隨著訓(xùn)練數(shù)據(jù)
、
模型大小和計算資源的增加,大語言模型的性能會有所提升的規(guī)律
,
2020年由OpenAI提出;2022年,GoogleDeepMind研究固定成本下最優(yōu)的模型參數(shù)量和訓(xùn)練數(shù)據(jù)量,得出訓(xùn)練數(shù)據(jù)量應(yīng)當和參數(shù)量同等提升,并訓(xùn)練出Chinchilla模型。伴隨OpenAI
o1模型的發(fā)布,ScalingLaw從模型訓(xùn)練擴展演進到推理擴展階段。MMLU評分
全球主流大模型性能表現(xiàn)符合規(guī)模定律
Falcon
180B
U-PaLM
540B
1800億參數(shù)
,
3.5萬億token
,3.76e24
Flops
?2024.11ZD
Insights
Gopher
0.4B
70億參數(shù)
,
2萬億token
,8.4e22
Flops
10090807060504030201002800億參數(shù)
,3000億token,6.31e23
Flops700億參數(shù)
,1.4萬億token,5.76e23
Flops400億參數(shù)
,1萬億token,2.4e23
FlopsLLaMA
2
34B●
Falcon
40B
LLaMA
33B110100100010000資料來源:
MMLU,Epoch
AI,至頂智庫整理繪制。Mistral
7BQwen
7B●BLOOM
176BRoBERTa-base
125M●ChinchillaGeminiUltra~1760BGLM
130B●Gopher
280BQwen1.5
72BLLaMA
65BLLaMA
2
13BLLaMA
2
7B參數(shù)量8Google企業(yè)名稱企業(yè)LOGO總部
所在
地生成式AI產(chǎn)業(yè)主要細分領(lǐng)域AI芯片AI計算集群MaaS平臺AI大模型AI場景應(yīng)用/解決方案閉源開源輕量智能助手辦公金融醫(yī)療汽車教育營銷商湯
中國
o
o
oo
o
ooo
資料來源:至頂智庫結(jié)合公開資料整理繪制。
9?2024.11ZD
Insights
1.4全球科技領(lǐng)軍企業(yè)在AIGC產(chǎn)業(yè)的布局韓國企業(yè)韓國√騰訊
Tencent騰訊
阿里云
C-〕阿里云火山引擎京東華為科大訊飛C
Metaintel.Qual
cowwMetaOpenAI蘋果英偉達英特爾高通美國
。
美國
。
美國美國
美國
美國
美國
美國中國中國
中國
中國
中國
中國亞馬遜云科技
微軟●●√●√
√√●●
●√√√
√●中國√美國企業(yè)中國企業(yè)谷歌美國三星百度√√√√√√2017年,伴隨Transformer的出現(xiàn),AI大模型在全球掀起開發(fā)浪潮
。
2022年11月,ChatGPT的正式發(fā)布
,加速了各類科技企業(yè)開發(fā)大模型的進度,以谷歌、
Meta、
OpenAI
、Anthropic、百度、
阿里、騰訊、
科大訊飛、
智譜等國內(nèi)外領(lǐng)軍科技企業(yè),推出語言、
圖像、視覺、
多模態(tài)等各種類型的AI大模型,主流模型具有生成各類文案、
圖像、視頻等能力。
此外
,適用于
金融、
醫(yī)療、教育、
營銷、客服等領(lǐng)域的行業(yè)大模型也層出不窮
,不斷推動商業(yè)化落地進程。1.5全球AIGC產(chǎn)業(yè)發(fā)展路線圖(2015-2024)
資料來源:至頂智庫結(jié)合公開資料整理繪制。
10?2024.11ZD
Insights
Transformer
BERT
Ernie
1.02020.5發(fā)布GPT-32020.6
Gshard
CodeGeeX
OPT-175B發(fā)布GPT-2發(fā)布GPT-1
2020.102020.112022.112015.122017.62018.10
Ernie2.0
Ernie
3.02022.8Make-a-Video
視頻生成模型DALL·E圖像生成模型DALL·E2圖像生成模型2022201720212019202020182015
RoBERTa2021.5
2021.1發(fā)布ChatGPT2022.9
OpenAI成立GLM-130B2021.12WebGLMGLM-10B2022.42018.62021.72022.52021.92019.22019.72019.3LaMDAGLaMGLMmT5文心大模型4.0工具版Gemma
2
型
i-
i
視頻
Mistral
Large
Mixtral
8x22BGrok-1.5
GLM-4
2024.2
Grok-2
豆包大模型
Grok-1.5V
Llama
3
Claude
3
Opus
Gemini
1.5Grok-2
mini
r
2
GPT-4o
ia1.5
ProGemmGeminMogeeaNLstrastraMM生成模型Sora發(fā)布型min型側(cè)量端Ph輕4
0Turbo文心大模圖像生成模型
文心大模型4.0AndesGPT
端側(cè)模型OPPO2023.6
2023.71.5全球AIGC產(chǎn)業(yè)發(fā)展路線圖(2015-2024)
Claude3
Haiku
Claude3
Sonnet2024.42024.62024.3?2024.11ZD
Insights
Gemini
Live圖像智能語音助手
Pixel
Studio生成應(yīng)用谷歌AI手機搭載Gemini模型
TensorG4AI手機芯片Gemini
1.0UltraGemini
1.0ProGemini
1.0Nano輕量模型/端側(cè)模型Phi-3圖像生成模型Veo視頻生成模型Gemini
1.5
Flash
輕量模型Llama3.2視覺模型
(11B和90B)文本生成模型1B和3B)日日新SenseNova5.5大模型體系日日新
5.5Lite端側(cè)模型OpenAI與FinancialTimes達成合作,提升ChatGPT體驗OpenAI與Apple達成合作,未來蘋果產(chǎn)品將搭載ChatGPTQwen2.5開源通義萬相發(fā)布視頻
生成模型CodeGeeX4
代碼生成模型
CogVideoX視頻生成模型2023.82023.52023.92023.10Qwen-72BQwen-1.8BQwen-Audio
(音頻大模型)資料來源:至頂智庫結(jié)合公開資料整理繪制。訊飛星火V3.5
星火語音大模型
星火開源-13BAI芯片MTIAv1PaLM2ChatGPT
Enterprise
企業(yè)級產(chǎn)品推出Claude2.1長文本200KToken日日新SenseNova
大模型體系2023.3ChatGPT
Plus訂
閱服務(wù)推出CogVLM
ChatGLM3
智譜清言Ernie
3.5
端側(cè)模型2024.92024.8蔚來NOMI
GPT
端側(cè)模型CM3leon
文生圖模型
Llama2日日新SenseNova4.0大模型體系日日新SenseNova5.0大模型體系理想Mind
GPT
端側(cè)模型豆包·視頻生成
模型藍心大模型1B
端側(cè)模型Emu視頻生成模型Qwen-VL視覺語言模型20232024Microsoft
Copilot智能助理GPT-4o
mini
SearchGPTChatGLM2
智譜清言O(shè)penAIo1
推理模型ERNIE
Bot
文心一言發(fā)布GPT
StoreClaudePro
Mistral
7BMetaAI
智能助理Phi-3.5輕量模型騰訊混元大模型訊飛星火V1.5訊飛星火V2.0訊飛星火V1.0訊飛星火V4.0訊飛星火V3.0通義千問2.5通義千問2.0通義千問1.0小米MiLMMixtral
8x7BImagen3VisualGLMClaude3.52023.122023.11ERNIE4.0Llama3.1ChatGLMDALL-E32024.72024.12024.52023.42023.2PaLM-ELlama
1SonnetClaudeClaudeGPT-4112024年10月Ministral
3B/8B包括Ministral3B和Ministral8B兩種
輕量級模型,均支持128k上下文且
性能媲美Gemma
2、Llama
3.1開源模
型。Ministral8B具有特殊的交錯滑
動窗口注意力機制(SWA),可實現(xiàn)更
快和內(nèi)存高效的推理。2024年7月Mistral
Large
21230億參數(shù)的大小使其能夠在單
個節(jié)點上以大吞吐量運行
。Mistral
Large2擁有128k上下文窗口,支持
英語、法語、
中文等數(shù)十種語言及80多種編程語言,在代碼和推理、指令遵循、
多輪對話等方面表現(xiàn)突
出。Mistral
Large
2允許用于研究和非商業(yè)用途的使用和修改。2024年4月Mixtral
8x22BMixtral8x22B是一個稀疏專家混合
(SMoE)
模型,僅使用
1410億激活參
數(shù)中的390億,具有高成本效率
。
Mixtral8x22B精通英語
、
法語
、
意
大利語
、德語和西班牙語
,具有很
強的數(shù)學和編碼能力
,64K
token上
下文窗口允許從大型文檔中精確調(diào)
用信息。2024年6月多模態(tài)模型
Claude
3.5
SonnetClaude
3.5Sonnet
的運行速度是Claude
3
Opus
的兩倍,且推理、
閱
讀理解、數(shù)學、科學和編碼能力更
強,也是Anthropic迄今最強的視覺
模型;Claude.ai
新增了Artifacts
功
能。
Artifacts
是
一
項
擴
展
用戶
與
Claude
交互方式的新功能。用戶可
以實時查看
、
編輯和構(gòu)建Claude的創(chuàng)作,并將生成的內(nèi)容無縫集成
到項目和工作流程中。2024年3月多模態(tài)模型Claude
3Claude3Opus是最智能的模型
,在
高度復(fù)雜的任務(wù)上具有市場最佳的
性能;
Claude3Sonnet在智能和速
度之間實現(xiàn)理想的平衡;
Claude3
Haiku是最快、最緊湊的模型。2024年9月推理模型
OpenAIo1OpenAI
o1在處理物理學、化學和生物學領(lǐng)域的復(fù)雜問題時展現(xiàn)出
了接近博士的專業(yè)能力。在國際
奧林匹克數(shù)學競賽中,展現(xiàn)出
83%的準確率水平
。
其編程能力
還在Codeforces競賽中表現(xiàn)超過
89%的人類選手。2024年5月多模態(tài)模型GPT-4oGPT-4o采用更自然的人機交互
,接受文本、音頻、
圖像和視頻的任意組合作為輸入
,并生成文本、音頻和圖像的任意組合輸出。2024年2月視頻生成模型Sora視頻生成模型Sora能夠生成時長一
分鐘的高保真視頻
。OpenAI在可變
持續(xù)時間、分辨率和寬高比的視頻
和圖像上聯(lián)合訓(xùn)練文本調(diào)節(jié)擴散模
型,能在時間上向前或向后擴展視
頻;可修改輸入視頻的風格和環(huán)境;
可連接兩個輸入視頻,在不同主題
和場景構(gòu)成的視頻之間無縫過渡。2024年8月Gemma
2輕量級輕量級Gemma
2
2B
擁有20億參數(shù),具有內(nèi)置的安全改進以及性能和
效率的強大平衡。
可在各種硬件上高效運行,從邊緣設(shè)備和筆記本
電腦到使用
VertexAI
和Google
KubernetesEngine
(GKE)
的強大云
部署。
可根據(jù)商業(yè)友好的Gemma條款進行研究和商業(yè)應(yīng)用。2024年6月視覺語言模型PaliGemma及開源模型Gemma
2PaliGemma是開放式視覺語言模型,可在廣泛的視覺語言任務(wù)中實現(xiàn)卓越的微調(diào)性能,包括為圖片和短視頻描述生成、視覺問答、理解圖像中的文本、對象檢測和對象分割;Gemma
2開源9B和27B版本,其中Gemma
2
27B性能與
Llama
3
70B相媲
美,大小不到Llama
3
70B
的一半。2024年5月多模態(tài)
Gemini
1.5Flash1.5Flash是通過API提供的速度最快
的Gemini模型,比
1.5
Pro
更輕量級
但具有強大的多模態(tài)推理能力,在
總結(jié)摘要、聊天應(yīng)用、
圖像和視頻字幕生成以及從長文檔和表格中提取數(shù)據(jù)等方面表現(xiàn)出色。,2024年5月視頻生成模型VeoVeo
可生成時間超過一分鐘的1080p
分辨率視頻。包括生成查詢網(wǎng)絡(luò)
(GQN)、
DVD-GAN
、
Imagen-Video
、
Phenaki
、
WALT
、
VideoPoet和Lumiere
,提高質(zhì)量和輸出分辨率。2024年5月圖像生成模型Imagen
3Imagen
3是Google最高質(zhì)量的文本到
圖像模型,可生成高細節(jié)水平、逼真的圖像,與之前的模型相比,分
散注意力的視覺干擾更少。2024年2月開源模型
GemmaGemma更加輕量,擁有2B和7B版本模型權(quán)重也一并開源,且允許商用。
采用與Gemini模型相同技術(shù)構(gòu)建。2024年2月Gemini
1.5Gemini
1.5采用新的專家混合(MoE)
架構(gòu)
,使訓(xùn)練和服務(wù)更加高效
。
其中
Gemini1.5Pro是中型多模態(tài)模型,配備了標準的
128k
token上下文窗口。2024年9月開源模型Llama
3.2包括視覺模型(11B和90B)和文本
模型(1B和3B)
,提供預(yù)訓(xùn)練與對
齊版本
,可通過torchtune進行微調(diào)
,
也可使用torchchat在本地部署
,還
可通過Meta
AI進行使用。2024年7月開源模型Llama
3.1Llama3.1405B使用15萬億token在超
過16000個H100GPU上訓(xùn)練
,上下文長度擴展到128K。2024年4月開源模型Llama
3具有80億和700億參數(shù)
,預(yù)訓(xùn)練數(shù)
據(jù)集達到15萬億token進行訓(xùn)練,
訓(xùn)練數(shù)據(jù)來源于30余種語言。1.62024年全球領(lǐng)軍科技企業(yè)在AIGC領(lǐng)域的最新進展2024年4月小尺寸模型Phi-3
mini可用于手機上運行的小尺寸模型
,
其中Phi-3mini擁有38億參數(shù),經(jīng)
過
3.3
萬億token訓(xùn)練。Phi-3-mini有兩種上下文長度變體
:4K和
128K
token。?2024.11ZD
Insights
資料來源:至頂智庫結(jié)合公開資料整理繪制。你open
AlO
MetaGoogleGoogleAN
THRO
P\C122024年10月訊飛星火4.0Turbo文本生成、語言理解、知識問答、邏輯推理、數(shù)學能力、代碼能力、
多模態(tài)能力均超過GPT-4
Turbo,數(shù)
學和代碼能力超越GPT-4o,效率相
對提升50%,國內(nèi)外中英文14項主
流測試集中實現(xiàn)9項第一。2024年6月訊飛星火大模型V4.0實現(xiàn)對標GPT4-Turbo
,在文本生成、
語言理解、知識問答、邏輯推理、數(shù)學能力等方面實現(xiàn)超越。2024年1月訊飛星火大模型V3.5模型在語言理解、文本生成、知識問答、邏輯推理,數(shù)學能力、
代碼能力和多模態(tài)能力七個方面進行全面升級,其中語言理解、
數(shù)學能力超過GPT-4Turbo。代碼
達到GPT-4Turbo
96%,多模態(tài)理
解達到GPT-4V
91%。2024年1月星火語音大模型在中文、英語、法語、俄語等首批37個主流透種的語音識劇效果
超過OpenAl
WhisperV3。在多語種
語音合成方面,星火語音大模型
的首批40個語種平均MOS分絕對提
升0.25,擬人度超83%。2024年9月開源模型Qwen2.5通義大模型家族已全面涵蓋語言
、
圖像、視頻、音頻等
全
模
態(tài)
。
Qwen2.5全系列模型都在18T
token數(shù)
據(jù)上進行預(yù)訓(xùn)練
,Qwen2.5-72B模型
在MMLU-rudex
基準
、
MBPP基準和
MATH
基準的得分高達86.8
、
88.2
、
83.1。通義萬相發(fā)布視頻生成模型文生視頻中,支持多語言輸入和多種比例生成
,并可以通過靈感
擴寫功能豐富視頻內(nèi)容表現(xiàn)力;圖生視頻中,支持將上傳圖片按
照比例轉(zhuǎn)化為動態(tài)視頻
,并能通
過提示詞控制視頻運動。2024年5月通義千問2.5通義千問2.5版本的理解能力、邏輯推理、指令遵循、代碼能力分
別提升9%、
16%、
19%,10%。2024年4月開源模型Qwen1.5-32BQwen1.5-32B在MMLU、GSM8K、HumanEval以及BBH等多種任務(wù)上展
現(xiàn)出頗具競爭力的表現(xiàn),優(yōu)于其他
30B級別模型。2024年3月開源模型Qwen1.5開源
0.5B
、1.8B、
4B
、7B
、14B
和
72B共計6個不同規(guī)模的Base和Chat模型。2024年7月飛槳框架3.0飛槳框架3.0
是面向大模型
、
異構(gòu)多芯進行專屬設(shè)計,向下適配異構(gòu)多芯,充分釋放硬件潛能;
向上一體化支撐大模型的訓(xùn)練、推理。
同時具有動靜統(tǒng)一自動并行、編譯器
自動優(yōu)化、大模型訓(xùn)推一體、
大模型多硬件適配四大能力
,全面地提升了服務(wù)產(chǎn)業(yè)的能力。2024年6月文心大模型4.0Turbo網(wǎng)頁版、APP、API
陸續(xù)開放,通過數(shù)據(jù)、基礎(chǔ)模型、對齊技術(shù)、提示、知識增強、檢索增強和對話增強等核心技術(shù)的持續(xù)創(chuàng)新
,速度更快,效果更好。2024年4月文心大模型4.0工具版在工具版上,可以通過自然語言交互,進行文檔問答、數(shù)據(jù)分析、代
碼執(zhí)行。提供基于大模型來開發(fā)各種應(yīng)用的工具
,包括智能體開發(fā)工具AgentBuilder
,AI原生應(yīng)用開發(fā)
工具AppBuilder,以及各種尺寸的
模型定制工具ModelBuilder。2024年4月智艙大模型2.0智艙大模型2.0采用全新MoE架構(gòu),可支持本地化部署
,并配套專屬開發(fā)工具鏈,支持車企高效定制品牌特色,基于智艙體驗打造差異化競爭力。2024年10月基座大模型GLM-4-PlusGLM-4-Plus
在各大語言文本能力
數(shù)據(jù)集上獲得與
GPT-4o
及405B
Llama3.1
相當?shù)乃?,在語言理
解、邏輯推理、指令遵循、長文
本輸出方面都有較大突破。2024年7月視頻生成模型CogVideoX智譜發(fā)布AI
視頻模型「清影」
,30秒將任意文圖生成視頻
,并開源與「清影」
同源的視頻生成模型CogVideoX。2024年7月代碼生成模型CodeGeeX4開源CodeGeeX4-ALL-9B
,集代碼補
全和生成、代碼問答、代碼解釋器、
工具調(diào)用、聯(lián)網(wǎng)搜索、項目級代碼問答等能力于一體的代碼大模型。2024年1月GLM-4GLM-4
,整體性能相比GLM3全面提
升60%
,支持更長上下文
、
更強的多模態(tài),支持更快推理速度,更多
并發(fā),降低推理成本。GLM-4實現(xiàn)自主根據(jù)用戶意圖,
自動理解、規(guī)
劃復(fù)雜指令,
自由調(diào)用網(wǎng)頁瀏覽器、
Code
Interpreter代碼解釋器和多模
態(tài)文生圖大模型,以完成復(fù)雜任務(wù)。2024年9月豆包·視頻生成模型遵從復(fù)雜prompt
,解鎖時序性多拍
動作指令與多個主體間的交互能力。
具備多鏡頭語言能力,并能完成在一個prompt內(nèi)實現(xiàn)多個鏡頭切換。支持多種視頻風格
,還包含六種不同比例的視頻。2024年5月豆包大模型發(fā)布9款豆包系列大模型
,包括豆包通用模型Pro/Lite
、
角色扮演模
型、語音合成模型、聲音復(fù)刻模型、
語音識別模型、文生圖
模型
、Functioncall模型
、向量化模型
。
其中豆包通用模型pro支持128k長文
本,全系列可精調(diào)
,具備更強的理解、
生成、邏輯等綜合能力。2024年9月騰訊混元Turbo相比于前一代混元Turbo模型,新一代的訓(xùn)練效率提升108%,推理效
率提升100%,推理成本則降低為前
一代的一半。在多個基準的測試上
已能夠?qū)薌PT-4o。2024年5月AI助手元寶基于騰訊混元大模型
,具備看
、
聽
、說等多模態(tài)能力
,在知識學
習
、
生活百科
、
職場辦公
、趣味
創(chuàng)作等多個領(lǐng)域提高效率。1.62024年中國領(lǐng)軍科技企業(yè)在AIGC領(lǐng)域的最新進展2024年5月Baichuan
4發(fā)布最新一代基座大模型
Baichuan4
,
同時推出首款A(yù)I助手“百小應(yīng)”。
Baichuan4
相較Baichuan
3在各項能力上均有極大提升
,其中
通用能力提升超過10%,數(shù)學和代
碼能力分別提升14%和9%。2024年7月日日新SenseNova
5.5日日新5.5具有6000億參數(shù),綜合
性能較「
日日新5.0
」提升30%。
交互效果和多項核心指標實現(xiàn)對
標GPT-4o
;「
日日新
5o」,流式多模態(tài)交互,帶來全新AI交互模
式;端側(cè)模型升級,發(fā)布日日新
5.5
Lite。2024年10月Yi-LightningYi-Lightning在ChatbotArena榜單中
以1287的競技場分數(shù)位列大語言模型性能的世界第6
,在數(shù)學模塊位
列世界第3,超越GPT-4o以及Claude
3.5Sonnet等行業(yè)內(nèi)頂尖模型。?2024.11ZD
Insights
資料來源:至頂智庫結(jié)合公開資料整理繪制。C-〕阿里云Tencent騰訊131.7測試集成為評判AI模型性能的重要手段大模型測試集是評估和提升人工智能模型性能的重要工具
,為開發(fā)者提供標準化平臺,用于量化和比較不同模型的性能,有助于加速模型的迭代
和優(yōu)化。
相關(guān)測試集通常涵蓋多個領(lǐng)域和任務(wù),
以確保全面評估模型的通用性和專業(yè)性。
按類別來看,全球AI大模型測試集分為綜合考試類、
理解推理類、
數(shù)學科學類、代碼類。其中,綜合考試類的MMLU(Massive
Multitask
Language
Understanding)測試集使用較為廣泛,
由加州大學
伯克利分校于2020年9月發(fā)布,涵蓋57個學科,從人文到社科到理工多個大類的綜合知識能力。具體如下表所示。全球主流AI大模型測試集理解&推理HellaSwag英文艾倫人工智能研究所BBH英文GoogleWinoGrande英文華盛頓大學/艾倫人工智能研究所RACE-H英文卡內(nèi)基梅隆大學數(shù)學&科學GSM8K英文OpenAIMATH英文加州大學伯克利分校GPQA英文紐約大學、Cohere、Anthropic代碼HumanEval英文
OpenAI
資料來源:至頂智庫結(jié)合公開資料整理繪制。
14?2024.11ZD
Insights
加州大學伯克利分校上海交通大學/微軟亞洲研究院/墨爾本大學艾倫人工智能研究所清華大學/愛丁堡大學/上海交通大學MMLUCMMLU
ARC-C
C-Eval英文中文
英文
中文發(fā)布單位綜合考試測試集語種類別發(fā)布時間政策名稱發(fā)布機構(gòu)政策內(nèi)容美國2024年4月Futureof
ArtificialIntelligenceInnovation
Actof2024《2024年人工智能創(chuàng)新法案》美國國會成立美國人工智能安全研究所,
旨在制定確保國家安全、
公共安全和個人權(quán)利的人工智能
標準。
創(chuàng)建人工智能測試計劃,幫助發(fā)現(xiàn)人工智能生態(tài)系統(tǒng)中的漏洞
。
組建人工智能創(chuàng)新
和標準聯(lián)盟,鼓勵人工智能創(chuàng)新合作,協(xié)調(diào)各國人工智能標準
。由美國國家科學基金會指
導(dǎo)啟動雙邊和多邊人工智能研究合作
,這一發(fā)展將推動協(xié)調(diào)創(chuàng)新和安全人工智能發(fā)展。2024年1月The
California
ArtificialIntelligenceTransparency
Act《加州人工智能透明度法案》美國加州議會旨在賦予消費者識別AI生成產(chǎn)品的能力,
以降低AI生成內(nèi)容可能被濫用的風險
。
要求大型AI生成內(nèi)容提供商對其生成的圖像、
視頻、
音頻等媒體內(nèi)容添加水印,并為消費者提供相
應(yīng)的查詢平臺和查詢服務(wù),確保消費者擁有對產(chǎn)品必要信息的知情權(quán)
。
該法案標志著美國
加州在為人工智能生成產(chǎn)品制定明確準則方面邁出了重要一步。2023年5月National
ArtificialIntelligence
ResearchandDevelopment
Strategic
Plan《國家人工智能開發(fā)戰(zhàn)略計劃》美國白宮旨在確保人工智能技術(shù)的發(fā)展符合國家的價值觀、
保護公民權(quán)利、
促進經(jīng)濟增長并保護國
家安全。
該計劃提出培養(yǎng)聯(lián)邦機器學習方法
,提高模型通信和從多個設(shè)備更新到共享的全
局模型的效率。
研究可擴展通用人工智能系統(tǒng),不斷創(chuàng)新推出基礎(chǔ)模型在語言和圖像任務(wù)
上的應(yīng)用,解決在數(shù)據(jù)庫上訓(xùn)練模型的隱私問題,提升大模型的有效性、
可靠性、
安全性。歐盟2024年9月Councilof
Europe
Framework
ConventiononArtificialIntelligenceand
HumanRights,Democracy
andthe
Ruleof
Law《人工智能與人權(quán)、民主及法治框架公約》歐盟委員會旨在確保人工智能活動符合人權(quán)、民主和法治。
公約促進成員國間以及全球范圍內(nèi)的合作
,
以強化共同價值觀;關(guān)切人工智能發(fā)展可能導(dǎo)致的歧視和經(jīng)濟
、
社會不平等;強調(diào)人工智
能系統(tǒng)的透明度和負責創(chuàng)新的重要性;國家需采取措施
,保障人工智能活動中對隱私和個
人數(shù)據(jù)的保護;
各成員國需通過法律和行政手段,確保人工智能系統(tǒng)不危害民主進程和法
律的尊重;指定開展國際合作和機制監(jiān)督,
以確保其條款的有效實施。2024年7月EU
ArtificialIntelligence
Act《歐盟人工智能法案》歐盟委員會該法案根據(jù)風險將人工智能分類為四個等級:不可接受風險的AI(如社會評分系統(tǒng)和操控
性AI)
被禁止;
高風險AI系統(tǒng)受到嚴格監(jiān)管;
有限風險AI系統(tǒng)則面臨較輕的透明度義務(wù);最小風險AI(如大多數(shù)現(xiàn)有應(yīng)用)
不受監(jiān)管
。
高風險AI系統(tǒng)的主要責任在于提供者(開發(fā)
者)
,無論其是否在歐盟內(nèi),服務(wù)提供者承擔相關(guān)義務(wù)。
通用AI模型的提供者需提供技術(shù)
文檔和使用說明,并遵守版權(quán)指令,存在系統(tǒng)性風險的模型還需進行評估和網(wǎng)絡(luò)安全保護。日本2024年4月《商業(yè)人工智能指南1.0》日本總務(wù)省、日本經(jīng)濟產(chǎn)業(yè)省旨在應(yīng)對生成式人工智能技術(shù)變化,并提供統(tǒng)一的人工智能治理指導(dǎo)原則
。
該指南草案建
議人工智能開發(fā)人員收集和處理合理的數(shù)據(jù)以用于模型的學習;定期評估AI模型的輸入和
輸出,
以監(jiān)測任何生成的偏見;還應(yīng)當向利益相關(guān)方披露用于訓(xùn)練AI的數(shù)據(jù)收集方法以及AI模型的訓(xùn)練方法;確保AI商業(yè)參與者之間的合作,從價值鏈和風險鏈的角度出發(fā)。
資料來源:至頂智庫結(jié)合公開資料整理繪制。
15
?2024.11ZD
Insights
1.8全球AIGC產(chǎn)業(yè)發(fā)展的政策環(huán)境2023年以來全球發(fā)布的AIGC相關(guān)政策發(fā)布時間政策名稱發(fā)布機構(gòu)政策內(nèi)容國家層面2024年6月《國家人工智能產(chǎn)業(yè)綜合標準化體系建設(shè)指南(2024版)
》工業(yè)和信息化部、中央網(wǎng)信辦、國家
發(fā)改委、國家標準化管理委員會指南提出機器學習、
知識圖譜、
大模型、
自然語言處理、
計算機視覺等關(guān)鍵技術(shù)的標準,
其中大模型標準包括大模型通用技術(shù)要求、
評測指標與方法、
服務(wù)能力成熟度評估、
生成
內(nèi)容評價等。
政策還對包括基礎(chǔ)安全,數(shù)據(jù)、
算法和模型安全,
網(wǎng)絡(luò)、
技術(shù)和系統(tǒng)安全等
與人工智能模型相關(guān)的安全標準進行規(guī)范。2023年7月《生成式人工智能服務(wù)管理暫行辦法》國家網(wǎng)信辦、國家發(fā)改委、教育部、
科技部、工業(yè)和信息化部、公安部、國家廣電總局鼓勵生成式人工智能技術(shù)在各行業(yè)、
各領(lǐng)域的創(chuàng)新應(yīng)用,生成積極健康、向上向善的優(yōu)質(zhì)
內(nèi)容,探索優(yōu)化應(yīng)用場景,構(gòu)建應(yīng)用生態(tài)體系。
生成式人工智能服務(wù)提供者應(yīng)當依法開展
預(yù)訓(xùn)練、
優(yōu)化訓(xùn)練等訓(xùn)練數(shù)據(jù)處理活動,應(yīng)遵守:
使用具有合法來源的數(shù)據(jù)和基礎(chǔ)模型;
不得侵害他人依法享有的知識產(chǎn)權(quán);采取有效措施提高訓(xùn)練數(shù)據(jù)質(zhì)量。地方層面北京2024年7月《北京市推動“人工智能+”行動計劃
(2024-2025年)
》北京市發(fā)展和改革委員會、北京市經(jīng)濟和信息化局、北京市科學技術(shù)委員會、中關(guān)村科技園區(qū)管理委員會到2025年,力爭形成3-5個先進可用、
自主可控的基礎(chǔ)大模型產(chǎn)品、
100個優(yōu)秀的行業(yè)大模
型產(chǎn)品和1000個行業(yè)成功案例。圍繞機器人、
教育、醫(yī)療、
金融、
文化、
交通等領(lǐng)域組織
實施一批綜合型、
標桿性重大工程,建立各行業(yè)大模型平臺,促進大模型核心理論與技術(shù)
突破,增強人工智能工程化能力。2024年3月《北京經(jīng)濟技術(shù)開發(fā)區(qū)關(guān)于加快打造AI原生
產(chǎn)業(yè)創(chuàng)新高地的若干政策》北京經(jīng)濟技術(shù)開發(fā)區(qū)管理委員會到2026年,集聚人工智能產(chǎn)業(yè)鏈企業(yè)100家,建成人工智能算力
10000PFlops
。
加快推進算
力基礎(chǔ)設(shè)施建設(shè),鼓勵打造國產(chǎn)算力底座。
支持頭部企業(yè)圍繞多模態(tài)通用模型基礎(chǔ)架構(gòu)、多模態(tài)學習算法
、
對齊調(diào)優(yōu)等領(lǐng)域開展大模型關(guān)鍵技術(shù)攻關(guān)
。
大力開展
“大模型+”行動
,
推動“大模型+自動駕駛”
、
“大模型+機器人”
、
“大模型+工業(yè)制造”等場景應(yīng)用。2023年5月《北京市促進通用人工智能創(chuàng)新發(fā)展的
若干措施》北京市人民政府辦公廳建設(shè)北京人工智能公共算力中心,形成規(guī)?;冗M算力供給能力。圍繞模型構(gòu)建、
訓(xùn)練、
調(diào)優(yōu)對齊、
推理部署等環(huán)節(jié),積極探索基礎(chǔ)模型架構(gòu)創(chuàng)新,研究大模型高效并行訓(xùn)練技術(shù)
和認知推理、
指令學習、
人類意圖對齊等調(diào)優(yōu)方法,研發(fā)支持百億參數(shù)模型推理的高效壓
縮和端側(cè)部署技術(shù),形成完整高效的技術(shù)體系,鼓勵開源技術(shù)生態(tài)建設(shè)。
資料來源:至頂智庫結(jié)合公開資料整理繪制。
?2024.11ZD
Insights
1.9
中國AIGC產(chǎn)業(yè)發(fā)展的政策環(huán)境2023年以來中國發(fā)布的AIGC相關(guān)政策16發(fā)布時間政策名稱發(fā)布機構(gòu)政策內(nèi)容地方層面上海2024年3月《上海市智能算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展
“算
力浦江”智算行動實施方案(2024-2025年)》上海市通信管理局、上海網(wǎng)信辦、上
海市發(fā)改委、上海市數(shù)據(jù)局、上海市
教委、上海市科委、上海市衛(wèi)健委、
上海市市場監(jiān)管局、上海市國資委、
上海市交通委、中國人民銀行上??偛康?025年,智能算力規(guī)模超過30EFlops,
占比達到總算力的50%以上,算力網(wǎng)絡(luò)節(jié)點間單向
網(wǎng)絡(luò)時延控制在1毫秒以內(nèi)
。
鼓勵基礎(chǔ)電信企業(yè)跨地區(qū)提供智算服務(wù),推動智算芯片全面
兼容國產(chǎn)訓(xùn)練框架,推動大模型多維并行訓(xùn)練優(yōu)化、
模型快速適配、
模型異構(gòu)推理部署等
技術(shù)和工具研發(fā),推動打造智能算力與工業(yè)、
城市治理、
教育科研等應(yīng)用場景的創(chuàng)新融合。2023年10月《上海市推動人工智能大模型創(chuàng)新發(fā)展若干
措施(2023-2025年)
》上海市經(jīng)濟和信息化委員會、上海市
發(fā)展和改革委員會、上海市科學技術(shù)
委員會、上海網(wǎng)信辦、上海市財政局支持引進高水平創(chuàng)新企業(yè),支持本市創(chuàng)新主體打造具有國際競爭力的大模型
,鼓勵形成數(shù)
據(jù)飛輪,加速模型迭代。
應(yīng)用層面,重點支持在智能制造、
生物醫(yī)藥、
集成電路、
智能化
教育教學、
科技金融、
設(shè)計創(chuàng)意、
自動駕駛、
機器人、
數(shù)字政府等領(lǐng)域構(gòu)建示范應(yīng)用場景
,
打造標桿性大模型產(chǎn)品和服務(wù)。深圳2024年9月《深圳市前海深港現(xiàn)代服務(wù)業(yè)合作區(qū)管理局
關(guān)于支持人工智能高質(zhì)量發(fā)展高水平應(yīng)用的若干措施》深圳市前海深港現(xiàn)代服務(wù)業(yè)合作區(qū)
管理局鼓勵企業(yè)建設(shè)智能算力中心和智能算力調(diào)度平臺,支持企業(yè)基于國產(chǎn)人工智能軟件底座打
造共性技術(shù)服務(wù)平臺,鼓勵開展人工智能語音識別、圖像識別、自然語言理解等領(lǐng)域通用
關(guān)鍵技術(shù)開發(fā)
。圍繞制造、
金融、
物流、
商務(wù)等重點領(lǐng)域支持
“大模型+產(chǎn)業(yè)”應(yīng)用創(chuàng)新。2024年7月《深圳市加快打造人工智能先鋒城市
行動方案》深圳市工業(yè)和信息化局鼓勵開展大模型架構(gòu)、
大模型超級智能、
超級對齊等技術(shù)創(chuàng)新,打造全鏈路自研大模型技
術(shù)體系。
研發(fā)多模態(tài)具身智能大模型,開發(fā)具身智能機器人
“大腦”,推動具身智能大模
型與機器人本體深度結(jié)合,鼓勵打造具有商業(yè)價值的整機產(chǎn)品。
在數(shù)字政府、
教育、
醫(yī)療、
氣象、
智慧城市、
環(huán)衛(wèi)、
科研、
制造、
金融、
低空經(jīng)濟、
智能網(wǎng)聯(lián)汽車、
現(xiàn)代時尚、
游戲
動漫、
文旅、網(wǎng)絡(luò)安全等領(lǐng)域,鼓勵企業(yè)聯(lián)合研發(fā)行業(yè)大模型。2023年5月《深圳市加快推動人工智能高質(zhì)量發(fā)展高水平應(yīng)用行動方案(2023-2024年)
》中共深圳市委、深圳市人民政府聚焦通用大模型、
智能算力芯片、
智能傳感器、
智能機器人、
智能網(wǎng)聯(lián)汽車等領(lǐng)域,重點
支持打造基于國內(nèi)外芯片和算法的開源通用大模型;支持重點企業(yè)持續(xù)研發(fā)和迭代商用通
用大模型;開展通用型具身智能機器人的研發(fā)和應(yīng)用。
資料來源:至頂智庫結(jié)合公開資料整理繪制。
17
?2024.11ZD
Insights
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2023年宜賓市屏山縣科學技術(shù)協(xié)會招聘用工人員筆試真題
- 2023年四川省自然資源廳廳機關(guān)服務(wù)中心選調(diào)筆試真題
- 2024年電子支付安全防護技術(shù)研發(fā)與市場推廣協(xié)議合同3篇
- 三分鐘正能量演講稿范文6篇
- 環(huán)境演講稿模板錦集7篇
- 購銷合同簽訂的常見問題解答
- 軟件招標文件撰寫要點
- 家庭水管布線合同
- 兒童服飾批發(fā)合同
- 熟食連鎖加盟合同樣本
- 公司經(jīng)營發(fā)展規(guī)劃
- 2024譯林版七年級英語上冊單詞(帶音標)
- 品管圈PDCA案例-普外科提高甲狀腺手術(shù)患者功能鍛煉合格率
- 新媒體復(fù)習題與參考答案
- 2024年公司職代會發(fā)言稿(3篇)
- 菏澤學院課程與教學論(專升本)復(fù)習題
- 電玩城租賃經(jīng)營合同
- 2024年中國救生圈市場調(diào)查研究報告
- 動火作業(yè)應(yīng)急預(yù)案樣本(4篇)
- Unit 4 Plants around us(說課稿)-2024-2025學年人教PEP版(2024)英語三年級上冊
- 2024年抖音直播平臺搭建合同
評論
0/150
提交評論