ChatGPT火爆出圈AI算力和行業(yè)應(yīng)用潛力巨大

上傳人：b*** IP屬地：北京上傳時(shí)間：2023-03-21 格式：PPTX 頁(yè)數(shù)：41 大小：5.29MB 積分：22 舉報(bào) 版權(quán)申訴

ChatGPT火爆出圈AI算力和行業(yè)應(yīng)用潛力巨大_第2頁(yè)

ChatGPT火爆出圈AI算力和行業(yè)應(yīng)用潛力巨大_第3頁(yè)

ChatGPT火爆出圈AI算力和行業(yè)應(yīng)用潛力巨大_第4頁(yè)

ChatGPT火爆出圈AI算力和行業(yè)應(yīng)用潛力巨大_第5頁(yè)

已閱讀5頁(yè)，還剩36頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

3目錄焦點(diǎn)：ChatGPT帶火AIGC，Open

AI強(qiáng)勢(shì)出圈2022年11月30日，由OpenAI開發(fā)的聊天機(jī)器人ChatGPT推出并席卷了整個(gè)行業(yè)，短短5天，注冊(cè)用戶數(shù)就超過100萬，僅兩個(gè)月月活用戶數(shù)已經(jīng)破億。2023年1月，全球每天約有1300萬獨(dú)立訪問者使用ChatGPT。ChatGPT擁有強(qiáng)大的語言理解和文本生成能力，能夠很好地支持聊天對(duì)話、代碼撰寫、文案創(chuàng)作等任務(wù)。與之前的AI聊天機(jī)器人相比，ChatGPT能夠理解上下文并給出合理的回復(fù)，對(duì)話連續(xù)性大幅提升，可以稱為人工智能發(fā)展史上的劃時(shí)代產(chǎn)品。憑借著ChatGPT的成功，Open

AI成為全球AI行業(yè)關(guān)注的焦點(diǎn)。各軟件用戶數(shù)達(dá)到100萬所用的時(shí)間

ChatGPT寫詩(shī)、評(píng)論和代碼生成等樣例Statista、百度百科OPEN AI：GPT模型技術(shù)領(lǐng)先，ChatGPT發(fā)布引發(fā)變革百度百科20152023201620182020開放人工智能應(yīng)用接口2017201920222021微軟投資OPAN

10億美元發(fā)布ProximalPolicy

Optimization算法發(fā)布OPEN

AI憲章發(fā)布DELL

E2發(fā)布ChatGPTOPEN

AI發(fā)布發(fā)布發(fā)布發(fā)布研究人工神經(jīng)網(wǎng)絡(luò)發(fā)布ChatGPT成立UniverseGPT-1GPT-2GPT-3中的多模式神經(jīng)元InstructGPT月活用戶超1億AIGC(AI

Generated

Content)是人工智能生成內(nèi)容，也稱為生成式AI，涉及無監(jiān)督和半監(jiān)督學(xué)習(xí)算法，能夠使計(jì)算機(jī)用先前創(chuàng)建的內(nèi)容（諸如文本、音頻、視頻、圖像和代碼等）來生成新的內(nèi)容，以此響應(yīng)用戶輸入的提示語。OPEN

AI是全球領(lǐng)先的AIGC公司。OPEN

AI成立于2015年，其最初定位為“非盈利性研究機(jī)構(gòu)”，2018年，OPAN

AI發(fā)布了GPT-1模型，2019年，公司改制為“有上限的盈利性機(jī)構(gòu)”，并于同年發(fā)布GPT-2模型；2022年3月，OPAN

AI發(fā)布InstructGPT模型；2022年11月，OPENAI發(fā)布ChatGPT。此外，公司還擁有自然語言轉(zhuǎn)圖片的應(yīng)用DELL

E2。OPEN

AI發(fā)展歷程5OPEN

AI：微軟持續(xù)提供資金、算力和生態(tài)支持，助力成就爆款美國(guó)財(cái)富雜志，平安證券研究所Azure超級(jí)計(jì)算機(jī)賦能OPEN

AI計(jì)算資源軟件應(yīng)用微軟高度重視人工智能領(lǐng)域，在資金投入、計(jì)算資源、應(yīng)用開發(fā)等方面與OPEN

AI形成了密切的合作關(guān)系，兩者優(yōu)勢(shì)互補(bǔ)、合作共贏。資金投入：2019年，微軟向OPEN

AI投資10億美元；2021年，微軟再次向OPEN

AI投資，數(shù)額未披露；2023年1月，微軟宣布將通過一項(xiàng)花費(fèi)數(shù)年、數(shù)十億美金的投資深化與OPEN

AI的合作，根據(jù)美國(guó)財(cái)富雜志信息，該投資可能高達(dá)100億美元。計(jì)算資源：微軟Azure是OPEN

AI的獨(dú)家云供應(yīng)商，且微軟將加大在超級(jí)計(jì)算機(jī)方面的投資以支持OPEN

AI的發(fā)展，同時(shí)OPEN

AI也可以反哺增強(qiáng)微軟Azure的AI能力，兩者能夠很好的合作共贏。應(yīng)用開發(fā)：2月8日，微軟推出基于OPEN

AI模型的Edge瀏覽器和Bing搜索引擎，且微軟表示未來所有產(chǎn)品將全線整合ChatGPT，包括Office三件套、Azure云服務(wù)、企業(yè)定制版產(chǎn)品等。微軟投資OPEN

AI歷史

OPEN

AI與微軟在計(jì)算資源、應(yīng)用開發(fā)方面的合作關(guān)系Microsoft2019MicrosoftOpen

AI610億$2021未披露2023數(shù)十億$投資百度：文心大模型國(guó)內(nèi)全面領(lǐng)先，有望打造成國(guó)產(chǎn)ChatGPT20192023202020212022發(fā)布發(fā)布ERNIE3.0模型，構(gòu)建通用語義表示和任務(wù)語義表示框架發(fā)布鵬城-百度文心大模型,為全球首個(gè)知識(shí)增強(qiáng)型千億級(jí)模型應(yīng)用至百度搜索業(yè)務(wù)發(fā)布ERNIE3.0

Zeus模型發(fā)布ERNIE2.0模型,提出持續(xù)學(xué)習(xí)ERNIE1.0模型

語義理解框架將推出“文心一言”L1L2L3L1L2L3L1L2L3L4生態(tài)能力百度，IDC7百度文心大模型平均分應(yīng)用能力注：目前尚未有廠商在產(chǎn)品能力和生態(tài)能力方面達(dá)到L5，應(yīng)用能力尚未有廠商達(dá)到L4百度在大模型領(lǐng)域擁有較強(qiáng)的技術(shù)實(shí)力和平臺(tái)積累，其文心大模型總體位于行業(yè)前列。2019年3月，百度首次發(fā)布預(yù)訓(xùn)練模型ERNIE1.0，之后針對(duì)大模型的技術(shù)創(chuàng)新與產(chǎn)業(yè)應(yīng)用持續(xù)發(fā)力，目前已經(jīng)實(shí)陸續(xù)實(shí)現(xiàn)了一定程度的突破：2021年，百度發(fā)布最新版大模型ERNIE

3.0；2022年，百度發(fā)布鵬城-百度文心大模型，其參數(shù)規(guī)模達(dá)到2600億，較GPT-3參數(shù)量高50；2023年2月，百度宣布其最新的大模型“文心一言”將于三月份完成內(nèi)測(cè)，并面向公眾開放。根據(jù)IDC對(duì)國(guó)內(nèi)大模型市場(chǎng)的評(píng)估，百度文心大模型在產(chǎn)品能力、應(yīng)用能力、生態(tài)能力等方面處于全面領(lǐng)先的業(yè)界地位。百度文心大模型發(fā)展歷程

中國(guó)大模型市場(chǎng)2022年評(píng)估結(jié)果-百度文心產(chǎn)品能力L4百度：創(chuàng)新性引入大規(guī)模知識(shí)，文心大模型性能大幅提升百度，ERNIE

3.0:

LARGE-SCALE

KNOWLEDGE

ENHANCED

PRE-TRAINING

FOR

LANGUAGE

UNDERSTANDINGAND

GENERATION，消費(fèi)日?qǐng)?bào)網(wǎng)，平安證券研究所百度文心大模型擁有NLP、CV、跨模態(tài)、生物計(jì)算等大模型組合，具有產(chǎn)業(yè)級(jí)和知識(shí)增強(qiáng)兩大特點(diǎn)。文心大模型源于產(chǎn)業(yè)、服務(wù)于產(chǎn)業(yè)，可以滿足真實(shí)場(chǎng)景中的諸多應(yīng)用需求，真正發(fā)揮大模型驅(qū)動(dòng)AI規(guī)模化應(yīng)用的產(chǎn)業(yè)價(jià)值；文心大模型在海量文本數(shù)據(jù)的基礎(chǔ)上引入大規(guī)模知識(shí)圖譜，促進(jìn)了結(jié)構(gòu)化知識(shí)和無結(jié)構(gòu)化文本之間的融合與共享，模型能力大幅提升。2021年百度發(fā)布了ERNIE3.0模型，首次在百億級(jí)預(yù)訓(xùn)練中引入了大規(guī)模知識(shí)，模型學(xué)習(xí)效率和可解釋性大幅增強(qiáng)。框架方面，ERNIE3.0模型框架分為“通用表示”

和“任務(wù)表示”兩層，同時(shí)具備語言理解和語言生成兩種功能；性能方面，ERNIE

3.0刷新了54個(gè)中文NLP任務(wù)基準(zhǔn)，且其英文模型在復(fù)雜語言理解任務(wù)評(píng)測(cè)中超過了人類水平0.8個(gè)百分點(diǎn)。百度文心大模型全景圖

ERNIE3.0框架結(jié)構(gòu)8百度：“文心一言”生態(tài)建設(shè)取得進(jìn)展，具備商用拓展?jié)摿Π俣任男腘LP大模型面向語言理解、語言生成等場(chǎng)景，具備超強(qiáng)的語言理解、對(duì)話生成、文學(xué)創(chuàng)作等能力。文心NLP模型將大數(shù)據(jù)預(yù)訓(xùn)練與多源豐富知識(shí)相結(jié)合，通過持續(xù)學(xué)習(xí)，不斷吸收海量文本數(shù)據(jù)中詞匯、結(jié)構(gòu)、語義等方面的新知識(shí)，實(shí)現(xiàn)模型效果不斷進(jìn)化?！拔男囊谎裕ㄓ⑽拿篍RNIEBot）”是百度基于文心大模型技術(shù)推出的生成式對(duì)話產(chǎn)品。2023年2月7日，百度宣布將于2023年3月份發(fā)布“文心一言”，目前已經(jīng)有大量下游客戶參與文心一言的生態(tài)建設(shè)，行業(yè)覆蓋面廣泛，包括新聞、傳媒、互聯(lián)網(wǎng)、家裝、汽車、金融等，其中新聞傳媒業(yè)積極性最高，反映出“文心一言”這類AIGC產(chǎn)品將給媒體創(chuàng)作類行業(yè)帶來巨大影響。在2023

AI+工業(yè)互聯(lián)網(wǎng)高峰論壇上，百度智能云宣布“文心一言”將通過百度智能云對(duì)外提供服務(wù)，率先在內(nèi)容和信息相關(guān)的行業(yè)和場(chǎng)景落地。文心NLP大模型

“文心一言”生態(tài)合作伙伴9目錄焦點(diǎn)：ChatGPT帶火AIGC，Open

AI引領(lǐng)技術(shù)和生態(tài)1變革：AIGC與人更為神似，模型和數(shù)據(jù)是主要助力2市場(chǎng)：大模型需要大算力，推動(dòng)AI服務(wù)器市場(chǎng)增長(zhǎng)3應(yīng)用：行業(yè)將逐步回歸理性，能否突破需要看B端4投資建議及風(fēng)險(xiǎn)提示51011改變：AIGC實(shí)現(xiàn)了從分析預(yù)測(cè)到生成創(chuàng)造的跨越，AI開始更像人AIGC為人工智能技術(shù)帶來技術(shù)變革。相比于之前的分析式AI，AIGC不再局限于分析已有數(shù)據(jù)的規(guī)律，而是實(shí)現(xiàn)了從分析內(nèi)容到創(chuàng)造生成新內(nèi)容的跨越，讓AI更像人。事實(shí)上，早在2014年，隨著一種深度學(xué)習(xí)架構(gòu)生成對(duì)抗網(wǎng)絡(luò)（GAN）的出現(xiàn)，生成式AI就開始流行。但近年來，生成式AI在模型、數(shù)據(jù)、算力都大幅度提升和改進(jìn)，行業(yè)進(jìn)入爆發(fā)期，其中模型的演進(jìn)影響最為深遠(yuǎn)。NLP發(fā)展歷程騰訊研究院、CSDN2015年，基于流的生成模型(Flow

Based)；擴(kuò)散模型(Diffusion)2021年，CLIP模型2012年，卷積神經(jīng)網(wǎng)絡(luò)AlexNet2013年，變分自動(dòng)編碼（VAE）2020年，神經(jīng)輻射場(chǎng)（NeRF)2017年，Transformer模型2014年，生成對(duì)抗網(wǎng)絡(luò)（GAN）2015年，深度殘差網(wǎng)絡(luò)（ResNet)12突破|模型：預(yù)訓(xùn)練大模型Transformer助力，AIGC實(shí)現(xiàn)里程碑式飛躍資料來源：Google《Attention

All

you

Need》、CSDN、IDC&百度預(yù)訓(xùn)練大模型為生成式AI帶來里程碑式飛躍。2017年Transformer架構(gòu)的出現(xiàn)改善了循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的局限性，標(biāo)志性特征是采用了self-attention機(jī)制，可為輸入數(shù)據(jù)的各部分分配不同權(quán)重，支持GPT-3和LaMDA等大型語言模型(LLM)。Transformer模型可并行訓(xùn)練，使GPU性能改善所帶來的模型訓(xùn)練效果顯著提升，同時(shí)可以通過不斷增加模型參數(shù)量以及預(yù)訓(xùn)練使用的數(shù)據(jù)量來提升模型性能。大模型（又稱基礎(chǔ)模型）可經(jīng)過海量、多樣化數(shù)據(jù)（通常無標(biāo)注文本）的預(yù)訓(xùn)練，再針對(duì)廣泛的下游任務(wù)進(jìn)行微調(diào)或適應(yīng)。針對(duì)不同的任務(wù)和應(yīng)用場(chǎng)景，只需要將大模型遷移學(xué)習(xí)到下游任務(wù)即可實(shí)現(xiàn)，避免了傳統(tǒng)NLP技術(shù)需要從頭開始訓(xùn)練下游任務(wù)的痛點(diǎn)。Transformer模型架構(gòu)

模型所需參數(shù)量變化趨勢(shì)

訓(xùn)練大模型“預(yù)訓(xùn)練+精調(diào)”模式13突破|模型：Transformer衍生出三類模型，打下生成式AI算法的基礎(chǔ)、CSDN，平安證券研究所深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)升級(jí)引發(fā)AIGC技術(shù)開發(fā)新范式，各類預(yù)訓(xùn)練模型層出不窮，可用于NLP（諸如GTP-3)、CV(諸如Florence）或多模態(tài)領(lǐng)域（諸如Stable

Diffusion）

。以Transformer架構(gòu)為基礎(chǔ)衍生出的典型預(yù)訓(xùn)練語言模型大致可以分為三類：1）Encoder模型（以BERT為代表）：又稱自編碼模型，適用于內(nèi)容理解任務(wù)，例如需要理解輸入語義的任務(wù)，例如情感分析；2）Decoder模型（以GPT為代表）：又稱自回歸模型，適用于生成式任務(wù)，例如文本生成；3）Encoder-Decoder模型（以T5為代表）：又稱Seq2Seq模型，通常用于需要內(nèi)容理解和生成的任務(wù)，例如翻譯。Transformer模型家族時(shí)間軸

Transformer模型系列分類14突破|模型：GPT系列大模型演進(jìn)和應(yīng)用較快，最終掀起AIGC熱潮Transformer三條路線中，GPT模型進(jìn)展較快：2018年，由OpenAI提出的生成式預(yù)訓(xùn)練模型GPT誕生，提出了半監(jiān)督學(xué)習(xí)方法，即通過“預(yù)訓(xùn)練+微調(diào)”的方式讓模型通過大量無標(biāo)注數(shù)據(jù)學(xué)習(xí)，從而緩解人工標(biāo)注數(shù)據(jù)有限的問題；2019年，GPT-2去除finetune，參數(shù)量增加，采用zero-shot（零樣本）學(xué)習(xí)，模型的泛化能力提升；2020年，GPT-3采用few-shot（小樣本），并將訓(xùn)練參數(shù)又提升兩個(gè)數(shù)量級(jí)，模型準(zhǔn)確率和性能再次提升；2022年，InstructGPT在GPT-3基礎(chǔ)上采用獎(jiǎng)勵(lì)機(jī)制，通過人為標(biāo)注和強(qiáng)化學(xué)習(xí)的方法提升模型輸出結(jié)果的真實(shí)性、無害性和有用性，13億參數(shù)版本實(shí)現(xiàn)了比1750億參數(shù)版本GPT-3更好的模型性能。GPT系列模型比較知乎、AI模型發(fā)布時(shí)間模型層數(shù)詞向量維度數(shù)據(jù)量參數(shù)量說明GPT2018.612768約5GB1.17億無監(jiān)督預(yù)訓(xùn)練模型+有監(jiān)督微調(diào)無監(jiān)督預(yù)訓(xùn)練模型，去除GPT的微調(diào),架構(gòu)上改進(jìn)（將層歸一化移動(dòng)到每個(gè)子層GPT-22019.248160040GB15億的輸入并在最終的自注意力塊后增加一層歸一化，將上下文窗口大小從512增加到1024）GPT-32020.5961288845TB1750億無監(jiān)督預(yù)訓(xùn)練模型，參數(shù)量相比GPT-2提升兩個(gè)數(shù)量級(jí)，架構(gòu)上優(yōu)化（將上下文窗口大小從1024增加到2048，采用交替密度和局部帶狀稀疏注意模式）InstructGPT 2022.3 13億從預(yù)訓(xùn)練的GPT3模型開始，并在有監(jiān)督微調(diào)后通過強(qiáng)化學(xué)習(xí)加入獎(jiǎng)勵(lì)模型機(jī)制GPT-3.5 GPT3.5系列包括一系列諸如Davinci-003等模型，它們是在InstructGPT的基礎(chǔ)上構(gòu)建的ChatGPT采用GPT3.5（又名GPT3

Davinci-003）預(yù)訓(xùn)練模型，并使用RLHF微調(diào)，ChatGPT 2022.11 這與InstructGPT中大致相同，但在數(shù)據(jù)收集方面略有不同。ChatGPT也不僅只是個(gè)模型，因?yàn)樗愃朴贐lenderBot3的內(nèi)存存儲(chǔ)和檢索的擴(kuò)展。15突破|模型：文本、圖像生成是起點(diǎn)，多模態(tài)生成也正在興起ChatGPT建立在GPT-3.5大語言模型

(LLM)系列之上，并通過監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)技術(shù)進(jìn)行了微調(diào)，引入基于人類反饋的強(qiáng)化學(xué)習(xí)機(jī)制（Reinforcement

Learningfrom

Human

Feedback，RLHF）。ChatGPT能完成問答、詩(shī)歌創(chuàng)作、代碼編寫、文案寫作、翻譯等，接近真實(shí)人類的思維方式，在生成效果上取得重大突破。除了文本、代碼生成之外，圖片、視頻甚至是圖文多模態(tài)模型也都開始應(yīng)用，而且應(yīng)用規(guī)模將大幅增加。多模態(tài)大模型能夠?qū)崿F(xiàn)文本、語音、圖像、視頻等各種模態(tài)之間的融合和內(nèi)容形式生成。例如，OPENAI開發(fā)的CLIP模型可同時(shí)將文字和圖片相匹配。RLHF強(qiáng)化學(xué)習(xí)原理步驟Hugging

Face基于CLIP的對(duì)比圖文多模態(tài)預(yù)訓(xùn)練16突破|數(shù)據(jù)集：數(shù)據(jù)量、多樣性、數(shù)據(jù)質(zhì)量是關(guān)鍵要素語料庫(kù)的數(shù)據(jù)量、多樣性、數(shù)據(jù)質(zhì)量成為訓(xùn)練數(shù)據(jù)集的關(guān)鍵要素。GPT使用了包含7000本書的BookCorpus數(shù)據(jù)集；GPT-2則收集了更加廣泛、數(shù)量更多的語料組成數(shù)據(jù)集，包含800萬篇Reddit上高贊的文章網(wǎng)頁(yè)，大小為40GB，Reddit上的數(shù)據(jù)會(huì)包括各個(gè)領(lǐng)域，所以既保證了數(shù)據(jù)質(zhì)量、數(shù)量又保證了數(shù)據(jù)的多樣性;

GPT-3則采用了5種語料庫(kù)（5000億tokens），大小增至45TB；InstructGPT的預(yù)訓(xùn)練和GPT3相同，但用標(biāo)注數(shù)據(jù)和提示語進(jìn)行了微調(diào)和優(yōu)化，OPENAI雇傭了40名標(biāo)注人員（labeler）且進(jìn)行了培訓(xùn)，通過指示學(xué)習(xí)構(gòu)建訓(xùn)練樣本來訓(xùn)練獎(jiǎng)勵(lì)模型，最后通過獎(jiǎng)勵(lì)模型的打分排序來指導(dǎo)強(qiáng)化學(xué)習(xí)模型的訓(xùn)練。GPT系列模型數(shù)據(jù)集概覽知乎、GPT語料庫(kù)：

BookCorpus

數(shù)據(jù)集（7000本書）上的無監(jiān)督預(yù)訓(xùn)練，在幾個(gè)特定任務(wù)數(shù)據(jù)集上有監(jiān)督微調(diào)，

包括SNLI

、RACE、Quora等數(shù)據(jù)量：5GB語料庫(kù)：

WebTex（包含800萬個(gè)Reddit上高贊的文章網(wǎng)頁(yè)）數(shù)據(jù)量：40GB語料庫(kù)：

500B

tokens

包含CommonCrawl(410B),WebText2

(19B),

Books1

(12B),Books2(55B),Wikipedia

(3B)數(shù)據(jù)量：45TB語料庫(kù)：

預(yù)訓(xùn)練同GPT3語料庫(kù)，但用標(biāo)注數(shù)據(jù)和提示語進(jìn)行了微調(diào)和優(yōu)化SFT數(shù)據(jù)集包含13K

的prompts;RM數(shù)據(jù)集包含33K的prompts;PPO數(shù)據(jù)集包含31K的prompts?？偣?7K的數(shù)據(jù)中涉及人工標(biāo)注的有46K左右。GPT-2GPT-3InstructGPT17突破|數(shù)據(jù)集：增加數(shù)據(jù)集采樣頻率且加入人工標(biāo)注，數(shù)據(jù)質(zhì)量提升OPENAI發(fā)現(xiàn)Common

Crawl雖然包含一萬億個(gè)詞，但未經(jīng)過濾或輕微過濾的版本數(shù)據(jù)質(zhì)量偏低。鑒于此，他們參照高質(zhì)量語料將Common

Crawl的45TB數(shù)據(jù)壓縮過濾到570GB，并且添加了幾個(gè)高質(zhì)量的精選語料庫(kù)（如Wikipedia）。值得注意的是，為了得到更高質(zhì)量的訓(xùn)練數(shù)據(jù)，數(shù)據(jù)集不是按其大小成比例采樣，而是質(zhì)量更高的數(shù)據(jù)集被更頻繁地采樣。而InstructGPT與GPT-3最大的區(qū)別在于引入RLHF，訓(xùn)練SFT、RM、PPO模型的數(shù)據(jù)集既有來自API用戶的，也有來自標(biāo)注人員的。其中SFT、RM的prompts來自于在線API上的用戶使用數(shù)據(jù)以及標(biāo)注人員標(biāo)注的數(shù)據(jù)，PPO則全都是從API數(shù)據(jù)中采樣的。雖然人類標(biāo)注只有46K，但是InstructGPT對(duì)于沒見過的prompt依然有較好的泛化能力。GPT3模型數(shù)據(jù)集OPENAIInstructGPT各模型數(shù)據(jù)集大小（單位:prompts的數(shù)量）Dataset Quantity(tokens)Weightintraining

mixEpochselapsedwhentrainingfor300B

tokensCommon

Crawl 410

billion600.44(filtered)WebText219

billion222.9Books112

billion81.9Books255

billion80.43Wikipedia3

billion33.4SFT

DataRM

DataPPO

Datasplitsourcesizesplitsourcesizesplitsourcesizetrainlabeler11,295trainlabeler6,623traincustomer31,144traincustomer1,430traincustomer26,584validcustomer16,185validlabeler1,550validlabeler3,488validcustomer103validcustomer14,399目錄焦點(diǎn)：ChatGPT帶火AIGC，Open

AI引領(lǐng)技術(shù)和生態(tài)1變革：AIGC與人更為神似，模型和數(shù)據(jù)是主要助力2市場(chǎng)：大模型需要大算力，推動(dòng)AI服務(wù)器市場(chǎng)增長(zhǎng)3應(yīng)用：行業(yè)將逐步回歸理性，能否突破需要看B端4投資建議及風(fēng)險(xiǎn)提示518算力：ChatGPT是基于InstructGPT模型，大幅擴(kuò)大數(shù)據(jù)量級(jí)而得到ChatGPT模型訓(xùn)練結(jié)合了監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)，具體的訓(xùn)練方法分為三步：1）收集數(shù)據(jù)集并進(jìn)行人工標(biāo)注，輸入到GPT-3.5模型中進(jìn)行GPT-3.5模型微調(diào)，訓(xùn)練輸出一個(gè)監(jiān)督模型（SFT）；2）收集SFT模型生成的多輸出比較數(shù)據(jù)集，對(duì)諸多答案進(jìn)行排序打分（人工標(biāo)注），訓(xùn)練輸出一個(gè)獎(jiǎng)勵(lì)模型（RM）；3）利用RM模型作為獎(jiǎng)勵(lì)函數(shù)，通過PPO算法對(duì)SFT模型進(jìn)行強(qiáng)化學(xué)習(xí)，持續(xù)迭代生成模型，此過程無需人工標(biāo)注。ChatGPT模型訓(xùn)練過程19OPENAI官網(wǎng)，平安證券研究所算力：大模型的實(shí)現(xiàn)需要十分強(qiáng)大的算力來支持訓(xùn)練過程和推理過程大模型的實(shí)現(xiàn)需要十分強(qiáng)大的算力來支持訓(xùn)練過程和推理過程。根據(jù)OPENAI數(shù)據(jù)，訓(xùn)練GPT-3

175B的模型，需要的算力高達(dá)3640

PF-days（即以1PetaFLOP/s的效率要跑3640天）。2018年以來，大模型的參數(shù)量級(jí)已達(dá)到數(shù)千億參數(shù)的量級(jí)規(guī)模，對(duì)算力的需求將呈現(xiàn)指數(shù)級(jí)增長(zhǎng)。各個(gè)模型所需計(jì)算量及參數(shù)量2018-2022年大模型參數(shù)增長(zhǎng)變化趨勢(shì)資料來源：澎湃新聞，OPENAI，平安證券研究所20算力：AI芯片的性能提升成為決定大模型從理論實(shí)踐到大規(guī)模應(yīng)用的關(guān)鍵要素根據(jù)《COMPUTETRENDS

ACROSSTHREEERAS

MACHINE

LEARNING》研究結(jié)果，大模型時(shí)代，算力翻倍的需求時(shí)間是9.9個(gè)月。AI芯片的性能提升成為決定大模型從理論實(shí)踐到大規(guī)模應(yīng)用的關(guān)鍵要素。在供給端，AI芯片廠商推出了性能越來越強(qiáng)的新產(chǎn)品來應(yīng)對(duì)人工智能發(fā)展的算力需求。以英偉達(dá)為例，

2020年，英偉達(dá)推出了A100

GPU芯片，相比上一代V100

GPU芯片，A100

GPU芯片性能大幅提升。針對(duì)大模型，A100

GPU芯片相比V100

GPU芯片可提供高達(dá)3倍的訓(xùn)練速度。人工智能不同時(shí)代對(duì)算力翻倍的需求時(shí)間

英偉達(dá)A100

GPU的性能遠(yuǎn)超V100

GPU資料來源：《COMPUTE

TRENDS

ACROSSTHREE

ERAS

MACHINE

LEARNING》，英偉達(dá)官網(wǎng)，平安證券研究所21算力：ChatGPT的訓(xùn)練成本和推理成本高昂22在訓(xùn)練端：據(jù)報(bào)道，2020年，微軟宣布與OpenAI合作，建成了一臺(tái)超級(jí)計(jì)算機(jī)，專門用來在Azure公有云上訓(xùn)練超大規(guī)模的人工智能模型。這臺(tái)為OpenAI開發(fā)的超級(jí)計(jì)算機(jī)擁有超過28.5萬個(gè)CPU核心，擁有超過1萬個(gè)GPU（V100

GPU芯片）。以此規(guī)格，如果自建IDC，以A100

GPU芯片替代V100

GPU芯片，依照A100和V100的性能換算，需要約3000個(gè)A100

GPU芯片。根據(jù)英偉達(dá)網(wǎng)站信息，NVIDIA

DGX

A100服務(wù)器搭載8塊A100芯片，估算需要375臺(tái)NVIDIA

DGX

A100服務(wù)器，每臺(tái)NVIDIA

DGX

A100服務(wù)器的價(jià)格為19.9萬美元，則自建IDC的訓(xùn)練服務(wù)器的算力成本為7462.5萬美元。若在云端訓(xùn)練，據(jù)Lambda

Labs首席科學(xué)官Chuan

li介紹，擁有1750億個(gè)參數(shù)的GPT-3單次訓(xùn)練成本達(dá)到460萬美元。自建IDC的訓(xùn)練成本估算A100GPU

芯片（個(gè)）1臺(tái)NVIDIA

DGX

A100服務(wù)器搭載A100芯片個(gè)數(shù)NVIDIA

DGX

A100服務(wù)器（臺(tái)）NVIDIA

DGX

A100服務(wù)器價(jià)格（萬美元）訓(xùn)練成本（萬美元）3000837519.97462.5在推理（用戶訪問）端：ChatGPT推出僅兩個(gè)月月活用戶數(shù)已經(jīng)破億，2023年1月，全球每天約有1300萬獨(dú)立訪問者使用ChatGPT。以ChatGPT日活用戶2000萬估算，假設(shè)每天每用戶提10個(gè)問題，則每天有2億的訪問量。若自建IDC，假設(shè)每個(gè)問題平均20個(gè)字，ChatGPT在A100

GPU芯片上對(duì)每個(gè)字的響應(yīng)時(shí)間是350毫秒，則2億的訪問量需要A100芯片運(yùn)行388889個(gè)芯片小時(shí)，即每天需要16204（388889/24）個(gè)A100芯片同時(shí)工作，需要2026(16204/8)臺(tái)NVIDIA

DGXA100服務(wù)器同時(shí)工作，則自建IDC的推理服務(wù)器的算力成本為4.03億美元。若在云端推理，據(jù)《Fortune》雜志數(shù)據(jù),每次用戶與ChatGPT互動(dòng),產(chǎn)生的算力云服務(wù)成本約0.01美元，則每天2億的訪問量，對(duì)應(yīng)的云端成本為每天200萬美元。自建IDC的推理成本估算日活用戶數(shù)（萬）單用戶每日提問次數(shù)每個(gè)問題平均字?jǐn)?shù)（個(gè)）A100

GPU對(duì)每個(gè)字的響應(yīng)時(shí)間（毫秒）每日消耗GPU計(jì)算時(shí)間（小時(shí)）每天需要A100GPU芯片（個(gè)）NVIDIA

DGXA100服務(wù)器（臺(tái)）NVIDIA

DGXA100服務(wù)器價(jià)格（萬美元）推理成本（億美元）2000102035038888916204202619.94.03資料來源：澎湃新聞，環(huán)球零碳，英偉達(dá)官網(wǎng)，平安證券研究所算力：大模型將為全球和中國(guó)AI芯片和AI服務(wù)器市場(chǎng)的增長(zhǎng)提供強(qiáng)勁動(dòng)力我們認(rèn)為，隨著模型的迭代和AI芯片廠商產(chǎn)品的迭代，ChatGPT的訓(xùn)練成本和推理成本未來必將呈現(xiàn)下降趨勢(shì)。但一次訓(xùn)練百萬美元量級(jí)的訓(xùn)練成本和每天百萬美元量級(jí)的推理成本，隨著全球和中國(guó)人工智能廠商布局大模型，大模型將為全球和中國(guó)AI服務(wù)器市場(chǎng)的增長(zhǎng)提供強(qiáng)勁動(dòng)力。根據(jù)《2022年北京人工智能產(chǎn)業(yè)發(fā)展白皮書》數(shù)據(jù)，截至2022年10月，北京擁有人工智能核心企業(yè)1048家，占我國(guó)人工智能核心企業(yè)總量的29%

。以此計(jì)算，我國(guó)人工智能核心企業(yè)總數(shù)約為3614家。假設(shè)其中有2%的企業(yè)自建IDC訓(xùn)練和推理大模型，如前所述，單一企業(yè)自建IDC推理和訓(xùn)練大模型的算力成本約為4.78（4.03+0.75）億美元，以此估算，大模型將為我國(guó)AI服務(wù)器市場(chǎng)帶來約345.50億美元的市場(chǎng)空間。以2021年我國(guó)AI服務(wù)器市場(chǎng)規(guī)模占全球AI服務(wù)器市場(chǎng)規(guī)模的占比估算，則將為全球AI服務(wù)器市場(chǎng)帶來約910.44億美元的市場(chǎng)空間。市場(chǎng)空間巨大，相關(guān)芯片和服務(wù)器廠商將深度受益此次ChatGPT浪潮。資料來源：IDC，浪潮信息，平安證券研究所2021H1全球AI服務(wù)器市場(chǎng)競(jìng)爭(zhēng)格局2021年中國(guó)AI服務(wù)器市場(chǎng)競(jìng)爭(zhēng)格局2021-2025年全球AI服務(wù)器市場(chǎng)規(guī)模CAGR為19.52021-2026年中國(guó)AI服務(wù)器市場(chǎng)規(guī)模CAGR為15.823目錄焦點(diǎn)：ChatGPT帶火AIGC，Open

AI引領(lǐng)技術(shù)和生態(tài)1變革：AIGC與人更為神似，模型和數(shù)據(jù)是主要助力2市場(chǎng)：大模型需要大算力，推動(dòng)AI服務(wù)器市場(chǎng)增長(zhǎng)3應(yīng)用：行業(yè)將逐步回歸理性，能否突破需要看B端4投資建議及風(fēng)險(xiǎn)提示524AIGC將逐步回歸理性，未來2-3年重點(diǎn)培育應(yīng)用和教育市場(chǎng)未來2-3年是AIGC走向成熟的關(guān)鍵時(shí)期。類似于計(jì)算機(jī)視覺等相對(duì)成熟的技術(shù)，AIGC在經(jīng)歷了近期的炒作熱潮結(jié)束之后，預(yù)計(jì)行業(yè)將經(jīng)歷一段下沉期，市場(chǎng)趨向理性。AIGC則需要加快開始教育和融入市場(chǎng)，培育產(chǎn)品和應(yīng)用。如果能夠像計(jì)算機(jī)視覺一樣，找到合適的商業(yè)化場(chǎng)景，行業(yè)后續(xù)將逐步得到市場(chǎng)認(rèn)可，并持續(xù)做大；如果不能，這項(xiàng)技術(shù)也可能持續(xù)停留在低谷期，甚至被市場(chǎng)淘汰。ChatGPT的快速推進(jìn)，標(biāo)志著AIGC在C端有著巨大潛力，但B端、G端相關(guān)產(chǎn)品應(yīng)該將是公司的主要收入來源。C端看，主要是來自于內(nèi)容生成等工具性的需求，一般都是輕應(yīng)用，嘗鮮之后的付費(fèi)意愿值得觀察，主流的產(chǎn)品收費(fèi)模式將是SaaS應(yīng)用訂閱；B端看，是含金量最大的市場(chǎng)，需要將技術(shù)轉(zhuǎn)化成工具和解決方案，為企業(yè)和行業(yè)賦能，收費(fèi)模式可能包括項(xiàng)目定制+后續(xù)訂閱收入。生成式AI走向炒作頂峰

AIGC潛在商業(yè)模式Gartner（2022.7），平安證券研究所2526文本、代碼等應(yīng)用有望近兩年進(jìn)入快速發(fā)展期，圖像、視頻生成成熟需時(shí)日AIGC的應(yīng)用場(chǎng)景文本生成圖像生成視頻生成游戲生成根據(jù)使用場(chǎng)景，可分為非交互式文本生成和交互式文本生成。視頻生成可分為視頻編輯、視頻自動(dòng)剪輯和端到端視頻生成。醫(yī)療影像生成建筑建模創(chuàng)作游戲生成主要包括NPC生成場(chǎng)景生成自主創(chuàng)作類人聊天智能搜索文章寫作輔助輔助編程……文字生成圖片圖片編輯圖像轉(zhuǎn)圖像根據(jù)使用場(chǎng)景，可分為圖像編輯工具游戲元素生成和游和端到端圖像生成。戲策略生成。虛擬數(shù)字人劇情生成代碼編寫文本生成：應(yīng)用相對(duì)成熟，在垃圾郵件的檢測(cè)、基礎(chǔ)的問答等領(lǐng)域都得到了應(yīng)用，并在長(zhǎng)篇寫作等方面有所建樹，快速發(fā)展階段預(yù)計(jì)很快到來；后續(xù)預(yù)期在專業(yè)論文或者文學(xué)創(chuàng)作上實(shí)現(xiàn)落地；圖像生成：已經(jīng)開始應(yīng)用于產(chǎn)品設(shè)計(jì)、建筑模型，而且在醫(yī)療領(lǐng)域也實(shí)現(xiàn)應(yīng)用，但達(dá)到設(shè)計(jì)師等專業(yè)人士的水平，還有差距；視頻、游戲生成：目前還處在早期嘗試階段，如實(shí)現(xiàn)電子游戲和電影的個(gè)性化創(chuàng)作，可能需要等待較長(zhǎng)時(shí)間。長(zhǎng)視頻生成動(dòng)畫制作視頻自動(dòng)編輯短視頻生成文字生成視頻AIGC在不同場(chǎng)景中的發(fā)展預(yù)期資料來源：紅杉資本、平安證券研究所27國(guó)內(nèi)AIGC垂直應(yīng)用起步較晚，文本、圖像等領(lǐng)域都還是藍(lán)海賽道國(guó)內(nèi)AIGC主要賽道參與企業(yè)相較美國(guó)市場(chǎng)，國(guó)內(nèi)AIGC在相對(duì)成熟的賽道上參與者也不是很多，這和之前的預(yù)測(cè)性AI趨于紅海的市場(chǎng)有著很大的差異。一方面，國(guó)內(nèi)在算法和應(yīng)用開發(fā)上存在差距，同時(shí)公有云SaaS發(fā)展不足帶來的訓(xùn)練數(shù)據(jù)質(zhì)量和應(yīng)用通用性較差，限制了國(guó)內(nèi)應(yīng)用的大面積鋪開；另一方面，國(guó)內(nèi)B端為應(yīng)用付費(fèi)的意愿，尤其是AIGC這類新應(yīng)用付費(fèi)的意愿并不夠強(qiáng)，反而是國(guó)內(nèi)一些To

C的賽道發(fā)展的更好一點(diǎn)。從趨勢(shì)上看，AIGC最終的市場(chǎng)依然是B端，但是考慮到中美市場(chǎng)的差異，國(guó)內(nèi)企業(yè)依靠單一通用應(yīng)用去打所有市場(chǎng)的可能性比較小，需要通過垂直化、行業(yè)定制化的開發(fā)AIGC方案，早期可能只面向1個(gè)或者幾個(gè)行業(yè)賽道，有積累之后持續(xù)拓展其他行業(yè)。美國(guó)AIGC主要賽道參與企業(yè)（不完全統(tǒng)計(jì)）資料來源：百度、平安證券研究所28文本生成：通過營(yíng)銷文案、摘要、故事生成引擎，賦能文創(chuàng)、金融等行業(yè)功能：輸入結(jié)構(gòu)化的數(shù)據(jù)、圖片或者文本來生成一段新的文本。例如輸入結(jié)構(gòu)化的數(shù)據(jù)、輸入一張圖片，或者輸入若干關(guān)鍵詞來生成文本。目前主要功能是生成可控文本，即文本中帶有期望得到的屬性，比如情感、關(guān)鍵詞、事實(shí)以及主題等。應(yīng)用：營(yíng)銷文案引擎、文章摘要、故事生成、散文小說、文本復(fù)述、研報(bào)生成。挑戰(zhàn)：對(duì)篇章結(jié)構(gòu)、多樣性的可控；長(zhǎng)文本生成面臨的前后邏輯不一致、主題不一致以及事實(shí)不一致等問題。國(guó)內(nèi)文本生成典型解決方案國(guó)內(nèi)文本生成主要應(yīng)用場(chǎng)景及功能場(chǎng)景功能描述應(yīng)用實(shí)例文化創(chuàng)作、快消基于關(guān)鍵詞生成輸入關(guān)鍵詞句，將圍繞關(guān)鍵詞生成具有指定風(fēng)格特色的原創(chuàng)內(nèi)容中文在線：利用文本生成平臺(tái)進(jìn)行輔助創(chuàng)作自定義模板生成用戶輸入文本并標(biāo)注出待補(bǔ)全部分，模型基于用戶輸入進(jìn)行內(nèi)容補(bǔ)全續(xù)寫根據(jù)用戶選擇的題材和輸入的前序文本進(jìn)行續(xù)寫營(yíng)銷文本生成輸入品牌、核心賣點(diǎn)、應(yīng)用場(chǎng)景等關(guān)鍵詞，生成營(yíng)銷文案美妝、汽車等行業(yè)已經(jīng)開始有應(yīng)用金融行業(yè)研報(bào)觀點(diǎn)分析自動(dòng)抽取研報(bào)中的觀點(diǎn)內(nèi)容，并輸出觀點(diǎn)標(biāo)簽及觀點(diǎn)極性。華夏基金：輿情監(jiān)測(cè)。重點(diǎn)解決傳統(tǒng)工具關(guān)鍵字判斷準(zhǔn)確度低、情緒判斷和業(yè)務(wù)需求不一致、大量重復(fù)信息干擾、無法識(shí)別輿情對(duì)象等問題。金融文本情感分析對(duì)金融、財(cái)經(jīng)領(lǐng)域中文本的情感傾向進(jìn)行分析判斷，有效賦能金融財(cái)經(jīng)領(lǐng)域信息分析以及處理。事件檢測(cè)從新聞中檢測(cè)金融相關(guān)事件，用于分析和決策。資料來源：瀾舟科技、平安證券研究所29圖片/視頻生成：能力提升明顯，C端認(rèn)知需提升但B端潛力較大功能：通過AI技術(shù)來自動(dòng)或輔助生成內(nèi)容的生產(chǎn)方式，通過輸入指令，讓AI去完成冗雜的代碼、繪圖、建模等任務(wù)，實(shí)現(xiàn)“圖生圖”或者“文生圖”的模式，生成新的圖片/視頻。在開源公司StabilityAI發(fā)布了Vincent的圖形模型StableDiffusion之后，AIGC圖片生成能力顯著提高。商業(yè)模式：C端客戶目前需求更為復(fù)雜，AIGC在技術(shù)上還存在差距，目前很難有大的商業(yè)機(jī)會(huì)，業(yè)內(nèi)企業(yè)6Pen調(diào)研數(shù)據(jù)顯示，60%用戶不曾付費(fèi)，付費(fèi)超過100元的比重也只有10%，市場(chǎng)拓展還需要時(shí)日；B端客戶變現(xiàn)的可能性會(huì)更高，垂直客戶需求相對(duì)聚焦，變現(xiàn)路徑也更為多元和成熟，比如廣告、營(yíng)銷、文旅等行業(yè)，預(yù)計(jì)都會(huì)有較大的空間。2023/2/28行業(yè)應(yīng)用方式應(yīng)用實(shí)例廣告行業(yè)利用AI制作宣傳材料百度利用文心平臺(tái)制作電視劇宣傳海報(bào)，騰訊、美圖也在進(jìn)入該賽道設(shè)計(jì)行業(yè)建筑、包裝、服飾等設(shè)計(jì)出圖ZMO.AI通過生成高質(zhì)量的模特兒照片圖片，降低拍照成本和等待時(shí)間營(yíng)銷定制生成圖片或者視頻材料百家號(hào)、剪映開放圖文轉(zhuǎn)視頻功能可以進(jìn)行個(gè)性化的創(chuàng)作漫畫/動(dòng)漫行業(yè)配文生成漫畫、插畫和視頻國(guó)內(nèi)藝術(shù)家基于小說《2086元宇宙》制作漫畫版，形成可視版本游戲行業(yè)輔助角色、道具、場(chǎng)景設(shè)計(jì)網(wǎng)易推出首個(gè)游戲版ChatGPT將會(huì)在《逆水寒》手游，國(guó)內(nèi)圖片/視頻生成典型應(yīng)用場(chǎng)景利用AIGC生成的繪畫、海報(bào)和手游資料來源：觀研天下、網(wǎng)易、平安證券研究所30類人聊天機(jī)器人：AIGC應(yīng)用集大成者，已從形似開始走向神似類人聊天機(jī)器人及頭部廠商類人聊天機(jī)器人是一種旨在模擬與用戶進(jìn)行類人對(duì)話的電腦程序。它們已被應(yīng)用于多個(gè)行業(yè)，包括客戶服務(wù)、電子商務(wù)和娛樂等。chatGPT帶來的變革：此前的聊天機(jī)器人只能根據(jù)設(shè)定問題回復(fù)固定內(nèi)容，同chatGPT融合之后，將文本生成、圖像生成、多模態(tài)轉(zhuǎn)換技術(shù)融合起來，環(huán)境感知、理解能力在大幅增強(qiáng)，實(shí)現(xiàn)和人的形似到神似?；赾hatGPT的類人聊天機(jī)器人可以提供客戶服務(wù)、虛擬代理、內(nèi)容創(chuàng)意和文本生成、以及信息知識(shí)提供等服務(wù)。國(guó)外重點(diǎn)企業(yè)：-

openAI：公司核心宗旨在于“實(shí)現(xiàn)安全的通用人工智能(AGI)”，目前推出的“chatGPT類人聊天機(jī)器人”火爆全球，其公司在圖片生成和視頻生成的應(yīng)用上也有很深的造詣。-

Google:

公司在AIGC領(lǐng)域布局很久，目前也有“bard”類人聊天機(jī)器人的誕生試用，在AIGC的多種技術(shù)領(lǐng)域也處于前列。國(guó)內(nèi)重點(diǎn)企業(yè)：百度：是國(guó)內(nèi)布局AI賽道最早的公司之一，目前已宣布“文心一言”類人聊天機(jī)器人將很快進(jìn)入公測(cè)環(huán)節(jié)，圖片生成方面也有突破。小冰：從微軟獨(dú)立拆分出來的人工智能公司，推出的“小冰”機(jī)器人是目前全球范圍內(nèi)承載交互量最大的人工智能系統(tǒng)。類人聊天機(jī)器人的多種應(yīng)用場(chǎng)景—以chatGPT為例智能搜索引擎新聞寫稿機(jī)器人chatGPT類人聊天機(jī)器人文本生成信息提供系統(tǒng)創(chuàng)意內(nèi)容生成虛擬代理客戶服務(wù)虛擬數(shù)字人虛擬主播電商智能客服金融資訊客服信息整合工具數(shù)字教育資源營(yíng)銷文案生成影視劇本生成31類人聊天機(jī)器人|新聞寫稿：應(yīng)用起步較早，大幅提升寫作效率利用AIGC技術(shù)參與新聞寫稿輔助工作，各家新聞機(jī)構(gòu)起步均較早，2015年以來國(guó)外包括紐約時(shí)報(bào)、彭博都已經(jīng)開始應(yīng)用，國(guó)內(nèi)隨后也在做相關(guān)投入，比如新華社的“快筆小新”、第一財(cái)經(jīng)與阿里巴巴合作開發(fā)了“DT稿王”、南方都市報(bào)與北京大學(xué)團(tuán)隊(duì)合作研發(fā)的寫稿機(jī)器人“小南”等。AI機(jī)器人可以幫助精確檢索二手信息，收集素材。在高性能的AIGC工具如ChatGPT出現(xiàn)后，就可以像常人對(duì)話一樣直接提問并獲得答案。另外AIGC轉(zhuǎn)寫工具可以幫助記者實(shí)時(shí)生成文稿，自動(dòng)撰寫提綱、精簡(jiǎn)語句等，進(jìn)而提高工作效率，保證最終產(chǎn)出的時(shí)效性。目前AIGC撰稿工具能在一分鐘內(nèi)生成兩千條新聞，且單條質(zhì)量可比擬人類半小時(shí)的作品質(zhì)量。尤其是針對(duì)股市、重大體育賽事等新聞，會(huì)在關(guān)鍵時(shí)間點(diǎn)自動(dòng)撰寫新聞，編輯只需要做最終審校就可以發(fā)出，大幅提升了新聞的時(shí)效性，降低了編輯的工作量。目前AI機(jī)器人主要在財(cái)經(jīng)、體育和生活類等新聞中出場(chǎng)，深度、調(diào)查報(bào)告等還需要人類記者完成，后續(xù)隨著技術(shù)的進(jìn)步，應(yīng)用面將拓寬。國(guó)內(nèi)代表性的機(jī)器人記者方案新聞寫稿機(jī)器人重點(diǎn)功能應(yīng)用功能具體應(yīng)用文本復(fù)述/改寫對(duì)原有文本進(jìn)行改寫，觀點(diǎn)一致，但寫作風(fēng)格和表達(dá)多樣語音交互通過口述查詢，自動(dòng)生成稿件，通過ChatGPT技術(shù)可以實(shí)現(xiàn)智能問答看圖寫話圖片、視頻的自動(dòng)生成。根據(jù)給定的圖片或者視頻，自動(dòng)生成可以描述圖片或者視頻內(nèi)容的稿件，類似于“看圖寫話”或是“看視頻寫話”。視頻寫稿根據(jù)現(xiàn)有文字提取摘要和關(guān)鍵詞，快速生成對(duì)應(yīng)的短視頻稿件。對(duì)編輯填寫的文本信息進(jìn)行語義分析，得到摘要與關(guān)鍵詞，并自動(dòng)搜索資源庫(kù)匹配關(guān)聯(lián)性最強(qiáng)的圖片、視頻、音頻素材，自動(dòng)制作成一段視頻智能模板生成通過持續(xù)訓(xùn)練，根據(jù)不同的內(nèi)容要求，自動(dòng)生成模板資料來源：搜狐網(wǎng)、新華網(wǎng)等、平安證券研究所32類人聊天機(jī)器人|虛擬數(shù)字人：形似到神似，活躍于客服、新聞制播等多個(gè)場(chǎng)景虛擬數(shù)字人是AIGC的重要應(yīng)用之一，利用人像、聲音生成等技術(shù)，可以定制2D、3D的虛擬數(shù)字人，可以實(shí)現(xiàn)文本到視頻的輸出。目前，AIGC在該領(lǐng)域應(yīng)用更為成熟，智能化水平更高，輸出結(jié)果更為靈活和應(yīng)景，交流更為順暢，實(shí)現(xiàn)了從形似到神似的跨越。目前市場(chǎng)上的虛擬數(shù)字人可以充當(dāng)虛擬客服、數(shù)字員工、虛擬老師、虛擬主播、數(shù)字導(dǎo)游等角色，應(yīng)用于金融、傳媒、旅游、電子政務(wù)等多個(gè)場(chǎng)景，提供客戶服務(wù)和交互、課程制作、新聞制播、政務(wù)服務(wù)和查詢等多方面的功能，大幅提升了內(nèi)容制作輸出效率，保證了用戶的服務(wù)體驗(yàn)。目前，科大訊飛等人工智能企業(yè)，均提供了虛擬數(shù)字人的解決方案。虛擬數(shù)字人制作流程虛擬數(shù)字人當(dāng)前面向的場(chǎng)景金融業(yè)新聞媒體數(shù)字員工電子政務(wù)旅游景點(diǎn)資料來源：科大訊飛、平安證券研究所33落地案例|游戲：AIGC與游戲賽道天然親和，數(shù)據(jù)資產(chǎn)生產(chǎn)等應(yīng)用將加速?gòu)S商產(chǎn)品應(yīng)用情況通過強(qiáng)化學(xué)習(xí)的方法來模仿真實(shí)玩家，包括發(fā)育、騰訊“絕悟”陪玩機(jī)器人運(yùn)營(yíng)、協(xié)作等指標(biāo)類別，以及每分鐘手速、技能釋放頻率、命中率、擊殺數(shù)等具體參數(shù)，讓AI更接近正式服玩家真實(shí)表現(xiàn)，將測(cè)試的總體準(zhǔn)確性提升到95%。rct

A智能NPC生成、劇情延展、智能Q&A、智能陪玩等智能NPC為例，其NPC能夠分析玩家的實(shí)時(shí)輸入，并動(dòng)態(tài)地生成交互反應(yīng)，從而構(gòu)建幾乎無限目不重復(fù)的劇情，增強(qiáng)自戶體驗(yàn)并延長(zhǎng)游戲生命周期。網(wǎng)易游戲智能NPC、玩家智能對(duì)話武俠手游《逆水寒》宣布實(shí)裝國(guó)內(nèi)首個(gè)游戲版ChatGPT，讓智能NPC能和玩家自由生成對(duì)話，并基于對(duì)話內(nèi)容，自主給出有邏輯的行為反饋。該手游已經(jīng)獲得版號(hào)，預(yù)計(jì)將于2023年年內(nèi)上線。行者AI游戲資產(chǎn)生成為游戲生成2D圖片、3D

環(huán)境、單體建筑、人物角色模型、虛擬數(shù)字人等復(fù)雜內(nèi)容生成。游戲是典型的資產(chǎn)復(fù)雜度非常高的娛樂形式，人力密集，研發(fā)人員持續(xù)膨脹，質(zhì)量、成本、效率不可能三角問題難解。AIGC與游戲具有天然的適配性，在圖片/視頻生成、虛擬玩家、音樂制作、劇情/策略開發(fā)等方面都有非常大的潛力，而且娛樂場(chǎng)景來自監(jiān)管、倫理、安全性等方面的壓力較小，落地較快。目前，AIGC正在為游戲中的數(shù)據(jù)資產(chǎn)建立模型，開發(fā)智能對(duì)話、智能陪玩、智能QA，并能夠通過劇情和策略生成等方式，豐富和延展游戲內(nèi)容，延展游戲壽命。通過AI生成，可以降低生產(chǎn)成本，提高效率，還能保證游戲質(zhì)量不下降，完美解決不可能三角問題。AIGC在游戲資產(chǎn)生成過程中的應(yīng)用

AIGC在國(guó)內(nèi)外落地案例資料來源：行者AI、平安證券研究所34落地案例|銀行：通過數(shù)字員工等形式試水AIGC，監(jiān)管、安全性問題需關(guān)注機(jī)構(gòu)AIGC技術(shù)應(yīng)用進(jìn)展寧波銀行開發(fā)了數(shù)字員工小寧，用于智慧大堂服務(wù)和線上營(yíng)銷等場(chǎng)景。工商銀行開發(fā)了數(shù)字員工工小智，提供線下支行網(wǎng)點(diǎn)大堂服務(wù)，進(jìn)行產(chǎn)品介紹和營(yíng)銷。郵儲(chǔ)銀行將開始內(nèi)測(cè)文心一言，在智能客服、數(shù)字員工、虛擬營(yíng)業(yè)廳等場(chǎng)景進(jìn)行應(yīng)用，進(jìn)一步提升客戶體驗(yàn)。江蘇銀行嘗試運(yùn)用ChatGPT技術(shù)提升軟件開發(fā)生產(chǎn)力。招商銀行在智能客服、流程智能化等方面，廣泛應(yīng)用了大模型技術(shù)用于意圖識(shí)別、信息提取等具體工作。百信銀行把百度文心一言的智能對(duì)話技術(shù)成果應(yīng)用在數(shù)字金融、AI數(shù)字人、數(shù)字營(yíng)業(yè)廳等領(lǐng)域。中信銀行將接入文心一言生態(tài)，在財(cái)富管理等場(chǎng)景嘗試應(yīng)用。興業(yè)銀行接入文心一言，用于智慧網(wǎng)點(diǎn)、智能服務(wù)、智能風(fēng)控、智能運(yùn)營(yíng)、智能營(yíng)銷、智能投研等。銀行是作為服務(wù)業(yè)的重點(diǎn)領(lǐng)域，數(shù)據(jù)豐富且質(zhì)量?jī)?yōu)秀，也是與AI融合的比較快的領(lǐng)域。此前，AI營(yíng)銷文案生成、數(shù)字員工（客服）等解決方案已經(jīng)得到應(yīng)用，承擔(dān)問題應(yīng)答、業(yè)務(wù)操作指引、查詢響應(yīng)和確權(quán)等職能。隨著ChatGPT的火爆，各家銀行正在探索AIGC進(jìn)一步為虛擬數(shù)字員工賦能，提升智能化水平，在內(nèi)外部溝通等環(huán)節(jié)中發(fā)揮更重要的作用。在銀行線下網(wǎng)點(diǎn)，數(shù)字員工就充當(dāng)“服務(wù)型數(shù)字人”的角色，提升大堂的服務(wù)效率和服務(wù)質(zhì)量；線上業(yè)務(wù)可能將是各大銀行未來利用數(shù)字員工爭(zhēng)奪的重點(diǎn)，會(huì)強(qiáng)調(diào)”數(shù)字人“IP的打造，樹立起銀行在虛擬世界的品牌形象，實(shí)現(xiàn)客戶的轉(zhuǎn)化，很多銀行已經(jīng)將數(shù)字員工應(yīng)用到線上的營(yíng)銷推廣中。后續(xù)，AIGC處理復(fù)雜問題和創(chuàng)造性問題的能力也將持續(xù)提高，銀行業(yè)應(yīng)用面臨的監(jiān)管、安全性等問題也將逐步得到解決，AIGC在銀行領(lǐng)域的應(yīng)用范圍將擴(kuò)大。除了當(dāng)前正在應(yīng)用的客戶服務(wù)、營(yíng)銷運(yùn)營(yíng)和數(shù)字員工之外，未來在風(fēng)險(xiǎn)管控、經(jīng)營(yíng)態(tài)勢(shì)分析等領(lǐng)域也會(huì)有較大的應(yīng)用潛力。主要銀行機(jī)構(gòu)AIGC應(yīng)用情況

銀行機(jī)構(gòu)數(shù)字員工典型應(yīng)用對(duì)外對(duì)外場(chǎng)景包括存、貸、匯、監(jiān)等一系列金融業(yè)務(wù)服務(wù)：網(wǎng)點(diǎn)客戶服務(wù)、交流結(jié)合用戶特征定制專屬方案，成為客戶的“專屬顧問”，并在交互過程中識(shí)別用戶情感，通過話術(shù)激發(fā)用戶興趣、引導(dǎo)用戶選擇產(chǎn)品在用戶不感興趣時(shí)進(jìn)行挽留、適時(shí)推薦其他產(chǎn)品，充分給予用戶優(yōu)質(zhì)體驗(yàn)。對(duì)內(nèi)場(chǎng)景，數(shù)字員工可以充當(dāng)智慧助手：解答員工問題，及時(shí)提醒待辦日程，快速辦理日常事務(wù)，提升員工幸福感為員工制定專屬的崗位培訓(xùn)計(jì)劃，提供專業(yè)的職業(yè)發(fā)展建議，加速員工成長(zhǎng)HR的“分析助手”，對(duì)員工數(shù)據(jù)進(jìn)行整合挖掘，形成員工畫像和關(guān)系圖譜，協(xié)助HR評(píng)估員工能力、調(diào)優(yōu)人員配置對(duì)內(nèi)資料來源：《金融電子化》、工商銀行等、平安證券研究所目錄焦點(diǎn)：ChatGPT帶火AIGC，Open

AI引領(lǐng)技術(shù)和生態(tài)1變革：AIGC與人更為神似，模型和數(shù)據(jù)是主要助力2市場(chǎng)：大模型需要大算力，推動(dòng)AI服務(wù)器市場(chǎng)增長(zhǎng)3應(yīng)用：行業(yè)將逐步回歸理性，能否突破需要看B端4投資建議及風(fēng)險(xiǎn)提示535投資建議及風(fēng)險(xiǎn)提示36投資建議：近年來AIGC的算法、數(shù)據(jù)質(zhì)量等要素有著顯著提升，文本、圖片/視頻、代碼等技術(shù)能力快速發(fā)展，在客服、營(yíng)銷、游戲等賽道都顯示出非常強(qiáng)的應(yīng)用潛力。伴隨著chatGPT的催化，國(guó)內(nèi)AIGC產(chǎn)業(yè)鏈也將迎來空前的市場(chǎng)機(jī)會(huì)。算法方面，預(yù)計(jì)今年國(guó)內(nèi)龍頭AI廠商有希望推出能力接近c(diǎn)hatGPT的產(chǎn)品；算力是短板，由于供應(yīng)鏈的問題，我國(guó)高端訓(xùn)練芯片供給可能面對(duì)較大的壓力，AI算力不足的問題可能顯現(xiàn)，相關(guān)設(shè)備研發(fā)和基礎(chǔ)設(shè)施建設(shè)企業(yè)可能繼續(xù)受益。同時(shí)，AIGC新技術(shù)也會(huì)帶來新的安全挑戰(zhàn)，國(guó)產(chǎn)安全廠商也將受益。強(qiáng)烈推薦啟明星辰，推薦科大訊飛、金山辦公、中科曙光、浪潮信息、紫光股份等；關(guān)注AI廠商后續(xù)發(fā)展機(jī)會(huì)，如云從科技、海天瑞聲、云天勵(lì)飛（待上市，已同意注冊(cè)）。風(fēng)險(xiǎn)提示：1）技術(shù)落地可能不及預(yù)期。目前chatGPT處于市場(chǎng)炒作高點(diǎn)，未來將面臨著市場(chǎng)落地的考驗(yàn)，由于技術(shù)本身尚需持續(xù)完善，能否跨越商業(yè)化的“死亡之谷”仍待觀察。2）來自監(jiān)管和版權(quán)方面的風(fēng)險(xiǎn)。AIGC生成內(nèi)容還主要依賴現(xiàn)有素材，可能產(chǎn)生版權(quán)糾紛，同時(shí)生成內(nèi)容版權(quán)的認(rèn)定還存在爭(zhēng)議，商業(yè)化可能面臨障礙；在一些特定場(chǎng)景，AIGC可能受到監(jiān)管的限制；3）國(guó)內(nèi)AI供應(yīng)鏈斷裂的風(fēng)險(xiǎn)?？赡艹霈F(xiàn)芯片、軟件和算法等供給限制更為嚴(yán)格的情況，國(guó)內(nèi)研發(fā)和商業(yè)化可能受到?jīng)_擊。重點(diǎn)推薦標(biāo)的37股票簡(jiǎn)稱股票代碼2月27日EPS（元）PE（倍）評(píng)級(jí)收盤價(jià)（元）2021A2022E2023E2024E2021A2022E2023E2024E啟明星辰002439.SZ28.680.900.921.231.5731.931.223.318.3強(qiáng)烈推薦科大訊飛002230.SZ47.790.670.250.710.9571.3191.267.350.3推薦金山辦公688111.SH288.712.262.423.424.73127.7119.384.461.0推薦浪潮信息000977.SZ37.241.371.632.002.4727.222.818.615.1推薦紫光股份000938.SZ24.480.750.861.071.3332.628.522.918.4推薦中科曙光603019.SH31.410.791.021.311.6439.830.824.019.2推薦重點(diǎn)標(biāo)的｜科大訊飛——智能語音領(lǐng)軍企業(yè)科大訊飛成立于1999年，是亞太地區(qū)知名的智能語音和人工智能企業(yè)。公司作為技術(shù)創(chuàng)新型企業(yè)，其智能語音、自然語言理解、計(jì)算機(jī)視覺等核心技術(shù)處于國(guó)際領(lǐng)先水平，已入駐“中國(guó)人工智能國(guó)家隊(duì)”。公司以“平臺(tái)+賽道”戰(zhàn)略為指引，2B+2C雙輪驅(qū)動(dòng)產(chǎn)品落地。公司構(gòu)建了以智能語音和人機(jī)交互為核心的“訊飛開放平臺(tái)”，并在此基礎(chǔ)上推動(dòng)產(chǎn)品及服務(wù)在消費(fèi)者、智慧教育、智慧城市、智慧司法、智能汽車、智慧醫(yī)療、運(yùn)營(yíng)商等領(lǐng)域的深度應(yīng)用。截至2022年5月31日，訊飛開放平臺(tái)已開放493項(xiàng)AI產(chǎn)品及能力，聚集超過337.3萬開發(fā)者團(tuán)隊(duì)，總應(yīng)用數(shù)超過150.1萬，累計(jì)覆蓋終端設(shè)備數(shù)35.1億+。公司營(yíng)收及歸母凈利潤(rùn)情況公司AI產(chǎn)品全棧布局資料來源：公司官網(wǎng)，WIND2022年前三季度，公司實(shí)現(xiàn)營(yíng)業(yè)收入126.61億元（+16.50

）；實(shí)現(xiàn)歸母凈利潤(rùn)4.20億元（-42.34

）；EPS為0.18元。預(yù)計(jì)20

人人文庫(kù)> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

ChatGPT火爆出圈AI算力和行業(yè)應(yīng)用潛力巨大

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔