版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
3目錄焦點(diǎn):ChatGPT帶火AIGC,Open
AI引領(lǐng)技術(shù)和生態(tài)1變革:AIGC與人更為神似,模型和數(shù)據(jù)是主要助力2市場(chǎng):大模型需要大算力,推動(dòng)AI服務(wù)器市場(chǎng)增長(zhǎng)3應(yīng)用:行業(yè)將逐步回歸理性,能否突破需要看B端4投資建議及風(fēng)險(xiǎn)提示54焦點(diǎn):憑借AIGC爆款應(yīng)用ChatGPT,Open
AI強(qiáng)勢(shì)出圈2022年11月30日,由OpenAI開發(fā)的聊天機(jī)器人ChatGPT推出并席卷了整個(gè)行業(yè),短短5天,注冊(cè)用戶數(shù)就超過100萬,僅兩個(gè)月月活用戶數(shù)已經(jīng)破億。2023年1月,全球每天約有1300萬獨(dú)立訪問者使用ChatGPT。ChatGPT擁有強(qiáng)大的語言理解和文本生成能力,能夠很好地支持聊天對(duì)話、代碼撰寫、文案創(chuàng)作等任務(wù)。與之前的AI聊天機(jī)器人相比,ChatGPT能夠理解上下文并給出合理的回復(fù),對(duì)話連續(xù)性大幅提升,可以稱為人工智能發(fā)展史上的劃時(shí)代產(chǎn)品。憑借著ChatGPT的成功,Open
AI成為全球AI行業(yè)關(guān)注的焦點(diǎn)。各軟件用戶數(shù)達(dá)到100萬所用的時(shí)間
ChatGPT寫詩(shī)、評(píng)論和代碼生成等樣例Statista、百度百科OPEN AI:GPT模型技術(shù)領(lǐng)先,ChatGPT發(fā)布引發(fā)變革百度百科20152023201620182020開放人工智能應(yīng)用接口2017201920222021微軟投資OPAN
AI
10億美元發(fā)布ProximalPolicy
Optimization算法發(fā)布OPEN
AI憲章發(fā)布DELL
E2發(fā)布ChatGPTOPEN
AI發(fā)布發(fā)布發(fā)布發(fā)布研究人工神經(jīng)網(wǎng)絡(luò)發(fā)布ChatGPT成立UniverseGPT-1GPT-2GPT-3中的多模式神經(jīng)元InstructGPT月活用戶超1億AIGC(AI
Generated
Content)是人工智能生成內(nèi)容,也稱為生成式AI,涉及無監(jiān)督和半監(jiān)督學(xué)習(xí)算法,能夠使計(jì)算機(jī)用先前創(chuàng)建的內(nèi)容(諸如文本、音頻、視頻、圖像和代碼等)來生成新的內(nèi)容,以此響應(yīng)用戶輸入的提示語。OPEN
AI是全球領(lǐng)先的AIGC公司。OPEN
AI成立于2015年,其最初定位為“非盈利性研究機(jī)構(gòu)”,2018年,OPAN
AI發(fā)布了GPT-1模型,2019年,公司改制為“有上限的盈利性機(jī)構(gòu)”,并于同年發(fā)布GPT-2模型;2022年3月,OPAN
AI發(fā)布InstructGPT模型;2022年11月,OPENAI發(fā)布ChatGPT。此外,公司還擁有自然語言轉(zhuǎn)圖片的應(yīng)用DELL
E2。OPEN
AI發(fā)展歷程5OPEN
AI:微軟持續(xù)提供資金、算力和生態(tài)支持,助力成就爆款美國(guó)財(cái)富雜志,平安證券研究所Azure超級(jí)計(jì)算機(jī)賦能OPEN
AI計(jì)算資源軟件應(yīng)用微軟高度重視人工智能領(lǐng)域,在資金投入、計(jì)算資源、應(yīng)用開發(fā)等方面與OPEN
AI形成了密切的合作關(guān)系,兩者優(yōu)勢(shì)互補(bǔ)、合作共贏。資金投入:2019年,微軟向OPEN
AI投資10億美元;2021年,微軟再次向OPEN
AI投資,數(shù)額未披露;2023年1月,微軟宣布將通過一項(xiàng)花費(fèi)數(shù)年、數(shù)十億美金的投資深化與OPEN
AI的合作,根據(jù)美國(guó)財(cái)富雜志信息,該投資可能高達(dá)100億美元。計(jì)算資源:微軟Azure是OPEN
AI的獨(dú)家云供應(yīng)商,且微軟將加大在超級(jí)計(jì)算機(jī)方面的投資以支持OPEN
AI的發(fā)展,同時(shí)OPEN
AI也可以反哺增強(qiáng)微軟Azure的AI能力,兩者能夠很好的合作共贏。應(yīng)用開發(fā):2月8日,微軟推出基于OPEN
AI模型的Edge瀏覽器和Bing搜索引擎,且微軟表示未來所有產(chǎn)品將全線整合ChatGPT,包括Office三件套、Azure云服務(wù)、企業(yè)定制版產(chǎn)品等。微軟投資OPEN
AI歷史
OPEN
AI與微軟在計(jì)算資源、應(yīng)用開發(fā)方面的合作關(guān)系Microsoft2019MicrosoftOpen
AI610億$2021未披露2023數(shù)十億$投資百度:文心大模型國(guó)內(nèi)全面領(lǐng)先,有望打造成國(guó)產(chǎn)ChatGPT20192023202020212022發(fā)布發(fā)布ERNIE3.0模型,構(gòu)建通用語義表示和任務(wù)語義表示框架發(fā)布鵬城-百度文心大模型,為全球首個(gè)知識(shí)增強(qiáng)型千億級(jí)模型應(yīng)用至百度搜索業(yè)務(wù)發(fā)布ERNIE3.0
Zeus模型發(fā)布ERNIE2.0模型,提出持續(xù)學(xué)習(xí)ERNIE1.0模型
語義理解框架將推出“文心一言”L1L2L3L1L2L3L1L2L3L4生態(tài)能力百度,IDC7百度文心大模型平均分應(yīng)用能力注:目前尚未有廠商在產(chǎn)品能力和生態(tài)能力方面達(dá)到L5,應(yīng)用能力尚未有廠商達(dá)到L4百度在大模型領(lǐng)域擁有較強(qiáng)的技術(shù)實(shí)力和平臺(tái)積累,其文心大模型總體位于行業(yè)前列。2019年3月,百度首次發(fā)布預(yù)訓(xùn)練模型ERNIE1.0,之后針對(duì)大模型的技術(shù)創(chuàng)新與產(chǎn)業(yè)應(yīng)用持續(xù)發(fā)力,目前已經(jīng)實(shí)陸續(xù)實(shí)現(xiàn)了一定程度的突破:2021年,百度發(fā)布最新版大模型ERNIE
3.0;2022年,百度發(fā)布鵬城-百度文心大模型,其參數(shù)規(guī)模達(dá)到2600億,較GPT-3參數(shù)量高50;2023年2月,百度宣布其最新的大模型“文心一言”將于三月份完成內(nèi)測(cè),并面向公眾開放。根據(jù)IDC對(duì)國(guó)內(nèi)大模型市場(chǎng)的評(píng)估,百度文心大模型在產(chǎn)品能力、應(yīng)用能力、生態(tài)能力等方面處于全面領(lǐng)先的業(yè)界地位。百度文心大模型發(fā)展歷程
中國(guó)大模型市場(chǎng)2022年評(píng)估結(jié)果-百度文心產(chǎn)品能力L4百度:創(chuàng)新性引入大規(guī)模知識(shí),文心大模型性能大幅提升百度,ERNIE
3.0:
LARGE-SCALE
KNOWLEDGE
ENHANCED
PRE-TRAINING
FOR
LANGUAGE
UNDERSTANDINGAND
GENERATION,消費(fèi)日?qǐng)?bào)網(wǎng),平安證券研究所百度文心大模型擁有NLP、CV、跨模態(tài)、生物計(jì)算等大模型組合,具有產(chǎn)業(yè)級(jí)和知識(shí)增強(qiáng)兩大特點(diǎn)。文心大模型源于產(chǎn)業(yè)、服務(wù)于產(chǎn)業(yè),可以滿足真實(shí)場(chǎng)景中的諸多應(yīng)用需求,真正發(fā)揮大模型驅(qū)動(dòng)AI規(guī)模化應(yīng)用的產(chǎn)業(yè)價(jià)值;文心大模型在海量文本數(shù)據(jù)的基礎(chǔ)上引入大規(guī)模知識(shí)圖譜,促進(jìn)了結(jié)構(gòu)化知識(shí)和無結(jié)構(gòu)化文本之間的融合與共享,模型能力大幅提升。2021年百度發(fā)布了ERNIE3.0模型,首次在百億級(jí)預(yù)訓(xùn)練中引入了大規(guī)模知識(shí),模型學(xué)習(xí)效率和可解釋性大幅增強(qiáng)。框架方面,ERNIE3.0模型框架分為“通用表示”
和“任務(wù)表示”兩層,同時(shí)具備語言理解和語言生成兩種功能;性能方面,ERNIE
3.0刷新了54個(gè)中文NLP任務(wù)基準(zhǔn),且其英文模型在復(fù)雜語言理解任務(wù)評(píng)測(cè)中超過了人類水平0.8個(gè)百分點(diǎn)。百度文心大模型全景圖
ERNIE3.0框架結(jié)構(gòu)8百度:“文心一言”生態(tài)建設(shè)取得進(jìn)展,具備商用拓展?jié)摿Π俣任男腘LP大模型面向語言理解、語言生成等場(chǎng)景,具備超強(qiáng)的語言理解、對(duì)話生成、文學(xué)創(chuàng)作等能力。文心NLP模型將大數(shù)據(jù)預(yù)訓(xùn)練與多源豐富知識(shí)相結(jié)合,通過持續(xù)學(xué)習(xí),不斷吸收海量文本數(shù)據(jù)中詞匯、結(jié)構(gòu)、語義等方面的新知識(shí),實(shí)現(xiàn)模型效果不斷進(jìn)化?!拔男囊谎裕ㄓ⑽拿篍RNIEBot)”是百度基于文心大模型技術(shù)推出的生成式對(duì)話產(chǎn)品。2023年2月7日,百度宣布將于2023年3月份發(fā)布“文心一言”,目前已經(jīng)有大量下游客戶參與文心一言的生態(tài)建設(shè),行業(yè)覆蓋面廣泛,包括新聞、傳媒、互聯(lián)網(wǎng)、家裝、汽車、金融等,其中新聞傳媒業(yè)積極性最高,反映出“文心一言”這類AIGC產(chǎn)品將給媒體創(chuàng)作類行業(yè)帶來巨大影響。在2023
AI+工業(yè)互聯(lián)網(wǎng)高峰論壇上,百度智能云宣布“文心一言”將通過百度智能云對(duì)外提供服務(wù),率先在內(nèi)容和信息相關(guān)的行業(yè)和場(chǎng)景落地。文心NLP大模型
“文心一言”生態(tài)合作伙伴9目錄焦點(diǎn):ChatGPT帶火AIGC,Open
AI引領(lǐng)技術(shù)和生態(tài)1變革:AIGC與人更為神似,模型和數(shù)據(jù)是主要助力2市場(chǎng):大模型需要大算力,推動(dòng)AI服務(wù)器市場(chǎng)增長(zhǎng)3應(yīng)用:行業(yè)將逐步回歸理性,能否突破需要看B端4投資建議及風(fēng)險(xiǎn)提示51011改變:AIGC實(shí)現(xiàn)了從分析預(yù)測(cè)到生成創(chuàng)造的跨越,AI開始更像人AIGC為人工智能技術(shù)帶來技術(shù)變革。相比于之前的分析式AI,AIGC不再局限于分析已有數(shù)據(jù)的規(guī)律,而是實(shí)現(xiàn)了從分析內(nèi)容到創(chuàng)造生成新內(nèi)容的跨越,讓AI更像人。事實(shí)上,早在2014年,隨著一種深度學(xué)習(xí)架構(gòu)生成對(duì)抗網(wǎng)絡(luò)(GAN)的出現(xiàn),生成式AI就開始流行。但近年來,生成式AI在模型、數(shù)據(jù)、算力都大幅度提升和改進(jìn),行業(yè)進(jìn)入爆發(fā)期,其中模型的演進(jìn)影響最為深遠(yuǎn)。NLP發(fā)展歷程騰訊研究院、CSDN2015年,基于流的生成模型(Flow
Based);擴(kuò)散模型(Diffusion)2021年,CLIP模型2012年,卷積神經(jīng)網(wǎng)絡(luò)AlexNet2013年,變分自動(dòng)編碼(VAE)2020年,神經(jīng)輻射場(chǎng)(NeRF)2017年,Transformer模型2014年,生成對(duì)抗網(wǎng)絡(luò)(GAN)2015年,深度殘差網(wǎng)絡(luò)(ResNet)12突破|模型:預(yù)訓(xùn)練大模型Transformer助力,AIGC實(shí)現(xiàn)里程碑式飛躍資料來源:Google《Attention
is
All
you
Need》、CSDN、IDC&百度預(yù)訓(xùn)練大模型為生成式AI帶來里程碑式飛躍。2017年Transformer架構(gòu)的出現(xiàn)改善了循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的局限性,標(biāo)志性特征是采用了self-attention機(jī)制,可為輸入數(shù)據(jù)的各部分分配不同權(quán)重,支持GPT-3和LaMDA等大型語言模型(LLM)。Transformer模型可并行訓(xùn)練,使GPU性能改善所帶來的模型訓(xùn)練效果顯著提升,同時(shí)可以通過不斷增加模型參數(shù)量以及預(yù)訓(xùn)練使用的數(shù)據(jù)量來提升模型性能。大模型(又稱基礎(chǔ)模型)可經(jīng)過海量、多樣化數(shù)據(jù)(通常無標(biāo)注文本)的預(yù)訓(xùn)練,再針對(duì)廣泛的下游任務(wù)進(jìn)行微調(diào)或適應(yīng)。針對(duì)不同的任務(wù)和應(yīng)用場(chǎng)景,只需要將大模型遷移學(xué)習(xí)到下游任務(wù)即可實(shí)現(xiàn),避免了傳統(tǒng)NLP技術(shù)需要從頭開始訓(xùn)練下游任務(wù)的痛點(diǎn)。Transformer模型架構(gòu)
模型所需參數(shù)量變化趨勢(shì)
訓(xùn)練大模型“預(yù)訓(xùn)練+精調(diào)”模式13突破|模型:Transformer衍生出三類模型,打下生成式AI算法的基礎(chǔ)、CSDN,平安證券研究所深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)升級(jí)引發(fā)AIGC技術(shù)開發(fā)新范式,各類預(yù)訓(xùn)練模型層出不窮,可用于NLP(諸如GTP-3)、CV(諸如Florence)或多模態(tài)領(lǐng)域(諸如Stable
Diffusion)
。以Transformer架構(gòu)為基礎(chǔ)衍生出的典型預(yù)訓(xùn)練語言模型大致可以分為三類:1)Encoder模型(以BERT為代表):又稱自編碼模型,適用于內(nèi)容理解任務(wù),例如需要理解輸入語義的任務(wù),例如情感分析;2)Decoder模型(以GPT為代表):又稱自回歸模型,適用于生成式任務(wù),例如文本生成;3)Encoder-Decoder模型(以T5為代表):又稱Seq2Seq模型,通常用于需要內(nèi)容理解和生成的任務(wù),例如翻譯。Transformer模型家族時(shí)間軸
Transformer模型系列分類14突破|模型:GPT系列大模型演進(jìn)和應(yīng)用較快,最終掀起AIGC熱潮Transformer三條路線中,GPT模型進(jìn)展較快:2018年,由OpenAI提出的生成式預(yù)訓(xùn)練模型GPT誕生,提出了半監(jiān)督學(xué)習(xí)方法,即通過“預(yù)訓(xùn)練+微調(diào)”的方式讓模型通過大量無標(biāo)注數(shù)據(jù)學(xué)習(xí),從而緩解人工標(biāo)注數(shù)據(jù)有限的問題;2019年,GPT-2去除finetune,參數(shù)量增加,采用zero-shot(零樣本)學(xué)習(xí),模型的泛化能力提升;2020年,GPT-3采用few-shot(小樣本),并將訓(xùn)練參數(shù)又提升兩個(gè)數(shù)量級(jí),模型準(zhǔn)確率和性能再次提升;2022年,InstructGPT在GPT-3基礎(chǔ)上采用獎(jiǎng)勵(lì)機(jī)制,通過人為標(biāo)注和強(qiáng)化學(xué)習(xí)的方法提升模型輸出結(jié)果的真實(shí)性、無害性和有用性,13億參數(shù)版本實(shí)現(xiàn)了比1750億參數(shù)版本GPT-3更好的模型性能。GPT系列模型比較知乎、AI模型發(fā)布時(shí)間模型層數(shù)詞向量維度數(shù)據(jù)量參數(shù)量說明GPT2018.612768約5GB1.17億無監(jiān)督預(yù)訓(xùn)練模型+有監(jiān)督微調(diào)無監(jiān)督預(yù)訓(xùn)練模型,去除GPT的微調(diào),架構(gòu)上改進(jìn)(將層歸一化移動(dòng)到每個(gè)子層GPT-22019.248160040GB15億的輸入并在最終的自注意力塊后增加一層歸一化,將上下文窗口大小從512增加到1024)GPT-32020.5961288845TB1750億無監(jiān)督預(yù)訓(xùn)練模型,參數(shù)量相比GPT-2提升兩個(gè)數(shù)量級(jí),架構(gòu)上優(yōu)化(將上下文窗口大小從1024增加到2048,采用交替密度和局部帶狀稀疏注意模式)InstructGPT 2022.3 13億 從預(yù)訓(xùn)練的GPT3模型開始,并在有監(jiān)督微調(diào)后通過強(qiáng)化學(xué)習(xí)加入獎(jiǎng)勵(lì)模型機(jī)制GPT-3.5 GPT3.5系列包括一系列諸如Davinci-003等模型,它們是在InstructGPT的基礎(chǔ)上構(gòu)建的ChatGPT采用GPT3.5(又名GPT3
Davinci-003)預(yù)訓(xùn)練模型,并使用RLHF微調(diào),ChatGPT 2022.11 這與InstructGPT中大致相同,但在數(shù)據(jù)收集方面略有不同。ChatGPT也不僅只是個(gè)模型,因?yàn)樗愃朴贐lenderBot3的內(nèi)存存儲(chǔ)和檢索的擴(kuò)展。15突破|模型:文本、圖像生成是起點(diǎn),多模態(tài)生成也正在興起ChatGPT建立在GPT-3.5大語言模型
(LLM)系列之上,并通過監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)技術(shù)進(jìn)行了微調(diào),引入基于人類反饋的強(qiáng)化學(xué)習(xí)機(jī)制(Reinforcement
Learningfrom
Human
Feedback,RLHF)。ChatGPT能完成問答、詩(shī)歌創(chuàng)作、代碼編寫、文案寫作、翻譯等,接近真實(shí)人類的思維方式,在生成效果上取得重大突破。除了文本、代碼生成之外,圖片、視頻甚至是圖文多模態(tài)模型也都開始應(yīng)用,而且應(yīng)用規(guī)模將大幅增加。多模態(tài)大模型能夠?qū)崿F(xiàn)文本、語音、圖像、視頻等各種模態(tài)之間的融合和內(nèi)容形式生成。例如,OPENAI開發(fā)的CLIP模型可同時(shí)將文字和圖片相匹配。RLHF強(qiáng)化學(xué)習(xí)原理步驟Hugging
Face基于CLIP的對(duì)比圖文多模態(tài)預(yù)訓(xùn)練16突破|數(shù)據(jù)集:數(shù)據(jù)量、多樣性、數(shù)據(jù)質(zhì)量是關(guān)鍵要素語料庫(kù)的數(shù)據(jù)量、多樣性、數(shù)據(jù)質(zhì)量成為訓(xùn)練數(shù)據(jù)集的關(guān)鍵要素。GPT使用了包含7000本書的BookCorpus數(shù)據(jù)集;GPT-2則收集了更加廣泛、數(shù)量更多的語料組成數(shù)據(jù)集,包含800萬篇Reddit上高贊的文章網(wǎng)頁(yè),大小為40GB,Reddit上的數(shù)據(jù)會(huì)包括各個(gè)領(lǐng)域,所以既保證了數(shù)據(jù)質(zhì)量、數(shù)量又保證了數(shù)據(jù)的多樣性;
GPT-3則采用了5種語料庫(kù)(5000億tokens),大小增至45TB;InstructGPT的預(yù)訓(xùn)練和GPT3相同,但用標(biāo)注數(shù)據(jù)和提示語進(jìn)行了微調(diào)和優(yōu)化,OPENAI雇傭了40名標(biāo)注人員(labeler)且進(jìn)行了培訓(xùn),通過指示學(xué)習(xí)構(gòu)建訓(xùn)練樣本來訓(xùn)練獎(jiǎng)勵(lì)模型,最后通過獎(jiǎng)勵(lì)模型的打分排序來指導(dǎo)強(qiáng)化學(xué)習(xí)模型的訓(xùn)練。GPT系列模型數(shù)據(jù)集概覽知乎、GPT語料庫(kù):
BookCorpus
數(shù)據(jù)集(7000本書)上的無監(jiān)督預(yù)訓(xùn)練,在幾個(gè)特定任務(wù)數(shù)據(jù)集上有監(jiān)督微調(diào),
包括SNLI
、RACE、Quora等數(shù)據(jù)量:5GB語料庫(kù):
WebTex(包含800萬個(gè)Reddit上高贊的文章網(wǎng)頁(yè))數(shù)據(jù)量:40GB語料庫(kù):
500B
tokens
包含CommonCrawl(410B),WebText2
(19B),
Books1
(12B),Books2(55B),Wikipedia
(3B)數(shù)據(jù)量:45TB語料庫(kù):
預(yù)訓(xùn)練同GPT3語料庫(kù),但用標(biāo)注數(shù)據(jù)和提示語進(jìn)行了微調(diào)和優(yōu)化SFT數(shù)據(jù)集包含13K
的prompts;RM數(shù)據(jù)集包含33K的prompts;PPO數(shù)據(jù)集包含31K的prompts??偣?7K的數(shù)據(jù)中涉及人工標(biāo)注的有46K左右。GPT-2GPT-3InstructGPT17突破|數(shù)據(jù)集:增加數(shù)據(jù)集采樣頻率且加入人工標(biāo)注,數(shù)據(jù)質(zhì)量提升OPENAI發(fā)現(xiàn)Common
Crawl雖然包含一萬億個(gè)詞,但未經(jīng)過濾或輕微過濾的版本數(shù)據(jù)質(zhì)量偏低。鑒于此,他們參照高質(zhì)量語料將Common
Crawl的45TB數(shù)據(jù)壓縮過濾到570GB,并且添加了幾個(gè)高質(zhì)量的精選語料庫(kù)(如Wikipedia)。值得注意的是,為了得到更高質(zhì)量的訓(xùn)練數(shù)據(jù),數(shù)據(jù)集不是按其大小成比例采樣,而是質(zhì)量更高的數(shù)據(jù)集被更頻繁地采樣。而InstructGPT與GPT-3最大的區(qū)別在于引入RLHF,訓(xùn)練SFT、RM、PPO模型的數(shù)據(jù)集既有來自API用戶的,也有來自標(biāo)注人員的。其中SFT、RM的prompts來自于在線API上的用戶使用數(shù)據(jù)以及標(biāo)注人員標(biāo)注的數(shù)據(jù),PPO則全都是從API數(shù)據(jù)中采樣的。雖然人類標(biāo)注只有46K,但是InstructGPT對(duì)于沒見過的prompt依然有較好的泛化能力。GPT3模型數(shù)據(jù)集OPENAIInstructGPT各模型數(shù)據(jù)集大小(單位:prompts的數(shù)量)Dataset Quantity(tokens)Weightintraining
mixEpochselapsedwhentrainingfor300B
tokensCommon
Crawl 410
billion600.44(filtered)WebText219
billion222.9Books112
billion81.9Books255
billion80.43Wikipedia3
billion33.4SFT
DataRM
DataPPO
Datasplitsourcesizesplitsourcesizesplitsourcesizetrainlabeler11,295trainlabeler6,623traincustomer31,144traincustomer1,430traincustomer26,584validcustomer16,185validlabeler1,550validlabeler3,488validcustomer103validcustomer14,399目錄焦點(diǎn):ChatGPT帶火AIGC,Open
AI引領(lǐng)技術(shù)和生態(tài)1變革:AIGC與人更為神似,模型和數(shù)據(jù)是主要助力2市場(chǎng):大模型需要大算力,推動(dòng)AI服務(wù)器市場(chǎng)增長(zhǎng)3應(yīng)用:行業(yè)將逐步回歸理性,能否突破需要看B端4投資建議及風(fēng)險(xiǎn)提示518算力:ChatGPT是基于InstructGPT模型,大幅擴(kuò)大數(shù)據(jù)量級(jí)而得到ChatGPT模型訓(xùn)練結(jié)合了監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí),具體的訓(xùn)練方法分為三步:1)收集數(shù)據(jù)集并進(jìn)行人工標(biāo)注,輸入到GPT-3.5模型中進(jìn)行GPT-3.5模型微調(diào),訓(xùn)練輸出一個(gè)監(jiān)督模型(SFT);2)收集SFT模型生成的多輸出比較數(shù)據(jù)集,對(duì)諸多答案進(jìn)行排序打分(人工標(biāo)注),訓(xùn)練輸出一個(gè)獎(jiǎng)勵(lì)模型(RM);3)利用RM模型作為獎(jiǎng)勵(lì)函數(shù),通過PPO算法對(duì)SFT模型進(jìn)行強(qiáng)化學(xué)習(xí),持續(xù)迭代生成模型,此過程無需人工標(biāo)注。ChatGPT模型訓(xùn)練過程19OPENAI官網(wǎng),平安證券研究所算力:大模型的實(shí)現(xiàn)需要十分強(qiáng)大的算力來支持訓(xùn)練過程和推理過程大模型的實(shí)現(xiàn)需要十分強(qiáng)大的算力來支持訓(xùn)練過程和推理過程。根據(jù)OPENAI數(shù)據(jù),訓(xùn)練GPT-3
175B的模型,需要的算力高達(dá)3640
PF-days(即以1PetaFLOP/s的效率要跑3640天)。2018年以來,大模型的參數(shù)量級(jí)已達(dá)到數(shù)千億參數(shù)的量級(jí)規(guī)模,對(duì)算力的需求將呈現(xiàn)指數(shù)級(jí)增長(zhǎng)。各個(gè)模型所需計(jì)算量及參數(shù)量2018-2022年大模型參數(shù)增長(zhǎng)變化趨勢(shì)資料來源:澎湃新聞,OPENAI,平安證券研究所20算力:AI芯片的性能提升成為決定大模型從理論實(shí)踐到大規(guī)模應(yīng)用的關(guān)鍵要素根據(jù)《COMPUTETRENDS
ACROSSTHREEERAS
OF
MACHINE
LEARNING》研究結(jié)果,大模型時(shí)代,算力翻倍的需求時(shí)間是9.9個(gè)月。AI芯片的性能提升成為決定大模型從理論實(shí)踐到大規(guī)模應(yīng)用的關(guān)鍵要素。在供給端,AI芯片廠商推出了性能越來越強(qiáng)的新產(chǎn)品來應(yīng)對(duì)人工智能發(fā)展的算力需求。以英偉達(dá)為例,
2020年,英偉達(dá)推出了A100
GPU芯片,相比上一代V100
GPU芯片,A100
GPU芯片性能大幅提升。針對(duì)大模型,A100
GPU芯片相比V100
GPU芯片可提供高達(dá)3倍的訓(xùn)練速度。人工智能不同時(shí)代對(duì)算力翻倍的需求時(shí)間
英偉達(dá)A100
GPU的性能遠(yuǎn)超V100
GPU資料來源:《COMPUTE
TRENDS
ACROSSTHREE
ERAS
OF
MACHINE
LEARNING》,英偉達(dá)官網(wǎng),平安證券研究所21算力:ChatGPT的訓(xùn)練成本和推理成本高昂22在訓(xùn)練端:據(jù)報(bào)道,2020年,微軟宣布與OpenAI合作,建成了一臺(tái)超級(jí)計(jì)算機(jī),專門用來在Azure公有云上訓(xùn)練超大規(guī)模的人工智能模型。這臺(tái)為OpenAI開發(fā)的超級(jí)計(jì)算機(jī)擁有超過28.5萬個(gè)CPU核心,擁有超過1萬個(gè)GPU(V100
GPU芯片)。以此規(guī)格,如果自建IDC,以A100
GPU芯片替代V100
GPU芯片,依照A100和V100的性能換算,需要約3000個(gè)A100
GPU芯片。根據(jù)英偉達(dá)網(wǎng)站信息,NVIDIA
DGX
A100服務(wù)器搭載8塊A100芯片,估算需要375臺(tái)NVIDIA
DGX
A100服務(wù)器,每臺(tái)NVIDIA
DGX
A100服務(wù)器的價(jià)格為19.9萬美元,則自建IDC的訓(xùn)練服務(wù)器的算力成本為7462.5萬美元。若在云端訓(xùn)練,據(jù)Lambda
Labs首席科學(xué)官Chuan
li介紹,擁有1750億個(gè)參數(shù)的GPT-3單次訓(xùn)練成本達(dá)到460萬美元。自建IDC的訓(xùn)練成本估算A100GPU
芯片(個(gè))1臺(tái)NVIDIA
DGX
A100服務(wù)器搭載A100芯片個(gè)數(shù)NVIDIA
DGX
A100服務(wù)器(臺(tái))NVIDIA
DGX
A100服務(wù)器價(jià)格(萬美元)訓(xùn)練成本(萬美元)3000837519.97462.5在推理(用戶訪問)端:ChatGPT推出僅兩個(gè)月月活用戶數(shù)已經(jīng)破億,2023年1月,全球每天約有1300萬獨(dú)立訪問者使用ChatGPT。以ChatGPT日活用戶2000萬估算,假設(shè)每天每用戶提10個(gè)問題,則每天有2億的訪問量。若自建IDC,假設(shè)每個(gè)問題平均20個(gè)字,ChatGPT在A100
GPU芯片上對(duì)每個(gè)字的響應(yīng)時(shí)間是350毫秒,則2億的訪問量需要A100芯片運(yùn)行388889個(gè)芯片小時(shí),即每天需要16204(388889/24)個(gè)A100芯片同時(shí)工作,需要2026(16204/8)臺(tái)NVIDIA
DGXA100服務(wù)器同時(shí)工作,則自建IDC的推理服務(wù)器的算力成本為4.03億美元。若在云端推理,據(jù)《Fortune》雜志數(shù)據(jù),每次用戶與ChatGPT互動(dòng),產(chǎn)生的算力云服務(wù)成本約0.01美元,則每天2億的訪問量,對(duì)應(yīng)的云端成本為每天200萬美元。自建IDC的推理成本估算日活用戶數(shù)(萬)單用戶每日提問次數(shù)每個(gè)問題平均字?jǐn)?shù)(個(gè))A100
GPU對(duì)每個(gè)字的響應(yīng)時(shí)間(毫秒)每日消耗GPU計(jì)算時(shí)間(小時(shí))每天需要A100GPU芯片(個(gè))NVIDIA
DGXA100服務(wù)器(臺(tái))NVIDIA
DGXA100服務(wù)器價(jià)格(萬美元)推理成本(億美元)2000102035038888916204202619.94.03資料來源:澎湃新聞,環(huán)球零碳,英偉達(dá)官網(wǎng),平安證券研究所算力:大模型將為全球和中國(guó)AI芯片和AI服務(wù)器市場(chǎng)的增長(zhǎng)提供強(qiáng)勁動(dòng)力我們認(rèn)為,隨著模型的迭代和AI芯片廠商產(chǎn)品的迭代,ChatGPT的訓(xùn)練成本和推理成本未來必將呈現(xiàn)下降趨勢(shì)。但一次訓(xùn)練百萬美元量級(jí)的訓(xùn)練成本和每天百萬美元量級(jí)的推理成本,隨著全球和中國(guó)人工智能廠商布局大模型,大模型將為全球和中國(guó)AI服務(wù)器市場(chǎng)的增長(zhǎng)提供強(qiáng)勁動(dòng)力。根據(jù)《2022年北京人工智能產(chǎn)業(yè)發(fā)展白皮書》數(shù)據(jù),截至2022年10月,北京擁有人工智能核心企業(yè)1048家,占我國(guó)人工智能核心企業(yè)總量的29%
。以此計(jì)算,我國(guó)人工智能核心企業(yè)總數(shù)約為3614家。假設(shè)其中有2%的企業(yè)自建IDC訓(xùn)練和推理大模型,如前所述,單一企業(yè)自建IDC推理和訓(xùn)練大模型的算力成本約為4.78(4.03+0.75)億美元,以此估算,大模型將為我國(guó)AI服務(wù)器市場(chǎng)帶來約345.50億美元的市場(chǎng)空間。以2021年我國(guó)AI服務(wù)器市場(chǎng)規(guī)模占全球AI服務(wù)器市場(chǎng)規(guī)模的占比估算,則將為全球AI服務(wù)器市場(chǎng)帶來約910.44億美元的市場(chǎng)空間。市場(chǎng)空間巨大,相關(guān)芯片和服務(wù)器廠商將深度受益此次ChatGPT浪潮。資料來源:IDC,浪潮信息,平安證券研究所2021H1全球AI服務(wù)器市場(chǎng)競(jìng)爭(zhēng)格局2021年中國(guó)AI服務(wù)器市場(chǎng)競(jìng)爭(zhēng)格局2021-2025年全球AI服務(wù)器市場(chǎng)規(guī)模CAGR為19.52021-2026年中國(guó)AI服務(wù)器市場(chǎng)規(guī)模CAGR為15.823目錄焦點(diǎn):ChatGPT帶火AIGC,Open
AI引領(lǐng)技術(shù)和生態(tài)1變革:AIGC與人更為神似,模型和數(shù)據(jù)是主要助力2市場(chǎng):大模型需要大算力,推動(dòng)AI服務(wù)器市場(chǎng)增長(zhǎng)3應(yīng)用:行業(yè)將逐步回歸理性,能否突破需要看B端4投資建議及風(fēng)險(xiǎn)提示524AIGC將逐步回歸理性,未來2-3年重點(diǎn)培育應(yīng)用和教育市場(chǎng)未來2-3年是AIGC走向成熟的關(guān)鍵時(shí)期。類似于計(jì)算機(jī)視覺等相對(duì)成熟的技術(shù),AIGC在經(jīng)歷了近期的炒作熱潮結(jié)束之后,預(yù)計(jì)行業(yè)將經(jīng)歷一段下沉期,市場(chǎng)趨向理性。AIGC則需要加快開始教育和融入市場(chǎng),培育產(chǎn)品和應(yīng)用。如果能夠像計(jì)算機(jī)視覺一樣,找到合適的商業(yè)化場(chǎng)景,行業(yè)后續(xù)將逐步得到市場(chǎng)認(rèn)可,并持續(xù)做大;如果不能,這項(xiàng)技術(shù)也可能持續(xù)停留在低谷期,甚至被市場(chǎng)淘汰。ChatGPT的快速推進(jìn),標(biāo)志著AIGC在C端有著巨大潛力,但B端、G端相關(guān)產(chǎn)品應(yīng)該將是公司的主要收入來源。C端看,主要是來自于內(nèi)容生成等工具性的需求,一般都是輕應(yīng)用,嘗鮮之后的付費(fèi)意愿值得觀察,主流的產(chǎn)品收費(fèi)模式將是SaaS應(yīng)用訂閱;B端看,是含金量最大的市場(chǎng),需要將技術(shù)轉(zhuǎn)化成工具和解決方案,為企業(yè)和行業(yè)賦能,收費(fèi)模式可能包括項(xiàng)目定制+后續(xù)訂閱收入。生成式AI走向炒作頂峰
AIGC潛在商業(yè)模式Gartner(2022.7),平安證券研究所2526文本、代碼等應(yīng)用有望近兩年進(jìn)入快速發(fā)展期,圖像、視頻生成成熟需時(shí)日AIGC的應(yīng)用場(chǎng)景文本生成圖像生成視頻生成游戲生成根據(jù)使用場(chǎng)景,可分為非交互式文本生成和交互式文本生成。視頻生成可分為視頻編輯、視頻自動(dòng)剪輯和端到端視頻生成。醫(yī)療影像生成建筑建模創(chuàng)作游戲生成主要包括NPC生成場(chǎng)景生成自主創(chuàng)作類人聊天智能搜索文章寫作輔助輔助編程……文字生成圖片圖片編輯圖像轉(zhuǎn)圖像根據(jù)使用場(chǎng)景,可分為圖像編輯工具游戲元素生成和游和端到端圖像生成。戲策略生成。虛擬數(shù)字人劇情生成代碼編寫文本生成:應(yīng)用相對(duì)成熟,在垃圾郵件的檢測(cè)、基礎(chǔ)的問答等領(lǐng)域都得到了應(yīng)用,并在長(zhǎng)篇寫作等方面有所建樹,快速發(fā)展階段預(yù)計(jì)很快到來;后續(xù)預(yù)期在專業(yè)論文或者文學(xué)創(chuàng)作上實(shí)現(xiàn)落地;圖像生成:已經(jīng)開始應(yīng)用于產(chǎn)品設(shè)計(jì)、建筑模型,而且在醫(yī)療領(lǐng)域也實(shí)現(xiàn)應(yīng)用,但達(dá)到設(shè)計(jì)師等專業(yè)人士的水平,還有差距;視頻、游戲生成:目前還處在早期嘗試階段,如實(shí)現(xiàn)電子游戲和電影的個(gè)性化創(chuàng)作,可能需要等待較長(zhǎng)時(shí)間。長(zhǎng)視頻生成動(dòng)畫制作視頻自動(dòng)編輯短視頻生成文字生成視頻AIGC在不同場(chǎng)景中的發(fā)展預(yù)期資料來源:紅杉資本、平安證券研究所27國(guó)內(nèi)AIGC垂直應(yīng)用起步較晚,文本、圖像等領(lǐng)域都還是藍(lán)海賽道國(guó)內(nèi)AIGC主要賽道參與企業(yè)相較美國(guó)市場(chǎng),國(guó)內(nèi)AIGC在相對(duì)成熟的賽道上參與者也不是很多,這和之前的預(yù)測(cè)性AI趨于紅海的市場(chǎng)有著很大的差異。一方面,國(guó)內(nèi)在算法和應(yīng)用開發(fā)上存在差距,同時(shí)公有云SaaS發(fā)展不足帶來的訓(xùn)練數(shù)據(jù)質(zhì)量和應(yīng)用通用性較差,限制了國(guó)內(nèi)應(yīng)用的大面積鋪開;另一方面,國(guó)內(nèi)B端為應(yīng)用付費(fèi)的意愿,尤其是AIGC這類新應(yīng)用付費(fèi)的意愿并不夠強(qiáng),反而是國(guó)內(nèi)一些To
C的賽道發(fā)展的更好一點(diǎn)。從趨勢(shì)上看,AIGC最終的市場(chǎng)依然是B端,但是考慮到中美市場(chǎng)的差異,國(guó)內(nèi)企業(yè)依靠單一通用應(yīng)用去打所有市場(chǎng)的可能性比較小,需要通過垂直化、行業(yè)定制化的開發(fā)AIGC方案,早期可能只面向1個(gè)或者幾個(gè)行業(yè)賽道,有積累之后持續(xù)拓展其他行業(yè)。美國(guó)AIGC主要賽道參與企業(yè)(不完全統(tǒng)計(jì))資料來源:百度、平安證券研究所28文本生成:通過營(yíng)銷文案、摘要、故事生成引擎,賦能文創(chuàng)、金融等行業(yè)功能:輸入結(jié)構(gòu)化的數(shù)據(jù)、圖片或者文本來生成一段新的文本。例如輸入結(jié)構(gòu)化的數(shù)據(jù)、輸入一張圖片,或者輸入若干關(guān)鍵詞來生成文本。目前主要功能是生成可控文本,即文本中帶有期望得到的屬性,比如情感、關(guān)鍵詞、事實(shí)以及主題等。應(yīng)用:營(yíng)銷文案引擎、文章摘要、故事生成、散文小說、文本復(fù)述、研報(bào)生成。挑戰(zhàn):對(duì)篇章結(jié)構(gòu)、多樣性的可控;長(zhǎng)文本生成面臨的前后邏輯不一致、主題不一致以及事實(shí)不一致等問題。國(guó)內(nèi)文本生成典型解決方案國(guó)內(nèi)文本生成主要應(yīng)用場(chǎng)景及功能場(chǎng)景功能描述應(yīng)用實(shí)例文化創(chuàng)作、快消基于關(guān)鍵詞生成輸入關(guān)鍵詞句,將圍繞關(guān)鍵詞生成具有指定風(fēng)格特色的原創(chuàng)內(nèi)容中文在線:利用文本生成平臺(tái)進(jìn)行輔助創(chuàng)作自定義模板生成用戶輸入文本并標(biāo)注出待補(bǔ)全部分,模型基于用戶輸入進(jìn)行內(nèi)容補(bǔ)全續(xù)寫根據(jù)用戶選擇的題材和輸入的前序文本進(jìn)行續(xù)寫營(yíng)銷文本生成輸入品牌、核心賣點(diǎn)、應(yīng)用場(chǎng)景等關(guān)鍵詞,生成營(yíng)銷文案美妝、汽車等行業(yè)已經(jīng)開始有應(yīng)用金融行業(yè)研報(bào)觀點(diǎn)分析自動(dòng)抽取研報(bào)中的觀點(diǎn)內(nèi)容,并輸出觀點(diǎn)標(biāo)簽及觀點(diǎn)極性。華夏基金:輿情監(jiān)測(cè)。重點(diǎn)解決傳統(tǒng)工具關(guān)鍵字判斷準(zhǔn)確度低、情緒判斷和業(yè)務(wù)需求不一致、大量重復(fù)信息干擾、無法識(shí)別輿情對(duì)象等問題。金融文本情感分析對(duì)金融、財(cái)經(jīng)領(lǐng)域中文本的情感傾向進(jìn)行分析判斷,有效賦能金融財(cái)經(jīng)領(lǐng)域信息分析以及處理。事件檢測(cè)從新聞中檢測(cè)金融相關(guān)事件,用于分析和決策。資料來源:瀾舟科技、平安證券研究所29圖片/視頻生成:能力提升明顯,C端認(rèn)知需提升但B端潛力較大功能:通過AI技術(shù)來自動(dòng)或輔助生成內(nèi)容的生產(chǎn)方式,通過輸入指令,讓AI去完成冗雜的代碼、繪圖、建模等任務(wù),實(shí)現(xiàn)“圖生圖”或者“文生圖”的模式,生成新的圖片/視頻。在開源公司StabilityAI發(fā)布了Vincent的圖形模型StableDiffusion之后,AIGC圖片生成能力顯著提高。商業(yè)模式:C端客戶目前需求更為復(fù)雜,AIGC在技術(shù)上還存在差距,目前很難有大的商業(yè)機(jī)會(huì),業(yè)內(nèi)企業(yè)6Pen調(diào)研數(shù)據(jù)顯示,60%用戶不曾付費(fèi),付費(fèi)超過100元的比重也只有10%,市場(chǎng)拓展還需要時(shí)日;B端客戶變現(xiàn)的可能性會(huì)更高,垂直客戶需求相對(duì)聚焦,變現(xiàn)路徑也更為多元和成熟,比如廣告、營(yíng)銷、文旅等行業(yè),預(yù)計(jì)都會(huì)有較大的空間。2023/2/28行業(yè)應(yīng)用方式應(yīng)用實(shí)例廣告行業(yè)利用AI制作宣傳材料百度利用文心平臺(tái)制作電視劇宣傳海報(bào),騰訊、美圖也在進(jìn)入該賽道設(shè)計(jì)行業(yè)建筑、包裝、服飾等設(shè)計(jì)出圖ZMO.AI通過生成高質(zhì)量的模特兒照片圖片,降低拍照成本和等待時(shí)間營(yíng)銷定制生成圖片或者視頻材料百家號(hào)、剪映開放圖文轉(zhuǎn)視頻功能可以進(jìn)行個(gè)性化的創(chuàng)作漫畫/動(dòng)漫行業(yè)配文生成漫畫、插畫和視頻國(guó)內(nèi)藝術(shù)家基于小說《2086元宇宙》制作漫畫版,形成可視版本游戲行業(yè)輔助角色、道具、場(chǎng)景設(shè)計(jì)網(wǎng)易推出首個(gè)游戲版ChatGPT將會(huì)在《逆水寒》手游,國(guó)內(nèi)圖片/視頻生成典型應(yīng)用場(chǎng)景利用AIGC生成的繪畫、海報(bào)和手游資料來源:觀研天下、網(wǎng)易、平安證券研究所30類人聊天機(jī)器人:AIGC應(yīng)用集大成者,已從形似開始走向神似類人聊天機(jī)器人及頭部廠商類人聊天機(jī)器人是一種旨在模擬與用戶進(jìn)行類人對(duì)話的電腦程序。它們已被應(yīng)用于多個(gè)行業(yè),包括客戶服務(wù)、電子商務(wù)和娛樂等。chatGPT帶來的變革:此前的聊天機(jī)器人只能根據(jù)設(shè)定問題回復(fù)固定內(nèi)容,同chatGPT融合之后,將文本生成、圖像生成、多模態(tài)轉(zhuǎn)換技術(shù)融合起來,環(huán)境感知、理解能力在大幅增強(qiáng),實(shí)現(xiàn)和人的形似到神似?;赾hatGPT的類人聊天機(jī)器人可以提供客戶服務(wù)、虛擬代理、內(nèi)容創(chuàng)意和文本生成、以及信息知識(shí)提供等服務(wù)。國(guó)外重點(diǎn)企業(yè):-
openAI:公司核心宗旨在于“實(shí)現(xiàn)安全的通用人工智能(AGI)”,目前推出的“chatGPT類人聊天機(jī)器人”火爆全球,其公司在圖片生成和視頻生成的應(yīng)用上也有很深的造詣。-
Google:
公司在AIGC領(lǐng)域布局很久,目前也有“bard”類人聊天機(jī)器人的誕生試用,在AIGC的多種技術(shù)領(lǐng)域也處于前列。國(guó)內(nèi)重點(diǎn)企業(yè):百度:是國(guó)內(nèi)布局AI賽道最早的公司之一,目前已宣布“文心一言”類人聊天機(jī)器人將很快進(jìn)入公測(cè)環(huán)節(jié),圖片生成方面也有突破。小冰:從微軟獨(dú)立拆分出來的人工智能公司,推出的“小冰”機(jī)器人是目前全球范圍內(nèi)承載交互量最大的人工智能系統(tǒng)。類人聊天機(jī)器人的多種應(yīng)用場(chǎng)景—以chatGPT為例智能搜索引擎新聞寫稿機(jī)器人chatGPT類人聊天機(jī)器人文本生成信息提供系統(tǒng)創(chuàng)意內(nèi)容生成虛擬代理客戶服務(wù)虛擬數(shù)字人虛擬主播電商智能客服金融資訊客服信息整合工具數(shù)字教育資源營(yíng)銷文案生成影視劇本生成31類人聊天機(jī)器人|新聞寫稿:應(yīng)用起步較早,大幅提升寫作效率利用AIGC技術(shù)參與新聞寫稿輔助工作,各家新聞機(jī)構(gòu)起步均較早,2015年以來國(guó)外包括紐約時(shí)報(bào)、彭博都已經(jīng)開始應(yīng)用,國(guó)內(nèi)隨后也在做相關(guān)投入,比如新華社的“快筆小新”、第一財(cái)經(jīng)與阿里巴巴合作開發(fā)了“DT稿王”、南方都市報(bào)與北京大學(xué)團(tuán)隊(duì)合作研發(fā)的寫稿機(jī)器人“小南”等。AI機(jī)器人可以幫助精確檢索二手信息,收集素材。在高性能的AIGC工具如ChatGPT出現(xiàn)后,就可以像常人對(duì)話一樣直接提問并獲得答案。另外AIGC轉(zhuǎn)寫工具可以幫助記者實(shí)時(shí)生成文稿,自動(dòng)撰寫提綱、精簡(jiǎn)語句等,進(jìn)而提高工作效率,保證最終產(chǎn)出的時(shí)效性。目前AIGC撰稿工具能在一分鐘內(nèi)生成兩千條新聞,且單條質(zhì)量可比擬人類半小時(shí)的作品質(zhì)量。尤其是針對(duì)股市、重大體育賽事等新聞,會(huì)在關(guān)鍵時(shí)間點(diǎn)自動(dòng)撰寫新聞,編輯只需要做最終審校就可以發(fā)出,大幅提升了新聞的時(shí)效性,降低了編輯的工作量。目前AI機(jī)器人主要在財(cái)經(jīng)、體育和生活類等新聞中出場(chǎng),深度、調(diào)查報(bào)告等還需要人類記者完成,后續(xù)隨著技術(shù)的進(jìn)步,應(yīng)用面將拓寬。國(guó)內(nèi)代表性的機(jī)器人記者方案新聞寫稿機(jī)器人重點(diǎn)功能應(yīng)用功能具體應(yīng)用文本復(fù)述/改寫對(duì)原有文本進(jìn)行改寫,觀點(diǎn)一致,但寫作風(fēng)格和表達(dá)多樣語音交互通過口述查詢,自動(dòng)生成稿件,通過ChatGPT技術(shù)可以實(shí)現(xiàn)智能問答看圖寫話圖片、視頻的自動(dòng)生成。根據(jù)給定的圖片或者視頻,自動(dòng)生成可以描述圖片或者視頻內(nèi)容的稿件,類似于“看圖寫話”或是“看視頻寫話”。視頻寫稿根據(jù)現(xiàn)有文字提取摘要和關(guān)鍵詞,快速生成對(duì)應(yīng)的短視頻稿件。對(duì)編輯填寫的文本信息進(jìn)行語義分析,得到摘要與關(guān)鍵詞,并自動(dòng)搜索資源庫(kù)匹配關(guān)聯(lián)性最強(qiáng)的圖片、視頻、音頻素材,自動(dòng)制作成一段視頻智能模板生成通過持續(xù)訓(xùn)練,根據(jù)不同的內(nèi)容要求,自動(dòng)生成模板資料來源:搜狐網(wǎng)、新華網(wǎng)等、平安證券研究所32類人聊天機(jī)器人|虛擬數(shù)字人:形似到神似,活躍于客服、新聞制播等多個(gè)場(chǎng)景虛擬數(shù)字人是AIGC的重要應(yīng)用之一,利用人像、聲音生成等技術(shù),可以定制2D、3D的虛擬數(shù)字人,可以實(shí)現(xiàn)文本到視頻的輸出。目前,AIGC在該領(lǐng)域應(yīng)用更為成熟,智能化水平更高,輸出結(jié)果更為靈活和應(yīng)景,交流更為順暢,實(shí)現(xiàn)了從形似到神似的跨越。目前市場(chǎng)上的虛擬數(shù)字人可以充當(dāng)虛擬客服、數(shù)字員工、虛擬老師、虛擬主播、數(shù)字導(dǎo)游等角色,應(yīng)用于金融、傳媒、旅游、電子政務(wù)等多個(gè)場(chǎng)景,提供客戶服務(wù)和交互、課程制作、新聞制播、政務(wù)服務(wù)和查詢等多方面的功能,大幅提升了內(nèi)容制作輸出效率,保證了用戶的服務(wù)體驗(yàn)。目前,科大訊飛等人工智能企業(yè),均提供了虛擬數(shù)字人的解決方案。虛擬數(shù)字人制作流程虛擬數(shù)字人當(dāng)前面向的場(chǎng)景金融業(yè)新聞媒體數(shù)字員工電子政務(wù)旅游景點(diǎn)資料來源:科大訊飛、平安證券研究所33落地案例|游戲:AIGC與游戲賽道天然親和,數(shù)據(jù)資產(chǎn)生產(chǎn)等應(yīng)用將加速?gòu)S商產(chǎn)品應(yīng)用情況通過強(qiáng)化學(xué)習(xí)的方法來模仿真實(shí)玩家,包括發(fā)育、騰訊“絕悟”陪玩機(jī)器人運(yùn)營(yíng)、協(xié)作等指標(biāo)類別,以及每分鐘手速、技能釋放頻率、命中率、擊殺數(shù)等具體參數(shù),讓AI更接近正式服玩家真實(shí)表現(xiàn),將測(cè)試的總體準(zhǔn)確性提升到95%。rct
A智能NPC生成、劇情延展、智能Q&A、智能陪玩等智能NPC為例,其NPC能夠分析玩家的實(shí)時(shí)輸入,并動(dòng)態(tài)地生成交互反應(yīng),從而構(gòu)建幾乎無限目不重復(fù)的劇情,增強(qiáng)自戶體驗(yàn)并延長(zhǎng)游戲生命周期。網(wǎng)易游戲智能NPC、玩家智能對(duì)話武俠手游《逆水寒》宣布實(shí)裝國(guó)內(nèi)首個(gè)游戲版ChatGPT,讓智能NPC能和玩家自由生成對(duì)話,并基于對(duì)話內(nèi)容,自主給出有邏輯的行為反饋。該手游已經(jīng)獲得版號(hào),預(yù)計(jì)將于2023年年內(nèi)上線。行者AI游戲資產(chǎn)生成為游戲生成2D圖片、3D
環(huán)境、單體建筑、人物角色模型、虛擬數(shù)字人等復(fù)雜內(nèi)容生成。游戲是典型的資產(chǎn)復(fù)雜度非常高的娛樂形式,人力密集,研發(fā)人員持續(xù)膨脹,質(zhì)量、成本、效率不可能三角問題難解。AIGC與游戲具有天然的適配性,在圖片/視頻生成、虛擬玩家、音樂制作、劇情/策略開發(fā)等方面都有非常大的潛力,而且娛樂場(chǎng)景來自監(jiān)管、倫理、安全性等方面的壓力較小,落地較快。目前,AIGC正在為游戲中的數(shù)據(jù)資產(chǎn)建立模型,開發(fā)智能對(duì)話、智能陪玩、智能QA,并能夠通過劇情和策略生成等方式,豐富和延展游戲內(nèi)容,延展游戲壽命。通過AI生成,可以降低生產(chǎn)成本,提高效率,還能保證游戲質(zhì)量不下降,完美解決不可能三角問題。AIGC在游戲資產(chǎn)生成過程中的應(yīng)用
AIGC在國(guó)內(nèi)外落地案例資料來源:行者AI、平安證券研究所34落地案例|銀行:通過數(shù)字員工等形式試水AIGC,監(jiān)管、安全性問題需關(guān)注機(jī)構(gòu)AIGC技術(shù)應(yīng)用進(jìn)展寧波銀行開發(fā)了數(shù)字員工小寧,用于智慧大堂服務(wù)和線上營(yíng)銷等場(chǎng)景。工商銀行開發(fā)了數(shù)字員工工小智,提供線下支行網(wǎng)點(diǎn)大堂服務(wù),進(jìn)行產(chǎn)品介紹和營(yíng)銷。郵儲(chǔ)銀行將開始內(nèi)測(cè)文心一言,在智能客服、數(shù)字員工、虛擬營(yíng)業(yè)廳等場(chǎng)景進(jìn)行應(yīng)用,進(jìn)一步提升客戶體驗(yàn)。江蘇銀行嘗試運(yùn)用ChatGPT技術(shù)提升軟件開發(fā)生產(chǎn)力。招商銀行在智能客服、流程智能化等方面,廣泛應(yīng)用了大模型技術(shù)用于意圖識(shí)別、信息提取等具體工作。百信銀行把百度文心一言的智能對(duì)話技術(shù)成果應(yīng)用在數(shù)字金融、AI數(shù)字人、數(shù)字營(yíng)業(yè)廳等領(lǐng)域。中信銀行將接入文心一言生態(tài),在財(cái)富管理等場(chǎng)景嘗試應(yīng)用。興業(yè)銀行接入文心一言,用于智慧網(wǎng)點(diǎn)、智能服務(wù)、智能風(fēng)控、智能運(yùn)營(yíng)、智能營(yíng)銷、智能投研等。銀行是作為服務(wù)業(yè)的重點(diǎn)領(lǐng)域,數(shù)據(jù)豐富且質(zhì)量?jī)?yōu)秀,也是與AI融合的比較快的領(lǐng)域。此前,AI營(yíng)銷文案生成、數(shù)字員工(客服)等解決方案已經(jīng)得到應(yīng)用,承擔(dān)問題應(yīng)答、業(yè)務(wù)操作指引、查詢響應(yīng)和確權(quán)等職能。隨著ChatGPT的火爆,各家銀行正在探索AIGC進(jìn)一步為虛擬數(shù)字員工賦能,提升智能化水平,在內(nèi)外部溝通等環(huán)節(jié)中發(fā)揮更重要的作用。在銀行線下網(wǎng)點(diǎn),數(shù)字員工就充當(dāng)“服務(wù)型數(shù)字人”的角色,提升大堂的服務(wù)效率和服務(wù)質(zhì)量;線上業(yè)務(wù)可能將是各大銀行未來利用數(shù)字員工爭(zhēng)奪的重點(diǎn),會(huì)強(qiáng)調(diào)”數(shù)字人“IP的打造,樹立起銀行在虛擬世界的品牌形象,實(shí)現(xiàn)客戶的轉(zhuǎn)化,很多銀行已經(jīng)將數(shù)字員工應(yīng)用到線上的營(yíng)銷推廣中。后續(xù),AIGC處理復(fù)雜問題和創(chuàng)造性問題的能力也將持續(xù)提高,銀行業(yè)應(yīng)用面臨的監(jiān)管、安全性等問題也將逐步得到解決,AIGC在銀行領(lǐng)域的應(yīng)用范圍將擴(kuò)大。除了當(dāng)前正在應(yīng)用的客戶服務(wù)、營(yíng)銷運(yùn)營(yíng)和數(shù)字員工之外,未來在風(fēng)險(xiǎn)管控、經(jīng)營(yíng)態(tài)勢(shì)分析等領(lǐng)域也會(huì)有較大的應(yīng)用潛力。主要銀行機(jī)構(gòu)AIGC應(yīng)用情況
銀行機(jī)構(gòu)數(shù)字員工典型應(yīng)用對(duì)外對(duì)外場(chǎng)景包括存、貸、匯、監(jiān)等一系列金融業(yè)務(wù)服務(wù):網(wǎng)點(diǎn)客戶服務(wù)、交流結(jié)合用戶特征定制專屬方案,成為客戶的“專屬顧問”,并在交互過程中識(shí)別用戶情感,通過話術(shù)激發(fā)用戶興趣、引導(dǎo)用戶選擇產(chǎn)品在用戶不感興趣時(shí)進(jìn)行挽留、適時(shí)推薦其他產(chǎn)品,充分給予用戶優(yōu)質(zhì)體驗(yàn)。對(duì)內(nèi)場(chǎng)景,數(shù)字員工可以充當(dāng)智慧助手:解答員工問題,及時(shí)提醒待辦日程,快速辦理日常事務(wù),提升員工幸福感為員工制定專屬的崗位培訓(xùn)計(jì)劃,提供專業(yè)的職業(yè)發(fā)展建議,加速員工成長(zhǎng)HR的“分析助手”,對(duì)員工數(shù)據(jù)進(jìn)行整合挖掘,形成員工畫像和關(guān)系圖譜,協(xié)助HR評(píng)估員工能力、調(diào)優(yōu)人員配置對(duì)內(nèi)資料來源:《金融電子化》、工商銀行等、平安證券研究所目錄焦點(diǎn):ChatGPT帶火AIGC,Open
AI引領(lǐng)技術(shù)和生態(tài)1變革:AIGC與人更為神似,模型和數(shù)據(jù)是主要助力2市場(chǎng):大模型需要大算力,推動(dòng)AI服務(wù)器市場(chǎng)增長(zhǎng)3應(yīng)用:行業(yè)將逐步回歸理性,能否突破需要看B端4投資建議及風(fēng)險(xiǎn)提示535投資建議及風(fēng)險(xiǎn)提示36投資建議:近年來AIGC的算法、數(shù)據(jù)質(zhì)量等要素有著顯著提升,文本、圖片/視頻、代碼等技術(shù)能力快速發(fā)展,在客服、營(yíng)銷、游戲等賽道都顯示出非常強(qiáng)的應(yīng)用潛力。伴隨著chatGPT的催化,國(guó)內(nèi)AIGC產(chǎn)業(yè)鏈也將迎來空前的市場(chǎng)機(jī)會(huì)。算法方面,預(yù)計(jì)今年國(guó)內(nèi)龍頭AI廠商有希望推出能力接近c(diǎn)hatGPT的產(chǎn)品;算力是短板,由于供應(yīng)鏈的問題,我國(guó)高端訓(xùn)練芯片供給可能面對(duì)較大的壓力,AI算力不足的問題可能顯現(xiàn),相關(guān)設(shè)備研發(fā)和基礎(chǔ)設(shè)施建設(shè)企業(yè)可能繼續(xù)受益。同時(shí),AIGC新技術(shù)也會(huì)帶來新的安全挑戰(zhàn),國(guó)產(chǎn)安全廠商也將受益。強(qiáng)烈推薦啟明星辰,推薦科大訊飛、金山辦公、中科曙光、浪潮信息、紫光股份等;關(guān)注AI廠商后續(xù)發(fā)展機(jī)會(huì),如云從科技、海天瑞聲、云天勵(lì)飛(待上市,已同意注冊(cè))。風(fēng)險(xiǎn)提示:1)技術(shù)落地可能不及預(yù)期。目前chatGPT處于市場(chǎng)炒作高點(diǎn),未來將面臨著市場(chǎng)落地的考驗(yàn),由于技術(shù)本身尚需持續(xù)完善,能否跨越商業(yè)化的“死亡之谷”仍待觀察。2)來自監(jiān)管和版權(quán)方面的風(fēng)險(xiǎn)。AIGC生成內(nèi)容還主要依賴現(xiàn)有素材,可能產(chǎn)生版權(quán)糾紛,同時(shí)生成內(nèi)容版權(quán)的認(rèn)定還存在爭(zhēng)議,商業(yè)化可能面臨障礙;在一些特定場(chǎng)景,AIGC可能受到監(jiān)管的限制;3)國(guó)內(nèi)AI供應(yīng)鏈斷裂的風(fēng)險(xiǎn)??赡艹霈F(xiàn)芯片、軟件和算法等供給限制更為嚴(yán)格的情況,國(guó)內(nèi)研發(fā)和商業(yè)化可能受到?jīng)_擊。重點(diǎn)推薦標(biāo)的37股票簡(jiǎn)稱股票代碼2月27日EPS(元)PE(倍)評(píng)級(jí)收盤價(jià)(元)2021A2022E2023E2024E2021A2022E2023E2024E啟明星辰002439.SZ28.680.900.921.231.5731.931.223.318.3強(qiáng)烈推薦科大訊飛002230.SZ47.790.670.250.710.9571.3191.267.350.3推薦金山辦公688111.SH288.712.262.423.424.73127.7119.384.461.0推薦浪潮信息000977.SZ37.241.371.632.002.4727.222.818.615.1推薦紫光股份000938.SZ24.480.750.861.071.3332.628.522.918.4推薦中科曙光603019.SH31.410.791.021.311.6439.830.824.019.2推薦重點(diǎn)標(biāo)的|科大訊飛——智能語音領(lǐng)軍企業(yè)科大訊飛成立于1999年,是亞太地區(qū)知名的智能語音和人工智能企業(yè)。公司作為技術(shù)創(chuàng)新型企業(yè),其智能語音、自然語言理解、計(jì)算機(jī)視覺等核心技術(shù)處于國(guó)際領(lǐng)先水平,已入駐“中國(guó)人工智能國(guó)家隊(duì)”。公司以“平臺(tái)+賽道”戰(zhàn)略為指引,2B+2C雙輪驅(qū)動(dòng)產(chǎn)品落地。公司構(gòu)建了以智能語音和人機(jī)交互為核心的“訊飛開放平臺(tái)”,并在此基礎(chǔ)上推動(dòng)產(chǎn)品及服務(wù)在消費(fèi)者、智慧教育、智慧城市、智慧司法、智能汽車、智慧醫(yī)療、運(yùn)營(yíng)商等領(lǐng)域的深度應(yīng)用。截至2022年5月31日,訊飛開放平臺(tái)已開放493項(xiàng)AI產(chǎn)品及能力,聚集超過337.3萬開發(fā)者團(tuán)隊(duì),總應(yīng)用數(shù)超過150.1萬,累計(jì)覆蓋終端設(shè)備數(shù)35.1億+。公司營(yíng)收及歸母凈利潤(rùn)情況公司AI產(chǎn)品全棧布局資料來源:公司官網(wǎng),WIND2022年前三季度,公司實(shí)現(xiàn)營(yíng)業(yè)收入126.61億元(+16.50
);實(shí)現(xiàn)歸母凈利潤(rùn)4.20億元(-42.34
);EPS為0.18元。預(yù)計(jì)20
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 課題申報(bào)參考:教育家精神引領(lǐng)高校思政課教師職業(yè)素養(yǎng)評(píng)價(jià)體系建構(gòu)研究
- 二零二五版鋁合金建筑模板采購(gòu)協(xié)議書4篇
- 商場(chǎng)內(nèi)品牌專賣店裝修許可協(xié)議(2025年)2篇
- 2025年度苗木種植與林業(yè)產(chǎn)業(yè)發(fā)展合作合同4篇
- 二手房合作投資合同模板2024版B版
- 二零二五年度人工智能教育培訓(xùn)合同補(bǔ)充協(xié)議6篇
- 二零二五年度旅行社與航空公司合作協(xié)議書3篇
- 2025年度品牌跨界合作與品牌授權(quán)合作協(xié)議4篇
- 二零二五版?zhèn)€人貸款居間中介服務(wù)協(xié)議書6篇
- 2025年度個(gè)人房產(chǎn)抵押借款合同規(guī)范文本8篇
- 【寒假預(yù)習(xí)】專題04 閱讀理解 20篇 集訓(xùn)-2025年人教版(PEP)六年級(jí)英語下冊(cè)寒假提前學(xué)(含答案)
- 2024年智能監(jiān)獄安防監(jiān)控工程合同3篇
- 2024年度窯爐施工協(xié)議詳例細(xì)則版B版
- 幼兒園籃球課培訓(xùn)
- 【企業(yè)盈利能力探析的國(guó)內(nèi)外文獻(xiàn)綜述2400字】
- 統(tǒng)編版(2024新版)七年級(jí)《道德與法治》上冊(cè)第一單元《少年有夢(mèng)》單元測(cè)試卷(含答案)
- 100道20以內(nèi)的口算題共20份
- 高三完形填空專項(xiàng)訓(xùn)練單選(部分答案)
- 護(hù)理查房高鉀血癥
- 項(xiàng)目監(jiān)理策劃方案匯報(bào)
- 《職業(yè)培訓(xùn)師的培訓(xùn)》課件
評(píng)論
0/150
提交評(píng)論