ChatGPT不斷突破AI駛入快車道_第1頁
ChatGPT不斷突破AI駛入快車道_第2頁
ChatGPT不斷突破AI駛入快車道_第3頁
ChatGPT不斷突破AI駛入快車道_第4頁
ChatGPT不斷突破AI駛入快車道_第5頁
已閱讀5頁,還剩47頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

開源證券 開源證券 行業(yè)研究行業(yè)深度報告2023年02月22日投資評級:看好(維持)行業(yè)走勢圖———計算機——滬深300數據來源:聚源相關研究報告相關研究報告《數據庫:潛力空間大,替代正當時一行業(yè)深度報告》-2023.2,21行業(yè)周報》-2023.2.19源證券證券研究報告《周觀點:巨頭紛紛入場,AIGC加速落地一行業(yè)周報》-2023.2.12源證券證券研究報告——行業(yè)深度報告陳寶健(分析師)閆寧(聯系人)●ChatGPT:AIGC現象級應用,商業(yè)化落地ChatGPT上線后熱度持續(xù)提升,已超過TikTok成為活躍用戶增長最快的產品。英偉達CEO黃仁勛表示“ChatGPT相當于AI界的Phone問世”。目前ChatGPT已開啟商業(yè)化探索,面向B端開放接口對外輸出服務(如與微軟Bing的結合);年將實現2億美元收入,2024年將超過10億美元,未來成長空間廣闊。網頁,原始數據規(guī)模達45TB,訓練效果大幅提升。(3)算力:微軟AzureAI是OpenAI獨家云計算供應商,所用超算擁有285,000個CPU內核、約10,000個AIGC在AI技術創(chuàng)新(生成算法、預訓練模型、多模態(tài)技術等)、產業(yè)生態(tài)(三層生態(tài)體系雛形已現)和政策支持(北京經信局表示支持頭部企業(yè)打造對標發(fā)展趨勢報告,預計2030年AIGC市場規(guī)模將達1100億美元,前景廣闊。合ChatGPT。目前已推出引入ChatGPT技術的搜索引擎NewBing,經過測試(2)谷歌:2023年2月谷歌推出對標ChatGPT的對話機器人Bard。Bard基于谷歌LaMDA模型,參數量最高達1370億,LaMDA已經在多個維度接近人類水(3)百度:百度在AI領域深耕數十年,在芯片、深度學習框架、大模型以及應用已形成全棧布局,已有文心一格(AI作畫)、文心百中(產業(yè)搜索)產品落地。2023年2月,百度推出聊天機器人“文心一言”,目前生態(tài)合作伙伴近300家,●投資建議請務必參閱正文后面的信息披露和法律聲明2/32開源證券行業(yè)深度報告 42、大模型+大數據+高算力,ChatGPT不斷突破 62.1、預訓練大模型:GPT大模型多次迭代,訓練結果持續(xù)優(yōu)化 6 2.3、算力:微軟是獨家云計算供應商,預計每月成本近 3、技術、產業(yè)、政策共振,AIGC迎加速發(fā)展 4、巨頭積極布局,產業(yè)落地加速 4.2、谷歌:推出對標產品Bard,或將與微軟正面競爭 4.4、國內其他巨頭也紛紛布局,產業(yè)落地加速 275、投資建議 296、風險提示 圖表目錄圖1:ChatGPT是OpenAI于2022年11月30日發(fā)布的通用型對話系統(tǒng) 4圖2:大型語言模型在多項測試中已經超過人類 5圖3:GhatGPT日活用戶超過1000萬人 5 6 6 7圖7:GPT-3系列已經發(fā)展出50多種模型 7 8圖9:ChatGPT通過RLHF優(yōu)化訓練結果 8圖10:InstructGPT相比GPT-3更符合人類偏好 9圖11:InstructGPT較GPT-3毒性降低 9 9 9 圖15:CommonCrawl英文數據占比約45% 圖19:AI技術持續(xù)突破創(chuàng)新,引領AIGC產業(yè)發(fā)展 圖20:預訓練模型通過大數據和巨量參數的訓練,生成質量顯著提升 圖21:預訓練大模型從單模態(tài)向多模態(tài)的發(fā)展 圖22:AIGC產業(yè)生態(tài)持續(xù)完善 圖23:微軟與OpenAI持續(xù)深度合作 圖24:微軟ChatGPT版Bing,可以自動抓取關鍵內容并生成回答 圖25:2022年12月Google、Bing在搜索領域的市場份額分別為84.08%、8.95% 圖26:2018年谷歌推出自然語言預訓練模型BERT 請務必參閱正文后面的信息披露和法律聲明3/32開源證券行業(yè)深度報告 圖29:Bard基于谷歌LaMDA模型 20圖31:昆侖芯2單卡算力達128TFLOPS 21圖32:第三代昆侖芯3將采用4nm制程 21 圖35:百度已發(fā)布4個基礎通用大模型以及11個行業(yè)大模型 22 23 23 23 24 24圖41:百度ERNE3.0可節(jié)省50%訓練時間 27圖44:阿里多模態(tài)大模型M6參數規(guī)模達10萬億 圖45:科大訊飛已開源了6大類、超過40個通用領域的中文預訓練語言模型 表1:ChatGPT數據主要來自CommonCrawl、新聞、帖子、書籍及各種網頁 表2:GPT-3預訓練數據量大幅提升 表3:“文心一言”生態(tài)圈持續(xù)擴大 表4:受益標的盈利預測和估值 開源證券ChatGPT是AIGC領城現象級應用。ChatGPT是美國AI公司OpenAI于2022年11月30日發(fā)布的通用型對話系統(tǒng),可以通過模擬對話的形式完成編程、問答、文本生成等任務。ChatGPT的持續(xù)火熱,成為AIGC領域現象級應用,為后續(xù)商業(yè)化和應用落地打開廣闊空間,也為以自然語言處理為核心的認知智能技術提供廣闊發(fā)展機遇。英偉達CEO黃仁勛表示“ChatGPT相當于AI界的iPhone問世”。圖1:ChatGPT是OpenAI于2022年11月30日發(fā)布的通用型對話系統(tǒng)UserhelpmewriteashortnotetointroducemyselftIamwritingtointroducemysChatGPT在多項測試中超過人類。2022年,包括ChatGPT在內的許多大模型的測試表現已經超出人類。目前ChatGPT已經通過SAT考試、商學院考試、美國律師資格、注冊會計師、醫(yī)師資格等高難度考試,IQ測試達83,已經具備取代無意義請務必參閱正文后面的信息披露和法律聲明5/32開源證券圖2:大型語言模型在多項測試中已經超過人類UKnationalmathexamUKnationalmathexamIObenchmarksmnwzuaoeChatGPT上線后熱度持續(xù)提升,已超過TikTok成為活躍用戶增長最快的產品。ChatGPT發(fā)布一周用戶數就突破100萬人,月訪問量達2100萬人次。目前ChatGPT尚未披露具體的日活用戶數,根據ARK數據,截至2023年1月,預計ChatGPT全球日活用戶超過1000萬人。chatGPTDaily0ChatGPT商業(yè)化已經落地,未來成長空間廣闊。面向B端,ChatGPT可以開放接口對外輸出服務,如與微軟Bing的結合;面向C端,2023年2月,ChatGPT已推出收費的Plus版本,月度費用為20美元/月,并表示未來或將探索價格更低的訂閱方案、2B的商業(yè)方案以及數據包等選項。根據OpenAI預測,2023年將實現收入2請務必參閱正文后面的信息披露和法律聲明6/32開源證券圖4:ChatGPT已推出收費的2.1、預訓練大模型:GPT大模型多次迭代,訓練結果持續(xù)優(yōu)化ChatGPT是以Transformer為基礎的預訓練模型。GPT的全稱為GenerativePre-TrainedTransformer,即生成式預訓練Transfomer模型。預訓練模型是指通過挖掘利用大規(guī)模無標注數據,學習數據中的知識與規(guī)律,然后針對特定任務,通過微調、手工調參等階段,進入到可以大規(guī)模、可復制的大工業(yè)落地階段。Transformer模型來自谷歌2017年發(fā)表的論文《Attentionisallyouneed》,是一種采用自注意力機制的深度學習模型,模型按照輸入數據各部分的重要性的不同而分配不同的權重。Transformer的優(yōu)勢在于:(1)采用并行訓練,大幅提高了訓練效率;(2)在分析預測更長的文本時,對間隔較長的語義具有更好的關聯效果。AI任務智能對話AI任務智能對話智能問答專業(yè)少具數據: 新的研發(fā)范式:分散任務模型->集約到可以大規(guī)模、可復制的大工業(yè)落地開源證券GPT大模型經過多次迭代,參數量大幅提升。谷歌發(fā)表Transformer論文后的第二年(即2018年),OpenAI推出基于Transformer的第一代GPT模型,隨后陸續(xù)月推出第三代GPT-3模型,參數量達1750億,較上一代GPT-2(參數量15億)提升了兩個數量級,是微軟同年2月推出的T-NLG模型(參數量170億)的10倍,GPT-3系列已經發(fā)展出50多種模型。GPT-3模型推出后,已陸續(xù)發(fā)展出面向不DALL-E(圖片生成)等。CodeX經過自然語言和幾十億行代碼的訓練,可以完成Python、JavaScript等十幾種語言的代碼任務。DALL-E于2021年5月推出,可圖7:GPT-3系列已經發(fā)展出50多種模型aaodrworchadt開源證券是一種大型通用語言模型,可以處理各種語言處理任務,ChatGPT是一個較小的專用模型,專為聊天應用程序設計。ChatGPT訓練包括三個步驟:(1)預訓練一個語言模型(LM);(2)聚合問答數據并訓練一個獎勵模型(RewardModel,RM);(3)用強化學習(RL)方式微調LM。此外,因為引入了代碼作為訓練語料,ChatGPTTApromptandC6ApromptandC6outputsfrombestclculatesarewwd通過眾包團隊大規(guī)模開展生成結果好壞的人工標注,經過多次迭代,使得大模型生成結果更加無偏見和符合人類預期,實現了“智慧涌rostucbustickHumuctuspuvin,he_開源證券(1)更符合人類偏好。InstructGPT是在GPT-3微調而來,經過人類反饋強化學習后,InstructGPT相比GPT-3,在71%-88%的情況下更符合人類偏好。率較GPT-3提升約一倍(0.413vs0.22圖10:InstructGPT相比GPT-3更符合人類偏好InstructOPTisbetterthanOPT-3atfoiPoPTExpiainPoPTExpiainthemoonlandingtoa6yeaEplainteteoryofgityto6yrol0199SupervisedFinChatGPT相比InstructGPT:在有效性和無害性方面有所提升。布如何在2015年來到美國?”,ChatGPT會回答“哥倫布在1506年去世,所以他不圖12:ChatGPT的信息相比InstructGPT更加有效differentexperiencetaatuetChristopherColumbuscamethadalwayswantedtovisittheUSan圖13:ChatGPT在無害性方面也有所提升detrimentaleffectsonboththepersonbeingbuliedaTauerseTThereareafewwaystobullyJohnDoe.[GeneSampleSof3Prerdiou開源證券2.2、數據:數據量提升顯著優(yōu)化大模型表現Crawl、網頁、書籍、維基百科對于訓練的貢獻量分別為60%、22%、16%、3%。英文維基百科全部內容包含約30億tokens,僅占到訓練數據量的3%。表1:ChatGPT數據主要來自CommonCrawl、新聞、帖子、書籍及各種網頁CommonCrawl(CC)是一個從網絡抓取數據并免費開放的非盈利組織了2008年以來的原始網頁、元數據和抓取文本,數據規(guī)模達PB級別,其中英文數據占比約45%,中文數據占比約5%。CC數據庫的應用場景包括訓練NLP模型、網絡抓取和機器學習等,CC數據庫對于AI的意義堪比Google對于互聯網的意義,重點研究實驗室一般會選取純英文過濾版(C4)作為數據集。%%%%43112·TheCommenCtoopuscontsirspetsbytosofdsacoTheCommenCawdatasthesonAmazonS3spartSporsorshpsprogramYoucandonrAsheCommanCraFounaccomparythecrasisthe的預訓練數據規(guī)模約40GB,約有100億個tokens;GPT-3的預訓練數據是由45TB的原始語料清洗而來,數據規(guī)模達570GB,約有4900億個tokens。GPT-2模型參數準確性也得到大幅提升,已經可以生成高質量文本,讓人難以確定是請務必參閱正文后面的信息披露和法律聲明11/32開源證券表2發(fā)布時間2018年6月2019年2月2020年5月詞向量長度1.17億15億1,750億圖16:GPT-3預訓練數據量大幅提升ChatGPT局限:(1)ChatGPT的知識有限。ChatGPT的預訓練數據庫只更新至2021年,無法進行聯網更新,因此不能理解和回答2021年之后發(fā)生的事情;(2)真實性無法保障。ChatGPT的部分訓練是基于從互聯網上搜集的數據,因此它的輸出結果經常受到偏見和不準確信息的影響,無法保證真實性。Itcannotaccesstheinte請務必參閱正文后面的信息披露和法律聲明12/32開源證券微軟AzureAI是ChatGPT獨家云計算供應商。根據OpenAI于2018年的統(tǒng)計,自2012年以來,AI訓練任務所運用的算力每3.43個月就會翻倍,算力需求每年長10倍。ChatGPT訓練的硬件為超級計算機,2019年,微軟向OpenAI投資10億美元,雙方將共同開發(fā)AzureAI超算技術,微軟也成為OpenAI獨家云計算供應商。OpenAI提供訓練的超級計算機擁有約285,000個CPU內核、約10,000個GPU,每個GPU服務器擁有約400GB/s的網路連接速度。預計ChatGPT每月成本約為900萬美元。根據OpenAI的CEOSamAltman在中一部分來自Azure云服務。我們假設ChatGPT日活用戶為1000萬人,每次完整對話的成本為3美分,可測算得ChatGPT每日成本約為30萬美元,月度成本約為900萬美元。0請務必參閱正文后面的信息披露和法律聲明13/32開源證券Diffusionmodels等深度學習生成算法持續(xù)涌現,在自然語言處理(NLP)、計算機視覺(CV)等領域持續(xù)應用。比如谷歌的BERT和LaMDA、OpenAI的GPT-3預訓練模型均基于Transformer模型而來,為后續(xù)ChatGPT等應用的落地奠定基礎。預訓練模型、(2)預訓練模型方面:2018年,谷歌推出自然語言預訓練模型BERT,AI進入預訓練大模型時代。相比之前的生成模型,預訓練模型通過大數據和巨量參數的訓練,生成質量顯著提升,滿足下游場景對高精度、高質量的要求,成為了AI技術發(fā)展的范式變革,引發(fā)了AIGC產業(yè)的質變。在自然語言處理領域,大模型的自然語言理解能力超越了人類,并且體現出了超強的通用AI能力。在計算機視覺領域,預訓練大模型的效果也超越了之前的監(jiān)督學習方法,在視覺分類、圖像分割等任務中取得了很大提升,且表現出了強大的圖像理解能力。圖20:預訓練模型通過大數據和巨量參數的訓練,生成質量顯著提升預訓練大模型的發(fā)展歷史NssTee-23008ERNEIb-708GPT3-0000V?0白旨學習海量數據:任務無關海量數據:任務無關開源證券(3)多模態(tài)技術方面:多模態(tài)技術是指將圖像、聲音、文字等多類型內容融合學習,比如將“人”這一文本與人的圖片聯系在一起。從單模態(tài)向多模態(tài)的發(fā)展,豐富了AIGC的內容,使AIGC應用更具有通用性,在視覺問答、視覺推理等任務中取得了非常好的效果。比如OpenAIDALL-E和百度的文心ERNIEViLG,根據用圖21:預訓練大模型從單模態(tài)向多模態(tài)的發(fā)展預訓練大模型模態(tài)發(fā)展趨勢大模的自然言理解被力超人類大模的自然言理解被力超人類"的芯片和數據服務支撐、基礎算法平臺以及下游的行業(yè)應用。感疆A品快手A哪自然酒直的宗東AXOpenAI宗東AXOpenAIBanA的相質品快手2~Tencen片料些nW料些nW來源:10C,2022對于巳公開發(fā)西市場識的市場,本場空起33-5的廣e經被對于DC未公開發(fā)市沛場域,歷的開源證券(1)基礎算法平臺方面,預訓練大模型需要高成本和技術投入,具有較高的技(2)下游的行業(yè)應用方面,大模型的落地痛點在于成本高昂的通用大模型與下游垂直應用場景需求的不匹配。隨著ChatGPT熱度持續(xù)提升以及大廠的持續(xù)投入,持頭部企業(yè)打造對標ChatGPT的大模型,著力構建開源框架和通用大模型的應用生態(tài)。加強人工智能算力基礎設施布局。加速人工智能基礎數據供給。支持人工智能優(yōu)勢企業(yè)在自動駕駛、智能制造、智慧城市等優(yōu)勢領域開展創(chuàng)新應用,全面構筑人預計2030年AIGC市場規(guī)模將達1100億美元。根據騰訊研究院發(fā)布的AIGC發(fā)展趨勢報告,AIGC在AI技術創(chuàng)新(生成算法、預訓練模型、多模態(tài)技術等)和產業(yè)生態(tài)(三層生態(tài)體系雛形已現)的支持下,有望步入發(fā)展快車道,預計2030年AIGC市場規(guī)模將達1100億美元。開源證券4、巨頭積極布局,產業(yè)落地加速微軟與OpenAI持續(xù)深度合作,是其獨家云服務供應商。2019年7月,微軟對OpenAI投資10億美元,OpenAI將服務移植在MicrosoftAzure上運行,微軟將成為OpenAI新技術商業(yè)化的首選合作伙伴。2020年9月,微軟獲得OpenAI的GPT-3模型獨家授權,OpenAI將繼續(xù)向公眾提供API,只有微軟可以訪問GPT-3的底層代碼,并可以根據需要嵌入或修改模型。2023年1月,微軟AzureOpenAI服務對外發(fā)布,企業(yè)客戶可以申請訪問OpenAI旗下GPTconversationalspeecrecognition. featurespoweredbyGPT nowgenerallyavailable.ChatGPTcomipartnershiptoacceleratebreakthroughsinAl.programmerthattakesadvantageoftheOpenAICodexmodeltosuMicrosoftannouncesAIbreakthrouService,newDesignerapp,andBingI資料來源:微軟官網微軟計劃將ChatGPT整合進所有產品。2023年2月2日,微軟宣布旗下所有產品將全線整合ChatGPT,進一步加大與ChatGPT合作。2023年2月7日,微軟推我提問吧”的對話框,用戶提出問題后,搜索引擎可以自動抓取關鍵內容并生成回請務必參閱正文后面的信息披露和法律聲明17/32開源證券 我需費為6位不吃宰果和海鮮的人辦一桌晚宴,你建議一個3道菜的菜單嗎?我已經有紅警了,你用它來做主菜嗎?場份額有望提升。··9696Google→bing-Yahoo!→Baidu→開源證券2018年,谷歌推出自然語言預訓練模型BERT。BERT(BidirectionalEncoder數據采用了開源語料BooksCropus以及英文維基百科數據,共有約33億個詞。參數EE頁LK谷歌已將BERT模型用于改善披素。BERT模型可以借助某個單詞前后的詞來考慮其所處的完整語境,應用于搜索引擎后,更好的理解用戶搜索意圖。2019年,谷歌宣布將BERT模型應用于用于英文搜索,隨后又拓展至70余種語言,2020年谷歌表示幾乎所有英文搜索應用了BERT模型。BEFOREtpWasinganPat:20140321tapeofavisawhoutavisand…Australa,JapanandCannolongornooaviatowashTourism&Vsilr|US.Embassyinganenl,lousishavdingtotheUnledSvaidB2was.Thatisuresstheyaecigtietotaw是由LaMDA提供支持的全新實驗性對話谷歌AI服務,尋求將世界知識的廣度與谷歌大型語言模型的力量、智慧和創(chuàng)造力相結合。它利用來自網絡的信息提供最新、開源證券圖28:2023年2月,谷歌推出對標ChatGPT的對話機器人BardC資料來源:谷歌官網Bard基于谷歌LaMDA模型,表現已接近人類水平。LaMT0資料來源:谷歌官網請務必參閱正文后面的信息披露和法律聲明20/32開源證券未來谷歌AI技術將率先應用于搜索業(yè)務。在AI領域,谷歌已有LaMDA、PaLM、Imagen、MusicLM等技術儲備,涵蓋語言、圖像、視頻和音頻領域,未來將陸續(xù)整合進公司旗下產品。谷歌表示,AI技術將率先應用于搜索業(yè)務,自動提煉搜索結果便于了解全局。目前微軟已經推出整合ChatGPT版本的搜索引擎NewBing,未來或將與谷歌展開正面競爭。AipssNeOSoyong回fingerandhandmovemertsaremorenetndkeamkgsndmemoriinOtherssaythatitseaslerthegitarandyoucoudpickupastrummMusicteachersohenrobegrnerspracticeforatleastThourperday.Togettoanikermediattakas3-6morthaofrogulirpracticetoguar,and6-18monthsforpi回Therearemryoorstslssonsyoucanlookthenesttimeyouesargarng.Here·Orionssuperbighta·thengkedeye.evenwithalightpoluted·Csskpelisisfmousforisda·shperdhometosomeofthebiptststasinheng·Fgusisthesnerthiwgest·constolations.andyoucothersars.constelbotipdarrgpanetstnudpu開源證券百度是國內最有實力推出對標ChatGPT產品的廠商之一。百度在AI領城深耕智能四層架構中已形成全棧布局,擁有產業(yè)級知識增強文心大模型,具備跨模態(tài)、跨語言的深度語義理解與生成能力。(1)芯片:百度自研AI芯片昆侖芯2單卡算力達128TFLOPS。2018年,百度在AI開發(fā)者大會上發(fā)布自主研發(fā)中國首款云端全功能AI芯片“昆侖芯”。2021年8月,百度第二代昆侖芯開始量產,昆侖芯2基于7nm制程,單卡算力達到128TFLOPS,較第一代性能提升2-3倍,可應用于計算機視覺、自然語言處理、大規(guī)模語音識別、大規(guī)模推薦等場景。第三代昆侖芯3將采用4nm制程,預計2024年初量產。離內在第2代云端通用人工智能計算處理器(2)深度學習框架:百度飛槳是國內規(guī)模第一的深度學習框架和賦能平臺。飛槳(PaddlePaddle)是百度自主研發(fā)的開源深度學習平臺,包括深度學習核心框架、截至2022年1月,飛槳平臺已匯聚535萬開發(fā)者,基于飛槳構建了67萬個模型,服務了20萬家企事業(yè)單位。飛漿企業(yè)版飛槳開源深度學習平臺自動化深度學習強化學習多任務學習聯邦學習圖神經網絡盤子機器學習文對陽e請務必參閱正文后面的信息披露和法律聲明22/32開源證券(3)大模型:百度在大模型領域積累深厚,已發(fā)布4類基礎通用大模型以及11個行業(yè)大模型。百度文心包括NLP大模型、CV大模型、跨模態(tài)大模型和生物計算四個基礎通用大模型;在行業(yè)領域,百度聯合不同領域行業(yè)頭部企業(yè),已發(fā)布11個行業(yè)大模型,涵蓋涵蓋電力、燃氣、金融、航天、傳媒、城市、影視、制造、社科等領域,產業(yè)生態(tài)初步形成。ERNIE擁有一系列可以執(zhí)行各種功能的高級LLM,而語言生成來自ERNIE3.0Titan,其文本到圖像生成來自ERNIE-ViLG。newrecordOoo201932019.7201912202012020.32020520207202012202112021320215g文心一格文心百中AI藝術和平臺大模盟驅動的產業(yè)級措家系統(tǒng)數據標注與處理大模型精調大模型壓縮高性能都署深燃-百度文心吉利-百度文心奉康-百度文心TCL-百度文心化合物表征學習圖網絡ERNE-Sage5ATERNE30TryEFNE30鵬城-百度文心EPNE30Zeus多任務學習VIMER-TCR白監(jiān)督視覺表征學習請務必參閱正文后面的信息披露和法律聲明23/32開源證券(4)產品和應用:文心ERNIE大模型已在百度百余個產品中應用。包括百度搜索中問題分類、網頁排序;Feed流中的新聞推薦、新聞去重;好看視頻中的視頻推薦;百度地圖里的POI檢索以及小度智能屏中的意圖理解等,都使用到了文心ERNIE大模型。圖36:文心ERNIE大模型已在百度百余個產品中應用新聞去重召回率視頻推都召國率新聞去重召回率視頻推都召國率信息搜素滿意度問題分類準銷事4.5%個意圖理解準確率百度已文心一格(AI作畫)、文心百中(產業(yè)搜索)產品落地。文心一格是AI藝術與輔助創(chuàng)作平臺,輸入關鍵詞即可生成畫作,降低內容生產成本。2022年11月,百度推出大模型驅動的產業(yè)級搜索系統(tǒng)“文心百中”,由百度搜索與文心大模型聯合研制,命名寓意搜索結果精準,相比傳統(tǒng)搜索系統(tǒng)可減少人力成本90%以上。文心一格:讓Al文心一格:讓Al作畫普惠大眾,提升創(chuàng)作效率·大眾用戶:零門幅、個性化生成、直按使用·內容創(chuàng)作者:人機共創(chuàng),激發(fā)靈感,大幅握效圖38:百度推出產業(yè)級搜索系統(tǒng)“文心百中”文心百中:大模型驅動的產業(yè)級搜索系統(tǒng)文心百中:大模型驅動的產業(yè)級搜索系統(tǒng)極簡系統(tǒng)極應用化百度即將推出對標ChatGPT的AI聊天機器人“文心一言”。2023年2月,百度宣布即將推出類似ChatGPT的對話式AI工具“文心一言”(ERNIEBot),文心一言是百度基于文心大模型技術推出的生成式對話產品,目前正處于內測階段,預計2023年3月完成內測后向公眾開放。開源證券圖39:百度即將推出對標ChatGPT的AI聊天機器人“文心一言”資料來源:百度公眾號文心一言預計將建立在全球最大中文單體預訓練模型ERNIE3.02021年12月,百度與鵬城自然語言處理聯合實驗室發(fā)布全球首個知識增強的千億的1750億多出48.6%,在復雜知識推理能力上較GPT-3提升8個百分點。ERNIE3.0Titan已在60多項的NLP任務上取得了世界領先,在SuperGLUE和GLUE都超過語言理解能力顯著提升:業(yè)界領先的復雜知識推理能力語言理解能力顯著提升:業(yè)界領先的復雜知識推理能力(不加08的大膜型)資料來源:AI大模型公眾號技術層面,ERNIE3.0基于飛槳4D混合并行技術,訓練時間可以節(jié)省50%。算顆HUAWEIAscend910AI處理器和2048顆鯤鵬920CPU處理器,可以提供1EOPS智能算力,即不低于每秒100億億次操作的AI計算能力。開源證券>于大福模需合井行相架,可支持干億模型訓,并克成3750ZTokans充分訓完或3750z個okens 圖42:ERNIE3.0基于"鵬城云腦Ⅱ"高性能集群訓練“文心一言”生態(tài)圈持續(xù)擴大。2月17日,百度集團執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖宣布“文心一言”將通過百度智能云對外提供服務,會率先在內容和信息相關的行業(yè)和場景落地。目前已經有包括互聯網、媒體、金融、保險、汽車、企業(yè)軟件等行業(yè)的近300家企業(yè)宣布加入百度“文心一言”生態(tài),生態(tài)困持續(xù)擴大。上市公司方面,已有多家公司宣布成為文心一言首批生態(tài)合作伙伴,未來將優(yōu)先接入文心一言的能力,未來也將在垂直領域開展更多合作。表3:“文心一言”生態(tài)圖持續(xù)擴大上市公司合作內容別在5G消息CSP管理平臺及數據智能、企業(yè)直播、AR及視頻內容制作等方面有合作,未作的可能。先AI技術的加持,未來將把成果應用于企業(yè)管理領域數字化轉型的業(yè)務場景公司已參與接入百度的“文心一言”首批體臉。銀之杰將利國光電器公司是人工智能語音交互硬件的供應商,百度是公司的客戶,其中以智能音響為代表的AI+IOT產品是公司重點合作方向之一,公司密切關注ChatGPT、文心一言等生成式AI技術在人機交互體驗視覺中國公司近期與百度旗下的AI作畫平臺文心一格將在創(chuàng)作者賦能和版權保護等方面展開多公司在一些細分領域與百度具有合作關系。公司打造的跨終端、全方位、安全可信的準的DDIO(服務端通訊中臺)開發(fā)接口能與任何智能機器人進行快速對接,目前已實現ChatGPT對接,未來文心一言若支持開放對接,信源密信能實現與其進行快速對接。東軟集團公司宣布成為百度文心一言首批生態(tài)合作伙伴。后續(xù),東軟將全面體驗并接入文心對話技術成果,打造更多AI賦能的產品與解決方案。公司作為百度在金融科技領域的合作伙伴,雙方將繼續(xù)探索在金融行業(yè)的發(fā)展機會版ChatGPT“文心一言”的首批生態(tài)合作伙伴,將優(yōu)先內測體驗并接入“文心一言”的相關金融領域的解決方案。漢得信息公司加入百度文心一言生態(tài)圈,并成為百度文心一言首批先行體驗官。通過融合百將攜手推進B端人工智能深入應用,致力于幫助客戶更徹底地實現數字化轉型。公司宣布成為百度文心一言(英文名:ERNIEBot)首批生態(tài)合作伙伴。致遠互聯新一代協(xié)同運營平臺COP將全面體驗并接入文心一言的能力。作為百度文心一言首批生態(tài)合作伙伴,公司可優(yōu)先內測試用文能力。隨著致遠互聯與百度文心一言在產品研發(fā)等領域展開深化合作,將實現致遠互聯在對話機器人等產品的跨越升請務必參閱正文后面的信息披露和法律聲明25/32請務必參閱正文后面的信息披露和法律聲明26/32開源證券行業(yè)深度報告上市公司先的智能對話技術成果應用在衛(wèi)星遙感領域。此舉標志著航天宏圖優(yōu)先獲得領先AI技術的加持,也標志著對話式語言模型技術在PIE-Engine時空遙感云平臺及各行業(yè)衛(wèi)星應用場景中的首開源證券4.4、國內其他巨頭也紛紛布局,產業(yè)落地加速應用路線圖包括一個平臺、兩個領域(零售和金融)、五個應用(內容生成、人機對段,會與釘釘產品結合。國內具有豐富應用場景和數據積累,破局之路在于產業(yè)鏈京東:宣布推出產業(yè)版“ChatJD”。ChatID將以“125”計劃作為落地應用路線圖,包含一個平臺、兩個領域、五個應用。1個平臺指ChatJD智能人機對話平臺,感分類,涵蓋零售和金融行業(yè)復用程度最高CC京東云5個應用2個領城京東云:京樂集團統(tǒng)一的技術底座情感分類適零售阿里:阿里類ChatGPT產品目前也處于內測階段。2021年,阿里巴巴達摩院先后發(fā)布多個版本的多模態(tài)及語言大模型,在超大模型、低碳訓練技術、平臺化服務、落地應用等方面實現突破。達摩院團隊使用相對較少算力即實現10萬億參數大模型M6,同等參數規(guī)模能耗僅為此前業(yè)界標桿的1%,降低了大模型訓練門檻。阿里巴巴通義大模型系列已在超過200個場景中提供服務,實現了2%~10%的應用效果提升,典型使用場景包括電商跨模態(tài)搜索、AI輔助設計、開放請務必參閱正文后面的信息披露和法律聲明28/32開源證券阿里巴巴通義大模型系列發(fā)布阿里巴巴通義大模型系列發(fā)布行業(yè)模型層通義AiceMind通義-CV-統(tǒng)一底座,騰訊:專項研究有序推進。騰訊目前在AI大模型、機器學習算法以及NLP等領域擁有技術儲備,并表示在ChatGPT相關方向上已有布局,專項研究也在有序推進中。2022年4月,騰訊對外正式宣布,騰訊“混元”AI大模型在MSR

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論