傳媒行業(yè)GPT系列專題分析報告:GPT聚焦全領域發(fā)展應用_第1頁
傳媒行業(yè)GPT系列專題分析報告:GPT聚焦全領域發(fā)展應用_第2頁
傳媒行業(yè)GPT系列專題分析報告:GPT聚焦全領域發(fā)展應用_第3頁
傳媒行業(yè)GPT系列專題分析報告:GPT聚焦全領域發(fā)展應用_第4頁
傳媒行業(yè)GPT系列專題分析報告:GPT聚焦全領域發(fā)展應用_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

GPT聚焦全領域發(fā)展:應用篇——GPT系列專題之三主要觀點我們將“AI+傳媒”的研究框架體系定義為“通用大模型”+“行業(yè)小樣本”的技術架構,“AI+傳媒”在應用層表現效力優(yōu)劣的關鍵取決于通用大模型對垂直應用的適配程度及迭代速度,1、適配程度是指:多模態(tài)的輸入及輸出是否匹配應用層的輸入及輸出。比如GPT-4屬于“圖+文”多模態(tài)輸入+“文”單模態(tài)輸出,因此輸入模態(tài)為“圖或文”且輸出模態(tài)為“文”的垂直應用更適配GPT-4。2、迭代速度是指:應用層產生的“行業(yè)小樣本”的數據量是否匹配大模型的迭代要求。根據我們對GPT模型的理解,比如BingAI產生的“行業(yè)小樣本”源自Bing的搜索結果,ChatGPT產生的“行業(yè)小樣本”源自用戶的反饋和互動。因此我們認為,對于超出GPT所使用的預訓練數據庫范圍(2021年9月前)的事實性表述,BingAI反饋的是搜索的結果,ChatGPT反饋的是用戶主動的觀點,BingAI反饋的效果比ChatGPT更好。我們認為“行業(yè)小樣本”的價值取決于數據數量及數據質量,數量大且質量高(多模態(tài))的應用場景復用及迭代AI能力的效力更強,因此更進一步理解我們的研究框架,我們將“行業(yè)小樣本”的結構分層(中層小模型+下層應用及內容),并將“行業(yè)小樣本”的結合方式分類(調用+訓練):1、“行業(yè)小樣本”的數據集來自小模型或應用及內容:AI產業(yè)鏈包括上層大模型、中層小模型、下層應用及內容,包括應用及內容直接接入大模型或通過小模型接入大模型兩種方式,即“大模型+應用及內容”或“大模型+小模型+應用或內容”,其中具備特定功能的AIGC軟件產品及MaaS我們理解為“小模型”+“應用”的技術范式,本身具備較高質量的AI能力,若接入匹配的多模態(tài)大模型,有望實現能力上的質變突破。2主要觀點2、“行業(yè)小樣本”的結合方式包括“能力調用”及“能力訓練”兩類:(1)“能力調用”是指下游垂類場景直接調用通用大模型的通用能力,并基于垂類場景內產生的特性化數據不斷提升調用能力在垂類場景內的適配程度。我們認為現階段下游應用及內容主要采取此類方式接入大模型能力,此類方式可高效快速調用大模型先進能力,在時間上及成本上具備優(yōu)勢。我們認為“能力調用”匹配“AI+傳媒”的第一層利好,即通過AI降本增效,大幅提高數據及內容的供給量。內容產業(yè)本質由供給決定需求,因此內容供給量的明顯提升將有效帶動傳媒基本面拐點及增量空間出現。(2)“能力訓練”是指下游垂類場景將通用大模型針對特性化數據集進行再訓練,從而形成垂類場景專屬大模型。例如利用自身豐富的金融數據源,基于開源的GPT-3框架再訓練,開發(fā)出了金融專屬大模型BloombergGPT。我們認為“能力訓練”匹配“AI+傳媒”的第二層利好,即下游垂類場景本身的數據或內容反過來“再訓練”通用大模型(或開源大模型),形成傳媒內容場景專屬大模型,形成更穩(wěn)定且高質的內容輸出。我們認為訓練難度文本<圖片<視頻<影視<游戲,且內容數量逐步遞減但內容質量逐步遞增,即偏后端的影視、游戲在內容數量上訓練量級不足,因此高質量的內容形態(tài)首先通過“能力調用”輸出AIGC內容,再將AIGC內容“再訓練”大模型以解決高質量內容數量不足的問題(合成數據“再訓練”范疇)。3主要觀點從投資的角度,按照我們的研究框架,傳媒對應垂類場景的“行業(yè)小樣本”,其核心價值取決于數據與內容,第一層對應數據與內容的輸入模態(tài)是否匹配大模型的輸出模態(tài);第二層對應數據與內容的數量及質量是否匹配大模型的能力再訓練:1、按照“模態(tài)匹配”的邏輯,AI+文本/虛擬人預計率先兌現案例及業(yè)績,其次AI+圖片可通過“大模型”+“小模型”組合方式實現(如GPT+StableDiffusion、GPT+Midjourney)。隨著未來GPT-5提供更多模態(tài)的輸入及輸出,下游垂類場景的適配范圍有望擴大,通過“能力調用”適配的應用及內容場景更為豐富,因此后續(xù)“AI+視頻/影視/游戲”的案例兌現度存在新的催化空間。OpenAI最新發(fā)布的GPT-4核心特征包括:(1)多模態(tài)輸入(圖+文),單模態(tài)輸出(文),可以閱讀并總結論文內容、解答較高難度的物理題目、具備較強的OCR能力(如識別網頁草稿并按要求反饋網頁代碼)、理解人類社會常識;(2)具備長文字處理及推理判斷能力,GPT-4上下文上限約2.5萬字,允許使用長格式內容創(chuàng)建、擴展對話以及文檔搜索和分析等,能夠閱讀并記憶更多信息,且具備更高的推理判斷能力;(3)可靠性大幅提升,分辨能力提高,有效減少“虛構”或“有害”信息輸出。2、按照“能力再訓練”的邏輯,AI+內容/IP預計空間及價值更大,其價值核心取決于數據與內容/IP的數量及質量的高低。微軟本周發(fā)布的DeepSpeed-Chat大幅提升大模型預訓練速度并大幅降低訓練成本,我們認為最核心意義為大幅降低垂類場景專屬大模型的訓練門檻,小模型層及應用層有望明顯受益。掌握數據及優(yōu)質內容(多模態(tài)數據)的下游場景具備核心競爭力,因此內容及IP()的價值有望重估。DeepSpeed-Chat集成預訓練語言大模型完整三個步驟,其中針對第三步RLHF訓練集成了高效且經濟的DeepSpeed-RLHF系統(tǒng),使復雜的RLHF訓練變得快速、經濟并且易于大規(guī)模推廣(相比現有系統(tǒng)提速15倍以上,且大幅降低算力要求及成本)。4主要內容本篇報告主要介紹了以下方面:1)OpenAI通過大量數據來訓練AI系統(tǒng)并執(zhí)行任務,應用于多個領域,改善人們生活。2)持續(xù)深化AI賦能,加速探索全方面、多領域的商業(yè)化路徑。3)不斷改善GPT數據驅動模型性能,完善下游市場,引領軟件、硬件、芯片的全面發(fā)展。u

OpenAI使用深度學習技術構建生成模型,多領域運用到人們生活。GPT-4的大型多模態(tài)模型通過使用大量數據來訓練AI系統(tǒng)并使其執(zhí)行任務,應用于多個領域。通過多家公司和多種程序應用在GPT-4模型上的建立、探索和貢獻,將GPT-4打造成為改善人們生活的寶貴工具。u

深化與人工智能合作,借力提升工作效率、加速產品創(chuàng)新、延續(xù)文化發(fā)展。各公司持續(xù)深耕AIGC領域,加大產品布局,目前已運用到教育、搜索、游戲、電商、社交媒體、營銷、娛樂、醫(yī)療、政府、辦公等領域。u

不斷改善模型性能和AI技術,完善下游市場,引領軟件、硬件、芯片的全面創(chuàng)新。AI技術的發(fā)展加速AI算力的提升,需要軟件服務、硬件支撐、芯片技術等方面協(xié)同創(chuàng)新。u

GPT技術將成為國內外科技巨頭必爭之地。CHATGPT發(fā)布后,國內多家科技巨頭企業(yè)逐步跟進,中國企業(yè)進入AIGC賽道。隨著數據的增多,GPT的數據驅動模型性能也會逐步提高,因此會吸引更多的用戶產生更多的數據,從而形成良性循環(huán),不斷改善模型性能、完善下游市場。5目錄Content一、背景介紹:構建應用多領域的模型二、賦能領域:全方位、多公司、多程序應用三、未來展望:完善下游市場,形成良性循環(huán)四、投資建議五、風險提示1.1

聚焦多領域應用OpenAI使用深度學習技術構建生成模型。該技術通過使用大量數據來訓練AI系統(tǒng)并使其執(zhí)行任務,可以應用于多個領域。u

文本處理方面,作為一個高級的文本模型語言處理工具,可以生成、分類、匯總高度連貫和準確的文本,通過訓練語言模型來理解并遵循用戶意圖。ChatGPT可以用于文本分析、生成、翻譯、自動摘要等自然語言處理。u

圖像方面,形成了以CLIP(匹配文本和圖像)和DALL-E(從文本描述中創(chuàng)建原始、逼真的圖像和藝術)為代表的圖像生成模型。u

語音方面,將AI運用到音頻處理和音頻生成中,促進語言識別和原創(chuàng)音樂的發(fā)展。圖1

文本處理領域圖2

圖像領域圖3

語音領域通過訓練模型來總結整本書和讀者反饋生成各種流派和藝術家風

使用4種不同的樂器生成DALL-E:輸入一位宇航員以逼真的風格騎馬格的原始音頻10分鐘的音樂作品CLIP:連接文本和圖像資料:

OpenAI官網,上海證券研究所

資料:

OpenAI官網,上海證券研究所資料:

OpenAI官網,上海證券研究所71.2

GPT-4使用方法OpenAI致力于通過多家公司和多種程序應用的努力,在GPT-4模型上建立、探索和貢獻,將GPT-4打造成為改善人們生活的寶貴工具。1)ChatGPTPlus客戶端:2)API端,公司邀請更多開發(fā)者,逐步擴大規(guī)模與需求。第一步,打開GPT-4官網,進入CHATGPTPLUS;第二步,登錄OPENAI/CHATGPT賬戶,升級成Plus用戶第一步,打開GPT-4官網,進入JoinAPIwaitlist申請注冊候補名單;第二步,獲得訪問權限后,可以向

GPT-4

模型發(fā)出純文本請求,定價0.03美元/1k

prompttoken,0.06美元/1kcompletiontoken。與GPT-3.5模型下的ChatGPT不同的是,ChatGPT

Plus取消免費會員資格,每月需支付20美元訂閱費。圖4

ChatGPTPlus使用指南()圖5

API開發(fā)者使用指南()資料:

OpenAI官網,上海證券研究所資料:

OpenAI官網,上海證券研究所82.1

賦能領域——教育(1/2)GPT-4深化語言學習軟件Duolingo的對話功能,打造Duolingo

Max協(xié)助語言教育產品。Duolingo

Max是在SuperDuolingo的基礎上,通過“角色扮演”和“解釋答案”兩大全新功能推出的新產品,協(xié)助語言教育。u

Duolingo每月有超5000萬學習第二語言的用戶,支持40余種語言,擁有100余門課,用戶通過使用手機便可進行簡單的詞匯學習、復雜的句子結構學習和語法學習。u

與母語人士對話可快速提升語言學習,但此辦法成本高、實行難度大,因此Duolingo使用GPT-4運行“Roleplay”(角色扮演)的個性化課程和英語測試,來減少學生與母語人士對話的難度,并通過“ExplainMyAnswer”(解釋答案)來反饋學生對話練習時的錯誤表述,加深課堂對話時的回答,解釋學生練習時答案正確或錯誤的原因,并提供示例進一步解釋答案。圖6

Duolingo用戶界面資料:

OpenAI官網,上海證券研究所92.1

賦能領域——教育(2/2)可汗學院使用GPT-4創(chuàng)建聊天機器人AI助手Khanmigo,免費提供給可汗學院的學生和教師,開辟AI教育的新領域。u

可汗學院是一家為任何地方的任何人提供免費世界一流教育的非營利組織,為各年齡段的學生提供上千節(jié)數學、科學和人文課程??珊箤W院2022年開始測試最新版本OpenAI語言模型,2023年3月14日宣布使用GPT-4驅動AI助手Khanmigo,Khanmigo既可以作為學生的虛擬導師,也可以作為教師的課堂助教。u

GPT-4能夠理解用戶的問題和提示。學生端:與學生來回對話并提出個性化問題,促使學生更深入的學習。教師端:為教師編寫教學材料,未來幫助教師為學生量身定制學習計劃、幫助教師了解每位學生在可汗學院的表現。圖8

Khanmigo幫助教師提供教學材料圖7

Khanmigo幫助學生解答數學問題資料:

OpenAI官網,上海證券研究所資料:

OpenAI官網,上海證券研究所102.2

賦能領域——搜索引擎MicrosoftBing與OpenAI共同打造New

Bing,提供自然語言處理服務和解決方案。u

隨著GPT-4的發(fā)布,微軟與OpenAI的合作也讓New

Bing成功接入GPT-4模型,讓用戶在B瀏覽器中體驗強大的搜索、回答、聊天和創(chuàng)意功能。NewBing像是Web搜索的研究助理、個人規(guī)劃師和創(chuàng)意伙伴。u

與其他搜索引擎不同,1)搜索方面:除生成相關鏈接的列表外,New

Bing基于用戶說話、發(fā)短信和思考的方式,整合Web上的搜索結果,提供匯總答案;在用戶進行復雜搜索時,NewBing會給出細節(jié)回復。2)對話方面,NewBing可以與用戶自然聊天,在聊天過程中,可針對初始搜索提出后續(xù)問題,獲得詳細的回復。3)創(chuàng)意靈感方面,可以幫助用戶寫詩、寫故事、分享項目想法。圖9

輸入文字描述即可生成圖像圖10

在聊天中不斷細化搜索結果圖11

通過提取并匯總最新信息去問題答案圖12

多方面的靈感創(chuàng)意與創(chuàng)作資料:

Microsoft官網,上海證券研究所資料:

Microsoft官網,上海證券研究所資料:

Microsoft官網,上海證券研究所資料:

Microsoft官網,上海證券研究所112.3

賦能游戲微軟基于ChatGPT發(fā)布視覺模型Visual

ChatGPT,實現在ChatGPT的聊天過程中發(fā)送和接收圖像。u

微軟是計算機、云計算、視頻、游戲硬件、搜索等在線服務供應商巨頭,總部位于華盛頓州,辦事處遍布60多個國家/地區(qū)。VisualChatGPT是具有多種視覺和圖形用戶界面的新模型,它將ChatGPT與視覺基礎模型VFM相結合,通過聊天進行交流并生成視覺效果。u

Visual

ChatGPT結合多種VFM來處理各種任務。Visual

ChatGPT提出Prompt

Manager來彌補ChatGPT與VFM之間的差距,PromptManager主要有以下功能:1)明確告訴ChatGPT每個VFM的功能并指定輸入輸出格式;2)將不同圖片信息轉換為語言格式;3)處理不同VFM信息。在PromptManager幫助下,VisualChatGPT可以不斷迭代直到滿足客戶需求。圖13

Prompt

Manager細節(jié)運作圖資料:

大數據文摘,上海證券研究所122.4

賦能電商Amazon賣家使用ChatGPT來自動執(zhí)行與運營在線業(yè)務,使亞馬遜的市場銷售更便利。u

Amazon是美國最大的電商公司,位于華盛頓州西雅圖,

從只經營網絡書籍銷售擴展到多產品銷售,已成為全球商品品種最多的網上零售商和全球第二大互聯(lián)網企業(yè)。u

ChatGPT從以下兩方面助力Amazon業(yè)務:1)通過AI

-ChatGPT快速生成標題,幫助撰寫listing

title和優(yōu)化listing;2)幫助賣家分析評論、輔助寫推廣文章等,上手簡單,也提高了賣家效率。u

目前ChatGPT已經為Amazon賣家?guī)砹藢嶋H效果。部分賣家在使用ChatGPT后的廣告轉化率都有所上升,其中有一款產品的轉化率在八周內從26%提高至46%。圖14

利用chatGPT撰寫產品信息資料:

GrowthDevil,上海證券研究所132.5

賦能社交媒體MyAI是SnapChat基于ChatGPT推出的聊天機器人。u

Snapchat是全球化的社交平臺,適用于Android和iOS設備的移動APP。2023年2月27日,Snap發(fā)布聊天機器人My

AI。MyAI類似個人助手,擁有為用戶提供生日禮物建議、制定旅行計劃、推薦食譜等功能。目前My

AI僅對Snapchat+訂閱用戶開放(Snapchat2022年7月開放的高級訂閱服務,訂閱費3.99美元/月),Snapchat目標是讓7.5億的月活用戶使用該功能。u

MyAI是應用在SnapchatAPP內的ChatGPT的移動設備版本。區(qū)別在于Snapchat版本的回答受到很多限制,主要由于Snap員工訓練MyAI,使其遵守公司規(guī)章制度、安全準則,禁止回應負面內容和敏感話題等。圖15

My

AI個人資料界面圖16

My

AI個人資料界面資料:

TheVerge官網,上海證券研究所資料:

TheVerge官網,上海證券研究所142.6

賦能營銷HubSpot推出新的生成AI工具ChatSpot,將自身CRM技術與OpenAI的ChatGPT、DALL-E

2和GoogleDocs相結合,用自然語言完成調取數據、生成報告等多種任務。u

Hubspot是世界一流的自動化營銷平臺,連接營銷、銷售、內容管理和客戶服務所需的所有軟件和資源,涵蓋Marketing市場、Sales銷售、Services服務三大版塊,共同實現InboundMarketing(集客營銷)全流程CRM(客戶關系管理)。u

Chatspot擁有更多可能。基于GPT-4的ChatSpot更智能、生成文本更好,是為數不多的可以處理32000tokens的APP(大多基于GPT-4的APP只能處理8000tokens)。u

ChatSpot網上可獲取公開文章的摘要,并提取文章的人名和公司名稱。HubSpot

CRM可顯示哪些公司在CRM中,以及它們是否是潛在客戶。圖17

ChatSpot的組成資料:

網易,上海證券研究所152.7

賦能醫(yī)療BeMyEyes推出幫助盲人和視障人士的免費APP——BeMyEyesVirtualVolunteer。u

BeMyEyesVirtualVolunteer是GPT-4首款數字視覺助手,該模型包含從動新圖像到文本生成。用戶可通過APP將圖像發(fā)送給AI驅動的虛擬志愿者,虛擬志愿者可回答有關該圖像的任何問題,并提供即時視覺幫助。u

BeMyEye的虛擬志愿者功能致力于幫助630萬志愿者完成日常任務。BeMyEyesVirtualVolunteer將幫助盲人或視力低下的人更好地駕馭物理環(huán)境、滿足日常需求并獲得更多獨立性。圖18

呼叫虛擬志愿者界面圖19

iPhone上的虛擬志愿者界面預覽資料:

OpenAI官網,上海證券研究所資料:

bemyeyes官網,上海證券研究所162.8

賦能政府冰島政府使用GPT-4保護冰島語u

冰島是位于北大西洋中部的島國,冰島語擁有豐富的文化遺產和國家身份聯(lián)系,但其370萬公民中大多數說英語或其他第二語言,為防止冰島語的滅絕,冰島與OpenAI合作,使用GPT-4來保護冰島語。非營利性語言技術中心AlmannarómurCEO稱希望確保AI不僅用于幫助保護語言、文化和歷史,而且用于支撐經濟繁榮。u

GPT模型的大部分訓練集是英語和其他主要語言,因此像冰島語等較小語言沒有相同的理解能力和理解廣度。GPT-4的冰島語理解能力強于GPT-3.5,但仍會出現語法、翻譯和文化知識錯誤,語言技術公司MieeindehfCEO組建40名志愿者的團隊,對GPT-4進行正確的冰島語法和文化知識培訓。u

冰島團隊用更多的例子訓練GPT-4,不斷改進模型,使該模型可以為冰島語中最復雜和最具創(chuàng)意的app提供支持,以便冰島公司可以很快在其交互式app中部署冰島語中的GPT-4。u

為冰島整個國家提供用冰島語與OpenAI模型的交互機會。以GPT-4為后端,未來Embla(Mieeind的語音助手app)將能夠以流利的冰島語與用戶進行對話,并提供其他語言的翻譯。冰島公司不必依賴其網站上的英語聊天機器人,而是可以擁有一個冰島語聊天機器人。圖21

Mieeind的AI研究團隊致力于在冰島語上訓練GPT-4圖20

相同問題,不同語言輸入,得到的回答不同資料:

OpenAI官網,上海證券研究所資料:

OpenAI官網,上海證券研究所172.9

賦能辦公結合LLM強大模型、MicrosoftGraph數據及Microsoft

365應用,微軟3月16日發(fā)布全新Microsoft

365Copilot,將GPT的生成式AI能力全面應用于Word、Excel、PowerPoint、Outlook、Teams

等辦公套件,Copilot有以下兩種功能:1)嵌入Copilot至Microsoft365,根據不同軟件的功能與需要,處理不同類型的任務。如在Word中編寫、總結和生成文本;在Excel中分析用戶輸入的數據,并將結果生成可視化圖表;在Outlook郵箱中管理收件箱、合成回復草稿,并且支持多種語氣文本生成。2)用戶通過BusinessChat自然語言提出“告訴我的團隊我們如何更新的產品策略”,即可根據晨會內容、郵件和相關聊天記錄中更新報告。圖22

Microsoft

365

Copilo界面資料:

微軟官網,上海證券研究所18未來展望u

各大公司密切關注ChatGPT的發(fā)展并希望借此提升自己競爭力。國外:Google投資3億美元于Anthropic(2021年成立的人工智能初創(chuàng)公司),以應對ChatGPT的威脅;微軟作為OpenAI投資方,利用ChatGPT增加其各方面產品的競爭力;Amazon將ChatGPT廣泛運用在多種領域。國內:百度3月宣布大模型“文心一言”項目,并向公眾開放;騰訊公布人機對話專利,旨在實現機器人與用戶之間的交流;科大訊飛5月6日發(fā)布中國版ChatGPT。u

AI技術的飛速發(fā)展引領軟件、硬件、芯片的全面創(chuàng)新。從2018年起,AI技術開始加速落地,按照現在的進度,AI算力每100天將翻一倍,到2030年所需算力是現在的3200萬倍,因此AI的發(fā)展需要在軟件服務、硬件支撐、芯片技術等方面協(xié)同創(chuàng)新。u

GPT技術將成為國內外科技巨頭必爭之地。CHATGPT發(fā)布后,百度、阿里、京東、騰訊、字節(jié)、360等國內多家科技

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論