ChatGPT商業(yè)化落地方向分析報告_第1頁
ChatGPT商業(yè)化落地方向分析報告_第2頁
ChatGPT商業(yè)化落地方向分析報告_第3頁
ChatGPT商業(yè)化落地方向分析報告_第4頁
ChatGPT商業(yè)化落地方向分析報告_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

ChatGPT商業(yè)化落地方向分析報告導(dǎo)語:ChatGPT的出現(xiàn)將AIGC這個概念捧上了熱度高點,但是在討論熱度過后,ChatGPT的發(fā)展還需面臨一個關(guān)鍵問題,即其如何才能實現(xiàn)商業(yè)化落地,找到后續(xù)的發(fā)展路徑?那么對ChatGPT而言,有哪些可以參考的商業(yè)化落地方向?前言:我希望謹(jǐn)慎地做出判斷雖然媒體狂歡、大廠跟進(jìn),所有跡象都表明一個新時代正在到來。但是在前文發(fā)布后,我和很多人進(jìn)行了交流。給我印象最深刻的就是,有些朋友在表達(dá)感謝后,總會忐忑地追問一句——“你覺得ChatGPT方向能落地嗎?”他們中有面臨職業(yè)抉擇的打工人,有躍躍欲試的創(chuàng)業(yè)者,有二級市場的沖浪者,有一級市場態(tài)度謹(jǐn)慎的投資人。所有人都在岸邊謹(jǐn)慎、克制地觀望。所以,究竟能落地嗎?如果能,是100%完全能嗎?哪些方向可以哪些方向不可以?如果不可以,那么為什么不可以?因為少年時的AI幻想成真感動感動是一回事,客觀的現(xiàn)實又是另一回事。而且當(dāng)我的建議會對其他人產(chǎn)生影響,這就愈加讓我謹(jǐn)慎。OK,前言就到這里,我將開始我的推理過程,向你展示我整個過程中的所思所想。如果你對推理過程不感興趣,可以直接看結(jié)論——“我相信他能夠成功落地,并且將是一個時代的開始?!钡俏腋M愀S我的思考過程,就像GPT模型中用到的思維鏈CoT技術(shù)一樣,我們“thinkstepbystep”,當(dāng)每個環(huán)節(jié)都清晰無誤時,最終的答案也將更值得信任。第一步:開始思考前,想清楚如何思考我們需要更清晰地定義我們的問題,從我們自身的角度出發(fā)(打工人、創(chuàng)業(yè)者、投資者等)。并在隨后圍繞定義來確定我們要去加載哪些方面的知識,并基于這些知識做出符合利益和邏輯的推理。我所尋求的答案是“AIGC這波狂潮能否落地”,那么:01首先,這是一門生意。而生意的本質(zhì)就是價值交換,并在過程中積累剩余價值。所以他的首要原則一定是能跑通商業(yè)模式,賺到利潤。當(dāng)然,生意要賺到錢是誰都知道的道理。AI繪畫也能賺到錢啊,有人靠激勵廣告打平收益,有人拿到了融資,有人延伸出了提示語買賣。02是的,所以我還期望他具備足夠?qū)挾鹊馁惖?,能夠支撐百花齊放。因為這樣對于打工人來說,他進(jìn)入這個方向才足夠?qū)掗?,擁有突破天花板的可能,對?chuàng)業(yè)者來說市場的機(jī)會足夠多,避免扎堆死在沙灘上,對于一級市場投資者來說有足夠的種子進(jìn)行選擇試錯,對于二級投資者來說,百花齊放的涌現(xiàn)才是這個賽道長久生長的推力。在這里我們觀察一下AI繪畫,他的賽道是不是一眼就望到了盡頭?你敢投入其中嗎(此處假裝忽略Diffusion技術(shù)后續(xù)的潛力)?03然后,找到新技術(shù)帶來的增量市場。我們要避免被媒體詞語迷惑。什么是媒體詞語?就是標(biāo)題中的“AIGC”。事實上這波狂潮中只有AI繪畫背后的Diffusion和ChatGPT背后的GPT這兩項技術(shù)產(chǎn)生了應(yīng)用端的突破。但是AIGC詞語一造出來,干涸的互聯(lián)網(wǎng)終于迎來了久違的新概念,媒體迫不及待將他扶上王座,繪制出一張張行業(yè)全景圖。但事實上真正因為這兩項技術(shù)發(fā)生影響的行業(yè)是哪些?受到影響的行業(yè)就一定存在增量機(jī)會嗎?我搜集材料時一般剛開始的時候是不看投研式的報告的,很寬很全,但是好像知識從腦子流淌過去,看完什么也沒留下。特別做過匯報PPT的人應(yīng)該知道,很多時候為了結(jié)構(gòu)式美觀,你會硬湊信息,比如這個產(chǎn)業(yè)鏈只有2條不好看呀,我湊夠3個來個金字塔布局。這種信息會誤導(dǎo)思維框架的的建立,我一般是建立了體系化認(rèn)知再去看報告來補(bǔ)充參考的。OpenAICEO對資本造詞“生成式AI”的嘲諷05緊接著,讓我們首先瞄準(zhǔn)核心的應(yīng)用場景,暫時忽略上下游布局。當(dāng)一個地方發(fā)現(xiàn)金子,馬上就會有為淘金者服務(wù)的餐館、旅館、勞保店出現(xiàn),但這這一切的前提在于必須能發(fā)現(xiàn)金子。核心應(yīng)用場景就是這波浪潮中的金子,只有找到在消費端能夠跑通模式的場景,才會關(guān)聯(lián)延伸出相應(yīng)的上下游產(chǎn)業(yè)。因此在這個問題的思考過程中,上下游產(chǎn)業(yè)是不重要的,我們不需要投注任何精力去關(guān)注。06最后,讓我們基于如上推理,重新構(gòu)筑對這個問題的定義:“當(dāng)前是否有足夠多的受到兩個新技術(shù)影響且產(chǎn)生增量機(jī)會的核心場景能夠跑通生意模式,獲取盈利”。當(dāng)我們收集的知識滿足這些條件,我們就認(rèn)為答案是“是”。推導(dǎo)順序如下圖:第二步:開始組裝知識框架在有了思考的方向后,我們需要構(gòu)造知識框架,哪些重要、哪些不重要、哪些要素之間互相關(guān)聯(lián)、影響、先后順序是什么等等。首先,搞錢是最重要的,即核心場景,第一個要做的就是盤點應(yīng)用場景,客觀評估其商業(yè)模式及可行性。其次,場景不是獨立存在的,有大量因素影響制約。其中影響最大的是技術(shù),其次可能是政策、道德等。最后,我們在知識收集過程中,必定面臨一些困難。例如自身的知識洼地?zé)o法跨越,或是元素過多無法窮盡,我們需要應(yīng)用一些抽象、指代的方法來跨過這些障礙?;谏鲜鲈瓌t,形成我們的收集框架:優(yōu)先梳理商業(yè)部分,并在遇到知識洼地時采用抽象要素、同理推斷、指代推斷等方法。技術(shù)現(xiàn)狀決定當(dāng)前生意是否成立,技術(shù)潛力決定生意的上限天花板。作為重要支撐因素進(jìn)行分析。限制因素如道德、政策、版權(quán)等,對主干不構(gòu)成影響,放到最次優(yōu)先級大概看看就行,對行業(yè)未來可能的限制稍作了解。導(dǎo)圖見下方:對了,補(bǔ)充一下接下來這篇文章將只分析GPT是否能夠落地,不涉及AI繪畫,這是因為:1)我做不到AI繪畫的材料我收集了,但是還未整理,后續(xù)會有一篇《AI產(chǎn)品經(jīng)理視角下的AI繪畫全解析》。我要等那篇文章寫完了,思路才會清晰,沒想清楚之前我就不亂說了。2)其實也沒必要兩項技術(shù)雖然都具備突破性,但目前ChatGPT的延伸方向、變革程度,都是遠(yuǎn)遠(yuǎn)高于Diffusion的,所以如果ChatGPT能論證成功,不用等AI繪畫,我們也可以推出標(biāo)題中的答案。第三步(1):基于框架進(jìn)行知識填充——商業(yè)篇我們先說盈利模式和成本控制兩部分,然后帶著相關(guān)認(rèn)知去盤點場景。1.盈利模式互聯(lián)網(wǎng)主流盈利模式無非三種:1)廣告/流量模式通過免費產(chǎn)品吸引用戶使用,促使用戶投注大量時長/頻率,再從中切割廣告流量從而盈利。在目前短視頻、中長視頻、游戲、小說的圍剿下,我不看好ChatGPT所創(chuàng)新的應(yīng)用能夠搶奪足夠份額的時長。邊角料的時長空間或許可以,但上限不夠大。而且一旦涉及時長爭奪,我們所描述的肯定是C端娛樂應(yīng)用。對于有野心的玩家來說,是很難接受讓廣告突破用戶體驗的。不過小規(guī)模應(yīng)用其實可以考慮,特別對于獨立開發(fā)者來說,激勵廣告變現(xiàn)是一個很好的方式,雖然我手里沒有數(shù)據(jù),但AI繪畫在過去的半年內(nèi)已經(jīng)證明了可以實現(xiàn)收益打正。AI繪畫暫時形成一條應(yīng)用-消費的小市場,但上限很低不過我感覺廣告模式應(yīng)該是最不適配的,除非技術(shù)再進(jìn)行突破,或出現(xiàn)意料外的殺手應(yīng)用。例如一個讓你愿意每天投入半小時進(jìn)行聊天,并且他放廣告你還不反感的虛擬人……這有可能嗎?2)商品模式商品模式是最傳統(tǒng)的,一手交錢一手交貨。只是這種模式下,交易是一次性的。2B端的定制開發(fā)服務(wù),游戲充值都可以用這種模式概括——當(dāng)然也包括賣實體商品。但是商品模式最需要的是“復(fù)購動力/頻率”,游戲充值有沉浸心流、社交貨幣、排行攀比等心理方法來推動,實體商品則來自現(xiàn)實生活的復(fù)雜需求。Chat的應(yīng)用延伸,如果采用商品模式變現(xiàn),需要考慮幾點:是否可以延伸出豐富的商品——例如虛擬人物的劇本,不同的TTS音色,或者虛擬人物本身的購買。這些商品的邊際成本如何,是否能控制到極低的程度?這些商品用什么動力來推動復(fù)購?B端會更明確一些,商品付費基于明確價值。例如49.9元1000次SEO文案生成/社媒生成/廣告語生成。而C端提供的價值不那么商業(yè)實際,需要考慮其他動力來刺激復(fù)購能想到的替代。例如宅男手辦、以及明星周邊/打榜。3)訂閱模式用戶周期性支付費用,以獲取某種服務(wù)、特權(quán)、功能。這種模式最重要的在于,花錢訂閱的那個東西對用戶是否具備“持續(xù)價值”。2B方向的產(chǎn)品,可以不用討論,訂閱模式已經(jīng)逐步替代商品模式成為最優(yōu)解。我們慢慢看到不管是軟件服務(wù)的定制開發(fā),還是本地應(yīng)用軟件的license機(jī)制越來越少,取而代之的是訂閱模式。畢竟訂閱模式能帶來更健康穩(wěn)定的現(xiàn)金流,這已經(jīng)是非常大的優(yōu)勢了。而2C方向的產(chǎn)品,還充滿不確定性。比較經(jīng)典的如視頻會員VIP所代表的娛樂價值,交友APP代表的社會尊重價值,GTD代表的生產(chǎn)力價值,2C向的GPT產(chǎn)品能否像他們一樣創(chuàng)造足夠的“持續(xù)價值”,還需要先行者為我們踩坑。上述三種盈利模式簡單了解即可,他們之間不是非此即彼的。例如百度云盤限速下載,你可以用訂閱來做,也可以用商品來做,嚴(yán)格來說沒有那么明確的界限,純粹看那種盈利方式在商業(yè)測算上能帶來更大的利潤。但綜合來看,商品模式和訂閱模式和ChatGPT的延伸應(yīng)用會更為匹配。2.成本控制成本可以分為三塊:1)技術(shù)成本GPT3.0的付費接口是3700個字/元(經(jīng)過換算),這是最明確的成本線。除非等幾個月成本下降或國內(nèi)大廠跟進(jìn)做出服務(wù)開放,否則這個成本線會持續(xù)一段時間。此外搭建相關(guān)服務(wù)、開發(fā)產(chǎn)品并維護(hù)也會產(chǎn)生費用,根據(jù)落地的形式不同。2)運營成本人力費用一般而言是大頭。即使排除算法角色(是的,只做應(yīng)用層甚至可以不需要算法,所以這波技術(shù)浪潮對算法同學(xué)而言是非利好),那么也至少需要工程方向、前后端、產(chǎn)品設(shè)計等角色。如果你是2B市場,還至少需要配備銷售團(tuán)隊。整體的上限浮動空間非常大,從0人(獨立開發(fā)者)到幾十人都有可能。另外還需要考慮辦公場地、器材購買、HR/行政等費用,當(dāng)然你可以選擇全體遠(yuǎn)程協(xié)作+服務(wù)外包等多種方式去降低。上下浮動空間也比較大。3)增長成本2B的增長成本來自PR費用,參會費用,以及銷售費用。部分to小B的例如給電商從業(yè)者的還會涉及廣告費用。2C就更不用說了,除非運氣好裂變了,不然買量是離不開的話題。目前比較好的是這個方向比較新,競價價格會相對低。不過也存在蹭流量現(xiàn)象,例如完全沒有相關(guān)要素的社交APP,也會投放含有“虛擬聊天”相關(guān)的素材。2C還有一個利好就是一般做娛樂類應(yīng)用,社交的買量價格起碼不像電商和金融那么恐怖。帶著上述這些前置信息,我們會發(fā)現(xiàn),考慮場景的生意模式的時候,我們不可能只按3700字/元來作為底線測算。整體的成本線可能要壓到2000字甚至1000字/元,才能抹平其他成本。即我們需要做到,GPT每生成1000個字,產(chǎn)品能從用戶身上賺到1元。這樣營收與成本線3700字/元之間的差額就是我們可累積的利潤。3.場景盤點帶著對盈利模式和成本線的簡單了解,我們進(jìn)入場景盤點。在這一部分我們要注意,我們沒有精力、也不可能將市面上全部的應(yīng)用羅列。因此只能基于技術(shù)線應(yīng)用可能進(jìn)行分類聚合,然后基于各類別的關(guān)鍵要素進(jìn)行分析。4.文本創(chuàng)作類這是目前最火爆的一個分類。從文本長度來說,可以分為短文本、長文本、超長文本。從專業(yè)角度,可以分為法律、心理咨詢、教育、建筑、小說、公文等。再細(xì)致一點可以列出SEO文案、社媒內(nèi)容、廣告創(chuàng)意、郵件寫作、公文信函、簡歷修改等等等等。我們不可能把全部的可能組合起來,其結(jié)果將超出我們的分析能力范圍。我們只抓兩個關(guān)鍵要素:怎么賺錢,技術(shù)能否支撐。在這里,舉兩個例子:SEO文章生成:在AIGC之前,人工手寫的SEO稿是有明確標(biāo)價的,大約在千字10元~50元不等,個別優(yōu)質(zhì)的可以到100元。我們?nèi)∫粋€最低值,就是千字/10元,離我們前文硬推的千字/1元之間足足有10倍的價值差額。電商運營提效:我是一名在西班牙的電商從業(yè)者,原本我雇傭了一名本地運營,幫助我維護(hù)西語系國家的站點?,F(xiàn)在通過AI的能力,仍然是這名運營,可以在多個不同語系,數(shù)十個細(xì)分市場中維護(hù)站點。那么這中間的差額就來自1名運營人員和N名運營人員之間。我們會發(fā)現(xiàn),他的模式本質(zhì)上是AI在內(nèi)容創(chuàng)作這項勞動上,制造了剪刀差。只要這場浪潮沒有完全結(jié)束,內(nèi)容創(chuàng)作的社會必要勞動時間沒有完全進(jìn)入另一個層面,剩余價值就會自動從動蕩的剪刀差中掉落。而在技術(shù)層面而言,目前的技術(shù)支撐程度,簡單來說就是:文本越長死的越快,結(jié)構(gòu)越復(fù)雜死的越快,但短文本和通用內(nèi)容方面已經(jīng)是如魚得水,非常成熟。不過目前已經(jīng)有人在中長文本方向進(jìn)行努力,他的推理能力也在加強(qiáng),所以技術(shù)的突破和垂直領(lǐng)域適應(yīng)是一個非常值得期待的方向。綜上,我認(rèn)為,文本生成領(lǐng)域是一個完全的增量市場。并且隨著技術(shù)的進(jìn)一步提升,他的規(guī)模更逐步擴(kuò)大。補(bǔ)充:其實還有一些小分支領(lǐng)域,例如文本糾錯、實時翻譯等,但是都不如文本生成夸張,所以就略過了。5.代碼生成/糾錯/Sql/語言轉(zhuǎn)換等等等等這是目前海外第二火爆的分類,獨立開發(fā)者很多。不過分析到這里我遇到一個尷尬的地方。我并不是程序員,無法設(shè)身處地去設(shè)想是否愿意為相關(guān)的服務(wù)付費。哈哈,所以我把問題轉(zhuǎn)手給我的程序媛夫人,讓她在旁邊靜靜思考一下。我們先從這個領(lǐng)域的技術(shù)情況開始分析。首先,不要被媒體稿迷惑。就目前而言,GPT無法替代程序員。他的代碼生成能力,在常規(guī)問題上能夠正確,但是一旦你換一些變種,他就會給出看似正確其實離了大譜的答案。這項技術(shù)的應(yīng)用前景,更多在于代碼輔助寫作,例如快速生成一個簡單模塊,對代碼進(jìn)行自動Bug檢查,生成Sql語句、代碼解釋等等。但是都需要人工二次review,他能夠幫助你的主要在于快速的檢索、簡單代碼的快速寫作、自動糾錯等輔助功能。并且這方面和文本生成領(lǐng)域不太像,技術(shù)角度產(chǎn)出的結(jié)果質(zhì)量還不夠高,不太能形成巨大的剪刀差。但目前的技術(shù)已經(jīng)實現(xiàn)了一定的效率提升,以及門檻降低。效率提升:有助于程序員們coding環(huán)節(jié)加快速度。門檻降低:門外漢已經(jīng)可以通過開發(fā)工具+GPT實現(xiàn)部分專業(yè)領(lǐng)域的簡單設(shè)計(例如Unity+GPT做游戲)。好了,回到商業(yè)價值上,一段時間的思考后,程序媛老婆給出了堅定的答復(fù)——“我們花這個錢干什么,當(dāng)然自己做一個啊?!蔽遥骸?.0???”我有點不太相信,但是找了一圈這個領(lǐng)域的投融資情況,找不到太多的例子,只看到OpenAI有投資消息:一家代碼編輯,一家開發(fā)工具。但再往下細(xì)探就找不到任何相關(guān)消息了。好吧,我只能認(rèn)為暫時而言,這方面的商業(yè)前景可能不太樂觀。2C側(cè)暫時相信老婆大人的判斷,應(yīng)該比較難創(chuàng)收;而2B側(cè)需要企業(yè)判定對自身內(nèi)部效率有幫助。而眾所周知,提效類的2B服務(wù),往往比不過營銷類這種能直接創(chuàng)收的服務(wù)……綜上,這是一個完全的增量市場,但是商業(yè)化機(jī)會似乎不太美妙。比起有一個成熟公司在這里殺出來,我更期待獨立開發(fā)者或者是大廠做出的自用工具然后開源。畢竟——“當(dāng)然是自己做一個啊”真的是程序員獨有的浪漫了吧。6.Chatbot方向在說Chatbot方向前,我們先提煉新技術(shù)對這個領(lǐng)域的影響,然后帶著這些認(rèn)知去做場景盤點。簡單而言,ChatGPT的技術(shù)讓對話更自然了。這里的自然包括純閑聊部分,也包括QA甚至Task任務(wù)。一個能夠聯(lián)系上下文,并對知識進(jìn)行整合推理的Chatbot,對以往的機(jī)器人會是一種顛覆式的升級,能夠跨越以往用戶體驗的上限。整體上,我將Chatbot分為以下方向:1)客服類這部分包括目前各個主流平臺自研的機(jī)器人或者提供相關(guān)服務(wù)的客服機(jī)器人企業(yè)。從技術(shù)上來看,有非常大的變化,甚至推動技術(shù)棧重構(gòu)。但是從商業(yè)上來看,有可能影響寥寥。客服bot的市場中,仍然有一些競爭者,他不止ChatGPT,甚至連BERT也沒有應(yīng)用,仍然是相當(dāng)老舊的一套系統(tǒng)。而他們既然仍然在這個市場保有份額,自然有其原因——某些時候,2B的市場中,技術(shù)不是第一競爭力,服務(wù)、渠道、價格都會比技術(shù)重要。而新一代語言模型技術(shù)的出現(xiàn),不過是給這個市場增加了一點擾動。已經(jīng)買了產(chǎn)品的,因為遷移成本,渠道關(guān)系不一定馬上會切換。技術(shù)服務(wù)商可能會緊急跟進(jìn)嘗試,但也不妨礙部分競爭者慢悠悠甚至毫不在意。并且一個關(guān)鍵點在于,GPT技術(shù)除非自行部署,否則意味著自身的核心能力轉(zhuǎn)為依托于大廠。這是不是客服機(jī)器人公司所能接受的,還存在疑問。最后ChatGPT模式下,算力成本以及時延會變得難以忽視,會給這個方向帶來一些陰影。綜上,我覺得客服方向,屬于舊技術(shù)盤踞的存量市場。技術(shù)蝶變在部分公司會狂風(fēng)暴雨(但落地會很謹(jǐn)慎),在部分公司可能進(jìn)展較慢或無動于衷。2)娛樂類娛樂類即只提供情感/娛樂價值的方向,上篇文章提及的APPGlow是一個典型例子。對于這個方向來說,技術(shù)上讓情感價值的提供成為現(xiàn)實(AI更自然了,沒那么智障了),但是非常需要結(jié)合情感場景的設(shè)計。而脫離場景設(shè)計的結(jié)果,最典型的就是ChatGPT本身。ChatGPT當(dāng)時在11月30日發(fā)布后,用戶們是情不知所起,一往而深,再而衰,三而竭,僅僅一周左右的時間就銷聲匿跡。因為沒有任何一個人的需求是“聊天”,以及看一個AI“賣弄聰明”。在上篇文章中,我大概說了一些關(guān)于娛樂類Chatbot的一些想法,這里不再重復(fù)闡述這種方案的細(xì)節(jié)描述,沒看過的朋友可以移步此鏈接:輕松小補(bǔ)充:GTPAPP全景地圖+虛擬人構(gòu)造想法+prompt模式詳解,看第二部分就行。我們重點說說商業(yè)上的問題,先來回顧下上面提及的關(guān)鍵點:1000字/元的成本線;基于訂閱收費模式所需要的持續(xù)價值;基于商品收費模式所需要的復(fù)購動力。其中成本線問題需要通過產(chǎn)品設(shè)計繞開,不能讓用戶的行為時間大量投注在閑聊中,否則隨著文字互動量的上升,成本將急劇飆升。一種可能的解決的方式是以閑聊交互為核心行動線,穿插劇本設(shè)計、劇情推動、用戶自主人設(shè)構(gòu)建等玩法,來減少算力損耗——總之就是不要只能聊天,撐不住。還有一種比較騷的玩法,可能是在Prompt層面對模型進(jìn)行約束,例如下面這張圖,ChatGPT會強(qiáng)制在問題中引入一段前綴,以此限制答案長度節(jié)約算力。而持續(xù)價值和復(fù)購動力可以合并來說,因為這兩種收費模式其實很容易互相搖擺。一個比較好玩的做法可能是構(gòu)造“角色”的獲取-使用-厭倦-再獲取這種閉環(huán)。這套模式已經(jīng)被諸多集卡類游戲深度驗證過,也成功從我手中掏走了不少錢(該死的原神?。。?。綜上,我認(rèn)為娛樂類BOT是一個完全的增量市場,技術(shù)的突破成為這個方向的關(guān)鍵要素。但是市場強(qiáng)依賴對用戶需求的打磨和設(shè)計,到底應(yīng)該怎么做,還需要摸索,目前大家都在嘗試。3)工具類(助手類)工具類包括語音音箱、手機(jī)語音助手、車載語音助手等。從技術(shù)上來看,我覺得非常大的問題在于“實時性”,我從圈內(nèi)朋友獲取的信息是,目前接口調(diào)用的時延在1S以上(不知道是不是因為服務(wù)器距離導(dǎo)致)。這種延遲很難說可以應(yīng)用在上述場景,他的用戶體驗將十分糟糕。除了這個缺陷以外,技術(shù)上對工具類BOT的體驗提升將是非常大的幫助(上面說過了不再重復(fù)一遍了)。但從商業(yè)上來看,我認(rèn)為這也是一個舊市場?;蛟S你會認(rèn)為,可能有一家創(chuàng)業(yè)公司,依賴全新、更好體驗的語音助手殺出重圍,擠占原有語音助手的空間。但需要我們注意的是,這些助手雖然是軟件,實際上卻非常依賴自身的硬件渠道——小愛依托小米,Siri依托蘋果,車載助手則在各個汽車品牌之間互相割裂。我感覺這個領(lǐng)域應(yīng)該是產(chǎn)生不了新蛋糕的。不過比較有意思的是,雖然看起來和客服類一樣是個存量市場,但工具類Chatbot會熱衷于擁抱這些新技術(shù),因為這將有助于提升他們的用戶體驗,從而推動他們硬件渠道的增長。綜上,我認(rèn)為工具類方向半舊不舊,沒有增量,但更樂于擁抱新技術(shù)。4)專業(yè)類專業(yè)類指需要獨特領(lǐng)域知識的Chatbot,例如法律咨詢機(jī)器人、投顧機(jī)器人、心理咨詢機(jī)器人等。這類機(jī)器人有幾個特點:第一,專業(yè)要求高,需要專業(yè)人員調(diào)教驗證;第二,結(jié)果輸出要求穩(wěn)定/高質(zhì)量,需要為結(jié)果負(fù)責(zé);第三,部分場景使用頻率偏低(例如法律Chatbot,普通人一輩子用不到幾次);第四,極度需求高質(zhì)量專業(yè)數(shù)據(jù)。從技術(shù)角度來說,GPT給他們帶來的升級效應(yīng)較小。因為這個領(lǐng)域最困難的并不是交互過程、理解過程的升級,他面臨的困難始終來自專業(yè)數(shù)據(jù),低頻場景。不知道GPT是否可能掛載額外的知識庫,而不需要專業(yè)數(shù)據(jù)在預(yù)訓(xùn)練環(huán)節(jié)重新接入。如果可以的話,應(yīng)該有助于提升用戶體驗的上限。目前看到一個法律領(lǐng)域的BOT,如下圖:在我一位律師朋友看來雖然還會有些錯誤,但已經(jīng)相當(dāng)自然通順,相較過去基于舊技術(shù)的專業(yè)機(jī)器人已經(jīng)有一些提升。綜合來看,對當(dāng)前體驗沒有顛覆性升級,場景低頻難以變現(xiàn)。一條可靠的路徑可能是先做給專業(yè)人員的輔助工具,然后在使用中積累數(shù)據(jù)優(yōu)化再開放。我認(rèn)為他暫時是一個有一點潛力的增量市場,需要結(jié)合技術(shù)演進(jìn)和專業(yè)落地嘗試再細(xì)看。補(bǔ)充:專業(yè)領(lǐng)域太多了,非常需要行業(yè)經(jīng)驗逐一盤點,所以這段判斷僅供參考,存在較高錯誤可能。7.游戲方向頭部的應(yīng)用方向基本就是Chatbot、文本生成、代碼這三個領(lǐng)域,而游戲其實暫時我看不到太多優(yōu)秀的例子。這是我目前唯一找到的case:AI地下城,文字交互類游戲。但是我畢竟是20年+的游戲玩家,為愛發(fā)電也要強(qiáng)行聊一波:1)NPC流水線NPC制作的幾個制約因素都被本輪技術(shù)升級覆蓋。包括NPC背景故事的生成(短文本),NPC自由對話(基于人設(shè)的對話),NPC頭像、3D建模生成(頭像比較容易,3D建模有點困難,但NPC外貌重要性弱一些),NPC好感度機(jī)制等。其中自由對話模塊已有現(xiàn)成的case,一名玩家為《騎馬與砍殺2》制作了一段實驗性demo,見下圖:詢問NPC村民能否鑄劍,得到肯定回復(fù)并詢問預(yù)算及材料2)任務(wù)流水線任務(wù)制作的影響范圍相對較小,因為他會涉及到數(shù)值設(shè)計、關(guān)卡設(shè)計、上下游依賴任務(wù)等問題。但在單環(huán)任務(wù),一次性任務(wù)上,新技術(shù)將在任務(wù)文本生成,任務(wù)選項等方面起到幫助。這方面我勉強(qiáng)看到一個例子,不過他是劇情式游戲,僅供參考。中間那個>Yougogogo就是我的命令,可惜寫這篇文章太累了,投不進(jìn)心思玩3)交互模式傳統(tǒng)的游戲交互方式是界面(傳統(tǒng)鍵鼠或觸控)、體感(Switch或VR),奇葩一點的可能會加入聲音觸控(音調(diào)、音量、或者少數(shù)ASR識別關(guān)鍵詞)。而GPT可以讓自然語言交互成為可能,即延伸出來的文本交互&語音交互會相當(dāng)成熟。但是并不是說更新的交互方式就一定更好,大家可以借鑒上一輪Chatbot的發(fā)展歷史來看。在Chatbot剛出的時候,極度追求極端的VUI交互(語音交互),但發(fā)展到后面都妥協(xié)了,采用VUI+GUI(圖形界面交互)的方式。這是因為語音或文本,天然是有其缺陷的,需要根據(jù)實際需求選擇組裝。具體內(nèi)容可以參見我2017年的一篇產(chǎn)出,現(xiàn)在回過頭看有一些更新的理解,不過我只剩個PDF了修改不了,就將就著看一看吧哈哈。From《VUI設(shè)計方法分享》不過游戲方向是非常特殊的,技術(shù)能夠為他帶來改變,但他的成功絕不會只靠技術(shù)。事實上,全智能NPC、全智能任務(wù)只是一種新穎的設(shè)計。真正一款游戲好不好玩,能不能打動人心,還有非常多題外的因素。另外技術(shù)是否還能應(yīng)用到其他領(lǐng)域呢?例如NPC決策邏輯,世界背景構(gòu)建,新語言創(chuàng)造等——我不知道,但對技術(shù)永遠(yuǎn)抱有期待。希望綠洲早日來臨!為了部落,waaaaagh!最后收尾總結(jié)一下:游戲領(lǐng)域是一個100%的舊市場,但又和客服機(jī)器人、工具機(jī)器人不一樣,新技術(shù)可能讓這個領(lǐng)域出現(xiàn)顛覆性的新玩家。補(bǔ)充:或許MUD類型游戲會重新閃亮出場?這種類型可以甩開音樂、UI、建模等諸多成本,最先吃到這波技術(shù)升級的紅利。利用好玩家們對新技術(shù)的新鮮感應(yīng)該會有一波流量,但后續(xù)留存就難說了。8.是否還有其他方向?在上文列舉的文本生成、Chatbot、代碼生成,其實是ChatGPT演示中直觀帶給我們的靈感,只是在落地過程中,隨著參賽者的選擇,逐步延伸向了各自的細(xì)分方向。而游戲方向則是典型的,GPT技術(shù)+其他行業(yè)邏輯構(gòu)造出的延伸方向。因此我們可以想象類似游戲這樣的擴(kuò)展行業(yè)還有很多,只要他的行業(yè)中有大量關(guān)于文本的應(yīng)用——哪個行業(yè)不是呢?例如教育行業(yè),能不能用GPT梳理、查找關(guān)聯(lián)知識點?金融行業(yè),能不能用GPT閱讀會計報告、合同文件進(jìn)行分析?我不知道哈哈,暫時沒有case,等待新玩家們涌現(xiàn)。第三步(2)基于框架進(jìn)行知識填充——技術(shù)篇技術(shù)篇非常簡單,我們不再科普技術(shù)原理,技術(shù)原理已經(jīng)在前文萬字長文:AI產(chǎn)品經(jīng)理視角的ChatGPT全解析中大篇幅講過了。我們重新基于應(yīng)用角度,梳理當(dāng)前技術(shù)的現(xiàn)狀及潛力?,F(xiàn)狀決定短期內(nèi)哪些能做哪些不能做,潛力決定未來橫向、縱向的擴(kuò)展可能。大家可以用這些認(rèn)知來掃描任何新出現(xiàn)的應(yīng)用場景。1.技術(shù)現(xiàn)狀1)結(jié)果不穩(wěn)定,需要review需要Review,就意味著大部分場景不能脫離人,只能輔助人。除非你在做一些完全不在乎質(zhì)只在乎量的市場,例如營銷號、SEO、刷評論。2)推理能力弱,容易推出看似正確的錯誤答案結(jié)構(gòu)復(fù)雜、邏輯復(fù)雜的場景無法適配,例如長篇小說容易顛三倒四,教育應(yīng)用也要謹(jǐn)慎用在理工科方向的問題上。3)知識更新困難,成本巨大知識無法通過Prompt獲取,源頭只來自LLM中的1750億參數(shù),更新一次知識成本高,速度慢。所以無法適配需要緊跟時事的場景——但這不意味著不能用來摘要新聞,畢竟天底下無新鮮事。4)延遲較高,實時場景不適配截止昨天2月3日我已知的信息是接口延遲在1~2S(可能有誤),所以暫時語音助手這種實時響應(yīng)要求高的會不適配。但我覺得這個問題應(yīng)該很快會被解決,工程問題無法求解是沒看到蛋糕,只要看到蛋糕性能迭代是非??斓模珹I的演進(jìn)歷史本身就是一部效率迭代的歷史。5)垂直領(lǐng)域表現(xiàn)未達(dá)最佳這里的垂直領(lǐng)域包含兩種解釋,一種是技術(shù)側(cè)的垂直領(lǐng)域,例如自然語言理解類的任務(wù),暫時仍是BERT更優(yōu)。另一種是行業(yè)側(cè)的垂直領(lǐng)域,例如法律、心理、金融等。我猜想一個原因可能來自原始訓(xùn)練數(shù)據(jù)中缺乏高質(zhì)量的文本數(shù)據(jù)。From《LanguageModelsareFew-ShotLearners》模型預(yù)訓(xùn)練訓(xùn)練中所用到的數(shù)據(jù)集6)可掛載其他模塊,但目前沒有標(biāo)準(zhǔn)方法目前看到的一些方式是,用GPT作為輸入端,再用其他工具作為邏輯端,例如GPT+unity,GPT+Wolfram|Alpha。一方面是這些掛載目前都是自發(fā)行動的,后續(xù)有可能會出現(xiàn)標(biāo)準(zhǔn)規(guī)范的GPT引用方式,甚至可能大部分應(yīng)用會以“本店支持GPT-3”做為榮譽(yù)標(biāo)識。另一方面我還沒看到更深層次、更觸碰GPT底層邏輯的實踐。現(xiàn)在的實踐本質(zhì)上和ifttt有點像,是兩個應(yīng)用的解耦式聯(lián)合。是否能實現(xiàn)更深層次的呢?例如我們前面說的知識更新困難,有辦法通過掛載一個小規(guī)模的實時知識庫來實現(xiàn)嗎?不知道,等待玩家們的表現(xiàn)。2.技術(shù)潛力1)更通用說白了就是從Text-Text到Text-everything。GPT已經(jīng)證明了在NLP領(lǐng)域的統(tǒng)治力,而圖像、語音、視頻等多模態(tài),其實只需要Text-多模塊的若干轉(zhuǎn)譯通路。我沒有針對性地搜集信息,但至少Text-image的通路是現(xiàn)成、成熟的。StableDiffusion中一個關(guān)鍵技術(shù)就是OpenAI所提供的CLIP(ContrastiveLanguage-ImagePre-Training)。2)更便宜經(jīng)過商業(yè)模式部分的分析,我們可以相信這個方向的應(yīng)用潛力是巨大的。當(dāng)應(yīng)用可行時,配套的上下游產(chǎn)業(yè)鏈會快速出現(xiàn),包括芯片、算法平臺、專屬云服務(wù)等等。不過前面就說了,上下游產(chǎn)業(yè)鏈不做分析,整個結(jié)果是不證自明的。我們只需要知道,按照邏輯推理,更便宜是100%會出現(xiàn)的就可以。3)更強(qiáng)大一方面的提升來自于多種GPT方向大模型的嘗試落地。目前大廠們哪怕在短時間內(nèi)會與OpenAI展開合作,但除了微軟以外,應(yīng)該都無法忍受上游關(guān)鍵技術(shù)握在其他人手里。因此可預(yù)見的GPT的最上游會出現(xiàn)復(fù)數(shù)玩家來一起嘗試。另一方面的提升來自模型結(jié)構(gòu)的改進(jìn),2023年學(xué)術(shù)界的關(guān)于這方面的paper肯定會爆炸的。唯一限制他們的就是學(xué)術(shù)界如何繞開大模型訓(xùn)練成本這一難關(guān)。應(yīng)該會形成企業(yè)-學(xué)術(shù)這樣的合作通道。最后一方面來自各種垂直方向的適配調(diào)優(yōu),前面在分析商業(yè)模式盤點場景的時候已經(jīng)舉了很多例子了。第三步(3)基于框架進(jìn)行知識填充——限制

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論