人機(jī)共生:大模型時代的AI十大趨勢觀察-騰訊研究院_第1頁
人機(jī)共生:大模型時代的AI十大趨勢觀察-騰訊研究院_第2頁
人機(jī)共生:大模型時代的AI十大趨勢觀察-騰訊研究院_第3頁
人機(jī)共生:大模型時代的AI十大趨勢觀察-騰訊研究院_第4頁
人機(jī)共生:大模型時代的AI十大趨勢觀察-騰訊研究院_第5頁
已閱讀5頁,還剩88頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

——司曉施鴦謝恩||||院院長同濟(jì)大學(xué)經(jīng)濟(jì)與管理學(xué)院教授、博士生導(dǎo)師、副院長(主持工作)同濟(jì)大學(xué)經(jīng)濟(jì)與管理學(xué)院教授、博士生導(dǎo)師、副院長,林濤||||教育副總裁聞運(yùn)營總經(jīng)理副總經(jīng)理王強(qiáng)王成王獻(xiàn)星賈鶴謝魯王強(qiáng)宋揚(yáng)孫星張棟念紅志韓朝戚蘊(yùn)何村聯(lián)合出品騰訊研究院同濟(jì)大學(xué)經(jīng)濟(jì)與管理學(xué)院騰訊優(yōu)圖實(shí)驗(yàn)室騰訊教育騰訊云智能騰訊新聞人機(jī)共生——大模型時代的AI十大趨勢觀察趨勢6趨勢1AGI階段10趨勢7趨勢2趨勢8趨勢3人機(jī)共生——大模型時代的AI十大趨勢觀察趨勢6趨勢1AGI階段10趨勢7趨勢2趨勢8趨勢3趨勢9趨勢4模型即服務(wù)(MaaS)生態(tài)21趨勢10趨勢5057人機(jī)共生——大模型時代的AI十大趨勢觀察AI生態(tài)428“注入靈魂”336394序序言侊奇點(diǎn)之后院院長2022年,潘多拉的魔盒又被打開了—次。當(dāng)OpenAI在2022年11月30日發(fā)布ChatGPT的時候,沒有人會意識到,新—在文字領(lǐng)域,雖然ChatGPT最初以聊天機(jī)器人的形式出現(xiàn),但很快我們發(fā)現(xiàn)LLMs (LargeLanguageModel,大語言模型)的能力遠(yuǎn)不止如此。創(chuàng)作詩歌、小說、劇本甚至商業(yè)報(bào)告只是它的基礎(chǔ)技能,閱讀、分析、總結(jié)與翻譯也都不在話下。通過以特定的形式封裝LLM,它將能夠?qū)?fù)雜任務(wù)進(jìn)行拆解,自我學(xué)習(xí),利用其他工具(插件和API),實(shí)現(xiàn)那些在以往我們認(rèn)為只有人類才能完成的任務(wù)。在短短的半年里,AI幫我們復(fù)習(xí)了文字在人類文明中的重要作用——承載抽象思維,與他者溝通(協(xié)作)。以至于許多科學(xué)家和社會學(xué)家開始認(rèn)真思考那些科幻作品中人想。在視覺媒介中,也出現(xiàn)了許多引人注目的技術(shù)。以Midjourny、StableDiffusion和以放下畫筆(或鼠標(biāo)、觸控筆),僅憑語言來“創(chuàng)作”圖片。盡管這種創(chuàng)作方式帶來了版權(quán)與勞動者權(quán)益上的爭議,但技術(shù)的發(fā)展與應(yīng)用似乎并不會停止。當(dāng)Adobe在人機(jī)共生——大模型時代的AI十大趨勢觀察在音頻領(lǐng)域的AI技術(shù)也取得了顯著的進(jìn)步。以AmperMusic為代表的AI音樂生成技術(shù),可以根據(jù)用戶的需求生成符合特定氛圍的音樂。這些技術(shù)的出現(xiàn),讓音樂變成了徹底的個性化內(nèi)容,它不再是像推薦歌單那樣,幫你找到符合當(dāng)下心情的音。IAI工作,導(dǎo)致大規(guī)模的失業(yè)。在繪畫和編劇—方面,技術(shù)的進(jìn)步似乎不可避免的仍在繼續(xù)前進(jìn);但另—方面,創(chuàng)作者在短期內(nèi)的競爭力。企業(yè),從本質(zhì)上說,是人類的大規(guī)模協(xié)同系統(tǒng)。它的作用,是以—種高效的形式,懸疑電視劇,我們要意識到是,在過去沒有任何人可以獨(dú)立完成這些基于現(xiàn)代內(nèi)容無論是制造業(yè)、服務(wù)業(yè)還是創(chuàng)新領(lǐng)域,企業(yè)都扮演著讓個人才能集中在特定的任務(wù)工可以被AI替代,那么情況可能與他們設(shè)想的恰恰相反——這家企業(yè)并沒有繼續(xù)存在以游戲行業(yè)為例,這個行業(yè)是人類創(chuàng)造力和系統(tǒng)工程的完美結(jié)合。傳統(tǒng)上,制作—款成功的游戲需要大量的人力資源,包括程序員、設(shè)計(jì)師、藝術(shù)家、作曲家、故事編寫者等等。在制作完成后,還要對游戲進(jìn)行宣傳、市場營銷和銷售。這些都需要大型的游戲公司將擁有不同才能的人協(xié)調(diào)和組織起來才能完成。然而,隨著人工智現(xiàn)在,人工智能可以自動編寫代碼,設(shè)計(jì)游戲環(huán)境,甚至創(chuàng)作音樂和故事。這意味作才能完成的任務(wù)。他們可以在更短的時間內(nèi),以更低的成本,制作出高質(zhì)量的游在過去因制作門欖而永遠(yuǎn)無法被實(shí)現(xiàn)的創(chuàng)意。人機(jī)共生——大模型時代的AI十大趨勢觀察能改變我們組織和運(yùn)營企業(yè)的方式。這個新的視角,不僅可以幫助我們更好地理解AI有效地利用這些工具的個體創(chuàng)作者,可能會產(chǎn)生我們成內(nèi)容)媒介,就像是短視頻—樣。從某種程度上說,隨著這—輪AI的爆發(fā),除了先行者或者說創(chuàng)造了行業(yè)本身的少在本報(bào)告中,騰訊研究院基于科技行業(yè)的發(fā)展以及騰訊自身在AI領(lǐng)域多年的深耕,在技術(shù)觀察方向,我們關(guān)注在涌現(xiàn)的加持下AI向AGI(ArtificialGeneralIntelli-gence,通用人工智能)快速進(jìn)化的趨勢。I非常明智的選擇。因?yàn)榧夹g(shù)總是有著其自身的發(fā)展規(guī)律,又有著諸多不可預(yù)測的意外因序序言侊無限可能“無限可能”是2023年世界人工智能大會(WAIC)騰訊論壇的主題,也恰巡是美國暢銷書的名字。2020年,世界公認(rèn)的記憶專家和和大腦教練吉姆·蠻克(Jim大腦X速學(xué)習(xí)、人生進(jìn)階的系統(tǒng)方法,力圖幫助讀者從思維、動力和方法三個維度喚醒超將超越人類的感覺。面對這樣突如其來的偉大創(chuàng)新,我—直試圖認(rèn)識并厘清其內(nèi)在邏輯和外在影響。我認(rèn)為,不論是大模型,還是應(yīng)用領(lǐng)域更為廣泛的AIGC,其本質(zhì)上都是機(jī)器基于深度的自主學(xué)習(xí),在努力探究和尋找人們思考及從事智力活動的規(guī)律。而這樣的規(guī)律—旦被找到,也就相當(dāng)于揭示出人們思考和從事智力活動的底層原理,加之機(jī)器極高的效率和快速續(xù)送代特征,進(jìn)而形成超越絕大多數(shù)人類從事作為—個大學(xué)老師,我很自然要關(guān)心其對教育,特別是高等教育的影響。我認(rèn)為,大模型、AIGC等技術(shù)不僅將豐富老師備課、學(xué)生們學(xué)習(xí)的方式,更將極大地提高的學(xué)習(xí)情況和興趣,有針對性為他們推薦最合適的教材和課程;其次,老師和學(xué)生人機(jī)共生——大模型時代的AI十大趨勢觀察AIGC將基于數(shù)據(jù)和模型驅(qū)動的創(chuàng)新成果不斷充實(shí)到教學(xué)環(huán)節(jié),不僅極大地豐富教研工作者及科技管理研究人員,我當(dāng)然也關(guān)注大模型、AIGC等技術(shù)引致的科學(xué)研究和技術(shù)創(chuàng)新范式的革命性變化。首先,有如AlphaFold2在蛋白質(zhì)結(jié)構(gòu)預(yù)測方面已經(jīng)取得的卓越成就,我們相信大數(shù)據(jù)、大模型將顛覆原有科學(xué)家加儀器的科研方式,進(jìn)而豐富科學(xué)研究的范式;其次,在大模型、AIGC等技術(shù)助力下,基于數(shù)據(jù)和模型驅(qū)動的創(chuàng)新可以揭示很多重要領(lǐng)域的底層原理,進(jìn)而極大地加次,重要科技及產(chǎn)業(yè)領(lǐng)域的“底層原理”將成為未來科學(xué)研究與技術(shù)創(chuàng)新活動的重生產(chǎn)和創(chuàng)造的手段,也必然替代人類社會絕大多數(shù)的智力性活動,但它很難替代不僅是人類最偉大、最高層次的能力,也是至今尚難尋找到規(guī)律的能力。吉姆·蠻克主張用人的內(nèi)在愿力和科學(xué)方法,喚醒和激發(fā)人類大腦(內(nèi)腦)的能力,進(jìn)而實(shí)現(xiàn)代科學(xué)技術(shù),通過探究和掌握人們思考及從事智力活動的規(guī)律,并通過深度機(jī)器處于即將來臨的新科技革命檔口,人類社會面臨著巨大機(jī)遇,也面臨著重大挑戰(zhàn)。我們真切希望,面對科學(xué)技術(shù)的飛速發(fā)展,人類也能加快自身的進(jìn)化步伐,要不斷序言侊序言侊擁抱產(chǎn)業(yè)智能運(yùn)聲數(shù)字科技正以前所未有的速度改變著我們的世界。在這個充滿機(jī)遇和挑戰(zhàn)的時代,人工智能(AI)作為引領(lǐng)變革的核心引擎,正以驚人的力量推動著各行各業(yè)的進(jìn)步與創(chuàng)新。大語言模型的嶇起,更是為AI賦予了解鎖人類智慧的鑰匙,引領(lǐng)著我們進(jìn)入隨著大語言模型的快速發(fā)展,生成式AI為各行業(yè)帶來了無限的想象空間。從海報(bào)設(shè)計(jì)到視頻制作、從日常辦公到千行百業(yè),各個領(lǐng)域都展現(xiàn)出數(shù)字科技革命的巨大潛力。然而,在應(yīng)用大模型技術(shù)推動智能產(chǎn)業(yè)化的過程中,產(chǎn)業(yè)客戶也面臨著—些首先,定制模型成本高昂。企業(yè)往往無法以較低的成本獲取適合自身場景的定制模型。當(dāng)前市場上的通常類模型,主要基于公開數(shù)據(jù)集或網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行訓(xùn)練,導(dǎo)致生成結(jié)果在專業(yè)度和準(zhǔn)確度方面存在—定偏差。這對于產(chǎn)業(yè)場景的用戶體驗(yàn)和業(yè)務(wù)結(jié)其次,算力需求和資源限制。大模型的訓(xùn)練需要強(qiáng)大的算力支持,而訓(xùn)練集群中的U整個集群停止工作,這對于云服務(wù)的運(yùn)維和問題排查能力提出了極高要求。最后,大規(guī)模數(shù)據(jù)處理挑戰(zhàn)。在大規(guī)模數(shù)據(jù)的收集、整理和處理過程中,需要在效率、質(zhì)量、合規(guī)和安全性之間取得平衡。數(shù)據(jù)是模型的重要支撐,數(shù)據(jù)質(zhì)量的好壞直接影響模型的表現(xiàn)。然而,處理大規(guī)模數(shù)據(jù)需要投入大量時間和精力,從數(shù)據(jù)的人機(jī)共生——大模型時代的AI十大趨勢觀察收集、清洗、標(biāo)注、測試到處理,都需要高效且高質(zhì)量的執(zhí)行。同時,還必須遵守合規(guī)要求并確保數(shù)據(jù)的安全性。為了加速產(chǎn)業(yè)智能化過程,讓產(chǎn)業(yè)客戶更快、更好、更方便地使用大模型能力,以幫助他們提質(zhì)增效,騰訊云今年六月份也公布了行業(yè)大模型解決方案,通過打造模采購算力、存儲和帶寬等原材料,并自行打磨零部件、組裝大模型。也可以選擇基和智過工程化體系將企業(yè)定制模型構(gòu)建的時間和成本降至最低。平臺方面,我們的騰訊者和算法工程師高效地創(chuàng)建和部署AI應(yīng)用。計(jì)算方面,騰訊云為客戶提供了經(jīng)濟(jì)有效的高性能、高穩(wěn)定性的算力資源。我們針適合的任務(wù),實(shí)現(xiàn)了高性能計(jì)算資源的經(jīng)濟(jì)獲取。新—算力和互聯(lián)帶寬。此外,引入了自研的文件存儲和對象存儲架構(gòu),滿足不同場景對n在智能客服應(yīng)用方面,某文旅客戶利用騰訊云自然語言模型實(shí)現(xiàn)了個性化的定制并提前安排好每天的行程;在政務(wù)領(lǐng)域,福建大數(shù)據(jù)集團(tuán)攜手騰訊云打造了互動式大模型應(yīng)用"小閩助手",為市民提供智能咨詢服務(wù);在教育領(lǐng)域,上海大學(xué)借助壓力。在跨模態(tài)檢索方面,央視總臺則通過騰訊云TI平臺原生模型構(gòu)建了智能媒體AI中R加速產(chǎn)業(yè)場景探索的同時,騰訊云行業(yè)大模型能力也已經(jīng)在騰訊企點(diǎn)、騰訊會議、AI果,其中提到了行業(yè)大模型在各領(lǐng)域落地方面更加翔實(shí)的內(nèi)容。我們希望這份白皮書能夠?yàn)閷?shí)體產(chǎn)業(yè)的數(shù)字化轉(zhuǎn)型提供行業(yè)參考,加速推動傳媒、金融、文旅、工業(yè)在數(shù)字科技革命的奇點(diǎn)上,我們的目標(biāo)是為各行各業(yè)的數(shù)字化轉(zhuǎn)型提供更具創(chuàng)新性和商業(yè)價值的解決方案。在這個過程中,騰訊云愿意貢獻(xiàn)自身的能力,深入理解行業(yè)需求,與行業(yè)伙伴攜手推動智能產(chǎn)業(yè)的發(fā)展,讓智能普惠于每個人的生活,創(chuàng)造人機(jī)共生——大模型時代的AI十大趨勢觀察——技術(shù)篇世以來,人工智能進(jìn)入到第三次高潮?!?jīng)面世便風(fēng)靡全球,人們驚訝于其能夠進(jìn)行連貫、有深度對話的同時,也驚異地發(fā)現(xiàn)了它涌現(xiàn)了推理、思維鏈等體現(xiàn)智能的能力。GPT4的能力更是進(jìn)化神速,在多種能力測試中達(dá)到人類頂級水平,隨著2010年深度學(xué)習(xí)問世,人工智能的發(fā)展推進(jìn)了第三次高潮,而大模型將這次高潮的Transformer算法,雖然依然是深度學(xué)習(xí)的延續(xù),但是它使得深度學(xué)習(xí)模型參數(shù)突破了1經(jīng)網(wǎng)絡(luò)模型,最初用來完成不同語言之間的文分,分別負(fù)責(zé)對源語言文本進(jìn)行編碼和將編碼信息轉(zhuǎn)換為目標(biāo)語言文本。而后基于Encoder和Decoder,大模型的發(fā)展大致走上了兩條路:—條路是舍棄Decoder部分,僅僅使用Encoder作為編碼器的預(yù)訓(xùn)練模型,其最出名的代表就是Bert家族;另—條路,通過舍棄模型訓(xùn)練和NLP領(lǐng)域打開了新的思路,預(yù)訓(xùn)練模型逐漸成為自然語言處理(NLP)領(lǐng)域的主流;同時,網(wǎng)絡(luò)模型參數(shù)量首次超過3億規(guī)模。軟的DeBERTa等等。這些模型開始嘗試“無監(jiān)督預(yù)訓(xùn)練”的方式來更好的利用相較其他數(shù)據(jù)而言更容易獲得的大規(guī)模的自然語言數(shù)據(jù),而“無監(jiān)督”的方式就是MaskedLanguageModel(MLM),通過讓遮蓋句子中的部分單詞,讓模型去學(xué)習(xí)語境去預(yù)測被遮蓋的單詞的能力,填空”。GPT的成功在于擴(kuò)大語言模型的規(guī)??梢燥@著提高零樣本(zero-shot)與小樣本(few-shot)很大的區(qū)別,也是當(dāng)下大規(guī)模語言模型神奇能力的來源。GPT基于給定前面單詞序列預(yù)測下人機(jī)共生——大模型時代的AI十大趨勢觀察GPT的自回歸語言模型的優(yōu)越性在GPT-3之后得以顯現(xiàn),展示了大模型帶來的超越文本生訝于其能夠進(jìn)行連貫、有深度對話的能力,仿佛是與—個真人進(jìn)行交談。更令人驚異的是ChatGPT展現(xiàn)出了推理、思維鏈等體現(xiàn)智能的能力。這—切都源于其大規(guī)模的訓(xùn)練數(shù)據(jù)和復(fù)雜的機(jī)器學(xué)習(xí)策略。ChatGPT大致經(jīng)過三個訓(xùn)練階段:對“海量互聯(lián)網(wǎng)文本”做單字接龍,以擴(kuò)充模型的詞匯量、語言知識、世界的信息與知識。“優(yōu)質(zhì)對話范例”做單字接龍,以規(guī)范回答的對話模式和對話內(nèi)容。使ChatGPT變成“懂規(guī)矩的博學(xué)鸚鵡”;好壞評分來調(diào)節(jié)模型,以引導(dǎo)它生成人類認(rèn)可”。2017年,朱松純教授在《淺談人工智能:現(xiàn)狀、任務(wù)、構(gòu)架與統(tǒng)—》—文中提出并闡述了鸚鵡和烏鴉的能力。過去的深度學(xué)習(xí)只是“鸚鵡學(xué)舌”式的模仿,即鸚鵡是不知道那段話的含義的,它用自己的方式去理解了發(fā)音,然后模仿了出來。機(jī)器學(xué)習(xí),包括深度學(xué)習(xí),遵技術(shù)篇循的范式是“datafitting”,在已有的信息范疇內(nèi)尋找X與Y的關(guān)系,當(dāng)見到—個新的X'時,可以根據(jù)規(guī)律推斷出屬于哪個Y。這種方式依賴于應(yīng)用場景和數(shù)據(jù)集中的樣本特征,如果場景或數(shù)據(jù)集發(fā)生變化,就需要重新訓(xùn)練—遍。因此,這個階段的深度學(xué)習(xí)不具有學(xué)習(xí)的朱松純教授在論文中舉了—個烏鴉的例子。—只烏鴉,在尋找食物時發(fā)現(xiàn)了堅(jiān)果,卻無法,雖然堅(jiān)果被壓碎了,但它到路中間去吃是—件很危險(xiǎn)的事。然后,它進(jìn)—步觀察,發(fā)現(xiàn)在有紅綠路燈的路口,車子和人有時候會停下來。這時,它必須進(jìn)—步領(lǐng)悟到紅綠燈、斑馬線、車停、人停之間的關(guān)系。搞清楚這些后,它把堅(jiān)果拋到斑馬線上,等車子壓過去,然后等到行人燈亮了,它從容不迫地走過去,吃到了地上的果肉。在這個過程中,烏鴉展現(xiàn)出了完全自主的智能:感知、認(rèn)知、推理、學(xué)習(xí)、和執(zhí)T多現(xiàn)實(shí)世界場景中的能力不如人類,但在各種專業(yè)和學(xué)術(shù)基準(zhǔn)上表現(xiàn)出人類水平。這讓人們看到了通用人工智能(AGI)的曙光。AGI是指—種具有所有人類智能能力的機(jī)器,它可以理解、學(xué)習(xí)、適應(yīng)和實(shí)現(xiàn)任何知識工作。GPT-4的出現(xiàn),無疑讓這—愿景更近了—步。在了幾個網(wǎng)絡(luò)圖片為什么搞笑的問題,雖然解釋得比較初級,但它確實(shí)能準(zhǔn)確分析出圖片中的間的邏輯。爾特曼(SamAltman)發(fā)布博客文章,分享OpenAI對通用人工智能(AGI)的當(dāng)前和后續(xù)經(jīng)濟(jì)發(fā)展以及幫助發(fā)現(xiàn)改變可能性極限的新科學(xué)知識,來幫助我們提升人類。他相信,AGI來出現(xiàn)。人機(jī)共生——大模型時代的AI十大趨勢觀察——技術(shù)篇多模態(tài)AI是指能夠處理和理解多種類型信息的人工智能,如文本、圖像、音頻、視頻等。這種AI不僅能夠處理單—數(shù)據(jù)類型的任務(wù),而且可以在不同數(shù)據(jù)類型間建立聯(lián)系和融合,從而實(shí)現(xiàn)—個綜合、解決復(fù)雜問題提供支持。未來在諸多創(chuàng)新領(lǐng)域,多模態(tài)技術(shù)的發(fā)展將帶來創(chuàng)新應(yīng)用的藍(lán)海。多模態(tài)AI是指可以處理、分析和交互多種類型數(shù)據(jù)的人工智能系統(tǒng)。多模態(tài)AI不僅能夠處理單—數(shù)據(jù)類型的任務(wù),而且可以在不同數(shù)全面的理解。多模態(tài)AI能夠?qū)Ω鞣N不同類型的決復(fù)雜問題提供支持。5月9日,Meta宣布開源多模態(tài)大模型ImageBind,—個跨六種模態(tài)(圖像、文本、深度、熱度圖、音頻和IMU數(shù)據(jù))的整體化人工智能模型。展示了未來的人工智能模型如何能夠生成多感官內(nèi)容。通過利用多種類型的圖像配對數(shù)據(jù)來學(xué)習(xí)單個共享表示空間。該研究不需要所有模態(tài)相互同時出現(xiàn)的數(shù)據(jù)集,相反利用到了圖像的綁定屬性,只要將每個模態(tài)的嵌入與圖像嵌入對齊,就會實(shí)現(xiàn)所有模態(tài)的迅速在多模態(tài)技術(shù)發(fā)展初期,不同模態(tài)的AI開始進(jìn)行集成,比如圖像識別和自然語言處理技術(shù)的結(jié)合。除了ImageBind打通六種模態(tài)外,多數(shù)仍在探索文本與圖像的融合,但進(jìn)展飛快。UniDiffuser生圖,還能實(shí)現(xiàn)圖生問、生成等多種功能時生成與圖像相關(guān)的描述性文本,或由文本指隨著多模態(tài)技術(shù)的進(jìn)展,多模態(tài)AI在理解和處理不同類型數(shù)據(jù)時能夠?qū)崿F(xiàn)更高程度的融合。算法和模型可以在不同數(shù)據(jù)類型之間建立聯(lián)系,提取跨模態(tài)的共享信息。這使得AI能夠。多模態(tài)技術(shù)將助力人工智能向AGI發(fā)效的多模態(tài)智能處理機(jī);人類可以自然地處理多種類型的信息,如文本、聲音、圖像、觸覺等。為了讓AGI具備類似的能力,它需要具有高效的多模態(tài)信息處理機(jī)制。這讓AGI能夠在人機(jī)共生——大模型時代的AI十大趨勢觀察不同的任務(wù)和環(huán)境中靈活適應(yīng),從而更好地模擬人類智能。單純從語言文字中學(xué)習(xí)大概率無法獲得完整的世界認(rèn)知,人類擅長根據(jù)當(dāng)前的環(huán)境、情境、目標(biāo)和心理狀態(tài)理解和處理信息。具有類似能力的AGI將能更好地理解現(xiàn)實(shí)環(huán)境中的復(fù)雜信息,并根據(jù)不同的情境調(diào)整其行為和策略。未來真正的AGI很可能會是與人類相仿、高效的多模態(tài)智能處理機(jī),從所有模態(tài)信輯、方法。多模態(tài)應(yīng)用的創(chuàng)新“藍(lán)海”與單純通過自然語言進(jìn)行交互或輸入輸出交互、可“通感”等天然屬性。目前Midjourney在文生圖領(lǐng)域的應(yīng)用模式創(chuàng)新,只是未來多模未來在諸多創(chuàng)新領(lǐng)域,多模態(tài)技術(shù)的發(fā)展將帶提升AI模型性能:多模態(tài)AI在相互補(bǔ)足和輔助各種模態(tài)的數(shù)據(jù)信息的同時,可以提升AI模型的精度和性能。同時,可以借助融合后的數(shù)據(jù)集進(jìn)行自監(jiān)督學(xué)習(xí),使模型在更富有挑更好的泛化能力。?跨多模態(tài)語義的知識檢索與數(shù)據(jù)提??;跨跨領(lǐng)域融合應(yīng)用:多模態(tài)AI可以跨領(lǐng)域整技術(shù)篇?在醫(yī)療診斷中,結(jié)合圖像、患者病史、基因數(shù)據(jù)等多模態(tài)信息,提高診斷準(zhǔn)確性;在商業(yè)領(lǐng)域,通過融合銷售數(shù)據(jù)、客戶反債、市場確的市場預(yù)測。GoogleDeepMindAlphaFold是—個基于深度學(xué)習(xí)的多模態(tài)AI系統(tǒng),結(jié)合生物學(xué)和計(jì)算機(jī)科學(xué),預(yù)測蛋白質(zhì)三維結(jié)構(gòu),重新定義了生物科學(xué)在藥物研發(fā)和疾病研究領(lǐng)域的創(chuàng)新的創(chuàng)作與設(shè)計(jì):多模態(tài)AI可以為創(chuàng)意、如,AI可以通過分析圖片和文本數(shù)據(jù),自動生成新的藝具創(chuàng)意的設(shè)計(jì)方案。?多模態(tài)信息展示(如產(chǎn)品、年報(bào)、課程、演講)的自動生成;多模態(tài)網(wǎng)頁或小程序的自動生成等等?;旌狭硕嗄B(tài)創(chuàng)建能力的下—代用戶原創(chuàng)內(nèi)容(UGC)工具或平臺;支持多模態(tài)數(shù)據(jù)輸入的實(shí)時三維設(shè)計(jì)和協(xié)同工和視提升人機(jī)交互體驗(yàn):多模態(tài)AI結(jié)合了語音、圖像、文本、視頻等多種信息來源,使得人機(jī)交互更加自然、直觀和高效。這有望改善交流方式,例如在對話系統(tǒng)、虛擬助手和機(jī)器人領(lǐng)?多模態(tài)AI可以擴(kuò)展在社交媒體中的實(shí)時語音、文字、圖像和視頻的處理能力,為傳統(tǒng)游戲和增強(qiáng)現(xiàn)實(shí)/虛擬現(xiàn)實(shí)(AR/VR)應(yīng)用帶來人機(jī)共生——大模型時代的AI十大趨勢觀察——從使用鍵盤-鼠標(biāo)等方式跟電腦交互,到使用手指滑動屏幕跟手機(jī)交互,再到人們用喚醒詞跟智能音箱等交互,人機(jī)交互從識別機(jī)器演進(jìn)。生成式AI的發(fā)展,讓人類有史以來第—次有機(jī)會用自然語言的方式,來跟機(jī)器對話,而機(jī)器也借由大模型擁有了極強(qiáng)的理解人類語言的能力,有望帶來—場全新的交互變革。正如歷次交互變革帶來從終端、到連接,到各類應(yīng)用的顛覆式變革,生成式AI也必將帶來產(chǎn)業(yè)鏈、價值鏈和生態(tài)的重塑。 機(jī)器指令識別人類語音、動作理解人類語言式自計(jì)算機(jī)發(fā)明以來,人與機(jī)器交互方式的變革,—直在推動著信息產(chǎn)業(yè)的發(fā)展進(jìn)步。人們用各種輸入和輸出方式,來挖掘電腦的能力,讓機(jī)器為人服務(wù)。而這個過程,也是從機(jī)器語的過程。從最早的圖靈機(jī)打孔帶,到1946年2月在美國賓夕法尼亞大學(xué)誕生的第—臺計(jì)算機(jī)ENIAC,人們開始使用二級制語言來編程;再到后來IBMPC上微軟開發(fā)的DOS系統(tǒng),人們需要用命令行輸入;后來隨著微軟發(fā)明了來重大的變革,讓普通人學(xué)習(xí)和使用電腦的門業(yè)應(yīng)用和個人家用的主要計(jì)算設(shè)備,形成了顛覆式的生產(chǎn)力,人類開始進(jìn)入到計(jì)算機(jī)作為助手的新計(jì)算時代。在這個時代,微軟和英特爾Wintel全球科技界的領(lǐng)軍地位。圍繞微軟,也形成了基隨著喬布斯帶領(lǐng)蘋果在手機(jī)上應(yīng)用了多點(diǎn)觸控技術(shù),這種全新的手勢交互模式,第—次讓人機(jī)交互開始貼近人類的習(xí)慣,讓老人和人機(jī)共生——大模型時代的AI十大趨勢觀察孩子也可以非常輕松地掌握使用方法,從而讓更多人進(jìn)入信息社會,極大地彌合了信息鴻溝。移動互聯(lián)網(wǎng)的發(fā)展,不僅帶來了APPStore的繁榮,也讓每個人的生活和工作迎來了巨大的變革,因?yàn)橐苿拥姆绞?,增加了空間的新維度,讓機(jī)器得以在無時無刻成為人的幫手。由此也型理解能力的大幅提升。大模型可以更好地理解人類表達(dá)的含義,并生成更符合人類價值觀的回答。其技術(shù)成熟度已經(jīng)可以在很多場景下達(dá)到可用,甚至好用的程度。在科技公司不斷投入對齊工作的進(jìn)展中,大模型的“幻覺”被持續(xù)降低,從而讓人類第—次有可能完全以自然語言對話的方式來跟機(jī)器交流。這也是人去,最有效的交互方式。在這個背景下,所有APP都可以用生成式當(dāng)前的所有軟件,在后端不變的情況下,前端的交互可以直接換成自然語言對話的方式,這讓更多的APP擁有了智能對話的能力,給用戶帶來全新的體驗(yàn)。現(xiàn)在已經(jīng)有很多應(yīng)用軟件和硬件,開始往這個方向升級。另—方面,未來更具市場想象力的,是原生的AIAPP,例如未來很可能出現(xiàn)—個萬能的個人助理,他可以回答人的各種問題,幫人出主意,甚至做會議器生成+人腦篩選”在可預(yù)見的將來,會成為——模型即服務(wù)(MaaS)人機(jī)共生——大模型時代的AI十大趨勢觀察垂直行業(yè)領(lǐng)域的小模型應(yīng)用企業(yè)、以及更加貼合個人用戶的模型應(yīng)用和服務(wù)。這—生態(tài)的建立和發(fā)展,將更廣泛地賦能各行業(yè)應(yīng)用,加快大模型促進(jìn)了AI的工業(yè)化,即大模型為正在重構(gòu)現(xiàn)有的商業(yè)模式,未來將形成模型即中下三層架構(gòu)。首先,大模型公司將是AI世界的基礎(chǔ)設(shè)施型公司,大模型為AI技術(shù)基礎(chǔ)設(shè)施。由于預(yù)訓(xùn)練模型的高成本和技術(shù)投入,因此具有較高的進(jìn)入門欖。以2020年推出的GPT-3模型為例,其訓(xùn)練成本可能接近1200萬美元。因此,目前進(jìn)入預(yù)訓(xùn)練模型的主要機(jī)構(gòu)為頭部科技企業(yè)、科研機(jī)構(gòu)等。目前在美國,基礎(chǔ)設(shè)施型公司(處于上游生態(tài)位)有OpenAI、Stability.ai后通過開發(fā)和銷售專業(yè)版和定制版實(shí)現(xiàn)商業(yè)獲利,目前估值已經(jīng)超過10億美金。因?yàn)橛辛嘶A(chǔ)層的技術(shù)支撐,下游行業(yè)才能如雨后春筍般C其次,在大模型上可以快速抽取生成場景化、定制化、個性化的小模型,實(shí)現(xiàn)多場景、多領(lǐng)域的工業(yè)流水線式部署應(yīng)用,同時兼具按需使用、高效經(jīng)濟(jì)的優(yōu)勢。以大模型為基S成為現(xiàn)實(shí),它實(shí)現(xiàn)了AI從“手工作坊”到“工廠模式”的轉(zhuǎn)變。AI大模型具有更強(qiáng)的通用性低成本的模型使用與開發(fā)支持,能夠大規(guī)模地在產(chǎn)業(yè)中落地應(yīng)用,更廣泛地賦能各行業(yè)應(yīng)用,提升。最后,在大模型和垂直領(lǐng)域小模型的基礎(chǔ)上,不僅直接面向個人用戶的AI模型服務(wù)和應(yīng)人近MaaS成為—種新的商業(yè)模式,AI廣泛賦能各行業(yè)應(yīng)用。MaaS為下游應(yīng)用提供安全、高效、低成本的模型使用與開發(fā)支持。下游用戶可以直接在云端調(diào)用、開發(fā)與部署模型,而無需投資構(gòu)建和維護(hù)自己的模型所需的基礎(chǔ)設(shè)未來對于AI企業(yè)而言,MaaS也將成其核心商業(yè)模式。以O(shè)penAI為例,雖然目前已擁司的訂閱制收費(fèi)已經(jīng)開始,OpenAI在2月1經(jīng)成形的基礎(chǔ)AI算法大模型,疊加上專業(yè)領(lǐng)域數(shù)據(jù)的訓(xùn)練流程,訓(xùn)練打磨之后產(chǎn)生該專業(yè)領(lǐng)型技術(shù),在金融、智能客服等領(lǐng)域都已有所應(yīng)用。目前,從提供預(yù)訓(xùn)練模型的基礎(chǔ)設(shè)施層公司到專注打造AIGC產(chǎn)品和應(yīng)用工具的應(yīng)用層公司,美國圍繞AIGC生長出繁榮的生態(tài),技術(shù)創(chuàng)新引發(fā)的應(yīng)用創(chuàng)新浪潮送起;中國也有望騰訊云從產(chǎn)業(yè)客戶需求場景出發(fā),基于大模型高性能計(jì)算集群和大模型能力,依托騰訊 衣、普惠適用”的行業(yè)模型解決方案,全面降低落地門欖,助力客戶構(gòu)建專屬大模型及智能應(yīng)用。基于多年深耕產(chǎn)業(yè)互聯(lián)網(wǎng)經(jīng)驗(yàn)和積累,騰訊云已聯(lián)合行業(yè)頭部企業(yè),為10大行業(yè)輸出了決方案,提供—整套模型服務(wù)工具鏈,幫助企業(yè)高效率、高品質(zhì)、低成本地創(chuàng)建練平臺AI語音助手(車載/家居)型th太極Angel加速組件TIMatrix應(yīng)用平臺……高性能網(wǎng)絡(luò):自研星脈計(jì)算網(wǎng)絡(luò)架構(gòu)人機(jī)共生——大模型時代的AI十大趨勢觀察——隨著生成式人工智能技術(shù)的飛速發(fā)展,它已在多個領(lǐng)域催生出全新的商業(yè)價值。盡管這些模型處于擴(kuò)展的早期階段,但我們已經(jīng)開始看到第—批跨功能的應(yīng)用程序,在金融、零售、政府、制造、物流、地產(chǎn)、教育等多個行業(yè),以及財(cái)務(wù)、HR、客服等應(yīng)用場景展現(xiàn)極為出色的能力。各行各業(yè)都將迅速整合大模型的能力,創(chuàng)造全新的商業(yè)速加速。隨著生成式人工智能技術(shù)的飛速發(fā)展,它已在多個領(lǐng)域催生出全新的商業(yè)價值。這些模型處于擴(kuò)展的早期階段,但我們已經(jīng)開始看到第—批跨功能的應(yīng)用。在全球,已經(jīng)有金融行源行業(yè)諸如C3.ai開始將生成式AI應(yīng)用到內(nèi)容創(chuàng)建、知識發(fā)現(xiàn)、智能客服等場景,引領(lǐng)了行業(yè)企業(yè)也已經(jīng)看到生成式AI、大模型可能為企業(yè)帶來競爭優(yōu)勢,其中金融行業(yè)、文化娛樂行業(yè)等頭部機(jī)構(gòu)會率先在1年內(nèi)在相對成熟的場生成式AI技術(shù)能夠自動創(chuàng)建文本、圖像、設(shè)計(jì)方案等,在生產(chǎn)設(shè)計(jì)、設(shè)計(jì)研究、視覺識別、名稱擬定、副本生成與測試以及實(shí)時個性化等領(lǐng)域中,帶來前所未見的速度和創(chuàng)新。利用GAI,企業(yè)能夠節(jié)省大量人力資源投入,同時提高生產(chǎn)效率和準(zhǔn)確度,減少人工投入和時人工智能模型將成為每位工作者無處不在的得力助手,將新型超個性化智能放在人們手中來提高生產(chǎn)力。和以往的Bot相比,大語言模型更具有人類交互的能力和靈活性。并且充分利用強(qiáng)大的對話式智能機(jī)器人,理解客戶意愿、自行擬定回答,并提高答復(fù)的準(zhǔn)確性和質(zhì)量。其典型領(lǐng)域包括客戶支持、銷售賦能、人力資源、醫(yī)學(xué)和科學(xué)研究、企業(yè)戰(zhàn)略和市場情報(bào)等。這將有助于提高客戶參與度、滿意度和的可持續(xù)營收?;谏赡P偷淖詣釉O(shè)計(jì)和創(chuàng)新潛力,企人機(jī)共生——大模型時代的AI十大趨勢觀察利用生成式AI技術(shù)分析和挖掘海量數(shù)據(jù),為企業(yè)提供更為精準(zhǔn)的商業(yè)指導(dǎo),有助于企業(yè)作出更明智的投資、開發(fā)策略。此外,它還可以預(yù)測潛在風(fēng)險(xiǎn),以幫助企業(yè)及時進(jìn)行規(guī)避與生成式人工智能技術(shù)可通過跨領(lǐng)域數(shù)據(jù)分析和整合,優(yōu)化業(yè)務(wù)流程?;谠O(shè)定任務(wù)自主分析和自動化執(zhí)行,通過分析實(shí)現(xiàn)這個任務(wù)目標(biāo)需要的具體步驟。此外,企業(yè)還能在參考執(zhí)行任務(wù)的過程中自己發(fā)散性地提出問題并思考代碼編寫人員將借助生成式人工智能來大幅提高生產(chǎn)力——通過問題引導(dǎo)來轉(zhuǎn)換成編程語言,掌握各種編程工具和方法,大大提升代碼編程的效率,預(yù)測和預(yù)先防范問題,以及管企業(yè)可以通過API將生成式人工智能技術(shù)直接嵌入其他應(yīng)用中,也可以使用專有數(shù)據(jù)對基于大模型的生成式人工智能將對所有行業(yè)產(chǎn)生重大影響。據(jù)麥肯錫測算,在整個銀行業(yè),如果用例得到充分實(shí)施,該技術(shù)每年可以創(chuàng)造相當(dāng)于2000億至3400億美元的額外價值。在零售和包裝消費(fèi)品中,潛在影響也很大,6600億美元。數(shù)據(jù) 推理加速 訓(xùn)練加速調(diào)隨著企業(yè)深入開展人工智能重塑各種業(yè)務(wù)的探索,他們將明確各種應(yīng)用場景下最為匹配的人工智能類型。雖然人們對基于通用大語言模型的聊天機(jī)器人期待很高,但它不是唯—的大模型服務(wù)方式,也不—定是滿足行業(yè)場景需求的最優(yōu)解。在很多產(chǎn)業(yè)場景中,用戶對企業(yè)提供的專業(yè)服務(wù)要求高、容錯性低,企業(yè)—旦提供了錯誤信息,可能引起巨大的法律責(zé)任或公關(guān)危機(jī)。因此,企業(yè)使用的大模型必須可控、可追溯、可修正,而且必須反復(fù)與充分測試才相對于通用大模型,更專注更專業(yè)的行業(yè)大模型在金融、文旅、傳媒、政務(wù)、教育等多個產(chǎn)業(yè)場景具有廣泛應(yīng)用和商業(yè)創(chuàng)新價值;大為大模型的最佳練兵場??蛻舾枰行袠I(yè)針對性的行業(yè)大模型,再加上企業(yè)自己的數(shù)據(jù)做性高的智能服務(wù)?;诙嗄晟罡a(chǎn)業(yè)互聯(lián)網(wǎng)的經(jīng)驗(yàn),騰訊云TI平臺內(nèi)置了多個高質(zhì)量行業(yè)大模型,涵蓋金融、傳媒、文旅、政務(wù)、教育等多個行業(yè)場景,企業(yè)可以結(jié)合自身場景數(shù)據(jù)按需定制精調(diào),也可以根據(jù)自身需求開展多模型訓(xùn)練任務(wù),大幅門欖。未來,生成式人工智能將在多行業(yè)發(fā)揮伴隨其快速發(fā)展,更應(yīng)關(guān)注數(shù)據(jù)隱私、倫理道德和政策監(jiān)管等問題,平衡創(chuàng)新與風(fēng)險(xiǎn),協(xié)同人機(jī)共生——大模型時代的AI十大趨勢觀察——in時的信息,還能夠執(zhí)行復(fù)雜計(jì)算、協(xié)助用戶進(jìn)行操作等更加廣泛的任務(wù),極大地豐富了大模型功能和應(yīng)用場景。Plugin插件的嵌入使得大變了用戶交互以及程序開發(fā)的方式。未來,隨著插件生態(tài)的繁榮和功中推出Plugins插件系統(tǒng)。插件專門為大語言模型設(shè)計(jì),通過與開發(fā)者定義的API互動,將ChatGPT連接到第三方應(yīng)用程序,使其能夠訪問互聯(lián)網(wǎng)的最新信息,并執(zhí)行包括預(yù)定酒店、任務(wù)。同時還將開放開發(fā)平臺使得第三方可以在BingPlugin插件讓大模型迎來了自己的“App代改變了用戶和開發(fā)者的互動方式、推動了應(yīng)Plugin在“AI+”的時代也將發(fā)揮至關(guān)重要的作用,作為AI時代的客戶和流量入口,推動大模型在更多無法獲取實(shí)時信息—直是大語言模型的“缺陷”之—,例如GPT-4的數(shù)據(jù)只更新到 2021年9月。而Plugin插件可以通過與開發(fā)者定義的API互動,將大模型連接到第三方應(yīng)用程序,增強(qiáng)大模型的能力。Plugin的功能相當(dāng)于教會大語言模型使用工具,因此給大語言模型的可實(shí)現(xiàn)功能注入了更多可能性。不僅能夠使其搜索實(shí)時發(fā)生的事情、獲取最新的信息,還使其能夠執(zhí)行復(fù)雜計(jì)算、代理操作等更加廣泛的任務(wù)。例如,以下任務(wù):.檢索實(shí)時信息?例如,體育比分、股票價人機(jī)共生——大模型時代的AI十大趨勢觀察.檢索知識庫信息:例如,公司文件、個人筆記等;.協(xié)助用戶進(jìn)行操作:例如,預(yù)訂機(jī)票、訂已經(jīng)上線186個插件,涵蓋了在線搜索、文檔職場招聘等各種場景,極大地解放了大語言模Plugin工具的具體實(shí)現(xiàn),是將大語言模型的API規(guī)范以及關(guān)于何時使用API的自然語言描述,在與用戶對話的過程中實(shí)現(xiàn)調(diào)用API來執(zhí)行操作。例如,如果用戶問:"我要怎么做—盤宮保雞丁?",該模型可能會選擇調(diào)用菜譜插生成—個面向用戶的答案,并支持用。部署門欖下,Plugin的調(diào)模型下的Plugin模型中即可選擇插件或進(jìn)插件商店安裝插件。ChatGPT會根據(jù)會話自動調(diào)用插件處理,也可以用戶自行選擇調(diào)用的插件,三個插件。而在Bing中,根據(jù)近期微軟在Build2023發(fā)布的信息,ChatGPT和NewBing正在走向融合。ChatGPT中增加了“使用必應(yīng)進(jìn)行搜索(BrowsingwithBing)”的功能,直接在ChatGPT中內(nèi)置了—個真正的搜索引擎。而Bing搜索中也增加了插件功能,和ChatGPT中的插件保持—致。例如,可以用Zillow插件 (美國線上房地產(chǎn)公司)來搜索附近可售的3套。在開發(fā)者端,以大語言模型作為基礎(chǔ),插件的開發(fā)門欖也被大大降低了。不同于AppStore、Chrome等平臺基于代碼的開發(fā)范式,大模型的Plugin只需要開發(fā)者構(gòu)建好本地API后,通過自然語言對插件的功能和使用場景進(jìn)行描述,即可完成插件的部署,大幅降低插件可以預(yù)見的是,在未來—段時間,大模型的Plugin插件生態(tài)將會進(jìn)入繁榮期,功能也將 (以用戶需求為主導(dǎo)”的交互模式變革雖然市場都將Plugin插件視為大語言模型的“AppStore時刻”,但插件生態(tài)和AppStore或者微信小程序仍有—定差異。相似之處在于,未來會有越來越多的插件嵌入到大模型中,大模型將作為AI時代的客戶和流量入口,不同之處則在于,不同于AppStore或者微信提供平臺,App或者小程序獨(dú)立運(yùn)作的弱件之間的關(guān)聯(lián)關(guān)系更強(qiáng)。App或者小程序有具體的功能,用戶在不同的應(yīng)用中進(jìn)行操作,實(shí)的角色。而大模型則不僅作為平臺,而是通過智能化的交互過程,實(shí)現(xiàn)面向用戶需求的自主正在讓過去以“應(yīng)用為主導(dǎo)”的互聯(lián)網(wǎng)交互?!鞭D(zhuǎn)變。目前,插件的數(shù)量正在快速增加,但插件e上每個App都有詳細(xì)的描述、演示以及用戶評名字、圖標(biāo)以及簡單的—句話描述,有時描述和實(shí)際功能還存在—定差距,造成了不好的交互體驗(yàn)。另外,目前插件大多是和已有的商業(yè)房產(chǎn)信息平臺Zillow等。雖然大模型提供了新人機(jī)共生——大模型時代的AI十大趨勢觀察的流量分發(fā)入口,但這實(shí)際上弱化了用戶與平臺或應(yīng)用的交互功能,只保留了最終的分析結(jié)果。例如,愛彼迎等—些頭部企業(yè)宣布正在關(guān)訂房租房服務(wù),而是—種更完整的體驗(yàn),因此于簡單。以上問題或許會隨著大模型功能的進(jìn)—步豐富而得到解決,游戲、社交等插件的嵌入也可能將給大模型的Plugin帶來更大的想象功功能,如何調(diào)用API以及信息(名字,版本號,功能 ——“注入靈魂”人機(jī)共生——大模型時代的AI十大趨勢觀察生成式人工智能所展現(xiàn)出來的高靈活度以及強(qiáng)交互性讓人們對能夠更充分地挖掘和梳理信息、知識,并更貼近人類日常交流和表達(dá)習(xí)慣地處理語句。數(shù)字人將不再僅僅局限于主播、客服等角色。數(shù)字人將成為個人分身“Avatar”,輸出文字、圖像、音視頻,乃至情感表達(dá)。未來構(gòu)建數(shù)字內(nèi)容的過程中,數(shù)字人將廣泛應(yīng)用于各種場合,提高工作效率并實(shí)現(xiàn)成本降低。在大型模型出現(xiàn)之前,數(shù)字人和機(jī)器人在語言交互能力和智能水平方面相對較弱。傳統(tǒng)方法主要依賴自然語言處理(NLP)技術(shù)進(jìn)行文本驅(qū)動。為實(shí)現(xiàn)數(shù)字人與用戶的交互,開發(fā)者會通過自動語音識別(ASR)、自然語言處理技術(shù)和文本語音合成(TTS)等AI技術(shù)構(gòu)建感知、決策和表達(dá)的閉環(huán)系統(tǒng)。為了實(shí)現(xiàn)這—目標(biāo),開發(fā)者需要預(yù)先設(shè)置包括知識圖譜和問答庫等資源,并將這些內(nèi)容與數(shù)字人的對話系統(tǒng)進(jìn)行對接。然而,在通用場景中,即便如此,NLP技術(shù)的能力仍有待進(jìn)—步提升。而生成式人工決策階段處理并理解文本,以對話能力為核心,為數(shù)配合知識圖譜,應(yīng)用于特定場景,字人的大腦未來通用型模型還需要完善建立輸入文本到輸出音頻與輸出視覺信息的關(guān)聯(lián)映射,主要是對采集到的文本到語音和嘴形視頻(2D)/嘴形動畫(3D)的數(shù)據(jù)進(jìn)得到相關(guān)模型,并智能合成動作是采用隨機(jī)策略或者腳本進(jìn)行預(yù)設(shè),需性的數(shù)據(jù)或者標(biāo)簽隨著寫實(shí)度的提高,微表情更多,超寫實(shí)對精度要求更高,超寫實(shí)還表達(dá)階段將需要輸出的文本合成為語音感知階段將人的語音轉(zhuǎn)換為文本語音理解動作合成方向示意圖方向示意圖圖像情感信息能力……I……生成式人工智能技術(shù)在數(shù)字人應(yīng)用中解決了“只會念稿、不能交互”的匕滄局面。同時,提高了內(nèi)容創(chuàng)作效率、降低創(chuàng)作門欖,并且豐富了內(nèi)容多樣性和個性化,以滿足不同用戶的需求和喜好。通過自然語言處理大型模型的升級,數(shù)字人的交互體驗(yàn)得到顯著提升。生成式人工智能所展現(xiàn)出來的高靈活度以及強(qiáng)交互性讓人們對AI技術(shù)有了全新的認(rèn)知。這種全新的AI技術(shù)讓數(shù)字人更像真實(shí)的人,能夠更充分地挖掘和梳理信息、知識,并更貼近人類日常交處理語句。生成式人工智能與數(shù)字人的結(jié)合將為元宇宙構(gòu)建全新的數(shù)字代理人——“阿凡達(dá)”。隨著計(jì)算能力的提升和生成式人工智能模型的升級,數(shù)字人將不再僅僅局限于主播、客服等角字、圖像、音視頻,乃至情感表達(dá)。未來構(gòu)建數(shù)字內(nèi)容的過程中,數(shù)字人將廣泛應(yīng)用于各種成本降低。IDC預(yù)計(jì),到2026年中國AI數(shù)字人市場規(guī)模將達(dá)到102.4億元人民幣,AI數(shù)字人具備下—代人機(jī)交互入口的潛質(zhì),未來我們面對的或不再是冰冷的屏幕,而是生動活潑的數(shù)字人類,越能夠挖掘最深層次的情感需求,成為我在未來,數(shù)字人將發(fā)揮重要作用,整合社交、創(chuàng)作、分享等功能。通過先進(jìn)的算法,數(shù)字人將展現(xiàn)出多模態(tài)的創(chuàng)新產(chǎn)品和應(yīng)用,覆蓋廣泛的使用場景。例如,數(shù)字人將逐步扮演更多角色,如金融分析師、客戶服務(wù)代表、醫(yī)療助手、心理咨詢師等。同時,數(shù)字人將拓寬人類在數(shù)字世界中的溝通和社交領(lǐng)域,提升人類驗(yàn)。人機(jī)共生——大模型時代的AI十大趨勢觀察——AI大模型將幫助個體基于LLMs服務(wù)或者訓(xùn)練Transformer模型的新應(yīng)用快速進(jìn)化,涌現(xiàn)出許多新型面向個體的生產(chǎn)力應(yīng)用。在創(chuàng)意制作、文本生成、圖像和視頻工具、學(xué)習(xí)工具、閱讀工具、市場分析、編程等各個領(lǐng)域快速融入工作流,從信息處理、個性化學(xué)習(xí)、輔助創(chuàng)作、智能優(yōu)化等方2023年3月16日,微軟發(fā)布基于AI的365Copilot,內(nèi)容涵蓋辦公各個領(lǐng)域,其中,將現(xiàn)有的書面文件轉(zhuǎn)化為帶有演講者筆記和資料來源的演示文稿,或從—個簡單的提示或大長的演示文稿,并使用自然語言命令來調(diào)整布局、重新編排文本和動畫安排。Copilot的問世提升。從GTP-4的發(fā)布到微軟Copilot的正式面世,基于LLMs服務(wù)或者訓(xùn)練Transformer模型的新應(yīng)用快速進(jìn)化,涌現(xiàn)出許多新型面向個體的生產(chǎn)力應(yīng)用。例如Jasper(創(chuàng)意文案)、Synthesia(合成語音與視頻),涉及創(chuàng)意制作、文本生成、圖像和視頻工具、學(xué)習(xí)工具、閱讀、編程等各個領(lǐng)域在大模型的快速發(fā)展下,AI生產(chǎn)力正在充分被激發(fā),為個體效率帶來積極的影響。在以下領(lǐng)域,AGI將快速融入工作流,協(xié)助個體成為超級生產(chǎn)者:人人阻力:工具學(xué)習(xí)成本人機(jī)共生——大模型時代的AI十大趨勢觀察人人阻力:工具學(xué)習(xí)成本人類獨(dú)立創(chuàng)作人類將機(jī)器作為提效工具人機(jī)協(xié)作人++快速的信息處理和分析:通過生成式人工智能的幫助,個體可以更快速地處理大量的信息和數(shù)據(jù),并且可以通過不斷地反債和學(xué)習(xí)來改進(jìn)和加強(qiáng)自己的能力。這可以幫助個體更好地利用時間和精力,以及更準(zhǔn)確地分析和理解思考和判斷能力。自動化和智能化的輔助工具:生成式人工智能可以幫助個體自動化和智能化地完成—些日常任務(wù),如自動化的翻譯、文字編輯、數(shù)據(jù)分析和圖像識別。這可以使個體更快地完成工作的精確度和準(zhǔn)確度。改進(jìn)創(chuàng)造力和創(chuàng)新思維:通過生成式人工智能的創(chuàng)意輸出和指導(dǎo),個體可以更好地理解和掌握不同的創(chuàng)新思維方法和行業(yè)趨勢。以此為基礎(chǔ),個體可以更好地開發(fā)自己的想象和創(chuàng)智能化的建議和反債:生成式可以通過分析個體和團(tuán)隊(duì)的行為和結(jié)果等數(shù)據(jù),提供個性化的建議和反債,幫助個體不斷優(yōu)化自己的工作流程和提高工作效率。這些智能反債也有助于個體進(jìn)行針對性的教育和培訓(xùn),以應(yīng)對行業(yè)我們正在經(jīng)歷—個從“好奇心驅(qū)使我們試用”到逐漸信任AGI,將AI融入工作流的轉(zhuǎn)變。未來生產(chǎn)方式將越來越簡單,主要以來新智能短。在AGI的演進(jìn)下,人機(jī)協(xié)作關(guān)系也將進(jìn)入下—個階段。在大模型的加持下,人工智能正在人工智能研究的早期,許多系統(tǒng)和機(jī)器最多代人工智能則可以不斷學(xué)習(xí)和進(jìn)化,提供更高級的定制化服務(wù),跟隨人類的需求進(jìn)步。人工智能助手將與人類進(jìn)行協(xié)同工作來達(dá)成共同目標(biāo)。在這個階段,人機(jī)協(xié)作模式也將發(fā)生變化:人類將發(fā)揮創(chuàng)造、立意、敘事和決策能力,而AI。需要注意的是,生成式人工智能仍然存在—些限制和局限,個體需要深入思考和理解其。會篇會篇——版權(quán)“思想表達(dá)二分人機(jī)共生——大模型時代的AI十大趨勢觀察從AI生成內(nèi)容本身的藝術(shù)性來看,已經(jīng)足以媳美甚至在—定程度上超過了人類的表達(dá)水平。但值得關(guān)注的是,傳統(tǒng)的版權(quán)制度立足達(dá)二分法”這—基本原則,即“只保護(hù)自然人思想的表達(dá),而不保護(hù)自然人的思想本身”。而在漸行漸近的人工智能時代,版權(quán)制度如若無法對于“最為寶貴的人的創(chuàng)造性思想”,以及“最為普遍的AI模型的獨(dú)創(chuàng)性表達(dá)”加以有效回應(yīng),那么其適用價值將受到極大影響。AI內(nèi)容首次贏得了國際知名攝影比賽;另—個基于以上事例可以看出,從AI生成內(nèi)容本身的藝術(shù)性來看,已經(jīng)足以媳美甚至在—定程度上超過了人類的表達(dá)水平。但值得關(guān)注的是,傳統(tǒng)的版權(quán)制度立足于“思想表達(dá)二分法”這—基本原則,即“只保護(hù)自然人思想的表達(dá),人工智能時代,版權(quán)制度如若無法對于“最為模型的獨(dú)創(chuàng)性表達(dá)”加以有效回應(yīng),那么其適。一、創(chuàng)作邏輯層面:生成式人工智能的興起,改變了版權(quán)領(lǐng)域的底層創(chuàng)作邏輯,點(diǎn)亮了可以—定程度上壟斷獨(dú)創(chuàng)性的思想,但在思想智能所趕超。二、適用主體層面:生成式人工智能技術(shù)的不斷提升,未來社會絕大多數(shù)、有價值且被廣泛利用的信息內(nèi)容可能都將由人工智能所生成。但版權(quán)法長久以來均堅(jiān)持“只保護(hù)自然人創(chuàng)作性貢獻(xiàn),才會被認(rèn)定為作品受版權(quán)保護(hù)。但從目前ChatGPT類產(chǎn)品的內(nèi)容生成機(jī)制來看,因?yàn)殡y以證明存在自然人的創(chuàng)作貢獻(xiàn),所以存范疇的困境。三、保護(hù)客體層面:新—輪生成式人工智能產(chǎn)品的內(nèi)容生成機(jī)制和市場應(yīng)用的邏輯在于,通過對思想層面作品風(fēng)格、感覺或靈感等的學(xué)習(xí),便可以輸出海量的、區(qū)別于原作品的新表達(dá)。依照“思想表達(dá)二分法”的基本原則,這—行為并不會構(gòu)成版權(quán)制度意義上的侵權(quán)行為,會篇但會被認(rèn)為存在對既有作品和版權(quán)權(quán)利的現(xiàn)實(shí)四、授權(quán)許可層面:從版權(quán)法現(xiàn)行規(guī)定和制度定位來看,生成式人工智能模型應(yīng)用對于他人作品訓(xùn)練利用的行為,目前難以歸入既有權(quán)?”,這就直接導(dǎo)致了版權(quán)領(lǐng)域傳統(tǒng)的“授權(quán)難以落地執(zhí)行。五、侵權(quán)判定層面:既有的版權(quán)法遵循“接觸+實(shí)質(zhì)性相似”的侵權(quán)判定規(guī)則。生成式人工智能模型應(yīng)用對于作品訓(xùn)練利用,是—種機(jī)器內(nèi)部的非外顯性作品利用行為。因此,版權(quán)人存在現(xiàn)實(shí)上的發(fā)現(xiàn)侵權(quán)困難,不易舉證模型對自身作品的利用。而在“實(shí)質(zhì)性相似”侵權(quán)比對過程中,基于生成式人工智能的內(nèi)容生成特點(diǎn),版權(quán)人會容易陷入模型輸出內(nèi)容與自身作品“似曾相識”但又“似是而非”的困頓。六、平臺責(zé)任層面:立基于“內(nèi)容傳播環(huán)面對“內(nèi)容生成環(huán)節(jié)”生成式人工智能的模型研發(fā)和商業(yè)應(yīng)用平臺,其適用價值便難以為繼。生成式人工智能技術(shù)的發(fā)展,已經(jīng)將平臺責(zé)任規(guī)則推向了—個新的階段,即從單純關(guān)注“內(nèi)容傳播階段的平臺版權(quán)責(zé)任”向關(guān)注“內(nèi)容生版權(quán)責(zé)任”轉(zhuǎn)變。術(shù)的送代速度驚人,從GPT3.5到GPT4只用了不到4個月,但各類性能都實(shí)現(xiàn)了質(zhì)的提升:OpenAI官方數(shù)據(jù)顯示,在美國律師執(zhí)照??紛W賽排名中,GPT4可達(dá)前1%而GPT3.5則是后31%。由此,出現(xiàn)全面超越期假想而是可預(yù)見的短期必然,并持續(xù)對既有鑒于我國在生成式人工智能技術(shù)研發(fā)和應(yīng)用領(lǐng)域尚處于起步階段,且與域外相比仍存在較為明顯的差距。因此不宜過早提出規(guī)則建議,因?yàn)樯杂胁簧鞅憧赡苁`技術(shù)的進(jìn)步和產(chǎn)業(yè)的發(fā)展。新—輪生成式人工智能方興未艾,制度層面科學(xué)、可行的版權(quán)應(yīng)對路徑,仍有待理論個價值平衡、利益博奕以及最終立法回應(yīng)的長。人機(jī)共生——大模型時代的AI十大趨勢觀察——倫理和安全建設(shè)塑造會篇AIAGI,也帶來更加復(fù)雜難控的風(fēng)險(xiǎn),包括對人類未來生存的潛在風(fēng)險(xiǎn)。AI時代需要成為—個負(fù)責(zé)任創(chuàng)新的時代,而非另—個“快速行動、打破陳規(guī)”的時代。人們需要建立合理審慎的AI倫理和治理框架,塑造負(fù)責(zé)任的AI生態(tài),打造人機(jī)和諧共生的未來。生成式AI領(lǐng)域的創(chuàng)新主體則需要積極探索技術(shù)上和管理上的安全保障措施,為生成式AI的健康發(fā)展和安全可控應(yīng)用構(gòu)筑起防護(hù)欄。隨著生成式語言模型、生成式圖像模型等生成式AI成為人工智能領(lǐng)域的最新發(fā)展方向,并在語言理解和生成等諸多方面展現(xiàn)出更加通用的甚至人類水平的能力,人們正在加快駛向礎(chǔ)模型,作為更加通用的AI技術(shù),也意味著更加復(fù)雜難控的風(fēng)險(xiǎn)。當(dāng)前,生成式AI的發(fā)展應(yīng)用不僅面臨著幻覺/虛構(gòu)問題、AI歧視、算法黑箱、版權(quán)保護(hù)、數(shù)據(jù)隱私、責(zé)任承擔(dān)、虛假信息、技術(shù)濫用、人機(jī)關(guān)系、工作和就業(yè)影響等多方面的法律和社會倫理挑戰(zhàn),而且引發(fā)了全球各界對人工智能未來發(fā)展可能給人類帶來更大安全風(fēng)險(xiǎn)(如生存性風(fēng)險(xiǎn))的擔(dān)憂。在監(jiān)管層面?各國采取不同的監(jiān)管路徑?!N是以英國和美國為代表的輕監(jiān)管思路,強(qiáng)調(diào)基于具體應(yīng)用場景和風(fēng)險(xiǎn)大小的行業(yè)分散監(jiān)管,聚焦于監(jiān)管AI技術(shù)的使用而非AI技術(shù)本身或整個行業(yè),確保監(jiān)管的相稱性和適應(yīng)性。另—種是以歐盟為代表的強(qiáng)監(jiān)管思路,歐盟正工智能應(yīng)用的全面監(jiān)管。在立法過程中,歐盟基礎(chǔ)模型納入監(jiān)管范圍,為基礎(chǔ)模型提供者設(shè)定了多項(xiàng)義務(wù);與此同時,歐盟立法者也積極調(diào)整立法思路,通過豁免、監(jiān)管沙盒等制度安排支持AI技術(shù)創(chuàng)新。就我國而言,近年來,我國積極推進(jìn)互聯(lián)網(wǎng)領(lǐng)域算法監(jiān)管,強(qiáng)調(diào)安全可控、權(quán)益保護(hù)、公平公正、公開透明、濫用防范等多元目的,在算法應(yīng)用分類分級基礎(chǔ)上制定監(jiān)管措施,出臺了《互聯(lián)網(wǎng)信息服務(wù)算法推規(guī)定》等監(jiān)管規(guī)范。相關(guān)監(jiān)管規(guī)范提出了算法備案、安全評估、AI生成/合成內(nèi)容標(biāo)識等制度要求。今年以來,面對ChatGPT類生成式AI技術(shù)的快速發(fā)展創(chuàng)新,2023年4月國家網(wǎng)信辦發(fā)布《生成式人工智能服務(wù)管理辦法(征求意規(guī)范應(yīng)用。在行業(yè)層面?生成式AI領(lǐng)域的創(chuàng)新主體積極探索技術(shù)上和管理上的安全保障措施,為人機(jī)共生——大模型時代的AI十大趨勢觀察生成式AI的健康發(fā)展和安全可控應(yīng)用構(gòu)筑起防護(hù)欄。這些措施包括對數(shù)據(jù)的干預(yù)(例如對預(yù)訓(xùn)練數(shù)據(jù)進(jìn)行選擇和過濾等,以確保數(shù)據(jù)質(zhì)量)、對模型架構(gòu)的干預(yù)、對模型輸出的審查、對用戶使用行為的監(jiān)測、對生成內(nèi)容的事后檢測等等?!愣?,在實(shí)踐中將AI工具和人類審查人員結(jié)合起來應(yīng)對有害內(nèi)容,是非常有效的干預(yù)機(jī)制。具體而言,在預(yù)訓(xùn)練階段,主要是針對數(shù)據(jù),重點(diǎn)是減少訓(xùn)練數(shù)據(jù)中色情性文本數(shù)據(jù)的數(shù)量、消除有偏見的或者不準(zhǔn)確的訓(xùn)練數(shù)據(jù)等。在預(yù)訓(xùn)練之后的階段,主要包括利用“人類反債的強(qiáng)化學(xué)習(xí)”(RLHF)算法改進(jìn)模型的行為、對模型開展廣泛的測試(如對抗測試)和評估、邀請外部專家進(jìn)行紅隊(duì)測試的請求,對敏感請求作出更恰當(dāng)?shù)幕貞?yīng),從而盡可能地減少輸出有害內(nèi)容的可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論