2024大模型十大趨勢手冊走進“機器外腦”時代

上傳人：策*** IP屬地：山西上傳時間：2024-07-11 格式：DOCX 頁數(shù)：99 大?。?0.90MB 積分：19.9 舉報 版權(quán)申訴

已閱讀5頁，還剩94頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

序言序言趨勢1算力底座趨勢1算力底座趨勢6游戲環(huán)境趨勢2推理分析趨勢2推理分析趨勢7移動革命趨勢3創(chuàng)意生成趨勢3創(chuàng)意生成趨勢8具身智能趨勢4情緒感知趨勢4情緒感知趨勢9開源共享趨勢5智能制造趨勢10人機對齊趨勢5智能制造趨勢10人機對齊創(chuàng)新者預(yù)見創(chuàng)新者預(yù)見編委會顧問司曉|騰訊副總裁騰訊研究院院長顧問馬利莊|上海交通大學(xué)特聘教授人工智能研究院副院長吳運聲|騰訊云副總裁騰訊云智能負(fù)責(zé)人優(yōu)圖實驗室負(fù)責(zé)人張立軍|騰訊公司副總裁、騰訊華東總部總經(jīng)理吳永堅|騰訊云副總裁騰訊云智能產(chǎn)研負(fù)責(zé)人騰訊企點研發(fā)負(fù)責(zé)人好好|騰訊云戰(zhàn)略研究院院長主編策劃徐思彥編寫委員汪鋮杰杜曉宇馬曉芳研究團隊袁曉輝李瑞龍陳楚儀曹建峰白惠天劉莫閑陳玉瓏?yán)钣缆稄堉局依罴西朦S小明王川南王亞鑫陳夢凡聯(lián)合出品騰訊研究院上海交通大學(xué)騰訊優(yōu)圖實驗室騰訊云智能騰訊青騰騰訊副總裁騰訊研究院院長繼ChatGPT開啟大語言模型引領(lǐng)的新一輪人工智能革命以來，我們持續(xù)見證了人工智能領(lǐng)域技術(shù)在海量GPU和新一代大模型的加持下，人工智能在三個方向上有了實質(zhì)性的飛躍。第一是推理能地理解氣候變化的影響，從而讓我們能夠更好地適應(yīng)這些變化。隨著更高級的推理智能被開發(fā)出序言序言的質(zhì)量和多樣性達(dá)到了新的高度。它們不僅讓普通人能夠創(chuàng)作出接近專業(yè)水準(zhǔn)的音樂和視頻作檻，使得創(chuàng)意表達(dá)更加通用化?，F(xiàn)在，只要有創(chuàng)意想法，人們就可以利用AI這個強大的“創(chuàng)意外另一個方向?qū)儆趶V義的情感陪伴。Dan模式的全網(wǎng)爆火，不僅展示了AI在情緒理解與表達(dá)上的巨供的心理咨詢服務(wù)，以其24/7的不間斷陪伴，為需要幫助的人們提供了及時的情緒支持和專業(yè)建議。在兒童領(lǐng)域，智能玩具不僅陪伴孩子們成長，更通過情感交互，培養(yǎng)孩子們的情感認(rèn)知和社交技能。隨著情感智能技術(shù)的不斷成熟，數(shù)字生命的議題也日漸升溫。一些創(chuàng)新嘗試正在探索如何利用數(shù)字技術(shù)復(fù)刻已故親人，為生者提供緬懷與思念的渠道。盡管這一領(lǐng)域還面臨著諸多法律和倫理挑戰(zhàn)，但其在情感陪伴方面的應(yīng)用前景無疑為AI賦予了新的溫度和深度。AI不再僅僅是冷冰冰的生產(chǎn)力工具，它正在成為人類情感世界中的一個溫暖伙伴。隨著技術(shù)的不斷發(fā)展和應(yīng)用的不斷拓展，我們有理由相信，AI將在人類的情感生活中扮演越來越重要的角色，為人們帶來更多的陪伴與慰藉。序言序言PRE-PRE-在本報告中，騰訊研究院基于科技行業(yè)發(fā)展和騰訊自身在AI領(lǐng)域的深耕，提出了10個關(guān)鍵性的趨展提供了算力的保障。隨著大模型與人機協(xié)作的深入，個體創(chuàng)作的門檻進一步降低，越來越多的的優(yōu)化將大幅提升提升移動設(shè)備的體驗，開啟全新的人機交互方式。在工業(yè)領(lǐng)域，多模態(tài)通用感知技術(shù)正在提升生產(chǎn)力，而游戲與大模型的共生關(guān)系為Agent訓(xùn)練提供了新的舞臺。開源模型的成熟，為技術(shù)共享與創(chuàng)新提供了強大的生態(tài)支持。最后，人機對齊成為確保大模型安全與治理的PRE-這十大趨勢共同勾勒出一個由大模型驅(qū)動的新未來。在這個未知和無限可能的時代，我們正在目序言序言上海交通大學(xué)特聘教授人工智能研究院副院長人物-行為-場景一體化視覺表達(dá)與理解是未來人工智能的重要研究方向。隨著生成式人工智能以并通過直接的物理交互滿足人類的各種需求。因而，在未來智能體可以承擔(dān)更多的體力勞動和重與理解是具身智能、智能生成等人工智能的核心基礎(chǔ)，是鏈接物理世界的關(guān)鍵，一系列頂尖高校斯坦福大學(xué)李飛飛教授創(chuàng)建的公司就利用類似人類的視覺數(shù)據(jù)處理方式，使人工智能能夠進行高級推理。她曾在溫哥華TED演講中表示，其研究涉及一種可以合理地推斷出圖像和文字在三維環(huán)境中樣子的算法，并根據(jù)這些預(yù)測采取行動，這種算法概念叫做“空間智能”。為了解釋這一概性循環(huán)?！彼€補充說，她所在的斯坦福大學(xué)實驗室正在嘗試教計算機“如何在三維世界中行英偉達(dá)CEO黃仁勛此前在多個場合強調(diào)了一體化視覺表達(dá)的重要性，并預(yù)測人形機器人將成為未序言序言當(dāng)前對人物理解的研究依舊是機器視覺的核心，但需要從單純的人臉識別、動作識別等人物視覺技術(shù)逐漸轉(zhuǎn)換為與場景交互的一體化表達(dá)范式。PRE-例如，高速動態(tài)場景中自動駕駛系統(tǒng)無法理解周圍環(huán)境中人和物的多變行為意圖，容易引發(fā)嚴(yán)重的交通安全事故;服務(wù)機器人無法預(yù)測兒童的意圖，也成為家庭的安全隱患。其核心問題是人物行為具有多樣性和歧義性，同樣的行為在不同的場景下具有不同的含義，行為意圖的歧義性必須通而這就需要對多模態(tài)的數(shù)據(jù)進行聯(lián)合分析。圖靈獎得主Hinton教授在5月訪談中就表示多模態(tài)學(xué)習(xí)可以使模型更好地理解空間事物，因為僅隨著di?usion、視頻生成大模型的不斷發(fā)展，真實物理世界的規(guī)則先驗將成為未來視覺、人工智能研究重點。相較于ChatGPT、圖文大模型等生成式人工智能在低維空間探生成式人工智能開始初步在三維空間模仿真實世界，并以人更容易接受的視頻形式加以展示，這樣高精度仿真世界投影的出現(xiàn)，也展示出了算力以及算法的進步。Sora生成的視頻令人驚訝更多業(yè)內(nèi)專家發(fā)聲強調(diào)，Sora在二維視覺信息的傳播與時空維度的表現(xiàn)力上雖然獨樹一幟，但并未達(dá)到對真實世界的全貌進行全面刻畫和模擬的高度，尚未形成嚴(yán)格意義上的世界模型。但瑕不掩瑜，能夠生成看起來像是在三維環(huán)境中自然移動和互動的視頻，已經(jīng)可以看作是人工智能“虛擬序言序言PRE-在AIGC發(fā)展的時間線上，總體是從單模態(tài)到多模態(tài)，從小模型到大模型這樣的越來越復(fù)雜化和智能式的選擇，然后不斷的加以擴展。這個生成和擴展是需要大規(guī)模數(shù)據(jù)或知識的積累，就像一個人，行萬里路以后具備了豐富經(jīng)驗，腦子里有很多經(jīng)驗與知識。但最后還有一步，還是要有一些專家或公認(rèn)的權(quán)威人士對它做強化訓(xùn)練，通過強化學(xué)習(xí)等生成合理可用的AI模型。最后一步非常重要，如果純是PRE-為適應(yīng)數(shù)智時代數(shù)字內(nèi)容智能化生產(chǎn)趨勢，2024年4月17人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力量。其中，具身智能是場景理解感知、邏輯思能夠以十分之一的成本實現(xiàn)千百倍內(nèi)容生產(chǎn)速度的AIGC(生成式人工智能)，正內(nèi)容的創(chuàng)意性生成，AIGC可以說將成為了未來互聯(lián)網(wǎng)的內(nèi)容生成基礎(chǔ)設(shè)施，內(nèi)容生產(chǎn)需求邁入強需具身智能、智能生成等人工智能技術(shù)的發(fā)展既需要一套人物-行為-場景一體化表達(dá)范式，同時也需求大規(guī)模數(shù)據(jù)或知識的積累以及專業(yè)的強化訓(xùn)練。大規(guī)模數(shù)據(jù)或知識的積累這就隱藏著數(shù)據(jù)以及訓(xùn)練量的規(guī)模法則，微軟全球前副總裁姜大昕就認(rèn)為在肉眼可見的未來，至少還有十萬億和百萬億量級。通過大規(guī)模數(shù)據(jù)以及訓(xùn)練集成了一體化表達(dá)范式的人工智能通用模型也可以在AIGC大模型、具身智能等應(yīng)用中大放異彩，從而讓機器能夠更多地承擔(dān)冗余重復(fù)的工作，釋放更多的時間讓夠更加享受創(chuàng)造性的工作以及高品質(zhì)的生活。序言序言吳運聲騰訊云副總裁騰訊云智能負(fù)責(zé)人騰訊優(yōu)圖實驗室負(fù)責(zé)人作為千行百業(yè)的親密合作伙伴，騰訊云有幸近距離見證了實體產(chǎn)業(yè)數(shù)字化、智能化轉(zhuǎn)型道路上的點點滴滴，與每個客戶一道深刻體會行業(yè)的滄桑巨變，體會數(shù)字經(jīng)濟時代對業(yè)務(wù)上、組織上和思維上的莫大影響。度的行業(yè)數(shù)據(jù)，加強模型對行業(yè)專業(yè)知識的理解；結(jié)合搜索增強與實時查詢能力，提升模型解決序言序言我們也看到，還有很多企業(yè)非常期待將大模型能力快速應(yīng)用于生產(chǎn)、銷售和服務(wù)。這需要模塊化申請專利超過10000項，居全球互聯(lián)網(wǎng)行業(yè)榜首。騰訊優(yōu)圖實驗室擁有1600多項《2024AI大模型十大趨勢?走進“機器外腦”時代的算法和強大的計算能力，挖掘出數(shù)據(jù)背后隱藏的模式和規(guī)律。這種融合不僅極大地豐富了模型其價值更是不可估量。比如在醫(yī)療領(lǐng)域，能夠輔助醫(yī)生進行更精準(zhǔn)的診斷；在工業(yè)生產(chǎn)中，提升生產(chǎn)效率和質(zhì)量；在文化創(chuàng)作領(lǐng)域，激發(fā)無限的創(chuàng)意靈感。多模態(tài)大模型正在成為推動社會進步這份報告，既凝聚了騰訊云與各方在AI模型方面的洞察與互動，也引發(fā)了更多全新的討論和大膽讀者給予我們寶貴的反饋意見，期望后續(xù)與更多同行者一道推進科技賦能與產(chǎn)業(yè)創(chuàng)新，共創(chuàng)、共序言序言PRE-發(fā)展，增長趨勢將從大模型專業(yè)領(lǐng)域延伸至各行業(yè)領(lǐng)將發(fā)展需求將逐步覆蓋其他層級。而隨著算力基礎(chǔ)設(shè)施建大規(guī)模加速卡集群容量、和更高算力利用率及計算能效之人工智能基礎(chǔ)設(shè)施供需兩旺，增長趨勢向行業(yè)企業(yè)延伸年提出的模型需要600萬倍的計算能力。預(yù)布將資本支出大幅提高到350-400億美元；OpenAI和微軟百億美元增加其在全球各地的超大規(guī)模云計算和AI基礎(chǔ)設(shè)場規(guī)模在整體人工智能服務(wù)器市場的占比將從2023年的Infra的建設(shè)最積極。全球各大科技巨頭對AI基礎(chǔ)設(shè)施的關(guān)產(chǎn)業(yè)鏈帶來巨大的發(fā)展機遇。人工智能基礎(chǔ)設(shè)施是現(xiàn)階段企業(yè)發(fā)展人工智能時最需要幫基礎(chǔ)設(shè)施戰(zhàn)略，其中最積極主動的行業(yè)包括：制造集群規(guī)模將從萬卡邁向十萬卡群規(guī)模也就越大，這樣才能在合理的時間內(nèi)完成大模型的國內(nèi)頭部科技企業(yè)也陸續(xù)實現(xiàn)萬卡集群來訓(xùn)萬卡集群的實現(xiàn)和運行，是各層級軟硬件緊密耦合和速卡在硬件層面進行單純的連接和堆砌，還要能夠基于計算任務(wù)進行統(tǒng)一調(diào)度和管理，以實現(xiàn)大模型訓(xùn)練和推理的練并非易事，總體看技術(shù)上會面臨硬件和軟件兩個層面的首先，構(gòu)建萬卡級別的超大規(guī)模集群本身就是一項極議、線纜布線等都提出了苛刻的要求。同時,高密度部署還面臨著散熱和供電的巨大壓力?，F(xiàn)有的計算機網(wǎng)絡(luò)和數(shù)據(jù)中心技術(shù)需要全面升級,才能滿足萬卡集群的苛刻要求。其次,在軟件層面,實現(xiàn)高效的分布式并行訓(xùn)練也面臨重重挑戰(zhàn)。傳統(tǒng)的數(shù)據(jù)并行和模型并行范式在萬卡尺度下將遇到通信瓶頸和負(fù)載不均衡等問題。需要全新的混合并行范式和任務(wù)調(diào)度機制,在最小化通信開銷的同時實現(xiàn)高效的并行計算。分布式訓(xùn)練框架還需要內(nèi)置故障檢測和恢復(fù)機制,確保系統(tǒng)能容忍局部節(jié)點的失效。此外,高效的分布式優(yōu)化算法,自動混合精度訓(xùn)練,以及針對大規(guī)模異構(gòu)集群的資源管理和任務(wù)編排技術(shù),都亟待突破。集群算力調(diào)度的一部分。如何將異構(gòu)加速卡進行統(tǒng)一虛擬化、調(diào)度管理、并執(zhí)行模型訓(xùn)練更是需要持續(xù)面對的技術(shù)還要考慮不同并行計算、分布式訓(xùn)練等軟件系統(tǒng)的相互兼容和融合，以及軟硬件集成運行時的穩(wěn)定性和可擴展性等提供多樣化算力選擇。和分布式將成破局三板斧提升大規(guī)模分布式訓(xùn)練的計算效率一直是該領(lǐng)域核心可實現(xiàn)更高的算力利用率，節(jié)省訓(xùn)練算力成本。騰訊自研深入的分析、創(chuàng)造性的解決方案和復(fù)雜的決策支持。這種推理能力的躍遷得益于LLM推理分析推理分析思維鏈的生成與以往的人工智能相比，大語言模型的顯著特征是推復(fù)雜問題的理解、對信息的整合以及在給定上下文中生成如同人類學(xué)習(xí)語言一樣，AI大模型通過大量數(shù)據(jù)的學(xué)未見過的數(shù)據(jù)。模型利用先前學(xué)到的規(guī)律進行預(yù)測、分類或生成新內(nèi)容，使得AI在實際應(yīng)用中能夠做出有意義的決文本中的長距離依賴關(guān)系，并通過注意力機制聚焦于輸入ing等策略，LLM能夠生成連貫且邏輯性強的文本，展現(xiàn)出在復(fù)雜問題上的推理能力。更高的算力與更好的模型的加持下，機器不再僅僅是精準(zhǔn)和深入的服務(wù)。過去幾十年我們一直在追求更快的計算機，但現(xiàn)在和未來，我們將追求更強大的大腦。Andrej推理分析SaaS服務(wù)通常按每個賬戶定價，本質(zhì)上是以員工成本為基掘以前受到軟件的市場推廣和定價限制而無法涉足的領(lǐng)與傳統(tǒng)的本地部署相比，智力即服務(wù)模式允許用戶根據(jù)實際需求快速調(diào)整資源，無需大量前期投資即可獲得專務(wù)的先進性和可靠性。業(yè)的企業(yè)都能獲得符合自身特定需求的智能解決方案。這正在成為推動各行各業(yè)數(shù)字化轉(zhuǎn)型的重要力量。機器外腦助力個體成為“超級生產(chǎn)者”展能力邊界，在生活和工作場景中成為一名擅長“人機協(xié)創(chuàng)作領(lǐng)域的應(yīng)用潛力將持續(xù)賦能個體進行更高效、更具創(chuàng)工經(jīng)濟的主力。隨著技術(shù)的不斷進步，LLM的推理能力將變得更加強大和精細(xì)。我們可以預(yù)見，未來，iQaaS使人類的推理和企業(yè)帶來更多的發(fā)展機遇和創(chuàng)新可能。推理分析創(chuàng)建了自我表達(dá)和創(chuàng)意釋放的新社區(qū)。大模型的崛起并非僅僅是人工智能對人類能力趨勢3創(chuàng)意生成趨勢3創(chuàng)意生成然后提出創(chuàng)新的組合,為創(chuàng)作者提供靈感和創(chuàng)意靈感。（4）音樂生成模型拓展個體創(chuàng)作能力，降低專業(yè)創(chuàng)作能融合的生活態(tài)度和職業(yè)選擇，而大模型會進一步推動藝模型技術(shù)所帶來的低成本創(chuàng)作工具，激發(fā)創(chuàng)造力和拓展創(chuàng)個體能力的延展和社會文化的演進。背景的個人也可以將自己的靈感或音樂動機轉(zhuǎn)化為prompt的創(chuàng)作路徑的生態(tài)圈。趨勢3趨勢3創(chuàng)意生成多模態(tài)AI改變視頻內(nèi)容生產(chǎn)模式以Sora為代表的多模態(tài)大模型的推出，標(biāo)志著視頻生圖像添加動畫以及在時間軸上延伸視頻等多樣化編輯任進展，類似技術(shù)和產(chǎn)品層出不窮。近期生數(shù)科技和快手可發(fā)布日期2023.112023.112023.112023.112023.122024.22024.4.222024.4.272024.6.62024.6.6公司RunwayPikaLabsStablilityAIMeta斯坦福+谷歌OpenAI抖音生數(shù)科技快手極佳科技產(chǎn)品Gen-2Pika1.0StableVideoDiffusionEmuVideW.A.L.T.Sora即夢DreaminaVidu可靈Kling視界一粟YiSu時長4s3-7s2-4s4s3s60s3s120s特點可延長至18s運動筆刷開源擴散模型Transformer物理規(guī)律易申請，免費U-ViT首個DiT架構(gòu)申請可用可端側(cè)運行是否已可用是是是否否否是否是否生圖大模型支持中英文雙語輸入及理解，擁有高達(dá)15億的混元文生圖大模型采用了與Sora模型一致的Di頻等多模態(tài)視覺內(nèi)容的生成奠定了基礎(chǔ)。在性能上，采用Hunyuan-DiT架構(gòu)的騰訊混元文生圖大模型超越了開源的構(gòu)建以中文為核心的文生圖開源生態(tài)系統(tǒng)提供了強有力的動中文文生圖和視頻生成技術(shù)的研發(fā)和應(yīng)用。多模態(tài)AIGC技術(shù)將從以下方向影響視頻內(nèi)容生產(chǎn)模根據(jù)文本提示生成長達(dá)一分鐘的視頻，這在傳統(tǒng)制作流程中可能需要數(shù)天甚至數(shù)周的時間來完成。趨勢3趨勢3創(chuàng)意生成多模態(tài)AIGC技術(shù)改變了視頻內(nèi)容生產(chǎn)模式，使創(chuàng)作者不再受限于傳統(tǒng)影視制作中對高度專助生成技術(shù)，創(chuàng)作團隊能夠更加專注于創(chuàng)意和情感的表達(dá)，以及故事的敘述，甚至創(chuàng)造出前所未展望未來，大模型不僅提升了現(xiàn)有行業(yè)的效率和產(chǎn)出質(zhì)量，還極大程度降低藝術(shù)創(chuàng)作的門基于大模型的軟件和平臺不僅僅是技術(shù)的應(yīng)用，也是個體追求個性化表達(dá)和自我價值實現(xiàn)的新場趨勢3趨勢3創(chuàng)意生成兼具EQ與IQ的大模型將在未來2-3年內(nèi)打開人機陪伴市場?；谧钚碌腁I模型如GPT-4o和趨勢4情緒智能趨勢4情緒智能高于其他AI應(yīng)用。例如Character.ai目前月訪問量超2別。譬如是否需要一個具體的形象、是否需要配合硬件使價值的同時滿足心理輔導(dǎo)、1對1教育等實際性功能……不論聚焦于哪個垂類，面向未來的人機陪伴產(chǎn)品有如下共性特趨勢4趨勢4念?不同的人對情感和社交動態(tài)的理解有所不同。精調(diào)和情感，根據(jù)對話場景實時調(diào)整互動方式，并通過個性化的語音、圖片等等把對于用戶的理解嵌入進產(chǎn)品體驗中。未來來更全面地理解人類的情感狀態(tài)。再結(jié)合可穿戴設(shè)備所采集甚至是先己一步，以最適合用戶的方式提供情感慰藉與支就要設(shè)定情景讓AI與用戶創(chuàng)造一些獨特的共同經(jīng)歷?例神秘感需要用戶不斷挖掘的角色……形態(tài)上也可能是文本、用生成對抗網(wǎng)絡(luò)（GANs）生成高質(zhì)量的創(chuàng)意內(nèi)容（例如情緒智能過流式語音識別技術(shù)消除了語言障礙，促進了跨文化交流，機交互就無法連續(xù)進行，個性化服務(wù)的精準(zhǔn)性也會大打折中涉及兩個環(huán)節(jié)：一是記憶系統(tǒng)的建立，另一個是“回憶策因為過去的普遍做法是各類信息/實體先轉(zhuǎn)換為文字再映射GPT-4o等模型的出現(xiàn)，記憶系統(tǒng)建立方式發(fā)生了系統(tǒng)性變用，并形成某種啟發(fā)或者共鳴?這是目前大模型正在攻關(guān)未來3-5年，情感陪伴類AI產(chǎn)品能否在打開市場之后持不僅提高了用戶體驗，還增強了用戶對AI的依賴和情感連機陪伴的公平性和安全性。如果上述問題能夠得到妥善解趨勢4趨勢4情緒智能智能制造：多模態(tài)大模型技術(shù)2024年被普遍認(rèn)為是大模型應(yīng)用落地的元年，而工業(yè)場景將會是大模型的重要戰(zhàn)場。工業(yè)生與產(chǎn)業(yè)深入融合以及多模態(tài)的混合交互模式的出現(xiàn)，有望重構(gòu)智能制造系統(tǒng)并推動工業(yè)智能化對復(fù)雜多模態(tài)Prompt的理解能力等。未來借助PEFT等技術(shù)的發(fā)展，大模型+小樣本數(shù)據(jù)適趨勢5智能制造趨勢5智能制造需要收集百張以上的產(chǎn)品圖，然后對該場景進行精細(xì)化調(diào)交付過程中依賴較長周期的數(shù)據(jù)采集及較復(fù)雜的個性化定場景適配和多種部署形式，最終實現(xiàn)工業(yè)大模型的落地賦力和遷移學(xué)習(xí)能力可以對不同生產(chǎn)場景中的產(chǎn)品質(zhì)量缺陷，業(yè)制造累積了大量的數(shù)據(jù)，為大模型提供了良好的基礎(chǔ)條升生產(chǎn)效率，智能化感知和交互也將重構(gòu)整個制造管理體趨勢5趨勢5智能制造技術(shù)加快向工業(yè)領(lǐng)域的遷移，多模態(tài)大模型的能力升級，更好滿足個性化需求目前國內(nèi)外推出的主流多模態(tài)模型乃是基于自然場景來需要在垂直場景實現(xiàn)超微小目標(biāo)感知及超細(xì)粒度語義理場景數(shù)據(jù)有限，未來需強化對復(fù)雜多模態(tài)Prompt的理解并工業(yè)多模態(tài)大模型對超微小目標(biāo)的感知和超細(xì)粒度語然場景下的圖像-文本數(shù)據(jù)集，目前自然場景的多模態(tài)大模片分辨率在百萬像素以下，其對圖片中主要物體、如大于率圖像一同輸入到大語言模型以提升模型對圖像局部的感圖像-文本數(shù)據(jù)集的增加，未來多模態(tài)大模型對超小目標(biāo)的未來將增強模型對復(fù)雜多模態(tài)Prompt的理解能力?，F(xiàn)有的自然場景多模態(tài)大模型的Prompt指令數(shù)據(jù)集主要包含少量的人工標(biāo)注圖像-文本數(shù)據(jù)以及借助GPT-4V或Gemini-Pro等多模態(tài)大模型來合成的大量圖像-文本數(shù)據(jù)，通過大量自然場景的多模態(tài)指令數(shù)據(jù)集進行指令微調(diào)能夠?qū)崿F(xiàn)較強的多模態(tài)Prompt理解能力。盡管在工業(yè)場景下能夠獲取到少量人工標(biāo)注的圖像-文本數(shù)據(jù)，但是現(xiàn)有的據(jù)積累下，有望將結(jié)合工業(yè)多模態(tài)大模型能力進行Prompt生成并針對性的進行技術(shù)改進，進而提升對復(fù)雜多模態(tài)型在雖然有較強的理解能力，但由于缺少具體的場景數(shù)據(jù)，無法滿足工業(yè)現(xiàn)場的個性化要求。大模型真正融入行業(yè)應(yīng)的協(xié)同性和智能化并驅(qū)動實現(xiàn)具身智能；“大模型+工業(yè)軟趨勢5趨勢5智能制造游戲環(huán)境：大模型與游戲共振趨勢6游戲環(huán)境趨勢6游戲環(huán)境技術(shù)試驗場：基于游戲環(huán)境的通用AIAgent并且在多個游戲環(huán)境中都表現(xiàn)出了高于同類智能體的性能水操作數(shù)據(jù)，用以訓(xùn)練智能體。從圍棋人工智能AlphaGO和趨勢6趨勢6游戲環(huán)境Gato使用了類GPT的大語言模型架構(gòu)，其訓(xùn)練材料包Games并可操控真實的機器人手臂堆疊積木。微軟在任務(wù)，不僅能夠完成簡單的程序化任務(wù)(programmatictasks)，還可以根據(jù)簡單描述完成創(chuàng)造任務(wù)（creativetasks例如根據(jù)描述建造一個圖書館等。的下一個前沿將是塑造一個可以在虛擬世界和現(xiàn)實世界里業(yè)的內(nèi)容創(chuàng)作，越來越多的從業(yè)者能夠以更低成本生成圖偉達(dá)于2023年6月發(fā)布了面向游戲開發(fā)者的AI工具平臺引擎公司Unity和Unreal相繼發(fā)布基于生成式AI的新趨勢6趨勢6游戲環(huán)境盡管當(dāng)下的人工智能研究距離實現(xiàn)AGI還有相當(dāng)長的路要走，但大語言模型與基于游戲環(huán)境的AI在未來人工智能技術(shù)的創(chuàng)新發(fā)展過程中，應(yīng)進一步重視游戲產(chǎn)業(yè)的科技價值，明確游戲作為人工智能技術(shù)趨勢6趨勢6游戲環(huán)境端側(cè)生態(tài)已成為科技大廠競爭的焦點，端側(cè)大模型結(jié)合AI芯片和操作系統(tǒng)，正在構(gòu)建承擔(dān)主要的計算和存儲任務(wù)，而端側(cè)模型則專注于滿足用戶的隱私保護和數(shù)據(jù)安全需移動革新移動革新邁進。從最關(guān)鍵的基礎(chǔ)模型迭代方向來看，也從此前追求的多模態(tài)小參數(shù)模型轉(zhuǎn)變，比如最新的微軟加載GPT-4o，端+云結(jié)合的混合模型將是長期存在的主流例，作為目前未過分量化穩(wěn)定可用的版本，其模型大小為終或?qū)⑿枰^續(xù)優(yōu)化芯片效率與能耗的方式來實現(xiàn)曲線救領(lǐng)先于原生智能終端，終端交互體驗提前變革各大基礎(chǔ)模型廠商有效的進行價值兌現(xiàn)重要入口的這一趨移動革新應(yīng)用入口變化可能性低中高高●長視頻平臺●020交易平臺●分發(fā)平臺[應(yīng)用分發(fā)等]●地圖●電商平臺●工具:理財、天氣等APP中交互目標(biāo)是物理實體●社交平臺●內(nèi)容社區(qū)資訊類應(yīng)用入口變化可能性低中高高●長視頻平臺●020交易平臺●分發(fā)平臺[應(yīng)用分發(fā)等]●地圖●電商平臺●工具:理財、天氣等APP中交互目標(biāo)是物理實體●社交平臺●內(nèi)容社區(qū)資訊類APP【新聞等]低●游戲●流量APP【短視頻等】影視內(nèi)容的分發(fā)平臺影視內(nèi)容的分發(fā)平臺從后臺運行的角度，APP本身也需要做出顛覆式的改移動革新趨勢8具身智能人型機器人作為人工智能的終極載體之一，憑借其類人形態(tài)和全身自由度，能夠適應(yīng)趨勢8具身智能人型機器人作為人工智能的終極載體之一，憑借其類人形態(tài)和全身自由度，能夠適應(yīng)未經(jīng)特別改造的人類環(huán)境，從而在各種生產(chǎn)和生活場景中發(fā)揮作用。人形機器人的發(fā)展依靠兩大技術(shù)支柱：運動控制與任務(wù)訓(xùn)練。機器人本體運動控制即從傳統(tǒng)的液壓系統(tǒng)向更高效、更精確的電機驅(qū)動系統(tǒng)的轉(zhuǎn)變，使得機器人的物理動作更加細(xì)膩和人性型的利用極大提高了機器人的學(xué)習(xí)效率和執(zhí)行復(fù)雜任務(wù)的能力。這兩種技術(shù)的融合不電機技術(shù)革新助力人形機器人實現(xiàn)高效精確的運動控制。人形機器人的組成復(fù)雜且精密，涵蓋了模擬人類的腿、還能執(zhí)行如抓取等精細(xì)動作。特斯拉的Optimus和Boston在電動汽車領(lǐng)域積累的電機控制技術(shù)轉(zhuǎn)化應(yīng)用到機器人技趨勢8趨勢8具身智能任務(wù)訓(xùn)練與大模型的結(jié)合任務(wù)訓(xùn)練成為了人形機器人領(lǐng)域技術(shù)進步的另一個關(guān)新嘗試展示了如何通過大模型技術(shù)來提高機器人的學(xué)習(xí)效率和執(zhí)行任務(wù)的能力。這些大模型通過處理龐大的數(shù)據(jù)集，系統(tǒng)架構(gòu)的選擇是決定人形機器人與大模型結(jié)合的開種架構(gòu)嘗試通過直接學(xué)習(xí)輸入到輸出的映射來簡化系統(tǒng)的選擇分層架構(gòu)還是端到端架構(gòu)，取決于特定的應(yīng)用需趨勢8趨勢8具身智能人形機器人與大模型機器學(xué)習(xí)的融合將引領(lǐng)技術(shù)革命，加速產(chǎn)業(yè)廣泛落地已經(jīng)證明了其在處理復(fù)雜數(shù)據(jù)和學(xué)習(xí)復(fù)雜模式上的強大能將對勞動市場產(chǎn)生深遠(yuǎn)影響，其可以替代或協(xié)助人類工作，不僅是技術(shù)競賽，也反映了各國對未來社會形態(tài)?人機共趨勢8趨勢8具身智能趨勢9趨勢9繁榮發(fā)展，隨著開源大模型數(shù)據(jù)質(zhì)量與多樣性提升，大模型將實現(xiàn)規(guī)?？s減和質(zhì)量提共享資源，

人人文庫> 全部分類> 應(yīng)用文書 > 研究報告

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

2024大模型十大趨勢手冊走進“機器外腦”時代

文檔簡介

溫馨提示

最新文檔

評論

2024大模型十大趨勢手冊 走進“機器外腦”時代

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔

2024大模型十大趨勢手冊走進“機器外腦”時代