【大數(shù)據(jù)百家講壇】2025年DeepSeek、Manus與AI+Agent行業(yè)現(xiàn)狀報告_第1頁
【大數(shù)據(jù)百家講壇】2025年DeepSeek、Manus與AI+Agent行業(yè)現(xiàn)狀報告_第2頁
【大數(shù)據(jù)百家講壇】2025年DeepSeek、Manus與AI+Agent行業(yè)現(xiàn)狀報告_第3頁
【大數(shù)據(jù)百家講壇】2025年DeepSeek、Manus與AI+Agent行業(yè)現(xiàn)狀報告_第4頁
【大數(shù)據(jù)百家講壇】2025年DeepSeek、Manus與AI+Agent行業(yè)現(xiàn)狀報告_第5頁
已閱讀5頁,還剩95頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

=<>大數(shù)據(jù)百家講壇第135期2025.03.29王吉偉,《一本書讀懂AIAgent:技術(shù)、應(yīng)用與商業(yè)》作者,AIGC&超自動化分析師,知名科技博客王吉偉頻道創(chuàng)始人。多年來持續(xù)關(guān)注互聯(lián)網(wǎng)+、IoT、產(chǎn)業(yè)互聯(lián)網(wǎng)、產(chǎn)業(yè)升級及數(shù)字化轉(zhuǎn)型,專注業(yè)務(wù)流程、人工智能、超自動化與RPA,致力于探索IOT時代產(chǎn)業(yè)升級新機(jī)會,為企業(yè)經(jīng)營和創(chuàng)業(yè)創(chuàng)新提供前沿技術(shù)、商業(yè)模式及方法論的解讀與分享。目前重點(diǎn)觀察與研究AIGC、AIAgent及超自動化在各行業(yè)的落地應(yīng)用與創(chuàng)業(yè)創(chuàng)新。已撰寫各類文章上千篇,作品見諸內(nèi)容平臺、學(xué)術(shù)網(wǎng)站及雜志。AIAgentDeepSeekAIAgent行AIAgent如AIAgent的AIAgent的=<>Agent2023年3月AutoGPT橫空出世,7月OpenAI的翁麗蓮發(fā)表名紹基于LLM的AIAgent,給出了AIAgent的理想技術(shù)架構(gòu)。關(guān)于AIAgent(智能體)的概念很多,很多組織都給出了定義基于大語言模型的AIAgent推薦類Agent對話型Agent推薦類Agent對話型Agent…………2023年3月AutoGPT橫空出世,7月OpenAI的翁麗蓮發(fā)表名2023年3月AutoGPT橫空出世,7月OpenAI的翁麗蓮發(fā)表名紹基于LLM的AIAgent,給出了AIAgent的理想技術(shù)架構(gòu)。大模型聚焦語言處理,以文本交互被動響應(yīng)指令,應(yīng)用于內(nèi)容生成等場景;AIAgent以LLM為核心,具備多模態(tài)交互和自主執(zhí)行能力,可完成跨場景復(fù)雜任務(wù)。還有很多人在問,AIAgent與大模型的區(qū)別。兩者的區(qū)別,可以體現(xiàn)在以下幾個方面:從單智能體到多智能體智能體的四種設(shè)計(jì)方式吳恩達(dá)教授提出的智能體設(shè)計(jì)方法有四種:反Collaboration多智能體協(xié)作正是其中之一。從這四種設(shè)計(jì)方式而言,現(xiàn)在的大語言模型尤其是推理模型能夠反思、規(guī)劃和進(jìn)行簡單的工具使用,都可以算是智能體。=<>DeepSeek等推理模型對AIAgent前面簡單介紹最近兩年AIAgent發(fā)展的基本路徑。其實(shí)所有問題的原點(diǎn),最終還要回到大模型上。LLMBasedAgent的能力與功能取決于LLM的性能,如果大模型能力足夠強(qiáng)大,智能體也就能做到勝任更多業(yè)務(wù)場景。當(dāng)然大模型足夠強(qiáng)大了,可能也就不需要智能體了,這個涉及到了模型即應(yīng)用,后面會講。一言X1、混元T1這樣的高質(zhì)推理模型的出現(xiàn),對AIAgent性能與功能的提升有著很大的賦能,這里總結(jié)了幾點(diǎn)。?市場格局:DeepSeek的技術(shù)突破推動中國從AI規(guī)則接受者轉(zhuǎn)變?yōu)闃?biāo)準(zhǔn)共治者,其開源策略和國產(chǎn)化優(yōu)勢可能重塑全球AIAgent市場的競爭與合作模式。=<>Manus通用智能體帶來的行業(yè)啟示多代理協(xié)同架構(gòu):規(guī)劃代理通過MCTS算法拆解任務(wù)為DAG結(jié)構(gòu),執(zhí)行代理調(diào)用工具鏈完成操作,驗(yàn)證代理檢測邏輯矛盾并核對數(shù)據(jù)源。模型調(diào)度與優(yōu)化:整合Claude3.5、DeepSeek等模型,降低調(diào)用成本,支持高并發(fā)任務(wù)調(diào)度,任務(wù)執(zhí)行準(zhǔn)確率達(dá)98%。動態(tài)任務(wù)調(diào)度引擎:動態(tài)分配算力資源,支持邊緣計(jì)算與云端協(xié)同,響應(yīng)時間控制在50ms以內(nèi),記憶模塊優(yōu)化后續(xù)任務(wù)路徑。安全與穩(wěn)定支撐:采用聯(lián)邦學(xué)習(xí)保障數(shù)據(jù)隱私,攔截惡意攻擊,異常處理模塊自動修正偏差,確保任務(wù)執(zhí)行成功率。?Manus技術(shù)架構(gòu)通過工具鏈整合優(yōu)化而非底層模型創(chuàng)新,實(shí)現(xiàn)了從任務(wù)理解到結(jié)果交付的全鏈路自主執(zhí)行,同時兼顧效率與成本優(yōu)勢。?從官方視頻展示來看,Manus可以用于零售與電商、金融、教育與研究等領(lǐng)域的多種應(yīng)用場景。我在書里介紹了智能體在多個領(lǐng)域的應(yīng)用,在技術(shù)部分提到了相關(guān)技術(shù)架構(gòu),在智能體技術(shù)發(fā)展趨勢和應(yīng)用發(fā)展趨勢方面也有介紹多智能體,可以幫助讀者理解這種智能體。?Manus在工程化方面下了很大功夫,率先產(chǎn)品化了,能夠一步到位給與用戶想要的直接結(jié)果。可以給到普通用戶更多智能體應(yīng)用的感知和更好的體驗(yàn),這是目前依托那些智能體平臺構(gòu)建的智能體尚未實(shí)現(xiàn)的,也是需要努力方向。Manus技術(shù)架構(gòu)通過工具鏈整合優(yōu)化而非底層模型創(chuàng)新,雖然大家對它的評價褒貶不一,但作為通用智能體還是為行業(yè)帶來了不少的啟示Manus的出圈也證明了能夠自主執(zhí)行相對復(fù)雜任務(wù)的智能體在現(xiàn)階段是可行的,雖然需要耗費(fèi)很多的token和時間。接下來肯定會有更多同類產(chǎn)品出現(xiàn),也會進(jìn)行更多優(yōu)化與迭代。加上大語言模型快速發(fā)展,今年內(nèi)這類智能體體驗(yàn)應(yīng)該能有很大提升。=<>AIAgent行業(yè)現(xiàn)狀1智能體應(yīng)用現(xiàn)狀51智能體應(yīng)用現(xiàn)狀5225.8%,反映了小型企業(yè)在資源有限下對AI43個人用戶使用的AIAgent,主要依賴Coze、文心智能體等AIAgent構(gòu)建平臺上Agent或者使用一些廠商提供的開箱即用AIAgent成品,部分用戶使用一些支持AIAgent的AI應(yīng)用客戶端,還有一部分懂技術(shù)的用戶會在本地部署一套包括大模型在內(nèi)的AIAgent系統(tǒng),比如Dify、Ragflow等。lAI輔助放射學(xué)報告的生成將關(guān)鍵發(fā)現(xiàn)檢測的準(zhǔn)確性和速度提高了20%(NCBI,2018年)。lAIAgent自動執(zhí)行89%的臨床文檔任務(wù),顯著提高醫(yī)療保健提供者的效率(NCBI,2023年)。l用于斑塊檢測的CT圖像處理中的AIAgent達(dá)到97%的準(zhǔn)確率,有助于心臟病的早期診斷(NCBI,2024年)。lAIAgent可以將初始簡歷篩選所花費(fèi)的時間減少75%,使人力資源專業(yè)人員能夠?qū)W⒂趹?zhàn)略計(jì)劃(OdinAI,2024年)。l94%的人力資源專業(yè)人士認(rèn)為,AIAgent通過識別最佳候選人來改進(jìn)招聘流程(ScienceDirect,2023年)。l96%的人力資源領(lǐng)導(dǎo)者認(rèn)為AIAgent可以提供個性化的學(xué)習(xí)和發(fā)展機(jī)會,培養(yǎng)一支更加敬業(yè)和熟練的員工隊(duì)伍(Getodin.AI,2024年)。lAIAgent通過自動化日常任務(wù)和提高流程效率來幫助降低HR的運(yùn)營成本,從而節(jié)省高達(dá)25%的成本(Getodin.AI,2024年)。l收入增長:69%使用AIAgent的零售商報告說,由于個性化和預(yù)測分析的改進(jìn),收入顯著增長(Statista,2024年)。l降低成本:利用AIAgent提供客戶服務(wù)的零售商的運(yùn)營成本降低了72%(Salesforce,2024年)。l增加收入:69%使用AIAgent的零售商觀察到年收入增加,其中一些報告增長了5%到15%不等(OdinAI,2024年)。l高達(dá)91%的財務(wù)專業(yè)人士對AIAgent持中立態(tài)度,專注于他們在欺詐預(yù)防、風(fēng)險評估和簡化財務(wù)流程方面的作用。l8%的人表示樂觀,這凸顯了AIAgent提供個性化客戶體驗(yàn)并通過實(shí)時分析改進(jìn)決策的能力。l82%的金融機(jī)構(gòu)報告說,由于實(shí)施了AIAgent,運(yùn)營成本降低了(OdinAI,2024年)。l客戶體驗(yàn)增強(qiáng):34%的金融機(jī)構(gòu)利用AIAgent通過聊天機(jī)器人、虛擬助手和推薦系統(tǒng)改善客戶體驗(yàn)(ScienceDirect,2024年)。l提高運(yùn)營效率:43%的金融專業(yè)人士觀察到使用AIAgent提高了運(yùn)營效率(福布斯顧問,2024年)。l根據(jù)HSO的說法,AIAgent可以以95%的準(zhǔn)確率預(yù)測設(shè)備故障,顯著減少停機(jī)時間和維修成本高達(dá)40%。lAIAgent優(yōu)化生產(chǎn)計(jì)劃和調(diào)度,將生產(chǎn)吞吐量提高20-30%,并將庫存和人員成本降低高達(dá)20%(OdinAI,2024年)。l分析實(shí)時數(shù)據(jù)流的AIAgent可以及早檢測到異常,將報廢和返工成本降低10-30%(OdinAI,2024年)。l實(shí)施AIAgent可以將工廠生產(chǎn)力提高多達(dá)50%,并將生產(chǎn)吞吐量提高20%(OdinAI,2024年)。lAIAgent將產(chǎn)品開發(fā)時間縮短了30-50%,從而提高了產(chǎn)品性能并降低了成本(OdinAI,2024年)。企業(yè)級解決方案企業(yè)級解決方案……AIAgent的產(chǎn)品及服務(wù)形態(tài),主要有以下幾種常見Agent產(chǎn)品包括聊天助手、編碼助手、AI搜索等當(dāng)前的AIAgent具有以下產(chǎn)品通性AI搜索、編碼助手是比較成功的AIAgent產(chǎn)品,目前ChatGPT、Kimi、通義千問等基于大語言模型的聊天AI搜索、編碼助手是比較成功的AIAgent產(chǎn)品,目前為用戶提供企業(yè)級的AIAgent解決方案。當(dāng)然企業(yè)軟為用戶提供企業(yè)級的AIAgent解決方案。當(dāng)然企業(yè)軟市面上的AIAgent大多基于特定知識庫或數(shù)據(jù)構(gòu)建,雖在問答交互方面表現(xiàn)出色,但在程序聯(lián)動和操作方市面上的AIAgent大多基于特定知識庫或數(shù)據(jù)構(gòu)建,雖在問答交互方面表現(xiàn)出色,但在程序聯(lián)動和操作方智能體構(gòu)建平臺產(chǎn)品,已經(jīng)成為智能體應(yīng)用構(gòu)建與承載的中流砥柱。更多智能體平臺面向開發(fā)者,普通用戶想要構(gòu)建想要的智能體還有門檻,當(dāng)然用起來沒有問題。Coze等智能體構(gòu)建平臺初步把智能體改造成了基于LLM的低代碼平臺,低代碼平臺也正在積極融合Agent技術(shù)升級為Agent構(gòu)建平臺。?Agent市場由主要科技公司和越來越多的初創(chuàng)公司主導(dǎo),競爭環(huán)境激烈。?AIAgent市場正在顯著擴(kuò)展,主要受到自動化和效率需求的推動。?marketsandmarkets報告數(shù)據(jù)顯示,該市場從2024年的51億美元增長到預(yù)計(jì)2030年的471億美元,復(fù)合年增長率為44.8%。?初創(chuàng)公司和細(xì)分市場參與者:CBInsights市場地圖識別出超過170家初創(chuàng)公司,包括Harvey,該公司在2025年30億美元估值融得3億美元,專注于法律AI代理TheAI?其他值得注意的初創(chuàng)公司包括CrewAI(40%的財富500強(qiáng)企業(yè)使用其多代理協(xié)調(diào)功能)和ServiceNow(最近推出AIAgentOrchestrator,用于自定義代理部署)大公司的各種動作,最能彰顯技術(shù)及市場動向。最近幾個月科技巨頭公司在AIAgent方面動作頻頻,有些公司已經(jīng)取得了不錯產(chǎn)品成果與市場進(jìn)展。頭部的大語言模型創(chuàng)業(yè)公司,也都在重點(diǎn)開拓AIAgent領(lǐng)域。大公司的各種動作,最能彰顯技術(shù)及市場動向。最近幾個月科技巨頭公司在AIAgent方面動作頻頻,有些公司已經(jīng)取得了不錯產(chǎn)品成果與市場進(jìn)展。頭部的大語言模型創(chuàng)業(yè)公司,也都在重點(diǎn)開拓AIAgent領(lǐng)域。月之暗面……AIAgent全景圖:隨著更多AIAgent產(chǎn)品與解決方案的推出,越來越多涉足AIAgent的公司與創(chuàng)業(yè)團(tuán)隊(duì)浮出吹面,AIAgent的行業(yè)版圖也在逐漸清晰。左邊是NewEconomies繪制的6月份市場全景圖,右邊insightpartners給出的12月市場全景圖。AIAgent全景圖:隨著更多AIAgent產(chǎn)品與解決方案的推出,越來越多涉足AIAgent的公司與創(chuàng)業(yè)團(tuán)隊(duì)浮出吹面,AIAgent的行業(yè)版圖也在逐漸清晰。左邊生態(tài)圖譜來自甲子光年4月份報告,右邊來自infoQ第二季度報告。智能體應(yīng)勢而生:單從AIAgent構(gòu)建平臺來說,5月份王吉偉頻道盤點(diǎn)了全球80多個Agent構(gòu)建平臺,現(xiàn)在的數(shù)量已經(jīng)遠(yuǎn)遠(yuǎn)超過這個數(shù)字,國內(nèi)就已經(jīng)有十?dāng)?shù)個。詳見公眾號文章《AI智?大語言模型(LLM)是AIAgent的核心,提供強(qiáng)大的自然語言處理能力,支持多語言和多領(lǐng)域任務(wù)。??大語言模型(LLM)是AIAgent的核心,提供強(qiáng)大的自然語言處理能力,支持多語言和多領(lǐng)域任務(wù)。?AIAgent具備多模態(tài)能力,整合圖像、音頻和視頻處理,適用于智能家居、醫(yī)療診斷和內(nèi)容創(chuàng)作。?AIAgent通過高級規(guī)劃和推理技術(shù)進(jìn)行自主決策,能夠調(diào)用外部工具和API,擴(kuò)展其功能。?AIAgent現(xiàn)可調(diào)用外部工具和API,如搜索引擎、數(shù)據(jù)庫或軟件接口,顯著擴(kuò)展其功能。?記憶和學(xué)習(xí)機(jī)制使其能夠存儲和檢索信息,增強(qiáng)學(xué)習(xí)?AIAgent的架構(gòu)通常包括感知、認(rèn)知和行動三個組件,支持多種分類和多代理協(xié)作。GPT-4o、谷歌的Gemini2.0和Anthropic的CGemini2.0原生支持工具使用。這一特征使AIAgentAIAgent通常包括感知(輸入處理)、認(rèn)知(決策)和行動(任務(wù)執(zhí)行組件。分類包括反應(yīng)式Agent(即時響應(yīng))、基于模型的Agent(預(yù)和學(xué)習(xí)型Agent(自適應(yīng)優(yōu)化)。多代理系統(tǒng)(如OpenAISwarm)技術(shù)現(xiàn)狀:AIAgent技術(shù)正朝著多個創(chuàng)新方向發(fā)展,以提升性能和用戶體驗(yàn)。增強(qiáng)多模態(tài)交互未來將更好地處理視頻、3D數(shù)據(jù)和觸覺輸入,應(yīng)用于智能家居、醫(yī)療診斷和虛擬現(xiàn)實(shí)。例如,Meta的Llama3支持多模態(tài)輸入,擴(kuò)展了應(yīng)用場景。提高自主性和可靠性增強(qiáng)多模態(tài)交互未來將更好地處理視頻、3D數(shù)據(jù)和觸覺輸入,應(yīng)用于智能家居、醫(yī)療診斷和虛擬現(xiàn)實(shí)。例如,Meta的Llama3支持多模態(tài)輸入,擴(kuò)展了應(yīng)用場景。提高自主性和可靠性讓AIAgent更獨(dú)立,減少錯誤,專注于復(fù)雜任務(wù)的自校正和魯棒性。例如,Anthropic的Claude3.5強(qiáng)調(diào)安全性和可靠性,適合企業(yè)關(guān)鍵任務(wù)。多Agent協(xié)作開發(fā)多代理系統(tǒng),多個AIAgent合作完成共同目標(biāo),模擬人類團(tuán)隊(duì)協(xié)作。例如,OpenAI的Swarm平臺支持多Agent協(xié)同優(yōu)化供應(yīng)鏈。邊緣計(jì)算與端側(cè)部署將AIAgent部署到智能手機(jī)、PC等邊緣設(shè)備,提升隱私和響應(yīng)速度。例如,蘋果的Siri正在向端側(cè)處理方向發(fā)展。可解釋性和信任增強(qiáng)決策過程的透明度,開發(fā)解釋性AI技術(shù)以構(gòu)建用戶信任。例如,IBM的ExplainableAI工具幫助用戶理解Agent決策。個性化與適應(yīng)根據(jù)用戶偏好和行為調(diào)整AIAgent,提供定制化體驗(yàn)。例如,亞馬遜的Alexa通過學(xué)習(xí)用戶習(xí)慣優(yōu)化交互。?提高自主性和可靠性:使AIAgent更獨(dú)立,減少錯誤,專注于復(fù)雜任務(wù)的自校正和魯棒性。例如,Anthropic的Claude3.5強(qiáng)調(diào)安全性和可靠性,適合企業(yè)關(guān)鍵任務(wù)。?多Agent協(xié)作:開發(fā)多代理系統(tǒng),多個AIAgent合作完成共同目標(biāo),模擬人類團(tuán)隊(duì)協(xié)作。例如,OpenAI的Swarm平臺支持多Agent協(xié)同優(yōu)化供應(yīng)鏈。?邊緣計(jì)算與端側(cè)部署:將AIAgent部署到智能手機(jī)、PC等邊緣設(shè)備,提升隱私和響應(yīng)速度。例如,蘋果的Siri正在向端側(cè)處理方向發(fā)展。?可解釋性和信任:增強(qiáng)決策過程的透明度,開發(fā)解釋性AI技術(shù)以構(gòu)建用戶信任。例如,IBM的ExplainableAI工具幫助用戶理解Agent決策。?個性化與適應(yīng):根據(jù)用戶偏好和行為調(diào)整AIAgent,提供定制化體驗(yàn)。例如,亞馬遜的Alexa通過學(xué)習(xí)用戶習(xí)慣優(yōu)化交互。技術(shù)現(xiàn)狀:這些當(dāng)前的熱門技術(shù),可以多關(guān)注熱門技術(shù)AIAgent技術(shù)棧:AIAgent技術(shù)發(fā)展到現(xiàn)在,技術(shù)生態(tài)基本已經(jīng)成型,用于構(gòu)建AIAgent的各種技術(shù)正在不斷完善。左邊是去年AuraVentures整理的市場全景,右邊是Letta在今年11月推出最新技術(shù)棧統(tǒng)計(jì)。圖源:AuraVentures《TheRiseofAutonomousAIAgents;DebundlingtheMarket圖源:Letta《TheAIagentsstack》AIAgent技術(shù)生態(tài)圖:把翁麗蓮的AIAgent框架圖用技術(shù)和企業(yè)進(jìn)行具象化,可以看到下面這張由ActivantCapital繪制的技術(shù)供應(yīng)商角度的AIAgent生態(tài)系統(tǒng)圖。圖源:activantcapital,詳見圖書第15.2.4節(jié)AIAgent技術(shù)進(jìn)展:基于大語言模型的AIAgent技術(shù),正在快速發(fā)展與迭代可用的大型語言模型一般用例特定實(shí)現(xiàn)可用的大型語言模型一般用例特定實(shí)現(xiàn)模型基礎(chǔ)工具最終用戶UI大語言模型發(fā)展前景圖七種流行的RAG技術(shù)架構(gòu)AIAgent技術(shù)進(jìn)展:AIAgent技術(shù)框架不斷推陳出新Jules技術(shù)框架/方案名稱描述AIAgent開源項(xiàng)目與閉源項(xiàng)目:已經(jīng)推出AIAgent技術(shù)框架、產(chǎn)品及解決方案的開源與閉源項(xiàng)目來源:e2bGithub倉庫awesome-ai-agents問題與不足:雖然AIAgent已經(jīng)逐漸在很多領(lǐng)域?qū)崿F(xiàn)商用,受限于現(xiàn)階段的技術(shù)、生態(tài)、用戶接受度等因素,仍然存在一些問題和不足。程穩(wěn)定性上存在隨機(jī)輸出和異常處理問題。安全性和隱私保護(hù)面臨數(shù)據(jù)泄說明AIAgent遇到的系列行業(yè)問題,可以參考圖書第11章:AIAgent行業(yè)應(yīng)用挑戰(zhàn)。及缺乏可重用的基礎(chǔ)設(shè)施。碎片化的工具、集成問題和可擴(kuò)展性問題使流程進(jìn)一步圖源:langbase《state-of-ai-agents》報告面臨的挑戰(zhàn)具體描述調(diào)研類場景容忍度較高。多任務(wù)場景下錯誤容面臨的挑戰(zhàn)具體描述調(diào)研類場景容忍度較高。多任務(wù)場景下錯誤容或高含知識任務(wù)時失敗率高。單次生成結(jié)果議標(biāo)準(zhǔn)化作業(yè)(如MCP規(guī)范滲透性差)。覽器與專業(yè)報表工具)。生產(chǎn)環(huán)境中模型易受對抗樣本攻擊(如利用FG?錯誤容忍度問題:在不同場景下的錯誤容忍度差異顯著。例如在代碼生成場景中錯誤容忍度極低(需專業(yè)程序員介入),而調(diào)研類場景容忍度較高。多任務(wù)場景下錯誤容易被累積放大,直接影響最終輸出質(zhì)量。?記憶與上下文管理瓶頸:大模型依賴上下文窗口提供歷史信息模擬記憶,但超大上下文窗口性能不足(如模型處理長文本時表現(xiàn)下降)。RAG技術(shù)面臨嵌入質(zhì)量與召回準(zhǔn)確率的挑戰(zhàn),難以實(shí)現(xiàn)有效記憶。?模型智能程度的限制:復(fù)雜場景下模型能力急劇下降,例如處理多文件代碼或隱含知識任務(wù)時失敗率高。單次生成結(jié)果的質(zhì)量直接影響Agent整體表現(xiàn),模型需更高精度。?自我評估能力的缺失:現(xiàn)有Agent缺乏結(jié)果自檢能力,無法判斷任務(wù)是否達(dá)到預(yù)期目標(biāo),需依賴外部反饋或人工干預(yù)。?工具集成與協(xié)調(diào)難題:工具調(diào)用成功率低(約50%失敗率),且缺乏統(tǒng)一協(xié)議標(biāo)準(zhǔn)化(如MCP被質(zhì)疑適配性差)??绛h(huán)境操作能力不足,Agent難以自由切換不同應(yīng)用軟件(如瀏覽器與專業(yè)報表工具)。?數(shù)據(jù)相關(guān)挑戰(zhàn):垂直領(lǐng)域樣本稀缺,需依賴對比學(xué)習(xí)、元學(xué)習(xí)等技術(shù),但數(shù)據(jù)合成成本高。多模態(tài)對齊困難,文本、圖像、語音的異構(gòu)性導(dǎo)致信息整合效率低。?魯棒性與安全性風(fēng)險:生產(chǎn)環(huán)境中模型易受對抗樣本攻擊(如利用FGSM算法生成的惡意輸入),需引入驗(yàn)證機(jī)制降低風(fēng)險。實(shí)時監(jiān)控與熱更新機(jī)制不足,難以應(yīng)對數(shù)據(jù)分布偏移問題。面臨的問題:模型即應(yīng)用是挑戰(zhàn)也是機(jī)會?現(xiàn)在有一個很明顯的趨勢:模型即應(yīng)用(服務(wù)模型本身直接構(gòu)成最終產(chǎn)品或服務(wù),而非通過應(yīng)用層(如API或第三方軟件)二次開發(fā)。比如OpenAI的DeepResearch模型能夠端到端自主完成研究報告生成,無需外部工具調(diào)用或人工干預(yù),ClaudeSonnet3.7可直接完成復(fù)雜任務(wù)(如代碼庫管理)而非僅作為生成代碼的工具,還有很多大模型推出的DeepResearch等功能。?這個趨勢,可能會造成2個結(jié)果:一是API時代將被終結(jié),大模型廠商(如OpenAI、DeepSeek)將停止對外提供API,轉(zhuǎn)為直接提供模型作為產(chǎn)品,這個時間可能也就兩年。二是應(yīng)用商直接集成能力的功能淘汰。AIAgent-Agenticworkflow-AgenticAI:AIAgent向AgenticWorkflow的發(fā)展以及AgenticAI的興起,正推動行業(yè)效率提升和數(shù)字化轉(zhuǎn)型。這些技術(shù)改變了企業(yè)運(yùn)營模式,改善了客戶體驗(yàn),并為決策支持和自動化服務(wù)帶來革命性變化。同時,它們也延伸了應(yīng)用價值鏈,改變了行業(yè)業(yè)態(tài),盡管面臨技術(shù)挑戰(zhàn),但為行業(yè)帶來了前所未有的發(fā)展機(jī)遇。):的智能實(shí)體。它基于預(yù)設(shè)的目標(biāo)或任務(wù),在給定的環(huán)境中通過獨(dú)立思考和調(diào)用工具逐步完成任務(wù)。AIAgent可以模擬人類對話,以自然且直觀的方式與人類交互,并在多個領(lǐng)言模型(LLM)調(diào)用靜態(tài)完成任務(wù)的工作流。在這個工作流中,AIAgent作為一個自主做出決策、采取行動、解決復(fù)雜問題,并在訓(xùn)練機(jī)器學(xué)習(xí)模型的數(shù)據(jù)之外與外部環(huán)境進(jìn)=

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論