版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
內(nèi)容目錄一、從大語言模型到智能體” 4如何理解智能體5Agents的運(yùn)行機(jī)制 6二、Agent的應(yīng)用與實(shí)踐 8單一智能體的部署——以為例 8多智能體的交互部署 10人與智能體的交互部署 10三、利用LLM-BasedAgent快速梳理產(chǎn)業(yè)鏈,捕捉投資熱點(diǎn) 10方法介紹 10產(chǎn)業(yè)鏈?zhǔn)崂碇悄荏w的構(gòu)建 12基于新聞數(shù)據(jù)進(jìn)行產(chǎn)業(yè)鏈知識的拓展 14產(chǎn)業(yè)鏈?zhǔn)崂砑?xì)化——相關(guān)投資標(biāo)的推薦 15如何針對投資主題梳理其產(chǎn)業(yè)鏈信息? 16四、產(chǎn)業(yè)鏈?zhǔn)崂戆咐故尽浴叭A為供應(yīng)鏈”主題為例 17投資主題梳理結(jié)果展示 17投資標(biāo)的梳理結(jié)果展示 20五、總結(jié) 21風(fēng)險(xiǎn)提示 21圖表目錄圖表1:GPT商店界面 5圖表2:自定義GPTs界面 5圖表3:OpenAI提供的DataAnalysis應(yīng)用案例 4圖表4:智能體技術(shù)演變 6圖表5:LLM-BasedAgent運(yùn)行機(jī)制示例 6圖表6:智能體運(yùn)行流程示意圖 7圖表7:LLM-BasedAgent三大應(yīng)用場景 8圖表8:AutoGPT整體邏輯流程與模塊調(diào)用概念圖 8圖表9:AutoGPT生成的模板 9圖表10:多智能體交互模式示例 10圖表11:大語言模型擁有充足的產(chǎn)業(yè)鏈知識 11圖表12:手機(jī)產(chǎn)業(yè)鏈推導(dǎo)示意圖 12圖表13:產(chǎn)業(yè)鏈Agent運(yùn)行流程示意圖 12圖表14:大語言模型產(chǎn)業(yè)鏈?zhǔn)崂斫Y(jié)果展示 13圖表15:Wind智能手機(jī)產(chǎn)業(yè)鏈?zhǔn)崂斫Y(jié)果展示 13圖表16:智能手機(jī)-顯示屏高相關(guān)新聞示例 14圖表17:智能手機(jī)-顯示屏上游(GPT3.5未疊加新聞) 14圖表18:智能手機(jī)-顯示屏上游(GPT3.5+202303-202306新聞) 15圖表19:智能手機(jī)-顯示屏上游(GPT3.5+202303-202310新聞) 15圖表20:智能手機(jī)-顯示屏上游投資標(biāo)的推薦案例 16圖表21:投資主題拆解結(jié)果展示 17圖表22:“華為供應(yīng)鏈”梳理(GPT4) 18圖表23:“華為供應(yīng)鏈”梳理(GPT3.5+新聞) 19圖表24:“華為供應(yīng)鏈”投資標(biāo)的梳理結(jié)果 20的首屆開發(fā)者大會上公布了一系列新成果,但其中給人們帶來最大沖擊的不是全GPT商店。自推出以來,人們一直在尋找方法讓它成為適應(yīng)特定使用目標(biāo)的定制化產(chǎn)品,而正是為此而來。GPT進(jìn)行“角色扮演”。當(dāng)前GPTStore也已正式上線,包含超300萬個(gè)用戶設(shè)計(jì)的GPTs。OpenAIGPTsDataAnalysisGPTs圖表1:OpenAI提供的DataAnalysis應(yīng)用案例來源:OpenAI,GPTsInstructions的具體行動內(nèi)容,還可以KnowledgeCapabilities調(diào)用代碼或其他接口的能力,GPTs并題問,它會自主地調(diào)用編程軟件并求解,直到它認(rèn)為我們給出的問題已得到解答。圖表2:GPT商店界面 圖表3:自定義GPTs界面來源:OpenAI, 來源:OpenAI,實(shí)際上,類似的思路早已有雛形。之前火爆一時(shí)的AutoGPT項(xiàng)目可以實(shí)現(xiàn)用戶提問后大模型自主尋找解決方案,包括由模型規(guī)劃解決問題的步驟、使用哪些工具、以及得到反饋后自動進(jìn)行下一步思考,在這一框架下模型獲得了一定的自主能力,并能夠獨(dú)立實(shí)現(xiàn)智能體get。如何理解智能體(Agent)?人工智能領(lǐng)域的“智能”概念與傳統(tǒng)理解有所不同,它更強(qiáng)調(diào)的是行使意志、做出選擇和采取行動的能力,強(qiáng)調(diào)物體不是單純被動地受外部刺激而做出反應(yīng)。智能體則是泛指滿足上述行動要求的實(shí)體。歷史上的智能體實(shí)踐經(jīng)歷了多輪迭代。最初智能體僅停留在概念的層面,強(qiáng)調(diào)符號邏輯與反應(yīng)速度。伴隨深度強(qiáng)化學(xué)習(xí)的發(fā)展,基于深度學(xué)習(xí)的智能體(RL-BasedAgents)開始發(fā)展,AlphaGo等廣為人知的項(xiàng)目獲得成功標(biāo)志著智能體開始進(jìn)入實(shí)際應(yīng)用環(huán)境。不過,強(qiáng)化學(xué)習(xí)作為核心也帶來訓(xùn)練時(shí)間長、采樣效率低以及穩(wěn)定性問題。大語言模型快速興起為智能體的發(fā)展也帶來了豐富想象,越來越多的人開始嘗試將大語言模型作為內(nèi)核,來構(gòu)建LLM-BasedAgent。大語言模型天生自帶的多模態(tài)感知、推理能力以及強(qiáng)大的泛化能力,為智能體帶來了豐富的應(yīng)用場景。圖表4:智能體技術(shù)演變來源:《TheRiseandPotentialofLargeLanguageModelBasedAgents:ASurvey》,智能體=大語言模型+規(guī)劃+工具+記憶大語言模型作為模型內(nèi)核,為智能體提供理解、推理與生成能力,也是其他所有功能的實(shí)現(xiàn)基礎(chǔ)。規(guī)劃步驟幫助智能體獲得對問題求解步驟進(jìn)行拆分的能力,實(shí)現(xiàn)從“一問一答”向“自主思考”轉(zhuǎn)變,其本質(zhì)上依賴于大語言模型的推理能力。工具賦予智能體與環(huán)境交互的能力,是智能體行動的載體;記憶則記錄智能體每一輪的思考、行動以及獲取的反饋,幫助它在多輪迭代中保持思考的連貫。以下我們對這類基于大語言模型的智能體進(jìn)行更詳細(xì)的介紹。LLM-BasedAgents的運(yùn)行機(jī)制Agents的運(yùn)行機(jī)制。當(dāng)人類詢問“明天這里是否會-sdgnt圖表5:LLM-BasedAgent運(yùn)行機(jī)制示例來源:《TheRiseandPotentialofLargeLanguageModelBasedAgents:ASurvey》,感知模塊將指令轉(zhuǎn)換為大語言模型可以理解的表示形式;然后大腦模塊開始根據(jù)天氣的圖片、地理位置或是其他天氣相關(guān)的數(shù)據(jù)進(jìn)行推理和行動規(guī)劃;最后由行動端做出響應(yīng)并將雨傘遞給人類。以上只是大致的運(yùn)作流程,實(shí)際上該流程內(nèi)部可能存在多輪迭代,譬如:第一輪,智能體識別出需要對下雨的概率進(jìn)行估計(jì),那么會規(guī)劃對天氣相關(guān)的數(shù)據(jù)進(jìn)行實(shí)時(shí)收集,行為模塊就會執(zhí)行聯(lián)網(wǎng)的查詢或是數(shù)據(jù)庫調(diào)取這類操作;第二輪,模型讀取收集到的數(shù)據(jù),再決定是基于自有知識或是直接調(diào)用天氣預(yù)測模型,來給出下雨的概率;……最終,智能體在重復(fù)上述過程中不斷與環(huán)境交互并獲得反饋,最后得出結(jié)論??偨Y(jié)來說,智能體的運(yùn)行流程可以簡化為:感知(Perception)、規(guī)劃(Planning)、行動(Action)。圖表6:智能體運(yùn)行流程示意圖來源:《TheRiseandPotentialofLargeLanguageModelBasedAgents:ASurvey》,感知的核心目的是將數(shù)據(jù)統(tǒng)一化為模型可以操作的向量形式,當(dāng)然在實(shí)踐層面它還負(fù)責(zé)Prompt的編寫等工作。規(guī)劃模塊則負(fù)責(zé)進(jìn)行推理和決策,主要是基于模型自身的參數(shù)來給出回答。在大語言模型的加持下,它能獲得“記憶”能力,結(jié)合自身過去的觀察、思考和行動進(jìn)行規(guī)劃。行動模塊接收規(guī)劃給出的行動安排,并與環(huán)境產(chǎn)生互動,這也是讓智能體擁有自主性的最關(guān)鍵部分。工具一般以API或函數(shù)的形式提供,豐富的工具選擇可以大大拓寬智能體的能力范圍,補(bǔ)足大語言模型不擅長的方面。例如模型并不擅長數(shù)學(xué)運(yùn)算,在需要涉及運(yùn)算時(shí)我們允許模型調(diào)用代碼(Codeinterpreter)進(jìn)行輔助,這樣可以明顯提升模型運(yùn)算的準(zhǔn)確度。大語言模型為智能體帶來如下的具體優(yōu)勢:知模塊也能添加圖像編碼器,在編碼器與大語言模型之間增添中間層的方式將Based的感知域擴(kuò)展到視覺輸入層面;聽覺輸入方面,智能體可以以級聯(lián)方式調(diào)用現(xiàn)有工具集或模型庫來處理音頻信息,將感知空間從純文字領(lǐng)域擴(kuò)展到包括文字、聽覺和視覺模式在內(nèi)的多模態(tài)領(lǐng)域。之外,針對復(fù)雜問題,我們還可以使用思維鏈(CoT)等技術(shù)有效提升智能體的推理能力。zero-shotfew-shot能力,允許我們通過描述工具功能或進(jìn)行少量演示的提示方法來幫助智能體理解工具,這有助于模型進(jìn)行復(fù)雜任務(wù)的拆分規(guī)劃;大語言模型還能夠按照指定的格式進(jìn)行輸出,便于行動模塊準(zhǔn)確讀取規(guī)劃的結(jié)果,這為智能體帶來更靈活且廣泛的工具調(diào)用能力。實(shí)踐中,我們一般要求模JSON格式給出選擇的工具名稱以及參數(shù)信息?!坝洃洝惫δ軒椭悄荏w從反饋中學(xué)習(xí),與環(huán)境互動的能力幫助其在多輪推理中不斷接近目標(biāo)。反饋包括環(huán)境反饋與人類反饋,智能體會識別自身行為給環(huán)境帶來的所有改變,包括任務(wù)是否完成等;在人類提供反饋時(shí),智能體也會從人類給出的顯性評價(jià)或隱性行為中讀取反饋信息。類場景;除此之外,大語言模型還可以隨時(shí)補(bǔ)充專業(yè)領(lǐng)域的知識,以在特定任務(wù)上有更的知識庫搭載和微調(diào)FneTunngPrompt層面告訴模型一些專業(yè)知識來提升能力,而后者直接從參數(shù)層面對模型進(jìn)行專業(yè)知識方向的提升。此外,若底層的大語言模型具有足夠的智能,LLM-BasedAgent還能通過生成可執(zhí)行程序或?qū)F(xiàn)有工具進(jìn)行集成來創(chuàng)建工具,甚至在多個(gè)智能體的系統(tǒng)中為其他智能體制作軟件包。推測未來,智能體可能會變得自給自足,在工具方面表現(xiàn)出高度的自主性。LLM-BasedAgent的優(yōu)秀能力已被初步應(yīng)用于各種現(xiàn)實(shí)場景,如軟件開發(fā)和科學(xué)研究等,但距離全方位的推廣還有一定距離。LLM-BasedAgent目前,LLM-BasedAgent應(yīng)用實(shí)例的發(fā)展十分活躍,各類項(xiàng)目層出不窮。它們大致可以分為三種應(yīng)用場景:單一智能體部署、多智能體交互部署和人與智能體交互部署。單個(gè)智能體擁有多種能力,在各種應(yīng)用方向上都能表現(xiàn)出出色的任務(wù)解決能力。當(dāng)多智能體互動時(shí),它們可以通過合作或?qū)剐曰尤〉眠M(jìn)步。目前單一智能體部署方面已有許多大膽嘗試,例如AutoGPT、Langchain等,此外還包括最近推出的GPTs。多智能體交互部署是未來的重點(diǎn)發(fā)展方向。圖表7:LLM-BasedAgent三大應(yīng)用場景來源:《TheRiseandPotentialofLargeLanguageModelBasedAgents:ASurvey》,單一智能體的部署——以AutoGPT為例AutoGPT是目前非常流行的開源項(xiàng)目之一,旨在實(shí)現(xiàn)完全自主的問題解決系統(tǒng)。除了GPT-4等大型語言模型的基本功能外,AutoGPT框架還集成了各種實(shí)用的外部工具和長短期內(nèi)存管理。理論上,用戶在輸入目標(biāo)后就可以解放雙手,等待AutoGPT自動生成想法并執(zhí)行特定任務(wù),所有這些都不需要用戶的額外提示。是將用戶的多目標(biāo)復(fù)雜任務(wù)進(jìn)行分步執(zhí)行,每一步使用何種工具以完成何種命令,都是通過調(diào)用大語言模型的返回結(jié)果決定的,從而極大程度上提升決策透明度,實(shí)現(xiàn)自我推理決策。此外,調(diào)用大語言模型時(shí)會將前幾輪推理結(jié)果的歷史信息一同傳給模LLM綜合全局的信息給出下一步要執(zhí)行的命令。其邏輯流程與模塊調(diào)用關(guān)系大致如下:圖表8:AutoGPT整體邏輯流程與模塊調(diào)用概念圖來源:GitHub,AutoGPT,從功能上來看,整個(gè)AutoGPT執(zhí)行可以分為四個(gè)步驟:任務(wù)構(gòu)建、LLM調(diào)用與結(jié)果解析、命令執(zhí)行、緩存處理四個(gè)部分。任務(wù)構(gòu)建是整個(gè)項(xiàng)目的核心所在,包括用戶的輸入以及Prompt生成兩大部分。用戶可以在最初的配置文件中指定任務(wù)目標(biāo)、智能體角色和可使用的工具等。之后AutoGPT會對用戶的輸入進(jìn)行整合與標(biāo)準(zhǔn)化形成Prompt文本,這也是該項(xiàng)目中最具特色的部分。目前階段,大語言模型的回答結(jié)果對Prompt依賴程度依舊較高,很可能使用了某些詞匯或句式可以大幅提升模型表現(xiàn)。因此,智能體的表現(xiàn)好壞與否很大程度上取決于其底層Prompt模板。命令、約束、表現(xiàn)評估和輸出格式的整個(gè)流程是在不斷地推理、行動與反思的循環(huán)中接近最終答案。圖表9:AutoGPT生成Prompt的模板來源:GitHub,AutoGPT,命令ommnds:通俗來說就是允許智能體調(diào)用的工具,包括執(zhí)行代碼、瀏覽網(wǎng)約束onstrants:約束主要給定一些輸入信息上的限制,防止多輪對話后智能體的“記憶”超出大語言模型的輸入上限。通過緩存來處理此前的行動與結(jié)果,為智能體賦予“記憶”的特性,但受限于當(dāng)前大語言模型的輸入文本存在一定上限,智能體必須對記憶進(jìn)行取舍。表現(xiàn)評估Prformncevutons:要求utoPT在每輪回答中對自己給出的回答進(jìn)行反思,持續(xù)判斷思考的方向是否準(zhǔn)確;同時(shí)要求后續(xù)求解步驟要盡可能精簡,以減少資源消耗。輸出格式RsponsectJSON格式輸出內(nèi)容。使用統(tǒng)一化的格式是為了方便后續(xù)調(diào)用命令時(shí)能讀取到具體的參數(shù)傳遞,提升智能體運(yùn)行的穩(wěn)健性。隨后,大腦模塊進(jìn)行新一輪思考并輸出標(biāo)準(zhǔn)化結(jié)果,同時(shí)判斷是否得到最終答案;若未獲得答案,行動模塊將開始解析輸出內(nèi)容并具體執(zhí)行命令;執(zhí)行得到的結(jié)果則進(jìn)入記憶模塊,在下一輪流程開始時(shí)再導(dǎo)入模型。記憶模塊也是項(xiàng)目的一大特點(diǎn),是由大語言模型向智能體邁進(jìn)中不可或缺的功能。記憶性確保了思考的連續(xù),可以將歷史信息一起喂給模型,以便得到更優(yōu)、更全局思考的結(jié)果,同時(shí)也可以避免重復(fù)執(zhí)行而浪費(fèi)計(jì)算資源。不過,這些功能能否按預(yù)期實(shí)現(xiàn)都依賴于大語言模型自身的能力是否足夠。AutoGPT在實(shí)際使用中經(jīng)常會陷入對某幾輪思考的循環(huán)中,這實(shí)際上就是受到了大語言模型輸入Token長度的限制導(dǎo)致智能體難以保留長期記憶;另一個(gè)現(xiàn)實(shí)問題就是成本,多輪思考通常會帶來較高的費(fèi)用。不過這些問題在可預(yù)見的未來內(nèi)都將基本獲得解決。多智能體的交互部署Agent已展現(xiàn)出強(qiáng)大能力,且由于模型應(yīng)用場景的固定化導(dǎo)致其實(shí)現(xiàn)多智能體的互動非常方便,例如擅長下圍棋的智能體之間進(jìn)行對弈等。相比之下,LLM之間基于文本進(jìn)行交流則更容易出現(xiàn)信息的丟失,這天生限制了它們從多輪反饋中學(xué)習(xí)以提高性能的潛力。不過伴隨參數(shù)量的上升,大語言模型展現(xiàn)出強(qiáng)大的文本理解和生成能力,從而大大提高了交互效率。這也是當(dāng)前的發(fā)展趨勢之一。如下圖所示,基于大語言模型的多智能體交互模式可以大致分為:取長補(bǔ)短的合作式交互以及互利共贏的對抗式交互。在合作互動中,智能體以無序或有序的方式進(jìn)行協(xié)作,以實(shí)現(xiàn)共同目標(biāo);在對抗式交互中,智能體以針鋒相對的方式展開競爭,以提高各自的性能。圖表10:多智能體交互模式示例來源:《TheRiseandPotentialofLargeLanguageModelBasedAgents:ASurvey》,具體來說,基于大語言模型的多智能體系統(tǒng)可以提供專業(yè)分工的優(yōu)勢。具備專業(yè)技能和領(lǐng)域知識的單個(gè)智能體可以從事特定的任務(wù)。同時(shí),將復(fù)雜任務(wù)分解為多個(gè)子任務(wù),可以省去在不同流程之間切換的時(shí)間。最終,多個(gè)智能體之間的高效分工可以完成比沒有專業(yè)化分工時(shí)大得多的工作量,從而大大提高整個(gè)系統(tǒng)的效率和產(chǎn)出質(zhì)量。人與智能體的交互部署人類能對LLM-BasedAgent進(jìn)行最有效的指導(dǎo)和監(jiān)督,確保它們符合人類的要求和目標(biāo)。人類的參與可以作為彌補(bǔ)數(shù)據(jù)不足的重要手段,從而促進(jìn)更順利、更安全的協(xié)作過程。因此,智能體不應(yīng)該完全依賴于用預(yù)先標(biāo)注的數(shù)據(jù)集訓(xùn)練出來的模型;相反,它們應(yīng)該通過在線互動和參與來發(fā)展。實(shí)際上,目前我們使用ChatGPT等產(chǎn)品都是在進(jìn)行這樣的交互,這也是最自然的交互形式之一。方法介紹當(dāng)前市場熱點(diǎn)輪動速度不斷加快,而主題投資的核心就在于對主題相關(guān)產(chǎn)業(yè)鏈的快速梳理與分析,以及進(jìn)一步對相關(guān)投資標(biāo)的的迅速定位。因此,產(chǎn)業(yè)鏈研究也是當(dāng)前市場上關(guān)注的熱點(diǎn)之一。如何快速了解一個(gè)完全陌生的產(chǎn)業(yè)或是投資熱點(diǎn),乃至于定位其中的投資標(biāo)的?投資者們迫切需要能實(shí)現(xiàn)以上功能的工具。我們嘗試基于大語言模型來做到這一點(diǎn)。對主動投資者來說,傳統(tǒng)的產(chǎn)業(yè)鏈?zhǔn)崂硎紫刃枰芯繂T對相關(guān)產(chǎn)業(yè)有較深入研究,且為了避免信息滯后需要定期跟蹤與實(shí)地調(diào)研才能掌握最新情況。而使用大語言模型進(jìn)行產(chǎn)業(yè)鏈的梳理可以極大程度縮減反應(yīng)速度,快速給出結(jié)果,盡管梳理結(jié)果的精度方面無法達(dá)到人工的程度,但在模型初步結(jié)果之上再進(jìn)行手動檢查與修正同樣能顯著提升投資的反應(yīng)速度;模型也能基于大數(shù)據(jù)給主觀投資提供增量信息,可能帶來新的投資視角。對量化投資者來說,本身了解新的產(chǎn)業(yè)鏈就存在一定壁壘,也需要大量資料搜集與專業(yè)的溝通之后才能逐步梳理出產(chǎn)業(yè)框架。使用大語言模型來輔助梳理產(chǎn)業(yè)鏈可以簡化工作,減少產(chǎn)業(yè)鏈投資中的各類成本。實(shí)踐結(jié)果顯示,盡管大語言模型具備充分的產(chǎn)業(yè)鏈知識,但無法直接給出完整的產(chǎn)業(yè)鏈結(jié)構(gòu)。梳理產(chǎn)業(yè)鏈?zhǔn)且粋€(gè)相對復(fù)雜的任務(wù),通常人類專家需要在閱讀大量資料、積累豐富的產(chǎn)業(yè)相關(guān)知識后才能實(shí)現(xiàn),并且需要對產(chǎn)業(yè)鏈上每個(gè)產(chǎn)品的供需結(jié)構(gòu)有清晰的認(rèn)識。當(dāng)前的大語言模型當(dāng)然也無法直接實(shí)現(xiàn)整個(gè)產(chǎn)業(yè)鏈結(jié)構(gòu)的推導(dǎo),事實(shí)上,若我們單純詢PT4也可以給出比較完善的回答,但當(dāng)面對較復(fù)雜的產(chǎn)業(yè)或需要給出更多產(chǎn)業(yè)鏈細(xì)節(jié)時(shí),模型就無法處理了。不過從回答中我們可以看出,大語言模型的訓(xùn)練文本中確實(shí)包含了充分的產(chǎn)業(yè)鏈知識,自身是有能力去回答產(chǎn)業(yè)鏈這種專業(yè)問題的。圖表11:大語言模型擁有充足的產(chǎn)業(yè)鏈知識來源:OpenAI,產(chǎn)業(yè)鏈中每一層級之間通過產(chǎn)品進(jìn)行連接,上下游關(guān)系通過產(chǎn)品的供需關(guān)系得以建立。因此,整條產(chǎn)業(yè)鏈可以拆解到對其中每個(gè)產(chǎn)品的上下游分析中去。我們以智能手機(jī)為例,它的“直接組成產(chǎn)品”包括顯示屏、鋰電池、處理器、存儲等,這些也就是手機(jī)的“上游”產(chǎn)品;對其中顯示屏分析其直接組成產(chǎn)品,可以找出液晶面板、觸控模塊、二極管……末端條件:產(chǎn)品本身為原材料、或從整個(gè)產(chǎn)業(yè)鏈來看沒有繼續(xù)拆分必要的產(chǎn)品。比如對鋰電池我們最終會追溯到鎳、鈷等正極原材料,但對顯示屏來說到液晶材料、玻璃基板等就已經(jīng)足夠詳細(xì)了。以上方法需要我們首先給定一個(gè)核心產(chǎn)品,然后向上游或下游對每個(gè)節(jié)點(diǎn)逐步追索,直到觸及末端,最終給出完整的產(chǎn)業(yè)鏈結(jié)構(gòu)。這正是本次研究的核心框架。圖表12:手機(jī)產(chǎn)業(yè)鏈推導(dǎo)示意圖來源:大語言模型自身具備邏輯推理能力以及一定的產(chǎn)業(yè)鏈知識,非常適合用于處理這類非結(jié)構(gòu)化的信息。同時(shí),產(chǎn)業(yè)鏈結(jié)構(gòu)相對穩(wěn)定,因此大語言模型用歷史信息也可以梳理出產(chǎn)業(yè)鏈結(jié)構(gòu)。因此,我們希望構(gòu)造一個(gè)以大語言模型為核心的智能體“產(chǎn)業(yè)鏈Agent”來自動化地完成產(chǎn)業(yè)鏈?zhǔn)崂砣蝿?wù)。產(chǎn)業(yè)鏈?zhǔn)崂碇悄荏w的構(gòu)建智能體的交互核心在于行動模塊,我們首先需要明確“產(chǎn)業(yè)鏈Agent”應(yīng)當(dāng)能夠?qū)崿F(xiàn)哪些功能。除了上文提到的直接組成產(chǎn)品分析和是否觸及末端外,一個(gè)完整的產(chǎn)業(yè)鏈分析結(jié)果還需要能體現(xiàn)各個(gè)產(chǎn)品在其中的重要程度,這同樣是一個(gè)較為復(fù)雜的問題。這里我們簡單以成本占比作為排序標(biāo)準(zhǔn),讓大語言模型根據(jù)其掌握的知識進(jìn)行重要度的判斷。因此我們對框架進(jìn)行細(xì)化,每次向上游分析出原產(chǎn)品的直接組成產(chǎn)品有哪些之后,要進(jìn)一步判斷:1、各組成產(chǎn)品的重要性;2、各組成產(chǎn)品是否為末端產(chǎn)品。類似地,向下游探索時(shí)也需要首先找到對原產(chǎn)品依賴度高的下游產(chǎn)成品或服務(wù),再判斷各自的重要性以及是否末端。以上兩個(gè)任務(wù)我們同樣基于大語言模型來完成。最后的行動模塊中,我們?yōu)楫a(chǎn)業(yè)鏈Agent增添了數(shù)據(jù)寫入以及新聞檢索的工具。數(shù)據(jù)寫入是最為基本的功能,需要實(shí)時(shí)保存對話記錄以及梳理后的產(chǎn)業(yè)鏈信息;新聞檢索則是對模型專業(yè)知識的巨大拓展,我們留到后文進(jìn)行說明。完整的產(chǎn)業(yè)鏈?zhǔn)崂砜蚣苋缦滤荆簣D表13:產(chǎn)業(yè)鏈Agent運(yùn)行流程示意圖來源:其中,調(diào)用大語言模型的部分依舊需要我們維護(hù)一個(gè)完善的Prompt模板,來獲取上下游產(chǎn)品信息以及對應(yīng)的重要性等。我們調(diào)用GPT4模型來進(jìn)行初步實(shí)驗(yàn),得到如下回復(fù):圖表14:大語言模型產(chǎn)業(yè)鏈?zhǔn)崂斫Y(jié)果展示來源:OpenAI,我們可以與上現(xiàn)成的“智能手機(jī)產(chǎn)業(yè)鏈”進(jìn)行對比,發(fā)現(xiàn)產(chǎn)業(yè)鏈Agent梳理出來的產(chǎn)業(yè)鏈結(jié)構(gòu)與結(jié)果基本保持一致;結(jié)果中的PCB等產(chǎn)品位于處理器、內(nèi)存的更上游,也將出現(xiàn)在產(chǎn)業(yè)鏈Agent最終完整的梳理結(jié)果中。我們認(rèn)為產(chǎn)業(yè)鏈Agent具有正確梳理產(chǎn)業(yè)鏈結(jié)果的能力,并能最終導(dǎo)出網(wǎng)狀結(jié)構(gòu)的產(chǎn)業(yè)鏈圖譜。圖表15:智能手機(jī)產(chǎn)業(yè)鏈?zhǔn)崂斫Y(jié)果展示來源:,基于新聞數(shù)據(jù)進(jìn)行產(chǎn)業(yè)鏈知識的拓展針對手機(jī)這樣較為常見的產(chǎn)品,我們在分析產(chǎn)業(yè)時(shí)更想觀察到它在不同時(shí)間節(jié)點(diǎn)上的動態(tài)變化;而對一些相關(guān)信息較少的產(chǎn)品,模型可能掌握的相關(guān)知識較少,無法基于自有知識給出答案。為了解決這些問題,我們給出了基于檢索增強(qiáng)生成(RAG)的解決方案,為產(chǎn)業(yè)鏈Agent配置了新聞檢索的工具就是基于自然語言模型,在外部提供的知識庫或數(shù)據(jù)庫中尋找與所需回答問題相關(guān)性最高的文檔;生成步驟就是將用戶問題與檢索得到的信息結(jié)合后,放入大語言模型生成回復(fù)。Embedding轉(zhuǎn)換成向量格式,以便快速計(jì)算文本相似性,Embedding我們選擇“text2vec-large-chinese”模型。LangchainAgent項(xiàng)目都采用向量數(shù)據(jù)庫來實(shí)現(xiàn)中的檢索步驟,這是一個(gè)高效的相似性搜索和聚類的庫,能夠快速處理大規(guī)模數(shù)據(jù),并在高維空間中進(jìn)行相似性搜索。相似性搜索會計(jì)算我們以智能手機(jī)的顯示屏為例,新聞時(shí)間區(qū)間為2023年3月至10月,篩選出與該產(chǎn)品相關(guān)性最高的新聞文本。以下新聞數(shù)據(jù)均來源于數(shù)庫。圖表16:智能手機(jī)-顯示屏高相關(guān)新聞示例新聞文本 文本距離液晶顯示屏及模組產(chǎn)品可應(yīng)用于智能家居、可視對講產(chǎn)品,各種需要屏控的家電及電器產(chǎn)品(冰箱、洗衣機(jī)、溫控器、智能機(jī)器人、音響設(shè)備等)以及需要屏幕的車載、工控等領(lǐng)域的相關(guān)產(chǎn)品。發(fā)行人根據(jù)產(chǎn)品功能及應(yīng)用領(lǐng)域不同細(xì)分產(chǎn)品類別,與同行業(yè)公司主要產(chǎn)品劃分基本相同,但是由于各家公司細(xì)分業(yè)務(wù)不同,產(chǎn)品分類略有不同。公司現(xiàn)已擁有豐富的顯示芯片產(chǎn)品系列,主要包括面板顯示驅(qū)動芯片、電源管理芯片、LEDLCD、LED、OLEDLED智能手機(jī)、平板電腦、超大屏電視、頭顯設(shè)備……顯示屏正在集成更多功能,衍生出更多形態(tài),應(yīng)用到更多場景。在眾多新型顯示技術(shù)中,牢牢占據(jù)主流地位的LCD和穩(wěn)步上升的OLED處不在的未來世界,唯有創(chuàng)新應(yīng)用,才能在激烈的競爭中充分釋放各自的價(jià)值,撬動更大的市場。作為信息交互的第一觸點(diǎn)和重要端口,新型顯示行業(yè)的重要地位不言而喻,而在人工智能、大數(shù)據(jù)、5G等新興科技的加持下,人類AMOLED調(diào)研時(shí)表示,在智能手機(jī)領(lǐng)域,得益于第6代AMOLEDAMOLED來源:數(shù)庫,
350.30084359.53342368.74445371.05957從新聞文本中我們可以看出,液晶顯示屏、顯示芯片、OLED等與顯示屏相關(guān)度較高的新聞都被篩選了出來,其中包含的市場現(xiàn)狀、專業(yè)知識等將為大語言模型的回答帶來增量信息。將篩選之后的新聞放入Prompt中,并告知大語言模型將自有知識與補(bǔ)充新聞進(jìn)行綜合之后給出回答。疊加新聞數(shù)據(jù)后,使用ChatGPT-3.5模型進(jìn)行產(chǎn)業(yè)鏈?zhǔn)崂硗瑯幽塬@得較高質(zhì)量的回答,ChatGPT3.5進(jìn)行掛載新聞的測試,測試的對象為智能手機(jī)的顯示屏。我們對比一下情況:未疊加新聞數(shù)據(jù)、疊加2023年3月到6月新聞、以及疊加2023年3月到10月新聞的回答結(jié)果。圖表17:智能手機(jī)-顯示屏上游(GPT3.5未疊加新聞)序號產(chǎn)品名稱具體作用成本比例是否末端0液晶面板顯示圖像0.4是1OLED面板顯示圖像0.3是2背光模組提供背光0.15否3觸摸屏實(shí)現(xiàn)觸摸功能0.1否4驅(qū)動IC控制顯示屏驅(qū)動0.05否來源:OpenAI,圖表18:智能手機(jī)-顯示屏上游(GPT3.5+202303-202306新聞)序號產(chǎn)品名稱具體作用成本比例是否末端0液晶顯示屏顯示屏幕0.4是1模組產(chǎn)品整合顯示相關(guān)電路0.3是2面板顯示驅(qū)動芯片控制顯示面板0.15否3電源管理芯片管理顯示屏電源0.1否4LED顯示驅(qū)動芯片控制LED顯示0.05否來源:OpenAI,數(shù)庫,圖表19:智能手機(jī)-顯示屏上游(GPT3.5+202303-202310新聞)序號產(chǎn)品名稱具體作用成本比例是否末端0面板顯示驅(qū)動芯片用于控制顯示屏的工作和功能0.15否1LED顯示驅(qū)動芯片用于控制顯示屏的LED背光0.1否2控制芯片用于控制顯示屏的各項(xiàng)功能和接口0.1否3TFT-LCD顯示面板用于實(shí)現(xiàn)圖像的顯示0.25是4AMOLED半導(dǎo)體顯示面板用于實(shí)現(xiàn)圖像的顯示0.1是來源:OpenAI,數(shù)庫,可以看出,疊加新聞后的產(chǎn)業(yè)鏈Agent能給出更加細(xì)致的答案。例如在疊加新聞之前,它只能大致知道圖像顯示分為液晶面板和OLED面板;疊加全時(shí)間段新聞后,產(chǎn)業(yè)鏈Agent可以清楚知道當(dāng)前主流采用的液晶技術(shù)為TFT-LCD,而自發(fā)光顯示方面目前主流采用AMOLED技術(shù)。同樣我們可以看出伴隨新的新聞數(shù)據(jù)加入數(shù)據(jù)庫后,產(chǎn)業(yè)鏈Agent梳理出來的結(jié)構(gòu)也會出現(xiàn)變化,掛載的新聞數(shù)據(jù)范圍更大,產(chǎn)業(yè)鏈Agent得到的產(chǎn)業(yè)鏈結(jié)構(gòu)也更加具體。當(dāng)然,出現(xiàn)這樣明顯變化的原因可能在于我們提供的新聞數(shù)據(jù)范圍依然較短,這導(dǎo)致梳理出來的產(chǎn)業(yè)鏈結(jié)構(gòu)易于改變,但同時(shí)也證明產(chǎn)業(yè)鏈Agent掛載新聞數(shù)據(jù)之后,可以梳理出隨時(shí)間變化的動態(tài)產(chǎn)業(yè)鏈結(jié)構(gòu)。產(chǎn)業(yè)鏈?zhǔn)崂砑?xì)化——相關(guān)投資標(biāo)的推薦在實(shí)際投資中,投資者們梳理產(chǎn)業(yè)鏈的根本目的是獲取相關(guān)的投資標(biāo)的,這也是我們梳理產(chǎn)業(yè)鏈后進(jìn)一步想實(shí)現(xiàn)的功能。而在掛載新聞數(shù)據(jù)后,這一目標(biāo)同樣可以通過新聞檢索與文本識別來實(shí)現(xiàn)。在底層新聞數(shù)據(jù)中,部分文本本身來源于個(gè)股的公告數(shù)據(jù),或是會在新聞開頭或其他標(biāo)模型尋找出與新聞較為相關(guān)的上市公司信息,在檢索出新聞數(shù)據(jù)的同時(shí)便可查詢到對應(yīng)投資標(biāo)的。我們依舊以“智能手機(jī)-顯示屏”這一產(chǎn)品為例,給出該產(chǎn)品及其完整上游的相關(guān)投資標(biāo)的梳理情況,淡藍(lán)色標(biāo)簽表示產(chǎn)品,深藍(lán)色為投資標(biāo)的及其代碼。需要注意的是,當(dāng)前我們僅使用產(chǎn)業(yè)鏈上的產(chǎn)品信息篩選股票,若需要個(gè)股同時(shí)屬于某產(chǎn)業(yè)概念或有其他篩選條件,則需要在所有新聞文本中重新檢索并提取標(biāo)的信息。圖表20:智能手機(jī)-顯示屏上游投資標(biāo)的推薦案例來源:OpenAI,數(shù)庫,如何針對投資主題梳理其產(chǎn)業(yè)鏈信息?最后,我們在范圍更大的投資主題或投資概念下應(yīng)用產(chǎn)業(yè)鏈?zhǔn)崂矸椒?。多?shù)時(shí)候,投資者更關(guān)注的是整個(gè)投資主題而非其中某個(gè)產(chǎn)品。投資主題形式多樣化,可以是某個(gè)公司、產(chǎn)品、地區(qū),甚至沒有對應(yīng)的實(shí)體而僅僅是一種技術(shù)或概念,例如華為供應(yīng)鏈、AR/VR、新能源汽車等等。我們利用業(yè)務(wù)的聯(lián)接作為切入,來處理相同主題下的不同產(chǎn)業(yè)鏈。此處,我們梳理的投資主題需要具有特定的業(yè)務(wù)作為核心,因此可能無法應(yīng)用于一些聯(lián)系處于業(yè)務(wù)以外的概念,例如“中特估”等。如何確立主題相關(guān)業(yè)務(wù)同樣是較復(fù)雜,傳統(tǒng)的做法是依賴行業(yè)分析師的經(jīng)驗(yàn)來確定哪些業(yè)務(wù)與該主題相關(guān),并進(jìn)一步匹配相關(guān)標(biāo)的。這種方法結(jié)果準(zhǔn)確,但需要消耗大量的精力和時(shí)間,不利于在主題行情啟動時(shí)迅速跟進(jìn)。為此,我們在梳理產(chǎn)業(yè)鏈的基礎(chǔ)上為產(chǎn)業(yè)鏈Agent增加了拆解投資主題的功能。以“華為供應(yīng)鏈”為例,我們給出GPT4的回答結(jié)果:圖表21:投資主題拆解結(jié)果展示來源:OpenAI,從回答中可以看出,大語言模型首先將“華為供應(yīng)鏈”投射到業(yè)務(wù)層面上,找出與概念相關(guān)性較高的數(shù)個(gè)業(yè)務(wù)板塊,再由業(yè)務(wù)去尋找相關(guān)度較高的終端產(chǎn)品或服務(wù)。有了具體的產(chǎn)品,我們可以很方便地調(diào)用產(chǎn)業(yè)鏈Agent來進(jìn)行梳理,最終將各個(gè)產(chǎn)品的產(chǎn)業(yè)鏈進(jìn)行匯總,得到“華為供應(yīng)鏈”概念的上下游信息。投資主題梳理結(jié)果展示我們以“華為供應(yīng)鏈”為例,梳理這一投資主題的上下游結(jié)構(gòu)。前文產(chǎn)業(yè)鏈Agent已總結(jié)出與該投資主題關(guān)聯(lián)最強(qiáng)的三個(gè)產(chǎn)品為:智能手機(jī)、5G基站設(shè)備、云服務(wù)。在此基礎(chǔ)上我們分別梳理各自的產(chǎn)業(yè)鏈信息,并進(jìn)行匯總。我們首先使用GPT4為內(nèi)核的產(chǎn)業(yè)鏈Agent對“華為供應(yīng)鏈”投資主題進(jìn)行梳理。結(jié)果如下:圖表22:“華為供應(yīng)鏈”梳理(GPT4)來源:OpenAI,
5G基站設(shè)備的梳理結(jié)果GPT4的訓(xùn)練5G基站設(shè)備本身專業(yè)程度更高,網(wǎng)絡(luò)相關(guān)討GPT4對這部分的掌握較少。隨后,我們使用GPT3.5作為內(nèi)核,同時(shí)給Agent提供新聞檢索的能力來增強(qiáng)生成結(jié)果。圖表23:“華為供應(yīng)鏈”梳理(GPT3.5+新聞)來源:OpenAI,數(shù)庫,
可以看出,5GGPT4的智能體先將云服務(wù)拆解成硬件、軟件等大類,再做上游劃分,GPT3.5模型在劃分上游時(shí),其分類依據(jù)更加貼近于業(yè)務(wù)或功能,同時(shí)也能給出的節(jié)點(diǎn)產(chǎn)品更加細(xì)節(jié)化。整體來看,疊加新聞數(shù)據(jù)能對智能體的回答效果帶來明顯增益。GPT3.5GPT3.5模型給出節(jié)點(diǎn)信息后,再GPT4投資標(biāo)的梳理結(jié)果展示最后,我們給出產(chǎn)業(yè)鏈Agent檢索得到的個(gè)股推薦結(jié)果。在篩選過程中,我們僅保留每只個(gè)股及其同時(shí)出現(xiàn)次數(shù)最多的產(chǎn)品節(jié)點(diǎn),同時(shí)剔除掉了部分末端節(jié)點(diǎn)對應(yīng)的個(gè)股。最終保留板塊股數(shù)量在72只。圖表24:“華為供應(yīng)鏈”投資標(biāo)的梳理結(jié)果個(gè)股代碼股票簡稱相關(guān)產(chǎn)品節(jié)點(diǎn)產(chǎn)業(yè)鏈個(gè)股代碼股票簡稱相關(guān)產(chǎn)品節(jié)點(diǎn)產(chǎn)業(yè)鏈300603.SZ002179.SZ003021.SZ002184.SZ002194.SZ立昂技術(shù)電源管理功率放大器內(nèi)存射頻濾波器5G5G5G5G5G002384.SZ002463.SZ002916.SZ002938.SZ300456.SZ東山精密PCBPCBPCBPCB半導(dǎo)體硅片智能手機(jī)002138.SZ300134.SZ001255.SZ600760.SH002975.SZ300322.SZ000063.SZ002635.SZ碩貝德射頻天線射頻天線5G5G5G5G5G5G5G5G300691.SZ603773.SH300598.SZ300496.SZ002241.SZ603160.SH688110.SH300183.SZ聯(lián)合光電沃格光電誠邁科技中科創(chuàng)達(dá)歌爾股份匯頂科技東芯股份東軟載波處理器電解液智能手機(jī)智能手機(jī)智能手機(jī)智能手機(jī)智能手機(jī)智能手機(jī)智能手機(jī)智能手機(jī)002792.SZ002881.SZ002229.SZ002261.SZ300379.SZ688171.SH300302.SZ東方通安全防護(hù)安全防護(hù)安全防護(hù)安全防護(hù)儲存設(shè)備5G基站設(shè)備5G基站設(shè)備云服務(wù)云服務(wù)云服務(wù)云服務(wù)云服務(wù)300543.SZ002185.SZ603005.SH300397.SZ688020.SH002158.SZ002456.SZ朗科智能華天科技晶方科技天和防務(wù)方邦股份漢鐘精機(jī)歐菲光電解液隔膜智能手機(jī)智能手機(jī)智能手機(jī)智能手機(jī)智能手機(jī)智能手機(jī)智能手機(jī)000034.SZ301128.SZ600498.SH603912.SH002123.SZ002334.SZ000977.SZ601138.SH佳力圖英威騰冷卻設(shè)備冷卻設(shè)備冷卻設(shè)備冷卻設(shè)備軟件開發(fā)數(shù)據(jù)中心硬件設(shè)備硬件設(shè)備云服務(wù)云服務(wù)云服務(wù)云服務(wù)云服務(wù)云服務(wù)云服務(wù)云服務(wù)000049.SZ300340.SZ300400.SZ688123.S
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度智慧養(yǎng)老民房管理服務(wù)合同4篇
- 二零二五年度門窗五金件國際貿(mào)易與物流服務(wù)合同4篇
- 北極生態(tài)環(huán)境解讀模板
- 鋼結(jié)構(gòu)立柱施工方案
- 2025年度個(gè)人醫(yī)療健康保險(xiǎn)分期繳費(fèi)協(xié)議4篇
- 2025年度個(gè)人職業(yè)規(guī)劃服務(wù)合同范本4篇
- 2024年信息化系統(tǒng)管理制度
- 貴州打水井施工方案
- 二零二五年度門類安裝工程材料供應(yīng)與安裝合同4篇
- 2024水泥欠款利息減免談判合同范本3篇
- 人力資源 -人效評估指導(dǎo)手冊
- 大疆80分鐘在線測評題
- 2024屆廣東省廣州市高三上學(xué)期調(diào)研測試英語試題及答案
- 中煤平朔集團(tuán)有限公司招聘筆試題庫2024
- 2023年成都市青白江區(qū)村(社區(qū))“兩委”后備人才考試真題
- 不付租金解除合同通知書
- 區(qū)域合作伙伴合作協(xié)議書范本
- 中學(xué)數(shù)學(xué)教學(xué)設(shè)計(jì)全套教學(xué)課件
- 環(huán)衛(wèi)公司年終工作總結(jié)
- 2023年德宏隴川縣人民法院招聘聘用制書記員考試真題及答案
- 2024中考復(fù)習(xí)必背初中英語單詞詞匯表(蘇教譯林版)
評論
0/150
提交評論