AI前沿跟蹤系列(一):基于人機(jī)互動(dòng)和大預(yù)言模型的因子挖掘平臺(tái)_第1頁(yè)
AI前沿跟蹤系列(一):基于人機(jī)互動(dòng)和大預(yù)言模型的因子挖掘平臺(tái)_第2頁(yè)
AI前沿跟蹤系列(一):基于人機(jī)互動(dòng)和大預(yù)言模型的因子挖掘平臺(tái)_第3頁(yè)
AI前沿跟蹤系列(一):基于人機(jī)互動(dòng)和大預(yù)言模型的因子挖掘平臺(tái)_第4頁(yè)
AI前沿跟蹤系列(一):基于人機(jī)互動(dòng)和大預(yù)言模型的因子挖掘平臺(tái)_第5頁(yè)
已閱讀5頁(yè),還剩14頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分基于人機(jī)互動(dòng)和大預(yù)言模型的因子挖掘平臺(tái)——AI前沿跟蹤系列(一)核心觀點(diǎn)SaizhuoWang、HangYuan等人的論文中提出了一種利用大型語(yǔ)言模型進(jìn)行Alpha因子挖掘的新范式,也為投資機(jī)構(gòu)未來(lái)金融科技、數(shù)據(jù)平臺(tái)、因子系統(tǒng)等平臺(tái)未來(lái)搭建提供了一種思路?,F(xiàn)代金融體系信息傳播、獲取、響應(yīng)大有不同,因子效果持續(xù)性下降,Alpha因子需要?jiǎng)討B(tài)評(píng)估都對(duì)因子挖掘新范式提出了更高的要求。基于LLM的Alpha挖掘范式提出相關(guān)報(bào)告SaizhuoWang和HangYuan等提出了第三種alpha挖掘范式,即增強(qiáng)人工智能交互以提高alpha研究的效果和效率?;谶@種新的范式,構(gòu)建一個(gè)人機(jī)交互式alpha挖掘系統(tǒng)Alpha-GPT。該系統(tǒng)利用大型語(yǔ)言模型作為量化研究人員和alpha搜索之間的中介,具有解釋用戶交易想法、快速總結(jié)優(yōu)秀alpha以及自動(dòng)修改搜索配置等優(yōu)勢(shì)。通過(guò)LLM實(shí)現(xiàn)人機(jī)互動(dòng)增加Alpha挖掘額外知識(shí)AlphaBot是Alpha-GPT的關(guān)鍵層,它通過(guò)四個(gè)功能模塊自動(dòng)將量化研究人員的意圖/思想轉(zhuǎn)化為L(zhǎng)LM查詢的領(lǐng)域特定提示和指令,并將其轉(zhuǎn)化為算法Alpha挖掘?qū)幽芾斫獾呐渲?,增加Alpha挖掘的額外知識(shí)、信息、文獻(xiàn)和數(shù)據(jù),以提高LLM的性能和準(zhǔn)確性。通過(guò)Alpha-GPT生成更加可解釋的因子表達(dá)式通過(guò)Alpha-GPT生成的Alpha表達(dá)式和相應(yīng)的自然語(yǔ)言解釋的示例表明,Alpha-GPT能夠提供適當(dāng)?shù)腁lpha解釋,減輕了人類研究人員自行解釋這些表達(dá)式的負(fù)風(fēng)險(xiǎn)提示本報(bào)告依據(jù)最新前沿論文進(jìn)行解讀評(píng)述,若有理解不當(dāng)請(qǐng)以原始論文表述為準(zhǔn)。且本報(bào)告為AI應(yīng)用方法和框架介紹,并不作為有效投資方法建議,僅供參考。請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分正文目錄 4 43平臺(tái)架構(gòu)與技術(shù)挑戰(zhàn) 63.1AlphaBot層 63.2Alpha挖掘算法層 83.3用于加速Alpha計(jì)算的技術(shù) 9 9 10 11請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分圖1:Alpha挖掘范式演化 4圖2:Alpha-GPT的工作流程 5圖3:Alpha-GPT用戶界面 5圖4:Alpha-GPT系統(tǒng)架構(gòu) 6圖5:Alpha-GPT因子挖掘不同階段回測(cè)曲線 10圖6:Alpha-GPT生成的可解釋Alpha因子示例 10表1:Alpha-GPT樣本外Top-20IC搜索加強(qiáng)前后對(duì)比 9尋找交易alpha旨在尋找一種具有預(yù)測(cè)超額回報(bào)或風(fēng)險(xiǎn)能力的金融信號(hào)或函數(shù)。傳統(tǒng)的alpha挖掘方法有兩種范式:第一種是手動(dòng)建模,通過(guò)將量化研究人員對(duì)金融市場(chǎng)的理念和直覺(jué)轉(zhuǎn)化為公式化的alpha,并通過(guò)回測(cè)實(shí)驗(yàn)證明其有效性和顯著性,從而改進(jìn)alpha的性能;第二種是通過(guò)搜索算法如遺傳編程等尋找alpha,但由于搜索空間巨大,計(jì)算密集度很然而,這兩種方法都存在一些共同的缺點(diǎn),比如難以找到精確簡(jiǎn)明的公式化表達(dá)、理解和解釋大量的alpha以及設(shè)計(jì)和修改算法參數(shù)和搜索配置等。為了解決這些問(wèn)題,(SaizhuoWang和HangYuan等,2023)提出了第三種alpha挖掘范式,即增強(qiáng)人工智能交互以提高alpha研究的效果和效率?;谶@種新的范式,構(gòu)建一個(gè)人機(jī)交互式alpha挖掘系統(tǒng)Alpha-GPT。該系統(tǒng)利用大型語(yǔ)言模型作為量化研究人員和alpha搜索之間的中介,具有解釋用戶交易想法、快速總結(jié)優(yōu)秀alpha以及自動(dòng)修改搜索配置等優(yōu)勢(shì)。2Alpha-GPT用戶接口框架Alpha-GPT的研究人員在論文中介紹了基于大語(yǔ)言模型的人機(jī)互動(dòng)因子挖掘平臺(tái)的用戶接口(UI)。它由三個(gè)主要組件組成:會(huì)話管理器、對(duì)話框和Alpha挖掘儀表板。對(duì)話框:用戶將他們的交易想法和思路輸入到對(duì)話框中。作為回應(yīng),生成的種子alpha、alpha搜索進(jìn)展、alpha挖掘的最終報(bào)告以及生成的alpha的表現(xiàn)都被組織成系統(tǒng)消息,提供全面的反饋。用戶可以分析結(jié)果并為alpha挖掘提供進(jìn)一步的指導(dǎo),這個(gè)對(duì)話會(huì)一直持續(xù)到找到有效的alpha為止。挖掘會(huì)話管理器:Alpha-GPT采用基于會(huì)話的用戶界面,通過(guò)會(huì)話管理器存儲(chǔ)過(guò)去的交互歷史記錄。這些會(huì)話還用于組織用戶生成的數(shù)據(jù),以進(jìn)一步提升系統(tǒng)的性能。Alpha挖掘儀表板:在右半部分,儀表板用于顯示和分析alpha挖掘的結(jié)果。它為用戶提供了會(huì)話的更詳細(xì)描述。實(shí)驗(yàn)監(jiān)控顯示了alpha挖掘?qū)嶒?yàn)的進(jìn)展和當(dāng)前系統(tǒng)負(fù)載,以及會(huì)話過(guò)程中生成的所有歷史alpha。如果選擇了特定的alpha,它的表現(xiàn)將在分析面板上進(jìn)1SaizhuoWang,HangYuan,LInvestment,2023Jul.請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分行繪制和可視化??捎玫睦L圖功能包括遺傳編程的世代間適應(yīng)度曲線,單個(gè)alpha的回測(cè)曲線,以及IC分布和信號(hào)衰減等其他附加分析。此外,Alpha儀表板還包括一鍵存儲(chǔ)和部署功能,可以進(jìn)一步應(yīng)用和下游分析。請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分圖4展示了作者提出的交互式Alpha挖掘范式的系統(tǒng)框架,通過(guò)從Alpha-GPT的架構(gòu)設(shè)計(jì)中提煉和抽象得出,各個(gè)模塊還是充滿細(xì)節(jié)和技術(shù)挑戰(zhàn)。3.1AlphaBot層AlphaBot是Alpha-GPT的關(guān)鍵層,它在人工智能與人類交互中扮演了調(diào)解者的角色。具體而言,該層包括四個(gè)功能模塊:1)知識(shí)編譯器自動(dòng)將量化研究人員的意圖/思想轉(zhuǎn)化為L(zhǎng)LM查詢的領(lǐng)域特定提示和指令;2)LLM為主流大型語(yǔ)言模型(如GPT-4)提供API或本地部署選項(xiàng);3)思想解編器將LLM的自然語(yǔ)言輸出轉(zhuǎn)化為算法Alpha挖掘?qū)幽芾斫獾呐渲茫?)知識(shí)庫(kù)整合了關(guān)于Alpha挖掘的額外知識(shí)、信息、文獻(xiàn)和數(shù)據(jù),以提高LLM的性能和準(zhǔn)確性。在像Alpha挖掘這樣的領(lǐng)域?qū)偃蝿?wù)中,許多用戶請(qǐng)求中會(huì)包含只能在金融領(lǐng)域中找到的術(shù)語(yǔ)。在沒(méi)有進(jìn)一步的上下文的情況下,傳統(tǒng)的LLM無(wú)法理解輸入背后的含義。這就需要知識(shí)編譯器模塊的介入。利用LLM的上下文學(xué)習(xí)能力,該模塊通過(guò)提供額外的上下文和澄清提示中的關(guān)鍵詞來(lái)增強(qiáng)原始用戶請(qǐng)求。例如,“youareaquantresearcherdevelopingformulaicalphas”這樣的具體短語(yǔ)有助于將可能的回答范圍縮小到更適合因子挖掘的答案。請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分由于Alpha表達(dá)式必須以一定的格式才能有效,提示中還有一個(gè)部分列出了表達(dá)式的每個(gè)可能組成部分以及如何利用它的解釋(例如,“high_1D”:股票的最高日內(nèi)價(jià)格)。這個(gè)補(bǔ)充幫助LLM將用戶意圖與可以實(shí)現(xiàn)該目標(biāo)的特定功能相關(guān)聯(lián),并確保輸出結(jié)果有效。由于這些術(shù)語(yǔ)適用于更廣泛的金融領(lǐng)域,提示的這一部分也在思想解編器中用于防止產(chǎn)生幻覺(jué)。這樣的模塊是為了允許用戶以自然語(yǔ)言進(jìn)行請(qǐng)求而不涉及不確定性。對(duì)其預(yù)建的大型語(yǔ)言模型的訪問(wèn)。這些產(chǎn)品按一定數(shù)量的標(biāo)記收取名義金額,并包括GPT、Claude和Bard等。在線請(qǐng)求的一個(gè)優(yōu)點(diǎn)是實(shí)時(shí)響應(yīng)和即時(shí)訪問(wèn)??傊珹lphaBot層是Alpha-GPT中的關(guān)鍵層,起到了人工智能與人類交互的調(diào)解者角色。其中的知識(shí)編譯器模塊用于加強(qiáng)用戶請(qǐng)求的語(yǔ)境理解和提示,而大型語(yǔ)言模型模塊用于提供LLM的API或本地部署選項(xiàng)。API的好處是它提供了易用性,并消除了對(duì)計(jì)算能力的需求。本地部署可以從頭開始開發(fā)LLM,這樣可以更加定制化地控制模型的功能??梢詫?duì)特定數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練,以使其適應(yīng)特定的目的。這包括通過(guò)學(xué)習(xí)相關(guān)文件進(jìn)行領(lǐng)域微調(diào),并通過(guò)人工反饋進(jìn)行強(qiáng)化學(xué)習(xí)。然而,這需要大量的計(jì)算能力來(lái)訓(xùn)練和更新這些模型。在alphamining中,LLM的響應(yīng)與期望的輸出結(jié)構(gòu)之間存在明顯差距。具體來(lái)說(shuō),這些差距可以從以下幾個(gè)方面的挑戰(zhàn)來(lái)總結(jié):將自然語(yǔ)言轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù):需要將LLM的響應(yīng)從自然語(yǔ)言轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)。對(duì)于每個(gè)LLM的響應(yīng)消息,需要從其原始輸出中提取一個(gè)表達(dá)式塊列表。每個(gè)表達(dá)式塊都遵循一定的組織方式,例如其簡(jiǎn)稱、表達(dá)式和一段自然語(yǔ)言描述。令牌大小限制:由于大多數(shù)最先進(jìn)的LLM都采用基于Transformer的架構(gòu)和自注意力機(jī)制,輸入序列長(zhǎng)度(令牌數(shù))的限制通常是一個(gè)非常常見的問(wèn)題。這樣,LLM的輸入和輸出都有長(zhǎng)度的上限。這可能會(huì)導(dǎo)致兩個(gè)問(wèn)題:1)不能將完整的對(duì)話歷史記錄發(fā)送給LLM,因?yàn)樗鼤?huì)超出輸入令牌大小的限制。2)單個(gè)LLM的響應(yīng)大小受限,這意味著每個(gè)消息只能獲取有限數(shù)量的表達(dá)式。為了解決這些問(wèn)題,作者提出了一個(gè)迭代的LLM推理過(guò)程。使用基于正則表達(dá)式的解析器來(lái)解析LLM的輸出。對(duì)于每個(gè)LLM生成的alpha,對(duì)其進(jìn)行語(yǔ)法和語(yǔ)義上的正確性驗(yàn)證。作者采用抽象語(yǔ)法樹解析器進(jìn)行語(yǔ)法檢查,對(duì)于語(yǔ)義正確性,使用模擬數(shù)據(jù)和運(yùn)行時(shí)上下文來(lái)評(píng)估這個(gè)表達(dá)式是否會(huì)拋出任何異常。在實(shí)踐中,正確的alpha比例可能很低(每輪只有10個(gè)alpha中的4個(gè)是正確的這使得alpha生成過(guò)程低效。同時(shí),由于對(duì)話歷史記錄被附加到LLM的輸入中,這些不正確的表達(dá)式也可能影響后續(xù)的生成過(guò)程。因此,采用迭代的修正過(guò)程,提示LLM重新生成不正確的alpha。此外,為了解決令牌大小限制的問(wèn)題,在每一輪中,動(dòng)態(tài)檢查是否超出了令牌大小限制,如果是,則會(huì)對(duì)輸入消息進(jìn)行截?cái)嗪椭匦陆M織,以減少令牌數(shù)。如上所述,在少樣本上下文學(xué)習(xí)中,需要一個(gè)支持有效檢索與交易想法相關(guān)的示例的外部存儲(chǔ)。在Alpha-GPT中,作者設(shè)計(jì)了一個(gè)協(xié)議來(lái)組織來(lái)自多個(gè)來(lái)源的內(nèi)容。這些來(lái)源包括現(xiàn)有的alpha表達(dá)式集合和金融文獻(xiàn)。當(dāng)用戶提出請(qǐng)求時(shí),知識(shí)庫(kù)對(duì)該查詢進(jìn)行編碼,并找到可以作為示例并合并到提示中的類似文檔。請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分3.2Alpha挖掘算法層該層在Alpha-GPT中提供搜索增強(qiáng)功能。具體而言,它通過(guò)接收AlphaBot的搜索命令和配置,利用種子Alpha來(lái)改進(jìn)它們,并將最合適的Alpha推送回AlphaBot。它由四個(gè)模塊組成:算法式Alpha搜索模塊根據(jù)AlphaBot的命令生成Alpha候選項(xiàng),評(píng)估和回測(cè)模塊從這些候選項(xiàng)中選擇合格的Alpha,Alpha選擇模塊根據(jù)特定的預(yù)測(cè)目標(biāo)(例如,對(duì)未來(lái)10天回報(bào)的貢獻(xiàn))進(jìn)一步修剪這些Alpha,最終的Alpha由Alpha部署模塊“一鍵”部署,以確保在線交易期間的實(shí)時(shí)計(jì)算的平滑性和正確性。Alpha搜索增強(qiáng)。目前在行業(yè)中使用最廣泛的Alpha搜索算法是遺傳編程(GP它從一些Alpha種子開始,根據(jù)評(píng)分函數(shù)的適應(yīng)性,通過(guò)隨機(jī)交叉和突變子樹選擇樹形表達(dá)的Alpha候選項(xiàng)。然而,GP目前存在三個(gè)問(wèn)題:1)過(guò)擬合,對(duì)于量化交易來(lái)說(shuō)極其危險(xiǎn)。可以通過(guò)在GP迭代中加入樣本外評(píng)估、減少函數(shù)復(fù)雜度的擬合正則化和迭代的早停等策略來(lái)減輕這個(gè)問(wèn)題。這些方法有助于確保Alpha在訓(xùn)練數(shù)據(jù)之外具有良好的泛化能力,提高其可靠性。2)Alpha多樣性的喪失可能導(dǎo)致投資風(fēng)險(xiǎn)的聚集和累積,并增加回報(bào)的不確定性??梢酝ㄟ^(guò)在GP的迭代過(guò)程中強(qiáng)制執(zhí)行更多的約束來(lái)實(shí)現(xiàn)Alpha多樣性,并有助于發(fā)現(xiàn)對(duì)不斷變化的市場(chǎng)條件具有韌性的穩(wěn)健Alpha因子。3)GP容易生成無(wú)效的Alpha。例如,log(0)和√-5,或者兩個(gè)具有不兼容單位的值的求和(例如,成交量+收盤價(jià))??梢酝ㄟ^(guò)整合數(shù)學(xué)規(guī)則、單位一致性規(guī)則和金融領(lǐng)域特定規(guī)則的規(guī)則庫(kù)來(lái)調(diào)節(jié)Alpha表達(dá)式的生成。評(píng)估和回測(cè)。評(píng)估Alpha最直接的方法是通過(guò)回測(cè)來(lái)揭示Alpha在投資策略中的具體表現(xiàn)。然而,這個(gè)過(guò)程引入了三個(gè)重要的挑戰(zhàn):1)引入未來(lái)信息:回測(cè)時(shí)來(lái)自更遠(yuǎn)時(shí)間點(diǎn)的信息可能對(duì)結(jié)果的準(zhǔn)確性產(chǎn)生災(zāi)難性的影響。為了減輕這個(gè)問(wèn)題,使用時(shí)間戳為每個(gè)輸入數(shù)據(jù)分配一個(gè)時(shí)間標(biāo)簽。這種技術(shù)可以更準(zhǔn)確地復(fù)制市場(chǎng)條件并驗(yàn)證測(cè)試結(jié)果,從而增強(qiáng)Alpha評(píng)估的可靠性。2)交易成本的估計(jì):常規(guī)的粗粒度回測(cè)無(wú)法準(zhǔn)確衡量交易成本,這對(duì)于短期Alpha至關(guān)重要。為了解決這個(gè)問(wèn)題,作者使用更詳細(xì)的數(shù)據(jù)(例如訂單簿級(jí)數(shù)據(jù))進(jìn)行基于模擬的回測(cè),并使用交易匹配規(guī)則模擬交易成本和市場(chǎng)價(jià)格對(duì)Alpha的影響,從而能夠在微觀結(jié)構(gòu)水平上對(duì)Alpha進(jìn)行建模。3)計(jì)算成本:Alpha挖掘所需的計(jì)算能力也是相當(dāng)大的,在計(jì)算加速層中解決了這個(gè)問(wèn)題。Alpha選擇。Alpha選擇模塊通過(guò)以下方式進(jìn)一步進(jìn)行選擇過(guò)程:1)去重和去相關(guān)性:新的Alpha需要與現(xiàn)有的Alpha不同,但是計(jì)算大量Alpha之間的成對(duì)相似性可能是耗時(shí)的。算法如KD-樹、局部敏感哈希(LSH)或近似最近鄰(ANN)可以快速確定每個(gè)潛在Alpha與池中其他Alpha的最大相關(guān)性。2)重要性評(píng)分:雖然一個(gè)Alpha的信息系數(shù)(IC)分?jǐn)?shù)和回測(cè)可能反映了其個(gè)體表現(xiàn),但在實(shí)際情況下,多個(gè)Alpha在投資策略中組合在一起,這些指標(biāo)不能準(zhǔn)確反映它們?cè)诟蠹现械谋憩F(xiàn)。一組IC分?jǐn)?shù)較低的Alpha可能會(huì)優(yōu)于由最高分Alpha組成的子集。因此,重要性評(píng)分技術(shù),如ShapleyAdditiveexplanations(SHAP)和LocalInterpretableModel-agnosticExplanations(LIME可以衡量這種貢獻(xiàn),并全面理解Alpha之間的相互關(guān)系。Alpha部署。在這個(gè)模塊中,需要正確管理三個(gè)關(guān)鍵方面,以確保在線交易期間的平滑和正確的實(shí)時(shí)計(jì)算:1)依賴管理:這涉及維護(hù)和監(jiān)督所有Alpha數(shù)據(jù)之間的依賴關(guān)系,以確保順序計(jì)算和問(wèn)題的可追溯性。2)流-批一體化:實(shí)時(shí)交易和歷史回測(cè)之間的不一致是不可接受的。通過(guò)采用Kappa架構(gòu),可以維護(hù)一個(gè)統(tǒng)一的實(shí)時(shí)處理層,從而以相同的方式處理所有數(shù)據(jù),消除Alpha生成過(guò)程中批處理和流處理之間的不一致性。3)自動(dòng)Alpha請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分驗(yàn)證:這用于驗(yàn)證所有系統(tǒng)維護(hù)的Alpha,監(jiān)控?cái)?shù)據(jù)質(zhì)量并識(shí)別差異。這種持續(xù)驗(yàn)證確保部署的Alpha的可靠性、及時(shí)性和準(zhǔn)確性。包括流算法(StreamingAlgorithms矢量化計(jì)算(VectorizedComputationSIMD和SIMT等并行計(jì)算技術(shù),內(nèi)存優(yōu)化(MemoryOptimization數(shù)據(jù)分區(qū)(DataPartitioning多線程計(jì)算(Multithreading以及利用GPU加速計(jì)算(GPUAcceleration)等方法。這些技術(shù)可大幅提高Alpha計(jì)算的效率,特別適用于處理金融數(shù)據(jù)等大規(guī)模數(shù)據(jù)集的計(jì)算任作者對(duì)Alpha-GPT進(jìn)行了多方面的實(shí)驗(yàn),旨在驗(yàn)證以下研究問(wèn)題:?RQ1:Alpha-GPT能否生成與輸入的交易想法一致的表達(dá)式??RQ2:算法性Alpha挖掘?qū)訉?duì)LLM的種子Alpha的增強(qiáng)效果如何??RQ3:用戶能否有效地與Alpha-GPT進(jìn)行交互指導(dǎo)挖掘過(guò)程??RQ4:Alpha-GPT能否成功解釋Alpha表達(dá)式背后的交易想法?實(shí)驗(yàn)設(shè)置包括:數(shù)據(jù)和運(yùn)算符:使用股票市場(chǎng)的日間成交量-價(jià)格數(shù)據(jù),包括基本的K線圖數(shù)據(jù)(開盤價(jià)、最高價(jià)、最低價(jià)、收盤價(jià))、加權(quán)平均價(jià)格(VWAP)和行業(yè)數(shù)據(jù)。還包括19個(gè)基本運(yùn)算符,包括時(shí)間序列運(yùn)算、橫截面運(yùn)算、分組運(yùn)算和基本元素運(yùn)算。知識(shí)庫(kù):對(duì)于每個(gè)Alpha,首先將其分解成子表達(dá)式并解釋它們。然后解釋這些子表達(dá)式的組合形成整個(gè)交易想法。文檔嵌入通過(guò)Faiss進(jìn)行索引。需要注意的是,僅在生成與交易想法相吻合的Alpha表達(dá)式時(shí)使用外部存儲(chǔ)器。LLM和適配器:為了進(jìn)行自然語(yǔ)言交互,使用OpenAI的聊天完成API,基于“gpt-3.5-turbo-16k-0613”模型基礎(chǔ)。對(duì)于知識(shí)檢索中使用的嵌入模型,使用OpenAI的“text-ada-embedding-002”API,嵌入維度為1536。LLM一次生成一批Alpha,并將被要求糾正具有語(yǔ)法或語(yǔ)義錯(cuò)誤的Alpha。Alpha搜索和評(píng)估:通過(guò)遺傳規(guī)劃模型搜索Alpha,其中適應(yīng)度評(píng)分由信息系數(shù)(IC)定義。評(píng)估這些Alpha在樣本外的指標(biāo)(如IC、年回報(bào)率、夏普比率等)上的表MomentumFlowofFundsAftersearch請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分實(shí)驗(yàn)結(jié)果包括:想法-公式一致性:Alpha-GPT能夠生成與用戶給定的交易想法一致的公式Alpha。通過(guò)示例展示了基于給定交易想法生成的Alpha表達(dá)式,并展示了它們與K線圖中的模式的對(duì)應(yīng)關(guān)系,驗(yàn)證了生成的Alpha正確捕捉了交易想法。搜索增強(qiáng):通過(guò)算法性Alpha挖掘?qū)拥乃阉髟鰪?qiáng),顯著提高了Alpha-GPT的表現(xiàn)。通過(guò)對(duì)7個(gè)不同的交易想法進(jìn)行搜索增強(qiáng)前后的Alpha樣本外IC進(jìn)行比較,可以看出搜索增強(qiáng)對(duì)Alpha-GPT的性能提升非常重要。人工智能交互:通過(guò)人工智能交互生成的Alpha的回測(cè)曲線顯示在圖中?;販y(cè)是在2012年至2021年的美國(guó)股票數(shù)據(jù)上進(jìn)行的。經(jīng)過(guò)幾輪搜索增強(qiáng)和用戶交互后,生成的Alpha的回測(cè)表現(xiàn)顯著提高。Alpha解釋:通過(guò)Alpha-GPT生成的Alpha表達(dá)式和相應(yīng)的自然語(yǔ)言解釋的示例表明,Alpha-GPT能夠提供適當(dāng)?shù)腁lpha解釋,減輕了人類研究人員自行解釋這些表達(dá)式的研究所整理研究所整理在SaizhuoWang、HangYuan等人的論文中提出了一種利用大型語(yǔ)言模型進(jìn)行Alpha因子挖掘的新范式,也為投資機(jī)構(gòu)未來(lái)金融科技、數(shù)據(jù)平臺(tái)、因子系統(tǒng)等平臺(tái)未來(lái)搭建提供了一種思路。這一點(diǎn)我們認(rèn)為可能為機(jī)構(gòu)量化投資平臺(tái)的演進(jìn)打開一片新天地,主要基于以下幾點(diǎn)我們認(rèn)為量化因子平臺(tái)新范式重構(gòu)的必要性越來(lái)越強(qiáng)。信息獲取傳播響應(yīng)的需要。互聯(lián)網(wǎng)時(shí)代的今天,信息傳播速度,市場(chǎng)響應(yīng)節(jié)奏都遠(yuǎn)遠(yuǎn)快于過(guò)去。及時(shí)可靠的因子分析平臺(tái)的重構(gòu)迫在眉睫。低頻因子似乎并不需要一個(gè)快捷的平臺(tái),然后輿情系統(tǒng)、實(shí)時(shí)價(jià)量分析都給量化平臺(tái)提出了新要求。因子穩(wěn)定性下降。越來(lái)越多的投資者運(yùn)用各種非線性技術(shù)進(jìn)行盈利模式挖掘。比如利用深度學(xué)習(xí)、GP模型等合成因子或生成因子表達(dá)式。然而,非線性模型最大的缺點(diǎn)在于穩(wěn)定性較差。同樣架構(gòu)的模型,可能在同一時(shí)點(diǎn)由于訓(xùn)練后參數(shù)的差異得到完全相反的研判請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分觀點(diǎn)。而這種對(duì)立模式的博弈,往往使得市場(chǎng)容易在原本可能形成一致邏輯的點(diǎn)上形成短暫的矛盾,導(dǎo)致過(guò)去可能持續(xù)性更好的因子,有效性衰減較快。Alpha因子需動(dòng)態(tài)認(rèn)識(shí)。因子穩(wěn)定性下降,使得獲取長(zhǎng)期穩(wěn)定Alpha的因子難度提升。動(dòng)態(tài)地捕捉當(dāng)前最為有效的Alpha因子成為當(dāng)下因子量化投資的重要課題。很多機(jī)構(gòu)選擇周度、月度、季度地重新評(píng)價(jià)其因子庫(kù)中各個(gè)因子的有效性和收益貢獻(xiàn),然而金融市場(chǎng)的動(dòng)態(tài)性決定了因子有效性的動(dòng)態(tài)變化,并沒(méi)有穩(wěn)定的周期性規(guī)律,因子動(dòng)量的持續(xù)性也難以測(cè)度。量化投資者更多是在“后驗(yàn)信息”的基礎(chǔ)上,不斷地更新和調(diào)整對(duì)于因子庫(kù)中因子有效性的跟蹤觀測(cè)。Alpha-GPT就提供了一種動(dòng)態(tài)形成因子跟蹤的范式。當(dāng)然,投資者也可使用類似BeyesianEstimation、ReinforcementLearning等方法對(duì)因子盈利模型進(jìn)行動(dòng)態(tài)評(píng)價(jià)?!畢⒖嘉墨I(xiàn)[1]SaizhuoWang,HangYuan,LeonZhou,LionelM.Ni,Heung-YeungShum,JianGuo,Alpha-GPT:Human-AIInteractiveAlphaMiningforQuantitativeInvestment,2023Jul.請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分股票投資評(píng)級(jí)說(shuō)明以報(bào)告日后的6個(gè)月內(nèi),證券相對(duì)于滬深300指數(shù)的漲跌幅為標(biāo)準(zhǔn),定義如下:1.買入:相對(duì)于滬深300指數(shù)表現(xiàn)+20%以上;2.增持:相對(duì)于滬深300指數(shù)表現(xiàn)+1020%;3.中性:相對(duì)于滬深300指數(shù)表現(xiàn)-1010%之間波動(dòng);4.減持:相對(duì)于滬深300指數(shù)表現(xiàn)-10%以下。行業(yè)的投資評(píng)級(jí):以報(bào)告日后的6個(gè)月內(nèi),行業(yè)指數(shù)相對(duì)于滬深300指數(shù)的漲跌幅為標(biāo)準(zhǔn),定義如下:1.看好:行業(yè)指數(shù)相對(duì)于滬深300指數(shù)表現(xiàn)+10%以上;2.中性:行業(yè)指

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論