深度學習如何利用公募持倉網(wǎng)絡(luò)優(yōu)化選股效果_第1頁
深度學習如何利用公募持倉網(wǎng)絡(luò)優(yōu)化選股效果_第2頁
深度學習如何利用公募持倉網(wǎng)絡(luò)優(yōu)化選股效果_第3頁
深度學習如何利用公募持倉網(wǎng)絡(luò)優(yōu)化選股效果_第4頁
深度學習如何利用公募持倉網(wǎng)絡(luò)優(yōu)化選股效果_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

目錄日頻深度學習模型初探 3從CNN到LSTM 3神經(jīng)網(wǎng)絡(luò)股票周頻收益率模型表現(xiàn) 5股票靜態(tài)內(nèi)在屬性及應(yīng)用 7股票內(nèi)在屬性的探究 7基于基金選股網(wǎng)絡(luò)的嵌入層計算 9股票靜態(tài)內(nèi)在屬性的應(yīng)用 10股票內(nèi)在屬性動態(tài)化應(yīng)用 13動態(tài)市場狀態(tài) 13股票內(nèi)在屬性動態(tài)特征的應(yīng)用 14總結(jié)與思考 17風險提示 18插圖目錄 19日頻深度學習模型初探從CNNLSTM深度神經(jīng)網(wǎng)絡(luò)是一種基于多層神經(jīng)元的無監(jiān)督算法,它被廣泛應(yīng)用于計算機視覺、自然語言處理等領(lǐng)域。深度學習的主要神經(jīng)網(wǎng)絡(luò)模型包括:卷積神經(jīng)網(wǎng)絡(luò)(CooonalNeralNeworksNNtNeualNeworkNNgrmmryNework,(GdtUnits,GRUNCNN圖1:CNN結(jié)構(gòu)示意圖 資料來源:Alometal.[1],CNNCNNRNNRNNA圖2:RNN結(jié)構(gòu)示意圖資料來源:Alometal.[1],RNNLSTM可以解決訓練過程中的梯度消失和梯度爆炸問題,簡單來說就是在更長序列中有更好的表現(xiàn)。LSTM可以被簡單理解為是一種神經(jīng)元更加復雜的常比RNN效果好。相較于構(gòu)造簡單的RNN每個神經(jīng)元(Cell(Forgetht-101ct-11(Input:對應(yīng)下圖中t和??用于決定將哪些信息存儲在這個時刻的元胞狀態(tài)t中,以及輸出門(OuttGe圖3:LSTM結(jié)構(gòu)示意圖資料來源:Alometal.[1],神經(jīng)網(wǎng)絡(luò)股票周頻收益率模型表現(xiàn)Nelsonetal[2]嘗試了利用LSTM模型和一系列量價特征預測股票收益并取得了不錯的效果。傳統(tǒng)LSTM模型的最后一層是一個全連接神經(jīng)網(wǎng)絡(luò),來將隱藏層的輸出轉(zhuǎn)為最后的預LSTM(MLP)來作為股票收益預測的模型框架。并且我們嘗試調(diào)整LSTM模型為雙向來提升模型表現(xiàn)。預測股票周度收益率的模型細節(jié)如下:數(shù)據(jù)輸入:2013年至今中證1000成分股個股行情6個量價指標:開盤(A7個指13數(shù)據(jù)窗口及預測對象:用過去80個交易日的量價及資金流數(shù)據(jù)預測五個交易日后的個股超額收益(開盤至開盤。模型結(jié)構(gòu)及細節(jié):LSTM(128128MLP(25664641),每半年對過去825個交易日數(shù)據(jù)進行滾動訓練,訓練集與驗證集8.5:1.5(打亂E。5020R210次,則訓練早停,并取驗證集表現(xiàn)最佳的一次訓練作為最終模型。益率預測模型結(jié)構(gòu)示意圖 資料來源:繪制最近一次模型采用了截至2023年4月1日的中證1000個股行情數(shù)據(jù),模loss和RR圖5:LSTM+MLP模型訓練loss變化 圖6:LSTM+MLP模型訓練R2變化資料來源:wind, 資料來源:wind,DL7年的因子IC0.038,ICIR0.5124.2%IR為2.25。僅用個股日度行情和資金流等指標,已經(jīng)可以初步訓練出具有一定選股能力的因子。圖7:DL因子IC表現(xiàn) 圖8:DL因子多空收益及凈值 資料來源:wind, 資料來源:wind,股票靜態(tài)內(nèi)在屬性及應(yīng)用股票內(nèi)在屬性的探究??傳統(tǒng)的多因子模型認為同一種因子的因子暴露對于所有的股票的影響是一樣LSTM+MLP??圖9:股票A收盤價(元)與某一技術(shù)因子值 圖10:股票B收盤價(元)與某一技術(shù)因子值 資料來源:wind, 資料來源:wind,如何把股票分成不同種類,并發(fā)現(xiàn)影響因子表現(xiàn)的內(nèi)在屬性呢?其實只要給每只股票生成一個嵌入(mbedig,包含足夠的信息即可。什么是嵌入?其本質(zhì)上是利用目標所處的環(huán)境對其進行定義的一種方式,類似找到目標的各種應(yīng)Lietal[3]就曾嘗試利用skip-gram算法計算股票的嵌入特征并應(yīng)用到深度神經(jīng)網(wǎng)絡(luò)中。在目前的股票市場上,基金的選股網(wǎng)絡(luò)Factorization)方法,矩陣分解是協(xié)同過濾算法的改進,分解的示意 資料來源:Corenetal.[4],??矩陣分解在基金選股網(wǎng)絡(luò)中也可以發(fā)揮相同的作用。矩陣分解算法本質(zhì)上通(真實值(預測值??,矩陣中的元素????,??代表基金??對股票??的投資行為,即??和??票j的表示????,這個????包括????和????,即股票??的隱向量和bias。分解的目標函數(shù)為:??min∑

?(??+????+????+??????))2+??‖??‖?? ??,??

??

????其中,??,????是基金??的隱向量和bias,??表示模型中的其他偏差,‖??‖是為了?? ??防止過擬合而引入的模型正則項。下圖示意了當我們?nèi)mbedding特征數(shù)為5時的矩陣分解算法:網(wǎng)絡(luò)的矩陣分解 資料來源:繪制[4]Y.Koren,R.BellandC.Volinsky,"MatrixFactorizationTechniquesforRecommenderSystems,"inComputer,vol.42,no.8,pp.30-37,Aug.2009,doi:10.1109/MC.2009.263.基于基金選股網(wǎng)絡(luò)的嵌入層計算32embeddingbiasMSE,訓640.12022loss64軸)隨訓練輪數(shù)(橫軸)變化 資料來源:wind,從矩陣分解的結(jié)果來看,基于基金選股網(wǎng)絡(luò)的嵌入層可能代表了某種未知的市場風格。我們用k-means算法用訓練得到股票的內(nèi)在屬性進行聚類并分為20類,選擇數(shù)量最少的一類,列出其中涵蓋的所有股票及截至2023年4月1日的所屬行業(yè)及流通市值。圖14:k-means聚類后某類涵蓋的所有股票 股票代碼 股票簡稱中信一級行業(yè)流通市值 股票代碼 股票簡稱 中信一級行業(yè) (億元) 000001.SZ平安銀行銀行2458.7600036.SH招商銀行銀行7068.2000002.SZ萬科A房地產(chǎn)1497.3600309.SH萬華化學基礎(chǔ)化工3008.5000423.SZ東阿阿膠醫(yī)藥345.1600438.SH通威股份電力設(shè)備及新能源1771.1000895.SZ雙匯發(fā)展食品飲料900.0600563.SH法拉電子電子326.8002100.SZ天康生物農(nóng)林牧漁131.4600570.SH恒生電子計算機1093.8002142.SZ寧波銀行銀行1775.7600862.SH中航高科國防軍工311.8002179.SZ中航光電國防軍工850.9600886.SH國投電力能源750.2002291.SZ遙望科技傳媒131.4600887.SH伊利股份傳媒1828.7002352.SZ順豐控股交通運輸2620.6601166.SH興業(yè)銀行銀行3508.8002410.SZ廣聯(lián)達計算機766.2603882.SH金域醫(yī)學醫(yī)藥392.3002475.SZ立訊精密電子2176.8603987.SH康德萊醫(yī)藥68.4002572.SZ索菲亞輕工制造131.3688188.SH柏楚電子計算機279.0002594.SZ比亞迪汽車2980.9688598.SH金博股份基礎(chǔ)化工146.8002841.SZ視源股份消費者服務(wù)363.4688596.SH正帆科技機械84.7300054.SZ鼎龍股份基礎(chǔ)化工189.0688408.SH中信博機械59.9300203.SZ聚光科技能源117.2605111.SH新潔能電子132.7688235.SH百濟神州-U醫(yī)藥145.2600905.SH三峽能源能源747.9資料來源:wind,我們計算這類中個股的平均風格暴露。風格因子取值在-330.48,且大多數(shù)因子取值都0風格暴露與行業(yè)分布 風格因子 因子暴露中信一級行業(yè)個股數(shù)量 中信一級行業(yè) 個股數(shù)量貝塔-0.07醫(yī)藥4汽車1盈利-0.26銀行3電力設(shè)備及新能源1成長0.23基礎(chǔ)化工3消費者服務(wù)1杠桿-0.21計算機3輕工制造1流動性0.23電子3房地產(chǎn)1動量-0.34能源3交通運輸1非線性市值0.06國防軍工2其他行業(yè)0市值0.17食品飲料2價值-0.48機械2波動率0.24農(nóng)林牧漁1資料來源:wind,股票靜態(tài)內(nèi)在屬性的應(yīng)用我們在LSTM模型生成多個因子后,與基金選股網(wǎng)絡(luò)嵌入層拼接后并輸入MLP,以將股票內(nèi)在屬性加入到深度學習中。這樣就能在計算因子權(quán)重時,考慮到股票的內(nèi)在屬性信息。即?????=??????([????,????])。??+5 ??我們從2016年開始,在每年的4月1日與9月1日進行訓練,分別取過去825180內(nèi)在屬性的應(yīng)用 資料來源:繪制202341lossR2R2上升較為單調(diào),在50次訓練后仍未見頂,R2接近0.5,且訓練集與驗證集趨勢一致,效果好于第一節(jié)提到的LSTM+MLP圖17:靜態(tài)內(nèi)在屬性神經(jīng)網(wǎng)絡(luò)模型訓練loss隨訓練輪數(shù)變化圖18:靜態(tài)內(nèi)在屬性神經(jīng)網(wǎng)絡(luò)模型訓練R2隨訓練輪數(shù)變化資料來源:wind, 資料來源:wind,2016-04-08至2023-05-05,采用每周最后一個交易日的因子IC圖19:DL_EM因子IC表現(xiàn) 圖20:DL_EM因子分10組凈值 資料來源:wind, 資料來源:wind,DL_EM1000年平均年化72.9%益主要來源于空頭端。圖21:DL_EM因子分年度表現(xiàn) 資料來源:wind,股票內(nèi)在屬性動態(tài)化應(yīng)用動態(tài)市場狀態(tài)但市場是所以我們需要將股票靜態(tài)的內(nèi)在屬性轉(zhuǎn)為動態(tài)內(nèi)在屬性。??時刻市場的偏好狀態(tài)????,之后利用獲得的市場偏好對股票??內(nèi)在屬性動態(tài)特征????,即:??1??=

??=????∑??(????1>????2>?>????????>?)??

??=1

??

?? ??????=???????? ??這一操作的本質(zhì)目標是刻畫各股票與當下市場偏好股票的相似性。態(tài)市場狀態(tài)的捕捉 資料來源:繪制????若將股票的動態(tài)內(nèi)在屬性動態(tài)特征????本身作為一個因子,并沒有顯著的選股Kr=20????因子表現(xiàn),后續(xù)的研究中,我們繼續(xù)取????Kr=20。圖23:????因子IC表現(xiàn) 圖24:????因子多空收益?? ??資料來源:wind, 資料來源:wind,股票內(nèi)在屬性動態(tài)特征的應(yīng)用??同樣的,我們將上一節(jié)中計算的股票內(nèi)在屬性動態(tài)特征????應(yīng)用到深度學習模型中??? =????,??,??]將????計算5日后拼接原型中其模????+?? ?? ?? ??型細節(jié)與2.3中相同,模型結(jié)構(gòu)如圖:內(nèi)在屬性的應(yīng)用 資料來源:繪制將上述訓練過程訓練得到的因子命名為DL_EM_Dynamic,進行周度回測,1000,2016-04-042023-06-09Ran12.3%,ICIR1.55,分十組凈值的單調(diào)性較強。圖26:DL_EM_Dynamic因子IC表現(xiàn) 圖27:DL_EM_Dynamic因子分10組凈值 資料來源:wind, 資料來源:wind,DL_EM_Dynamic100083.7203.4%,34%3.58。圖28:DL_EM_Dynamic因子分年表現(xiàn) 年份 扣費后多 多頭組合多頭組合 多空收益 扣費后純因子純因子組合純因子組合周度勝率頭收益 超額收益信息比率 組合收益 單邊換手率 信息比率2016年4月起19.1%15.4%2.8287.5%14.9%16.46.0886.8%2017-2.9%19.2%3.17120.0%17.2%21.45.8275.0%2018-36.5%5.7%0.7596.0%8.1%20.62.3260.8%201946.0%18.8%3.42175.9%25.9%21.68.9092.2%202082.3%50.5%6.49253.8%32.7%21.510.2092.2%202190.3%59.5%6.87347.3%41.3%20.511.9586.3%202237.3%74.5%6.34419.3%41.0%18.910.2294.1%2023/6/520.6%11.7%1.5651.3%8.5%9.12.1378.3%平均年化29.0%34.0%3.58203.4%26.2%20.87.4183.7%資料來源:wind,DL_EM_Dynamic1000指數(shù)增強組合5%,行業(yè)主動暴露±0.1,風格暴露±0.5,個股約束3%,單邊換手約束50%,得4.3,超5.5%,表現(xiàn)穩(wěn)定。圖29:DL_EM_Dynamic因子主動增強組合表現(xiàn) 資料來源:wind,7392支股票10%作10.1億左右。圖30:主動增強組合持倉個數(shù) 策略容量估算(億) 資料來源:wind, 資料來源:wind,總結(jié)與思考LSTM+MLP1000衡量因子在不同時期對于股價影響的變化。將這些內(nèi)在屬性與LSTM生成的因子MLP深度學習策略可解釋性相對較弱,今年來策略已經(jīng)出現(xiàn)過一次明顯波動,若風險提示量化模型基于歷史數(shù)據(jù),市場未來可能發(fā)生變化,策略模型有失效可能。插圖目錄圖1:CNN結(jié)構(gòu)示意圖 3圖2:RNN結(jié)構(gòu)示意圖 4圖3:LS

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論