




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
[13]。(二)CNN卷積神經(jīng)網(wǎng)絡與LSTM循環(huán)神經(jīng)網(wǎng)絡CNN卷積神經(jīng)網(wǎng)絡是一種前饋神經(jīng)網(wǎng)絡,整個網(wǎng)絡中包括卷積層、線性整流層、池化層和全連接層,該種網(wǎng)絡從原始數(shù)據(jù)中通過卷積層和池化層交替獲取有效表征,從而提取數(shù)據(jù)的局部特征,并建立稠密、完備的特征向量(楊家瑤,王雪,2020)。卷積層中,卷積核(即圖2-1中的kernal)在輸入圖像上按步幅滑動,每次滑動后進行乘積求和運算,并將運算結果輸出,在這種局面下考量對于同一張?zhí)卣鲌D而言,卷積核是固定不變的。圖21卷積過程圖示線性整流層可以增強神經(jīng)網(wǎng)絡的非線性特征,該層使用線性整流函數(shù)fx=max池化層中,輸入圖像被分為若干矩形區(qū)域,通過不同的池化函數(shù)對每個子區(qū)域進行處理,輸出每個區(qū)域經(jīng)過池化函數(shù)處理后的值組成新的圖像。這種降采樣處理方式會不斷降低圖像數(shù)據(jù)的大小,從這些信息可以看出提取圖像中的重要特征而忽略邊緣特征,減少模型參數(shù)量從而抑制過擬合,例如圖2-2所示的最大池化,每個子矩形中的最大值被輸出并組成新的圖像,其他值被忽略(趙雨琪,劉健宇,2022)。圖22最大池化示例LSTM循環(huán)神經(jīng)網(wǎng)絡是解決梯度消失問題的良好方案,它可以保留通過時間和層反向傳播的誤差,從這些數(shù)據(jù)可以明顯看出從而在循環(huán)時間網(wǎng)絡的訓練過程中創(chuàng)建遠程鏈接因果的通道,對有價值的信息進行長期記憶(張璇子,王雪寧,2023)。其網(wǎng)絡基本單元如圖2-3所示:遺忘門神經(jīng)元控制前一步記憶單元中的信息有多大程度上被遺忘,輸入門神經(jīng)元控制當前記憶中的信息以多大程度更新到記憶單元中,輸出門神經(jīng)元控制當前的輸出有多大程度取決于當前的長時記憶單元(周瑞文,李一凡,2020)。圖23LSTM基本單元結構示意圖神經(jīng)網(wǎng)絡模型構建(一)實驗設置本文使用Google公司的colab云服務器作為硬件平臺,使用Keras和Tensorflow作為深度學習框架,以此為前提數(shù)據(jù)從本地上傳至云服務器后,在colab提供的環(huán)境中運行代碼并進行模型訓練(馮凡,陳思琪,2021)。本文將構建兩個神經(jīng)網(wǎng)絡模型,以板塊漲跌幅排名數(shù)據(jù)為標簽的LSTM神經(jīng)網(wǎng)絡(MODEL1)和以板塊漲跌幅排名數(shù)據(jù)為標簽的CNN-LSTM網(wǎng)絡混合模型(MODEL2),并通過控制變量法分別對MODEL1和MODEL2的超參數(shù)進行實驗,探尋最優(yōu)的隱藏單元數(shù)和模型深度,最后將以最優(yōu)參數(shù)進行訓練的MODEL1和MODEL2的測試結果按交叉熵損失和預測準確率兩個指標進行比較(黃欣怡,李俊杰,2022)。在優(yōu)化設計的過程中,特別關注了成本效益和方案的廣泛適用性,因此與初始版本相比,在多個維度上進行了改良。首先,通過去除冗余步驟、選用更經(jīng)濟有效的策略,顯著降低了執(zhí)行費用,使方案更為實惠。此外,為了提升其普及潛力,設計方案時充分考量了各地不同環(huán)境的需求,確保該方案在各種情況下都能平穩(wěn)運作,并且方便他人借鑒實施。(二)數(shù)據(jù)預處理首先要選定合適的觀測數(shù)據(jù),板塊輪動可以簡化為為不同時期內漲幅最高板塊的變化,因此選用不同維度的觀測數(shù)據(jù)會對模型造成較大影響。本文選用申萬宏源一級行業(yè)分類作為區(qū)分不同行業(yè)(板塊)的標準,截止目前共有31個一級行業(yè),以此為前提其中包括2014年2月21日新添加的板塊國防軍工、機械設備、汽車、非銀金融、銀行、通信、傳媒、計算機、電力設備、建筑裝飾、建筑材料,以及2021年12月13日新添加板塊美容護理、環(huán)保、石油石化、煤炭(趙瑞彤,周雪怡,2023)。因為神經(jīng)網(wǎng)絡的訓練數(shù)據(jù)維度必須保持一致,并且長期空缺值無法通過數(shù)據(jù)處理進行彌補,所以暫時只考慮兩個數(shù)據(jù)集:一是一直以來均存在的16個板塊,二是2014年2月21日以來均存在的27個板塊。對于神經(jīng)網(wǎng)絡模型而言,在此情境之下后者數(shù)據(jù)量過小,而板塊數(shù)量又過多,因此訓練所得模型效果不佳(鄧欣妍,劉雅婷,2020)。因此最終本文選用2000年1月1日至2022年2月7日16個板塊的技術面和部分基本面信息作為數(shù)據(jù)集(2000年以前數(shù)據(jù)缺失值較多,不予考慮)。圖3SEQ圖\*ARABIC\s11每日各板塊技術面與基本面數(shù)據(jù)結構概覽上圖為部分板塊的技術面數(shù)據(jù)和基本面數(shù)據(jù)(因數(shù)據(jù)過多僅以前三個板塊為例進行展示)。其中sum_increase_days_label列代表過去days天內標簽為label的板塊累計漲跌幅,no_1_sector列代表過去days天內漲幅最高板塊的標簽,標簽與板塊對應關系如表3-1所示。在這一狀況里該圖所示數(shù)據(jù)經(jīng)過標準化處理后即為模型所用數(shù)據(jù)(張?zhí)煊?王雯欣,2021)。表3SEQ表\*ARABIC\s11各板塊與對應標簽農林牧漁基礎化工鋼鐵有色金屬電子家用電器食品飲料紡織服裝標簽01234567輕工制造醫(yī)藥生物公用事業(yè)交通運輸房地產商貿零售社會服務綜合標簽89101112131415將數(shù)據(jù)集按時間劃分為訓練集、驗證集和測試集,比例為8:1:1。也就是2000年1月1日-2020年2月7日的前80%數(shù)據(jù)(截至2017年9月)作為訓練集,中間10%的數(shù)據(jù)作為驗證集,最后10%的數(shù)據(jù)作為測試集。將模型劃分為訓練集、驗證集、測試集有如下原因(李雅琳,楊智博,2022):首先,可以迅速判斷模型是否出現(xiàn)過擬合。一般而言,我們用訓練集數(shù)據(jù)訓練模型并同時在驗證集上測試模型的效果。此文采用了先前的設計理念來構建計算框架,并進行了適當?shù)暮喕?,旨在增強其實用價值和操作簡便性。通過詳細分析與評估現(xiàn)有方法,識別并去除了冗余復雜的步驟,優(yōu)化了流程,從而形成了一種簡潔高效的計算模型。這樣做不僅減少了資源消耗,還縮短了處理周期,同時維持了原有性能,便于執(zhí)行和普及,加入了多樣的驗證和質量控制機制。如果模型在訓練集上表現(xiàn)優(yōu)異(loss值低或者準確率高)但在驗證集上模型效果不佳,則模型可能參數(shù)或訓練輪次過多而出現(xiàn)了過擬合,在這種情況框架下導致模型泛化能力下降,可以據(jù)此調整模型的層數(shù)、單層模型神經(jīng)元個數(shù)或者訓練組數(shù)(趙晨曦,陳怡琳,2023)。其次,測試集的留用可以有效評估模型的泛化能力即實際效果,由于這一數(shù)據(jù)集在模型訓練和超參數(shù)的調整過程中并未使用,因此可以有效的評估模型實際的預測能力。(三)以板塊漲跌幅排名數(shù)據(jù)為標簽的LSTM神經(jīng)網(wǎng)絡(MODEL1)漲跌幅排名數(shù)據(jù)即以圖1中no_1_sector(分類數(shù)據(jù))為目標輸出Y,以各板塊成交量、漲跌幅、換手率、市盈率等作為輸入X的數(shù)據(jù)集。構建的LSTM循環(huán)神經(jīng)網(wǎng)絡模型MODEL1結構如圖2-2所示(黃一,李若馨,2020)。圖32MODEL1結構示意圖本模型采用控制變量的方式逐步尋找最優(yōu)參數(shù),通過改變LSTM循環(huán)神經(jīng)網(wǎng)絡的層數(shù)或每層網(wǎng)絡中隱藏單元數(shù)來探究增加模型深度或增加模型變量對提升板塊輪動預測效果的作用(鄧梓昕,周建宏,2021)。在這種局面下考量試驗結果如表2-2所示,可以看出當循環(huán)神經(jīng)網(wǎng)絡層數(shù)為1時,因應這情況的發(fā)展隨著逐步增加LSTM循環(huán)神經(jīng)網(wǎng)絡的隱藏單元數(shù),模型趨于收斂后的的交叉熵損失有所下降,但模型的預測準確率先升后降,隱藏單元數(shù)取值為64時準確率達到最高值16.5%(張志濤,王怡然,2022)。而增加循環(huán)神經(jīng)網(wǎng)絡的層數(shù)在沒有顯著降低交叉熵損失的情況下,從這些信息可以看出準確率也不及單層模型,因此MODEL1選用第二組參數(shù),即一層LSTM神經(jīng)網(wǎng)絡,包含64個隱藏單元。表3SEQ表\*ARABIC\s12MODEL1模型結構組合試驗結果LSTM循環(huán)神經(jīng)網(wǎng)絡層數(shù)訓練輪數(shù)隱藏單元數(shù)交叉熵損失準確率120322.95040.1100120642.76760.16501 201283.64820.125022032/322.77670.105022064/322.77280.1225(四)以板塊漲跌幅排名數(shù)據(jù)為標簽的CNN-LSTM網(wǎng)絡混合模型(MODEL2)MODEL2使用CNN來提取數(shù)據(jù)特征,從這些數(shù)據(jù)可以明顯看出并以CNN的輸出為LSTM的輸入,結構如圖3-3所示(趙婷怡,劉文潔,2023)。圖33MODEL2結構示意圖與MODEL1試驗參數(shù)的過程相同,該模型也采用控制變量的方式逐步尋找最優(yōu)參數(shù),試驗結果如表2-3所示。當循環(huán)神經(jīng)網(wǎng)絡層數(shù)為1時,逐步增加LSTM循環(huán)神經(jīng)網(wǎng)絡的隱藏單元數(shù),以此為前提模型趨于收斂后的的交叉熵損失與預測準確率先降后升,圍繞這種局面展開隱藏單元數(shù)取值為64時準確率達到最高值18.25%。而增加循環(huán)神經(jīng)網(wǎng)絡的層數(shù)顯著提高了交叉熵損失,準確率也不及單層模型,因此MODEL2選用第二組參數(shù),即一層LSTM神經(jīng)網(wǎng)絡,包含64個隱藏單元(馮雅莉,陳天,2020)。表3SEQ表\*ARABIC\s13MODEL2模型結構組合試驗結果LSTM循環(huán)神經(jīng)網(wǎng)絡層數(shù)訓練輪數(shù)隱藏單元數(shù)交叉熵損失準確率120322.76780.1550120642.6921077660.155022032/322.85520.140022064/322.95930.1500通過上述控制變量法得到最優(yōu)CNN-LSTM模型后,分別對LSTM循環(huán)神經(jīng)網(wǎng)絡模型與CNN-LSTM網(wǎng)絡混合模型進行測試。由于樣本量較少,本文以驗證集和測試集總體作為測試樣本(后20%),在此情境之下即對2017年9月至2022年2月漲幅排名第一的板塊進行滾動預測,通過計算交叉熵損失和預測準確率作為評判標準。結果顯示MODEL2的交叉熵損失和預測準確率均高于MODEL1。表3SEQ表\*ARABIC\s14模型效果比較模型LSTM循環(huán)神經(jīng)網(wǎng)絡CNN-LSTM網(wǎng)絡混合模型交叉熵損失2.83052.7221準確率15.85%18.00%三、結論與展望(一)結論本文在A股板塊輪動現(xiàn)象顯著的前提下,采用申萬宏源一級行業(yè)分類數(shù)據(jù)進行處理與清洗得到板塊漲跌幅排名數(shù)據(jù)集,并以此構建了以基本面和技術面數(shù)據(jù)為輸入X,漲跌幅排名數(shù)據(jù)為輸出Y的LSTM循環(huán)神經(jīng)網(wǎng)絡和CNN-LSTM網(wǎng)絡混合模型,得出結論(李瑞婷,張玉婷,2021):CNN-LSTM網(wǎng)絡混合模型相比于LSTM循環(huán)神經(jīng)網(wǎng)絡模型能夠更有效地預測下一時段內漲幅排名第一的板塊。該混合模型有如下優(yōu)勢:首先,在這種情況框架下將大量技術面與基本面數(shù)據(jù)構造特征圖作為輸入,先使用CNN提取特征圖中潛在關系信息形成特征向量,能夠從數(shù)據(jù)中簡化、挖掘出更多有效信息;其次,將CNN網(wǎng)絡輸出的向量以時序序列輸入給LSTM循環(huán)神經(jīng)網(wǎng)絡,LSTM網(wǎng)絡模型能夠較好地提取數(shù)據(jù)中的時序信息和非線性關系。本文介紹的數(shù)據(jù)處理方法相較于以往的技術顯得更為簡便且效果更佳。采用了一種直接了當?shù)念A處理步驟,該步驟避免了冗余的操作,優(yōu)化了數(shù)據(jù)清理和標準化過程,從而顯著提升了信息處理效率。這不僅加快了分析資料集的準備速度,還減少了復雜操作可能帶來的錯誤。此外,經(jīng)過對各種來源與類型的數(shù)據(jù)進行測試,證明了此方法的可靠性和穩(wěn)定性。在這種局面下考量目前國內學界對中國板塊輪動現(xiàn)象欠缺量化方向研究,聚焦于板塊輪動現(xiàn)象的解釋與識別,且其研究僅限于輪動現(xiàn)象突出的幾個主要板塊,分析主要依賴于定性的手段(周佳怡,王澤宇,2022)。而本文利用2000年以來的板塊技術面和基本面數(shù)據(jù)全時段地構建了混合神經(jīng)網(wǎng)絡模型,有效彌補了這一領域的空白。(二)不足與展望首先,雖然本文構建的CNN-LSTM網(wǎng)絡混合模型相比LSTM循環(huán)神經(jīng)網(wǎng)絡在預測板塊輪動的數(shù)據(jù)集上表現(xiàn)更加優(yōu)異,但模型整體的預測準確率仍然不夠高,可能不足以應用到實際交易當中(黃芝和,李俊宇,2023)。其次,因應這情況的發(fā)展本文所構建的模型僅針對板塊的漲幅排名進行了預測,但在缺乏相關板塊etf的情況下一次性購入整個板塊的操作不可行,因此該類策略還需輔助板塊內的選股策略配合使用。第三,市場上的板塊輪動時長可能不一,可能小到小時級別也可能長達數(shù)周,但本文模型僅能使用固定的時長參數(shù)來進行預測,且數(shù)據(jù)集的最小尺度也是日級別的,因此僅能識別板塊輪動中的一小部分(鄧晨希,張怡君,2020)。針對以上提出的幾點不足,可以引申出未來進一步研究的方向:首先,挖掘包含更多信息的數(shù)據(jù)集。從這些信息可以看出神經(jīng)網(wǎng)絡模型的上限由數(shù)據(jù)決定,本文數(shù)據(jù)集所包含的基本面信息和宏觀經(jīng)濟信息仍舊較少且采樣頻率過低,可能網(wǎng)絡難以學習到相關的板塊輪動規(guī)律。其次,進一步構建輔助的選股策略,例如多因子選股策略與板塊輪動策略配合,形成可以實施的完整策略,針對不同板塊的不同基本面選擇不同的因子。參考文獻張逸凡,周紫晴.中國股市“板塊現(xiàn)象”分析[J].經(jīng)濟研究,2022(12):82-87.潘奕凡,朱可欣.我國證券市場的板塊聯(lián)動效應及模糊聚類分析[J].商業(yè)研究,2023(22):41-45魏琪琳,邵宇翔.中國證券市場價格沖擊傳導效應分析[J].管理世界,2021(10):24-33.DOI:10.19744/ki.11-1235/f.2005.10.003.李高,張蕓.中國股市“板塊聯(lián)動”現(xiàn)象分析[J].時代金融,2021(10):31-32.王晨曦,周瑤瑤.中國股市行業(yè)輪動策略的實證分析[J].中國證券期貨,2013,(01):16.趙心怡,李宇昕.狀態(tài)轉移框架下跨地區(qū)、跨行業(yè)資產配置模型及實證[J].運籌與管理,2018,27(03):150-158.劉瑞琳,陳云霞.深度學習的金融實證應用:動態(tài)、貢獻與展望[J].金融研究,2017(05):111-126.周杰倫,楊星雨.基于深度學習LSTM神經(jīng)網(wǎng)絡的全球股票指數(shù)預測研究[J].統(tǒng)計研究,2019,36(03):65-77.DOI:10.19343/ki.11-1302/c.2019.03.006.張靜怡,趙天宇.中國股市板塊輪動:特征、影響因素與趨勢[J].浙江金融,2007(08):42+41.陳瑤瑤,王彥君.股市行業(yè)板塊輪動效應與宏觀經(jīng)濟驅動的研究[J].特區(qū)經(jīng)濟,2020,(05):130-132.李雨軒,鄧曉璇.中國A股市場行業(yè)輪動現(xiàn)象研究[J].南方金融,2017,(02):40-48.趙心瑜,王凱文.基于關聯(lián)規(guī)則的中國股票市場行業(yè)輪動現(xiàn)象研究[J].北京郵電大學學報(社會科學版),2016,18(01):66-71.周依娜,劉天宇.中國A股市場的行業(yè)輪動現(xiàn)象分析——基于動量和反轉交易策略的檢驗[J].金融理論與實踐,2014(09):111-114.楊思琪,陳澤宇.股市量化投資策略與實證檢驗[J].統(tǒng)計與決策,2016(06):145-149.DOI:10.13546/ki.t陳瑤瑤,王彥君c.2016.06.038.趙曉菲,張軒瑞.USsectorrotationwithfive-factorFama–Frenchalphas[J].JournalofAssetManagement,2018,19(2):116-132.AHybridEvolutionaryDynamicNeuralNetworkForStockMarketTrendAnalysisAndPredictionUsingUnscentedKalmanFilter[J].RanjeetaBisoi,P.K.Dash.AppliedSoftComputingJournal.2014ABayesianregularizedartificialneuralnetworkforstockmarketforecasting[J].JonathanL.Ticknor.Expert周詩,李高峰temsWithApplications.2013(14)李建華,王梓馨Usingartificialneuralnetworkmodelsinstockmarketindexprediction[J].ErkamGuresen,GulgunK張逸凡,周紫晴kutlu,TugrulU.Daim.Expert周詩,李高峰tems
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 地暖太陽能工程施工方案
- 管道跨越施工方案
- 醫(yī)療機構水污染物排放的法律責任與監(jiān)管措施
- 【專精特新】印制電路板行業(yè)市場份額證明材料(智研咨詢發(fā)布)
- 食品加工企業(yè)食品安全事件應急預案
- 基于大觀念的高中英語單元整體教學設計探究
- 湖北省2024-2025學年高二上學期1月期末物理試題(原卷版)
- 四川羅渡中學20172018人教地理必修二綜合訓練(四)及解析
- 北京市房山區(qū)2024-2025學年高三上學期期末學業(yè)水平調研(二)物理試卷2
- 安徽省亳州市2024-2025學年高二上學期期末考試地理試卷
- 醫(yī)院考勤制度實施細則
- 肺結節(jié)診治中國專家共識(2024年版)解讀
- TSDDP 8-2024 新型無機磨石施工質量與驗收規(guī)范
- MES系統(tǒng)實施管理辦法
- 2024年新課標高考化學真題試題(原卷版+含解析)
- 《七色花》整本書閱讀導讀活動 教學設計-2023-2024學年語文二年級下冊統(tǒng)編版
- DL-T5153-2014火力發(fā)電廠廠用電設計技術規(guī)程
- 冀人版科學六年級下冊全冊同步練習
- 醫(yī)院營養(yǎng)食堂餐飲服務投標方案(技術方案)
- 惡性心律失常的識別及處理
- 宗教活動場所財務管理辦法
評論
0/150
提交評論