2019年人工智能市場(chǎng)報(bào)告_第1頁(yè)
2019年人工智能市場(chǎng)報(bào)告_第2頁(yè)
2019年人工智能市場(chǎng)報(bào)告_第3頁(yè)
2019年人工智能市場(chǎng)報(bào)告_第4頁(yè)
2019年人工智能市場(chǎng)報(bào)告_第5頁(yè)
已閱讀5頁(yè),還剩12頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2019年人工智能市場(chǎng)報(bào)告

正文目錄本文研究導(dǎo)讀....................................................................................................................4卷積神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介.............................................................................................................5卷積神經(jīng)網(wǎng)絡(luò)的原理..................................................................................................5卷積神經(jīng)網(wǎng)絡(luò)和ImageNet........................................................................................6卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于股票多因子收益預(yù)測(cè).................................................................6卷積神經(jīng)網(wǎng)絡(luò)選股模型測(cè)試流程.....................................................................................11測(cè)試流程..................................................................................................................11測(cè)試模型設(shè)置..........................................................................................................13卷積神經(jīng)網(wǎng)絡(luò)選股模型測(cè)試結(jié)果.....................................................................................15單因子測(cè)試..............................................................................................................15單因子回歸測(cè)試和IC測(cè)試...............................................................................15單因子分層測(cè)試...............................................................................................15構(gòu)建策略組合及回測(cè)分析.................................................................................16結(jié)論和展望......................................................................................................................192圖表目錄圖表:LeNet-5卷積神經(jīng)網(wǎng)絡(luò)模型...............................................................................5圖表:幾種重要的卷積神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介...........................................................................6圖表:個(gè)股的“因子圖片”及其對(duì)應(yīng)的相對(duì)收益率標(biāo)簽..............................................7圖表:卷積運(yùn)算的原理展示..........................................................................................7圖表:卷積運(yùn)算的原理展示(水平遍歷)....................................................................8圖表:卷積運(yùn)算的原理展示(垂直遍歷)....................................................................8圖表:卷積結(jié)果的后續(xù)處理步驟..................................................................................9圖表:圖像識(shí)別中的多層卷積......................................................................................9圖表:圖像識(shí)別中的池化...........................................................................................10圖表:不同的因子排布方式生成的“因子圖片”.....................................................10圖表:卷積神經(jīng)網(wǎng)絡(luò)選股模型測(cè)試流程示意圖.........................................................11圖表:年度滾動(dòng)訓(xùn)練示意圖......................................................................................12圖表:選股模型中涉及的全部因子及其描述(表)..............................................12圖表:選股模型中涉及的全部因子及其描述(表)..............................................13圖表:卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu).........................................................................................14圖表:全連接神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)......................................................................................14圖表:三種模型在全A股的回歸法、IC值分析結(jié)果匯總(回測(cè)期~20190131)....................................................................................................................15圖表:三種模型的累積RankIC曲線........................................................................15圖表:三種模型的累積因子收益率曲線....................................................................15圖表:三種模型在全A股的分層測(cè)試法結(jié)果匯總(分五層,回測(cè)期~20190131)....................................................................................................................16圖表:組合詳細(xì)績(jī)效分析(分五層,回測(cè)期~20190131).......................................................................................................................................16.圖表:卷積神經(jīng)網(wǎng)絡(luò)各層組合凈值除以基準(zhǔn)組合凈值示意圖...................................16圖表:組合凈值除以基準(zhǔn)組合凈值示意圖........................................16圖表:三種模型構(gòu)建全A選股策略回測(cè)指標(biāo)對(duì)比(回測(cè)期~20190131)........................................................................................................................................17圖表:三種模型全A選股策略表現(xiàn)(個(gè)股權(quán)重偏離上限2.5%,基準(zhǔn)為滬深).......................................................................................................................................17圖表:三種模型全A選股策略表現(xiàn)(個(gè)股權(quán)重偏離上限,基準(zhǔn)為中證)...18.3卷積神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetwork,,是計(jì)算機(jī)視覺(jué)研究和應(yīng)用領(lǐng)域中最具影響力的模型。回顧C(jī)NN的發(fā)展歷史,可以看到一座座令人贊嘆的里程碑。Lecun等人在年提出基于梯度下降的CNN算法,并成功地將其應(yīng)用在手寫(xiě)數(shù)字字的錯(cuò)誤率。E.Hinton等人憑借卷積神經(jīng)網(wǎng)絡(luò)AlexNet以超過(guò)第二名近CNNImageNet競(jìng)賽的冠軍非CNN莫屬。年,CNN在數(shù)據(jù)集上的錯(cuò)誤率()第一次超過(guò)了人類(lèi)預(yù)測(cè)錯(cuò)誤率(5.1%相關(guān)領(lǐng)域研究人員的增多,技術(shù)的日新月異,CNN也變得越來(lái)越復(fù)雜。從最初的5層,層,到諸如提出的層ResNet甚至上千層網(wǎng)絡(luò)已被廣大研究者和工程實(shí)踐人員司空見(jiàn)慣,成為深度學(xué)習(xí)發(fā)展的重要推手。CNN目前在很多很多研究領(lǐng)域取得了成功,例如:圖像識(shí)別,圖像分割,語(yǔ)音識(shí)別,自然語(yǔ)言處理等。雖然這些領(lǐng)域中解決的問(wèn)題并不相同,但是這些應(yīng)用方法都可以被歸納為:可以自動(dòng)從通常是大規(guī)模數(shù)據(jù)整理自)卷積神經(jīng)網(wǎng)絡(luò)的原理取。我們將以經(jīng)典的LeNet-5模型為例,介紹卷積神經(jīng)網(wǎng)絡(luò)的工作原理。圖表:LeNet-5卷積神經(jīng)網(wǎng)絡(luò)模型資料來(lái)源:LeCunBottou,Bengio&Haffner(1998),XXX市場(chǎng)研究部LeNet-51和寬度的像素點(diǎn),為了識(shí)別該圖像中的字母,LeNet-5依次完成以下步驟:1絡(luò)能從低級(jí)特征中迭代提取更復(fù)雜的特征。在卷積層之后都會(huì)使用非線性激活函數(shù)(如,tanh等)對(duì)特征進(jìn)行非線性變換。1中的維特征的圖片進(jìn)行特征提取和特征降維(subsample3.1和特征降維,得到更加高層和抽象的特征。.1中的和fullconnection維特征,用來(lái)進(jìn)行最后的訓(xùn)練和預(yù)測(cè)。45對(duì)圖像本身的完整性有害,而且提取的特征有限,不能捕捉到最好的切割效果,而CNN能夠很好的完成這份工作,通過(guò)不同的卷積核進(jìn)行特征提取,并結(jié)合池化層的降維能力,為提取特征更完美的結(jié)果,這也是其他神經(jīng)網(wǎng)絡(luò)所不具備的特點(diǎn)。卷積神經(jīng)網(wǎng)絡(luò)和ImageNetImageNet項(xiàng)目是一個(gè)用于視覺(jué)對(duì)象識(shí)別軟件研究的大型可視化數(shù)據(jù)庫(kù),包含超過(guò)萬(wàn)張有標(biāo)注的圖像。該項(xiàng)目的圖像由李飛飛團(tuán)隊(duì)從年開(kāi)始,耗費(fèi)大量人力,通過(guò)各CNN的各種改進(jìn)版本在ImageNet旗下的大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)賽()中持續(xù)斬獲冠軍。在圖表2中,我們將簡(jiǎn)要介紹幾種重要的卷積神經(jīng)網(wǎng)絡(luò)以及其在的表現(xiàn)。圖表:幾種重要的卷積神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介模型提出時(shí)間主要特性ILSVRC排名AlexNet2012年包含7層隱藏層,首次使用了RELUDropOut、數(shù)據(jù)增強(qiáng)等技術(shù),2012冠軍對(duì)后續(xù)CNN的設(shè)計(jì)起到了啟發(fā)作用。VGGNet2014年包含19的難題。2014亞軍Inception-V12014年ResNet2015年包含22Inception結(jié)構(gòu),進(jìn)一步增強(qiáng)網(wǎng)絡(luò)的特征學(xué)習(xí)能力。2014冠軍包含152層隱藏層,提出了解決更加深層次網(wǎng)絡(luò)難以訓(xùn)練的方法:殘差學(xué)習(xí),即在網(wǎng)絡(luò)中增加了直連通道。在Inception結(jié)構(gòu)中使用維度更小的卷積核,使用BatchNormalization技術(shù)。2015冠軍Inception-V2,2015年Inception-V3--Inception-V42016年結(jié)合了ResNet的特性,進(jìn)一步加深了神經(jīng)網(wǎng)絡(luò)。資料來(lái)源:ImageNet,XXX市場(chǎng)研究部回顧歷史,正是不斷加深、結(jié)構(gòu)不斷復(fù)雜的CNN引領(lǐng)了人工智能領(lǐng)域最近數(shù)年的發(fā)展。在最后兩屆比賽中(和2017CNN的進(jìn)一步改進(jìn)版本以及分別獲得了冠軍。卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于股票多因子收益預(yù)測(cè)總結(jié)一下CNNCNN經(jīng)網(wǎng)絡(luò)的端到端以及反向傳播的特性,CNN可以根據(jù)數(shù)據(jù)和標(biāo)簽的情況進(jìn)行自動(dòng)的特征提取和特征降維。隨著金融市場(chǎng)的發(fā)展,大量與股票收益可能相關(guān)的數(shù)據(jù)在連續(xù)不斷地生成,CNN的優(yōu)秀特性或許能為我們提供股票收益建模的新方法。然而回顧C(jī)NN的發(fā)展歷程,其大部分應(yīng)用都是在計(jì)算機(jī)視覺(jué)領(lǐng)域,如果將CNN應(yīng)用到股票多因子收益預(yù)測(cè),需要對(duì)因子數(shù)據(jù)進(jìn)行一定的整理組織。如圖表3所示,為了利用方便處理二維數(shù)據(jù)的特性,我們將個(gè)股的因子數(shù)據(jù)組織成ROE,…5t時(shí)間的相對(duì)收益率Rt作為標(biāo)簽,如果在一個(gè)截面上有只個(gè)股,我們就可以得到張個(gè)股的“因子圖序列屬性。6圖表:個(gè)股的“因子圖片”及其對(duì)應(yīng)的相對(duì)收益率標(biāo)簽資料來(lái)源:XXX市場(chǎng)研究部CNN驟如圖表圖表6所示。如圖表,假設(shè)有一個(gè)大小為的卷積核,該卷積核對(duì)應(yīng)4個(gè)權(quán)重(WWWW)以及一個(gè)偏置項(xiàng)(bias12344右側(cè)灰色區(qū)域的卷積4行因子合成,在同一時(shí)間截面上,不同的因子與權(quán)重相乘后累加,得到新的因子值F56歷的卷積運(yùn)算,最終生成一個(gè)圖表:卷積運(yùn)算的原理展示資料來(lái)源:XXX市場(chǎng)研究部7圖表:卷積運(yùn)算的原理展示(水平遍歷)資料來(lái)源:XXX市場(chǎng)研究部圖表:卷積運(yùn)算的原理展示(垂直遍歷)資料來(lái)源:XXX市場(chǎng)研究部77右側(cè)的結(jié)果,接下來(lái)我們?cè)賹⑵溥M(jìn)行一維展開(kāi),得到卷積層處理后的因子向量(X1,t-4X1,…,Xn,Xnt-3t-2t-1照全連接神經(jīng)網(wǎng)絡(luò)的優(yōu)化方法(反向傳播,梯度下降)來(lái)優(yōu)化網(wǎng)絡(luò)參數(shù)。8圖表:卷積結(jié)果的后續(xù)處理步驟資料來(lái)源:XXX市場(chǎng)研究部到這里,讀者可能會(huì)有三個(gè)疑問(wèn),我們將給出解釋?zhuān)?23.以上步驟只使用了一層卷積層,可否使用多層卷積層?.以上步驟為何沒(méi)有池化層?.“因子圖片”中因子的排列順序?qū)Y(jié)果是否有影響?8更加原始的數(shù)據(jù),那么多層卷積層或許能達(dá)到更好的效果。圖表:圖像識(shí)別中的多層卷積資料來(lái)源:Prof.BartHaarRomeny,XXX市場(chǎng)研究部對(duì)于第二個(gè)問(wèn)題,解釋與第一個(gè)問(wèn)題類(lèi)似。如圖表,池化層所起的作用本質(zhì)上是對(duì)卷積9Pooling于損失了一些精細(xì)的信息,這對(duì)于股票收益建模來(lái)說(shuō)并不可靠。9圖表:圖像識(shí)別中的池化資料來(lái)源:DISHASHREEGUPTA,XXX市場(chǎng)研究部因子和因子相鄰,右圖中因子和因子不相鄰,那么對(duì)于右圖中的情況來(lái)說(shuō),從卷積核的作用區(qū)域(黃色)可以看出,無(wú)法對(duì)因子和ROE因子進(jìn)行卷積運(yùn)算,這將使得卷積核因子放在相鄰位置。圖表:不同的因子排布方式生成的“因子圖片”資料來(lái)源:XXX市場(chǎng)研究部卷積神經(jīng)網(wǎng)絡(luò)選股模型測(cè)試流程測(cè)試流程圖表:卷積神經(jīng)網(wǎng)絡(luò)選股模型測(cè)試流程示意圖特征預(yù)處理和二維數(shù)據(jù)生成滾動(dòng)訓(xùn)練集和驗(yàn)證集合成數(shù)據(jù)獲取模型評(píng)價(jià)特征和標(biāo)簽提取樣本外測(cè)試交叉驗(yàn)證調(diào)參樣本內(nèi)訓(xùn)練資料來(lái)源:XXX市場(chǎng)研究部測(cè)試流程包含如下步驟:.?dāng)?shù)據(jù)獲?。篈上市3個(gè)月內(nèi)的股票,每只股票視作一個(gè)樣本?;販y(cè)區(qū)間:年1月日至年1月.特征和標(biāo)簽提?。好總€(gè)自然月的最后一個(gè)交易日,計(jì)算個(gè)因子暴露度,作為樣本和圖表(的股票作為正例(y=1的股票作為負(fù)例(y=0用下個(gè)月的超額收益作為標(biāo)簽。.特征預(yù)處理和二維數(shù)據(jù)生成中位數(shù)去極值:設(shè)第T期某因子在所有個(gè)股上的暴露度序列為?,?為該序列??中位數(shù),?1為序列??|的中位數(shù),則將序列?中所有大于?+?1的數(shù)????重設(shè)為?+5?,將序列?中所有小于??5?的數(shù)重設(shè)為???1;??1???級(jí)行業(yè)相同個(gè)股的平均值;c)做線性回歸,取殘差作為新的因子暴露度;標(biāo)準(zhǔn)化:將中性化處理后的因子暴露度序列減去其現(xiàn)在的均值、除以其標(biāo)準(zhǔn)差,得到一個(gè)新的近似服從N(0,1)分布的序列。3只股票多個(gè)截面期的因子數(shù)據(jù)組織成類(lèi)似于圖片的二維數(shù)據(jù),總共行(對(duì)應(yīng)個(gè)因子,5列(對(duì)應(yīng)54.滾動(dòng)訓(xùn)練集和驗(yàn)證集的合成:由于月度滾動(dòng)訓(xùn)練模型的時(shí)間開(kāi)銷(xiāo)較大,本文采用年度滾動(dòng)訓(xùn)練方式,全體樣本內(nèi)外數(shù)據(jù)共分為九個(gè)階段,如下圖所示。例如預(yù)測(cè)年時(shí),將年共個(gè)月數(shù)據(jù)合并作為樣本內(nèi)數(shù)據(jù)集;預(yù)測(cè)T年時(shí),將至個(gè)月合并作為樣本內(nèi)數(shù)據(jù)。.樣本內(nèi)訓(xùn)練:使用卷積神經(jīng)網(wǎng)絡(luò)對(duì)訓(xùn)練集進(jìn)行訓(xùn)練。6.絡(luò)在驗(yàn)證集上的表現(xiàn),當(dāng)驗(yàn)證集上的達(dá)到最小時(shí),停止訓(xùn)練。.T月末截面期所有樣本預(yù)處理后的特征作為模型的輸入,得到每個(gè)樣本的預(yù)測(cè)值f(x)。將預(yù)測(cè)值視作合成后的因子,進(jìn)行單因子分層回測(cè)。7.模型評(píng)價(jià):我們以分層回測(cè)和構(gòu)建選股策略的結(jié)果作為模型評(píng)價(jià)標(biāo)準(zhǔn)。圖表:年度滾動(dòng)訓(xùn)練示意圖資料來(lái)源:XXX市場(chǎng)研究部圖表:選股模型中涉及的全部因子及其描述(表)大類(lèi)因子具體因子因子描述估值估值估值估值估值估值估值估值成長(zhǎng)成長(zhǎng)成長(zhǎng)成長(zhǎng)EP凈利潤(rùn)()總市值EPcutBP扣除非經(jīng)常性損益后凈利潤(rùn)()總市值凈資產(chǎn)總市值SP營(yíng)業(yè)收入()總市值NCFPOCFPDP凈現(xiàn)金流()總市值經(jīng)營(yíng)性現(xiàn)金流()總市值近12個(gè)月現(xiàn)金紅利(按除息日計(jì))總市值凈利潤(rùn)()同比增長(zhǎng)率/PE_TTM營(yíng)業(yè)收入(最新財(cái)報(bào),)同比增長(zhǎng)率凈利潤(rùn)(最新財(cái)報(bào),)同比增長(zhǎng)率經(jīng)營(yíng)性現(xiàn)金流(最新財(cái)報(bào),)同比增長(zhǎng)率ROE(最新財(cái)報(bào),)同比增長(zhǎng)率ROE(最新財(cái)報(bào),)G/PESales_G_qProfit_G_qOCF_G_qROE_G_q財(cái)務(wù)質(zhì)量ROE_q財(cái)務(wù)質(zhì)量ROE_ttmROE(最新財(cái)報(bào),)財(cái)務(wù)質(zhì)量ROA_qROA(最新財(cái)報(bào),)財(cái)務(wù)質(zhì)量ROA_ttmROA(最新財(cái)報(bào),)財(cái)務(wù)質(zhì)量grossprofitmargin_q財(cái)務(wù)質(zhì)量grossprofitmargin_ttm財(cái)務(wù)質(zhì)量profitmargin_q財(cái)務(wù)質(zhì)量profitmargin_ttm財(cái)務(wù)質(zhì)量assetturnover_q財(cái)務(wù)質(zhì)量assetturnover_ttm財(cái)務(wù)質(zhì)量operationcashflowratio_q財(cái)務(wù)質(zhì)量operationcashflowratio_ttm毛利率(最新財(cái)報(bào),)毛利率(最新財(cái)報(bào),)扣除非經(jīng)常性損益后凈利潤(rùn)率(最新財(cái)報(bào),)扣除非經(jīng)常性損益后凈利潤(rùn)率(最新財(cái)報(bào),)資產(chǎn)周轉(zhuǎn)率(最新財(cái)報(bào),YTD)資產(chǎn)周轉(zhuǎn)率(最新財(cái)報(bào),)經(jīng)營(yíng)性現(xiàn)金流凈利潤(rùn)(最新財(cái)報(bào),YTD)經(jīng)營(yíng)性現(xiàn)金流凈利潤(rùn)(最新財(cái)報(bào),TTM)總資產(chǎn)凈資產(chǎn)杠桿杠桿杠桿杠桿市值financial_leveragedebtequityratiocashratio非流動(dòng)負(fù)債凈資產(chǎn)現(xiàn)金比率currentratio流動(dòng)比率ln_capital總市值取對(duì)數(shù)動(dòng)量反轉(zhuǎn)HAlpha個(gè)股60個(gè)月收益與上證綜指回歸的截距項(xiàng)個(gè)股最近N個(gè)月收益率,,,,12個(gè)股最近N個(gè)月內(nèi)用每日換手率乘以每日收益率求算術(shù)平均值,N=1,,,12動(dòng)量反轉(zhuǎn)return_Nm動(dòng)量反轉(zhuǎn)wgt_return_Nm動(dòng)量反轉(zhuǎn)exp_wgt_return_Nm個(gè)股最近N個(gè)月內(nèi)用每日換手率乘以函數(shù)exp(-x_i/N/4)再乘以每日收益率求算術(shù)平均值,為該日距離截面日的交易日的個(gè)數(shù),N=1,,,12波動(dòng)率std_FF3factor_Nm特質(zhì)波動(dòng)率——個(gè)股最近N個(gè)月內(nèi)用日頻收益率對(duì)FamaFrench三因子回歸的殘差的標(biāo)準(zhǔn)差,N=1,,,12個(gè)股最近N個(gè)月的日收益率序列標(biāo)準(zhǔn)差,,,,12股價(jià)取對(duì)數(shù)波動(dòng)率股價(jià)std_Nmln_pricebetabeta個(gè)股60個(gè)月收益與上證綜指回歸的beta個(gè)股最近N個(gè)月內(nèi)日均換手率(剔除停牌、漲跌停的交易日),N=1,,,12換手率turn_Nm換手率bias_turn_Nm個(gè)股最近N個(gè)月內(nèi)日均換手率除以最近2牌、漲跌停的交易日)再減去,N=1,,,12Wind,XXX市場(chǎng)研究部圖表:選股模型中涉及的全部因子及其描述(表)大類(lèi)因子具體因子因子描述一致預(yù)期rating_average一致預(yù)期rating_change一致預(yù)期rating_targetprice一致預(yù)期CON_EP評(píng)級(jí)的平均值評(píng)級(jí)(上調(diào)家數(shù)下調(diào)家數(shù))總數(shù)一致目標(biāo)價(jià)現(xiàn)價(jià)-1朝陽(yáng)永續(xù)一致預(yù)期一致預(yù)期CON_EP_REL一致預(yù)期CON_BP朝陽(yáng)永續(xù)一致預(yù)期季度環(huán)比朝陽(yáng)永續(xù)一致預(yù)期一致預(yù)期CON_BP_REL一致預(yù)期CON_GPE朝陽(yáng)永續(xù)一致預(yù)期季度環(huán)比朝陽(yáng)永續(xù)一致預(yù)期GPE一致預(yù)期CON_GPE_REL一致預(yù)期CON_ROE朝陽(yáng)永續(xù)一致預(yù)期GPE季度環(huán)比朝陽(yáng)永續(xù)一致預(yù)期ROE一致預(yù)期CON_ROE_REL一致預(yù)期CON_EPS朝陽(yáng)永續(xù)一致預(yù)期季度環(huán)比朝陽(yáng)永續(xù)一致預(yù)期一致預(yù)期CON_EPS_REL一致預(yù)期CON_NP朝陽(yáng)永續(xù)一致預(yù)期季度環(huán)比朝陽(yáng)永續(xù)一致預(yù)期歸母凈利潤(rùn)朝陽(yáng)永續(xù)一致預(yù)期歸母凈利潤(rùn)季度環(huán)比戶(hù)均持股比例的同比增長(zhǎng)率一致預(yù)期CON_NP_REL股東技術(shù)技術(shù)技術(shù)技術(shù)技術(shù)技術(shù)holder_avgpctchangeMACDDEADIF經(jīng)典技術(shù)指標(biāo)(釋義可參考百度百科),長(zhǎng)周期取30日,短周期取10日,計(jì)算均線的周期(中周期)取15日RSI經(jīng)典技術(shù)指標(biāo),周期取20日經(jīng)典技術(shù)指標(biāo),周期取20日經(jīng)典技術(shù)指標(biāo),周期取20日PSYBIASWind,朝陽(yáng)永續(xù),XXX市場(chǎng)研究部測(cè)試模型設(shè)置絡(luò)和線性回歸。其中卷積神經(jīng)網(wǎng)絡(luò)和全連接神經(jīng)網(wǎng)絡(luò)的主要參數(shù)如下:1.卷積神經(jīng)網(wǎng)絡(luò):)輸入數(shù)據(jù):每個(gè)股票樣本包含個(gè)因子,5個(gè)歷史截面期,構(gòu)成的“因子圖1或)卷積層:一層卷積層,包含個(gè)大小的卷積核。卷積核權(quán)重使用初始(((()池化層:沒(méi)有池化層。4)全連接層:3層全連接層,分別包含100、70、個(gè)神經(jīng)元,連接權(quán)重使用truncated_normal((()。)優(yōu)化器和學(xué)習(xí)速率:,0.001。卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如下圖所示:圖表:卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)資料來(lái)源:XXX市場(chǎng)研究部2.的參數(shù)設(shè)置如下:)輸入數(shù)據(jù):每個(gè)股票樣本包含個(gè)因子,5個(gè)歷史截面期,構(gòu)成的“因子圖1或)全連接層:4層全連接層,分別包含、、、個(gè)神經(jīng)元,連接權(quán)重使用((truncated_normal個(gè)神經(jīng)元等于卷積神經(jīng)網(wǎng)絡(luò)中卷積結(jié)果一維展開(kāi)后得到的特征數(shù)目,(82-5+1)((()率:。)優(yōu)化器和學(xué)習(xí)速率:,0.001。全連接神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如下圖所示:圖表:全連接神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)資料來(lái)源:XXX市場(chǎng)研究部卷積神經(jīng)網(wǎng)絡(luò)選股模型測(cè)試結(jié)果單因子測(cè)試如果將機(jī)器學(xué)習(xí)模型的輸出視為單因子,則可進(jìn)行單因子測(cè)試。單因子回歸測(cè)試和IC測(cè)試測(cè)試模型構(gòu)建方法如下:股票池:全A股,剔除股票,剔除每個(gè)截面期下一交易日停牌的股票,剔除上市3個(gè)月以?xún)?nèi)的股票。2..回測(cè)區(qū)間:至2019-01-31。3截面期:每個(gè)月月末,用當(dāng)前截面期因子值與當(dāng)前截面期至下個(gè)截面期內(nèi)的個(gè)股收益進(jìn)行回歸和計(jì)算RankIC4..數(shù)據(jù)處理方法:對(duì)于分類(lèi)模型,將模型對(duì)股票下期上漲概率的預(yù)測(cè)值視作單因子。對(duì)于回歸模型,將回歸預(yù)測(cè)值視作單因子。因子值為空的股票不參與測(cè)試。WLS測(cè)試時(shí)對(duì)單因子進(jìn)行行業(yè)市值中性。5如圖表RankIC均值和因子收益率均值略高于全連接神經(jīng)網(wǎng)絡(luò),也要高于線性回歸。圖表:三種模型在全A股的回歸法、值分析結(jié)果匯總(回測(cè)期~20190131)模型|t|均值|t|>2占比t均值因子收益率均值RankIC均值RankIC標(biāo)準(zhǔn)差I(lǐng)C_IRIC>0占比卷積神經(jīng)網(wǎng)絡(luò)全連接神經(jīng)網(wǎng)絡(luò)線性回歸5.3579.17%4.975.4476.04%4.955.2281.25%4.961.021%1.015%0.968%13.62%13.28%12.48%10.92%11.34%9.67%987.50%87.50%87.50%Wind,朝陽(yáng)永續(xù),XXX市場(chǎng)研究部圖表和圖表分別展示了三種模型的累積RankIC和累積因子收益率曲線。圖表:三種模型的累積RankIC曲線圖表:三種模型的累積因子收益率曲線111420864201.2卷積神經(jīng)網(wǎng)絡(luò)全連接神經(jīng)網(wǎng)絡(luò)線性回歸卷積神經(jīng)網(wǎng)絡(luò)全連接神經(jīng)網(wǎng)絡(luò)1線性回歸0.20Wind,朝陽(yáng)永續(xù),XXX市場(chǎng)研究部Wind,朝陽(yáng)永續(xù),XXX市場(chǎng)研究部單因子分層測(cè)試模型構(gòu)建方法如下:1..股票池、回測(cè)區(qū)間、截面期均與回歸法相同。2換倉(cāng):在每個(gè)自然月最后一個(gè)交易日核算因子值,在下個(gè)自然月首個(gè)交易日按當(dāng)日收盤(pán)價(jià)換倉(cāng),交易費(fèi)用以雙邊千分之四計(jì)。分層方法:因子先用中位數(shù)法去極值,然后進(jìn)行市值、行業(yè)中性化處理(方法論詳見(jiàn)N層,每層內(nèi)部的N對(duì)分層組合的回測(cè)結(jié)果影響很小。4..多空組合收益計(jì)算方法:用組每天的收益減去組每天的收益,得到每日多空收益序列?,?,?,?n天的凈值等于+?)(1+?)?(1+?)。12?12?5N夏普比率、最大回撤、月勝率等。我們展示了模型分層測(cè)試的結(jié)果(圖表和圖表測(cè)試的組合的表現(xiàn)(圖表和圖表卷積神經(jīng)網(wǎng)絡(luò)相比全連接神經(jīng)網(wǎng)絡(luò)表現(xiàn)略好,并且優(yōu)于線性回歸。圖表:三種模型在全A股的分層測(cè)試法結(jié)果匯總(分五層,回測(cè)期~20190131)多空組合年化多空組合夏多空組合最多空組合月組合月均模型分層組合~(從左到右)年化收益率收益率40.41%39.29%35.57%普比率4.84大回撤12.19%11.53%10.80%勝率82.29%82.29%87.50%雙邊換手率81.85%卷積神經(jīng)網(wǎng)絡(luò)全連接神經(jīng)網(wǎng)絡(luò)線性回歸20.05%19.24%16.40%8.60%8.47%8.75%2.90%3.30%1.61%-6.11%-14.42%-5.23%-14.41%-2.73%-13.91%4.6476.24%4.7198.66%Wind,朝陽(yáng)永續(xù),XXX市場(chǎng)研究部圖表:三種模型組合詳細(xì)績(jī)效分析(分五層,回測(cè)期~)模型年化收益率年化波動(dòng)率夏普比率最大回撤年化超額收益率年化跟蹤誤差超額收益最大回撤信息比率相對(duì)基準(zhǔn)月勝率卷積神經(jīng)網(wǎng)絡(luò)全連接神經(jīng)網(wǎng)絡(luò)線性回歸20.05%19.24%16.40%4.21%27.95%27.75%28.44%26.85%0.7249.07%0.6949.70%0.5853.31%0.1663.14%15.48%14.63%12.05%3.83%3.75%3.72%5.38%4.90%5.88%4.043.913.2482.29%78.13%82.29%基準(zhǔn)組合Wind,朝陽(yáng)永續(xù),XXX市場(chǎng)研究部圖表:卷積神經(jīng)網(wǎng)絡(luò)各層組合凈值除以基準(zhǔn)組合凈值示意圖圖表:三種模型組合凈值除以基準(zhǔn)組合凈值示意圖3210.53.5第1層第3層第5層第2層第4層卷積神經(jīng)網(wǎng)絡(luò)全連接神經(jīng)網(wǎng)絡(luò)33.52線性回歸.522.511.51.50Wind,朝陽(yáng)永續(xù),XXX市場(chǎng)研究部Wind,朝陽(yáng)永續(xù),XXX市場(chǎng)研究部構(gòu)建策略組合及回測(cè)分析A選股策中分別展示了以滬深Calmar從左至右對(duì)應(yīng)不同的個(gè)股權(quán)重偏離上限。從圖表中可以看出,當(dāng)以滬深為基準(zhǔn)時(shí),兩種神經(jīng)網(wǎng)絡(luò)在年化超額收益率、信息比率和Calmar比率上的表現(xiàn)都不如線性回歸。當(dāng)以中證略?xún)?yōu)于線性回歸。圖表:三種模型構(gòu)建全A選股策略回測(cè)指標(biāo)對(duì)比(回測(cè)期~)模型選擇個(gè)股權(quán)重偏離上限(從左至右:1.5%,2%,2.5%,3%,5%)全A選股,基準(zhǔn)為滬深(行業(yè)中性、市值中性)年化超額收益率個(gè)股權(quán)重偏離上限(從左至右:1.5%,2%,2.5%,3%)全A選股,基準(zhǔn)為中證(行業(yè)中性、市值中性)年化超額收益率卷積神經(jīng)網(wǎng)絡(luò)全連接神經(jīng)網(wǎng)絡(luò)線性回歸5.39%6.15%7.03%6.06%6.01%6.90%6.14

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論