版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、正文目錄 HYPERLINK l _TOC_250009 引言 3 HYPERLINK l _TOC_250008 文章主要內(nèi)容 3 HYPERLINK l _TOC_250007 一、研究背景 3 HYPERLINK l _TOC_250006 二、相關(guān)工作 3 HYPERLINK l _TOC_250005 三、遺傳算法的組成部分 7 HYPERLINK l _TOC_250004 四、算法詳解 11 HYPERLINK l _TOC_250003 五、實(shí)驗(yàn)結(jié)果 18 HYPERLINK l _TOC_250002 討論 26 HYPERLINK l _TOC_250001 總結(jié) 26 H
2、YPERLINK l _TOC_250000 參考文獻(xiàn) 27圖表目錄表 1 兩公司的現(xiàn)金股利率 8表 2 每個(gè)股票的現(xiàn)金股利率 8表 3 每組平均現(xiàn)金股利占所有組的比例 8表 4 例子中使用的股票 13表 5 股價(jià)序列的 12 只股票 14表 6 2011 年至 2013 年 12 只股票的現(xiàn)金股利 14表 7:所有歸一化的股票序列 15表 8:十二個(gè)代表性的股票序列 15表 9 所有染色體的組合滿意度 15表 10 染色體的組平衡 16表 11 所有染色體的序列距離 16表 12 所有染色體的適應(yīng)度 16表 13 參數(shù)設(shè)定 18表 14 基于 Proposed Approach(f1)用 S
3、AX 的 GSP 的比較 20表 15 基于 Proposed Approach(f1)用 ESAX 的 GSP 的比較 20表 16 此處錄入標(biāo)題 21表 17 基于 Proposed Approach(f2)的 GSP 與 ESAX 的比較 21表 18 過(guò)去和本文提出的方法得出的 GSP 的SAX 和ESAX 距離 25表 19 過(guò)去和本文提出的方法在一年的訓(xùn)練和測(cè)試集上的平均回報(bào) 25表 20 過(guò)去和本文提出的方法在兩年的訓(xùn)練和測(cè)試集上的平均回報(bào) 25引言在市場(chǎng)上,對(duì)于資產(chǎn)、基金的分類一直是大家討論的話題,根據(jù)業(yè)績(jī)走勢(shì)對(duì)于基金進(jìn)行分類我們也曾有相關(guān)研究。研究資產(chǎn)的相關(guān)性一個(gè)重要的應(yīng)用就
4、是可以利用相似資產(chǎn)找到原資產(chǎn)中不可購(gòu)買(mǎi)的一部分資產(chǎn)。本期琢璞系列我們推薦 Chen, Chun-Hao, and Chih-Hung Yu(2017)的A Series-based group stock portfolio optimization approach using the grouping genetic algorithm with symbolic aggregate approximations,文獻(xiàn)利用遺傳算法對(duì)相似資產(chǎn)進(jìn)行了歸類,便于投資者選擇替代資產(chǎn),可以對(duì)于這個(gè)問(wèn)題提供一些理論參考文章主要內(nèi)容一、研究背景由于金融市場(chǎng)受各種各樣因素的影響,投資仍然是個(gè)極具吸引力的話
5、題。同時(shí),市場(chǎng)上還有許多衍生品可供投資者選擇。換句話來(lái)說(shuō),投資者可以根據(jù)很多方法來(lái)創(chuàng)建投資組合。通常,使用兩個(gè)客觀的度量值,即風(fēng)險(xiǎn)價(jià)值(VaR)和投資回報(bào)率(ROI)來(lái)評(píng)估投資組合的質(zhì)量。由于許多因素會(huì)影響給定投資組合的收益,因此需要一種更為復(fù)雜的方法來(lái)獲得一個(gè)考慮多個(gè)因素的投資組合。通過(guò)使用均值方差(M-V)模型,人們提出了許多優(yōu)化算法來(lái)挖掘最佳投資組合。盡管已經(jīng)有了許多股票投資組合優(yōu)化方法,但這些方法僅用于得出股票投資組合,不能保證分組后每組的股票價(jià)格相似。實(shí)際上,這往往是不夠的,因?yàn)橛脩艨赡軙?huì)由于各種原因無(wú)法購(gòu)買(mǎi)建議的股票,例如建議購(gòu)買(mǎi)的股票價(jià)格太高。這時(shí)應(yīng)建議購(gòu)買(mǎi)替代股票。因此,在過(guò)去
6、的方法中,提出了一種使用分組遺傳算法(GGA)來(lái)篩選股票投資組合(GSP)的算法。二、相關(guān)工作本節(jié)介紹與本篇論文具體使用方法相關(guān)的研究。首先,在 2.1 節(jié)中介紹了投資組合優(yōu)化的相關(guān)方法,在第 2.2 節(jié)中提供了相關(guān)背景知識(shí)。投資組合優(yōu)化的相關(guān)方法迄今為止,許多投資組合優(yōu)化方法已經(jīng)被提出,譬如使用單目標(biāo)和多目標(biāo)遺傳算法來(lái)推導(dǎo)最優(yōu)投資組合。 Chang 提出了一種使用遺傳算法(GA)進(jìn)行組合優(yōu)化的啟蒙方法,該算法使用了半方差,平均絕對(duì)偏差和偏度方差,同時(shí)提出了一種根據(jù)利潤(rùn)和風(fēng)險(xiǎn)找到投資組合的優(yōu)化方法。 Chen 設(shè)計(jì)了一種基于領(lǐng)域驅(qū)動(dòng)數(shù)據(jù)挖掘概念的方法,根據(jù)投資者的需求,優(yōu)化可行的股票投資組合。
7、Guo 提出了一種稱為“基于模糊模擬遺傳算法”(FSGA)的方法,該方法基于可信度理論框架內(nèi)的公式化均值-方差模型來(lái)解決帶有 V形交易成本的模糊多期投資組合選擇問(wèn)題。Bevilacqua 提出了一種使用多目標(biāo) GA 的 ROI 和 VaR 進(jìn)行投資組合優(yōu)化的算法,其中使用的 PONSGA 模型考慮了五種不同的風(fēng)險(xiǎn)度量,可以最小化風(fēng)險(xiǎn)并最大化投資組合收益。 Saborido 將均值-下行風(fēng)險(xiǎn)偏度(MDRS)模型視為約束的三目標(biāo)優(yōu)化問(wèn)題。設(shè)計(jì)了三個(gè)新的遺傳操作,包括突變,交叉和倒位,并將它們合并到現(xiàn)有的多目標(biāo)進(jìn)化算法(如NSGAII 和 MOEA / D)中,以更有效地分析投資組合。此外,學(xué)者還提
8、出了幾種混合算法,這些算法結(jié)合了不同類型的數(shù)據(jù)挖掘技術(shù)。 Hachloufi 結(jié)合遺傳算法的分類設(shè)計(jì)了一種混合算法,該算法可獲得近似最優(yōu)的股票投資組合。首先, 該算法根據(jù)預(yù)期收益和風(fēng)險(xiǎn)將資產(chǎn)分成給定類別。然后, 利用 MinVaR-MaxVaL 算法找到接近最優(yōu)的資產(chǎn)組合。同時(shí),提出了一種用于投資組合選擇的綜合方法。通過(guò)使用向量機(jī),將資產(chǎn)分為三個(gè)預(yù)定義類別:低風(fēng)險(xiǎn),高收益和流動(dòng)資產(chǎn)。從這三個(gè)類別中,開(kāi)發(fā)出了一套實(shí)際代碼的 GA 以根據(jù)使用偏好來(lái)挖掘投資組合。此外,Gottschlich 還介紹了一種利用集成智慧提出股票投資建議的方法??紤]到財(cái)務(wù)和倫理標(biāo)準(zhǔn),Gupta 設(shè)計(jì)了一個(gè)用于投資組合選擇
9、全面的三階段多標(biāo)準(zhǔn)決策制定框架。首先,使用層次分析處理技術(shù)來(lái)評(píng)估每項(xiàng)資產(chǎn)的倫理表現(xiàn)得分。然后,通過(guò)模糊多準(zhǔn)則決策方法為每種資產(chǎn)計(jì)算出其財(cái)務(wù)質(zhì)量得分。接著利用三種混合投資組合優(yōu)化模型來(lái)獲得投資組合。還提出了其他進(jìn)化方法來(lái)解決投資組合優(yōu)化問(wèn)題。 Mousavi 提出了一種利用多樹(shù)遺傳規(guī)劃(GP)的動(dòng)態(tài)證券交易系統(tǒng)的方法。Wang 在模糊隨機(jī)不確定性下,根據(jù)不同的風(fēng)險(xiǎn)偏好,制定了兩個(gè)多期投資組合選擇模型。接著,設(shè)計(jì)了一種基于粒子群優(yōu)化算法的模糊隨機(jī)仿真算法,以求近似最優(yōu)解。上述提出的每種方法都只能用于得到股票投資組合。然而,對(duì)于投資者而言,僅僅得出股票投資組合是遠(yuǎn)遠(yuǎn)不夠的,因?yàn)橛刑嗟睦碛刹蝗ベ?gòu)買(mǎi)算
10、法推薦的股票。因此,Chen基于 GGA 對(duì) GSP 進(jìn)行優(yōu)化,GGA 可以為用戶提供一組股票投資組合,而不只是一個(gè)股票投資組合。這樣做的主要目標(biāo)是將股票分成幾組,而每組中的股票相似。每個(gè)染色體會(huì)有以下兩個(gè)評(píng)判標(biāo)準(zhǔn):組平衡度和投資組合滿意度,然后進(jìn)行遺傳操作以尋找更好的后代。重復(fù)遺傳操作,直到找到合適的分組股票組合。背景知識(shí)本節(jié)主要介紹背景知識(shí)。在 2.2.1 節(jié)中說(shuō)明分組問(wèn)題的定義,而在 2.2.2 和 2.2.3 節(jié)中對(duì)SAX 和 ESAX 進(jìn)行了說(shuō)明。分組問(wèn)題的定義根據(jù) Falkenauer 的定義,假設(shè)存在一組對(duì)象 O=o1,o2,., on,那么分組問(wèn)題可以被定義為: Gi = O
11、and Gi Gj = ,i j,Gi 代表一個(gè)分組,使用給定的標(biāo)準(zhǔn)將對(duì)象分成組是一個(gè)優(yōu)化問(wèn)題。遺傳算法是由 Holland 提出的,用于在接受的時(shí)間范圍內(nèi)為復(fù)雜的問(wèn)題找到合適的解決方案,并已用于解決各種優(yōu)化問(wèn)題?;谶z傳算法,提出了利用遺傳算法來(lái)解決各種分組問(wèn)題(GGA)。GGA 的基本概念如下,在編碼過(guò)程中,利用分組情況和組內(nèi)對(duì)象來(lái)表示分組結(jié)果。接下來(lái),將介紹 GGA 的組成。一個(gè)染色體包含兩個(gè)部分:分組情況和對(duì)象部分。例如,下面給出了完整的染色體:ACBBC:ABC.在前面的染色體中,在冒號(hào)左邊,字符串“ ACBBC”是對(duì)象部分,代表五個(gè)對(duì)象,即 o1,o2,o3,o4 和 o5。在冒號(hào)
12、之后,字符串“ ABC”是分組部分,這意味著對(duì)象部分中的每個(gè)對(duì)象都應(yīng)屬于三個(gè)組之一。因此,該染色體代表五個(gè)對(duì)象,這些對(duì)象被分為三組。在此示例中,對(duì)象o1 屬于組A,而對(duì)象 o3 和 o4 屬于組B,對(duì)象 o2 和 o5 屬于組 C。這三個(gè)遺傳操作包括交叉,變異和倒位。交叉不是在 GA 中交換基因,而是在 GGA 中切換組。變異是將對(duì)象從一組移動(dòng)到另一組。最后,第三個(gè)基因操作是倒位,其目的是讓交叉算子獲得更多種染色體。實(shí)際上,通過(guò)改變?nèi)旧w中各組的順序,執(zhí)行交叉算子時(shí)可以生成不同的染色體。符號(hào)聚合近似時(shí)間序列在實(shí)際應(yīng)用中很容易獲得,時(shí)間序列中的每個(gè)數(shù)據(jù)點(diǎn) dt 表示某個(gè)時(shí)間 t 的值。因此,具有
13、 n 個(gè)數(shù)據(jù)的時(shí)間序列 T 可以表示為 T d1,d2,.,dn。時(shí)間序列分析一直是一個(gè)重要而有趣的研究領(lǐng)域,因?yàn)樗谠S多應(yīng)用中很常見(jiàn)。當(dāng)數(shù)據(jù)量很大時(shí),時(shí)間序列分析可能會(huì)成為一項(xiàng)耗時(shí)的任務(wù)。因此,需要采用降維技術(shù)來(lái)提高數(shù)據(jù)挖掘過(guò)程的效率。眾所周知,我們可以采用符號(hào)聚合近似(SAX)對(duì)時(shí)間序列進(jìn)行降維。 SAX 的主要概念是根據(jù)給定的字母大小將時(shí)間序列轉(zhuǎn)換為符號(hào)。流程如圖 1 所示。圖 1 SAX 流程圖資料來(lái)源:招商證券量化團(tuán)隊(duì)整理從圖 1 可以看出,第一步是對(duì)給定的時(shí)間序列進(jìn)行標(biāo)準(zhǔn)化。以時(shí)間序列 T = 39.35,38.4, 36.65,42.2,40.83,39.9,36.75,37.5
14、,38.8,41.3為例,標(biāo)準(zhǔn)化后,T 變?yōu)?T=0.04,-0.21,-0.69,0.83, 0.45、0.20,-0.66,-0.45,-0.10,0.58。由于時(shí)間序列數(shù)據(jù)的維數(shù)始終很高,因此使用 PAA(一種降維方法)將維數(shù)從 n 減少到 m 個(gè)數(shù)據(jù)點(diǎn),其中 mn。首先將給定的時(shí)間序列基于預(yù)定義的片段大小劃分為 m 個(gè)片段。然后,計(jì)算每個(gè)段的平均值。最后,可以通過(guò)組合m 個(gè)平均值來(lái)形成給定時(shí)間序列的PAA 近似值。假設(shè)段大小設(shè)置為 3,則將 T減小為 T” = 0.28,0.49, 0.40,0.58。最后,根據(jù)給定的字母大小,將 T”中的數(shù)據(jù)轉(zhuǎn)換為符號(hào)序列。例如,因?yàn)?0.28 在-
15、0.84,-0.25)范圍內(nèi),所以它被映射為符號(hào)“ B”。以相同的方式,得出“ B,D,B,D”這一完整的符號(hào)序列。擴(kuò)展符號(hào)聚合近似在 SAX 中,對(duì)于給定的分段大小,使用PAA 來(lái)減少時(shí)間序列的維數(shù),然后將減少時(shí)間序列的每個(gè)點(diǎn)轉(zhuǎn)換為一個(gè)符號(hào)。但是,當(dāng)分段大小為較大值時(shí),使用單個(gè)符號(hào)表示分段可能不夠。因此將SAX 進(jìn)行擴(kuò)展,提出了ESAX 以解決此問(wèn)題。在每段中,SAX 僅將平均值轉(zhuǎn)換為符號(hào)。但是,在 ESAX 中,段的最大值,平均值和最小值均被轉(zhuǎn)換為符號(hào)。因此,每個(gè)段都由三個(gè)符號(hào)表示,它們更清楚地反映了每個(gè)段中的信息。假設(shè) s1,s2和 s3 是從第i 個(gè)股價(jià)序列的第j 個(gè)分段的 rij m
16、ax,rij min 和 rijavg 轉(zhuǎn)換而來(lái)的第一,第二和第三個(gè)符號(hào),并且 tmax,tmin 和 tavg 出現(xiàn)在時(shí)間軸上最大值,最小值和平均值的位置??梢酝ㄟ^(guò)以下方式確定三個(gè)符號(hào) s1,s2 和 s3 的順序:ESAX 的概念如圖 2 所示。圖 2 ESAX 流程圖資料來(lái)源:招商證券量化團(tuán)隊(duì)如圖 2 所示,首先根據(jù)均值和方差對(duì)時(shí)間序列進(jìn)行標(biāo)準(zhǔn)化。以時(shí)間序列 T = 13.7,13.75, 13.75,13.05,13.2,9.12,9.29,9.32,9.32,9.38,9.52,11.9,12.0,11.75,12.2,11.9,12.05,8.85,8.57,8.44為例。標(biāo)準(zhǔn)化后
17、,T 變?yōu)門(mén)= 0.7,0.72,0.72,0.53,0.57,-0.51,-0.47,-0.46,-0.44,-0.4,0.22,0.25,0.18,0.3,0.22,0.26,-0.58 ,-0.66,-0.69。假設(shè)將段大小設(shè)置為 5,則每組 5 個(gè)數(shù)據(jù)點(diǎn)將減少為 3 個(gè)點(diǎn)-最大值,最小值和平均值。減少的時(shí)間序列 T”是0.72、0.65、0.53,-0.51,-0.47,-0.44,-0.4、 0.11、0.3、0.26,-0.29,-0.69。最后,基于字母大小,將 T”中的數(shù)據(jù)點(diǎn)轉(zhuǎn)換為符號(hào)表示。例如,因?yàn)?0.72 在0.25,0.84)的范圍內(nèi),它被映射成符號(hào)“ D”。同樣,由
18、ESAX 導(dǎo)出的完整的符號(hào)序列為“ D,D,D,B,B,B,B,B,C,D,D,B,B”。三、遺傳算法的組成部分在本節(jié)中,提出了該算法的四個(gè)要素:代表染色體,初始總體,適應(yīng)和選擇以及遺傳操作。代表染色體假設(shè)一組S 由n 個(gè)股票組成,分別表示為s1,s2,.,sn。該算法的目的是將股票分為幾類,來(lái)獲得可用于形成各種股票投資組合的 GSP。圖 3 染色體示意圖資料來(lái)源:招商證券量化研究團(tuán)隊(duì)整理圖 3 顯示染色體由三個(gè)部分組成:分組情況,股票和股票投資組合。分組情況和股票部分用于指示如何將股票分為幾類。同一組 Gi 中的股票具有相似的屬性?;诠善蓖顿Y組合部分,從組中選擇股票以形成股票投資組合。如果
19、組數(shù)為 K,則股票投資組合中的最大股票數(shù)量也將為 K。因此,每個(gè)組由股票投資組合部分中的兩個(gè)基因表示,即 bi和 ui,其中 bi 表示實(shí)際數(shù)量,ui 是從組中購(gòu)買(mǎi)的選定股票 si 的購(gòu)買(mǎi)數(shù)量。當(dāng) bi 的值大于或等于 0.5,就將股票 si 選入投資組合中。 si 的一個(gè)購(gòu)買(mǎi)單位是 1000 股,下面給出了將 GSP 編碼為染色體的示例。初始總體設(shè)計(jì)生成初始總體的策略很重要,因?yàn)樗赡軙?huì)影響最終的優(yōu)化結(jié)果。本文利用股票的現(xiàn)金股息收益率來(lái)創(chuàng)建初始總體。接著,使用 Quanta Computer INC.(QCI)和 Taiwan Mobile Co.,Ltd.(TWM)的股票來(lái)具體說(shuō)明這樣做的
20、好處。表 1 顯示了基于每股現(xiàn)金股息和當(dāng)前股價(jià)的兩家公司的現(xiàn)金股息收益率。根據(jù)表 1,由于 QCI 的現(xiàn)金股息分別為NT$ 4、4、3.8 和 4,因此,2011、2012、2013和 2014 年 QCI 的現(xiàn)金股息收益率分別為 6.27,5.85,5.46和 5.78。同樣, TWM 的現(xiàn)金股息收益率分別為 5.46,5.14,2.07和 5.35。將 QCI 與TWM 的現(xiàn)金股利收益率進(jìn)行比較,由于 QCI 的現(xiàn)金股利收益率穩(wěn)定,因此 QCI 優(yōu)于 TWM。換句話說(shuō),購(gòu)買(mǎi) QCI 的投資者更有可能獲得穩(wěn)定的收益和較低的風(fēng)險(xiǎn)。表 2 中顯示了 n家公司的現(xiàn)金股息收益率(yi)。表 1 兩公
21、司的現(xiàn)金股利率資料來(lái)源:招商證券量化團(tuán)隊(duì)整理表 2 每個(gè)股票的現(xiàn)金股利率資料來(lái)源:招商證券量化團(tuán)隊(duì)整理表 3 每組平均現(xiàn)金股利占所有組的比例資料來(lái)源:招商證券量化團(tuán)隊(duì)整理根據(jù)股票的現(xiàn)金股息收益率,可以通過(guò)現(xiàn)有技術(shù)(例如 kNN 和k-means 聚類)將n 個(gè)股票分為K 個(gè)聚類。對(duì)于每個(gè)組,計(jì)算股票 avgCDi 的平均現(xiàn)金股利,并將其用于初始化股票投資組合。然后,計(jì)算每組平均現(xiàn)金股利占所有組的比例,如表 3 所示。表 3 顯示,每個(gè)組都有其自己的股票投資組合概率。以 G1 和 Gi 為例。當(dāng) G1 的平均現(xiàn)金股利大于 Gi 時(shí),G1 的股票更有可能被選擇形成投資組合。因此,更大的平均現(xiàn)金股利
22、增加了從組中挑選股票以形成股票投資組合的可能性。使用此策略,可以提高初始總體的質(zhì)量。適應(yīng)和選擇要評(píng)估個(gè)體的質(zhì)量,定義合適的適應(yīng)度函數(shù)很重要。根據(jù)適應(yīng)度值,可以選擇父代個(gè)體以概率的方式進(jìn)行交配,從而從總體中獲得大量個(gè)體。考慮到給定的股票價(jià)格序列和股票的基本信息,本文的目標(biāo)是得出一種 GSP,該 GSP 不僅可以實(shí)現(xiàn)良好的收益,而且可以提高組合中股票的相似性。因此,需要定義適當(dāng)?shù)倪m應(yīng)度函數(shù)來(lái)評(píng)估每個(gè)個(gè)體。本文基于先前方法中使用的適應(yīng)度函數(shù),開(kāi)發(fā)了兩個(gè)用于優(yōu)化 GSP 的新適應(yīng)度函數(shù)。前一種方法的適應(yīng)度函數(shù)如下:f(Cq) = PS(Cq) GB(Cq), 其中PS(Cq)表示投資組合滿意度,用于評(píng)
23、估用戶對(duì)利潤(rùn)和指定染色體需求的滿意度,是GB(Cq)組平衡度,用于計(jì)算相似組中的股票數(shù)量。參數(shù)用于控制兩個(gè)因素的相關(guān)性。利潤(rùn)滿意度當(dāng) GSP 的投資組合滿意度很高時(shí),通過(guò)染色體生成的股票組合可以獲得良好的利潤(rùn)收益。需要考慮給定的客觀標(biāo)準(zhǔn)和主觀標(biāo)準(zhǔn)這兩個(gè)因素。 PS(Cq)的計(jì)算公式為:PS(Cq) =NCp=1subPS(SPp)/NC, 其中 NC 是從染色體Cq生成的股票投資組合的數(shù)量,subPS(SPp)是第p 個(gè)股票投資組合SP 的滿意度。subPS(SP )的公式為:subPS(SP ) = ROI(SPp) ,pppsuitability(SPp)ROI(SP )是股票投資組合SP
24、 的利潤(rùn),其計(jì)算公式為:ROI(SP ) = n(SPi SPi) pppi=1sbu + Div(i) u + u Risk , 其中u 是股票s 的購(gòu)買(mǎi)數(shù)量,SPi,SPi,Div(i)和Risk 分iiiii isb i別是賣出價(jià),買(mǎi)入價(jià),現(xiàn)金股息和股票si的風(fēng)險(xiǎn),其可以通過(guò)歷史模擬(HS)計(jì)算。suitability(SPp)的計(jì)算公式為:suitability(SPp) = ICP(SPp) + PP(SPp) , 其中ICP(SPp)是投資資本處罰,PP(SPp) 是投資組合處罰,是用于控制這兩個(gè)因素影響的參數(shù)。ICP(SPp)用于測(cè)量SPp 中的投資資本對(duì)預(yù)設(shè)的最大投資資本的滿意
25、度,如公式所示:max Inves , if Cap max InvesICP(SP ) = Cappp, 其中Cap 是SP 的投資資本,max Inves是預(yù)pp Capp , if max Inves Cappp max Inves定義的最大投資。 PP(SPp) 用于測(cè)量SPp中購(gòu)買(mǎi)的股票數(shù)量對(duì)預(yù)設(shè)的最大購(gòu)買(mǎi)股票數(shù)量 num Comp , if numCom num Com的滿意度,如公式所示:PP(SP ) = numComp, 其中num CompnumCom , if num Comp 0; 其中 Ki=11, otherwise.為組數(shù),Ui表示組Gi的購(gòu)買(mǎi)單位ui是否在規(guī)定范
26、圍內(nèi)。如果購(gòu)買(mǎi)的單位在最小購(gòu)買(mǎi)單位和最大購(gòu)買(mǎi)單位之間,則Ui為 1,否則,Ui為-1。當(dāng)UB(Cq)為 1.4 時(shí),所有組的購(gòu)買(mǎi)單位均在規(guī)定范圍內(nèi);但是,當(dāng)UB(Cq)為 1.15 時(shí),某些組的購(gòu)買(mǎi)單位不在規(guī)定范圍內(nèi)。其他情況時(shí),UB(Cq)為 1。價(jià)格平衡度為了確保同一組中的股票價(jià)格盡可能相似,使用了價(jià)格平衡度的概念。價(jià)格平衡的公式為:PB(C) = MAX(1, kn |Secj| log |Secj|),其中Sec 是價(jià)格部分,用于表示用戶定qi=1j=1|Gi|Gi|j義的股票價(jià)格范圍,|Secj|是第j 部分的股票價(jià)格,|Gi|是組Gi中的股票數(shù)量。結(jié)合SF(Cq),UB(Cq)和P
27、B(Cq),優(yōu)化的適應(yīng)度函數(shù)f(Cq)的公式為:f(Cq) = PS(Cq)GB(Cq) UB(Cq).PB(Cq)距離因子最后一個(gè)評(píng)價(jià)因子是序列距離因子。該因子的目的是衡量同一組中股價(jià)序列的相似性。( Gi Gi)染色體C的序列距離SD(C )的公式為:SD(C ) = KseriesDist Bm ,Bn, 其中qqqi=1GiGiKTm Tni=1 GiGi 1Tm TnBGi, BGi 是兩個(gè)從股票價(jià)格序列TGi , TGi 轉(zhuǎn)化而得的符號(hào)序列,并且可以分別表示為mnmnBGi =b, b, , b和BGi =b, b , , b, seriesDist(BGi, BGi)是兩個(gè)符號(hào)序
28、列的mm1m2mknn1n2nkmn距離, 其 計(jì) 算 公 式 為 : seriesDist(BGi, BGi) = k symbloDist(b , b ) , 其中 mni=1minisymbloDist(bmi, bni)是兩個(gè)符號(hào)bmi, bni的距離,其計(jì)算公式為:symbloDist(bmi, bni) =0, if bmi = bni ;1, if bmi, bni相鄰;其中g(shù)ap(bmi, bni)是根據(jù)bmi和bmi中給定字母的順序計(jì)算的。gap(bmi, bni), otherwise.在本文中,使用SAX 和 ESAX 將時(shí)間序列轉(zhuǎn)換為符號(hào)序列。因此,根據(jù)上文中穩(wěn)定性因子
29、和系列距離因子的公式,定義了第一適應(yīng)度函數(shù):f1(Cq) = PS(Cq) GB(Cq) /SD(Cq), 其中參數(shù)和用于反映組平衡度和序列距離的相關(guān)性,可由用戶設(shè)置。另外,又定義了第二適應(yīng)度函數(shù):f (C) = PS(Cq)GB(Cq) UB(Cq)2q.PB(Cq)SD(Cq)遺傳操作算法中使用了三種遺傳操作:交叉,突變和倒位。這些與先前方法中采用的操作相同。由于編碼方案包含三個(gè)部分,因此對(duì)它們執(zhí)行遺傳操作的過(guò)程描述如下,首先對(duì)分組部分執(zhí)行交叉操作,隨機(jī)選擇兩個(gè)染色體作為基礎(chǔ)染色體和插入染色體。從插入染色體中選出一些組,并將其插入基礎(chǔ)染色體中。然后,刪除基礎(chǔ)染色體中的冗余組。在股票投資組合
30、上執(zhí)行交叉操作,可以使用單點(diǎn)交叉操作來(lái)生成新的后代。若對(duì)股票執(zhí)行突變操作,可以隨機(jī)選擇兩個(gè)組,兩個(gè)組的股票數(shù)量均大于 1,然后隨機(jī)選擇一組中的股票,將其重新分配給另一組。如果對(duì)股票投資組合進(jìn)行突變操作,首先隨機(jī)選擇一個(gè)基因進(jìn)行突變,當(dāng)所選基因在股票投資組合部分中位于奇數(shù)位置時(shí),其值從0,0.5更改為0.5, 1或從0.5,1更改為0,0.5。當(dāng)所選擇的基因在于偶數(shù)位置,從區(qū)間1,maxUnit中產(chǎn)生隨機(jī)值來(lái)替換舊的值。四、算法詳解本節(jié)介紹了使用 GGA 基于符號(hào)序列優(yōu)化 GSP 的算法,分別在第 4.1 節(jié)和第 4.2 節(jié)中給出偽代碼和建議的方法示例。算法的偽代碼為了清楚地描述該算法,其對(duì)應(yīng)的
31、偽代碼如圖 7 所示。圖 7 顯示了該算法基于現(xiàn)金股利(第 1 行)生成初始總體。然后將股票價(jià)格序列轉(zhuǎn)換為符號(hào)序列(第 2 至 4 行)。這里需要注意變量類型指示是使用 SAX 還是 ESAX 來(lái)獲得符號(hào)序列。然后通過(guò)設(shè)計(jì)的合適的適應(yīng)度函數(shù)(第 7 至 13 行)來(lái)評(píng)估每個(gè)染色體。當(dāng)在算法中使用適應(yīng)度函數(shù) f1 時(shí),將使用投資組合滿意度,組平衡度和序列距離以評(píng)估染色體,而使用適應(yīng)度函數(shù) f2 用于評(píng)估染色體時(shí),將計(jì)算兩個(gè)附加因子,即單位平衡度和價(jià)格平衡度。然后進(jìn)行遺傳操作以產(chǎn)生不同的染色體(第 14 至 17 行)。重復(fù)進(jìn)化過(guò)程,直到達(dá)到終止條件為止。最后,輸出即是獲得的 GSP(第 21 至
32、 22 行)。圖 5 優(yōu)化方法的偽代碼資料來(lái)源:招商證券量化團(tuán)隊(duì)整理具體示例本小節(jié)提供一個(gè)示例,用以解釋說(shuō)明通過(guò)給定的股價(jià)序列和相關(guān)信息推導(dǎo)出 GSP 的算法。假設(shè)有十二只股票,相關(guān)數(shù)據(jù)如表 4 所示,股票價(jià)格序列及其現(xiàn)金股利分別如表 5和表 6 所示。步驟 1:將 pSize 設(shè)置為十二。然后,使用以下子步驟生成初始總體:子步驟 1.1:將 K 設(shè)置為 4 時(shí),十二種股票被隨機(jī)分為四組,以形成分組部分。例如, C1 的分組部分可以是 G1:3,9,G2:2,4 ,10,G3:1、5、8、12,G4:6、 7、11。子步驟 1.2:根據(jù)股票的現(xiàn)金股利計(jì)算每組的平均現(xiàn)金股利。以 C1 中的組 G
33、1 為例,其股票的現(xiàn)金股利分別為 2.97 和 2.5。因此,G1 的平均現(xiàn)金股利為 2.73(=(2.97 + 2.5)/ 2)。同樣,計(jì)算 G2,G3 和 G4 的平均現(xiàn)金股利分別為 1.4、1.45 和 2.87。子步驟 1.3:計(jì)算每組平均現(xiàn)金股利占所有組的比例。由于 G1,G2,G3 和 G4 的平均現(xiàn)金股利分別為 2.73、1.4、1.45 和 2.87,以 G1 為例,G1 的平均現(xiàn)金股利在所有組中的比例為 0.323(= 2.73 /(2.73 + 1.4 + 1.45 + 2.87)。同樣,G2,G3 和 G4 占所有組中的平均現(xiàn)金股利比例分別為 0.165、0.17 和 0
34、.34。子步驟 1.4 和 1.5:將 numCom 設(shè)置為 3,則生成的集合 R 為0.23,0.31,0.46。因此,組 G1 和 G2 被選為投資組合中的候選組。子步驟 1.6 和 1.7:根據(jù)候選組生成股票投資組合。因?yàn)檫x擇了組 G1 和 G2,所以將 b1 和b2 設(shè)置為大于 0.5 的值,而將 b3 和b4 設(shè)置為小于 0.5 的值。每個(gè)組的已購(gòu)買(mǎi)單位數(shù)是從區(qū)間0,max-Unit內(nèi)隨機(jī)生成的。假設(shè) maxUnit 為 10,則生成以下十個(gè)初始染色體:步驟 2:使用以下子步驟將股票的股價(jià)序列轉(zhuǎn)換為符號(hào)序列:子步驟 2.1:對(duì)股票價(jià)格序列中的每個(gè)數(shù)據(jù)值進(jìn)行標(biāo)準(zhǔn)化。以 s1 的值 17
35、.3 為例,由于均值和方差分別為 18.63 和 0.9238,因此標(biāo)準(zhǔn)化后的值為-0.63。以相同的方式進(jìn)行標(biāo)準(zhǔn)化后,所有標(biāo)準(zhǔn)化的序列都顯示在表 7 中。表 4 例子中使用的股票資料來(lái)源:招商證券量化團(tuán)隊(duì)整理子步驟 2.2 至 2.4:然后利用 PAA 來(lái)降低標(biāo)準(zhǔn)化序列的維數(shù)。假設(shè) paaSize 設(shè)置為五個(gè),則生成 50(= 246/5 +1)個(gè)段。計(jì)算每個(gè)段的平均值,并將其用于表示該段。以股票 s1 的細(xì)分 seg1 為例,平均價(jià)值為-1.92(=(-0.63 + -0.95 + -0.58 + -0.85 + -0.49)/ 5)。假定給定的字母大小為 5 并使用 SAX,則 seg1
36、 的平均值小于-0.84,因此將其轉(zhuǎn)換為符號(hào)“ A”。同樣,s1 的符號(hào)系列為“ AAAABBBBAC EE”,表 8 中顯示了十二個(gè)符號(hào)系列。表 5 股價(jià)序列的 12 只股票資料來(lái)源:招商證券量化團(tuán)隊(duì)整理表 6 2011 年至 2013 年 12 只股票的現(xiàn)金股利資料來(lái)源:招商證券量化團(tuán)隊(duì)整理表 7:所有歸一化的股票序列資料來(lái)源:招商證券量化團(tuán)隊(duì)整理表 8:十二個(gè)代表性的股票序列資料來(lái)源:招商證券量化團(tuán)隊(duì)整理表 9 所有染色體的組合滿意度資料來(lái)源:招商證券量化團(tuán)隊(duì)整理表 10 染色體的組平衡資料來(lái)源:招商證券量化團(tuán)隊(duì)整理表 11 所有染色體的序列距離資料來(lái)源:招商證券量化團(tuán)隊(duì)整理表 12 所
37、有染色體的適應(yīng)度資料來(lái)源:招商證券量化團(tuán)隊(duì)整理步驟 3:使用以下子步驟計(jì)算每個(gè)染色體的適應(yīng)度值:子步驟 3.1:通過(guò)以下子步驟計(jì)算每個(gè)染色體的投資組合滿意度:子步驟 3.1.1:首先,生成可能的股票投資組合。以染色體 C1 為例,根據(jù)其分組部分(G1:3,9,G2:2,4,10,G3:1,5,8,12,G4:6,7, 11),共有 72(= 2343)個(gè)股票投資組合。所有這些都收集在集合 SP = 3,2,1,6,3,2,1,7,3,2,1,11,3,2,5,6,3,2,5,7,.,9,10,12,11中。子步驟 3.1.2:計(jì)算每個(gè)股票投資組合的利潤(rùn)。以 SP1:3,2,1,6為例,因?yàn)楦鶕?jù)
38、染色體 C1 :0.75、9、0.89、9、0.10、9、0.09、6的股票投資組合部分,s1,s2,s3 和 s6 的風(fēng)險(xiǎn)分別為-0.83,-0.65,-1.75 和-2.19,則 SP1 的利潤(rùn)為 6.84(= 9(9.52-13.7)+9(2.97)-9(1.75)+9( 18.3516.1)+9(0.6)-9(0.65)。4子步驟 3.1.3:計(jì)算每種股票投資組合的適應(yīng)度。假設(shè)最大購(gòu)買(mǎi)股票數(shù)量為 2,最大投資資本為 1000,則 SP1 的適應(yīng)度因子為 8.791 (=SCP(SP1)+ PP(SPp) )=(1000 / 268.2)+(3 / 2)4)。子步驟 3.1.4:計(jì)算每個(gè)
39、股票投資組合的穩(wěn)定性因子。將參數(shù) h 設(shè)置為 3;現(xiàn)金股利的第三大方差為 2.123。以 SP1 為例,因?yàn)橘?gòu)買(mǎi)了股票 s2 和 s3,并且它們的現(xiàn)金股利的標(biāo)準(zhǔn)化方差為 0 和 1.384,所以 SP1 的穩(wěn)定因子計(jì)算為 4.769(= 2(1+ max(0, 1.384)。子步驟 3.1.5 至 3.1.7:容易得知,SP1 的投資組合滿意度為 0.055(= 6.84(/(8.791) 1.54.769)。同樣,C1 的組合滿意度為-0.0426。重復(fù)子步驟 3.1.2 至 3.1.7,所有染色體的組合滿意度如表 9 所示。子步驟 3.2 到 3.4:若在此示例中僅使用組平衡度,根據(jù)染色體
40、的分組情況計(jì)算每個(gè)染色體的組平衡。以 C1 染色體為例,因?yàn)?C1 的分組情況是 G1:3,9,G2:2,4,10, G3:1,5,8,12,G4:6, 7,11,其組平衡度為 1.8441。表 10 顯示了所有染色體的組平衡。子步驟 3.5:使用 SAX 來(lái)計(jì)算每個(gè)染色體的序列距離。以 C1 為例。根據(jù)公式,C1 的 SAX 距離為 51.0(=(seriesDist(s3,s9)+ seriesDist(s2,s4)+ seriesDist(s2, s10)+ seriesDist(s4,s10)+ seriesDist(s1,s5)+ seriesDist(s1,s8)+ seriesD
41、ist(s1,s12)+ seriesDist(s5,s8)+ seriesDist(s5,s12)+ seriesDist(s8,s12)+ seriesDist(s6,s7)+ seriesDist(s6,s11 )+ seriesDist(s7,s11)/ 13)。表 11 顯示了所有染色體的序列距離。子步驟 3.6:假設(shè)參數(shù)和分別為 5 和 2。那么,C1 染色體的適應(yīng)度值為 0.00147(=(-0.1794221.84415 / 51.02)。所有染色體的適應(yīng)度值在表 12 中給出。步驟 4:對(duì)總體執(zhí)行選擇操作以形成下一個(gè)總體,此處使用了精英選擇策略。在此示例中,十個(gè)初始染色體被選
42、擇用以形成下一個(gè)總體。步驟 5:對(duì)總體執(zhí)行兩階段交叉操作。在第一階段,假設(shè)選擇了染色體 C1 和 C5。它們的分組情況分別是“ G1:3,9,G2:2,4,10,G3:1,5,8,12,G4:6, 7,11”和 “ G5:2,6,11,G2:12,G3:3,5,8,9,10,G4:1,4,7”。 設(shè)插入基礎(chǔ)染色體C5 的位置為 G3,染色體 C1 的插入順序?yàn)椤?G:3,5,8,9,10”。因此,在執(zhí)行交叉操作之后,C1變?yōu)椤?G1:3,5,8,9,10,G2:2,4,G3:1,12,G4:6,7,11?!?接著,將交叉的第二階段應(yīng)用于染色體 C1和 C5。因?yàn)?C1和 C5 的股票投資組合部
43、分分別為“ 0.57,5,0.04,8,0.05,6,0.84, 8” 和 “ 0.75,9,0.89,9,0.10,9,0.09,6”,假定切點(diǎn)為 2,新的股票投資組合部分為C1”:“ 0.75,9,0.04,8,0.05,6,0.84,8 和 C5:“ 0.57,5,0.89, 9,0.10,9,0.09,6。”步驟 6:對(duì)總體執(zhí)行兩階段突變操作。第一階段,股票從一組隨機(jī)轉(zhuǎn)移到另一組。染色體 C2 的分組情況為:“ G1:4,9,G2:2,8,12,G3:7,G4:1,3,5,6, 10,11”。 舉例來(lái)說(shuō),若將 G4 中的 s11 移至 G3;染色體 C2的分組情況變?yōu)椤?G1:4,9,
44、G2:2,8,12,G3:7,11,G4:1,3,5,6,10?!痹诘诙A段,如果 C2 的 b2 發(fā)生突變,則染色體 C2的股票投資組合部分將變?yōu)椤?0.12,9,0.56, 8,0.79,8,0.05,7”。步驟 7:對(duì)總體執(zhí)行倒位操作。取染色體 C4 的分組情況:“ G1:2,9,10,G2:3,12, G3:1,8,11,G4:4,5,6,7”。舉例來(lái)說(shuō),假設(shè) G1 和 G4 已交換,分組情況將變?yōu)椤?G1:4,5,6,7,G2:3,12,G3:1,8,11,G4:2,9,10?!辈襟E 8 和 9:當(dāng)滿足終止條件時(shí),將輸出具有最佳適應(yīng)性值的 GSP。在此示例中,經(jīng)過(guò) 150 代,得出的
45、 GSP 如下所示:Cbest:G1:7,8,9,11,G2:4,6,G3:1,10,12,G4:2,3,5,0.90,5,0.68,9,0.06,9,0.84,9。染色體 Cbest 將十二只股票分為四組, G1 組包含 s7,s8,s9 和 s11; G2 組包含 s4和 s6; G3 組包含 s1,s10 和 s12;組 G4 包含 s2,s3 和 s5。此外,G1,G2 和 G4可以形成可能的股票投資組合。換句話說(shuō),可以提供二十四種股票投資組合(= 423)給用戶。五、實(shí)驗(yàn)結(jié)果在這一節(jié)中,我們進(jìn)行了實(shí)驗(yàn),來(lái)說(shuō)明本文提出的方法在實(shí)際的金融數(shù)據(jù)集上的優(yōu)點(diǎn)。參數(shù)設(shè)置見(jiàn)表 13。表 13 參數(shù)
46、設(shè)定資料來(lái)源:招商證券量化團(tuán)隊(duì)整理第 5.1 節(jié)描述了實(shí)驗(yàn)數(shù)據(jù)集。第 5.2 節(jié)對(duì)得出的 GSP 進(jìn)行了分析。第 5.3 節(jié)比較了本文提出的方法和過(guò)去的方法在ROI 上的結(jié)果,并在第 5.4 節(jié)進(jìn)行了討論。實(shí)驗(yàn)數(shù)據(jù)集數(shù)據(jù)集包含從臺(tái)灣證券交易所收集的 2012/01/01 至 2014/12/31 的數(shù)據(jù)。該數(shù)據(jù)集包含 31 只股票,其屬性包括股價(jià)、現(xiàn)金股利和風(fēng)險(xiǎn)值。每個(gè)股票價(jià)格序列包括大約 742 個(gè)數(shù)據(jù)點(diǎn),每個(gè)數(shù)據(jù)點(diǎn)代表一天的收盤(pán)價(jià)。股票的風(fēng)險(xiǎn)值是用 HS28和從給定的股票價(jià)格序列轉(zhuǎn)換而來(lái)的月平均序列來(lái)計(jì)算的。該數(shù)據(jù)集總共包含 15 個(gè)股票類別,其中前三名是半導(dǎo)體、通信網(wǎng)絡(luò)和金融。31 個(gè)股
47、票價(jià)格序列如圖 5 所示。圖 5 數(shù)據(jù)集的股價(jià)序列資料來(lái)源:招商證券量化團(tuán)隊(duì)整理從圖 5 可以看出,大多數(shù)股票價(jià)格在 0 到 100 之間,有些在 100 到 400 之間,還有一些大于 400 。對(duì)我們的研究主題感興趣的讀者, 實(shí)驗(yàn)數(shù)據(jù)集可從此鏈接獲得 ( HYPERLINK .tw/chchen/StockPriceSeries(31).rar) .tw/chchen/StockPriceSeries(31).rar)。在下一節(jié)中,將本文提出的方法的結(jié)果與過(guò)去的方法4進(jìn)行了比較,以顯示本文提出方法的優(yōu)點(diǎn)。為了區(qū)分這兩種方法,我們用原先的適應(yīng)度函數(shù)“Previous Approach”來(lái)命名
48、過(guò)去的方法。在本文提出的方法中,使用公式(19)和(20)中定義的兩個(gè)適應(yīng)度函數(shù) f1 和 f2 來(lái)挖掘 GSP;這兩個(gè)函數(shù)分別被命名為“Proposed Approach(f1)”和 “Proposed Approach(f2)”得出的股票投資組合分析首先,本節(jié)介紹并分析了基于 Proposed Approach(f1)和兩年培訓(xùn)數(shù)據(jù)集(2012 年至 2013 年)得出的 GSP。在分別使用 SAX 和 ESAX 距離算法的情況下,表 14 和表 15 對(duì)比了基于Proposed Approach(f1)的初始 GSP 和得出的最佳 GSP表 14 和表 15 顯示,得出的 GSP 在適應(yīng)
49、值方面優(yōu)于初始 GSP。此外,從投資組合滿意度和序列距離得分可以看出,本文提出的方法不僅獲得了較好的 ROI,而且提高了股票序列在組合中的相似性。以表 14 中得出的 GSP 為例,其投資組合滿意度和序列距離分別為 41.04 和 10,說(shuō)明得出的 GSP 優(yōu)于初始 GSP。同樣的現(xiàn)象也可以在表 15 中找到。然而,采用 SAX 和 ESAX 的本文提出的方法得出的 GSP 的價(jià)格相似度分別為3.4 和 6.2,這意味著這兩組股票的購(gòu)買(mǎi)價(jià)格有些不同。表 14 基于 Proposed Approach(f1)用 SAX 的 GSP 的比較資料來(lái)源:招商證券量化團(tuán)隊(duì)整理表 15 基于 Propos
50、ed Approach(f1)用 ESAX 的 GSP 的比較資料來(lái)源:招商證券量化團(tuán)隊(duì)整理因此,在兩年的訓(xùn)練數(shù)據(jù)集(2012 年至 2013 年)上進(jìn)行了實(shí)驗(yàn),分別使用 SAX 和 ESAX距離算法,對(duì)比基于Proposed Approach(f2)的初始 GSP 和得出的 GSP。結(jié)果分別見(jiàn)表 16 和表 17。表 16 此處錄入標(biāo)題資料來(lái)源:招商證券量化團(tuán)隊(duì)整理表 17 基于 Proposed Approach(f2)的 GSP 與 ESAX 的比較資料來(lái)源:招商證券量化團(tuán)隊(duì)整理表 16 和表 17 顯示,得出的 GSP 在適應(yīng)值方面優(yōu)于初始 GSP。由于表 16 和表 17 中得出的
51、GSP 的序列距離分別為 9 和 40,很明顯,股價(jià)序列的相似性有所增加,并且優(yōu)于初始 GSP。此外,通過(guò)比較表 16 和表 17 的得出的 GSP 與表 14 和表 15 的得出的 GSP,我們還可以發(fā)現(xiàn),對(duì)于高單位平衡和低價(jià)格平衡的 GSP,Proposed Approach(f2)比 Proposed Approach(f1)??偟膩?lái)說(shuō),我們可以得出這樣的結(jié)論:由于序列距離的減小,同一組得出的 GSP 中股票價(jià)格序列的相似性增加。為了更清楚地驗(yàn)證這一點(diǎn),我們進(jìn)行了實(shí)驗(yàn),從股票價(jià)格序列在組合中的相似性的角度比較了過(guò)去和本文提出的方法的結(jié)果。分別基于 Previous Approach、Pr
52、oposed Approach(f1)、Proposed Approach(f2)得出的 GSP 的股價(jià)序列如圖 9-11 所示。圖 6 按過(guò)去方法的股價(jià)序列資料來(lái)源:招商證券量化團(tuán)隊(duì)整理圖 7 proposed approach(f1)組股價(jià)序列資料來(lái)源:招商證券量化團(tuán)隊(duì)整理圖 8 proposed approach(f2)組股價(jià)序列資料來(lái)源:招商證券量化團(tuán)隊(duì)整理圖 9 顯示 G1 組和 G6 組中的股票價(jià)格序列不同于其他組。例如,對(duì)于 G1,股票代號(hào) 2357、2207 和 2912 代號(hào) 1402、1326 和 1303 不同。比較圖 9 與圖 10、圖 11 中各組的股價(jià)序列,我們可以
53、觀察到,本文提出的方法可以增加股票價(jià)格序列在組合上的相似性。舉圖 10(a)到(d)為例,很明顯,組合中的股票價(jià)格序列相似性比圖9 中的更好,因?yàn)橹挥泄善贝?hào)2207 不同于G2 中的其他股票,并且其他三組中的股票價(jià)格序列很相似。然后,比較了圖 10 和圖 11 中各組的股票價(jià)格序列圖。我們還可以觀察到,當(dāng)使用適應(yīng)度函數(shù) f2 時(shí),組內(nèi)股價(jià)序列比使用適應(yīng)度函數(shù) f1 時(shí)更接近。此外,由于 f2 考慮了價(jià)格均衡,結(jié)果還表明,圖 11 中組合的股票買(mǎi)入價(jià)格非常相似。最后,為了說(shuō)明本文提出的方法的優(yōu)點(diǎn),將其與過(guò)去的方法在 SAX和 ESAX 距離方面進(jìn)行了比較,如表 18 所示。表 9 過(guò)去和本文提出的方法得出的 GSP 的 SAX 和 ESAX 距離資料來(lái)源:招商證券量化團(tuán)隊(duì)整理表 10 過(guò)去和本文提出的方法在一年的訓(xùn)練和測(cè)試集上的平均回報(bào)資料來(lái)源:招商證券量化團(tuán)隊(duì)整理表 11 過(guò)去和本文提出的方法在兩年的訓(xùn)練和測(cè)試集上的平均回報(bào)資料來(lái)源:招商證券量化團(tuán)隊(duì)整理表 18 顯示,過(guò)去方法的 SAX 和 ESAX 距離分別為 14 和 47。與本文提出的方法得到的距離進(jìn)行比
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度玻璃隔斷行業(yè)安全風(fēng)險(xiǎn)評(píng)估與控制合同3篇
- 二零二五版美容美發(fā)產(chǎn)品跨境電商銷售合作協(xié)議4篇
- 玻璃幕墻維修施工方案
- 二零二五版美容院供應(yīng)鏈管理及股權(quán)投資協(xié)議4篇
- 環(huán)氧砂漿施工方案
- 2025年P(guān)DA市場(chǎng)拓展專用采購(gòu)合同3篇
- 2025年度智能家居公司成立合作協(xié)議書(shū)正式版4篇
- 2025年度新型農(nóng)業(yè)貸款合同標(biāo)的特征分析3篇
- 2024版鋁單板采購(gòu)合同
- 會(huì)展搭建施工方案
- 稱量與天平培訓(xùn)試題及答案
- 超全的超濾與納濾概述、基本理論和應(yīng)用
- 2020年醫(yī)師定期考核試題與答案(公衛(wèi)專業(yè))
- 2022年中國(guó)育齡女性生殖健康研究報(bào)告
- 各種靜脈置管固定方法
- 消防報(bào)審驗(yàn)收程序及表格
- 教育金規(guī)劃ppt課件
- 呼吸機(jī)波形分析及臨床應(yīng)用
- 常用緊固件選用指南
- 私人借款協(xié)議書(shū)新編整理版示范文本
- 自薦書(shū)(彩色封面)
評(píng)論
0/150
提交評(píng)論