遺傳算法在股票中的運用_第1頁
遺傳算法在股票中的運用_第2頁
遺傳算法在股票中的運用_第3頁
遺傳算法在股票中的運用_第4頁
遺傳算法在股票中的運用_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、基于浮點數(shù)編碼的遺傳算法來實現(xiàn)股票趨勢的預(yù)測*程強匕張永昌",李律y華中師范大學(xué)計算機科學(xué)與技術(shù)系,武漢430079)&華中師范大學(xué)計算機科學(xué)與技術(shù)系,武漢430079) “華中師范大學(xué)計算機科學(xué)與技術(shù)系,武漢430079)technical indicators optimization in stock trend following using float-encoding genetic algorithmchengqiang1, zhang yongchang2, li binji31 (department of computer science and tech

2、nology, centre china normal university, wuhan 430079,china) 2(department of computer science and technology, centre china normal university, wuhan 430079,china) '(department of computescience and technology, centre china normal university, wuhan 430079,china)abstract: stock trend following plays

3、 an important role in algorithmic trading . in this paper, we establish a model employing float-encoding genetic algorithm (fga) to determine when to buy and sell called p & q following the amount of an uptrend and downtrend respectively. in our model, we firstly smooth the closing price by expo

4、ncntia】 moving average (ema) and partition the sample data into two parts respectively for training and testing. then in the training section, the p & q values are optimized with the objective of gaining highest profits by fga within the given scopes based on the risky that users can take finall

5、y we examine the performance of the model by trading on the testing data the experiment conducted on hang sang index (hsi), hong kong shows that the model is very promisingkeywords: stock trend following, p & q、float-encoding genetic algorithm, exponential moving average摘 要:股票趨勢預(yù)測在遺傳算法交易中起到了重要作用

6、,在這篇文章里,我們建立一個根據(jù)相對的上升量和 下降量來決定什么時候買和什么時候賣的所謂p&q點的基于遺傳算法的模型。在我們的模型里,我們首先利用 指數(shù)平均來平滑我們的股票數(shù)值而且我們把樣本數(shù)據(jù)化為兩部分,一部分用來訓(xùn)練模型,另一部分用來測試模型。 在訓(xùn)練階段,這個p和q值根據(jù)我們獲得的股票收益的最大值而用遺傳算法來優(yōu)化的,當(dāng)然這也與我們設(shè)計的 能夠承受的最大風(fēng)險率相關(guān)。最后我們利用測試數(shù)據(jù)來交易,通過這我們可以檢驗這個模型的表現(xiàn)怎么樣。這個 實驗是基于恒生指數(shù)的,通過實驗,反應(yīng)這個模型非常有前途。keywords:股票趨勢預(yù)測,p&q,遺傳算法的浮點數(shù)編碼,指數(shù)平均平滑1引言

7、股票趨勢的跟蹤和趨勢的預(yù)測變比而言是一種不同的交易技巧。它根據(jù)市場的趨勢和基于己經(jīng)規(guī)定的原 則做交易。這個原則就是什么時候買和什么時候這個核心問題。因此在這篇論文里我們建議一個p和q的技 術(shù)指標(biāo)來指明上升的或者下降的屋,這個量用來激發(fā)買或者賣的信號,這個信號是由基于浮點數(shù)的遺傳算法 決定的。一旦用戶根據(jù)他們所能承受的風(fēng)險而給定p和q值,我們就會根據(jù)p和q的范用以及過去十年使這個收 益達到垠人值的原則來精確計算出p和q的值。然后用戶就可以根據(jù)這兩個值來做交易。不僅如此,這兩個值會根據(jù)最新的股票數(shù)據(jù)來定期更新。這篇文章提供遺傳算法來優(yōu)化p和q的值。遺傳算法的能力是基于自然和人類基因的機制。它能根據(jù)

8、以 前的解決方案來改進未來的解決方案的變現(xiàn)。遺傳算法的第一個優(yōu)勢是它針對搜索空間利用隨機操作來代替 確定的準(zhǔn)則。例外它的一個優(yōu)勢是并行搜索更多的優(yōu)化解。傳統(tǒng)的基于二進制表示的遺傳算法面對多維或者大取值范圍的數(shù)據(jù)有很多缺點。舉一個例子,在我們的 模型屮,如果用戶提供p和q值范圍比較大得話。對應(yīng)的用二進制表示的染色體就會非常長,這對于我們的 計算會浪費很長的時間。然而對于我們在浮點數(shù)編碼用到的浮點數(shù)編碼的基因就可以避免上面捉到的問題, 因而它能為我們的模型提供一個令人滿意的結(jié)果。在這篇文章里,我們首先介紹趨勢跟蹤的概念,然后我們是用來平滑我們股票市場的股票價格的指數(shù)平 均平滑方法的介紹,接著是在我

9、們模型中用到的用來優(yōu)化p和q值的浮點數(shù)表示的遺傳算法。最厲是我們在 恒生股票的實驗和我們最終的結(jié)論。2股票趨勢跟蹤的交易模型2.1取票趨勢跟蹤趨勢跟蹤即指跟趨勢一起走,或者就是努力跟蹤方向。如果市場在上升,那么一個人有理由相信它會 繼續(xù)上升-段時間,如果市場在下降,他們就會相信市場還會持續(xù)下降一段時間,因此他們開始賣出或賣空。 趨勢跟蹤來源于股票市場交易的“勢頭理論”,這個理論指出,只要上升,就會上升一段時間,只耍下降,就 會繼續(xù)下降一段時間,因此我們可以利用這種趨勢跟蹤來獲益。2.2指數(shù)平均平滑在真實的市場中,股票價格波動不是線性的,相反它非常不穩(wěn)定,即價格會重復(fù)的上升或者下降。因此 我們不

10、可能(不現(xiàn)實)在這種趨勢下來應(yīng)用p和q值。因此,我們需要通過技術(shù)指標(biāo)來平滑這種波動的指數(shù) 價格。公式如下:ema =(price (/) - ema (/ - 1) x 二一+ ema (r-1)n + 1其屮:t是交易的那一天,n是平滑之后的那一天,n的值越小,那么ema數(shù)值就能更好的跟蹤股票價 格。price(i)就是i這一天股票的價格。2.3遺傳算法模型中的浮點數(shù)編碼同遺傳算法中的二進制編碼不同,浮點數(shù)編碼在染色體中應(yīng)用真實的數(shù)值和一些特殊的操作。這樣它避 免了二進制編碼中編碼和解碼需要耗費人量計算時間和存儲空間。在二進制遺傳算法中,有三個基本的操作: 選擇,交叉,變界。每一代中,每一個

11、個體的適應(yīng)值被計算出來。適應(yīng)值更人的個體在進化中可以更好的生 存,同時,適應(yīng)度更差的個體會更容易被清除出來。2.3.1 遺傳算法染色體的編碼正如上而所說,我們在遺傳算法中迭代的h的就是要找出p和q的兩個值,這個值會使我們的收益值達 到戢大,當(dāng)然p和q的范用是根據(jù)用戶所能承受風(fēng)險確定的。染色體如下:pq在遺傳算法的迭代中,p和q值會變化,使適應(yīng)值繪大,一旦它滿足繪終的條件,迭代就會結(jié)束。2.3.2遺傳算法的適應(yīng)度函數(shù)適應(yīng)度函數(shù)是用來衡量個體的生存能力的。這意味著適應(yīng)度更大的個體在競爭中就叮以更好的生存下來, 在這篇論文里,適應(yīng)度函數(shù)就是在訓(xùn)練模型階段股票獲得的最人總收益。在我們的實驗中我們僅僅應(yīng)

12、用賣出價格和買進價格之間的差值。公式如下:nprofits = (sellingprice(i, t )-buyingprice(i, t )»=i英中:buyingpriceii. t)和sllingpric(i, t)指的是在第i次中賣出價格和買進價格。t,是對 應(yīng)的時間。n是在訓(xùn)練數(shù)據(jù)屮交易的次數(shù)。2.3.3選擇選擇的hl的就是要在進化中選取適應(yīng)環(huán)境授好的個體,這些被選中的個體會根據(jù)他們適應(yīng)值被存進交配 庫里。在這篇論文里,我們采取輪盤賭選擇算法來執(zhí)行這個操作,描述如下:(1) 計算每個個體的適應(yīng)值。(2) 計算每個個體的比例:pr( /)= 嚴(yán) 為二 jimess (/)(3

13、) 計算毎個個體的選擇概率:p=(4) 然后在(01)之間任意選取一個r。選擇滿足條件p(i)< r < p(i + 1)的第(i+1)山個體, 重復(fù)這個步驟直至制定的個體被選擇到。2.3.4交叉在遺傳算法中交義是一個特別重要的操作。在指定的p概率下,這是一個基因的結(jié)合并產(chǎn)生新個體的 過程,交叉的過程如下:r = (l_a)片+0 遲, 爲(wèi)=(1_0)迅+0.片, if(pi < l) then p; = l, r = 1, 2 if (p, > /?) then pi = r,i = 1, 2英中:pl, p2是父代的基因,pl p2,是交叉后對應(yīng)的后代的基因,a邛是

14、在(0-r), r<=u l, r是p的取值范圍。q的情況和p類似。2.3.5變異變異是一種使染色體中一個或多個基因從當(dāng)前的狀態(tài)中變化出來,這樣就擴大了搜索空間,這樣冇助于 減小操作陷入局部優(yōu)化最優(yōu)解的概率,過程如下:random (0,1) = 0,random (0,1) = 1.)p + k(r-p)y、when p-k-(p-l)/, when其中:k是恒定的學(xué)習(xí)參數(shù)。q的情況類似。3實驗和結(jié)果31訓(xùn)練階段:實驗是基于恒生指數(shù)的從2001.1.12009.9.1的股票數(shù)據(jù)。其中:前面2000個記錄用來訓(xùn)練最好的p和q值,剩下的從2009.1.20-2011.9.14的記錄用來測試

15、。數(shù)據(jù)如下:2010年的恒生指數(shù):經(jīng)過ema (25)處理z后的數(shù)據(jù)說明:對應(yīng)短期.中期.長期有三種不同的參數(shù)10, 25,50用來對數(shù)據(jù)進行平滑處理。經(jīng)過了 160代,p和q值相對穩(wěn)定在421.330815和684.627900.輸岀最憂個體:415.875137利潤:12564.680000686.561534末代最憂:421.330815利潤:12502.880000684.6279003.2測試階段k = 0.005 ,變異率:0.02,交叉率:0.98,種群人?。?0,代數(shù):1000代。對應(yīng)每個p和q值的收益是:輸出雖憂個體:415.875137利潤:4441.500000686.5

16、61534末代最憂:421.330815利潤:1221.770000684.627900說明:p和q范圍太小以及ema值比較小時會使交易的頻率太高,這樣就會包括一些錯誤的交易信號 的產(chǎn)生。但是p和q值范圍太大以及ema值太高時,會錯過一些交易信號,這取決于用戶所能承受的風(fēng)率。4 references:11.smith, t.f,waterman, m.s.: identification of common molecular subsequences. j. mol. biol. 147, 195197 (1981)2 .may, p., ehrlich, h.c., steinke, t.

17、: zib structure prediction pipeline: composing a complex biological workflow through web services. in: nagel, w.e., walter, w.v., lehner, w. (eds.) euro-par 2006. lncs, vol. 4128, pp. 11481158. springer, heidelberg (2006)3 .foster, i., kesselman, c.: the grid: blueprint for a new computing infrastructure. morgan kaufmann, san francisco (1999)4 .czajkowski, k,fitzgerald, s., foster, i., kesselman, c.: grid information services for distributed resource sharing. in: 10th ieee international symposium on high performance distributed computing, pp. 181 184. ieee pres

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論