版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、基于多元線性回歸的期權(quán)價格預測模型王某某(北京航空航天大學 計算機學院 北京 100191)作者簡介:王某某,北京航空航天大學研究生 郵箱:bnuwjx。摘 要:期權(quán)是國際市場成熟、普遍的金融衍生品,是金融市場極為重要的金融工具。2015年2月9日,上海證券交易所正式推出了我國首支場內(nèi)交易期權(quán)上證50ETF期權(quán),翻開了境內(nèi)場內(nèi)期權(quán)市場的新篇章。50ETF期權(quán)上市以來,市場規(guī)模逐步擴大,其發(fā)展情況境外期權(quán)產(chǎn)品相同時期。本文以此為研究背景,以“50ETF購12月1.95”這支期權(quán)為研究對象,以今日開盤價、收盤價、最高價、最低價、結(jié)算價、成交量、成交額、持倉量、漲停價和跌停價為解釋變量,通過多元線性
2、回歸模型,預測該期權(quán)的明日收盤價。本次研究以多元線性回歸的全模型(模型1)為出發(fā)點,通過異方差檢驗、殘差的獨立性檢驗、誤差的正太分布檢驗以及多重共線性檢驗,說明該模型不違反回歸的基本假設(shè)條件。進而通過主成分回歸(模型4)和逐步回歸(模型5)進行降維,結(jié)果表明因變量與解釋變量之間存在強烈的線性相關(guān)關(guān)系,且主成分回歸和逐步回歸相比全模型有更好的預測能力。關(guān)鍵詞:期權(quán)價格 多元線性回歸 50ETF 多重共線性 因子分析一、引言期權(quán)(option)是依據(jù)合約形態(tài)劃分的一種衍生品,指賦予其購買方在規(guī)定期限內(nèi)按買賣雙方約定的價格(即協(xié)議價格或行權(quán)價格)購買或者出售一定數(shù)量某種金融資產(chǎn)(即標的資產(chǎn))的權(quán)利的
3、合約。期權(quán)購買方為了獲得這個權(quán)利,必須支付給期權(quán)出售方一定的費用,稱為權(quán)利金或期權(quán)價格1。2015年2月9日,上海證券交易所正式推出了我國首支場內(nèi)交易期權(quán)上證50ETF,翻開了境內(nèi)場內(nèi)期權(quán)市場的新篇章。期權(quán)是與期貨并列的基礎(chǔ)衍生產(chǎn)品,是金融市場極為重要的金融工具之一。自50ETF上市以來,市場規(guī)模逐步擴大。2015年2月日均合約成交面值為5.45億元,12月就達到了47.69億元,增長了7.75倍;2月日均合約成交量為2.33萬張,12月就達到了19.81萬張,增長了7.5倍;2月權(quán)利金總成交額為2.48億元,12月就達到了35.98億元,增長了13.51倍1。我國股票市場有上億的個人投資者,
4、是一個較為典型的散戶市場1。相較于專業(yè)投資機構(gòu)講,散戶缺乏時間,精力以及專業(yè)分析,投資具有很大的投機行為。對于這些投資者來說,期權(quán)價格的變動則是他們最為關(guān)注的問題,其變化直接影響到自身的收益。在實際情況中,影響股票價格的因素很多,涉及到金融政策、利率政策以及國際市場等因素,其作用機制也相當復雜2。因此,對于期權(quán)價格預測的研究,則可以降低投資者的投資風險,及時調(diào)整投資結(jié)構(gòu),從而保障自身的收益。本文選擇“50ETF購12月1.95(期權(quán)代碼:10000629)”這支期權(quán)作為研究對象,根據(jù)過去一個月內(nèi)期權(quán)的交易數(shù)據(jù),以今日開盤價、收盤價、最高價、最低價、結(jié)算價、成交量、成交額、持倉量、漲停價和跌停價
5、為解釋變量,通過多元線性回歸模型,預測該期權(quán)的明日收盤價。下文由如下幾部分構(gòu)成:第二部分介紹了本次研究的數(shù)據(jù)集,包括數(shù)據(jù)來源、和數(shù)據(jù)字段;第三部分重點介紹了各個多元線性回歸模型,包括全模型及異方差檢驗,殘差的獨立性檢驗、誤差的正太分布檢驗和多種共線性檢驗,在第4小節(jié)和第5小節(jié)分別采用主成分回歸和逐步回歸對模型加以改善;第四部分運用第三部分建立的各個模型對期權(quán)價格進行了預測;第五部分對本文研究進行了總結(jié)并未來的研究加以展望。二、數(shù)據(jù)說明本次研究的數(shù)據(jù)來源于Wind資訊金融終端,從上面獲取了“50ETF購12月1.95”這支期權(quán)自2016年10月24日至2016年11月24日(只包含工作日)共計2
6、4日的交易數(shù)據(jù)。經(jīng)過整理后得到最終的數(shù)據(jù)字段,見表1。表 1 期權(quán)交易數(shù)據(jù)字段收盤價開盤價最高價最低價結(jié)算價成交額成交量持倉量漲停價跌停價 期權(quán)交易數(shù)據(jù)見附錄1。三、建模1 符號說明 各個變量及其符號說明見表2。表 2 各個變量及其符號說明變量符號明日收盤價Y今日開盤價X1今日收盤價X2今日最高價X3今日最低價X4今日結(jié)算價X5今日成交額X6今日成交量X7今日持倉量X8今日漲停價X9今日跌停價X102 解釋變量與指標變量的散點圖在建立模型之前,首先利用MATLAB繪制各個解釋變量與指標變量(明日收盤價)之間的散點圖,觀察各個解釋變量與指標變量之間的關(guān)系,散點圖結(jié)果見圖1。圖 1 各個解釋變量與
7、指標變量(明日收盤價)的散點圖通過圖一中的散點圖可以看出,明日收盤價與今日收盤價、今日開盤價、今日最高價、今日最低價、今日結(jié)算價、今日持倉量、今日漲停價以及今日跌停價之間有較為明顯的線性關(guān)系;而與今日成交額以及今日成交量之間的線性關(guān)系并不明顯。3 全模型 通過散點圖我們觀察到指標變量與各個解釋變量之間大致上為線性關(guān)系,所以考慮多元線性回歸模型進行建模。3.1 模型建立與求解首先建立各個解釋變量與指標變量的全模型,即考慮如下模型:Y=0+1X1+10X10+ N0, 2 式中,0,1,10,2都是與解釋變量無關(guān)的未知參數(shù),其中0,1,10稱為回歸系數(shù)。在MATLAB中使用regress函數(shù)即可求
8、解此多元線性回歸模型,求解結(jié)果見表3.表 3 MATLAB求解全模型結(jié)果回歸系數(shù)回歸系數(shù)的估計值回歸系數(shù)置信區(qū)間00.1555-0.1938 0.504911.8288-0.9212 4.578720.0586-1.5671 1.684330.6199-0.4249 1.66474-1.0532-1.9703 -0.13625-1.2208-3.8759 1.434260.0000-0.0000 0.00007-0.0000-0.0001 0.00008-0.0000-0.0000 0.000090.3233-1.0317 1.67831000 0R2 = 0.9489 F = 26.7989
9、 p < 0.0001 s2 = 0.0001從上表容易看出模型(1)成立,此時指標變量與解釋變量滿足的回歸模型為:Y=0.1555+1.8288X1+0.0586X2+0.6199X3-1.0532X4-1.2208X5+0.3233X9 (模型1)在MATLAB中畫出模型1的殘差分布,見圖2。圖 Error! Main Document Only. 模型1的殘差分布除第12個數(shù)據(jù)外其余殘差的置信區(qū)間均包含零點,因此第12個點應(yīng)當視為異常點,將其剔除后重新計算,得到模型2:Y=0.2484+1.5432X1+0.0291X2+0.7482X3-0.8726X4-1.1292X5+0.1
10、584X9 (模型2)模型2的R2 = 0.9736,F(xiàn) = 49.1655,p < 0.0001,s2 = 0.0001。但同時我們發(fā)現(xiàn),各個回歸系數(shù)的置信區(qū)間仍然均包含零點。畫出模型2的殘差分布,發(fā)現(xiàn)又出現(xiàn)了異常點,按照上面的方法剔除異常點直至沒有異常點產(chǎn)生。最終一共去掉了5個異常點(分別是2,12,15,22以及23),最終得到模型3:Y=0.3999+2.7664X1-0.5987X2+1.6607X3-1.3712X4- 3.1596X5-0.0001X7+0.6669X9 (模型3)模型3的R2 = 0.9969,F(xiàn) = 281.6079,p < 0.0001,s2 &
11、lt; 0.0001??梢娔P?相當顯著,各個回歸系數(shù)的置信區(qū)間均不包含零點;但是去除的數(shù)據(jù)點有5個(總共23個),去除的異常點比較多,容易去除有用信息,所以我們只把模型3作為后期預測的一個對比模型,在之后的分析中,我們只考慮去除第12個異常點的數(shù)據(jù)。接下來進行異方差檢驗,殘差的獨立性檢驗以及多重共線性檢驗。3.2 異方差檢驗圖 Error! Main Document Only. 殘差對預測值的散點圖通過SPSS畫出殘差對預測值的散點圖,見圖3。根據(jù)圖3可以認為數(shù)據(jù)基本不存在異方差性,即認為隨機誤差具有相同的方差。3.3 殘差的獨立性檢驗通過SPSS的Durbin-watson檢驗得到DW值
12、為2.545,模型2中解釋變量數(shù)量k(包括常數(shù)項)為7,樣本數(shù)量n 為22,查DW分布表得到相應(yīng)的dL= 0.510,dU= 2.015。由于dU<DW<4-dL,認為隨機誤差之間無自相關(guān)3。3.4 誤差的正態(tài)分布檢驗通過SPSS畫出正態(tài)P-P圖以及回歸標準化殘差頻率分布直方圖,見圖4。圖 Error! Main Document Only. 誤差的正太分布檢驗圖從上圖可以認為誤差服從均值為0的正態(tài)分布。3.5 多重共線性檢驗多元線性回歸模型的基本假設(shè)中要求設(shè)計矩陣X的列向量之間不存在密切的線性關(guān)系3,如果存在,就稱它們之間存在多重共線性。表 Error! Main Documen
13、t Only. 多重共線性診斷結(jié)果通過SPSS進行多重共線性診斷,結(jié)果如下表。從上表可以看出絕大部分變量的VIF值遠遠大于10,說明嚴重存在多重共線性,針對多重共線性的問題,接下來用主成分分析加以處理。4 主成分回歸利用MATLAB對這個十個解釋變量進行主成分分析,分析過程如下。1)對原始數(shù)據(jù)進行標準化處理xi= xi- isi即每個元素的值減去該列的均值,然后除以這一列的方差。2)計算相關(guān)系數(shù)矩陣R,結(jié)果見表表 5 解釋變量的相關(guān)系數(shù)X1X2X3X4X5X6X7X8X9X10X11.000.920.980.961.000.610.50-0.880.920.92X20.921.000.900.
14、960.910.430.31-0.880.990.99X30.980.901.000.940.980.680.58-0.880.910.91X40.960.960.941.000.950.460.34-0.840.960.96X51.000.910.980.951.000.640.54-0.880.910.91X60.610.430.680.460.641.000.99-0.540.460.46X70.500.310.580.340.540.991.00-0.450.340.34X8-0.88-0.88-0.88-0.84-0.88-0.54-0.451.00-0.86-0.86X90.920
15、.990.910.960.910.460.34-0.861.001.00X100.920.990.910.960.910.460.34-0.861.001.003)計算特征值和累計貢獻率見表6表 6 各個解釋變量的特征根和累計貢獻率變量特征根累計貢獻率X18.103081.03%X21.501196.04%X30.187897.92%X40.155399.47%X50.024099.71%X60.017399.89%X70.007499.96%X80.002899.99%X90.0013100.0%X100.0000100.0%可以看出,前兩個特征根的累計貢獻率就達到了90%以上,主成分分析效
16、果很好。下面選擇前四個主成分(累計貢獻率99.47%)進行綜合分析。4)前四個特征根對應(yīng)的特征向量見表7表 7 前四個特征根對應(yīng)的特征向量X1X2X3X4X5X6X7X8X9X10第1個特征向量0.34 0.33 0.35 0.34 0.35 0.23 0.19 -0.32 0.34 0.34 第2個特征向量-0.03 -0.22 0.05 -0.18 0.01 0.61 0.68 0.05 -0.20 -0.20 第3個特征向量0.07 0.04 0.09 0.26 0.06 0.10 0.01 0.93 0.14 0.14 第4個特征向量0.45 -0.36 0.27 0.18 0.43
17、-0.14 -0.18 0.01 -0.40 -0.40 5)主成分回歸模型求得的主成分回歸模型如下:Y=0.204151+0.199353*X1+0.044479*X2+0.154424*X3+0.082825*X4+0.193987*X5+0.000289*X9+0.000353*X10 (模型4)5 逐步回歸主成分回歸求出的主成分是原始變量的線性組合,表示新的綜合變量。接下來使用逐步回歸的方法來篩選變量。在逐步回歸中,決定一個變量時候有必要進入模型或者從模型中剔除時,常用的方法是偏F檢驗3,關(guān)于偏F檢驗這里不做贅述。圖 Error! Main Document Only. 逐步回歸結(jié)果在
18、MATLAB中使用stepwise函數(shù)進行逐步回歸4,運行結(jié)果如圖5求得的逐步回歸模型如下:Y=1.0103*X3-0.6147*X4+0.6815*X9-0.7097*X10 (模型5)四、預測接下來我們利用上面求得的模型來進行期權(quán)價格預測。利用模型1、模型2、模型3、模型4和模型5分別預測了11月25日至12月10日的期權(quán)價格,11月25日至12月20日的真實期權(quán)以及預測結(jié)果如表8。表 8 各個模型的預測結(jié)果日期真實數(shù)據(jù)模型1模型2模型3模型4模型52016-11-250.50410.52290.51350.10100.49400.52232016-11-280.53250.53810.5
19、3150.14800.51640.52292016-11-290.51410.59320.58070.04920.52930.55702016-11-300.52560.58200.56770.01570.54310.54582016-12-010.50790.55170.54250.18280.53190.53972016-12-020.46210.54730.53610.20310.52670.53772016-12-050.46230.49510.48910.38880.48960.49812016-12-060.46600.46060.46150.45790.46910.4682201
20、6-12-070.46690.46530.46450.41790.46810.47492016-12-080.49890.45990.46110.40660.47380.47202016-12-090.47570.52780.52400.28200.49330.51792016-12-120.46600.53190.52650.28170.50410.51192016-12-130.45550.48120.47980.41310.47770.48442016-12-140.40030.47120.47410.43950.47050.46552016-12-150.39260.47000.468
21、30.21020.44900.43672016-12-160.38120.41400.42320.45520.40920.39072016-12-190.36330.40550.41440.38920.40030.38292016-12-200.39040.40040.40890.31030.39190.3757各個模型的平均誤差以及誤差百分比見表9。表 9 各個模型預測結(jié)果評價真實數(shù)據(jù)模型1模型2模型3模型4模型5平均誤差0.04140.03850.18840.02640.0301平均誤差百分比9.18%8.71%38.84%6.02%6.66%從表8和表9可以看出,模型4(主成分回歸)和模
22、型5(逐步回歸)的結(jié)果最好,而模型3由于去掉了較多的異常點反而導致預測結(jié)果不好。接下來不考慮模型3,畫出其余4個模型的預測結(jié)果與真實數(shù)據(jù)的折線圖,見圖6在圖圖 Error! Main Document Only. 4個模型預測結(jié)果與真實數(shù)據(jù)的折線圖4中,橫坐標表示數(shù)據(jù)的序號,分別與各個日期對應(yīng),其中前面24個數(shù)據(jù)來自訓練集,故而各個模型的預測結(jié)果與實際結(jié)果接近;后面的數(shù)據(jù)則來自測試集,可以看出各個模型的預測結(jié)果與實際數(shù)據(jù)存在一定差異,不過總體趨勢與實際數(shù)據(jù)比較匹配。其中模型4和模型5的預測結(jié)果最好。五、結(jié)論本文從以期權(quán)今日開盤價、收盤價、最高價、最低價、結(jié)算價、成交量、成交額、持倉量、漲停價和
23、跌停價為解釋變量,期權(quán)明日收盤價為指標變量,建立了多元線性回歸模型1,通過異方差檢驗、殘差的獨立性檢驗、誤差的正太分布檢驗以及多重共線性檢驗,說明該模型不違反回歸的基本假設(shè)條件。進而通過主成分回歸(模型4)和逐步回歸(模型5)進行降維,通過預測結(jié)果與真實數(shù)據(jù)的差異比較了各個模型的預測效果,結(jié)果表明主成分回歸以及逐步回歸相比全模型有更好的預測能力。實際情況中,該期權(quán)的當日價格波動一般不會超過15%,而普遍真是情況是8%以內(nèi),可見模型4和模型5的預測效果并不理想,今后的研究可以在以下兩個方面進行改進:不斷向模型加入得到的最新數(shù)據(jù);運用時間序列模型進行研究。參考文獻1 吳清. 期權(quán)交易策略十講M.
24、上海人民出版社, 20162 李珺. 基于因子分析的多元線性回歸方法及其在股價預測中的應(yīng)用D. 南京大學, 20143 孫海燕, 周夢, 李衛(wèi)國, 馮偉. 數(shù)理統(tǒng)計M. 北京航空航天大學出版社, 20164 司守奎. 數(shù)學建模算法與應(yīng)用(第2版)M. 國防工業(yè)出版社, 2015Option price forecasting model based on multiple linear regressionWang MoumouSchool of Computer Science, BeiHang University, Beijing 100191Abstract: Option is on
25、e kind of universal financial derivatives with a mature international market, and it is extremely important financial instrument. On February 9, 2015, the Shanghai Stock Exchange officially launched China's first floor trading options - SSE 50ETF options, opened a new chapter in the domestic mar
26、ket options market. 50ETF options since listing, the market gradually expanded, the development of offshore options products the same period. In this paper, the background of this study, "50ETF purchase December 1.95" this option for the study to today's opening, closing price, the hig
27、hest price, lowest price, settlement price, volume, turnover, open interest, price and the limit price for the explanatory variables, through multiple linear regression model, the option of the closing price of tomorrow. In this study, the heterogeneity test, residual independence test, error positi
28、ve distribution test and multicollinearity test were taken as the starting point of the whole model (model 1) of multivariate linear regression to show that the model did not violate the basic assumptions of regression. The results show that there is a strong linear correlation between the dependent
29、 variable and the explanatory variable, and the principal component regression and the stepwise regression are better than the whole regression model (step 4) and stepwise regression (model 5). The results show that there is a strong linear correlation between the dependent variable and the explanat
30、ory variable, and the principal component regression and stepwise regression have better prediction ability than the whole model.Keywords: Option price, Multiple linear regression, Multicollinearity, Factor analysis附錄1 期權(quán)交易數(shù)據(jù)日期收盤價開盤價最高價最低價結(jié)算價2016-11-240.46130.45100.47020.45060.47502016-11-230.45280.
31、44550.46800.44540.46502016-11-220.44650.43500.44820.43500.45802016-11-210.43040.40690.44300.40450.44002016-11-180.40690.40970.42130.40370.41302016-11-170.41130.41100.41300.39620.41902016-11-160.40770.41060.41500.40500.41102016-11-150.41070.41400.41630.40710.41602016-11-140.41170.40000.43290.40000.42
32、402016-11-110.40740.38310.40930.38250.41302016-11-100.38690.37290.39660.36750.39402016-11-090.35970.38100.38100.33780.37002016-11-080.38050.37580.39140.37320.38802016-11-070.36860.36600.37380.36170.38002016-11-040.36500.36920.37870.36250.37402016-11-030.36670.34300.37830.34000.37702016-11-020.34580.35880.35880.34380.35002016-11-010.35880.34870.36250.34530.36602016-10-310.34700.35220.36100.33040.35502016-10-280.35100.35210.37490.35060.357020
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年版的軟件購買與技術(shù)支持合同
- 服裝銷售店長下半年工作計劃10篇
- 春季工作計劃模板8篇
- 2025年度全球十大風險報告
- 創(chuàng)建文明城市倡議書范文合集九篇
- 員工辭職申請書匯編6篇
- 2025年高模量玻璃纖維布項目發(fā)展計劃
- 新安江生態(tài)補償報告
- 煤業(yè)企業(yè)調(diào)度室管理制度匯編
- 計劃生育-婦產(chǎn)科教學課件
- 數(shù)據(jù)中心電力設(shè)備調(diào)試方案
- 2024年度國際物流運輸合同3篇
- 新入職員工年終工作總結(jié)課件
- 2024-2025學年高二上學期期末數(shù)學試卷(基礎(chǔ)篇)(含答案)
- 汽車吊籃使用專項施工方案
- 靜脈導管維護
- 普通邏輯學智慧樹知到期末考試答案章節(jié)答案2024年河海大學
- 帶你聽懂中國傳統(tǒng)音樂智慧樹知到期末考試答案2024年
- 年度先進員工選票標準格式
- 化工工藝設(shè)計工藝管段表
- 工程作業(yè)活動風險評價記錄表及分級管控清單【全面】
評論
0/150
提交評論