版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
資產(chǎn)定價(jià)與機(jī)器學(xué)習(xí)目錄TOC\h\h第一章導(dǎo)論\h1.1資產(chǎn)定價(jià)的研究背景\h1.2本書的結(jié)構(gòu)\h1.3本書的特點(diǎn)和局限性\h第二章資產(chǎn)定價(jià)中的機(jī)器學(xué)習(xí)方法\h2.1機(jī)器學(xué)習(xí)的定義和主要類別\h2.2機(jī)器學(xué)習(xí)方法介紹\h第三章投資組合優(yōu)化\h3.1馬科維茨投資組合\h3.2參數(shù)化投資組合優(yōu)化\h3.3最優(yōu)投資組合與隨機(jī)貼現(xiàn)因子等價(jià)性\h3.4基于收縮估計(jì)方法的投資組合優(yōu)化\h3.5神經(jīng)網(wǎng)絡(luò)\h3.6基于全子集回歸的組合優(yōu)化\h3.7實(shí)證分析\h3.8小結(jié)\h第三章附錄\h第四章隨機(jī)貼現(xiàn)因子模型中的定價(jià)因子識(shí)別\h4.1隨機(jī)貼現(xiàn)因子\h4.2雙重選擇LASSO算法識(shí)別因子\h4.3自糾偏機(jī)器學(xué)習(xí)法識(shí)別因子\h4.4小結(jié)\h第四章附錄\h第五章資產(chǎn)收益率樣本外預(yù)測(cè)\h5.1樣本外預(yù)測(cè)方法\h5.2數(shù)據(jù)和單變量投資組合構(gòu)造\h5.3實(shí)證結(jié)果\h5.4信息匯總方法和穩(wěn)健性檢驗(yàn)\h5.5小結(jié)\h第五章附錄第一章導(dǎo)論1.1資產(chǎn)定價(jià)的研究背景Markowitz(1952)提出了經(jīng)典的均值方差投資組合優(yōu)化理論,系統(tǒng)地分析了如何利用資產(chǎn)收益率的統(tǒng)計(jì)特征,即均值和方差,來(lái)優(yōu)化投資組合配置,為現(xiàn)代金融學(xué)的研究奠定了基礎(chǔ)?;诰捣讲罾碚摌?gòu)建的投資組合有效邊界,Sharpe(1964)和Lintner(1965)在考慮無(wú)風(fēng)險(xiǎn)資產(chǎn)和市場(chǎng)均衡概念后,提出了資本資產(chǎn)定價(jià)模型(capitalassetpricingmodel,CAPM),為資產(chǎn)預(yù)期收益率與其系統(tǒng)性風(fēng)險(xiǎn)敞口(beta)確立了經(jīng)典的線性因子模型關(guān)系。Fama(1970)提出了有效市場(chǎng)假說(shuō),盡管雙重檢驗(yàn)問(wèn)題使得有效市場(chǎng)假說(shuō)難以被精確檢驗(yàn),但它作為評(píng)價(jià)金融市場(chǎng)定價(jià)效率的重要參照系,為進(jìn)一步研究資產(chǎn)收益率的預(yù)測(cè)變量和構(gòu)建因子定價(jià)模型提供了理論基礎(chǔ)。如果金融市場(chǎng)是信息有效的,那么資產(chǎn)的收益率應(yīng)該是不可預(yù)測(cè)的。如果發(fā)現(xiàn)了可以預(yù)測(cè)股票收益率的變量,這就意味著該變量衡量了資產(chǎn)對(duì)某種系統(tǒng)性風(fēng)險(xiǎn)的敞口。在調(diào)整資產(chǎn)的系統(tǒng)性風(fēng)險(xiǎn)溢價(jià)后,不應(yīng)存在額外的異常收益率。那些經(jīng)因子模型調(diào)整后仍顯著的預(yù)測(cè)變量被稱為市場(chǎng)異象。在有效市場(chǎng)假說(shuō)被提出之后,資本資產(chǎn)定價(jià)模型自然成了最早被廣泛檢驗(yàn)的因子定價(jià)模型。隨著市值效應(yīng)、價(jià)值效應(yīng)等不能被CAPM解釋的市場(chǎng)異象在20世紀(jì)80年代陸續(xù)被發(fā)現(xiàn),F(xiàn)ama和French(1993)在CAPM的基礎(chǔ)上加入了市值因子和價(jià)值因子,提出了著名的Fama-French三因子模型。在那個(gè)時(shí)代,三因子模型可以解釋除了動(dòng)量效應(yīng)以外幾乎全部已知的市場(chǎng)異象。隨后資產(chǎn)定價(jià)研究領(lǐng)域也開啟了發(fā)掘檢驗(yàn)可預(yù)測(cè)資產(chǎn)收益率的新變量與開發(fā)升級(jí)新因子定價(jià)模型的“競(jìng)賽”。隨著信息收集分析技術(shù)手段的進(jìn)步,越來(lái)越多基于公司財(cái)務(wù)報(bào)表、經(jīng)營(yíng)公告的基本面數(shù)據(jù),高頻的股票歷史交易數(shù)據(jù)以及基于機(jī)器學(xué)習(xí)深度文本分析挖掘產(chǎn)生的公司層面、投資者層面和宏觀經(jīng)濟(jì)層面的變量被發(fā)現(xiàn)可以有效預(yù)測(cè)風(fēng)險(xiǎn)資產(chǎn)的預(yù)期收益率。僅考慮公司層面,迄今的資產(chǎn)定價(jià)文獻(xiàn)已提出了數(shù)以百計(jì)的具有顯著預(yù)測(cè)能力的公司特征變量。Harvey,Liu和Zhu(2016)統(tǒng)計(jì)了1967—2012年發(fā)表在國(guó)際頂尖金融期刊的論文中涉及的預(yù)測(cè)指標(biāo),發(fā)現(xiàn)有316個(gè)指標(biāo)被實(shí)證檢驗(yàn)具有重要影響,并且指標(biāo)數(shù)量以接近平均每年18個(gè)的速度增長(zhǎng)。Mclean和Pontiff(2016)在研究了金融、經(jīng)濟(jì)以及會(huì)計(jì)學(xué)頂尖期刊論文中涉及的97個(gè)橫截面股票收益率預(yù)測(cè)指標(biāo)后,發(fā)現(xiàn)部分指標(biāo)的預(yù)測(cè)效果來(lái)自數(shù)據(jù)挖掘,平均而言,這些指標(biāo)的多空組合收益在樣本外下降了26%,在文章發(fā)表后下降了58%。Hou,Xue和Zhang(2020)檢驗(yàn)了文獻(xiàn)中452個(gè)市場(chǎng)異象后,發(fā)現(xiàn)即使剔除流動(dòng)性較差的小市值股票,仍然有161個(gè)變量是統(tǒng)計(jì)顯著的。相應(yīng)的因子定價(jià)模型也在發(fā)展演進(jìn),F(xiàn)ama和French(2018)在Fama-French三因子模型的基礎(chǔ)上加入了盈利因子、投資因子和動(dòng)量因子,提出了Fama-French六因子模型。Hou等(2019)則提出了包含市場(chǎng)因子、市值因子、投資因子、盈利因子和預(yù)期投資增長(zhǎng)因子的Q5因子模型。盡管這兩個(gè)最新提出的多因子模型在眾多因子模型中對(duì)市場(chǎng)異象的解釋能力最強(qiáng),但依然存在較多的市場(chǎng)異象無(wú)法被解釋。時(shí)任美國(guó)金融學(xué)會(huì)主席的約翰·科克倫(JohnCochrane)教授在2011年的學(xué)會(huì)主旨演講中將數(shù)量眾多的收益率預(yù)測(cè)指標(biāo)稱為“因子動(dòng)物園”,并提出問(wèn)題:“究竟哪些變量能獨(dú)立解釋股票預(yù)期收益率差異?而哪些變量的解釋能力會(huì)被其他變量所涵蓋?”因此,發(fā)現(xiàn)真正具有解釋力的變量并確定能夠解釋其他變量的定價(jià)因子是目前資產(chǎn)定價(jià)領(lǐng)域核心的研究問(wèn)題。據(jù)作者對(duì)金融文獻(xiàn)的了解,目前只有DeMiguel等(2020)基于投資者最大化均值方差效用函數(shù),在資產(chǎn)配置權(quán)重是K維公司特征變量的線性模型假設(shè)下,使用LASSO(leastabsoluteshrinkageandselectionoperator)算法來(lái)挑選最有效的特征變量,從而推斷隨機(jī)貼現(xiàn)因子中到底哪些因子對(duì)于定價(jià)最重要。過(guò)去十多年中,很多研究從探究資產(chǎn)橫截面收益率的可預(yù)測(cè)性出發(fā),提出并驗(yàn)證新因子模型。金融數(shù)據(jù)具有低信號(hào)噪音比的特性,同時(shí)因子定價(jià)模型中有效因子結(jié)構(gòu)及其函數(shù)關(guān)系不確定,隨著包含眾多變量的“因子動(dòng)物園”被發(fā)現(xiàn),大數(shù)據(jù)分析和機(jī)器學(xué)習(xí)方法也被廣泛引入資產(chǎn)定價(jià)的研究。迄今為止,較多研究從篩選有效變量來(lái)預(yù)測(cè)資產(chǎn)橫截面和時(shí)間序列收益率、定價(jià)因子的風(fēng)險(xiǎn)溢價(jià)檢驗(yàn)和估計(jì)隨機(jī)貼現(xiàn)因子(stochasticdiscountfactor,SDF)模型的因子載荷(factorloadings)的角度,使用機(jī)器學(xué)習(xí)方法來(lái)解決“因子動(dòng)物園”問(wèn)題。然而從投資者最大化期望效用函數(shù)的角度,構(gòu)造最優(yōu)投資組合來(lái)確定隨機(jī)貼現(xiàn)因子則較少被關(guān)注,尤其是在面對(duì)高維度的解釋變量時(shí),應(yīng)用機(jī)器學(xué)習(xí)方法的相關(guān)研究則更有限。下面我們以投資組合優(yōu)化為例,簡(jiǎn)要介紹為什么包含高維解釋變量的“因子動(dòng)物園”會(huì)導(dǎo)致基于線性回歸的傳統(tǒng)計(jì)量分析方法面臨“維度災(zāi)難”問(wèn)題。Markowitz(1952)均值方差投資組合優(yōu)化理論根據(jù)資產(chǎn)收益率的均值和方差來(lái)估計(jì)最優(yōu)資產(chǎn)配置權(quán)重,因此在有N個(gè)資產(chǎn)的情形下,該模型需要估計(jì)N個(gè)均值和含有(N2+N)/2個(gè)參數(shù)的協(xié)方差矩陣。其估計(jì)參數(shù)的維度隨資產(chǎn)數(shù)量N的增加以冪函數(shù)的速度增加,因此在面對(duì)大量資產(chǎn)和有限樣本時(shí),參數(shù)估計(jì)變得十分困難。以往的研究往往采用貝葉斯估計(jì)方法解決這一問(wèn)題,通過(guò)引入先驗(yàn)信息幫助提高參數(shù)估計(jì)精度,或者使用因子模型來(lái)降低估計(jì)參數(shù)的維度。但引入先驗(yàn)信息通常會(huì)包含主觀判斷,導(dǎo)致統(tǒng)計(jì)推斷有一定的主觀性,而通過(guò)因子模型降維則需要引入模型假設(shè),增加了模型誤置的風(fēng)險(xiǎn)。Brandt,Santa-Clara和Valkanov(2009)通過(guò)直接對(duì)資產(chǎn)權(quán)重建模的方式來(lái)實(shí)現(xiàn)參數(shù)降維。之前的資產(chǎn)定價(jià)研究發(fā)現(xiàn)了大量對(duì)股票橫截面收益率有解釋力的特征變量,因此他們將股票權(quán)重建模成有K個(gè)特征變量的線性函數(shù),再通過(guò)最大化投資者的期望效用函數(shù)來(lái)估計(jì)這K個(gè)參數(shù)。該方法被稱作參數(shù)化投資組合方法,其待估參數(shù)的數(shù)量級(jí)從N維降至K維。在面對(duì)數(shù)以千計(jì)的股票資產(chǎn)(在中國(guó)A股市場(chǎng),N>3000),而特征變量數(shù)K相對(duì)較小時(shí),這一方法大大降低了投資組合參數(shù)的估計(jì)難度并提升了估計(jì)精度。然而,隨著研究發(fā)現(xiàn)的解釋變量越來(lái)越多,形成“因子動(dòng)物園”時(shí)需要加入權(quán)重模型的特征變量數(shù)K越來(lái)越大,參數(shù)化投資組合方法的估計(jì)也會(huì)面臨“維度災(zāi)難”,導(dǎo)致傳統(tǒng)回歸方法的參數(shù)估計(jì)精度下降。為解決這個(gè)問(wèn)題,DeMiguel等(2020)在股票權(quán)重的K維線性模型下使用LASSO算法挑選最有效的特征變量來(lái)實(shí)現(xiàn)降維。盡管DeMiguel等(2020)使用LASSO方法使得參數(shù)化投資組合在“因子動(dòng)物園”背景下得到較準(zhǔn)確的估計(jì),但該研究領(lǐng)域仍存在三方面問(wèn)題。首先,Brandt,Santa-Clara和Valkanov(2009)及DeMiguel等(2020)只考慮了權(quán)重的線性模型,忽略了最優(yōu)權(quán)重和特征變量之間極可能存在的非線性預(yù)測(cè)關(guān)系。A?t-Sahalia和Brandt(2001)指出,即使假定收益率和特征變量服從線性預(yù)測(cè)關(guān)系,最優(yōu)投資組合權(quán)重和預(yù)測(cè)變量之間也可能存在高度非線性關(guān)系,其原因在于求解的最優(yōu)組合權(quán)重中包含協(xié)方差矩陣的逆。而Freyberger,Neuhierl和Weber(2020)運(yùn)用非參數(shù)自適應(yīng)組LASSO(adaptivegroupLASSO)算法研究公司特征變量與股票期望收益率間的非線性預(yù)測(cè)關(guān)系。他們的實(shí)證發(fā)現(xiàn)使用非線性預(yù)測(cè)模型構(gòu)造的投資組合的樣本外夏普比率比使用線性LASSO模型得到的結(jié)果高近3倍,從而證明特征變量和收益率間存在顯著的非線性預(yù)測(cè)關(guān)系。其次,參數(shù)化投資組合方法能適用LASSO模型的前提假設(shè)是投資者具有均值方差效用函數(shù),這樣才能把最大化效用問(wèn)題轉(zhuǎn)化成一個(gè)具有約束條件的線性回歸問(wèn)題,符合LASSO的模型形式。然而在實(shí)際中,投資者偏好不太可能符合均值方差效用函數(shù)的描述,因?yàn)槿魏味A矩以上的高階矩在這一效用中均被忽略了。事實(shí)上,已有大量研究表明投資者很注重三階矩偏度和四階矩峰度[Harvey和Siddique(2000)及Dittmar(2002)等]。因此投資組合優(yōu)化文獻(xiàn)中通常會(huì)假設(shè)常數(shù)相對(duì)風(fēng)險(xiǎn)厭惡(CRRA)效用函數(shù),然而在CRRA效用下,DeMiguel等(2020)使用的LASSO降維方法則無(wú)法直接應(yīng)用。最后,雖然在均值方差效用函數(shù)下可以選出最有效的特征變量,但并不能準(zhǔn)確估計(jì)其在隨機(jī)貼現(xiàn)因子中的載荷。Feng,Giglio和Xiu(2020)指出使用線性回歸法或LASSO方法直接估計(jì)隨機(jī)貼現(xiàn)因子中的因子載荷會(huì)產(chǎn)生遺漏變量帶來(lái)的估計(jì)偏差,進(jìn)而提出雙重選擇LASSO算法,通過(guò)第一步LASSO選出最能解釋收益率的因子,再施加第二步LASSO篩選出遺漏變量,來(lái)消除估計(jì)誤差。1.2本書的結(jié)構(gòu)針對(duì)前文提到的高維“因子動(dòng)物園”背景下資產(chǎn)定價(jià)研究領(lǐng)域所面臨的問(wèn)題,本書從投資者最大化期望效用函數(shù)推導(dǎo)隨機(jī)貼現(xiàn)因子定價(jià)因子、準(zhǔn)確估計(jì)隨機(jī)貼現(xiàn)因子中定價(jià)因子的風(fēng)險(xiǎn)載荷,以及預(yù)測(cè)橫截面資產(chǎn)收益率這三個(gè)資產(chǎn)定價(jià)核心問(wèn)題入手。我們分析并介紹了基于線性回歸的傳統(tǒng)計(jì)量分析方法所面臨的“維度災(zāi)難”問(wèn)題,并進(jìn)一步探討了常用的機(jī)器學(xué)習(xí)方法的適用性和優(yōu)勢(shì)。本書還以中國(guó)A股市場(chǎng)為主要應(yīng)用場(chǎng)景,給出了詳細(xì)的分析。第二章簡(jiǎn)要概述了機(jī)器學(xué)習(xí)的概念和發(fā)展。首先對(duì)比了資產(chǎn)定價(jià)問(wèn)題和傳統(tǒng)機(jī)器學(xué)習(xí)問(wèn)題在應(yīng)用場(chǎng)景上的諸多差異,并介紹了兩大類機(jī)器學(xué)習(xí)方法,即監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)的區(qū)別。其次,將監(jiān)督學(xué)習(xí)方法按照線性和非線性方法分類并分別進(jìn)行介紹,然后介紹了主成分分析和聚類分析等無(wú)監(jiān)督學(xué)習(xí)方法。最后,討論了機(jī)器學(xué)習(xí)方法中關(guān)于超參數(shù)調(diào)節(jié)的相關(guān)問(wèn)題。第三章主要介紹了機(jī)器學(xué)習(xí)方法在投資組合優(yōu)化問(wèn)題中的應(yīng)用。我們?cè)敿?xì)回顧了從Markowitz(1952)的均值方差投資組合優(yōu)化理論在配置大量資產(chǎn)時(shí)面臨的參數(shù)估計(jì)問(wèn)題,到Brandt,Santa-Clara和Valkanov(2009)提出的參數(shù)化投資組合方法。該方法將待估計(jì)的資產(chǎn)權(quán)重建模為K個(gè)特征變量的線性函數(shù),然后利用投資者的期望效用函數(shù)最大化來(lái)估計(jì)這K個(gè)參數(shù),從而實(shí)現(xiàn)待估參數(shù)維度的降低。此外,我們從最大化投資者期望效用的角度出發(fā),推導(dǎo)了隨機(jī)貼現(xiàn)因子的表達(dá)式,并證明了文獻(xiàn)中利用若干個(gè)定價(jià)因子表示隨機(jī)貼現(xiàn)因子的做法本質(zhì)上與求解最大化期望效用問(wèn)題等價(jià)。這意味著在利用參數(shù)化投資組合方法進(jìn)行組合優(yōu)化時(shí),我們同時(shí)基于所使用的特征變量信息構(gòu)建隨機(jī)貼現(xiàn)因子,從而將均值方差有效前沿、隨機(jī)貼現(xiàn)因子和因子定價(jià)模型統(tǒng)一起來(lái)。針對(duì)上一節(jié)提到的DeMiguel等(2020)使用線性LASSO方法求解參數(shù)化組合模型存在的問(wèn)題,我們首先參考Freyberger,Neuhierl和Weber(2020),運(yùn)用自適應(yīng)組LASSO把非線性模型引入?yún)?shù)化投資組合方法,檢驗(yàn)非線性的特征變量是否能顯著提升投資組合的樣本外收益。其次,為了在求解最優(yōu)化投資組合權(quán)重時(shí)能使用更廣義的期望效用函數(shù),而不僅局限于均值方差效用,借鑒模型平均(modelavera-ging)的估計(jì)思想,我們提出全子集組合法(completesubsetcombina-tion,CSC)。該方法在數(shù)量眾多的K個(gè)特征變量中,每次估計(jì)只引入少量的k(k<K)個(gè)變量來(lái)估計(jì)參數(shù),再遍歷K?。郏↘-k)!k?。莘N可能組合,把每次估計(jì)的參數(shù)值加總求均值作為參數(shù)估計(jì)值。通過(guò)全子集組合法,每次需估計(jì)的參數(shù)維度都是較小的k,因而單次估計(jì)不需使用降維方法,不再受限于均值方差效用,可以適用于更廣義的具有顯性表達(dá)式的效用函數(shù),如CRRA效用函數(shù)。每次求解效用最大化時(shí)只需令一階條件為零,采用廣義矩方法(GMM)來(lái)估計(jì)參數(shù),再遍歷所有可能組合求出參數(shù)均值即可。最后,應(yīng)用我國(guó)A股市場(chǎng)數(shù)據(jù)對(duì)常用的機(jī)器學(xué)習(xí)方法和全子集組合法的實(shí)證表現(xiàn)進(jìn)行詳細(xì)的實(shí)證分析對(duì)比,并把最優(yōu)權(quán)重構(gòu)造出的投資組合作為潛在定價(jià)因子,疊加主流因子模型后,用于解釋現(xiàn)存顯著的市場(chǎng)異象并獲得了最好的定價(jià)解釋力。第四章介紹了在高維“因子動(dòng)物園”的背景下,如何使用機(jī)器學(xué)習(xí)方法準(zhǔn)確估計(jì)隨機(jī)貼現(xiàn)因子的因子載荷。在資產(chǎn)定價(jià)中,估計(jì)隨機(jī)貼現(xiàn)因子是對(duì)資產(chǎn)進(jìn)行準(zhǔn)確定價(jià)的關(guān)鍵。本章從隨機(jī)貼現(xiàn)因子的理論框架出發(fā),介紹了隨機(jī)貼現(xiàn)因子的定價(jià)理論。接著,我們介紹了雙重選擇LASSO算法在假設(shè)線性隨機(jī)貼現(xiàn)因子模型下,如何通過(guò)糾正遺漏變量誤差來(lái)識(shí)別有效定價(jià)因子,并給出了該方法在中國(guó)A股市場(chǎng)的應(yīng)用研究結(jié)果。進(jìn)一步,我們考慮如果隨機(jī)貼現(xiàn)因子模型存在非線性因子結(jié)構(gòu),那么雙重選擇LASSO算法將不再適用。因此,我們引入Chernozhukov,Newey和Singh(2022)提出的一種自糾偏機(jī)器學(xué)習(xí)方法(automaticdebiasedmachinelearning,ADML)。通過(guò)在識(shí)別矩條件中加入影響函數(shù)(influencefunction),將偏差調(diào)整為兩個(gè)估計(jì)量偏差的乘積,從而確保估計(jì)量的一致性。最后,我們介紹了如何使用ADML算法來(lái)識(shí)別隨機(jī)貼現(xiàn)因子中真正具有定價(jià)能力的有效因子,并給出了中國(guó)A股市場(chǎng)的實(shí)證研究結(jié)果。第五章介紹如何使用機(jī)器學(xué)習(xí)方法進(jìn)行樣本外橫截面收益率預(yù)測(cè)。剖析股票收益的橫截面數(shù)據(jù)是資產(chǎn)定價(jià)研究的核心主題之一。我們首先介紹線性模型和自適應(yīng)組LASSO等非線性模型進(jìn)行樣本外收益率預(yù)測(cè)的方法。使用中國(guó)A股市場(chǎng)數(shù)據(jù),我們把自適應(yīng)組LASSO與其他線性機(jī)器學(xué)習(xí)模型的變量篩選結(jié)果進(jìn)行對(duì)比,識(shí)別出了中國(guó)股票市場(chǎng)100個(gè)股票特征變量中具有顯著預(yù)測(cè)能力的因子。其次,我們比較了非線性預(yù)測(cè)模型與線性預(yù)測(cè)模型篩選出的預(yù)測(cè)變量,發(fā)現(xiàn)和非線性模型相比,線性模型在全樣本中選出了更多的變量,但使用線性模型收益率預(yù)測(cè)構(gòu)造的多空投資組合的夏普比率和異常收益率alpha均低于非線性模型。使用線性模型選出的特征變量,但用非線性模型進(jìn)行預(yù)測(cè)時(shí),我們發(fā)現(xiàn)多空組合的年化夏普比率比使用同樣變量的線性模型預(yù)測(cè)時(shí)提高了0.5以上,說(shuō)明使用同樣變量時(shí),非線性預(yù)測(cè)結(jié)構(gòu)顯著提升了樣本外預(yù)測(cè)的準(zhǔn)確性。另外,使用非線性模型選出的特征變量,用線性模型進(jìn)行預(yù)測(cè)時(shí),其多空投資組合的夏普比率也高于使用線性模型選出的變量進(jìn)行線性預(yù)測(cè)的組合。這表明非線性模型在特征變量篩選上比線性模型能更有效地發(fā)現(xiàn)最重要的收益預(yù)測(cè)變量。最后,我們通過(guò)線性或二次樣條非線性回歸來(lái)使用單個(gè)特征預(yù)測(cè)收益,然后使用預(yù)測(cè)組合方法、主成分回歸和偏最小二乘法等對(duì)使用單個(gè)特征預(yù)測(cè)得到的收益進(jìn)行聚合,結(jié)果非線性收益預(yù)測(cè)仍然具有更好的效果。這些實(shí)證發(fā)現(xiàn)強(qiáng)調(diào)了非線性結(jié)構(gòu)在特征變量篩選和收益預(yù)測(cè)中的重要性。1.3本書的特點(diǎn)和局限性目前已有的關(guān)于機(jī)器學(xué)習(xí)和資產(chǎn)定價(jià)方面的著作主要有兩本。Nagel(2021)側(cè)重于通過(guò)貝葉斯統(tǒng)計(jì)學(xué)框架來(lái)增強(qiáng)機(jī)器學(xué)習(xí)方法在資產(chǎn)定價(jià)應(yīng)用中的可解釋性,具體是對(duì)定價(jià)因子的主成分投資組合的夏普比率加以貝葉斯先驗(yàn)約束,進(jìn)而檢驗(yàn)隨機(jī)貼現(xiàn)因子模型是否滿足稀疏性假設(shè)。通過(guò)近似無(wú)套利條件來(lái)約束夏普比率不能過(guò)大,為L(zhǎng)ASSO和彈性網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)方法的應(yīng)用給出了清晰的經(jīng)濟(jì)學(xué)解釋。吳輝航、魏行空和張曉燕(2022)則比較類似Gu,Kelly和Xiu(2020),重點(diǎn)研究機(jī)器學(xué)習(xí)方法對(duì)橫截面股票收益率的樣本外預(yù)測(cè),并給出了中國(guó)市場(chǎng)的實(shí)證分析結(jié)果。本書側(cè)重于從投資者最大化期望效用函數(shù)入手,在求解最優(yōu)參數(shù)化投資組合中引入機(jī)器學(xué)習(xí)方法,實(shí)現(xiàn)對(duì)待估參數(shù)的降維和精確估計(jì)。同時(shí)還提出全子集組合法,其參數(shù)估計(jì)更加簡(jiǎn)單,適用性更強(qiáng),可用于CRRA等更具一般性的效用函數(shù)。因此,基于機(jī)器學(xué)習(xí)和全子集組合法來(lái)優(yōu)化參數(shù)化投資組合更具實(shí)用性??紤]交易成本影響的實(shí)證應(yīng)用可以參考Maasoumi等(2022)。在業(yè)界應(yīng)用方面,智能投顧是一種基于機(jī)器學(xué)習(xí)、智能算法、云計(jì)算等新科技手段服務(wù)于個(gè)人投資者的智能財(cái)富管理服務(wù),其本質(zhì)是依據(jù)投資者的風(fēng)險(xiǎn)偏好與財(cái)務(wù)狀況,利用大數(shù)據(jù)結(jié)合前沿的資產(chǎn)組合優(yōu)化理論來(lái)提供最佳風(fēng)險(xiǎn)收益比的個(gè)性化投資策略。2019年10月,中國(guó)證監(jiān)會(huì)發(fā)布《關(guān)于做好公開募集證券投資基金投資顧問(wèn)業(yè)務(wù)試點(diǎn)工作的通知》,標(biāo)志著基金投資顧問(wèn)業(yè)務(wù)試點(diǎn)正式推出。面對(duì)中國(guó)龐大的人口基數(shù)與不斷增長(zhǎng)的資產(chǎn)管理需求,基金智能投顧業(yè)務(wù)在服務(wù)居民理財(cái)需求、合理引導(dǎo)直接融資和助力普惠金融方面具有巨大發(fā)展?jié)摿Α=Y(jié)合大數(shù)據(jù)信息采集實(shí)現(xiàn)對(duì)投資者風(fēng)險(xiǎn)偏好特征的精確畫像,再應(yīng)用某種顯性效用函數(shù)擬合出投資者的風(fēng)險(xiǎn)偏好,則全子集組合法可以針對(duì)不同類型的投資者給出對(duì)任意一組資產(chǎn)的最優(yōu)投資權(quán)重配比。在實(shí)際應(yīng)用中,全子集組合法還可以考慮交易成本對(duì)投資組合權(quán)重的影響,并加入更多股票交易類的高頻數(shù)據(jù),實(shí)現(xiàn)對(duì)最優(yōu)權(quán)重的更高頻率更新,因此該方法在智能投顧中具有良好的應(yīng)用前景。本書的結(jié)構(gòu)安排也緊密契合資產(chǎn)定價(jià)領(lǐng)域的文獻(xiàn)發(fā)展歷程,以投資者最大化期望效用函數(shù)構(gòu)造最優(yōu)投資組合為出發(fā)點(diǎn),并根據(jù)隨機(jī)貼現(xiàn)因子和最優(yōu)投資組合的等價(jià)性,提出新的定價(jià)因子。進(jìn)而在“因子動(dòng)物園”背景下,介紹如何使用機(jī)器學(xué)習(xí)方法來(lái)準(zhǔn)確估計(jì)隨機(jī)貼現(xiàn)因子模型中的因子載荷,確定最優(yōu)因子定價(jià)模型。最后探討如何利用已有的大量市場(chǎng)異象和機(jī)器學(xué)習(xí)方法來(lái)提高樣本外收益率預(yù)測(cè)效果。正如資產(chǎn)定價(jià)學(xué)科從馬科維茨(Markowitz)的均值方差投資組合優(yōu)化理論起源,進(jìn)而由市場(chǎng)均衡條件推導(dǎo)出具有最大夏普比率的切點(diǎn)投資組合必然是市場(chǎng)組合,并衍生出了以市場(chǎng)組合為單風(fēng)險(xiǎn)因子的CAPM。隨著Fama(1970)提出有效市場(chǎng)假說(shuō),文獻(xiàn)開始大量研究能預(yù)測(cè)橫截面資產(chǎn)收益率的市場(chǎng)異象,并促進(jìn)了因子定價(jià)模型的迭代升級(jí)。這種結(jié)構(gòu)安排有利于讀者在把握資產(chǎn)定價(jià)學(xué)科發(fā)展脈絡(luò)的同時(shí),了解機(jī)器學(xué)習(xí)方法在這三個(gè)主流研究方向上的最新應(yīng)用成果。本書的另一個(gè)特點(diǎn)是注重機(jī)器學(xué)習(xí)方法在資產(chǎn)定價(jià)應(yīng)用中的可解釋性。經(jīng)濟(jì)學(xué)和金融學(xué)的學(xué)術(shù)研究對(duì)復(fù)雜的機(jī)器學(xué)習(xí)方法,例如深度神經(jīng)網(wǎng)絡(luò)模型等的應(yīng)用,一直存在一些顧慮。其核心原因是這類方法的優(yōu)化預(yù)測(cè)過(guò)程往往是一個(gè)黑箱(blackbox)。由于其模型內(nèi)部的復(fù)雜性和非線性,輸入變量和輸出結(jié)果之間缺乏直觀的、可解釋的關(guān)系,也很難和現(xiàn)有的經(jīng)濟(jì)學(xué)、金融學(xué)理論聯(lián)系起來(lái)。如果只關(guān)注樣本外預(yù)測(cè)的準(zhǔn)確性,這個(gè)黑箱問(wèn)題可能不會(huì)造成太大的影響。但是經(jīng)濟(jì)學(xué)和金融學(xué)的研究著眼于國(guó)計(jì)民生的重大問(wèn)題,經(jīng)濟(jì)和金融學(xué)者有責(zé)任去探求事物本質(zhì)的因果聯(lián)系,并需要向政策制定者、消費(fèi)者和投資者解釋模型的決策過(guò)程,因而可解釋性和透明度至關(guān)重要。本書對(duì)機(jī)器方法的選擇思路和Nagel(2021)接近,Nagel(2021)主要應(yīng)用可解釋性強(qiáng)的LASSO、嶺回歸和彈性網(wǎng)絡(luò)等線性機(jī)器學(xué)習(xí)方法。為了規(guī)避黑箱問(wèn)題,本書主要關(guān)注簡(jiǎn)單、具有明確函數(shù)形式且易于解釋的機(jī)器學(xué)習(xí)方法,例如LASSO、嶺回歸、彈性網(wǎng)絡(luò)和主成分回歸等。在投資組合優(yōu)化和隨機(jī)貼現(xiàn)因子識(shí)別部分,雖然使用了隱藏層數(shù)量較少的神經(jīng)網(wǎng)絡(luò)模型,但其主要目的是與其他簡(jiǎn)單機(jī)器學(xué)習(xí)方法的實(shí)證效果進(jìn)行對(duì)比。在撰寫過(guò)程中,作者非常重視解釋由機(jī)器學(xué)習(xí)方法得到的實(shí)證結(jié)果。第三至五章的核心實(shí)證目標(biāo)是從超過(guò)100個(gè)特征變量中篩選出對(duì)投資組合優(yōu)化、因子定價(jià)模型和橫截面收益率預(yù)測(cè)最重要、解釋力最強(qiáng)的變量。除此之外,本書強(qiáng)調(diào)允許特征變量與收益率之間的非線性關(guān)系對(duì)于提升模型預(yù)測(cè)和解釋能力至關(guān)重要。因此,在線性機(jī)器學(xué)習(xí)方法(如LASSO、嶺回歸和彈性網(wǎng)絡(luò))之外,還引入了加入非線性高階項(xiàng)的非參數(shù)組LASSO等機(jī)器學(xué)習(xí)模型。實(shí)證結(jié)果表明,這類非線性方法在投資組合優(yōu)化和樣本外預(yù)測(cè)方面表現(xiàn)出色,同時(shí)保留了篩選變量的可解釋性特征,因而在模型預(yù)測(cè)性能和可解釋性之間實(shí)現(xiàn)了較好的平衡。Jiang,Kelly和Xiu(2022)使用大型語(yǔ)言模型對(duì)新聞進(jìn)行深度文本分析,并將其應(yīng)用于預(yù)測(cè)市場(chǎng)收益率。本書主要基于作者在相關(guān)領(lǐng)域發(fā)表的多篇研究論文的精煉。其目標(biāo)并不是全面概述機(jī)器學(xué)習(xí)方法在資產(chǎn)定價(jià)全領(lǐng)域的應(yīng)用,而是更多地反映了作者關(guān)于機(jī)器學(xué)習(xí)方法在解決資產(chǎn)定價(jià)中三個(gè)核心問(wèn)題上所能帶來(lái)的改進(jìn)和局限性的思考。本書的內(nèi)容自然會(huì)受限于作者的研究方向,其中一個(gè)未涉及的重要應(yīng)用場(chǎng)景是利用機(jī)器學(xué)習(xí)方法進(jìn)行資產(chǎn)收益率的時(shí)間序列預(yù)測(cè)。在這個(gè)研究領(lǐng)域,作者在攻讀博士學(xué)位期間的校外導(dǎo)師、圣路易斯華盛頓大學(xué)的周國(guó)富教授撰寫了一篇非常出色的綜述文章。感興趣的讀者可以參閱Rapach和Zhou(2020)。除了前述內(nèi)容,還有一些本書未涉及的機(jī)器學(xué)習(xí)方法,包括復(fù)雜的深度學(xué)習(xí)方法以及近期非常流行的基于生成式人工智能的大型語(yǔ)言模型。這些模型,如BERT和ChatGPT,在資產(chǎn)定價(jià)領(lǐng)域同樣具有潛在應(yīng)用價(jià)值。第二章資產(chǎn)定價(jià)中的機(jī)器學(xué)習(xí)方法從不同角度對(duì)資產(chǎn)收益率進(jìn)行預(yù)測(cè)是現(xiàn)有的資產(chǎn)定價(jià)研究的基礎(chǔ)。隨著金融環(huán)境的持續(xù)變化以及可用于預(yù)測(cè)的變量不斷擴(kuò)展,機(jī)器學(xué)習(xí)方法對(duì)于投資組合優(yōu)化、定價(jià)因子識(shí)別和股票橫截面收益率預(yù)測(cè)等高維估計(jì)問(wèn)題具有廣泛的適用性。理解機(jī)器學(xué)習(xí)方法在資產(chǎn)定價(jià)領(lǐng)域的應(yīng)用會(huì)面臨哪些問(wèn)題,首先需要明確其定義和區(qū)別。人工智能先驅(qū)Samuel(1959)最早提出了“機(jī)器學(xué)習(xí)”一詞。早在1952年,塞繆爾(Samuel)在IBM公司研制了一個(gè)西洋跳棋程序,這個(gè)程序具有自學(xué)習(xí)能力,可通過(guò)分析大量棋局逐漸辨識(shí)出當(dāng)前局面下的“好棋”和“壞棋”,從而不斷提高弈棋水平,并很快就下贏了塞繆爾本人。1956年,塞繆爾應(yīng)約翰·麥卡錫(JohnMcCarthy,“人工智能之父”,1971年圖靈獎(jiǎng)得主)之邀,在標(biāo)志著人工智能學(xué)科誕生的達(dá)特茅斯會(huì)議上介紹這項(xiàng)工作,并將機(jī)器學(xué)習(xí)定義為“不顯式編程地賦予計(jì)算機(jī)能力的研究領(lǐng)域”。自此,“機(jī)器學(xué)習(xí)”正式進(jìn)入了大眾的視野并成為重要的計(jì)算機(jī)科研領(lǐng)域之一。20世紀(jì)末計(jì)算機(jī)學(xué)科蓬勃發(fā)展,Mitchell(1997)進(jìn)一步提出,一個(gè)計(jì)算機(jī)程序被稱為可以學(xué)習(xí),是指它能夠針對(duì)某個(gè)任務(wù)T(task)和某個(gè)性能指標(biāo)P(performance),從經(jīng)驗(yàn)E(experience)中學(xué)習(xí)。這種學(xué)習(xí)的特點(diǎn)是:它在任務(wù)T上被性能指標(biāo)P所衡量的性能,會(huì)隨著經(jīng)驗(yàn)E的增加而提高。由此,機(jī)器學(xué)習(xí)的定義進(jìn)一步完善。機(jī)器學(xué)習(xí)已逐漸發(fā)展成為人工智能領(lǐng)域的核心研究方向之一,其主要目標(biāo)在于賦予計(jì)算機(jī)系統(tǒng)類似于人類的學(xué)習(xí)能力,以實(shí)現(xiàn)真正的人工智能。目前被廣泛接受的機(jī)器學(xué)習(xí)定義為“通過(guò)經(jīng)驗(yàn)提高計(jì)算機(jī)系統(tǒng)的性能”。由于計(jì)算機(jī)系統(tǒng)中的“經(jīng)驗(yàn)”主要以數(shù)據(jù)形式存在,因此機(jī)器學(xué)習(xí)需要采用技術(shù)手段對(duì)數(shù)據(jù)進(jìn)行深入分析,這使得它成為智能數(shù)據(jù)分析領(lǐng)域的關(guān)鍵創(chuàng)新驅(qū)動(dòng)力之一,并日益受到廣泛關(guān)注。在本章中,我們將闡述典型機(jī)器學(xué)習(xí)問(wèn)題與資產(chǎn)定價(jià)問(wèn)題之間的差異,并簡(jiǎn)要介紹主流機(jī)器學(xué)習(xí)方法。2.1機(jī)器學(xué)習(xí)的定義和主要類別(一)典型機(jī)器學(xué)習(xí)問(wèn)題和資產(chǎn)定價(jià)問(wèn)題的區(qū)別計(jì)算機(jī)科學(xué)中典型機(jī)器學(xué)習(xí)問(wèn)題與資產(chǎn)定價(jià)問(wèn)題之間具有一些重要區(qū)別。在數(shù)據(jù)方面最重要的區(qū)別在于數(shù)據(jù)的信號(hào)噪聲比。資產(chǎn)定價(jià)問(wèn)題中,由于預(yù)測(cè)期望收益時(shí)訓(xùn)練數(shù)據(jù)的收益的條件期望值Et[rt]未知,只能觀測(cè)到收益率的實(shí)現(xiàn)值rt,但觀測(cè)值中同時(shí)包含Et[rt]和噪聲信號(hào)εt。同時(shí)收益率的條件期望值在橫截面或時(shí)間序列上的方差在收益率的總方差中占比也很小,信號(hào)噪聲比相應(yīng)較低。在數(shù)據(jù)維度方面,收益率訓(xùn)練數(shù)據(jù)觀測(cè)值通常較少也加劇了信號(hào)噪聲較低的問(wèn)題,加之預(yù)測(cè)變量缺乏高頻變化以及市場(chǎng)微觀結(jié)構(gòu)會(huì)發(fā)生變化導(dǎo)致預(yù)測(cè)結(jié)構(gòu)發(fā)生機(jī)制轉(zhuǎn)換(regime-switch)等原因,致使收益率的條件期望值的可預(yù)測(cè)性往往很低。+1+1+1+1從關(guān)注角度而言,資產(chǎn)定價(jià)問(wèn)題一般不關(guān)心單個(gè)資產(chǎn)的收益率預(yù)測(cè)是否精準(zhǔn),而更關(guān)注是否能構(gòu)建具備良好風(fēng)險(xiǎn)-收益性質(zhì)的投資組合。那么,對(duì)個(gè)股進(jìn)行良好預(yù)測(cè)的模型是否也能產(chǎn)生表現(xiàn)最優(yōu)越的投資組合?本書的核心內(nèi)容正是研究利用個(gè)股收益率的可預(yù)測(cè)特征來(lái)實(shí)現(xiàn)投資組合優(yōu)化。進(jìn)一步地,由于預(yù)測(cè)誤差的協(xié)方差矩陣很大程度上決定了投資組合的波動(dòng)率,其對(duì)于投資組合的均值方差性質(zhì)較為重要,因而將在模型選擇、正則化、預(yù)測(cè)表現(xiàn)的評(píng)價(jià)、構(gòu)建投資組合等方面對(duì)機(jī)器學(xué)習(xí)在資產(chǎn)定價(jià)中的應(yīng)用產(chǎn)生顯著影響。此外,預(yù)測(cè)問(wèn)題的一個(gè)關(guān)鍵特點(diǎn)是模型是否具備“稀疏性”(sparsity)。在資產(chǎn)定價(jià)問(wèn)題中,所有觀測(cè)到的變量都是某些潛在變量的帶噪聲信號(hào),其中某些變量可能與問(wèn)題高度相關(guān),而另一些變量可能幾乎不相關(guān)。傳統(tǒng)資產(chǎn)定價(jià)研究通常假設(shè)“稀疏性”,即只需少量預(yù)測(cè)變量或因子就能充分解釋不同資產(chǎn)預(yù)期收益率之間的差異。例如,經(jīng)典的Fama-French三因子模型就是稀疏性假設(shè)的代表,它認(rèn)為僅需三個(gè)因子就能解釋橫截面預(yù)期收益率。而機(jī)器學(xué)習(xí)方法提供了一種不強(qiáng)加“稀疏性”假設(shè)約束的數(shù)據(jù)驅(qū)動(dòng)估計(jì)方法,它能從數(shù)據(jù)中學(xué)習(xí)特征。這有助于我們?cè)趶?fù)雜的現(xiàn)實(shí)環(huán)境下探索高維變量之間的聯(lián)合效應(yīng)和統(tǒng)計(jì)特征間的相互作用,從而更有效地解釋潛在風(fēng)險(xiǎn)差異對(duì)股票收益率的影響。盧卡斯批判(Lucascritique)是一種針對(duì)宏觀經(jīng)濟(jì)模型的質(zhì)疑,尤其是對(duì)在制定經(jīng)濟(jì)政策時(shí)依賴歷史數(shù)據(jù)的方法的質(zhì)疑。盧卡斯批判強(qiáng)調(diào)在分析經(jīng)濟(jì)政策影響時(shí)應(yīng)考慮微觀基礎(chǔ),即個(gè)體行為和決策。其核心觀點(diǎn)在于,從歷史數(shù)據(jù)中觀察到的關(guān)系并不能保證在新的經(jīng)濟(jì)政策下仍然成立。當(dāng)政策發(fā)生變化時(shí),人們的預(yù)期和行為也會(huì)隨之調(diào)整,導(dǎo)致模型的參數(shù)發(fā)生變化。因此,僅僅依賴歷史數(shù)據(jù)可能會(huì)導(dǎo)致對(duì)政策影響的錯(cuò)誤預(yù)測(cè)。值得一提的是,基礎(chǔ)差別還包括投資者是否可以進(jìn)行學(xué)習(xí)從而使訓(xùn)練數(shù)據(jù)發(fā)生結(jié)構(gòu)性的變化??紤]到資產(chǎn)價(jià)格是人們根據(jù)歷史數(shù)據(jù)進(jìn)行投資決策的結(jié)果,收益率的潛在數(shù)據(jù)生成過(guò)程可能并不是時(shí)間序列平穩(wěn)的,例如在t時(shí)刻前,因子x能較好地預(yù)測(cè)收益,但在t時(shí)刻投資者發(fā)現(xiàn)了這個(gè)因子并進(jìn)行了大量交易,將會(huì)使收益可預(yù)測(cè)性在隨后的時(shí)段消失,即在t時(shí)刻數(shù)據(jù)發(fā)生了結(jié)構(gòu)性的變化。這種市場(chǎng)參與者的內(nèi)生行為導(dǎo)致在樣本內(nèi)發(fā)現(xiàn)的規(guī)律在樣本外失效的現(xiàn)象和宏觀經(jīng)濟(jì)學(xué)中經(jīng)典的“盧卡斯批判”(Lucas,1976)類似。但由于缺乏內(nèi)生的機(jī)制驅(qū)動(dòng)后續(xù)數(shù)據(jù)性質(zhì)的改變,當(dāng)前依然沒(méi)有合適的理論來(lái)指導(dǎo)如何使機(jī)器學(xué)習(xí)算法適應(yīng)資產(chǎn)定價(jià)數(shù)據(jù)結(jié)構(gòu)性的變化。(二)監(jiān)督學(xué)習(xí)及無(wú)監(jiān)督學(xué)習(xí)的區(qū)分關(guān)于監(jiān)督學(xué)習(xí)及無(wú)監(jiān)督學(xué)習(xí)的區(qū)分最早源自統(tǒng)計(jì)學(xué)習(xí)對(duì)數(shù)據(jù)的理解和應(yīng)用。具體而言,監(jiān)督學(xué)習(xí)涉及建立具體的統(tǒng)計(jì)模型,用于預(yù)測(cè)或估計(jì)基于一個(gè)或多個(gè)輸入的輸出,并可以在商業(yè)、醫(yī)學(xué)、天體物理學(xué)和公共政策等各類不同領(lǐng)域進(jìn)行應(yīng)用。就具體目標(biāo)而言,監(jiān)督學(xué)習(xí)是基于K個(gè)預(yù)測(cè)變量(predictor)或者K×1維特征(feature)向量xi,通過(guò)建立預(yù)測(cè)變量和響應(yīng)變量yi之間的關(guān)系,精準(zhǔn)預(yù)測(cè)響應(yīng)變量或更好地理解預(yù)測(cè)得到的響應(yīng)變量與預(yù)測(cè)變量的關(guān)系。對(duì)應(yīng)到實(shí)踐中,也就是使用訓(xùn)練數(shù)據(jù),在中尋找未知函數(shù),其中ε表示不可由x預(yù)測(cè)的均值為0的部分。假設(shè)訓(xùn)練數(shù)據(jù)和樣本外數(shù)據(jù)由同一個(gè)統(tǒng)計(jì)模型式(2-1)產(chǎn)生,由訓(xùn)練數(shù)據(jù)估計(jì)得到的是一個(gè)很好的樣本外預(yù)測(cè)變量。進(jìn)一步地,將響應(yīng)變量按照連續(xù)數(shù)值與離散數(shù)值進(jìn)行細(xì)分,監(jiān)督學(xué)習(xí)又包括回歸(regression)與分類(classification)兩大類模型,分別用于連續(xù)變量(定量問(wèn)題)和離散變量(定性問(wèn)題)的預(yù)測(cè)。在資產(chǎn)定價(jià)中,適用于推出連續(xù)變量的回歸問(wèn)題更加普遍??紤]不同的F,不同回歸方法又分別適用于線性與非線性模型,線性回歸在計(jì)量中常見,非線性回歸則類似于計(jì)量中的非參數(shù)估計(jì)方法,如核回歸等。不同于上述監(jiān)督學(xué)習(xí)的情形,在無(wú)監(jiān)督學(xué)習(xí)中,只有預(yù)測(cè)變量的觀測(cè)向量xi,也就是有輸入向量但沒(méi)有相應(yīng)的響應(yīng)變量來(lái)監(jiān)督輸出。換言之,無(wú)監(jiān)督學(xué)習(xí)無(wú)法提前告知算法數(shù)據(jù)集中不同類型數(shù)據(jù)對(duì)應(yīng)的標(biāo)簽。然而,即便缺乏響應(yīng)變量來(lái)指導(dǎo)數(shù)據(jù)分析,我們也可以從這些數(shù)據(jù)中學(xué)習(xí)相應(yīng)的關(guān)系和結(jié)構(gòu)。在下一節(jié)中,我們將具體展開介紹。2.2機(jī)器學(xué)習(xí)方法介紹(一)監(jiān)督學(xué)習(xí):線性回歸和收縮估計(jì)方法1.OLS模型假設(shè)統(tǒng)計(jì)模型式(2-1)中的f(xi)是線性的,則有其中g(shù)=(g1,…,gK)T是系數(shù)向量。盡管yi關(guān)于xi是線性的,xi中可以有預(yù)測(cè)變量的非線性轉(zhuǎn)化,即xi中可以有計(jì)量中解釋變量交互項(xiàng)之類的變量。將訓(xùn)練集中的N個(gè)觀測(cè)堆疊為N×1維的y=(y1,…,yN)T和N×K維的X=(x1,…,xN)T。由最小化均方誤差(meansquarederror)得到g的估計(jì)由此,樣本內(nèi)擬合值為。高維數(shù)據(jù)問(wèn)題中K相對(duì)于N并不會(huì)很小,此時(shí)樣本內(nèi)R2會(huì)很大,但是樣本外R2會(huì)很小甚至為負(fù),過(guò)擬合(overfitting)使得由OLS估計(jì)得到的預(yù)測(cè)不可信,原因是相比于觀測(cè)數(shù)量N有過(guò)多協(xié)變量(co-variate)使OLS過(guò)擬合(可以理解為重復(fù)使用少量的觀測(cè)訓(xùn)練模型所致),擬合了噪聲而非真實(shí)信號(hào)。K>N時(shí)OLS估計(jì)的結(jié)果甚至不是唯一的,但是這些擬合結(jié)果往往擬合了εi而非f(xi)。針對(duì)高維數(shù)據(jù)中解釋變量維度K較大(相對(duì)于樣本數(shù)量N)的問(wèn)題,統(tǒng)計(jì)學(xué)習(xí)文獻(xiàn)中采用基于收縮估計(jì)(shrinkageestimation)的回歸方法,此類方法的系數(shù)估計(jì)量并不滿足無(wú)偏性,但估計(jì)量的方差更小,所以其均方誤差更小,在模型預(yù)測(cè)上會(huì)有更好的效果。以下介紹嶺回歸、LASSO回歸和彈性網(wǎng)絡(luò)三種最具有代表性的收縮估計(jì)方法。2.嶺回歸在K很大時(shí),為了改善預(yù)測(cè)的表現(xiàn),對(duì)中太大的元素施加限制,在最小化均方誤差的基礎(chǔ)上施加L2懲罰(HoerlandKennard,1970a,1970b),從而得到g的嶺回歸(ridgeregression)估計(jì):其中,IK=diag(1,…,1)。目標(biāo)函數(shù)第一項(xiàng)為損失,第二項(xiàng)為懲罰項(xiàng),超參數(shù)γ控制了懲罰的強(qiáng)度,求逆矩陣的時(shí)候γIK使回歸系數(shù)向0收縮。在特殊情況。3.LASSO回歸類似于嶺回歸,對(duì)估計(jì)目標(biāo)函數(shù)施加L1懲罰(Tibshirani,1996),從而得到g的LASSO回歸估計(jì):此時(shí)關(guān)于y非線性,并且一般沒(méi)有解析解,但可以通過(guò)最小角回歸(Hastie,Tibshirani,andFriedman,2009)等算法得到數(shù)值解。LASSO回歸會(huì)使估計(jì)的系數(shù)向0收縮,由于L1懲罰項(xiàng)的加入,還可以使某些變量的系數(shù)壓縮到0,因而可以實(shí)現(xiàn)變量篩選稀疏的系數(shù)估計(jì)。特殊情況XTX=IK時(shí),。4.彈性網(wǎng)絡(luò)LASSO回歸在舍棄高度正相關(guān)的兩個(gè)變量中的一個(gè)時(shí),可能是數(shù)據(jù)中的噪聲起了決定性的作用,所以應(yīng)該將兩個(gè)變量的均值留在模型中,取均值有助于消除噪聲,而這正是嶺回歸做的事情,由此結(jié)合LASSO回歸與嶺回歸得到彈性網(wǎng)絡(luò)(elasticnet)(ZouandHastie,2005)彈性網(wǎng)絡(luò)也會(huì)使部分系數(shù)收縮為0,但是其變量篩選程度沒(méi)有LASSO回歸那么強(qiáng),并且也會(huì)有類似嶺回歸那樣的系數(shù)收縮。LASSO回歸、嶺回歸、彈性網(wǎng)絡(luò)對(duì)變量的縮放敏感HYPERLINK\h[1],所以一般應(yīng)該先對(duì)輸入的變量進(jìn)行標(biāo)準(zhǔn)化使其均值為0、標(biāo)準(zhǔn)差為1。但在一些經(jīng)濟(jì)金融學(xué)應(yīng)用中,模型中的回歸系數(shù)具有明確的經(jīng)濟(jì)學(xué)含義,其中對(duì)應(yīng)的變量受到經(jīng)濟(jì)學(xué)模型的約束,對(duì)其進(jìn)行標(biāo)準(zhǔn)化會(huì)影響模型系數(shù)的經(jīng)濟(jì)學(xué)解釋。例如Kozak,Nagel和Santosh(2020)應(yīng)用嶺回歸和彈性網(wǎng)絡(luò)來(lái)檢驗(yàn)隨機(jī)貼現(xiàn)因子模型是否具有稀疏性,為了保留定價(jià)因子風(fēng)險(xiǎn)價(jià)格系數(shù)的經(jīng)濟(jì)學(xué)含義,并沒(méi)有對(duì)因子的收益率和協(xié)方差矩陣做標(biāo)準(zhǔn)化處理。(二)監(jiān)督學(xué)習(xí):非線性方法1.回歸樹(CART)回歸樹(Breiman,etal.,1984,2017)通過(guò)多維階躍函數(shù)來(lái)近似非線性函數(shù)f(xi)。特征空間由多個(gè)包含各個(gè)xi的鄰近區(qū)域,即“葉子”組成,基于回歸樹的算法一般使用遞歸二元?jiǎng)澐炙惴▌澐痔卣骺臻g。尋找能最小化殘差平方和的全局最優(yōu)劃分在計(jì)算上是不可行的,一般使用貪婪算法(如Hastie,etal.,2009),對(duì)所有數(shù)據(jù)根據(jù)每一個(gè)特征依據(jù)不同閾值進(jìn)行二元?jiǎng)澐植⒄页瞿茏顑?yōu)化這一步擬合的做法,對(duì)劃分得到的數(shù)據(jù)集,即“域”,重復(fù)上述操作,直到每一個(gè)域內(nèi)的觀測(cè)值數(shù)量足夠少。用R1,…,RH表示根據(jù)x=(x1,…,xK)劃分出的域,是滿足xi∈Rh的觀測(cè)值yi的等權(quán)重均值。當(dāng)xi∈Rh時(shí),。非參數(shù)統(tǒng)計(jì)中常用的核回歸(kernelregression)的應(yīng)變量y估計(jì)值為待預(yù)測(cè)點(diǎn)鄰域內(nèi)觀測(cè)值的均值,不過(guò)鄰域的選取和對(duì)數(shù)據(jù)進(jìn)行加權(quán)的方法更復(fù)雜一些。為了避免過(guò)擬合,從一個(gè)足夠大、必然過(guò)擬合的樹開始剪枝。假設(shè)初始有H片葉子,尋找一個(gè)使剪枝后的樹能夠最小化受到的懲罰的殘差平方和調(diào)整參數(shù)(tuningparameter)γ=0時(shí)不進(jìn)行剪枝,γ越大剪枝越劇烈。2.隨機(jī)森林(randomforest)對(duì)樹的大小進(jìn)行懲罰的替代措施是使用隨機(jī)森林(Breiman,2001),令樹達(dá)到最大(葉的規(guī)模達(dá)到最?。?,使用自助聚合(bootstrapaggregation)來(lái)降低過(guò)擬合。假設(shè)xi有J個(gè)特征。從訓(xùn)練數(shù)據(jù)集中獲取一個(gè)和原數(shù)據(jù)集同樣大小的自助抽樣,隨機(jī)選擇m<J個(gè)特征,由此產(chǎn)生一個(gè)使葉的規(guī)模達(dá)到最小的樹,反復(fù)抽樣得到一個(gè)“森林”,調(diào)節(jié)m可以改變懲罰力度,最終xi對(duì)應(yīng)的估計(jì)值為這些樹在xi處估計(jì)值的均值,這種取均值的方法消除了不同樹、不同的過(guò)擬合噪聲帶來(lái)的影響。3.神經(jīng)網(wǎng)絡(luò)(neuralnetwork)對(duì)于單層全連接神經(jīng)網(wǎng)絡(luò),假設(shè)輸入xi有J個(gè)特征,輸出yi,神經(jīng)網(wǎng)絡(luò)隱藏層(hiddenlayer)有H個(gè)節(jié)點(diǎn)(node),擬合模型yi=f(xi)+εi,則神經(jīng)網(wǎng)絡(luò)可以表示為其中a1+W1xi表示潛變量(latentvariables)。激活函數(shù)(activationfunction)g是非線性的,對(duì)潛變量逐個(gè)元素進(jìn)行操作,如使用ReLU函數(shù)g(z)=max{0,z}。神經(jīng)網(wǎng)絡(luò)最終輸出f(xi)。隱藏層節(jié)點(diǎn)數(shù)量足夠多時(shí),神經(jīng)網(wǎng)絡(luò)可以近似任意非線性函數(shù);深度神經(jīng)網(wǎng)絡(luò)(DNN)一般有10~20層,更多層的神經(jīng)網(wǎng)絡(luò)可以表示為在全連接的情況下,記第p個(gè)隱藏層節(jié)點(diǎn)數(shù)量為Hp,則增加第p+1個(gè)隱藏層會(huì)增加Hp×Hp+Hp個(gè)參數(shù)。實(shí)踐中,對(duì)于擬合而言,添加層數(shù)比在一層中添加節(jié)點(diǎn)可能更有效,相關(guān)討論可參考Ba和Ca-ruana(2014)。+1+1神經(jīng)網(wǎng)絡(luò)輸入之間的交互效應(yīng)對(duì)輸出不可加,這種非線性在資產(chǎn)定價(jià)應(yīng)用中非常重要。考慮單一隱藏層中有兩個(gè)節(jié)點(diǎn)的全連接神經(jīng)網(wǎng)絡(luò),設(shè)g(z)=max{0,z},a1=(a1,a1)T,其中a1>a1,則此時(shí),1,2,2,1第二項(xiàng)在xi+xi>a1時(shí)才能被激活,第三項(xiàng)在xi+xi<a1且足夠小時(shí)才能被激活,即體現(xiàn)了交互效應(yīng)的不可加性。,1,2,1,1,2,2記所有參數(shù)的集合為θ,使用最小化均方誤差目標(biāo)函數(shù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)-1可以使用隨機(jī)梯度下降(stochasticgradientdescent,SGD)或者擬牛頓法(quasi-Newtonmethods)等數(shù)值方法求目標(biāo)函數(shù)的最小值。使用光滑的激活函數(shù)如sigmoid函數(shù)g(z)=[1+exp(-z)]可以方便求解。過(guò)大的神經(jīng)網(wǎng)絡(luò)也會(huì)有過(guò)擬合問(wèn)題,可以施加類似嶺回歸L2懲罰的正則化在使用激活函數(shù)sigmoid的情況下,參數(shù)收縮使神經(jīng)網(wǎng)絡(luò)向線性回歸模型收縮,如果輸入觀測(cè)的值很大,從而對(duì)應(yīng)的權(quán)重參數(shù)很小,則正則化無(wú)效,所以一般仍然要將輸入標(biāo)準(zhǔn)化,使其均值為0、標(biāo)準(zhǔn)差為1。(三)無(wú)監(jiān)督學(xué)習(xí)前面的線性方法和非線性方法都屬于監(jiān)督學(xué)習(xí)方法,可以使用結(jié)果變量對(duì)模型的訓(xùn)練效果進(jìn)行評(píng)估;無(wú)監(jiān)督學(xué)習(xí)方法則沒(méi)有目標(biāo)變量來(lái)評(píng)估模型的好壞,主要用于分析數(shù)據(jù)本身的特征,如主成分分析、K-均值聚類等。1.主成分分析主成分分析用于揭示變量之間的相關(guān)性特征,可以用低維獨(dú)立數(shù)據(jù)描述高維數(shù)據(jù)的變化。考慮一組隨機(jī)變量xi=(x1i,x2i,…,xki),其方差協(xié)方差矩陣為Σ。設(shè)wi=(wi1,wi2,…,wik)為一組k維權(quán)重向量,那么以wi為權(quán)重(載荷)的隨機(jī)變量xi線性組合為這里我們將wi標(biāo)準(zhǔn)化為以確保方差有限。隨機(jī)變量yi的方差和協(xié)方差為其中i,j=1,2,…,k。主成分分析的目的是找出一系列wi使得隨著i增大,yi的方差逐漸減小,并且對(duì)于任意i≠j,yi和yj的相關(guān)性為零。找出wi的步驟是:(1)i=1,最大化;(2)i=2,最大化Var(y2)=w′2Σw2,約束是和cov(y2,y1)=0;(3)i=j(luò),最大化Var(yj)=w′jΣwj,約束是和cov(yj,ys)=0,。這一優(yōu)化過(guò)程給出的最優(yōu)載荷向量恰好是Σ的特征向量,并且相對(duì)應(yīng)的特征值逐項(xiàng)遞減。令(λ1,e1),(λ2,e2),…,(λk,ek)為Σ的特征值(特征向量對(duì)),并且λ1≥λ2≥…≥λk≥0(Σ是非負(fù)定的,所以特征值非負(fù))。那么,第i個(gè)主成分為,其方差為。第i,j(i≠j)個(gè)主成分的協(xié)方差為cov(yi,yj)=。進(jìn)一步地,隨機(jī)變量xi的總方差恰好等于所有主成分的總方差,所以主成分i所能解釋的變量總體變化的比例等于對(duì)應(yīng)的特征值與所有特征值的和之比,即特別地,對(duì)主成分再進(jìn)行線性組合并不能構(gòu)造出一個(gè)方差更大的主成分。前幾個(gè)主成分包含了原隨機(jī)變量的大部分信息,可以用其替代原隨機(jī)變量作為訓(xùn)練模型的輸入,大大降低數(shù)據(jù)的維度。由于主成分之間并沒(méi)有相關(guān)性,在線性模型中用主成分替代原有隨機(jī)變量可以避免多重共線性問(wèn)題。2.K-均值聚類聚類是根據(jù)數(shù)據(jù)本身特征對(duì)數(shù)據(jù)進(jìn)行分組的技術(shù)。給定n個(gè)觀測(cè)值x1,x2,…,xn,每個(gè)觀測(cè)都有k維特征,K-均值聚類把n個(gè)觀測(cè)值分成互不交疊的K個(gè)子組S=S1,S2,…,Sk,這里的K需要提前給定。K-均值聚類技術(shù)通過(guò)最小化組內(nèi)平方和(within-clustersumofsquares,WCSS)來(lái)求出分組S,其中μi是子組Si的元素均值,即,這里指Si的元素個(gè)數(shù),是L2懲罰項(xiàng),即歐幾里得距離。由于,K-均值聚類最小化同一子組內(nèi)的兩兩元素的變差,由于總體的變差是不變的,因此最小化WCSS等于最大化子組間的平方變差(between-clustersumofsquares,BCSS)。在實(shí)踐中,可以采用Lloyd算法得到WCSS或BCSS問(wèn)題的數(shù)值解。(四)調(diào)節(jié)超參數(shù)超參數(shù)(hyperparameters)指在使用訓(xùn)練樣本估計(jì)機(jī)器學(xué)習(xí)模型前需要預(yù)先設(shè)置值的參數(shù),而非通過(guò)數(shù)據(jù)直接估計(jì)得到的參數(shù)。一般而言,超參數(shù)用于定義機(jī)器學(xué)習(xí)模型的更高層次的概念,比如模型復(fù)雜度或?qū)W習(xí)能力,其不能直接從模型訓(xùn)練數(shù)據(jù)集中學(xué)習(xí),需要預(yù)先定義。機(jī)器學(xué)習(xí)方法,尤其是監(jiān)督學(xué)習(xí)方法的實(shí)證應(yīng)用效果往往受超參數(shù)取值的影響很大,可以通過(guò)設(shè)置不同的測(cè)試值,訓(xùn)練不同的模型并觀察其在訓(xùn)練樣本外的驗(yàn)證集中的表現(xiàn)來(lái)調(diào)節(jié)優(yōu)化超參數(shù)取值。機(jī)器學(xué)習(xí)方法中常見的超參數(shù)包括:收縮估計(jì)法中調(diào)節(jié)對(duì)系數(shù)正則化約束條件強(qiáng)弱的參數(shù),樹方法中樹的數(shù)量或樹的深度,深層神經(jīng)網(wǎng)絡(luò)隱藏層數(shù),主成分分析中潛在主成分的數(shù)量,K-均值聚類中的子組數(shù)量等。下面我們以嶺回歸為例,簡(jiǎn)要介紹超參數(shù)的作用,以及在收縮估計(jì)法中常用的超參數(shù)優(yōu)化調(diào)節(jié)方法。在嶺回歸中,樣本內(nèi)均方誤差為其中,N為觀測(cè)數(shù)量,γ為嶺回歸的超參數(shù)。過(guò)擬合的程度與模型復(fù)雜度有關(guān),OLS回歸的模型復(fù)雜度只與變量個(gè)數(shù)有關(guān),嶺回歸的收縮限制了估計(jì)值從而降低了模型復(fù)雜度,要兼顧最小化樣本內(nèi)mse(γ)和降低模型復(fù)雜度對(duì)樣本外預(yù)測(cè)的好處以選擇最優(yōu)的γ。對(duì)于存在的線性模型(如OLS回歸),可以用有效參數(shù)數(shù)量tr(H)表現(xiàn)模型復(fù)雜度(Hastie,Tibshirani,andFriedman,2009),其中tr(·)表示求跡,在嶺回歸的情況下參數(shù)有效數(shù)量為在OLS回歸中,d(0)=tr(IK)=K;在嶺回歸中,γ>0時(shí),d(γ)<k,例如在XTX=IK的情況下d(γ)=k/(1+γ)。綜合參數(shù)有效數(shù)量和樣本內(nèi)誤差得到對(duì)擬合的測(cè)度如AIC(Akaikeinformationcriterion),在嶺回歸的情況下,假設(shè)ε是獨(dú)立同正態(tài)分布的高斯噪聲,則γ增加使AIC(γ)第一項(xiàng)增加、第二項(xiàng)降低,最小化AIC得到最優(yōu)超參數(shù)。AIC的缺點(diǎn)在于,它難以找到非線性模型的有效參數(shù)數(shù)量,即使應(yīng)用于線性模型也依賴于很強(qiáng)的假設(shè),降低ε獨(dú)立同正態(tài)分布的要求需要假設(shè)特定形式的似然函數(shù)。純數(shù)據(jù)驅(qū)動(dòng)的確定超參數(shù)的方法是交叉驗(yàn)證(cross-validation,CV),將估計(jì)得到的模型在驗(yàn)證集(Xv,yv)上的預(yù)測(cè)誤差作為最小化目標(biāo),Stone(1977)證明了由CV和AIC選擇模型是漸進(jìn)等價(jià)的。在嶺回歸的情況下使用k折交叉驗(yàn)證可以改善數(shù)據(jù)利用效率,即把整個(gè)數(shù)據(jù)集劃分為同等大小的k份,進(jìn)行k輪操作,每次使用其中的一份做模型驗(yàn)證,剩下的k-1份做模型估計(jì),最優(yōu)超參數(shù)能最小化k個(gè)預(yù)測(cè)誤差的均值。例如在嶺回歸的情況下其中v(j)表示劃分得到的第j份數(shù)據(jù)集,-v(j)表示除去第j份剩余的數(shù)據(jù)集。那么如何確定k折交叉驗(yàn)證中最優(yōu)的k呢?k小則估計(jì)參數(shù)使用的數(shù)據(jù)少,導(dǎo)致對(duì)預(yù)測(cè)誤差的評(píng)估偏悲觀;k大則每次估計(jì)模型使用的數(shù)據(jù)有較大程度的交疊,雖然對(duì)模型預(yù)測(cè)誤差的估計(jì)更傾向于無(wú)偏,但是預(yù)測(cè)誤差會(huì)有較大的方差,因?yàn)樾鲁槿〉尿?yàn)證集預(yù)測(cè)誤差有更大的不確定性,由此存在一個(gè)對(duì)預(yù)測(cè)誤差的偏差與方差的權(quán)衡;另外k過(guò)大還會(huì)增加計(jì)算量。實(shí)踐中一般選擇遠(yuǎn)小于N的k。由于要最小化預(yù)測(cè)誤差的均值,所以應(yīng)該選擇以得到對(duì)預(yù)測(cè)誤差的偏樂(lè)觀的評(píng)估。數(shù)據(jù)集中還應(yīng)劃分出一個(gè)額外的不用于訓(xùn)練和驗(yàn)證的測(cè)試集,在測(cè)試集上評(píng)估預(yù)測(cè)誤差。\h[1]可以考慮XTX=IK的情況。第三章投資組合優(yōu)化本章介紹資產(chǎn)定價(jià)領(lǐng)域的基礎(chǔ)性研究問(wèn)題,即投資組合優(yōu)化問(wèn)題。3.1節(jié)首先介紹經(jīng)典的Markowitz(1952)均值方差投資組合優(yōu)化理論以及其在高維數(shù)據(jù)環(huán)境下的局限性。3.2節(jié)介紹Brandt,Santa-Clara和Valkanov(2009)提出的參數(shù)化投資組合優(yōu)化理論,該方法將所需優(yōu)化的股票權(quán)重寫成K個(gè)特征變量的線性函數(shù),再針對(duì)投資者的期望效用函數(shù)求最大化從而估計(jì)出這K個(gè)參數(shù)。3.3節(jié)從最大化投資者期望效用出發(fā),推導(dǎo)隨機(jī)貼現(xiàn)因子的表達(dá)式,并證明文獻(xiàn)中利用若干個(gè)定價(jià)因子表示隨機(jī)貼現(xiàn)因子的做法本質(zhì)上與求解最大化期望效用問(wèn)題等價(jià)。3.4節(jié)介紹如何利用多種常用的機(jī)器學(xué)習(xí)方法實(shí)現(xiàn)降維來(lái)有效估計(jì)最優(yōu)參數(shù)化投資組合權(quán)重。3.5節(jié)簡(jiǎn)要介紹如何利用神經(jīng)網(wǎng)絡(luò)模型來(lái)求最優(yōu)投資組合權(quán)重。3.6節(jié)提出一種基于模型平均的更簡(jiǎn)單且適用于更具有一般性的期望效用函數(shù)的全子集組合法來(lái)優(yōu)化參數(shù)化投資組合。最后,3.7節(jié)結(jié)合我國(guó)A股市場(chǎng)數(shù)據(jù)給出了嚴(yán)謹(jǐn)?shù)膶?shí)證分析結(jié)果,希望幫助讀者從理論和實(shí)證的角度來(lái)了解機(jī)器學(xué)習(xí)方法在求解最優(yōu)投資組合權(quán)重中的應(yīng)用。3.8節(jié)總結(jié)本章內(nèi)容。3.1馬科維茨投資組合1952年馬科維茨在《金融學(xué)期刊》(TheJournalofFinance)上發(fā)表題為《投資組合選擇》(PortfolioSelection)的論文標(biāo)志著現(xiàn)代證券組合理論的開端。在單期投資中,投資者分別將資金按照預(yù)定比例分別投資于不同資產(chǎn)并持有一個(gè)證券組合到期末,馬科維茨模型通過(guò)優(yōu)化資產(chǎn)的組合來(lái)獲取風(fēng)險(xiǎn)和收益的最佳點(diǎn)。假設(shè)N個(gè)風(fēng)險(xiǎn)資產(chǎn)的超額收益是隨機(jī)收益向量與無(wú)風(fēng)險(xiǎn)收益率之差,即,記其條件均值為μt,協(xié)方差矩陣為Σt。假設(shè)超額收益獨(dú)立同分布并且各階矩為常數(shù)。假設(shè)投資者只能在這N個(gè)風(fēng)險(xiǎn)資產(chǎn)(不包括無(wú)風(fēng)險(xiǎn)資產(chǎn))之間配置財(cái)富,各資產(chǎn)在投資組合中的權(quán)重為w,那么優(yōu)化問(wèn)題為第一個(gè)限制條件保證了投資組合的期望收益,第二個(gè)限制條件保證了所有的財(cái)富都投資于風(fēng)險(xiǎn)資產(chǎn)。由拉格朗日方法一階條件求出最優(yōu)投資組合權(quán)重為-1-1-1-1-1-1-1?T?其中,Λ1=[B(Σι)-A(Σμ)]/D,Λ2=[C(Σμ)-A(Σι)]/D,ι=(1,…,1)T,A=ιTΣμ,B=μTΣμ,C=ιTΣι,D=BC-A2。最小化的投資組合方差為wΣw。如果投資者可以將財(cái)富配置于無(wú)風(fēng)險(xiǎn)資產(chǎn),即可以以無(wú)風(fēng)險(xiǎn)利率進(jìn)行不受限制的借貸,那么實(shí)現(xiàn)風(fēng)險(xiǎn)投資與無(wú)風(fēng)險(xiǎn)資產(chǎn)最優(yōu)的組合應(yīng)最大化夏普比率E[rp]/std[rp],即從無(wú)風(fēng)險(xiǎn)資產(chǎn)出發(fā)與均值方差有效前沿相切的切線上的任意一點(diǎn)所對(duì)應(yīng)的投資組合,由此每一個(gè)投資者將相同的風(fēng)險(xiǎn)資產(chǎn)投資與無(wú)風(fēng)險(xiǎn)資產(chǎn)進(jìn)行組合。假設(shè)財(cái)富配置于風(fēng)險(xiǎn)資產(chǎn)的權(quán)重向量為x,剩余(1-ιTx)的財(cái)富配置于無(wú)風(fēng)險(xiǎn)資產(chǎn),投資組合收益率為,則均值方差最優(yōu)化問(wèn)題可以用超額收益表示為,t+1,t+1解得均值方差投資組合權(quán)重為-1記常數(shù),可按比例縮放Σμ的所有元素以實(shí)現(xiàn)所需的期望投資組合風(fēng)險(xiǎn)溢價(jià)。基于上述最優(yōu)投資組合表達(dá)式,考慮到切點(diǎn)投資組合完全由風(fēng)險(xiǎn)資產(chǎn)組成,所以切點(diǎn)組合權(quán)重之和ιTwtgc=1,進(jìn)而對(duì)切點(diǎn)風(fēng)險(xiǎn)投資組合有?上述均值方差問(wèn)題生成了一個(gè)從期望投資組合風(fēng)險(xiǎn)溢價(jià)μ到均值方差投資組合權(quán)重w的映射,并使得投資組合收益波動(dòng)率為,而期望風(fēng)險(xiǎn)溢價(jià)則內(nèi)生地由投資者對(duì)風(fēng)險(xiǎn)的容忍度決定。從投資者對(duì)期望收益和風(fēng)險(xiǎn)進(jìn)行權(quán)衡的角度出發(fā),上述均值方差問(wèn)題也可以描述為一個(gè)效用最優(yōu)化問(wèn)題?-1其中γ表示投資者的相對(duì)風(fēng)險(xiǎn)厭惡程度。解仍為w=λΣμ,并有λ=1/γ。?馬科維茨模型有兩個(gè)重要的經(jīng)濟(jì)學(xué)意義:(1)不完全相關(guān)的資產(chǎn)可以產(chǎn)生較好的風(fēng)險(xiǎn)收益特征;(2)完全分散化投資時(shí),較高的期望收益只能通過(guò)極端的權(quán)重分配來(lái)取得(w是的線性函數(shù)),由此要承擔(dān)較高的風(fēng)險(xiǎn)。由此可見,馬科維茨模型主要關(guān)注投資組合選擇的兩方面,即分散化以及對(duì)期望收益和風(fēng)險(xiǎn)的權(quán)衡。然而,馬科維茨模型也存在如下幾個(gè)問(wèn)題:首先,馬科維茨模型僅考慮投資者具有均值方差效用時(shí)的配置情況,忽略了其對(duì)高階矩的偏好,尤其是收益的偏度和峰度。大量文獻(xiàn)證明投資者偏好收益率具有正偏度的資產(chǎn),甚至因此愿意接受預(yù)期收益率為負(fù)的資產(chǎn)?;趯?duì)負(fù)偏度收益率資產(chǎn)的厭惡,產(chǎn)生了方差之外的風(fēng)險(xiǎn)測(cè)度,如僅考慮負(fù)收益的“下行風(fēng)險(xiǎn)”(downsiderisk)。資產(chǎn)組合收益率的偏度不一定會(huì)比單個(gè)資產(chǎn)收益率的偏度的線性組合高或低,因此在考慮偏度的情況下,均值方差最優(yōu)準(zhǔn)則將會(huì)產(chǎn)生次優(yōu)的投資組合。其次,均值方差模型可以被證明等價(jià)于最大化期望效用時(shí)使用的二次效用函數(shù),而這種效用隨財(cái)富的增加并非單調(diào)增加。現(xiàn)有文獻(xiàn)更關(guān)注雙曲絕對(duì)風(fēng)險(xiǎn)厭惡(HARA)的時(shí)間可分的預(yù)期效用,特例包括對(duì)數(shù)效用、指數(shù)或常數(shù)相對(duì)風(fēng)險(xiǎn)厭惡(CRRA)效用、負(fù)指數(shù)或常數(shù)絕對(duì)風(fēng)險(xiǎn)厭惡(CARA)效用等。最后,馬科維茨模型僅考慮了單期問(wèn)題,而現(xiàn)實(shí)中投資組合優(yōu)化是長(zhǎng)期的問(wèn)題,并且需要在中期對(duì)投資組合進(jìn)行再平衡。一般地,投資者在時(shí)刻t選擇投資組合,通過(guò)在t,t+1,…,t+τ-1對(duì)無(wú)風(fēng)險(xiǎn)資產(chǎn)和N種風(fēng)險(xiǎn)資產(chǎn)進(jìn)行交易,來(lái)最大化t+τ時(shí)關(guān)于財(cái)富的效用,因此在多期情形下,最優(yōu)化問(wèn)題可表示為:其中各期財(cái)富均非負(fù),Ws≥0。zt是由狀態(tài)變量組成的K維向量,即t時(shí)刻的信息集。在多期情況下,投資者的決策優(yōu)化問(wèn)題更為復(fù)雜,不僅面臨著收益本身的不確定性與未來(lái)股息收益率的變化,同時(shí)也未知投資機(jī)會(huì)是否會(huì)改善、惡化或保持不變。類似于在橫截面上分散化收益風(fēng)險(xiǎn),投資者可能會(huì)為了未來(lái)的投資機(jī)會(huì)而平滑跨期風(fēng)險(xiǎn)。馬科維茨模型僅研究單期問(wèn)題,因此在研究更貼合實(shí)際的多期投資策略時(shí)顯得捉襟見肘。在研究組合配置問(wèn)題上,傳統(tǒng)的計(jì)量方法主要使用代入估計(jì)。代入估計(jì)指投資者直接對(duì)最優(yōu)組合中的未知參數(shù)進(jìn)行統(tǒng)計(jì)推斷,以單期投資組合選擇問(wèn)題為例,投資者期望效用最大化的解將偏好參數(shù)?、狀態(tài)向量zt、數(shù)據(jù)生成過(guò)程參數(shù)θ映射到最優(yōu)投資組合權(quán)重中:其中,偏好參數(shù)?為事前設(shè)定,狀態(tài)向量zt由觀察得到,根據(jù)Yt≡可以獲得θ的無(wú)偏估計(jì)或者一致估計(jì),將該估計(jì)代入便可得到最優(yōu)投資組合權(quán)重的估計(jì)。在實(shí)際應(yīng)用中,代入估計(jì)一般而言并不精確,即使是大樣本漸進(jìn)近似也不可靠。由于收益協(xié)方差矩陣會(huì)以二次速度遞增,代入估計(jì)的精確度隨資產(chǎn)數(shù)量N增加而大幅下降。此外,代入估計(jì)還可能出現(xiàn)極端權(quán)重,違背分散化原則并且不具有穩(wěn)定性。因此,對(duì)代入估計(jì)通常需要采用一些優(yōu)化方法,如收縮估計(jì)、使用因子模型、施加投資組合限制等。3.2參數(shù)化投資組合優(yōu)化傳統(tǒng)的投資組合優(yōu)化理論是基于Markowitz(1952)經(jīng)典的均值方差組合模型討論如何利用資產(chǎn)收益率的統(tǒng)計(jì)特征,即均值和方差,來(lái)最優(yōu)化資產(chǎn)配置,其估計(jì)參數(shù)的維度隨資產(chǎn)數(shù)量N的增加以冪函數(shù)的形式增加,在面對(duì)大量資產(chǎn)和有限樣本時(shí),參數(shù)估計(jì)變得十分困難。文獻(xiàn)中往往使用貝葉斯估計(jì)方法解決這一問(wèn)題,通過(guò)引入先驗(yàn)信息幫助提高參數(shù)估計(jì)精度,但先驗(yàn)信息往往會(huì)包含一定的主觀判斷,使統(tǒng)計(jì)推斷有一定的主觀性。Brandt,Santa-Clara和Valkanov(2009)則通過(guò)直接對(duì)每個(gè)資產(chǎn)的權(quán)重進(jìn)行建模的方式來(lái)達(dá)到參數(shù)降維的目的。資產(chǎn)定價(jià)文獻(xiàn)中,股票收益率的差別往往能被某些重要的特征變量所解釋,因此Brandt,Santa-Clara和Valkanov(2009)將所需優(yōu)化的股票權(quán)重參數(shù)寫成某K個(gè)特征變量的線性函數(shù),再針對(duì)投資者的期望效用函數(shù)求最大化從而估計(jì)出這K個(gè)參數(shù)。這一方法被稱作參數(shù)化投資組合??紤]在第t期由Nt只股票構(gòu)成的資產(chǎn)池,每只股票j在該期對(duì)應(yīng)K個(gè)可觀測(cè)的特征變量c1,…,cK,投資者需要在當(dāng)期期末再平衡組合,確定最優(yōu)的股票權(quán)重,即面臨如下關(guān)于下一期組合收益率rp的條件期望最大化問(wèn)題:,t+1設(shè)投資組合的權(quán)重是特征的函數(shù):先假設(shè)最簡(jiǎn)單的線性形式即其中為該股票在某基準(zhǔn)組合中的權(quán)重,例如該股票在市場(chǎng)指數(shù)中的市值權(quán)重,θ=(θ1,…,θK)T是待估計(jì)的參數(shù),表示投資者進(jìn)行主動(dòng)管理時(shí)投資組合權(quán)重相對(duì)于基準(zhǔn)投資組合權(quán)重偏離的部分。為了使權(quán)重之和為1,需要將所有特征在橫截面上進(jìn)行標(biāo)準(zhǔn)化。投資組合在下一期的收益率可以表示為基準(zhǔn)投資組合收益率與基于特征的投資組合收益率的加權(quán)平均之和,即其中,表示做多第k個(gè)特征取值高的股票、做空第k個(gè)特征取值低的股票所形成的零成本多空對(duì)沖投資組合的收益率。將rp表達(dá)式代入前述條件期望最大化問(wèn)題即可求解θ,進(jìn)一步可以求出投資組合最優(yōu)權(quán)重wt。由于θ不隨時(shí)間變化,所以條件期望效用最大化問(wèn)題等價(jià)于如下無(wú)條件期望效用最大化問(wèn)題,t+1記μb,為基準(zhǔn)投資組合收益率的期望和方差,μc,Σ為特征投資組合收益率的期望向量和方差矩陣,為的協(xié)方差向量,假設(shè)投資者有均值方差效用,則其中C為與θ無(wú)關(guān)的常數(shù),,由此最大化期望效用時(shí)令期望效用中二次型部分的一階導(dǎo)數(shù)為0,從而求得最優(yōu)參數(shù)?對(duì)于非均值方差效用的其他效用函數(shù),不一定可以求出參數(shù)θ估計(jì)的解析解,如果函數(shù)u(rp)連續(xù)可導(dǎo),則可以由如下K個(gè)矩條件使用GMM解得最優(yōu)的θ:,t+1?如果u(rp)不可導(dǎo),則需要通過(guò)插值或者數(shù)值計(jì)算尋找最優(yōu)的θ。由此可見,相比于最初的馬科維茨均值方差模型,參數(shù)化投資組合可以適用于更廣義的效用函數(shù)、考慮更多的投資者特征。,t+1??檢驗(yàn)θ估計(jì)量是否顯著不為0體現(xiàn)了參數(shù)化投資組合方法得到的投資組合權(quán)重偏離基準(zhǔn)投資組合權(quán)重的程度,可以使用自助法估計(jì)得到θ估計(jì)量的經(jīng)驗(yàn)分布,使用經(jīng)驗(yàn)分布的協(xié)方差矩陣代替總體協(xié)方差矩陣,本書在后續(xù)的實(shí)證分析中統(tǒng)一采用該方法。由上述論述可見,Brandt,Santa-Clara和Valkanov(2009)提出的參數(shù)化投資組合方法的優(yōu)勢(shì)主要包括:(1)對(duì)大量股票構(gòu)建最優(yōu)投資組合更加方便,參數(shù)個(gè)數(shù)不受資產(chǎn)數(shù)量影響,只取決于使用的特征變量的數(shù)量;(2)最優(yōu)投資組合權(quán)重不太容易出現(xiàn)過(guò)擬合,由于參數(shù)的數(shù)量遠(yuǎn)小于資產(chǎn)數(shù)量,并且當(dāng)且僅當(dāng)特征變量對(duì)預(yù)期收益率有穩(wěn)定的解釋作用時(shí)θ顯著不為0,這使得θ的估計(jì)量在時(shí)序上是平穩(wěn)的,只要特征變量沒(méi)有極端值,得到的最優(yōu)投資組合權(quán)重相比馬科維茨模型就不會(huì)非常極端;(3)多因子模型可以看作參數(shù)化投資組合方法得到的多空對(duì)沖組合,如將按公司市值規(guī)模排序,前20%市值最小的股票對(duì)應(yīng)的市值變量值轉(zhuǎn)化為-1,后20%市值最大的股票的市值變量值轉(zhuǎn)化為1,其他股票對(duì)應(yīng)的市值特征變量值設(shè)為0,即構(gòu)造了規(guī)模因子SMB;(4)可以將投資者對(duì)高階矩的偏好反映在特征變量與收益率的聯(lián)合分布中,這一點(diǎn)可以通過(guò)對(duì)E[u(rp)]在rp的均值附近進(jìn)行泰勒公式展開來(lái)證明。,t+1,t+13.3最優(yōu)投資組合與隨機(jī)貼現(xiàn)因子等價(jià)性本節(jié)從最大化投資者期望效用出發(fā),推導(dǎo)隨機(jī)貼現(xiàn)因子的表達(dá)式,并證明文獻(xiàn)中利用若干個(gè)定價(jià)因子表示隨機(jī)貼現(xiàn)因子本質(zhì)上與求解最大化期望效用問(wèn)題等價(jià)。這意味著在利用參數(shù)化投資組合方法進(jìn)行組合優(yōu)化時(shí),同時(shí)也是基于所用到的特征變量信息構(gòu)建隨機(jī)貼現(xiàn)因子,從而將均值方差有效前沿、隨機(jī)貼現(xiàn)因子和多因子模型統(tǒng)一起來(lái)。條件期望效用最大化問(wèn)題關(guān)于θ的一階矩條件為?令Mt=u′(rb+θTrc),則有Et[Mtrc]=0,即定義了隨機(jī)貼現(xiàn)因子。當(dāng)滿足前述一階矩條件時(shí),參數(shù)取值最優(yōu),即θ=θ,對(duì)u′(·)在0附近進(jìn)行泰勒展開+1,t+1,t+1+1,t+1?T其中rp=rb+θrc為最優(yōu)投資組合的收益,假設(shè)Mt有線性結(jié)構(gòu),忽略高階項(xiàng),由于Et[Mtrc]=0,所以對(duì)Mt進(jìn)行縮放調(diào)整,即得到隨機(jī)貼現(xiàn)因子的結(jié)構(gòu)。,t+1,t+1,t+1+1+1,t+1+1定理1:假設(shè)投資者的效用函數(shù)為u(·)且二階連續(xù)可微,則t+1期隨機(jī)貼現(xiàn)因子為如果投資者風(fēng)險(xiǎn)厭惡系數(shù)為γ,則投資者有均值方差效用和CRRA效用時(shí)隨機(jī)貼現(xiàn)因子結(jié)構(gòu)分別為證明:(1)投資者有均值方差效用且風(fēng)險(xiǎn)厭惡系數(shù)為γ時(shí),條件期望效用最大化問(wèn)題為由此可見,對(duì)于均值方差效用函數(shù),Et(rp)]2,進(jìn)而u′(rp)=1-γ[rp-Et(rp)],u″(rp)=-γ,將u′(0)和u″(0)代入Mt表達(dá)式即得。,t+1,t+1,t+1,t+1,t+1+1(2)投資者有CRRA效用且風(fēng)險(xiǎn)厭惡系數(shù)為γ時(shí),條件期望效用最大化問(wèn)題為則將u′(0)和u″(0)代入Mt表達(dá)式即得。+1Hansen和Richard(1987)證明了真實(shí)的隨機(jī)貼現(xiàn)因子與均值方差前沿的等價(jià)性,即存在線性隨機(jī)貼現(xiàn)因子滿足Mt=a+bRMV,其中RMV為均值方差前沿上的組合收益率,而前文得到的隨機(jī)貼現(xiàn)因子有類似的線性形式Mt=α+βrp,所以最優(yōu)組合rp的夏普比率越高,rp離真實(shí)的均值方差前沿越近,基于式(3-19)估計(jì)的隨機(jī)貼現(xiàn)因子與真實(shí)的隨機(jī)貼現(xiàn)因子距離也越小,其定價(jià)能力也越強(qiáng),因此對(duì)投資組合收益的條件期望效用進(jìn)行優(yōu)化,等價(jià)于逼近真實(shí)的隨機(jī)貼現(xiàn)因子。+1+1,t+1,t+1,t+1用參數(shù)化投資組合方法求解投資者效用函數(shù)最大化的問(wèn)題與尋找隨機(jī)貼現(xiàn)因子是等價(jià)的,即推導(dǎo)式(3-17)所估計(jì)的SDFMt=u′(rb+θTrc)與多因子模型的關(guān)系。根據(jù)Hansen和Jagannathan(1991),可找到如下形式的隨機(jī)貼現(xiàn)因子:+1,t+1,t+1其中,rt為N×1維股票超額收益向量,bt為描述股票“風(fēng)險(xiǎn)價(jià)格”的N×1維系數(shù)向量,通常使用一系列特征將bt參數(shù)化(Kozak,Nagel,andSantosh,2020;Haddad,Kozak,andSantosh,2020),如+1其中Zt為N×K維特征變量矩陣,δt為刻畫了不同特征變量隨時(shí)間變化的重要程度的K×1維時(shí)間序列向量。將bt代入Mt得+1其中為基于K個(gè)特征所構(gòu)建的K個(gè)投資組合的收益率,即多因子模型中的“定價(jià)因子”。定理2:不失一般性\h[1],假設(shè)投資者有風(fēng)險(xiǎn)厭惡系數(shù)為γ的均值方差效用函數(shù),面臨優(yōu)化問(wèn)題給定t+1期的隨機(jī)貼現(xiàn)因子結(jié)構(gòu)為式(3-26)的形式E(ft)],則有+1其中Nt表示第t期截面上的股票數(shù),St為N×1維的市值權(quán)重向量。證明:對(duì)于均值方差效用函數(shù),前文已證Et(rp)]2,進(jìn)而,t+1其中代入式(3-29)得令如果給定多因子模型中的定價(jià)因子ft,則求解最優(yōu)組合配置問(wèn)題+1等價(jià)于求解δt,δt刻畫了定價(jià)因子在隨機(jī)貼現(xiàn)因子結(jié)構(gòu)中的重要性,因?yàn)榭赡茈S時(shí)間變化,所以也被稱作“因子擇時(shí)”(Haddad,Kozak,andSantosh,2020)。鑒于隨機(jī)貼現(xiàn)因子同均值方差有效前沿以及多因子模型的等價(jià)性,在金融學(xué)文獻(xiàn)中,隨機(jī)貼現(xiàn)因子通??梢员硎境删捣讲钋把亟M合或定價(jià)因子的線性結(jié)構(gòu),而定理1與定理2則分別針對(duì)這兩種情形給出了對(duì)應(yīng)的具體形式,實(shí)現(xiàn)了將均值方差有效前沿、隨機(jī)貼現(xiàn)因子、多因子模型有機(jī)統(tǒng)一。\h[1]對(duì)于其他效用函數(shù)形式,可以將式(3-19)標(biāo)準(zhǔn)化為Mt=1-[-u″(0)]/[1+u″(0)Et(rp)][rp-Et(rp)],將系數(shù)[-u″(0)]/[1+u″(0)Et(rp)]替換為γ,之后的證明過(guò)程相同。+1,t+1,t+1,t+1,t+13.4基于收縮估計(jì)方法的投資組合優(yōu)化基于正則化回歸的收縮估計(jì)法在其他更具一般性的效用函數(shù),例如CRRA效用函數(shù)等情形下直接適用,原因在于此類效用函數(shù)無(wú)法直接轉(zhuǎn)化為最小化某種二次型函數(shù)的形式。我們將在本章介紹全子集組合法,該方法可以適用于任意給定函數(shù)形式的效用,并給出其在CRRA效用函數(shù)情形下的應(yīng)用。參數(shù)化投資組合方法向投資組合優(yōu)化問(wèn)題引入了大量特征變量的信息,這導(dǎo)致了如何利用大量特征變量蘊(yùn)含的預(yù)期收益率信息進(jìn)行組合優(yōu)化,并且能確保提供準(zhǔn)確的估計(jì)等問(wèn)題。高維的解釋變量數(shù)據(jù)會(huì)導(dǎo)致“維度災(zāi)難”,估計(jì)大量參數(shù)會(huì)出現(xiàn)過(guò)擬合問(wèn)題,而通過(guò)收縮估計(jì)法進(jìn)行降維有助于這些問(wèn)題的解決,典型的收縮估計(jì)降維方法包括LASSO、自適應(yīng)LASSO、非參數(shù)組LASSO、彈性網(wǎng)絡(luò)、主成分分析等。本節(jié)首先介紹基于收縮估計(jì)的降維方法,為了使這些基于回歸的降維方法可以直接適用于參數(shù)化投資組合問(wèn)題,我們首先假設(shè)投資者具有均值方差效用函數(shù)由此可見,最大化該均值方差期望效用函數(shù)等價(jià)于最小化上式中的二次型部分,?進(jìn)而求解得出最優(yōu)參數(shù)θ(一)LASSO與自適應(yīng)LASSO?LASSO(Tibshirani,1996)回歸方法本質(zhì)上是線性模型的L1范數(shù)正則化方法,即在線性回歸外構(gòu)造懲罰函數(shù)將部分變量回歸系數(shù)壓縮為0,從而達(dá)到變量選擇的目的。然而,Zou(2006)發(fā)現(xiàn),傳統(tǒng)的LASSO方法僅在滿足一定條件時(shí)才具有統(tǒng)計(jì)一致性,即使在大樣本下也不能以概率1選出真實(shí)的模型,因此他改進(jìn)并提出了自適應(yīng)LASSO回歸法(adaptiveLASSO),即在約束函數(shù)中對(duì)每個(gè)變量添加適當(dāng)權(quán)重。LASSO與自適應(yīng)LASSO的最優(yōu)參數(shù)θ分別為其中,為θ的L1范數(shù)。估計(jì)自適應(yīng)LASSO估計(jì)量θAd-LASSO時(shí),第一步先由普通的LASSO估計(jì)得到估計(jì)量θs,第二步將自適應(yīng)LASSO回歸的權(quán)重設(shè)置為(二)非參數(shù)組LASSO考慮到投資組合權(quán)重與特征之間的非線性關(guān)系,可以使用非參數(shù)組LASSO方法求解最優(yōu)參數(shù)(Freyberger,Neuhierl,andWeber,2020;Chen,Wu,andZhu,2022)。使用“秩變換”方法,將第s個(gè)特征變量cs(s=1,…,K)的值轉(zhuǎn)換為截面上的分位數(shù),歸一化到區(qū)間(0,1)上,即變量,將的支撐劃分為L(zhǎng)個(gè)區(qū)間0=t0<t1<…<tL<tL=1,基于二次樣條pm(cs),m=1,…,L+2的樣條增廣特征變量組合-1rcsm,t+1為其中,p1(c)=1,p2(c)=c,p3(c)=c2,pm(c)=max(c-tm,0)2,m=4,5,…,L+2。用分別表示的(L+2)K維均值向量和(L+2)K×(L+2)K維協(xié)方差矩陣,Λnp表示與基準(zhǔn)收益rb的(L+2)K維協(xié)方差向量。相應(yīng)的投資組合參數(shù)θs可以通過(guò)如下的組LASSO方法估計(jì)得到-3,t+1,m(三)彈性網(wǎng)絡(luò)?嶺回歸與LASSO回歸類似,將LASSO回歸使用的L1懲罰項(xiàng)改為L(zhǎng)2懲罰項(xiàng)即為嶺回歸。雖然嶺回歸使用的L2懲罰項(xiàng)不能篩選變量,但是它可以令大部分回歸系數(shù)向0收縮,使得預(yù)測(cè)結(jié)果不會(huì)因?yàn)閿?shù)據(jù)的細(xì)微變化而變動(dòng)太大,一定程度上減少了過(guò)擬合的風(fēng)險(xiǎn)。由于LASSO回歸與嶺回歸各有優(yōu)勢(shì),Zou和Hastie(2005)提出了彈性網(wǎng)絡(luò)(elasticnet)回歸,加入加權(quán)組合的L1與L2懲罰項(xiàng),既能一定程度地實(shí)現(xiàn)預(yù)測(cè)變量的稀疏化,又能盡量壓縮剩余變量的系數(shù),以保持模型解釋能力的穩(wěn)定性。彈性網(wǎng)絡(luò)的最優(yōu)參數(shù)θ為(四)主成分分析主成分分析是一種信息聚合方法,從大量特征變量中提取出兩兩正交的主成分,將能夠盡可能多地解釋原始數(shù)據(jù)方差的前幾個(gè)主成分加入模型,最大程度地保留原始數(shù)據(jù)攜帶的信息的同時(shí)對(duì)原始數(shù)據(jù)進(jìn)行降維。記K維特征變量投資組合收益向量,其中,對(duì)rc的協(xié)方差矩陣進(jìn)行特征分解Σ=QDQT,其中Q=(q1,…,qK)為特征變量排列成的正交矩陣,對(duì)rc進(jìn)行線性變換得到主成分rpc=QTrc,均值E[rpc]=QTμc,協(xié)方差矩陣Var[rpc]=QTΣQ=D,主成分rpc與基準(zhǔn)投資組合rb的協(xié)方差向量為cov(rpc,rb)=QTΛ。這樣我們可以使用主成分來(lái)替換原有的特征變量,并直接通過(guò)OLS回歸求解最優(yōu)參數(shù)化投資組合,這類使用主成分作為解釋變量的回歸方法也被稱為主成分回歸法。,t+1,t+1,t+1,t+1,t+1,t+1,t+1,t+1,t+1,t+1不妨假設(shè)前k個(gè)主成分已經(jīng)提取了足夠的信息,僅使用前k個(gè)主成分Qk=(q1,…,qk)構(gòu)造權(quán)重函數(shù),替代原有的特征變量求解最優(yōu)參數(shù)化投資組合,進(jìn)而得出最優(yōu)參數(shù)θPCLettau和Pelger(2020a,2020b)指出,主成分分析只能提取收益率中被共同因子解釋的部分,而忽略了風(fēng)險(xiǎn)溢價(jià)本身所隱含的因子結(jié)構(gòu)層面的信息,即在潛在定價(jià)錯(cuò)誤上的風(fēng)險(xiǎn)暴露。因此他們提出了RP-PCA估計(jì)量,以同時(shí)捕捉共同解釋部分與定價(jià)錯(cuò)誤,其本質(zhì)是在對(duì)協(xié)方差矩陣提取主成分時(shí)加入包含收益率一階矩信息的懲罰項(xiàng),即考慮風(fēng)險(xiǎn)溢價(jià)的影響。記,其中為rc在時(shí)間序列上的均值,δ為平衡殘差與錯(cuò)誤定價(jià)相對(duì)重要性的超參數(shù)。通過(guò)特征值分解ΣRP=QRPTDRPQRP,將基于ΣRP主成分所得到的最優(yōu)參數(shù)θ記為θRP-PCA。,t+13.5神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)是一種能夠靈活描述非線性函數(shù)關(guān)系的復(fù)雜模型。假設(shè)最優(yōu)權(quán)重滿足wi=f(xi,θ),這里是f(·)關(guān)于θ的未知函數(shù)。定義損失函數(shù)為,t,t對(duì)每一只股票,輸入公司特征變量的集合,神經(jīng)網(wǎng)絡(luò)通過(guò)多層隱藏層輸出最優(yōu)權(quán)重,這樣我們就獲得了所有股票的權(quán)重?;谝陨虾瘮?shù),優(yōu)化算法,如小批量梯度下降法,可以用來(lái)調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)中的參數(shù)。重復(fù)以上步驟并迭代,直到損失函數(shù)不再下降。參考Gu,Kelly和Xiu(2020),我們采用了正則化、提前中止迭代和暫退法等方法以避免過(guò)擬合。我們通過(guò)幾何金字塔原則選擇層結(jié)構(gòu),并選擇線性整流函數(shù)(ReLU)作為激活函數(shù)。為了提高優(yōu)化速度,我們以年劃分訓(xùn)練窗口,并在每次迭代中使用12個(gè)月的數(shù)據(jù)計(jì)算損失函數(shù)。通過(guò)最大化每一年的效用,我們可以最大化整個(gè)訓(xùn)練期間的效用。3.6基于全子集回歸的組合優(yōu)化全子集組合法(CSC)也可以被視作一種收縮估計(jì)方法。全子集組合法先聚合所有特征變量所蘊(yùn)含的預(yù)測(cè)信息,再進(jìn)行一定比例的壓縮,也可以用于緩解特征變量高維導(dǎo)致的過(guò)擬合等問(wèn)題。仍然考慮均值方差效用函數(shù)下的參數(shù)化投資組合優(yōu)化問(wèn)題此時(shí)最優(yōu)參數(shù),??該表達(dá)式也可以寫為θ=,即被視為K維的特征投資組合預(yù)期收益向量μc/r(經(jīng)特征變量組合與基準(zhǔn)組合的協(xié)方差向量Λ調(diào)整后)回歸于特征投資組合收益協(xié)方差矩陣Σ所得到的回歸系數(shù)。可見上述最大化期望效用問(wèn)題等價(jià)于線性回歸問(wèn)題。K很大時(shí)Σ可能是奇異矩陣,進(jìn)而會(huì)導(dǎo)致對(duì)θ估計(jì)的精準(zhǔn)度下降以及出現(xiàn)極端值,使最優(yōu)投資組合在樣本外表現(xiàn)不穩(wěn)定。Elliott,Gargano和Timmermann(2013)基于Timmermann(2006)的組合預(yù)測(cè)方法提出了全子集回歸法,每次回歸選擇k<K個(gè)特征構(gòu)成的“變量子集”作為解釋變量進(jìn)行回歸,遍歷所有子集組合后對(duì)所有回歸的系數(shù)取均值作為最終的結(jié)果。設(shè)y,X分別是T維向量和T×K維矩陣,Si為K×K維選擇矩陣,其中i列與單位陣相同,其余K-i列為0向量,估計(jì)回歸y=Xβ+ε,傳統(tǒng)OLS回歸估計(jì)量為,而全子集回歸方法的估計(jì)量為其中,為組合數(shù),表示從K個(gè)元素中選擇k個(gè)元素的組合方式數(shù)量。下面將CSC方法應(yīng)用于參數(shù)化投資組合最優(yōu)化問(wèn)題,假設(shè)投資者每次使用k(k<K)個(gè)特征對(duì)投資組合權(quán)重進(jìn)行建模,則
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 道路景觀設(shè)施承諾書
- 煙草產(chǎn)品收款流程
- 印刷廠門窗施工合同協(xié)議書
- 健身房墻面裝修合同協(xié)議
- 可持續(xù)發(fā)展成品油市場(chǎng)管理辦法
- 基坑降水施工合同:文物保護(hù)工程
- 廣告公司合同管理方案
- 建筑公司工程車輛司機(jī)聘用合同
- 通信設(shè)備維護(hù)服務(wù)合同
- 流行病的特征
- 二年級(jí)《看圖寫話》教學(xué)設(shè)計(jì)
- 中國(guó)的算籌PPT課件
- 《骨盆重要性》PPT課件.ppt
- WHO癌痛的三階梯止痛的原則
- 尼古拉的三個(gè)問(wèn)題(課堂PPT)
- 山西經(jīng)濟(jì)出版社小學(xué)第二冊(cè)四年級(jí)信息技術(shù)第一單元活動(dòng)教案
- 高等電力系統(tǒng)分析
- 深圳牛津版英語(yǔ)最新八年級(jí)(上) 課文 (帶翻譯)
- 城市污水處理廠污泥綜合處置利用制磚項(xiàng)目可行性研究報(bào)告
- 16食品科學(xué)與工程2班 吳志宏 年產(chǎn)3000噸茶油工廠設(shè)計(jì) 定稿
- 近年國(guó)內(nèi)電梯事故案例介紹
評(píng)論
0/150
提交評(píng)論