資產(chǎn)定價(jià)與機(jī)器學(xué)習(xí)

上傳人：M*** IP屬地：廣東上傳時(shí)間：2024-09-25 格式：DOCX 頁(yè)數(shù)：158 大?。?8.26MB 積分：7.2 舉報(bào) 版權(quán)申訴

資產(chǎn)定價(jià)與機(jī)器學(xué)習(xí)_第2頁(yè)

資產(chǎn)定價(jià)與機(jī)器學(xué)習(xí)_第3頁(yè)

資產(chǎn)定價(jià)與機(jī)器學(xué)習(xí)_第4頁(yè)

資產(chǎn)定價(jià)與機(jī)器學(xué)習(xí)_第5頁(yè)

已閱讀5頁(yè)，還剩153頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

資產(chǎn)定價(jià)與機(jī)器學(xué)習(xí)目錄TOC\h\h第一章導(dǎo)論\h1.1資產(chǎn)定價(jià)的研究背景\h1.2本書的結(jié)構(gòu)\h1.3本書的特點(diǎn)和局限性\h第二章資產(chǎn)定價(jià)中的機(jī)器學(xué)習(xí)方法\h2.1機(jī)器學(xué)習(xí)的定義和主要類別\h2.2機(jī)器學(xué)習(xí)方法介紹\h第三章投資組合優(yōu)化\h3.1馬科維茨投資組合\h3.2參數(shù)化投資組合優(yōu)化\h3.3最優(yōu)投資組合與隨機(jī)貼現(xiàn)因子等價(jià)性\h3.4基于收縮估計(jì)方法的投資組合優(yōu)化\h3.5神經(jīng)網(wǎng)絡(luò)\h3.6基于全子集回歸的組合優(yōu)化\h3.7實(shí)證分析\h3.8小結(jié)\h第三章附錄\h第四章隨機(jī)貼現(xiàn)因子模型中的定價(jià)因子識(shí)別\h4.1隨機(jī)貼現(xiàn)因子\h4.2雙重選擇LASSO算法識(shí)別因子\h4.3自糾偏機(jī)器學(xué)習(xí)法識(shí)別因子\h4.4小結(jié)\h第四章附錄\h第五章資產(chǎn)收益率樣本外預(yù)測(cè)\h5.1樣本外預(yù)測(cè)方法\h5.2數(shù)據(jù)和單變量投資組合構(gòu)造\h5.3實(shí)證結(jié)果\h5.4信息匯總方法和穩(wěn)健性檢驗(yàn)\h5.5小結(jié)\h第五章附錄第一章導(dǎo)論1.1資產(chǎn)定價(jià)的研究背景Markowitz（1952）提出了經(jīng)典的均值方差投資組合優(yōu)化理論，系統(tǒng)地分析了如何利用資產(chǎn)收益率的統(tǒng)計(jì)特征，即均值和方差，來(lái)優(yōu)化投資組合配置，為現(xiàn)代金融學(xué)的研究奠定了基礎(chǔ)?；诰捣讲罾碚摌?gòu)建的投資組合有效邊界，Sharpe（1964）和Lintner（1965）在考慮無(wú)風(fēng)險(xiǎn)資產(chǎn)和市場(chǎng)均衡概念后，提出了資本資產(chǎn)定價(jià)模型（capitalassetpricingmodel，CAPM），為資產(chǎn)預(yù)期收益率與其系統(tǒng)性風(fēng)險(xiǎn)敞口（beta）確立了經(jīng)典的線性因子模型關(guān)系。Fama（1970）提出了有效市場(chǎng)假說(shuō)，盡管雙重檢驗(yàn)問(wèn)題使得有效市場(chǎng)假說(shuō)難以被精確檢驗(yàn)，但它作為評(píng)價(jià)金融市場(chǎng)定價(jià)效率的重要參照系，為進(jìn)一步研究資產(chǎn)收益率的預(yù)測(cè)變量和構(gòu)建因子定價(jià)模型提供了理論基礎(chǔ)。如果金融市場(chǎng)是信息有效的，那么資產(chǎn)的收益率應(yīng)該是不可預(yù)測(cè)的。如果發(fā)現(xiàn)了可以預(yù)測(cè)股票收益率的變量，這就意味著該變量衡量了資產(chǎn)對(duì)某種系統(tǒng)性風(fēng)險(xiǎn)的敞口。在調(diào)整資產(chǎn)的系統(tǒng)性風(fēng)險(xiǎn)溢價(jià)后，不應(yīng)存在額外的異常收益率。那些經(jīng)因子模型調(diào)整后仍顯著的預(yù)測(cè)變量被稱為市場(chǎng)異象。在有效市場(chǎng)假說(shuō)被提出之后，資本資產(chǎn)定價(jià)模型自然成了最早被廣泛檢驗(yàn)的因子定價(jià)模型。隨著市值效應(yīng)、價(jià)值效應(yīng)等不能被CAPM解釋的市場(chǎng)異象在20世紀(jì)80年代陸續(xù)被發(fā)現(xiàn)，F(xiàn)ama和French（1993）在CAPM的基礎(chǔ)上加入了市值因子和價(jià)值因子，提出了著名的Fama-French三因子模型。在那個(gè)時(shí)代，三因子模型可以解釋除了動(dòng)量效應(yīng)以外幾乎全部已知的市場(chǎng)異象。隨后資產(chǎn)定價(jià)研究領(lǐng)域也開啟了發(fā)掘檢驗(yàn)可預(yù)測(cè)資產(chǎn)收益率的新變量與開發(fā)升級(jí)新因子定價(jià)模型的“競(jìng)賽”。隨著信息收集分析技術(shù)手段的進(jìn)步，越來(lái)越多基于公司財(cái)務(wù)報(bào)表、經(jīng)營(yíng)公告的基本面數(shù)據(jù)，高頻的股票歷史交易數(shù)據(jù)以及基于機(jī)器學(xué)習(xí)深度文本分析挖掘產(chǎn)生的公司層面、投資者層面和宏觀經(jīng)濟(jì)層面的變量被發(fā)現(xiàn)可以有效預(yù)測(cè)風(fēng)險(xiǎn)資產(chǎn)的預(yù)期收益率。僅考慮公司層面，迄今的資產(chǎn)定價(jià)文獻(xiàn)已提出了數(shù)以百計(jì)的具有顯著預(yù)測(cè)能力的公司特征變量。Harvey，Liu和Zhu（2016）統(tǒng)計(jì)了1967—2012年發(fā)表在國(guó)際頂尖金融期刊的論文中涉及的預(yù)測(cè)指標(biāo)，發(fā)現(xiàn)有316個(gè)指標(biāo)被實(shí)證檢驗(yàn)具有重要影響，并且指標(biāo)數(shù)量以接近平均每年18個(gè)的速度增長(zhǎng)。Mclean和Pontiff（2016）在研究了金融、經(jīng)濟(jì)以及會(huì)計(jì)學(xué)頂尖期刊論文中涉及的97個(gè)橫截面股票收益率預(yù)測(cè)指標(biāo)后，發(fā)現(xiàn)部分指標(biāo)的預(yù)測(cè)效果來(lái)自數(shù)據(jù)挖掘，平均而言，這些指標(biāo)的多空組合收益在樣本外下降了26%，在文章發(fā)表后下降了58%。Hou，Xue和Zhang（2020）檢驗(yàn)了文獻(xiàn)中452個(gè)市場(chǎng)異象后，發(fā)現(xiàn)即使剔除流動(dòng)性較差的小市值股票，仍然有161個(gè)變量是統(tǒng)計(jì)顯著的。相應(yīng)的因子定價(jià)模型也在發(fā)展演進(jìn)，F(xiàn)ama和French（2018）在Fama-French三因子模型的基礎(chǔ)上加入了盈利因子、投資因子和動(dòng)量因子，提出了Fama-French六因子模型。Hou等（2019）則提出了包含市場(chǎng)因子、市值因子、投資因子、盈利因子和預(yù)期投資增長(zhǎng)因子的Q5因子模型。盡管這兩個(gè)最新提出的多因子模型在眾多因子模型中對(duì)市場(chǎng)異象的解釋能力最強(qiáng)，但依然存在較多的市場(chǎng)異象無(wú)法被解釋。時(shí)任美國(guó)金融學(xué)會(huì)主席的約翰·科克倫（JohnCochrane）教授在2011年的學(xué)會(huì)主旨演講中將數(shù)量眾多的收益率預(yù)測(cè)指標(biāo)稱為“因子動(dòng)物園”，并提出問(wèn)題：“究竟哪些變量能獨(dú)立解釋股票預(yù)期收益率差異？而哪些變量的解釋能力會(huì)被其他變量所涵蓋？”因此，發(fā)現(xiàn)真正具有解釋力的變量并確定能夠解釋其他變量的定價(jià)因子是目前資產(chǎn)定價(jià)領(lǐng)域核心的研究問(wèn)題。據(jù)作者對(duì)金融文獻(xiàn)的了解，目前只有DeMiguel等（2020）基于投資者最大化均值方差效用函數(shù)，在資產(chǎn)配置權(quán)重是K維公司特征變量的線性模型假設(shè)下，使用LASSO（leastabsoluteshrinkageandselectionoperator）算法來(lái)挑選最有效的特征變量，從而推斷隨機(jī)貼現(xiàn)因子中到底哪些因子對(duì)于定價(jià)最重要。過(guò)去十多年中，很多研究從探究資產(chǎn)橫截面收益率的可預(yù)測(cè)性出發(fā)，提出并驗(yàn)證新因子模型。金融數(shù)據(jù)具有低信號(hào)噪音比的特性，同時(shí)因子定價(jià)模型中有效因子結(jié)構(gòu)及其函數(shù)關(guān)系不確定，隨著包含眾多變量的“因子動(dòng)物園”被發(fā)現(xiàn)，大數(shù)據(jù)分析和機(jī)器學(xué)習(xí)方法也被廣泛引入資產(chǎn)定價(jià)的研究。迄今為止，較多研究從篩選有效變量來(lái)預(yù)測(cè)資產(chǎn)橫截面和時(shí)間序列收益率、定價(jià)因子的風(fēng)險(xiǎn)溢價(jià)檢驗(yàn)和估計(jì)隨機(jī)貼現(xiàn)因子（stochasticdiscountfactor，SDF）模型的因子載荷（factorloadings）的角度，使用機(jī)器學(xué)習(xí)方法來(lái)解決“因子動(dòng)物園”問(wèn)題。然而從投資者最大化期望效用函數(shù)的角度，構(gòu)造最優(yōu)投資組合來(lái)確定隨機(jī)貼現(xiàn)因子則較少被關(guān)注，尤其是在面對(duì)高維度的解釋變量時(shí)，應(yīng)用機(jī)器學(xué)習(xí)方法的相關(guān)研究則更有限。下面我們以投資組合優(yōu)化為例，簡(jiǎn)要介紹為什么包含高維解釋變量的“因子動(dòng)物園”會(huì)導(dǎo)致基于線性回歸的傳統(tǒng)計(jì)量分析方法面臨“維度災(zāi)難”問(wèn)題。Markowitz（1952）均值方差投資組合優(yōu)化理論根據(jù)資產(chǎn)收益率的均值和方差來(lái)估計(jì)最優(yōu)資產(chǎn)配置權(quán)重，因此在有N個(gè)資產(chǎn)的情形下，該模型需要估計(jì)N個(gè)均值和含有（N2＋N）／2個(gè)參數(shù)的協(xié)方差矩陣。其估計(jì)參數(shù)的維度隨資產(chǎn)數(shù)量N的增加以冪函數(shù)的速度增加，因此在面對(duì)大量資產(chǎn)和有限樣本時(shí)，參數(shù)估計(jì)變得十分困難。以往的研究往往采用貝葉斯估計(jì)方法解決這一問(wèn)題，通過(guò)引入先驗(yàn)信息幫助提高參數(shù)估計(jì)精度，或者使用因子模型來(lái)降低估計(jì)參數(shù)的維度。但引入先驗(yàn)信息通常會(huì)包含主觀判斷，導(dǎo)致統(tǒng)計(jì)推斷有一定的主觀性，而通過(guò)因子模型降維則需要引入模型假設(shè)，增加了模型誤置的風(fēng)險(xiǎn)。Brandt，Santa-Clara和Valkanov（2009）通過(guò)直接對(duì)資產(chǎn)權(quán)重建模的方式來(lái)實(shí)現(xiàn)參數(shù)降維。之前的資產(chǎn)定價(jià)研究發(fā)現(xiàn)了大量對(duì)股票橫截面收益率有解釋力的特征變量，因此他們將股票權(quán)重建模成有K個(gè)特征變量的線性函數(shù)，再通過(guò)最大化投資者的期望效用函數(shù)來(lái)估計(jì)這K個(gè)參數(shù)。該方法被稱作參數(shù)化投資組合方法，其待估參數(shù)的數(shù)量級(jí)從N維降至K維。在面對(duì)數(shù)以千計(jì)的股票資產(chǎn)（在中國(guó)A股市場(chǎng)，N＞3000），而特征變量數(shù)K相對(duì)較小時(shí)，這一方法大大降低了投資組合參數(shù)的估計(jì)難度并提升了估計(jì)精度。然而，隨著研究發(fā)現(xiàn)的解釋變量越來(lái)越多，形成“因子動(dòng)物園”時(shí)需要加入權(quán)重模型的特征變量數(shù)K越來(lái)越大，參數(shù)化投資組合方法的估計(jì)也會(huì)面臨“維度災(zāi)難”，導(dǎo)致傳統(tǒng)回歸方法的參數(shù)估計(jì)精度下降。為解決這個(gè)問(wèn)題，DeMiguel等（2020）在股票權(quán)重的K維線性模型下使用LASSO算法挑選最有效的特征變量來(lái)實(shí)現(xiàn)降維。盡管DeMiguel等（2020）使用LASSO方法使得參數(shù)化投資組合在“因子動(dòng)物園”背景下得到較準(zhǔn)確的估計(jì)，但該研究領(lǐng)域仍存在三方面問(wèn)題。首先，Brandt，Santa-Clara和Valkanov（2009）及DeMiguel等（2020）只考慮了權(quán)重的線性模型，忽略了最優(yōu)權(quán)重和特征變量之間極可能存在的非線性預(yù)測(cè)關(guān)系。A?t-Sahalia和Brandt（2001）指出，即使假定收益率和特征變量服從線性預(yù)測(cè)關(guān)系，最優(yōu)投資組合權(quán)重和預(yù)測(cè)變量之間也可能存在高度非線性關(guān)系，其原因在于求解的最優(yōu)組合權(quán)重中包含協(xié)方差矩陣的逆。而Freyberger，Neuhierl和Weber（2020）運(yùn)用非參數(shù)自適應(yīng)組LASSO（adaptivegroupLASSO）算法研究公司特征變量與股票期望收益率間的非線性預(yù)測(cè)關(guān)系。他們的實(shí)證發(fā)現(xiàn)使用非線性預(yù)測(cè)模型構(gòu)造的投資組合的樣本外夏普比率比使用線性LASSO模型得到的結(jié)果高近3倍，從而證明特征變量和收益率間存在顯著的非線性預(yù)測(cè)關(guān)系。其次，參數(shù)化投資組合方法能適用LASSO模型的前提假設(shè)是投資者具有均值方差效用函數(shù)，這樣才能把最大化效用問(wèn)題轉(zhuǎn)化成一個(gè)具有約束條件的線性回歸問(wèn)題，符合LASSO的模型形式。然而在實(shí)際中，投資者偏好不太可能符合均值方差效用函數(shù)的描述，因?yàn)槿魏味A矩以上的高階矩在這一效用中均被忽略了。事實(shí)上，已有大量研究表明投資者很注重三階矩偏度和四階矩峰度［Harvey和Siddique（2000）及Dittmar（2002）等］。因此投資組合優(yōu)化文獻(xiàn)中通常會(huì)假設(shè)常數(shù)相對(duì)風(fēng)險(xiǎn)厭惡（CRRA）效用函數(shù)，然而在CRRA效用下，DeMiguel等（2020）使用的LASSO降維方法則無(wú)法直接應(yīng)用。最后，雖然在均值方差效用函數(shù)下可以選出最有效的特征變量，但并不能準(zhǔn)確估計(jì)其在隨機(jī)貼現(xiàn)因子中的載荷。Feng，Giglio和Xiu（2020）指出使用線性回歸法或LASSO方法直接估計(jì)隨機(jī)貼現(xiàn)因子中的因子載荷會(huì)產(chǎn)生遺漏變量帶來(lái)的估計(jì)偏差，進(jìn)而提出雙重選擇LASSO算法，通過(guò)第一步LASSO選出最能解釋收益率的因子，再施加第二步LASSO篩選出遺漏變量，來(lái)消除估計(jì)誤差。1.2本書的結(jié)構(gòu)針對(duì)前文提到的高維“因子動(dòng)物園”背景下資產(chǎn)定價(jià)研究領(lǐng)域所面臨的問(wèn)題，本書從投資者最大化期望效用函數(shù)推導(dǎo)隨機(jī)貼現(xiàn)因子定價(jià)因子、準(zhǔn)確估計(jì)隨機(jī)貼現(xiàn)因子中定價(jià)因子的風(fēng)險(xiǎn)載荷，以及預(yù)測(cè)橫截面資產(chǎn)收益率這三個(gè)資產(chǎn)定價(jià)核心問(wèn)題入手。我們分析并介紹了基于線性回歸的傳統(tǒng)計(jì)量分析方法所面臨的“維度災(zāi)難”問(wèn)題，并進(jìn)一步探討了常用的機(jī)器學(xué)習(xí)方法的適用性和優(yōu)勢(shì)。本書還以中國(guó)A股市場(chǎng)為主要應(yīng)用場(chǎng)景，給出了詳細(xì)的分析。第二章簡(jiǎn)要概述了機(jī)器學(xué)習(xí)的概念和發(fā)展。首先對(duì)比了資產(chǎn)定價(jià)問(wèn)題和傳統(tǒng)機(jī)器學(xué)習(xí)問(wèn)題在應(yīng)用場(chǎng)景上的諸多差異，并介紹了兩大類機(jī)器學(xué)習(xí)方法，即監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)的區(qū)別。其次，將監(jiān)督學(xué)習(xí)方法按照線性和非線性方法分類并分別進(jìn)行介紹，然后介紹了主成分分析和聚類分析等無(wú)監(jiān)督學(xué)習(xí)方法。最后，討論了機(jī)器學(xué)習(xí)方法中關(guān)于超參數(shù)調(diào)節(jié)的相關(guān)問(wèn)題。第三章主要介紹了機(jī)器學(xué)習(xí)方法在投資組合優(yōu)化問(wèn)題中的應(yīng)用。我們?cè)敿?xì)回顧了從Markowitz（1952）的均值方差投資組合優(yōu)化理論在配置大量資產(chǎn)時(shí)面臨的參數(shù)估計(jì)問(wèn)題，到Brandt，Santa-Clara和Valkanov（2009）提出的參數(shù)化投資組合方法。該方法將待估計(jì)的資產(chǎn)權(quán)重建模為K個(gè)特征變量的線性函數(shù)，然后利用投資者的期望效用函數(shù)最大化來(lái)估計(jì)這K個(gè)參數(shù)，從而實(shí)現(xiàn)待估參數(shù)維度的降低。此外，我們從最大化投資者期望效用的角度出發(fā)，推導(dǎo)了隨機(jī)貼現(xiàn)因子的表達(dá)式，并證明了文獻(xiàn)中利用若干個(gè)定價(jià)因子表示隨機(jī)貼現(xiàn)因子的做法本質(zhì)上與求解最大化期望效用問(wèn)題等價(jià)。這意味著在利用參數(shù)化投資組合方法進(jìn)行組合優(yōu)化時(shí)，我們同時(shí)基于所使用的特征變量信息構(gòu)建隨機(jī)貼現(xiàn)因子，從而將均值方差有效前沿、隨機(jī)貼現(xiàn)因子和因子定價(jià)模型統(tǒng)一起來(lái)。針對(duì)上一節(jié)提到的DeMiguel等（2020）使用線性LASSO方法求解參數(shù)化組合模型存在的問(wèn)題，我們首先參考Freyberger，Neuhierl和Weber（2020），運(yùn)用自適應(yīng)組LASSO把非線性模型引入?yún)?shù)化投資組合方法，檢驗(yàn)非線性的特征變量是否能顯著提升投資組合的樣本外收益。其次，為了在求解最優(yōu)化投資組合權(quán)重時(shí)能使用更廣義的期望效用函數(shù)，而不僅局限于均值方差效用，借鑒模型平均（modelavera-ging）的估計(jì)思想，我們提出全子集組合法（completesubsetcombina-tion，CSC）。該方法在數(shù)量眾多的K個(gè)特征變量中，每次估計(jì)只引入少量的k（k＜K）個(gè)變量來(lái)估計(jì)參數(shù)，再遍歷K?。郏↘－k）！k?。莘N可能組合，把每次估計(jì)的參數(shù)值加總求均值作為參數(shù)估計(jì)值。通過(guò)全子集組合法，每次需估計(jì)的參數(shù)維度都是較小的k，因而單次估計(jì)不需使用降維方法，不再受限于均值方差效用，可以適用于更廣義的具有顯性表達(dá)式的效用函數(shù)，如CRRA效用函數(shù)。每次求解效用最大化時(shí)只需令一階條件為零，采用廣義矩方法（GMM）來(lái)估計(jì)參數(shù)，再遍歷所有可能組合求出參數(shù)均值即可。最后，應(yīng)用我國(guó)A股市場(chǎng)數(shù)據(jù)對(duì)常用的機(jī)器學(xué)習(xí)方法和全子集組合法的實(shí)證表現(xiàn)進(jìn)行詳細(xì)的實(shí)證分析對(duì)比，并把最優(yōu)權(quán)重構(gòu)造出的投資組合作為潛在定價(jià)因子，疊加主流因子模型后，用于解釋現(xiàn)存顯著的市場(chǎng)異象并獲得了最好的定價(jià)解釋力。第四章介紹了在高維“因子動(dòng)物園”的背景下，如何使用機(jī)器學(xué)習(xí)方法準(zhǔn)確估計(jì)隨機(jī)貼現(xiàn)因子的因子載荷。在資產(chǎn)定價(jià)中，估計(jì)隨機(jī)貼現(xiàn)因子是對(duì)資產(chǎn)進(jìn)行準(zhǔn)確定價(jià)的關(guān)鍵。本章從隨機(jī)貼現(xiàn)因子的理論框架出發(fā)，介紹了隨機(jī)貼現(xiàn)因子的定價(jià)理論。接著，我們介紹了雙重選擇LASSO算法在假設(shè)線性隨機(jī)貼現(xiàn)因子模型下，如何通過(guò)糾正遺漏變量誤差來(lái)識(shí)別有效定價(jià)因子，并給出了該方法在中國(guó)A股市場(chǎng)的應(yīng)用研究結(jié)果。進(jìn)一步，我們考慮如果隨機(jī)貼現(xiàn)因子模型存在非線性因子結(jié)構(gòu)，那么雙重選擇LASSO算法將不再適用。因此，我們引入Chernozhukov，Newey和Singh（2022）提出的一種自糾偏機(jī)器學(xué)習(xí)方法（automaticdebiasedmachinelearning，ADML）。通過(guò)在識(shí)別矩條件中加入影響函數(shù)（influencefunction），將偏差調(diào)整為兩個(gè)估計(jì)量偏差的乘積，從而確保估計(jì)量的一致性。最后，我們介紹了如何使用ADML算法來(lái)識(shí)別隨機(jī)貼現(xiàn)因子中真正具有定價(jià)能力的有效因子，并給出了中國(guó)A股市場(chǎng)的實(shí)證研究結(jié)果。第五章介紹如何使用機(jī)器學(xué)習(xí)方法進(jìn)行樣本外橫截面收益率預(yù)測(cè)。剖析股票收益的橫截面數(shù)據(jù)是資產(chǎn)定價(jià)研究的核心主題之一。我們首先介紹線性模型和自適應(yīng)組LASSO等非線性模型進(jìn)行樣本外收益率預(yù)測(cè)的方法。使用中國(guó)A股市場(chǎng)數(shù)據(jù)，我們把自適應(yīng)組LASSO與其他線性機(jī)器學(xué)習(xí)模型的變量篩選結(jié)果進(jìn)行對(duì)比，識(shí)別出了中國(guó)股票市場(chǎng)100個(gè)股票特征變量中具有顯著預(yù)測(cè)能力的因子。其次，我們比較了非線性預(yù)測(cè)模型與線性預(yù)測(cè)模型篩選出的預(yù)測(cè)變量，發(fā)現(xiàn)和非線性模型相比，線性模型在全樣本中選出了更多的變量，但使用線性模型收益率預(yù)測(cè)構(gòu)造的多空投資組合的夏普比率和異常收益率alpha均低于非線性模型。使用線性模型選出的特征變量，但用非線性模型進(jìn)行預(yù)測(cè)時(shí)，我們發(fā)現(xiàn)多空組合的年化夏普比率比使用同樣變量的線性模型預(yù)測(cè)時(shí)提高了0.5以上，說(shuō)明使用同樣變量時(shí)，非線性預(yù)測(cè)結(jié)構(gòu)顯著提升了樣本外預(yù)測(cè)的準(zhǔn)確性。另外，使用非線性模型選出的特征變量，用線性模型進(jìn)行預(yù)測(cè)時(shí)，其多空投資組合的夏普比率也高于使用線性模型選出的變量進(jìn)行線性預(yù)測(cè)的組合。這表明非線性模型在特征變量篩選上比線性模型能更有效地發(fā)現(xiàn)最重要的收益預(yù)測(cè)變量。最后，我們通過(guò)線性或二次樣條非線性回歸來(lái)使用單個(gè)特征預(yù)測(cè)收益，然后使用預(yù)測(cè)組合方法、主成分回歸和偏最小二乘法等對(duì)使用單個(gè)特征預(yù)測(cè)得到的收益進(jìn)行聚合，結(jié)果非線性收益預(yù)測(cè)仍然具有更好的效果。這些實(shí)證發(fā)現(xiàn)強(qiáng)調(diào)了非線性結(jié)構(gòu)在特征變量篩選和收益預(yù)測(cè)中的重要性。1.3本書的特點(diǎn)和局限性目前已有的關(guān)于機(jī)器學(xué)習(xí)和資產(chǎn)定價(jià)方面的著作主要有兩本。Nagel（2021）側(cè)重于通過(guò)貝葉斯統(tǒng)計(jì)學(xué)框架來(lái)增強(qiáng)機(jī)器學(xué)習(xí)方法在資產(chǎn)定價(jià)應(yīng)用中的可解釋性，具體是對(duì)定價(jià)因子的主成分投資組合的夏普比率加以貝葉斯先驗(yàn)約束，進(jìn)而檢驗(yàn)隨機(jī)貼現(xiàn)因子模型是否滿足稀疏性假設(shè)。通過(guò)近似無(wú)套利條件來(lái)約束夏普比率不能過(guò)大，為L(zhǎng)ASSO和彈性網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)方法的應(yīng)用給出了清晰的經(jīng)濟(jì)學(xué)解釋。吳輝航、魏行空和張曉燕（2022）則比較類似Gu，Kelly和Xiu（2020），重點(diǎn)研究機(jī)器學(xué)習(xí)方法對(duì)橫截面股票收益率的樣本外預(yù)測(cè)，并給出了中國(guó)市場(chǎng)的實(shí)證分析結(jié)果。本書側(cè)重于從投資者最大化期望效用函數(shù)入手，在求解最優(yōu)參數(shù)化投資組合中引入機(jī)器學(xué)習(xí)方法，實(shí)現(xiàn)對(duì)待估參數(shù)的降維和精確估計(jì)。同時(shí)還提出全子集組合法，其參數(shù)估計(jì)更加簡(jiǎn)單，適用性更強(qiáng)，可用于CRRA等更具一般性的效用函數(shù)。因此，基于機(jī)器學(xué)習(xí)和全子集組合法來(lái)優(yōu)化參數(shù)化投資組合更具實(shí)用性?？紤]交易成本影響的實(shí)證應(yīng)用可以參考Maasoumi等（2022）。在業(yè)界應(yīng)用方面，智能投顧是一種基于機(jī)器學(xué)習(xí)、智能算法、云計(jì)算等新科技手段服務(wù)于個(gè)人投資者的智能財(cái)富管理服務(wù)，其本質(zhì)是依據(jù)投資者的風(fēng)險(xiǎn)偏好與財(cái)務(wù)狀況，利用大數(shù)據(jù)結(jié)合前沿的資產(chǎn)組合優(yōu)化理論來(lái)提供最佳風(fēng)險(xiǎn)收益比的個(gè)性化投資策略。2019年10月，中國(guó)證監(jiān)會(huì)發(fā)布《關(guān)于做好公開募集證券投資基金投資顧問(wèn)業(yè)務(wù)試點(diǎn)工作的通知》，標(biāo)志著基金投資顧問(wèn)業(yè)務(wù)試點(diǎn)正式推出。面對(duì)中國(guó)龐大的人口基數(shù)與不斷增長(zhǎng)的資產(chǎn)管理需求，基金智能投顧業(yè)務(wù)在服務(wù)居民理財(cái)需求、合理引導(dǎo)直接融資和助力普惠金融方面具有巨大發(fā)展?jié)摿Α＝Y(jié)合大數(shù)據(jù)信息采集實(shí)現(xiàn)對(duì)投資者風(fēng)險(xiǎn)偏好特征的精確畫像，再應(yīng)用某種顯性效用函數(shù)擬合出投資者的風(fēng)險(xiǎn)偏好，則全子集組合法可以針對(duì)不同類型的投資者給出對(duì)任意一組資產(chǎn)的最優(yōu)投資權(quán)重配比。在實(shí)際應(yīng)用中，全子集組合法還可以考慮交易成本對(duì)投資組合權(quán)重的影響，并加入更多股票交易類的高頻數(shù)據(jù)，實(shí)現(xiàn)對(duì)最優(yōu)權(quán)重的更高頻率更新，因此該方法在智能投顧中具有良好的應(yīng)用前景。本書的結(jié)構(gòu)安排也緊密契合資產(chǎn)定價(jià)領(lǐng)域的文獻(xiàn)發(fā)展歷程，以投資者最大化期望效用函數(shù)構(gòu)造最優(yōu)投資組合為出發(fā)點(diǎn)，并根據(jù)隨機(jī)貼現(xiàn)因子和最優(yōu)投資組合的等價(jià)性，提出新的定價(jià)因子。進(jìn)而在“因子動(dòng)物園”背景下，介紹如何使用機(jī)器學(xué)習(xí)方法來(lái)準(zhǔn)確估計(jì)隨機(jī)貼現(xiàn)因子模型中的因子載荷，確定最優(yōu)因子定價(jià)模型。最后探討如何利用已有的大量市場(chǎng)異象和機(jī)器學(xué)習(xí)方法來(lái)提高樣本外收益率預(yù)測(cè)效果。正如資產(chǎn)定價(jià)學(xué)科從馬科維茨（Markowitz）的均值方差投資組合優(yōu)化理論起源，進(jìn)而由市場(chǎng)均衡條件推導(dǎo)出具有最大夏普比率的切點(diǎn)投資組合必然是市場(chǎng)組合，并衍生出了以市場(chǎng)組合為單風(fēng)險(xiǎn)因子的CAPM。隨著Fama（1970）提出有效市場(chǎng)假說(shuō)，文獻(xiàn)開始大量研究能預(yù)測(cè)橫截面資產(chǎn)收益率的市場(chǎng)異象，并促進(jìn)了因子定價(jià)模型的迭代升級(jí)。這種結(jié)構(gòu)安排有利于讀者在把握資產(chǎn)定價(jià)學(xué)科發(fā)展脈絡(luò)的同時(shí)，了解機(jī)器學(xué)習(xí)方法在這三個(gè)主流研究方向上的最新應(yīng)用成果。本書的另一個(gè)特點(diǎn)是注重機(jī)器學(xué)習(xí)方法在資產(chǎn)定價(jià)應(yīng)用中的可解釋性。經(jīng)濟(jì)學(xué)和金融學(xué)的學(xué)術(shù)研究對(duì)復(fù)雜的機(jī)器學(xué)習(xí)方法，例如深度神經(jīng)網(wǎng)絡(luò)模型等的應(yīng)用，一直存在一些顧慮。其核心原因是這類方法的優(yōu)化預(yù)測(cè)過(guò)程往往是一個(gè)黑箱（blackbox）。由于其模型內(nèi)部的復(fù)雜性和非線性，輸入變量和輸出結(jié)果之間缺乏直觀的、可解釋的關(guān)系，也很難和現(xiàn)有的經(jīng)濟(jì)學(xué)、金融學(xué)理論聯(lián)系起來(lái)。如果只關(guān)注樣本外預(yù)測(cè)的準(zhǔn)確性，這個(gè)黑箱問(wèn)題可能不會(huì)造成太大的影響。但是經(jīng)濟(jì)學(xué)和金融學(xué)的研究著眼于國(guó)計(jì)民生的重大問(wèn)題，經(jīng)濟(jì)和金融學(xué)者有責(zé)任去探求事物本質(zhì)的因果聯(lián)系，并需要向政策制定者、消費(fèi)者和投資者解釋模型的決策過(guò)程，因而可解釋性和透明度至關(guān)重要。本書對(duì)機(jī)器方法的選擇思路和Nagel（2021）接近，Nagel（2021）主要應(yīng)用可解釋性強(qiáng)的LASSO、嶺回歸和彈性網(wǎng)絡(luò)等線性機(jī)器學(xué)習(xí)方法。為了規(guī)避黑箱問(wèn)題，本書主要關(guān)注簡(jiǎn)單、具有明確函數(shù)形式且易于解釋的機(jī)器學(xué)習(xí)方法，例如LASSO、嶺回歸、彈性網(wǎng)絡(luò)和主成分回歸等。在投資組合優(yōu)化和隨機(jī)貼現(xiàn)因子識(shí)別部分，雖然使用了隱藏層數(shù)量較少的神經(jīng)網(wǎng)絡(luò)模型，但其主要目的是與其他簡(jiǎn)單機(jī)器學(xué)習(xí)方法的實(shí)證效果進(jìn)行對(duì)比。在撰寫過(guò)程中，作者非常重視解釋由機(jī)器學(xué)習(xí)方法得到的實(shí)證結(jié)果。第三至五章的核心實(shí)證目標(biāo)是從超過(guò)100個(gè)特征變量中篩選出對(duì)投資組合優(yōu)化、因子定價(jià)模型和橫截面收益率預(yù)測(cè)最重要、解釋力最強(qiáng)的變量。除此之外，本書強(qiáng)調(diào)允許特征變量與收益率之間的非線性關(guān)系對(duì)于提升模型預(yù)測(cè)和解釋能力至關(guān)重要。因此，在線性機(jī)器學(xué)習(xí)方法（如LASSO、嶺回歸和彈性網(wǎng)絡(luò)）之外，還引入了加入非線性高階項(xiàng)的非參數(shù)組LASSO等機(jī)器學(xué)習(xí)模型。實(shí)證結(jié)果表明，這類非線性方法在投資組合優(yōu)化和樣本外預(yù)測(cè)方面表現(xiàn)出色，同時(shí)保留了篩選變量的可解釋性特征，因而在模型預(yù)測(cè)性能和可解釋性之間實(shí)現(xiàn)了較好的平衡。Jiang，Kelly和Xiu（2022）使用大型語(yǔ)言模型對(duì)新聞進(jìn)行深度文本分析，并將其應(yīng)用于預(yù)測(cè)市場(chǎng)收益率。本書主要基于作者在相關(guān)領(lǐng)域發(fā)表的多篇研究論文的精煉。其目標(biāo)并不是全面概述機(jī)器學(xué)習(xí)方法在資產(chǎn)定價(jià)全領(lǐng)域的應(yīng)用，而是更多地反映了作者關(guān)于機(jī)器學(xué)習(xí)方法在解決資產(chǎn)定價(jià)中三個(gè)核心問(wèn)題上所能帶來(lái)的改進(jìn)和局限性的思考。本書的內(nèi)容自然會(huì)受限于作者的研究方向，其中一個(gè)未涉及的重要應(yīng)用場(chǎng)景是利用機(jī)器學(xué)習(xí)方法進(jìn)行資產(chǎn)收益率的時(shí)間序列預(yù)測(cè)。在這個(gè)研究領(lǐng)域，作者在攻讀博士學(xué)位期間的校外導(dǎo)師、圣路易斯華盛頓大學(xué)的周國(guó)富教授撰寫了一篇非常出色的綜述文章。感興趣的讀者可以參閱Rapach和Zhou（2020）。除了前述內(nèi)容，還有一些本書未涉及的機(jī)器學(xué)習(xí)方法，包括復(fù)雜的深度學(xué)習(xí)方法以及近期非常流行的基于生成式人工智能的大型語(yǔ)言模型。這些模型，如BERT和ChatGPT，在資產(chǎn)定價(jià)領(lǐng)域同樣具有潛在應(yīng)用價(jià)值。第二章資產(chǎn)定價(jià)中的機(jī)器學(xué)習(xí)方法從不同角度對(duì)資產(chǎn)收益率進(jìn)行預(yù)測(cè)是現(xiàn)有的資產(chǎn)定價(jià)研究的基礎(chǔ)。隨著金融環(huán)境的持續(xù)變化以及可用于預(yù)測(cè)的變量不斷擴(kuò)展，機(jī)器學(xué)習(xí)方法對(duì)于投資組合優(yōu)化、定價(jià)因子識(shí)別和股票橫截面收益率預(yù)測(cè)等高維估計(jì)問(wèn)題具有廣泛的適用性。理解機(jī)器學(xué)習(xí)方法在資產(chǎn)定價(jià)領(lǐng)域的應(yīng)用會(huì)面臨哪些問(wèn)題，首先需要明確其定義和區(qū)別。人工智能先驅(qū)Samuel（1959）最早提出了“機(jī)器學(xué)習(xí)”一詞。早在1952年，塞繆爾（Samuel）在IBM公司研制了一個(gè)西洋跳棋程序，這個(gè)程序具有自學(xué)習(xí)能力，可通過(guò)分析大量棋局逐漸辨識(shí)出當(dāng)前局面下的“好棋”和“壞棋”，從而不斷提高弈棋水平，并很快就下贏了塞繆爾本人。1956年，塞繆爾應(yīng)約翰·麥卡錫（JohnMcCarthy，“人工智能之父”，1971年圖靈獎(jiǎng)得主）之邀，在標(biāo)志著人工智能學(xué)科誕生的達(dá)特茅斯會(huì)議上介紹這項(xiàng)工作，并將機(jī)器學(xué)習(xí)定義為“不顯式編程地賦予計(jì)算機(jī)能力的研究領(lǐng)域”。自此，“機(jī)器學(xué)習(xí)”正式進(jìn)入了大眾的視野并成為重要的計(jì)算機(jī)科研領(lǐng)域之一。20世紀(jì)末計(jì)算機(jī)學(xué)科蓬勃發(fā)展，Mitchell（1997）進(jìn)一步提出，一個(gè)計(jì)算機(jī)程序被稱為可以學(xué)習(xí)，是指它能夠針對(duì)某個(gè)任務(wù)T（task）和某個(gè)性能指標(biāo)P（performance），從經(jīng)驗(yàn)E（experience）中學(xué)習(xí)。這種學(xué)習(xí)的特點(diǎn)是：它在任務(wù)T上被性能指標(biāo)P所衡量的性能，會(huì)隨著經(jīng)驗(yàn)E的增加而提高。由此，機(jī)器學(xué)習(xí)的定義進(jìn)一步完善。機(jī)器學(xué)習(xí)已逐漸發(fā)展成為人工智能領(lǐng)域的核心研究方向之一，其主要目標(biāo)在于賦予計(jì)算機(jī)系統(tǒng)類似于人類的學(xué)習(xí)能力，以實(shí)現(xiàn)真正的人工智能。目前被廣泛接受的機(jī)器學(xué)習(xí)定義為“通過(guò)經(jīng)驗(yàn)提高計(jì)算機(jī)系統(tǒng)的性能”。由于計(jì)算機(jī)系統(tǒng)中的“經(jīng)驗(yàn)”主要以數(shù)據(jù)形式存在，因此機(jī)器學(xué)習(xí)需要采用技術(shù)手段對(duì)數(shù)據(jù)進(jìn)行深入分析，這使得它成為智能數(shù)據(jù)分析領(lǐng)域的關(guān)鍵創(chuàng)新驅(qū)動(dòng)力之一，并日益受到廣泛關(guān)注。在本章中，我們將闡述典型機(jī)器學(xué)習(xí)問(wèn)題與資產(chǎn)定價(jià)問(wèn)題之間的差異，并簡(jiǎn)要介紹主流機(jī)器學(xué)習(xí)方法。2.1機(jī)器學(xué)習(xí)的定義和主要類別（一）典型機(jī)器學(xué)習(xí)問(wèn)題和資產(chǎn)定價(jià)問(wèn)題的區(qū)別計(jì)算機(jī)科學(xué)中典型機(jī)器學(xué)習(xí)問(wèn)題與資產(chǎn)定價(jià)問(wèn)題之間具有一些重要區(qū)別。在數(shù)據(jù)方面最重要的區(qū)別在于數(shù)據(jù)的信號(hào)噪聲比。資產(chǎn)定價(jià)問(wèn)題中，由于預(yù)測(cè)期望收益時(shí)訓(xùn)練數(shù)據(jù)的收益的條件期望值Et［rt］未知，只能觀測(cè)到收益率的實(shí)現(xiàn)值rt，但觀測(cè)值中同時(shí)包含Et［rt］和噪聲信號(hào)εt。同時(shí)收益率的條件期望值在橫截面或時(shí)間序列上的方差在收益率的總方差中占比也很小，信號(hào)噪聲比相應(yīng)較低。在數(shù)據(jù)維度方面，收益率訓(xùn)練數(shù)據(jù)觀測(cè)值通常較少也加劇了信號(hào)噪聲較低的問(wèn)題，加之預(yù)測(cè)變量缺乏高頻變化以及市場(chǎng)微觀結(jié)構(gòu)會(huì)發(fā)生變化導(dǎo)致預(yù)測(cè)結(jié)構(gòu)發(fā)生機(jī)制轉(zhuǎn)換（regime-switch）等原因，致使收益率的條件期望值的可預(yù)測(cè)性往往很低。＋1＋1＋1＋1從關(guān)注角度而言，資產(chǎn)定價(jià)問(wèn)題一般不關(guān)心單個(gè)資產(chǎn)的收益率預(yù)測(cè)是否精準(zhǔn)，而更關(guān)注是否能構(gòu)建具備良好風(fēng)險(xiǎn)-收益性質(zhì)的投資組合。那么，對(duì)個(gè)股進(jìn)行良好預(yù)測(cè)的模型是否也能產(chǎn)生表現(xiàn)最優(yōu)越的投資組合？本書的核心內(nèi)容正是研究利用個(gè)股收益率的可預(yù)測(cè)特征來(lái)實(shí)現(xiàn)投資組合優(yōu)化。進(jìn)一步地，由于預(yù)測(cè)誤差的協(xié)方差矩陣很大程度上決定了投資組合的波動(dòng)率，其對(duì)于投資組合的均值方差性質(zhì)較為重要，因而將在模型選擇、正則化、預(yù)測(cè)表現(xiàn)的評(píng)價(jià)、構(gòu)建投資組合等方面對(duì)機(jī)器學(xué)習(xí)在資產(chǎn)定價(jià)中的應(yīng)用產(chǎn)生顯著影響。此外，預(yù)測(cè)問(wèn)題的一個(gè)關(guān)鍵特點(diǎn)是模型是否具備“稀疏性”（sparsity）。在資產(chǎn)定價(jià)問(wèn)題中，所有觀測(cè)到的變量都是某些潛在變量的帶噪聲信號(hào)，其中某些變量可能與問(wèn)題高度相關(guān)，而另一些變量可能幾乎不相關(guān)。傳統(tǒng)資產(chǎn)定價(jià)研究通常假設(shè)“稀疏性”，即只需少量預(yù)測(cè)變量或因子就能充分解釋不同資產(chǎn)預(yù)期收益率之間的差異。例如，經(jīng)典的Fama-French三因子模型就是稀疏性假設(shè)的代表，它認(rèn)為僅需三個(gè)因子就能解釋橫截面預(yù)期收益率。而機(jī)器學(xué)習(xí)方法提供了一種不強(qiáng)加“稀疏性”假設(shè)約束的數(shù)據(jù)驅(qū)動(dòng)估計(jì)方法，它能從數(shù)據(jù)中學(xué)習(xí)特征。這有助于我們?cè)趶?fù)雜的現(xiàn)實(shí)環(huán)境下探索高維變量之間的聯(lián)合效應(yīng)和統(tǒng)計(jì)特征間的相互作用，從而更有效地解釋潛在風(fēng)險(xiǎn)差異對(duì)股票收益率的影響。盧卡斯批判（Lucascritique）是一種針對(duì)宏觀經(jīng)濟(jì)模型的質(zhì)疑，尤其是對(duì)在制定經(jīng)濟(jì)政策時(shí)依賴歷史數(shù)據(jù)的方法的質(zhì)疑。盧卡斯批判強(qiáng)調(diào)在分析經(jīng)濟(jì)政策影響時(shí)應(yīng)考慮微觀基礎(chǔ)，即個(gè)體行為和決策。其核心觀點(diǎn)在于，從歷史數(shù)據(jù)中觀察到的關(guān)系并不能保證在新的經(jīng)濟(jì)政策下仍然成立。當(dāng)政策發(fā)生變化時(shí)，人們的預(yù)期和行為也會(huì)隨之調(diào)整，導(dǎo)致模型的參數(shù)發(fā)生變化。因此，僅僅依賴歷史數(shù)據(jù)可能會(huì)導(dǎo)致對(duì)政策影響的錯(cuò)誤預(yù)測(cè)。值得一提的是，基礎(chǔ)差別還包括投資者是否可以進(jìn)行學(xué)習(xí)從而使訓(xùn)練數(shù)據(jù)發(fā)生結(jié)構(gòu)性的變化?？紤]到資產(chǎn)價(jià)格是人們根據(jù)歷史數(shù)據(jù)進(jìn)行投資決策的結(jié)果，收益率的潛在數(shù)據(jù)生成過(guò)程可能并不是時(shí)間序列平穩(wěn)的，例如在t時(shí)刻前，因子x能較好地預(yù)測(cè)收益，但在t時(shí)刻投資者發(fā)現(xiàn)了這個(gè)因子并進(jìn)行了大量交易，將會(huì)使收益可預(yù)測(cè)性在隨后的時(shí)段消失，即在t時(shí)刻數(shù)據(jù)發(fā)生了結(jié)構(gòu)性的變化。這種市場(chǎng)參與者的內(nèi)生行為導(dǎo)致在樣本內(nèi)發(fā)現(xiàn)的規(guī)律在樣本外失效的現(xiàn)象和宏觀經(jīng)濟(jì)學(xué)中經(jīng)典的“盧卡斯批判”（Lucas，1976）類似。但由于缺乏內(nèi)生的機(jī)制驅(qū)動(dòng)后續(xù)數(shù)據(jù)性質(zhì)的改變，當(dāng)前依然沒(méi)有合適的理論來(lái)指導(dǎo)如何使機(jī)器學(xué)習(xí)算法適應(yīng)資產(chǎn)定價(jià)數(shù)據(jù)結(jié)構(gòu)性的變化。（二）監(jiān)督學(xué)習(xí)及無(wú)監(jiān)督學(xué)習(xí)的區(qū)分關(guān)于監(jiān)督學(xué)習(xí)及無(wú)監(jiān)督學(xué)習(xí)的區(qū)分最早源自統(tǒng)計(jì)學(xué)習(xí)對(duì)數(shù)據(jù)的理解和應(yīng)用。具體而言，監(jiān)督學(xué)習(xí)涉及建立具體的統(tǒng)計(jì)模型，用于預(yù)測(cè)或估計(jì)基于一個(gè)或多個(gè)輸入的輸出，并可以在商業(yè)、醫(yī)學(xué)、天體物理學(xué)和公共政策等各類不同領(lǐng)域進(jìn)行應(yīng)用。就具體目標(biāo)而言，監(jiān)督學(xué)習(xí)是基于K個(gè)預(yù)測(cè)變量（predictor）或者K×1維特征（feature）向量xi，通過(guò)建立預(yù)測(cè)變量和響應(yīng)變量yi之間的關(guān)系，精準(zhǔn)預(yù)測(cè)響應(yīng)變量或更好地理解預(yù)測(cè)得到的響應(yīng)變量與預(yù)測(cè)變量的關(guān)系。對(duì)應(yīng)到實(shí)踐中，也就是使用訓(xùn)練數(shù)據(jù)，在中尋找未知函數(shù)，其中ε表示不可由x預(yù)測(cè)的均值為0的部分。假設(shè)訓(xùn)練數(shù)據(jù)和樣本外數(shù)據(jù)由同一個(gè)統(tǒng)計(jì)模型式（2-1）產(chǎn)生，由訓(xùn)練數(shù)據(jù)估計(jì)得到的是一個(gè)很好的樣本外預(yù)測(cè)變量。進(jìn)一步地，將響應(yīng)變量按照連續(xù)數(shù)值與離散數(shù)值進(jìn)行細(xì)分，監(jiān)督學(xué)習(xí)又包括回歸（regression）與分類（classification）兩大類模型，分別用于連續(xù)變量（定量問(wèn)題）和離散變量（定性問(wèn)題）的預(yù)測(cè)。在資產(chǎn)定價(jià)中，適用于推出連續(xù)變量的回歸問(wèn)題更加普遍?？紤]不同的F，不同回歸方法又分別適用于線性與非線性模型，線性回歸在計(jì)量中常見，非線性回歸則類似于計(jì)量中的非參數(shù)估計(jì)方法，如核回歸等。不同于上述監(jiān)督學(xué)習(xí)的情形，在無(wú)監(jiān)督學(xué)習(xí)中，只有預(yù)測(cè)變量的觀測(cè)向量xi，也就是有輸入向量但沒(méi)有相應(yīng)的響應(yīng)變量來(lái)監(jiān)督輸出。換言之，無(wú)監(jiān)督學(xué)習(xí)無(wú)法提前告知算法數(shù)據(jù)集中不同類型數(shù)據(jù)對(duì)應(yīng)的標(biāo)簽。然而，即便缺乏響應(yīng)變量來(lái)指導(dǎo)數(shù)據(jù)分析，我們也可以從這些數(shù)據(jù)中學(xué)習(xí)相應(yīng)的關(guān)系和結(jié)構(gòu)。在下一節(jié)中，我們將具體展開介紹。2.2機(jī)器學(xué)習(xí)方法介紹（一）監(jiān)督學(xué)習(xí)：線性回歸和收縮估計(jì)方法1.OLS模型假設(shè)統(tǒng)計(jì)模型式（2-1）中的f（xi）是線性的，則有其中g(shù)＝（g1，…，gK）T是系數(shù)向量。盡管yi關(guān)于xi是線性的，xi中可以有預(yù)測(cè)變量的非線性轉(zhuǎn)化，即xi中可以有計(jì)量中解釋變量交互項(xiàng)之類的變量。將訓(xùn)練集中的N個(gè)觀測(cè)堆疊為N×1維的y＝（y1，…，yN）T和N×K維的X＝（x1，…，xN）T。由最小化均方誤差（meansquarederror）得到g的估計(jì)由此，樣本內(nèi)擬合值為。高維數(shù)據(jù)問(wèn)題中K相對(duì)于N并不會(huì)很小，此時(shí)樣本內(nèi)R2會(huì)很大，但是樣本外R2會(huì)很小甚至為負(fù)，過(guò)擬合（overfitting）使得由OLS估計(jì)得到的預(yù)測(cè)不可信，原因是相比于觀測(cè)數(shù)量N有過(guò)多協(xié)變量（co-variate）使OLS過(guò)擬合（可以理解為重復(fù)使用少量的觀測(cè)訓(xùn)練模型所致），擬合了噪聲而非真實(shí)信號(hào)。K＞N時(shí)OLS估計(jì)的結(jié)果甚至不是唯一的，但是這些擬合結(jié)果往往擬合了εi而非f（xi）。針對(duì)高維數(shù)據(jù)中解釋變量維度K較大（相對(duì)于樣本數(shù)量N）的問(wèn)題，統(tǒng)計(jì)學(xué)習(xí)文獻(xiàn)中采用基于收縮估計(jì)（shrinkageestimation）的回歸方法，此類方法的系數(shù)估計(jì)量并不滿足無(wú)偏性，但估計(jì)量的方差更小，所以其均方誤差更小，在模型預(yù)測(cè)上會(huì)有更好的效果。以下介紹嶺回歸、LASSO回歸和彈性網(wǎng)絡(luò)三種最具有代表性的收縮估計(jì)方法。2.嶺回歸在K很大時(shí)，為了改善預(yù)測(cè)的表現(xiàn)，對(duì)中太大的元素施加限制，在最小化均方誤差的基礎(chǔ)上施加L2懲罰（HoerlandKennard，1970a，1970b），從而得到g的嶺回歸（ridgeregression）估計(jì)：其中，IK＝diag（1，…，1）。目標(biāo)函數(shù)第一項(xiàng)為損失，第二項(xiàng)為懲罰項(xiàng)，超參數(shù)γ控制了懲罰的強(qiáng)度，求逆矩陣的時(shí)候γIK使回歸系數(shù)向0收縮。在特殊情況。3.LASSO回歸類似于嶺回歸，對(duì)估計(jì)目標(biāo)函數(shù)施加L1懲罰（Tibshirani，1996），從而得到g的LASSO回歸估計(jì)：此時(shí)關(guān)于y非線性，并且一般沒(méi)有解析解，但可以通過(guò)最小角回歸（Hastie，Tibshirani，andFriedman，2009）等算法得到數(shù)值解。LASSO回歸會(huì)使估計(jì)的系數(shù)向0收縮，由于L1懲罰項(xiàng)的加入，還可以使某些變量的系數(shù)壓縮到0，因而可以實(shí)現(xiàn)變量篩選稀疏的系數(shù)估計(jì)。特殊情況XTX＝IK時(shí)，。4.彈性網(wǎng)絡(luò)LASSO回歸在舍棄高度正相關(guān)的兩個(gè)變量中的一個(gè)時(shí)，可能是數(shù)據(jù)中的噪聲起了決定性的作用，所以應(yīng)該將兩個(gè)變量的均值留在模型中，取均值有助于消除噪聲，而這正是嶺回歸做的事情，由此結(jié)合LASSO回歸與嶺回歸得到彈性網(wǎng)絡(luò)（elasticnet）（ZouandHastie，2005）彈性網(wǎng)絡(luò)也會(huì)使部分系數(shù)收縮為0，但是其變量篩選程度沒(méi)有LASSO回歸那么強(qiáng)，并且也會(huì)有類似嶺回歸那樣的系數(shù)收縮。LASSO回歸、嶺回歸、彈性網(wǎng)絡(luò)對(duì)變量的縮放敏感HYPERLINK\h[1]，所以一般應(yīng)該先對(duì)輸入的變量進(jìn)行標(biāo)準(zhǔn)化使其均值為0、標(biāo)準(zhǔn)差為1。但在一些經(jīng)濟(jì)金融學(xué)應(yīng)用中，模型中的回歸系數(shù)具有明確的經(jīng)濟(jì)學(xué)含義，其中對(duì)應(yīng)的變量受到經(jīng)濟(jì)學(xué)模型的約束，對(duì)其進(jìn)行標(biāo)準(zhǔn)化會(huì)影響模型系數(shù)的經(jīng)濟(jì)學(xué)解釋。例如Kozak，Nagel和Santosh（2020）應(yīng)用嶺回歸和彈性網(wǎng)絡(luò)來(lái)檢驗(yàn)隨機(jī)貼現(xiàn)因子模型是否具有稀疏性，為了保留定價(jià)因子風(fēng)險(xiǎn)價(jià)格系數(shù)的經(jīng)濟(jì)學(xué)含義，并沒(méi)有對(duì)因子的收益率和協(xié)方差矩陣做標(biāo)準(zhǔn)化處理。（二）監(jiān)督學(xué)習(xí)：非線性方法1.回歸樹（CART）回歸樹（Breiman，etal.，1984，2017）通過(guò)多維階躍函數(shù)來(lái)近似非線性函數(shù)f（xi）。特征空間由多個(gè)包含各個(gè)xi的鄰近區(qū)域，即“葉子”組成，基于回歸樹的算法一般使用遞歸二元?jiǎng)澐炙惴▌澐痔卣骺臻g。尋找能最小化殘差平方和的全局最優(yōu)劃分在計(jì)算上是不可行的，一般使用貪婪算法（如Hastie，etal.，2009），對(duì)所有數(shù)據(jù)根據(jù)每一個(gè)特征依據(jù)不同閾值進(jìn)行二元?jiǎng)澐植⒄页瞿茏顑?yōu)化這一步擬合的做法，對(duì)劃分得到的數(shù)據(jù)集，即“域”，重復(fù)上述操作，直到每一個(gè)域內(nèi)的觀測(cè)值數(shù)量足夠少。用R1，…，RH表示根據(jù)x＝（x1，…，xK）劃分出的域，是滿足xi∈Rh的觀測(cè)值yi的等權(quán)重均值。當(dāng)xi∈Rh時(shí)，。非參數(shù)統(tǒng)計(jì)中常用的核回歸（kernelregression）的應(yīng)變量y估計(jì)值為待預(yù)測(cè)點(diǎn)鄰域內(nèi)觀測(cè)值的均值，不過(guò)鄰域的選取和對(duì)數(shù)據(jù)進(jìn)行加權(quán)的方法更復(fù)雜一些。為了避免過(guò)擬合，從一個(gè)足夠大、必然過(guò)擬合的樹開始剪枝。假設(shè)初始有H片葉子，尋找一個(gè)使剪枝后的樹能夠最小化受到的懲罰的殘差平方和調(diào)整參數(shù)（tuningparameter）γ＝0時(shí)不進(jìn)行剪枝，γ越大剪枝越劇烈。2.隨機(jī)森林（randomforest）對(duì)樹的大小進(jìn)行懲罰的替代措施是使用隨機(jī)森林（Breiman，2001），令樹達(dá)到最大（葉的規(guī)模達(dá)到最?。?，使用自助聚合（bootstrapaggregation）來(lái)降低過(guò)擬合。假設(shè)xi有J個(gè)特征。從訓(xùn)練數(shù)據(jù)集中獲取一個(gè)和原數(shù)據(jù)集同樣大小的自助抽樣，隨機(jī)選擇m＜J個(gè)特征，由此產(chǎn)生一個(gè)使葉的規(guī)模達(dá)到最小的樹，反復(fù)抽樣得到一個(gè)“森林”，調(diào)節(jié)m可以改變懲罰力度，最終xi對(duì)應(yīng)的估計(jì)值為這些樹在xi處估計(jì)值的均值，這種取均值的方法消除了不同樹、不同的過(guò)擬合噪聲帶來(lái)的影響。3.神經(jīng)網(wǎng)絡(luò)（neuralnetwork）對(duì)于單層全連接神經(jīng)網(wǎng)絡(luò)，假設(shè)輸入xi有J個(gè)特征，輸出yi，神經(jīng)網(wǎng)絡(luò)隱藏層（hiddenlayer）有H個(gè)節(jié)點(diǎn)（node），擬合模型yi＝f（xi）＋εi，則神經(jīng)網(wǎng)絡(luò)可以表示為其中a1＋W1xi表示潛變量（latentvariables）。激活函數(shù)（activationfunction）g是非線性的，對(duì)潛變量逐個(gè)元素進(jìn)行操作，如使用ReLU函數(shù)g（z）＝max｛0，z｝。神經(jīng)網(wǎng)絡(luò)最終輸出f（xi）。隱藏層節(jié)點(diǎn)數(shù)量足夠多時(shí)，神經(jīng)網(wǎng)絡(luò)可以近似任意非線性函數(shù)；深度神經(jīng)網(wǎng)絡(luò)（DNN）一般有10～20層，更多層的神經(jīng)網(wǎng)絡(luò)可以表示為在全連接的情況下，記第p個(gè)隱藏層節(jié)點(diǎn)數(shù)量為Hp，則增加第p＋1個(gè)隱藏層會(huì)增加Hp×Hp＋Hp個(gè)參數(shù)。實(shí)踐中，對(duì)于擬合而言，添加層數(shù)比在一層中添加節(jié)點(diǎn)可能更有效，相關(guān)討論可參考Ba和Ca-ruana（2014）。＋1＋1神經(jīng)網(wǎng)絡(luò)輸入之間的交互效應(yīng)對(duì)輸出不可加，這種非線性在資產(chǎn)定價(jià)應(yīng)用中非常重要。考慮單一隱藏層中有兩個(gè)節(jié)點(diǎn)的全連接神經(jīng)網(wǎng)絡(luò)，設(shè)g（z）＝max｛0，z｝，a1＝（a1，a1）T，其中a1＞a1，則此時(shí)，1，2，2，1第二項(xiàng)在xi＋xi＞a1時(shí)才能被激活，第三項(xiàng)在xi＋xi＜a1且足夠小時(shí)才能被激活，即體現(xiàn)了交互效應(yīng)的不可加性。，1，2，1，1，2，2記所有參數(shù)的集合為θ，使用最小化均方誤差目標(biāo)函數(shù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)－1可以使用隨機(jī)梯度下降（stochasticgradientdescent，SGD）或者擬牛頓法（quasi-Newtonmethods）等數(shù)值方法求目標(biāo)函數(shù)的最小值。使用光滑的激活函數(shù)如sigmoid函數(shù)g（z）＝［1＋exp（－z）］可以方便求解。過(guò)大的神經(jīng)網(wǎng)絡(luò)也會(huì)有過(guò)擬合問(wèn)題，可以施加類似嶺回歸L2懲罰的正則化在使用激活函數(shù)sigmoid的情況下，參數(shù)收縮使神經(jīng)網(wǎng)絡(luò)向線性回歸模型收縮，如果輸入觀測(cè)的值很大，從而對(duì)應(yīng)的權(quán)重參數(shù)很小，則正則化無(wú)效，所以一般仍然要將輸入標(biāo)準(zhǔn)化，使其均值為0、標(biāo)準(zhǔn)差為1。（三）無(wú)監(jiān)督學(xué)習(xí)前面的線性方法和非線性方法都屬于監(jiān)督學(xué)習(xí)方法，可以使用結(jié)果變量對(duì)模型的訓(xùn)練效果進(jìn)行評(píng)估；無(wú)監(jiān)督學(xué)習(xí)方法則沒(méi)有目標(biāo)變量來(lái)評(píng)估模型的好壞，主要用于分析數(shù)據(jù)本身的特征，如主成分分析、K－均值聚類等。1.主成分分析主成分分析用于揭示變量之間的相關(guān)性特征，可以用低維獨(dú)立數(shù)據(jù)描述高維數(shù)據(jù)的變化。考慮一組隨機(jī)變量xi＝（x1i，x2i，…，xki），其方差協(xié)方差矩陣為Σ。設(shè)wi＝（wi1，wi2，…，wik）為一組k維權(quán)重向量，那么以wi為權(quán)重（載荷）的隨機(jī)變量xi線性組合為這里我們將wi標(biāo)準(zhǔn)化為以確保方差有限。隨機(jī)變量yi的方差和協(xié)方差為其中i，j＝1，2，…，k。主成分分析的目的是找出一系列wi使得隨著i增大，yi的方差逐漸減小，并且對(duì)于任意i≠j，yi和yj的相關(guān)性為零。找出wi的步驟是：（1）i＝1，最大化；（2）i＝2，最大化Var（y2）＝w′2Σw2，約束是和cov（y2，y1）＝0；（3）i＝j(luò)，最大化Var（yj）＝w′jΣwj，約束是和cov（yj，ys）＝0，。這一優(yōu)化過(guò)程給出的最優(yōu)載荷向量恰好是Σ的特征向量，并且相對(duì)應(yīng)的特征值逐項(xiàng)遞減。令（λ1，e1），（λ2，e2），…，（λk，ek）為Σ的特征值（特征向量對(duì)），并且λ1≥λ2≥…≥λk≥0（Σ是非負(fù)定的，所以特征值非負(fù)）。那么，第i個(gè)主成分為，其方差為。第i，j（i≠j）個(gè)主成分的協(xié)方差為cov（yi，yj）＝。進(jìn)一步地，隨機(jī)變量xi的總方差恰好等于所有主成分的總方差，所以主成分i所能解釋的變量總體變化的比例等于對(duì)應(yīng)的特征值與所有特征值的和之比，即特別地，對(duì)主成分再進(jìn)行線性組合并不能構(gòu)造出一個(gè)方差更大的主成分。前幾個(gè)主成分包含了原隨機(jī)變量的大部分信息，可以用其替代原隨機(jī)變量作為訓(xùn)練模型的輸入，大大降低數(shù)據(jù)的維度。由于主成分之間并沒(méi)有相關(guān)性，在線性模型中用主成分替代原有隨機(jī)變量可以避免多重共線性問(wèn)題。2.K－均值聚類聚類是根據(jù)數(shù)據(jù)本身特征對(duì)數(shù)據(jù)進(jìn)行分組的技術(shù)。給定n個(gè)觀測(cè)值x1，x2，…，xn，每個(gè)觀測(cè)都有k維特征，K－均值聚類把n個(gè)觀測(cè)值分成互不交疊的K個(gè)子組S＝S1，S2，…，Sk，這里的K需要提前給定。K－均值聚類技術(shù)通過(guò)最小化組內(nèi)平方和（within-clustersumofsquares，WCSS）來(lái)求出分組S，其中μi是子組Si的元素均值，即，這里指Si的元素個(gè)數(shù)，是L2懲罰項(xiàng)，即歐幾里得距離。由于，K－均值聚類最小化同一子組內(nèi)的兩兩元素的變差，由于總體的變差是不變的，因此最小化WCSS等于最大化子組間的平方變差（between-clustersumofsquares，BCSS）。在實(shí)踐中，可以采用Lloyd算法得到WCSS或BCSS問(wèn)題的數(shù)值解。（四）調(diào)節(jié)超參數(shù)超參數(shù)（hyperparameters）指在使用訓(xùn)練樣本估計(jì)機(jī)器學(xué)習(xí)模型前需要預(yù)先設(shè)置值的參數(shù)，而非通過(guò)數(shù)據(jù)直接估計(jì)得到的參數(shù)。一般而言，超參數(shù)用于定義機(jī)器學(xué)習(xí)模型的更高層次的概念，比如模型復(fù)雜度或?qū)W習(xí)能力，其不能直接從模型訓(xùn)練數(shù)據(jù)集中學(xué)習(xí)，需要預(yù)先定義。機(jī)器學(xué)習(xí)方法，尤其是監(jiān)督學(xué)習(xí)方法的實(shí)證應(yīng)用效果往往受超參數(shù)取值的影響很大，可以通過(guò)設(shè)置不同的測(cè)試值，訓(xùn)練不同的模型并觀察其在訓(xùn)練樣本外的驗(yàn)證集中的表現(xiàn)來(lái)調(diào)節(jié)優(yōu)化超參數(shù)取值。機(jī)器學(xué)習(xí)方法中常見的超參數(shù)包括：收縮估計(jì)法中調(diào)節(jié)對(duì)系數(shù)正則化約束條件強(qiáng)弱的參數(shù)，樹方法中樹的數(shù)量或樹的深度，深層神經(jīng)網(wǎng)絡(luò)隱藏層數(shù)，主成分分析中潛在主成分的數(shù)量，K－均值聚類中的子組數(shù)量等。下面我們以嶺回歸為例，簡(jiǎn)要介紹超參數(shù)的作用，以及在收縮估計(jì)法中常用的超參數(shù)優(yōu)化調(diào)節(jié)方法。在嶺回歸中，樣本內(nèi)均方誤差為其中，N為觀測(cè)數(shù)量，γ為嶺回歸的超參數(shù)。過(guò)擬合的程度與模型復(fù)雜度有關(guān)，OLS回歸的模型復(fù)雜度只與變量個(gè)數(shù)有關(guān)，嶺回歸的收縮限制了估計(jì)值從而降低了模型復(fù)雜度，要兼顧最小化樣本內(nèi)mse（γ）和降低模型復(fù)雜度對(duì)樣本外預(yù)測(cè)的好處以選擇最優(yōu)的γ。對(duì)于存在的線性模型（如OLS回歸），可以用有效參數(shù)數(shù)量tr（H）表現(xiàn)模型復(fù)雜度（Hastie，Tibshirani，andFriedman，2009），其中tr（·）表示求跡，在嶺回歸的情況下參數(shù)有效數(shù)量為在OLS回歸中，d（0）＝tr（IK）＝K；在嶺回歸中，γ＞0時(shí)，d（γ）＜k，例如在XTX＝IK的情況下d（γ）＝k／（1＋γ）。綜合參數(shù)有效數(shù)量和樣本內(nèi)誤差得到對(duì)擬合的測(cè)度如AIC（Akaikeinformationcriterion），在嶺回歸的情況下，假設(shè)ε是獨(dú)立同正態(tài)分布的高斯噪聲，則γ增加使AIC（γ）第一項(xiàng)增加、第二項(xiàng)降低，最小化AIC得到最優(yōu)超參數(shù)。AIC的缺點(diǎn)在于，它難以找到非線性模型的有效參數(shù)數(shù)量，即使應(yīng)用于線性模型也依賴于很強(qiáng)的假設(shè)，降低ε獨(dú)立同正態(tài)分布的要求需要假設(shè)特定形式的似然函數(shù)。純數(shù)據(jù)驅(qū)動(dòng)的確定超參數(shù)的方法是交叉驗(yàn)證（cross-validation，CV），將估計(jì)得到的模型在驗(yàn)證集（Xv，yv）上的預(yù)測(cè)誤差作為最小化目標(biāo)，Stone（1977）證明了由CV和AIC選擇模型是漸進(jìn)等價(jià)的。在嶺回歸的情況下使用k折交叉驗(yàn)證可以改善數(shù)據(jù)利用效率，即把整個(gè)數(shù)據(jù)集劃分為同等大小的k份，進(jìn)行k輪操作，每次使用其中的一份做模型驗(yàn)證，剩下的k－1份做模型估計(jì)，最優(yōu)超參數(shù)能最小化k個(gè)預(yù)測(cè)誤差的均值。例如在嶺回歸的情況下其中v（j）表示劃分得到的第j份數(shù)據(jù)集，－v（j）表示除去第j份剩余的數(shù)據(jù)集。那么如何確定k折交叉驗(yàn)證中最優(yōu)的k呢？k小則估計(jì)參數(shù)使用的數(shù)據(jù)少，導(dǎo)致對(duì)預(yù)測(cè)誤差的評(píng)估偏悲觀；k大則每次估計(jì)模型使用的數(shù)據(jù)有較大程度的交疊，雖然對(duì)模型預(yù)測(cè)誤差的估計(jì)更傾向于無(wú)偏，但是預(yù)測(cè)誤差會(huì)有較大的方差，因?yàn)樾鲁槿〉尿?yàn)證集預(yù)測(cè)誤差有更大的不確定性，由此存在一個(gè)對(duì)預(yù)測(cè)誤差的偏差與方差的權(quán)衡；另外k過(guò)大還會(huì)增加計(jì)算量。實(shí)踐中一般選擇遠(yuǎn)小于N的k。由于要最小化預(yù)測(cè)誤差的均值，所以應(yīng)該選擇以得到對(duì)預(yù)測(cè)誤差的偏樂(lè)觀的評(píng)估。數(shù)據(jù)集中還應(yīng)劃分出一個(gè)額外的不用于訓(xùn)練和驗(yàn)證的測(cè)試集，在測(cè)試集上評(píng)估預(yù)測(cè)誤差。\h[1]可以考慮XTX＝IK的情況。第三章投資組合優(yōu)化本章介紹資產(chǎn)定價(jià)領(lǐng)域的基礎(chǔ)性研究問(wèn)題，即投資組合優(yōu)化問(wèn)題。3.1節(jié)首先介紹經(jīng)典的Markowitz（1952）均值方差投資組合優(yōu)化理論以及其在高維數(shù)據(jù)環(huán)境下的局限性。3.2節(jié)介紹Brandt，Santa-Clara和Valkanov（2009）提出的參數(shù)化投資組合優(yōu)化理論，該方法將所需優(yōu)化的股票權(quán)重寫成K個(gè)特征變量的線性函數(shù)，再針對(duì)投資者的期望效用函數(shù)求最大化從而估計(jì)出這K個(gè)參數(shù)。3.3節(jié)從最大化投資者期望效用出發(fā)，推導(dǎo)隨機(jī)貼現(xiàn)因子的表達(dá)式，并證明文獻(xiàn)中利用若干個(gè)定價(jià)因子表示隨機(jī)貼現(xiàn)因子的做法本質(zhì)上與求解最大化期望效用問(wèn)題等價(jià)。3.4節(jié)介紹如何利用多種常用的機(jī)器學(xué)習(xí)方法實(shí)現(xiàn)降維來(lái)有效估計(jì)最優(yōu)參數(shù)化投資組合權(quán)重。3.5節(jié)簡(jiǎn)要介紹如何利用神經(jīng)網(wǎng)絡(luò)模型來(lái)求最優(yōu)投資組合權(quán)重。3.6節(jié)提出一種基于模型平均的更簡(jiǎn)單且適用于更具有一般性的期望效用函數(shù)的全子集組合法來(lái)優(yōu)化參數(shù)化投資組合。最后，3.7節(jié)結(jié)合我國(guó)A股市場(chǎng)數(shù)據(jù)給出了嚴(yán)謹(jǐn)?shù)膶?shí)證分析結(jié)果，希望幫助讀者從理論和實(shí)證的角度來(lái)了解機(jī)器學(xué)習(xí)方法在求解最優(yōu)投資組合權(quán)重中的應(yīng)用。3.8節(jié)總結(jié)本章內(nèi)容。3.1馬科維茨投資組合1952年馬科維茨在《金融學(xué)期刊》（TheJournalofFinance）上發(fā)表題為《投資組合選擇》（PortfolioSelection）的論文標(biāo)志著現(xiàn)代證券組合理論的開端。在單期投資中，投資者分別將資金按照預(yù)定比例分別投資于不同資產(chǎn)并持有一個(gè)證券組合到期末，馬科維茨模型通過(guò)優(yōu)化資產(chǎn)的組合來(lái)獲取風(fēng)險(xiǎn)和收益的最佳點(diǎn)。假設(shè)N個(gè)風(fēng)險(xiǎn)資產(chǎn)的超額收益是隨機(jī)收益向量與無(wú)風(fēng)險(xiǎn)收益率之差，即，記其條件均值為μt，協(xié)方差矩陣為Σt。假設(shè)超額收益獨(dú)立同分布并且各階矩為常數(shù)。假設(shè)投資者只能在這N個(gè)風(fēng)險(xiǎn)資產(chǎn)（不包括無(wú)風(fēng)險(xiǎn)資產(chǎn)）之間配置財(cái)富，各資產(chǎn)在投資組合中的權(quán)重為w，那么優(yōu)化問(wèn)題為第一個(gè)限制條件保證了投資組合的期望收益，第二個(gè)限制條件保證了所有的財(cái)富都投資于風(fēng)險(xiǎn)資產(chǎn)。由拉格朗日方法一階條件求出最優(yōu)投資組合權(quán)重為－1－1－1－1－1－1－1?T?其中，Λ1＝［B（Σι）－A（Σμ）］／D，Λ2＝［C（Σμ）－A（Σι）］／D，ι＝（1，…，1）T，A＝ιTΣμ，B＝μTΣμ，C＝ιTΣι，D＝BC－A2。最小化的投資組合方差為wΣw。如果投資者可以將財(cái)富配置于無(wú)風(fēng)險(xiǎn)資產(chǎn)，即可以以無(wú)風(fēng)險(xiǎn)利率進(jìn)行不受限制的借貸，那么實(shí)現(xiàn)風(fēng)險(xiǎn)投資與無(wú)風(fēng)險(xiǎn)資產(chǎn)最優(yōu)的組合應(yīng)最大化夏普比率E［rp］／std［rp］，即從無(wú)風(fēng)險(xiǎn)資產(chǎn)出發(fā)與均值方差有效前沿相切的切線上的任意一點(diǎn)所對(duì)應(yīng)的投資組合，由此每一個(gè)投資者將相同的風(fēng)險(xiǎn)資產(chǎn)投資與無(wú)風(fēng)險(xiǎn)資產(chǎn)進(jìn)行組合。假設(shè)財(cái)富配置于風(fēng)險(xiǎn)資產(chǎn)的權(quán)重向量為x，剩余（1－ιTx）的財(cái)富配置于無(wú)風(fēng)險(xiǎn)資產(chǎn)，投資組合收益率為，則均值方差最優(yōu)化問(wèn)題可以用超額收益表示為，t＋1，t＋1解得均值方差投資組合權(quán)重為－1記常數(shù)，可按比例縮放Σμ的所有元素以實(shí)現(xiàn)所需的期望投資組合風(fēng)險(xiǎn)溢價(jià)。基于上述最優(yōu)投資組合表達(dá)式，考慮到切點(diǎn)投資組合完全由風(fēng)險(xiǎn)資產(chǎn)組成，所以切點(diǎn)組合權(quán)重之和ιTwtgc＝1，進(jìn)而對(duì)切點(diǎn)風(fēng)險(xiǎn)投資組合有?上述均值方差問(wèn)題生成了一個(gè)從期望投資組合風(fēng)險(xiǎn)溢價(jià)μ到均值方差投資組合權(quán)重w的映射，并使得投資組合收益波動(dòng)率為，而期望風(fēng)險(xiǎn)溢價(jià)則內(nèi)生地由投資者對(duì)風(fēng)險(xiǎn)的容忍度決定。從投資者對(duì)期望收益和風(fēng)險(xiǎn)進(jìn)行權(quán)衡的角度出發(fā)，上述均值方差問(wèn)題也可以描述為一個(gè)效用最優(yōu)化問(wèn)題?－1其中γ表示投資者的相對(duì)風(fēng)險(xiǎn)厭惡程度。解仍為w＝λΣμ，并有λ＝1／γ。?馬科維茨模型有兩個(gè)重要的經(jīng)濟(jì)學(xué)意義：（1）不完全相關(guān)的資產(chǎn)可以產(chǎn)生較好的風(fēng)險(xiǎn)收益特征；（2）完全分散化投資時(shí)，較高的期望收益只能通過(guò)極端的權(quán)重分配來(lái)取得（w是的線性函數(shù)），由此要承擔(dān)較高的風(fēng)險(xiǎn)。由此可見，馬科維茨模型主要關(guān)注投資組合選擇的兩方面，即分散化以及對(duì)期望收益和風(fēng)險(xiǎn)的權(quán)衡。然而，馬科維茨模型也存在如下幾個(gè)問(wèn)題：首先，馬科維茨模型僅考慮投資者具有均值方差效用時(shí)的配置情況，忽略了其對(duì)高階矩的偏好，尤其是收益的偏度和峰度。大量文獻(xiàn)證明投資者偏好收益率具有正偏度的資產(chǎn)，甚至因此愿意接受預(yù)期收益率為負(fù)的資產(chǎn)?；趯?duì)負(fù)偏度收益率資產(chǎn)的厭惡，產(chǎn)生了方差之外的風(fēng)險(xiǎn)測(cè)度，如僅考慮負(fù)收益的“下行風(fēng)險(xiǎn)”（downsiderisk）。資產(chǎn)組合收益率的偏度不一定會(huì)比單個(gè)資產(chǎn)收益率的偏度的線性組合高或低，因此在考慮偏度的情況下，均值方差最優(yōu)準(zhǔn)則將會(huì)產(chǎn)生次優(yōu)的投資組合。其次，均值方差模型可以被證明等價(jià)于最大化期望效用時(shí)使用的二次效用函數(shù)，而這種效用隨財(cái)富的增加并非單調(diào)增加。現(xiàn)有文獻(xiàn)更關(guān)注雙曲絕對(duì)風(fēng)險(xiǎn)厭惡（HARA）的時(shí)間可分的預(yù)期效用，特例包括對(duì)數(shù)效用、指數(shù)或常數(shù)相對(duì)風(fēng)險(xiǎn)厭惡（CRRA）效用、負(fù)指數(shù)或常數(shù)絕對(duì)風(fēng)險(xiǎn)厭惡（CARA）效用等。最后，馬科維茨模型僅考慮了單期問(wèn)題，而現(xiàn)實(shí)中投資組合優(yōu)化是長(zhǎng)期的問(wèn)題，并且需要在中期對(duì)投資組合進(jìn)行再平衡。一般地，投資者在時(shí)刻t選擇投資組合，通過(guò)在t，t＋1，…，t＋τ－1對(duì)無(wú)風(fēng)險(xiǎn)資產(chǎn)和N種風(fēng)險(xiǎn)資產(chǎn)進(jìn)行交易，來(lái)最大化t＋τ時(shí)關(guān)于財(cái)富的效用，因此在多期情形下，最優(yōu)化問(wèn)題可表示為：其中各期財(cái)富均非負(fù)，Ws≥0。zt是由狀態(tài)變量組成的K維向量，即t時(shí)刻的信息集。在多期情況下，投資者的決策優(yōu)化問(wèn)題更為復(fù)雜，不僅面臨著收益本身的不確定性與未來(lái)股息收益率的變化，同時(shí)也未知投資機(jī)會(huì)是否會(huì)改善、惡化或保持不變。類似于在橫截面上分散化收益風(fēng)險(xiǎn)，投資者可能會(huì)為了未來(lái)的投資機(jī)會(huì)而平滑跨期風(fēng)險(xiǎn)。馬科維茨模型僅研究單期問(wèn)題，因此在研究更貼合實(shí)際的多期投資策略時(shí)顯得捉襟見肘。在研究組合配置問(wèn)題上，傳統(tǒng)的計(jì)量方法主要使用代入估計(jì)。代入估計(jì)指投資者直接對(duì)最優(yōu)組合中的未知參數(shù)進(jìn)行統(tǒng)計(jì)推斷，以單期投資組合選擇問(wèn)題為例，投資者期望效用最大化的解將偏好參數(shù)?、狀態(tài)向量zt、數(shù)據(jù)生成過(guò)程參數(shù)θ映射到最優(yōu)投資組合權(quán)重中：其中，偏好參數(shù)?為事前設(shè)定，狀態(tài)向量zt由觀察得到，根據(jù)Yt≡可以獲得θ的無(wú)偏估計(jì)或者一致估計(jì)，將該估計(jì)代入便可得到最優(yōu)投資組合權(quán)重的估計(jì)。在實(shí)際應(yīng)用中，代入估計(jì)一般而言并不精確，即使是大樣本漸進(jìn)近似也不可靠。由于收益協(xié)方差矩陣會(huì)以二次速度遞增，代入估計(jì)的精確度隨資產(chǎn)數(shù)量N增加而大幅下降。此外，代入估計(jì)還可能出現(xiàn)極端權(quán)重，違背分散化原則并且不具有穩(wěn)定性。因此，對(duì)代入估計(jì)通常需要采用一些優(yōu)化方法，如收縮估計(jì)、使用因子模型、施加投資組合限制等。3.2參數(shù)化投資組合優(yōu)化傳統(tǒng)的投資組合優(yōu)化理論是基于Markowitz（1952）經(jīng)典的均值方差組合模型討論如何利用資產(chǎn)收益率的統(tǒng)計(jì)特征，即均值和方差，來(lái)最優(yōu)化資產(chǎn)配置，其估計(jì)參數(shù)的維度隨資產(chǎn)數(shù)量N的增加以冪函數(shù)的形式增加，在面對(duì)大量資產(chǎn)和有限樣本時(shí)，參數(shù)估計(jì)變得十分困難。文獻(xiàn)中往往使用貝葉斯估計(jì)方法解決這一問(wèn)題，通過(guò)引入先驗(yàn)信息幫助提高參數(shù)估計(jì)精度，但先驗(yàn)信息往往會(huì)包含一定的主觀判斷，使統(tǒng)計(jì)推斷有一定的主觀性。Brandt，Santa-Clara和Valkanov（2009）則通過(guò)直接對(duì)每個(gè)資產(chǎn)的權(quán)重進(jìn)行建模的方式來(lái)達(dá)到參數(shù)降維的目的。資產(chǎn)定價(jià)文獻(xiàn)中，股票收益率的差別往往能被某些重要的特征變量所解釋，因此Brandt，Santa-Clara和Valkanov（2009）將所需優(yōu)化的股票權(quán)重參數(shù)寫成某K個(gè)特征變量的線性函數(shù)，再針對(duì)投資者的期望效用函數(shù)求最大化從而估計(jì)出這K個(gè)參數(shù)。這一方法被稱作參數(shù)化投資組合?？紤]在第t期由Nt只股票構(gòu)成的資產(chǎn)池，每只股票j在該期對(duì)應(yīng)K個(gè)可觀測(cè)的特征變量c1，…，cK，投資者需要在當(dāng)期期末再平衡組合，確定最優(yōu)的股票權(quán)重，即面臨如下關(guān)于下一期組合收益率rp的條件期望最大化問(wèn)題：，t＋1設(shè)投資組合的權(quán)重是特征的函數(shù)：先假設(shè)最簡(jiǎn)單的線性形式即其中為該股票在某基準(zhǔn)組合中的權(quán)重，例如該股票在市場(chǎng)指數(shù)中的市值權(quán)重，θ＝（θ1，…，θK）T是待估計(jì)的參數(shù)，表示投資者進(jìn)行主動(dòng)管理時(shí)投資組合權(quán)重相對(duì)于基準(zhǔn)投資組合權(quán)重偏離的部分。為了使權(quán)重之和為1，需要將所有特征在橫截面上進(jìn)行標(biāo)準(zhǔn)化。投資組合在下一期的收益率可以表示為基準(zhǔn)投資組合收益率與基于特征的投資組合收益率的加權(quán)平均之和，即其中，表示做多第k個(gè)特征取值高的股票、做空第k個(gè)特征取值低的股票所形成的零成本多空對(duì)沖投資組合的收益率。將rp表達(dá)式代入前述條件期望最大化問(wèn)題即可求解θ，進(jìn)一步可以求出投資組合最優(yōu)權(quán)重wt。由于θ不隨時(shí)間變化，所以條件期望效用最大化問(wèn)題等價(jià)于如下無(wú)條件期望效用最大化問(wèn)題，t＋1記μb，為基準(zhǔn)投資組合收益率的期望和方差，μc，Σ為特征投資組合收益率的期望向量和方差矩陣，為的協(xié)方差向量，假設(shè)投資者有均值方差效用，則其中C為與θ無(wú)關(guān)的常數(shù)，，由此最大化期望效用時(shí)令期望效用中二次型部分的一階導(dǎo)數(shù)為0，從而求得最優(yōu)參數(shù)?對(duì)于非均值方差效用的其他效用函數(shù)，不一定可以求出參數(shù)θ估計(jì)的解析解，如果函數(shù)u（rp）連續(xù)可導(dǎo)，則可以由如下K個(gè)矩條件使用GMM解得最優(yōu)的θ：，t＋1?如果u（rp）不可導(dǎo)，則需要通過(guò)插值或者數(shù)值計(jì)算尋找最優(yōu)的θ。由此可見，相比于最初的馬科維茨均值方差模型，參數(shù)化投資組合可以適用于更廣義的效用函數(shù)、考慮更多的投資者特征。，t＋1??檢驗(yàn)θ估計(jì)量是否顯著不為0體現(xiàn)了參數(shù)化投資組合方法得到的投資組合權(quán)重偏離基準(zhǔn)投資組合權(quán)重的程度，可以使用自助法估計(jì)得到θ估計(jì)量的經(jīng)驗(yàn)分布，使用經(jīng)驗(yàn)分布的協(xié)方差矩陣代替總體協(xié)方差矩陣，本書在后續(xù)的實(shí)證分析中統(tǒng)一采用該方法。由上述論述可見，Brandt，Santa-Clara和Valkanov（2009）提出的參數(shù)化投資組合方法的優(yōu)勢(shì)主要包括：（1）對(duì)大量股票構(gòu)建最優(yōu)投資組合更加方便，參數(shù)個(gè)數(shù)不受資產(chǎn)數(shù)量影響，只取決于使用的特征變量的數(shù)量；（2）最優(yōu)投資組合權(quán)重不太容易出現(xiàn)過(guò)擬合，由于參數(shù)的數(shù)量遠(yuǎn)小于資產(chǎn)數(shù)量，并且當(dāng)且僅當(dāng)特征變量對(duì)預(yù)期收益率有穩(wěn)定的解釋作用時(shí)θ顯著不為0，這使得θ的估計(jì)量在時(shí)序上是平穩(wěn)的，只要特征變量沒(méi)有極端值，得到的最優(yōu)投資組合權(quán)重相比馬科維茨模型就不會(huì)非常極端；（3）多因子模型可以看作參數(shù)化投資組合方法得到的多空對(duì)沖組合，如將按公司市值規(guī)模排序，前20%市值最小的股票對(duì)應(yīng)的市值變量值轉(zhuǎn)化為－1，后20%市值最大的股票的市值變量值轉(zhuǎn)化為1，其他股票對(duì)應(yīng)的市值特征變量值設(shè)為0，即構(gòu)造了規(guī)模因子SMB；（4）可以將投資者對(duì)高階矩的偏好反映在特征變量與收益率的聯(lián)合分布中，這一點(diǎn)可以通過(guò)對(duì)E［u（rp）］在rp的均值附近進(jìn)行泰勒公式展開來(lái)證明。，t＋1，t＋13.3最優(yōu)投資組合與隨機(jī)貼現(xiàn)因子等價(jià)性本節(jié)從最大化投資者期望效用出發(fā)，推導(dǎo)隨機(jī)貼現(xiàn)因子的表達(dá)式，并證明文獻(xiàn)中利用若干個(gè)定價(jià)因子表示隨機(jī)貼現(xiàn)因子本質(zhì)上與求解最大化期望效用問(wèn)題等價(jià)。這意味著在利用參數(shù)化投資組合方法進(jìn)行組合優(yōu)化時(shí)，同時(shí)也是基于所用到的特征變量信息構(gòu)建隨機(jī)貼現(xiàn)因子，從而將均值方差有效前沿、隨機(jī)貼現(xiàn)因子和多因子模型統(tǒng)一起來(lái)。條件期望效用最大化問(wèn)題關(guān)于θ的一階矩條件為?令Mt＝u′（rb＋θTrc），則有Et［Mtrc］＝0，即定義了隨機(jī)貼現(xiàn)因子。當(dāng)滿足前述一階矩條件時(shí)，參數(shù)取值最優(yōu)，即θ＝θ，對(duì)u′（·）在0附近進(jìn)行泰勒展開＋1，t＋1，t＋1＋1，t＋1?T其中rp＝rb＋θrc為最優(yōu)投資組合的收益，假設(shè)Mt有線性結(jié)構(gòu)，忽略高階項(xiàng)，由于Et［Mtrc］＝0，所以對(duì)Mt進(jìn)行縮放調(diào)整，即得到隨機(jī)貼現(xiàn)因子的結(jié)構(gòu)。，t＋1，t＋1，t＋1＋1＋1，t＋1＋1定理1：假設(shè)投資者的效用函數(shù)為u（·）且二階連續(xù)可微，則t＋1期隨機(jī)貼現(xiàn)因子為如果投資者風(fēng)險(xiǎn)厭惡系數(shù)為γ，則投資者有均值方差效用和CRRA效用時(shí)隨機(jī)貼現(xiàn)因子結(jié)構(gòu)分別為證明：（1）投資者有均值方差效用且風(fēng)險(xiǎn)厭惡系數(shù)為γ時(shí)，條件期望效用最大化問(wèn)題為由此可見，對(duì)于均值方差效用函數(shù)，Et（rp）］2，進(jìn)而u′（rp）＝1－γ［rp－Et（rp）］，u″（rp）＝－γ，將u′（0）和u″（0）代入Mt表達(dá)式即得。，t＋1，t＋1，t＋1，t＋1，t＋1＋1（2）投資者有CRRA效用且風(fēng)險(xiǎn)厭惡系數(shù)為γ時(shí)，條件期望效用最大化問(wèn)題為則將u′（0）和u″（0）代入Mt表達(dá)式即得。＋1Hansen和Richard（1987）證明了真實(shí)的隨機(jī)貼現(xiàn)因子與均值方差前沿的等價(jià)性，即存在線性隨機(jī)貼現(xiàn)因子滿足Mt＝a＋bRMV，其中RMV為均值方差前沿上的組合收益率，而前文得到的隨機(jī)貼現(xiàn)因子有類似的線性形式Mt＝α＋βrp，所以最優(yōu)組合rp的夏普比率越高，rp離真實(shí)的均值方差前沿越近，基于式（3-19）估計(jì)的隨機(jī)貼現(xiàn)因子與真實(shí)的隨機(jī)貼現(xiàn)因子距離也越小，其定價(jià)能力也越強(qiáng)，因此對(duì)投資組合收益的條件期望效用進(jìn)行優(yōu)化，等價(jià)于逼近真實(shí)的隨機(jī)貼現(xiàn)因子。＋1＋1，t＋1，t＋1，t＋1用參數(shù)化投資組合方法求解投資者效用函數(shù)最大化的問(wèn)題與尋找隨機(jī)貼現(xiàn)因子是等價(jià)的，即推導(dǎo)式（3-17）所估計(jì)的SDFMt＝u′（rb＋θTrc）與多因子模型的關(guān)系。根據(jù)Hansen和Jagannathan（1991），可找到如下形式的隨機(jī)貼現(xiàn)因子：＋1，t＋1，t＋1其中，rt為N×1維股票超額收益向量，bt為描述股票“風(fēng)險(xiǎn)價(jià)格”的N×1維系數(shù)向量，通常使用一系列特征將bt參數(shù)化（Kozak，Nagel，andSantosh，2020；Haddad，Kozak，andSantosh，2020），如＋1其中Zt為N×K維特征變量矩陣，δt為刻畫了不同特征變量隨時(shí)間變化的重要程度的K×1維時(shí)間序列向量。將bt代入Mt得＋1其中為基于K個(gè)特征所構(gòu)建的K個(gè)投資組合的收益率，即多因子模型中的“定價(jià)因子”。定理2：不失一般性\h[1]，假設(shè)投資者有風(fēng)險(xiǎn)厭惡系數(shù)為γ的均值方差效用函數(shù)，面臨優(yōu)化問(wèn)題給定t＋1期的隨機(jī)貼現(xiàn)因子結(jié)構(gòu)為式（3-26）的形式E（ft）］，則有＋1其中Nt表示第t期截面上的股票數(shù)，St為N×1維的市值權(quán)重向量。證明：對(duì)于均值方差效用函數(shù)，前文已證Et（rp）］2，進(jìn)而，t＋1其中代入式（3-29）得令如果給定多因子模型中的定價(jià)因子ft，則求解最優(yōu)組合配置問(wèn)題＋1等價(jià)于求解δt，δt刻畫了定價(jià)因子在隨機(jī)貼現(xiàn)因子結(jié)構(gòu)中的重要性，因?yàn)榭赡茈S時(shí)間變化，所以也被稱作“因子擇時(shí)”（Haddad，Kozak，andSantosh，2020）。鑒于隨機(jī)貼現(xiàn)因子同均值方差有效前沿以及多因子模型的等價(jià)性，在金融學(xué)文獻(xiàn)中，隨機(jī)貼現(xiàn)因子通?？梢员硎境删捣讲钋把亟M合或定價(jià)因子的線性結(jié)構(gòu)，而定理1與定理2則分別針對(duì)這兩種情形給出了對(duì)應(yīng)的具體形式，實(shí)現(xiàn)了將均值方差有效前沿、隨機(jī)貼現(xiàn)因子、多因子模型有機(jī)統(tǒng)一。\h[1]對(duì)于其他效用函數(shù)形式，可以將式（3-19）標(biāo)準(zhǔn)化為Mt＝1－［－u″（0）］／［1＋u″（0）Et（rp）］［rp－Et（rp）］，將系數(shù)［－u″（0）］／［1＋u″（0）Et（rp）］替換為γ，之后的證明過(guò)程相同。＋1，t＋1，t＋1，t＋1，t＋13.4基于收縮估計(jì)方法的投資組合優(yōu)化基于正則化回歸的收縮估計(jì)法在其他更具一般性的效用函數(shù)，例如CRRA效用函數(shù)等情形下直接適用，原因在于此類效用函數(shù)無(wú)法直接轉(zhuǎn)化為最小化某種二次型函數(shù)的形式。我們將在本章介紹全子集組合法，該方法可以適用于任意給定函數(shù)形式的效用，并給出其在CRRA效用函數(shù)情形下的應(yīng)用。參數(shù)化投資組合方法向投資組合優(yōu)化問(wèn)題引入了大量特征變量的信息，這導(dǎo)致了如何利用大量特征變量蘊(yùn)含的預(yù)期收益率信息進(jìn)行組合優(yōu)化，并且能確保提供準(zhǔn)確的估計(jì)等問(wèn)題。高維的解釋變量數(shù)據(jù)會(huì)導(dǎo)致“維度災(zāi)難”，估計(jì)大量參數(shù)會(huì)出現(xiàn)過(guò)擬合問(wèn)題，而通過(guò)收縮估計(jì)法進(jìn)行降維有助于這些問(wèn)題的解決，典型的收縮估計(jì)降維方法包括LASSO、自適應(yīng)LASSO、非參數(shù)組LASSO、彈性網(wǎng)絡(luò)、主成分分析等。本節(jié)首先介紹基于收縮估計(jì)的降維方法，為了使這些基于回歸的降維方法可以直接適用于參數(shù)化投資組合問(wèn)題，我們首先假設(shè)投資者具有均值方差效用函數(shù)由此可見，最大化該均值方差期望效用函數(shù)等價(jià)于最小化上式中的二次型部分，?進(jìn)而求解得出最優(yōu)參數(shù)θ（一）LASSO與自適應(yīng)LASSO?LASSO（Tibshirani，1996）回歸方法本質(zhì)上是線性模型的L1范數(shù)正則化方法，即在線性回歸外構(gòu)造懲罰函數(shù)將部分變量回歸系數(shù)壓縮為0，從而達(dá)到變量選擇的目的。然而，Zou（2006）發(fā)現(xiàn)，傳統(tǒng)的LASSO方法僅在滿足一定條件時(shí)才具有統(tǒng)計(jì)一致性，即使在大樣本下也不能以概率1選出真實(shí)的模型，因此他改進(jìn)并提出了自適應(yīng)LASSO回歸法（adaptiveLASSO），即在約束函數(shù)中對(duì)每個(gè)變量添加適當(dāng)權(quán)重。LASSO與自適應(yīng)LASSO的最優(yōu)參數(shù)θ分別為其中，為θ的L1范數(shù)。估計(jì)自適應(yīng)LASSO估計(jì)量θAd-LASSO時(shí)，第一步先由普通的LASSO估計(jì)得到估計(jì)量θs，第二步將自適應(yīng)LASSO回歸的權(quán)重設(shè)置為（二）非參數(shù)組LASSO考慮到投資組合權(quán)重與特征之間的非線性關(guān)系，可以使用非參數(shù)組LASSO方法求解最優(yōu)參數(shù)（Freyberger，Neuhierl，andWeber，2020；Chen，Wu，andZhu，2022）。使用“秩變換”方法，將第s個(gè)特征變量cs（s＝1，…，K）的值轉(zhuǎn)換為截面上的分位數(shù)，歸一化到區(qū)間（0，1）上，即變量，將的支撐劃分為L(zhǎng)個(gè)區(qū)間0＝t0＜t1＜…＜tL＜tL＝1，基于二次樣條pm（cs），m＝1，…，L＋2的樣條增廣特征變量組合－1rcsm，t＋1為其中，p1（c）＝1，p2（c）＝c，p3（c）＝c2，pm（c）＝max（c－tm，0）2，m＝4，5，…，L＋2。用分別表示的（L＋2）K維均值向量和（L＋2）K×（L＋2）K維協(xié)方差矩陣，Λnp表示與基準(zhǔn)收益rb的（L＋2）K維協(xié)方差向量。相應(yīng)的投資組合參數(shù)θs可以通過(guò)如下的組LASSO方法估計(jì)得到－3，t＋1，m（三）彈性網(wǎng)絡(luò)?嶺回歸與LASSO回歸類似，將LASSO回歸使用的L1懲罰項(xiàng)改為L(zhǎng)2懲罰項(xiàng)即為嶺回歸。雖然嶺回歸使用的L2懲罰項(xiàng)不能篩選變量，但是它可以令大部分回歸系數(shù)向0收縮，使得預(yù)測(cè)結(jié)果不會(huì)因?yàn)閿?shù)據(jù)的細(xì)微變化而變動(dòng)太大，一定程度上減少了過(guò)擬合的風(fēng)險(xiǎn)。由于LASSO回歸與嶺回歸各有優(yōu)勢(shì)，Zou和Hastie（2005）提出了彈性網(wǎng)絡(luò)（elasticnet）回歸，加入加權(quán)組合的L1與L2懲罰項(xiàng)，既能一定程度地實(shí)現(xiàn)預(yù)測(cè)變量的稀疏化，又能盡量壓縮剩余變量的系數(shù)，以保持模型解釋能力的穩(wěn)定性。彈性網(wǎng)絡(luò)的最優(yōu)參數(shù)θ為（四）主成分分析主成分分析是一種信息聚合方法，從大量特征變量中提取出兩兩正交的主成分，將能夠盡可能多地解釋原始數(shù)據(jù)方差的前幾個(gè)主成分加入模型，最大程度地保留原始數(shù)據(jù)攜帶的信息的同時(shí)對(duì)原始數(shù)據(jù)進(jìn)行降維。記K維特征變量投資組合收益向量，其中，對(duì)rc的協(xié)方差矩陣進(jìn)行特征分解Σ＝QDQT，其中Q＝（q1，…，qK）為特征變量排列成的正交矩陣，對(duì)rc進(jìn)行線性變換得到主成分rpc＝QTrc，均值E[rpc]＝QTμc，協(xié)方差矩陣Var[rpc]＝QTΣQ＝D，主成分rpc與基準(zhǔn)投資組合rb的協(xié)方差向量為cov（rpc，rb）＝QTΛ。這樣我們可以使用主成分來(lái)替換原有的特征變量，并直接通過(guò)OLS回歸求解最優(yōu)參數(shù)化投資組合，這類使用主成分作為解釋變量的回歸方法也被稱為主成分回歸法。，t＋1，t＋1，t＋1，t＋1，t＋1，t＋1，t＋1，t＋1，t＋1，t＋1不妨假設(shè)前k個(gè)主成分已經(jīng)提取了足夠的信息，僅使用前k個(gè)主成分Qk＝（q1，…，qk）構(gòu)造權(quán)重函數(shù)，替代原有的特征變量求解最優(yōu)參數(shù)化投資組合，進(jìn)而得出最優(yōu)參數(shù)θPCLettau和Pelger（2020a，2020b）指出，主成分分析只能提取收益率中被共同因子解釋的部分，而忽略了風(fēng)險(xiǎn)溢價(jià)本身所隱含的因子結(jié)構(gòu)層面的信息，即在潛在定價(jià)錯(cuò)誤上的風(fēng)險(xiǎn)暴露。因此他們提出了RP-PCA估計(jì)量，以同時(shí)捕捉共同解釋部分與定價(jià)錯(cuò)誤，其本質(zhì)是在對(duì)協(xié)方差矩陣提取主成分時(shí)加入包含收益率一階矩信息的懲罰項(xiàng)，即考慮風(fēng)險(xiǎn)溢價(jià)的影響。記，其中為rc在時(shí)間序列上的均值，δ為平衡殘差與錯(cuò)誤定價(jià)相對(duì)重要性的超參數(shù)。通過(guò)特征值分解ΣRP＝QRPTDRPQRP，將基于ΣRP主成分所得到的最優(yōu)參數(shù)θ記為θRP-PCA。，t＋13.5神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)是一種能夠靈活描述非線性函數(shù)關(guān)系的復(fù)雜模型。假設(shè)最優(yōu)權(quán)重滿足wi＝f（xi，θ），這里是f（·）關(guān)于θ的未知函數(shù)。定義損失函數(shù)為，t，t對(duì)每一只股票，輸入公司特征變量的集合，神經(jīng)網(wǎng)絡(luò)通過(guò)多層隱藏層輸出最優(yōu)權(quán)重，這樣我們就獲得了所有股票的權(quán)重?；谝陨虾瘮?shù)，優(yōu)化算法，如小批量梯度下降法，可以用來(lái)調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)中的參數(shù)。重復(fù)以上步驟并迭代，直到損失函數(shù)不再下降。參考Gu，Kelly和Xiu（2020），我們采用了正則化、提前中止迭代和暫退法等方法以避免過(guò)擬合。我們通過(guò)幾何金字塔原則選擇層結(jié)構(gòu)，并選擇線性整流函數(shù)（ReLU）作為激活函數(shù)。為了提高優(yōu)化速度，我們以年劃分訓(xùn)練窗口，并在每次迭代中使用12個(gè)月的數(shù)據(jù)計(jì)算損失函數(shù)。通過(guò)最大化每一年的效用，我們可以最大化整個(gè)訓(xùn)練期間的效用。3.6基于全子集回歸的組合優(yōu)化全子集組合法（CSC）也可以被視作一種收縮估計(jì)方法。全子集組合法先聚合所有特征變量所蘊(yùn)含的預(yù)測(cè)信息，再進(jìn)行一定比例的壓縮，也可以用于緩解特征變量高維導(dǎo)致的過(guò)擬合等問(wèn)題。仍然考慮均值方差效用函數(shù)下的參數(shù)化投資組合優(yōu)化問(wèn)題此時(shí)最優(yōu)參數(shù)，??該表達(dá)式也可以寫為θ＝，即被視為K維的特征投資組合預(yù)期收益向量μc／r（經(jīng)特征變量組合與基準(zhǔn)組合的協(xié)方差向量Λ調(diào)整后）回歸于特征投資組合收益協(xié)方差矩陣Σ所得到的回歸系數(shù)。可見上述最大化期望效用問(wèn)題等價(jià)于線性回歸問(wèn)題。K很大時(shí)Σ可能是奇異矩陣，進(jìn)而會(huì)導(dǎo)致對(duì)θ估計(jì)的精準(zhǔn)度下降以及出現(xiàn)極端值，使最優(yōu)投資組合在樣本外表現(xiàn)不穩(wěn)定。Elliott，Gargano和Timmermann（2013）基于Timmermann（2006）的組合預(yù)測(cè)方法提出了全子集回歸法，每次回歸選擇k＜K個(gè)特征構(gòu)成的“變量子集”作為解釋變量進(jìn)行回歸，遍歷所有子集組合后對(duì)所有回歸的系數(shù)取均值作為最終的結(jié)果。設(shè)y，X分別是T維向量和T×K維矩陣，Si為K×K維選擇矩陣，其中i列與單位陣相同，其余K－i列為0向量，估計(jì)回歸y＝Xβ＋ε，傳統(tǒng)OLS回歸估計(jì)量為，而全子集回歸方法的估計(jì)量為其中，為組合數(shù)，表示從K個(gè)元素中選擇k個(gè)元素的組合方式數(shù)量。下面將CSC方法應(yīng)用于參數(shù)化投資組合最優(yōu)化問(wèn)題，假設(shè)投資者每次使用k（k＜K）個(gè)特征對(duì)投資組合權(quán)重進(jìn)行建模，則

人人文庫(kù)> 全部分類> 應(yīng)用文書 > 工作計(jì)劃

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

資產(chǎn)定價(jià)與機(jī)器學(xué)習(xí)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

資產(chǎn)定價(jià)與機(jī)器學(xué)習(xí)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔