圖譜系列17:行業(yè)重構(gòu)與重構(gòu)應(yīng)用_第1頁(yè)
圖譜系列17:行業(yè)重構(gòu)與重構(gòu)應(yīng)用_第2頁(yè)
圖譜系列17:行業(yè)重構(gòu)與重構(gòu)應(yīng)用_第3頁(yè)
圖譜系列17:行業(yè)重構(gòu)與重構(gòu)應(yīng)用_第4頁(yè)
圖譜系列17:行業(yè)重構(gòu)與重構(gòu)應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩46頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

定量研究專題報(bào)告定量研究專題報(bào)告zhengzhaolei@xyzq.c報(bào)告關(guān)鍵點(diǎn)在進(jìn)行自下而上的行業(yè)重構(gòu)子以及權(quán)重優(yōu)化等應(yīng)用場(chǎng)景《股票動(dòng)態(tài)分組視角下的因《基于產(chǎn)業(yè)鏈的行業(yè)重構(gòu)研 問題與難點(diǎn):目前,常見的投資型行業(yè)分類存在著時(shí)效性較低和單一性問題。在進(jìn)行自下而上的行業(yè)重構(gòu)研究時(shí),研究者往往會(huì)遇到三大難點(diǎn):1)多樣性:?jiǎn)我坏男袠I(yè)映射缺點(diǎn)愈發(fā)嚴(yán)重,該如何給出連續(xù)型的行業(yè)分類;2)可認(rèn)知性:聚完類之后的行業(yè)該如何認(rèn)知,每一個(gè)行業(yè)到底代表什么;3)應(yīng)用性:若能構(gòu)建出滿足多樣性的連續(xù)型分類,重構(gòu)完之后應(yīng)當(dāng)如何應(yīng)用。解決方案:本文中,我們基于專利和產(chǎn)品布局?jǐn)?shù)據(jù),引入L-LDA主題模型進(jìn)行行業(yè)重構(gòu)。L-LDA主題模型是一個(gè)以關(guān)鍵詞為約束、以詞袋為輸入數(shù)據(jù)的半監(jiān)督聚類模型,其輸出數(shù)據(jù)具有多概率分布的特征。在實(shí)際建模中,我們引入專利分類數(shù)據(jù)構(gòu)建公司的特征詞袋,以標(biāo)準(zhǔn)化產(chǎn)品名稱作為關(guān)鍵詞進(jìn)行聚類,將公司根據(jù)其自身特征分配至產(chǎn)品標(biāo)簽中,也就是最終的行業(yè)類別。效果認(rèn)知:經(jīng)過L-LDA主題模型聚類后,產(chǎn)品標(biāo)簽便是新的行業(yè)分類名稱,同時(shí)結(jié)果也包含了每個(gè)特征詞(專利)對(duì)行業(yè)的貢獻(xiàn)度,可認(rèn)知性極強(qiáng)。此外,在截面上看,我們實(shí)現(xiàn)了公司與行業(yè)之間“一對(duì)對(duì)應(yīng)行業(yè)的分布概率;在時(shí)序上看,公司自身特征不斷變化,行業(yè)分布概率也不斷變化。分類結(jié)果同時(shí)具備了多樣性和連續(xù)性。應(yīng)用嘗試:我們擇機(jī)將重構(gòu)結(jié)果應(yīng)用到指數(shù)增強(qiáng)、行業(yè)輪動(dòng)、相似股因子以及權(quán)重優(yōu)化等應(yīng)用場(chǎng)景進(jìn)行測(cè)試。1)指數(shù)策略年化超額達(dá)到11.54%,且大部分年份比之前模型優(yōu)異(尤其是近些年2)行業(yè)輪動(dòng)方面:模型2015年底以來(lái)年化收益率為17.69%,同期中信行業(yè)輪動(dòng)為3.72%,基準(zhǔn)為-0.99%。模型的收益波動(dòng)比為0.95,月度勝率為64.6%,同樣明顯優(yōu)于基準(zhǔn)。核心圖表:行業(yè)重構(gòu)應(yīng)用結(jié)果展示-行業(yè)輪動(dòng)與指數(shù)增強(qiáng)請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明 請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明 表6、寧德時(shí)代(300750)2022年年報(bào)和 請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明近年來(lái)基于圖譜的研究深受市場(chǎng)重視。在該領(lǐng)域,我們也耕筆不輟,團(tuán)隊(duì)共略化尋找隱匿的專精特新“小巨人”化會(huì)化化二請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明行業(yè)分類標(biāo)準(zhǔn)。相對(duì)于前者,后者主要為投資分析、業(yè)績(jī)?cè)u(píng)價(jià)、資產(chǎn)配置或指數(shù)跟蹤基金服務(wù)。其設(shè)計(jì)的初衷是滿足金融機(jī)構(gòu)對(duì)準(zhǔn)確、完全、標(biāo)準(zhǔn)的行業(yè)定義的整速度往往較慢,并且分類下公司業(yè)務(wù)并不相近。比如國(guó)內(nèi)的新能源行3.行業(yè)分類同樣存在部分公司業(yè)務(wù)不一致:即便在同一行業(yè)分類中,不同級(jí)行業(yè))的招商蛇口(001979)與海南機(jī)場(chǎng)(600515),其主營(yíng)業(yè)務(wù)也不盡相同:招商蛇口作為城市綜合開發(fā)運(yùn)營(yíng)板塊的旗艦企業(yè),核心業(yè)務(wù)為社區(qū)與園區(qū)的開發(fā)與運(yùn)營(yíng);而海南機(jī)場(chǎng)則以機(jī)場(chǎng)作為主業(yè),并通過場(chǎng)地租賃收取租金+提貨點(diǎn)收取費(fèi)用+參股投資的方式參與免稅業(yè)務(wù)。更新和修正,其分類的時(shí)效性較差。此外,目前的行業(yè)分類大多以“一對(duì)一”的形力于新的行業(yè)分類標(biāo)準(zhǔn)的構(gòu)建,即行業(yè)重構(gòu)系列研究。上文可得,傳統(tǒng)的行業(yè)分類體系存在一定的缺陷。為此,國(guó)內(nèi)外已有多位學(xué)者及多家機(jī)構(gòu)針對(duì)行業(yè)重新分類進(jìn)行了深入研究,并采用定量方法進(jìn)行分組。如請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明以已有的行業(yè)分類標(biāo)準(zhǔn)為基礎(chǔ),根據(jù)基于行業(yè)基本面數(shù)據(jù)構(gòu)建指標(biāo),對(duì)行業(yè)進(jìn)行重新劃分或動(dòng)態(tài)更新從個(gè)股出發(fā),采用企業(yè)基本面數(shù)據(jù)構(gòu)建指標(biāo),對(duì)個(gè)股進(jìn)行動(dòng)態(tài)聚類或構(gòu)建可比公司以已有的行業(yè)分類標(biāo)準(zhǔn)為基礎(chǔ),根據(jù)基于行業(yè)技術(shù)面特征構(gòu)建指標(biāo),對(duì)行業(yè)進(jìn)行重新劃分或動(dòng)態(tài)更新從個(gè)股出發(fā),根據(jù)個(gè)股技術(shù)面特征構(gòu)建指標(biāo),對(duì)個(gè)股進(jìn)行動(dòng)態(tài)聚類或構(gòu)建可比公司入數(shù)據(jù),從純定量的角度刻畫個(gè)股之間的相關(guān)性,進(jìn)而完成行業(yè)重構(gòu)。在這類方完成了基于公司產(chǎn)品布局的行業(yè)重構(gòu)研究。該模型同樣解決了現(xiàn)有行業(yè)分類中的引入公司與行業(yè)間的“一對(duì)多”關(guān)系。表3、興證金工團(tuán)隊(duì)現(xiàn)有行業(yè)重構(gòu)研究回顧股票動(dòng)態(tài)分組視角下的因子那么本文聚焦什么問題呢?結(jié)合之前的研究成果和經(jīng)驗(yàn)教訓(xùn),本次行業(yè)重構(gòu)請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明下而上的體系下)。但聚完類之后的行業(yè)該如何認(rèn)知,每一題,除了通常意義的類內(nèi)類間相關(guān)性(當(dāng)然這建立在互斥的行業(yè)分類2、主題模型、另類數(shù)據(jù)與多行業(yè)重構(gòu)的實(shí)現(xiàn)題模型來(lái)嘗試構(gòu)建多分類的行業(yè)模型。在實(shí)操層面,我們需要解決模型選擇、輸方式對(duì)文集的隱含語(yǔ)義結(jié)構(gòu)進(jìn)行聚類的統(tǒng)計(jì)模型。主題模型在常規(guī)的應(yīng)用場(chǎng)景中配主題。該模型的基本原理是:假設(shè)每個(gè)文檔都是由多個(gè)主題組成,并且每個(gè)主模型,針對(duì)的是普通文本建模。但在實(shí)際中,每篇文檔會(huì)包含部分增量?jī)?nèi)請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明作者認(rèn)為主題模型可以使用關(guān)鍵詞來(lái)約束摘要的最終分類主題,以解決主題意義概率分布、每個(gè)文本的條件概率分布等表達(dá)式,再進(jìn)一步通過近似求解算法(如在下圖中,我們以三個(gè)樣本的輸入數(shù)據(jù)作為展示。該樣例中共有三個(gè)樣本,以每個(gè)上市公司作為樣本,通過L-LDA模型對(duì)其進(jìn)行聚類,得到每個(gè)公司屬于請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明在主題模型中,輸入數(shù)據(jù)的質(zhì)量有舉足若輕的地位。在基于上市公司信息的紹、新聞等。這類數(shù)據(jù)需要經(jīng)過文本處理才能使用,包括語(yǔ)料清洗、分詞等,甚至需要人工預(yù)處理等。文本數(shù)據(jù)的低信噪比導(dǎo)致這類模型在實(shí)際運(yùn)用中容易遇到數(shù)據(jù)可得性較差、上手難度較高、數(shù)據(jù)質(zhì)量較差等問題。本文中,我們將拋開傳統(tǒng)的文本數(shù)據(jù)刻畫詞頻的方式,而是直接使用特征以及特征次數(shù)作為詞袋對(duì)公司專利數(shù)據(jù)是公司特征的重要信息之一,其獲得的專利分布能夠一專利文獻(xiàn)分類和檢索工具。國(guó)際專利分類系統(tǒng)按照技術(shù)主題設(shè)立類目,把整個(gè)技ABCDEF化學(xué)、冶金G作業(yè)、運(yùn)輸個(gè)公司專利屬性映射到不同的維度。請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明的專利屬于基本電氣元件、測(cè)量;測(cè)試和無(wú)機(jī)化學(xué)。473410473在本文中,我們創(chuàng)新性地將專利數(shù)據(jù)作為該公司的特征數(shù)據(jù)(與主題模型中將文本作為該段落的特征一致基于專利的分類數(shù)據(jù)構(gòu)建能夠用于分類的詞頻輸入數(shù)據(jù),進(jìn)而避免文本數(shù)據(jù)清洗中遇到的各類問題。以該公司的前三個(gè)專利分類為例,我們將該公司的特征詞頻設(shè)置為:請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明得授權(quán)的對(duì)應(yīng)專利數(shù)目作為詞頻構(gòu)建公司的詞袋,也就是該公司的特征數(shù)據(jù)。將其擴(kuò)展到全市場(chǎng)所有股票和所有二級(jí)專利分類的實(shí)際使用場(chǎng)景下,我們將每個(gè)公中時(shí),該公司在這個(gè)分類上的詞頻較高。對(duì)于全市場(chǎng)而言,如果兩個(gè)公司的詞袋統(tǒng)的文本處理下構(gòu)建特征詞袋相比,兩者的最終目的都是構(gòu)造出能夠代表公司特征的特征詞以及對(duì)應(yīng)的詞頻,并且各個(gè)特征詞之間的意義有所差異,同時(shí)出現(xiàn)次數(shù)越多的詞越能代表這個(gè)公司的特征。然而,基于專利分類的方式先天地避免了對(duì)重要程度,其在數(shù)據(jù)意義上與最終的主題模型輸入數(shù)據(jù)一致。2.2.2、產(chǎn)品布局?jǐn)?shù)據(jù)與標(biāo)簽數(shù)據(jù)構(gòu)建在確定好各個(gè)公司的特征詞袋之后,我們下一步確定各個(gè)公司的標(biāo)簽,也就(半年報(bào)與年報(bào))進(jìn)行標(biāo)準(zhǔn)化與本地化處理,將公司財(cái)報(bào)上數(shù)以萬(wàn)計(jì)的產(chǎn)品標(biāo)準(zhǔn)產(chǎn)品半導(dǎo)體集成電路(SE002019)及其父層級(jí)的名稱和定層級(jí)主要指半導(dǎo)體產(chǎn)品的制造商及半導(dǎo)體設(shè)備1包括了半導(dǎo)體組件產(chǎn)品、太陽(yáng)能產(chǎn)品以及2半導(dǎo)體器件分為半導(dǎo)體集成電路和半導(dǎo)體3將有源元件和無(wú)源元件,按照一定的電路4現(xiàn)該公司在電氣設(shè)備、電子元件、以及其他金屬與采礦上均有收入。請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明表6、寧德時(shí)代(300750)2022年年報(bào)和半年報(bào)產(chǎn)品營(yíng)收明細(xì)對(duì)應(yīng)數(shù)庫(kù)標(biāo)準(zhǔn)化產(chǎn)品標(biāo)準(zhǔn)產(chǎn)品對(duì)應(yīng)數(shù)庫(kù)二級(jí)產(chǎn)品報(bào)鋰離子電池材料由此,對(duì)于每個(gè)公司而言,我們均能得到其對(duì)應(yīng)的標(biāo)同時(shí)各個(gè)公司可以屬于多個(gè)行業(yè)。對(duì)于標(biāo)準(zhǔn)化產(chǎn)品而言,其本質(zhì)上類似于更為細(xì)化的行業(yè)分類,同時(shí)每個(gè)公司在此體系下可以有多個(gè)行業(yè)標(biāo)簽。需要注意的是,報(bào)信息作為基礎(chǔ)數(shù)據(jù),構(gòu)建公司的主營(yíng)產(chǎn)品標(biāo)簽。以上文中的寧公司在數(shù)庫(kù)一級(jí)產(chǎn)品上共有三個(gè)對(duì)應(yīng)的行業(yè)標(biāo)簽,我們將其的標(biāo)簽輸入數(shù)據(jù)設(shè)置在上述例子中,我們將單個(gè)公司過去一年內(nèi)所有營(yíng)收非零的一級(jí)標(biāo)準(zhǔn)化產(chǎn)品能被分類至其對(duì)應(yīng)的輸入標(biāo)簽中。對(duì)于單個(gè)公司而言,若其本身僅在一個(gè)標(biāo)準(zhǔn)化個(gè)公司最新一期的年報(bào)和半年報(bào)數(shù)據(jù)得到營(yíng)收非零的一級(jí)主營(yíng)產(chǎn)品,并剔除全局出現(xiàn)次數(shù)過少的主營(yíng)產(chǎn)品,以此完成數(shù)據(jù)清洗;請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明據(jù)以及過去披露的最新年報(bào)和半年報(bào)數(shù)據(jù),我們構(gòu)建各個(gè)公司詞袋和標(biāo)簽數(shù)據(jù),匯總記為特征詞袋DT和標(biāo)簽集合LabelT;3.模型訓(xùn)練:在T月末,基于構(gòu)建好的特征詞袋DT和標(biāo)簽集合LabelT,我們引入L-LDA主題模型,以標(biāo)簽集合LabelT作為標(biāo)簽,以特征詞袋各個(gè)行業(yè)上對(duì)應(yīng)的概率,記為原始行業(yè)重構(gòu)結(jié)果。在主題模型中,由于樣本最終會(huì)根據(jù)初始產(chǎn)品標(biāo)簽進(jìn)行概率分配,容易出現(xiàn)的概率不僅在可認(rèn)知性上意義較小,同時(shí)也在應(yīng)用層面增加了不少難度和噪音1。40%30%20%—上文中,我們介紹了基于主題模型的行業(yè)重構(gòu)模型,包括模型介紹、輸入數(shù)請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明公司在行業(yè)上對(duì)應(yīng)的概率。在截面上看,我們實(shí)現(xiàn)了公司與行業(yè)之間“一對(duì)多”的3.1、輸出結(jié)果整體統(tǒng)計(jì)70%—少公司為多行業(yè)公司。前文提及,我們的模型能夠?qū)崿F(xiàn)“一對(duì)多”的關(guān)系:即各個(gè)(即重構(gòu)后的多行業(yè)公司)占多主營(yíng)公司比值。統(tǒng)計(jì)結(jié)果展示如下:首先是多主營(yíng)公司的統(tǒng)計(jì):全市場(chǎng)中多主營(yíng)的公司個(gè)數(shù)占比均較高,整體占主營(yíng)分化現(xiàn)象逐步提升,多行業(yè)的行業(yè)重構(gòu)的重要性也日益提升。其次是模型得請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明司,而是將其根據(jù)特征數(shù)據(jù)進(jìn)行再分配,將交通基本設(shè)施等。我們首先統(tǒng)計(jì)每個(gè)行業(yè)中涉及到的公司個(gè)數(shù)。具體來(lái)說(shuō),我們?cè)撔袠I(yè)股票個(gè)數(shù)對(duì)應(yīng)行業(yè)涉及到的公司個(gè)數(shù)的比值。我們?cè)谙聢D中展示了行業(yè)涉及到的公司個(gè)數(shù)較大的部分行業(yè)。從結(jié)果上看,絕大多數(shù)行業(yè)內(nèi)的股票并非完全涉及股票個(gè)數(shù)最高的行業(yè)分別是工業(yè)機(jī)械、電子制造和商品化工,對(duì)應(yīng)的比值為請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明400200070%60%50%40%30%20%0%得到該行業(yè)的相關(guān)詞貢獻(xiàn)度,也就是:具備哪些專利分類的公司能有可能會(huì)被分獻(xiàn)度為32.3%。這表明:若一個(gè)公司本身在工業(yè)機(jī)械行業(yè)上有營(yíng)收,同時(shí)其專利分布在這三者上的占比較高,其更有可能在工業(yè)機(jī)械行業(yè)上獲得更大的概率。整體來(lái)看,工業(yè)機(jī)械中貢獻(xiàn)度較高的專利均為邏輯上相關(guān)的專利分類,整體分類的2.3%2.5%2.3%3.6%3.9%4.3%5.7%6.9%請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明輪動(dòng)等維度應(yīng)用到行業(yè)概念。在本章中,我們擇機(jī)將重構(gòu)結(jié)果應(yīng)用到組合優(yōu)化、行業(yè)輪動(dòng)、相似股因子以及權(quán)重優(yōu)化等應(yīng)用場(chǎng)景進(jìn)行樣本外表現(xiàn)優(yōu)異。請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明從測(cè)試結(jié)果來(lái)看,引入新的行業(yè)分類做的滬深300增強(qiáng)策略年化超額高達(dá)改善,即便分年度來(lái)看,在絕大部分年份都能穩(wěn)定的戰(zhàn)勝之前的模型。尤其是近些年增強(qiáng)難度加大的情況下,新模型愈發(fā)有效,這也契合公司經(jīng)營(yíng)業(yè)務(wù)多元化越年化收益年化波動(dòng)風(fēng)險(xiǎn)收益比最大回撤基準(zhǔn)老策略多頭老策略超額新策略多頭新策略超額2015年2016年2017年2018年2019年2020年2021年2022年2023年2024年請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明2.502.000.50-2.000.50-——在眾多行業(yè)輪動(dòng)模型中,基于個(gè)股打分的行業(yè)輪動(dòng)模型是最為常見的模型之一。以此前我們興證金工團(tuán)隊(duì)在推出的三因子行業(yè)輪動(dòng)策略為例(報(bào)告《基于盈加權(quán)平均或整體法的方式構(gòu)建出中信一級(jí)行業(yè)層面的三因子打分情況,再在每月并選取排名最高的五個(gè)行業(yè)構(gòu)建等權(quán)組合。此類模型的好處在于:可以將個(gè)股打分通過復(fù)合方請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明我們以同一復(fù)合因子構(gòu)建中信一級(jí)行業(yè)輪動(dòng)模型、團(tuán)隊(duì)原有的行業(yè)輪動(dòng)模輪動(dòng)為3.72%。兩種新策略的收益波動(dòng)比和收益回撤無(wú)論是前10%還是前5%的主題模型行業(yè)輪動(dòng)的影響拆分后,行業(yè)輪動(dòng)的有效性得到了較大的提升。請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明主題模型行業(yè)輪動(dòng)—前5%主題模型行業(yè)輪動(dòng)—前10%中信一級(jí)行業(yè)輪動(dòng)—前5原有行業(yè)輪動(dòng)市場(chǎng)基準(zhǔn)更進(jìn)一步,我們?cè)谥黝}模型行業(yè)輪動(dòng)上進(jìn)行改進(jìn)。通過觀察發(fā)現(xiàn):在一些公表12、行業(yè)輪動(dòng)測(cè)試列表-改進(jìn)以復(fù)合因子、分析師覆蓋和新行業(yè)分類構(gòu)建的輪動(dòng)模型,篩選股票,選擇排名最高的5%行業(yè)以復(fù)合因子、分析師覆蓋和新行業(yè)分類構(gòu)建的輪動(dòng)模型,篩選股票,選擇排名最高的10%行業(yè)2022年團(tuán)隊(duì)推出的中信行業(yè)輪動(dòng)模型同期萬(wàn)得全A指數(shù)請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明一定代表性公司能夠提升行業(yè)打分的準(zhǔn)確性,尤其是針對(duì)行業(yè)選擇較少的模型。表13、主題模型行業(yè)輪動(dòng)回測(cè)結(jié)果統(tǒng)計(jì)-改進(jìn)表14、主題模型行業(yè)輪動(dòng)分年度表現(xiàn)-改進(jìn)4.3、多行業(yè)概率下的相似動(dòng)量因子構(gòu)建在此前的興證金工相關(guān)研究中,我們?cè)趯@植?、?cái)務(wù)指標(biāo)、產(chǎn)業(yè)鏈上下請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明(3)業(yè)重構(gòu)后的結(jié)果刻畫個(gè)股之前的相關(guān)性。我們的改進(jìn)主要為兩部分:輸入數(shù)據(jù)和其中的每個(gè)值代表著公司對(duì)應(yīng)行業(yè)的概率。我們以公司的行業(yè)分布向量作為輸入數(shù)據(jù),構(gòu)建各個(gè)公司之間的相似度。在算法層面,我們引入Hellinger相似度兩個(gè)概率分布之間的相似性,其具體公式如sim_indi,j=1一Jθi一JθjI2(4)在此構(gòu)建方式中,我們首先根據(jù)專利和產(chǎn)品布局?jǐn)?shù)據(jù),通過主題模型構(gòu)建出各個(gè)公司的特征向量。該特征向量同時(shí)考慮了多個(gè)維度的另類數(shù)據(jù),同時(shí)是從全出的特征向量能夠找出公司在產(chǎn)品布局和專利維度中的共性之處,進(jìn)而獲得“補(bǔ)一級(jí)行業(yè)中性化處理,記為多行業(yè)相似動(dòng)量因子Neu。取出各個(gè)公司在傳統(tǒng)行業(yè)相似屬性之外的信息。從分位數(shù)組合測(cè)試結(jié)果上看,因子的分位數(shù)組合均相對(duì)單調(diào),多行業(yè)相似動(dòng)請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明........因子名稱分位數(shù)總收益率年化收益率波動(dòng)率Sharpe比率平均換手率最大回撤率多行業(yè)相似動(dòng)量因子Top123Bottom39.70%460.52%532.83%311.51%1-26.73%-328.73%0.14149.23%49.30%90%28.39%28.06%27.70%27.48%0.210.120.05-0.13157.73%150.98%157.37%148.35%44.64%50.08%53.41%60.22%50%市場(chǎng)L-S37.10%93.25%3.89%8.31%26.95%5.16%0.1444.27%2.62%這說(shuō)明,該因子與專利相似有著一定的共性之處,但由于主題模型、輸入數(shù)據(jù)和相似度計(jì)算等方面的不同,該因子也與此前的所有相似動(dòng)量因子保持著較低的相402004.4、多行業(yè)概率下的持倉(cāng)權(quán)重優(yōu)化在前序章節(jié)中,我們嘗試了兩種多行業(yè)概率分布的應(yīng)用場(chǎng)景:行業(yè)輪動(dòng)和相概率下的持倉(cāng)權(quán)重優(yōu)化方法。在介紹該方法之前,我們首先引入一個(gè)衡量產(chǎn)業(yè)集度的綜合指數(shù),以用來(lái)反應(yīng)市場(chǎng)規(guī)模的離散度與集中度。在測(cè)量一個(gè)產(chǎn)業(yè)的集中HHI=12請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明HHI=pi,j?wj)2(6)時(shí)也考慮到了多個(gè)公司在主題模型的行業(yè)重構(gòu)中特有的概率向量資的屬性更加明顯。在此基礎(chǔ)之上,我們可以針對(duì)某一主題策略的持倉(cāng)進(jìn)行權(quán)重為初始權(quán)重,通過約束權(quán)重上下限的方式最大化HHI),在上述方案中,我們可以在不修改持倉(cāng)股票的情況下,僅通過權(quán)重的優(yōu)化完請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明表16、多行業(yè)概率下的持倉(cāng)權(quán)重優(yōu)化結(jié)果54.543.532.5210.5018765432101在本文中,我們將嘗試構(gòu)建一種全新的行業(yè)分類模式,即多行業(yè)分類。具體這種分類方式下,我們能夠同時(shí)解決現(xiàn)有行業(yè)分類中時(shí)效性和單一性的問請(qǐng)務(wù)必閱讀正文之后的信息披露和重要聲明本人具有中國(guó)證券業(yè)協(xié)會(huì)授予的證券投資咨詢執(zhí)業(yè)資格并登記為證券分析師,以勤勉報(bào)告。本報(bào)告清晰準(zhǔn)確地反映了本人的研究觀點(diǎn)。本人不曾因,不因,也將不會(huì)因本報(bào)告中的具體推薦意見或投資建議的評(píng)級(jí)標(biāo)準(zhǔn)股票評(píng)級(jí)相對(duì)同期相關(guān)證券市場(chǎng)代表性指數(shù)漲幅在5%~相對(duì)同期相關(guān)證券市場(chǎng)代表性指數(shù)漲幅在-5%~相對(duì)同期相關(guān)證券市場(chǎng)代表性指數(shù)漲幅小于-5%使用本研究報(bào)告的風(fēng)險(xiǎn)提示及法律聲明,本公司不會(huì)因接收人收到本報(bào)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論