新聞輿情智能分析及其投資應(yīng)用_第1頁
新聞輿情智能分析及其投資應(yīng)用_第2頁
新聞輿情智能分析及其投資應(yīng)用_第3頁
新聞輿情智能分析及其投資應(yīng)用_第4頁
新聞輿情智能分析及其投資應(yīng)用_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、11. 海內(nèi)外機構(gòu)廣泛關(guān)注另類數(shù)據(jù)投研海外金融機構(gòu)投入高成本布局另類數(shù)據(jù)海外對新聞數(shù)據(jù)投資價值的探索和國內(nèi)機構(gòu)布局21.1海外金融機構(gòu)投入高成本布局另類數(shù)據(jù)2018年投資機構(gòu)在另類數(shù)據(jù)上預(yù)算的分布2018年不同管理規(guī)模的投資機構(gòu)在另類數(shù)據(jù)上的平均預(yù)算37%41%15%7%$5百萬$357,143$607,143$1,056,250$1,472,222$1,600,000$1,400,000$1,200,000$1,000,000$800,000$600,000$400,000$200,000$0資料來源:,中信證券研究部資料來源:,中信證券研究部資料來源:,中信證券研究部2018年投資機構(gòu)對各

2、類投資研究方式未來變化的預(yù)期57%29%7%43%39%Investment newslettersIndependent research providers減少Investment bank research50%32%7%11%29%18%Financial information systems (e.g., Thomson Reuters)7%61%7%7%36%7%Conferences4%68%7%4%61%7%Financial publications (e.g., Barrons)4%4%62%57%4%7%保持4%46%4%4%43%11%Alternative data

3、 sources4%21%50%增加1.2 海外對新聞數(shù)據(jù)投資價值的探索和國內(nèi)機構(gòu)布局海外研究與案例2010年,Bollen等人利用推特構(gòu)建出的冷靜情緒下的指標(biāo)能夠有效預(yù)測下一日的漲跌, 正確率達(dá)到86.7%。該研究成果已經(jīng)應(yīng)用到一家英國的對沖基金Derwent Capital Markets中。2015年,歐洲央行的研究報告“Quantifying the Effects of Online Bullishness on International Financial Markets”檢索 Twitter 和 Google 中“牛市”和“熊市”兩個 詞出現(xiàn)的頻數(shù)作為投資者的情緒指標(biāo),其與標(biāo)普

4、500指數(shù)下期收益率的回歸系數(shù)為 10.98,且具有顯著性。2018年9月,知名的對沖基金Two Sigma花10萬美金在Kaggle平臺舉辦采用新聞預(yù)測 股票趨勢的競賽以尋求人工智能解決方案,吸引了全球2900多支隊伍參加國內(nèi)的相關(guān)基金產(chǎn)品:以互聯(lián)網(wǎng)大數(shù)據(jù)為信息源,以特定信息為主要選股標(biāo)準(zhǔn)的產(chǎn)品資料來源:Wind,中信證券研究部部分國內(nèi)已發(fā)行的大數(shù)據(jù)基金(億份)001242.OF博時淘金大數(shù)據(jù)100A博時基金股票型2015-05-0435.1312001420.OF南方大數(shù)據(jù)300A南方基金股票型2015-06-2418.7444001637.OF嘉實騰訊自選股大數(shù)據(jù)嘉實基金股票型2015-

5、12-0712.6257001564.OF東方紅京東大數(shù)據(jù)東證資管混合型2015-07-3112.6071001113.OF南方大數(shù)據(jù)100A南方基金股票型2015-04-249.9144001734.OF廣發(fā)百發(fā)大數(shù)據(jù)策略成長A廣發(fā)基金混合型2015-11-185.50973基金代碼基金簡稱基金公司基金類型成立日期發(fā)行份額2. 基于NLP技術(shù)的新聞情緒指標(biāo)構(gòu)建4BERT模型:深度提取情緒信息BERT模型的基本原理從模型訓(xùn)練到應(yīng)用指標(biāo):六個步驟以市場為指導(dǎo):借用收益率作為標(biāo)簽情緒指標(biāo)構(gòu)建5預(yù)訓(xùn)練微調(diào)參數(shù)2.1 BERT模型:深度提取情緒信息傳統(tǒng)的情緒識別模型存在諸多不足依賴于情緒詞庫的建立,工

6、程量巨大容易斷章取義,對諸如“減少虧損”的表達(dá)可能完全理解錯誤。BERT : 2018 年 Google 團(tuán) 隊 在 “ BERT:Pre-trainingofDeepBidirectionalTransformers for Language Understanding”提出的一種新的語言模型能對整句文本進(jìn)行建模,有效避免傳統(tǒng)模型的斷章取義的問題通過在大語料比如維基百科上進(jìn)行預(yù)訓(xùn)練,充分學(xué)習(xí)語言的規(guī)律,吸收豐富的知識并 進(jìn)行遷移,從而降低對目標(biāo)數(shù)據(jù)量的要求。資料來源:,.tr,中信證券研究部預(yù)訓(xùn)練和參數(shù)微調(diào)示意圖2.2 BERT模型的基本原理預(yù)訓(xùn)練:通過預(yù)測句子中被掩蓋的字符來學(xué)習(xí)語言的規(guī)律

7、參數(shù)微調(diào):根據(jù)收益率構(gòu)造新聞的標(biāo)簽,然后進(jìn)行常規(guī)的二分類訓(xùn)練訓(xùn)練完成后,能夠?qū)γ織l新聞輸出取值在0,1的情緒分?jǐn)?shù)BERT模型的原理圖資料來源:中信證券研究部62.3 從模型訓(xùn)練到應(yīng)用指標(biāo):六個步驟1. 模型預(yù)訓(xùn)練:在大數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練使模型處于較好的初始化狀態(tài)2. 采用收益率為新聞打標(biāo)簽:采用股票本身的收益率給新聞賦予標(biāo)簽3. 微調(diào)模型參數(shù):采用上一步驟中打好標(biāo)簽的數(shù)據(jù)進(jìn)行常規(guī)的二分類訓(xùn)練4. 預(yù)測新聞情緒:采用上一步驟中訓(xùn)練完成的模型對新的新聞數(shù)據(jù)執(zhí)行情緒判斷5. 構(gòu)建情緒指標(biāo):所有新聞通過模型得到情緒分?jǐn)?shù)后,按照一定規(guī)則構(gòu)建情緒指標(biāo)6. 避險/熱點發(fā)現(xiàn)等任務(wù):對于構(gòu)建完成的情緒指標(biāo),便可用

8、于避險、增強或者熱點發(fā) 現(xiàn)等任務(wù)從模型訓(xùn)練到應(yīng)用指標(biāo)的處理流程訓(xùn)練模型模型預(yù)訓(xùn)采用收益率微調(diào) 練為新聞打標(biāo)模型參數(shù)簽使用模型預(yù)測 新聞情緒構(gòu)建指標(biāo)構(gòu)建 情緒指標(biāo)應(yīng)用指標(biāo)避險/熱點 發(fā)現(xiàn)等任 務(wù)資料來源:中信證券研究部72.4 以市場為指導(dǎo):借用收益率作為標(biāo)簽8單條新聞所屬日期的歸類:我們對新聞時間的劃分為每天的15:00,即發(fā)布時間在t-1 日15:00以后,t日15:00以前的消息作為t日的消息。標(biāo)簽計算:使用股票本身在t-2日到t+1日收盤價的收益率來打標(biāo)簽。為漲跌幅分別設(shè)置10%和-9.09%的閾值,新聞數(shù)據(jù)的時間范圍是2011年5月13日至2020年4月30日,共83萬條。其中,201

9、1年1 月1日至2018年12月31日的新聞用來作為訓(xùn)練數(shù)據(jù),共計57萬條;2019年1月1日至 2020年4月30日的數(shù)據(jù)作為模型的測試數(shù)據(jù)以做有效性檢測,共計26萬條。資料來源:Wind,中信證券研究部。分年度的新聞數(shù)目統(tǒng)計(萬條)訓(xùn)練完成的模型為每一條新聞的正負(fù)面進(jìn)行評價,輸出值為其屬于正面消息的概率,取 值范圍 0,1 ,對其進(jìn)行平移處理轉(zhuǎn)換為-1,1。,個股層次:個股新聞情緒=1,=1, 新聞情緒分?jǐn)?shù)t,i,j組合層次:組合新聞情緒 =11 個股新聞情緒,新聞情緒(調(diào)整) = 新聞情緒 新聞情緒120日均線新聞情緒變動 = 新聞情緒20日均線(調(diào)整) 新聞情緒20日均線(調(diào)整)20資

10、料來源:Wind,中信證券研究部新聞情緒指標(biāo)的20日均線、120日均線和調(diào)整后的20日均線2.5 情緒指標(biāo)構(gòu)建0.100.00-0.10-0.20-0.30-0.40-0.500.500.400.300-0.102012-012012-032012-052012-062012-082012-102012-122013-022013-042013-062013-082013-092013-112014-012014-032014-052014-072014-092014-112014-122015-022015-042015-062015-082015-102015-122

11、016-012016-032016-052016-072016-092016-112017-012017-032017-052017-062017-082017-102017-122018-022018-042018-062018-072018-092018-112019-012019-032019-052019-072019-082019-102019-122020-022020-042020-06新聞情緒20日均線(調(diào)整,右軸)新聞情緒20日均線新聞情緒120日均線93. 中期擇時:行情拐點的重要觀察信號10結(jié)合動量指標(biāo),警示牛轉(zhuǎn)熊反其道而行,捕捉超跌反彈新聞情緒vs.交易層面的風(fēng)險偏好:

12、通常具有較高的一 致性11資料來源:Wind,中信證券研究部3.1 結(jié)合動量指標(biāo),警示牛轉(zhuǎn)熊參數(shù)(-0.03,7%)下的警示信號vs中證全指以近20個交易日上漲超過7%,情緒下降超過-0.03為警示信號,剔除相鄰20日以內(nèi)的重 復(fù)信號。在訓(xùn)練集上準(zhǔn)確率達(dá)到70%(信號次數(shù)10),測試集正確率100%(3)。參數(shù)(-0.03,7%)下的13次警示信號日期新聞情緒變動未來20日收益率日期新聞情緒變動未來20日收益率2012-05-02-0.06-0.59%2015-06-18-0.04-23.21%2012-12-24-0.038.46%2015-12-25-0.07-21.03%2013-01-

13、28-0.03-1.36%2016-07-11-0.08-0.76%2014-12-18-0.03-2.63%2019-04-24-0.06-11.26%2015-01-08-0.07-0.38%2019-07-05-0.04-4.53%2015-04-16-0.038.48%2020-01-06-0.03-3.13%2015-05-08-0.0827.13%資料來源:Wind,中信證券研究部800070006000500040003000200000.050.00-0.05-0.10-0.15-0.20-0.252012-022012-032012-052012-062

14、012-082012-092012-112013-012013-022013-042013-062013-072013-092013-102013-122014-012014-032014-052014-062014-082014-092014-112014-122015-022015-042015-052015-072015-082015-102015-122016-012016-032016-042016-062016-072016-092016-112016-122017-022017-032017-052017-062017-082017-092017-112018-012018-02

15、2018-042018-052018-072018-082018-102018-122019-012019-032019-052019-062019-082019-092019-112019-122020-022020-042020-052020-07信號新聞情緒變動中證全指(右軸)3.2 反其道而行,捕捉超跌反彈參數(shù)(0.03,-5%)下的反彈信號vs中證全指以近20個交易日下跌超過5%,情緒上升超過0.03為反彈信號。在訓(xùn)練集上準(zhǔn)確率達(dá)到71%(信號次數(shù)7),測試集正確率100%(3)。參數(shù)(0.03,-5%)下的10次警示信號日期新聞情緒變動未來20日收益率日期新聞情緒變動未來20日收益

16、率2012-06-040.07-2.71%2018-08-060.070.21%2012-11-150.070.06%2018-10-110.042.77%2015-07-270.04-12.61%2019-05-270.032.56%2015-09-220.0412.38%2019-08-060.057.29%2016-02-260.048.47%2020-03-160.051.89%資料來源:Wind,中信證券研究部資料來源:Wind,中信證券研究部9000800070006000500040003000200050.00-0.05-0.10-0.152012-022

17、012-032012-052012-062012-082012-092012-112013-012013-022013-042013-062013-072013-092013-102013-122014-012014-032014-052014-062014-082014-092014-112014-122015-022015-042015-052015-072015-082015-102015-122016-012016-032016-042016-062016-072016-092016-112016-122017-022017-032017-052017-062017-082017-09

18、2017-112018-012018-022018-042018-052018-072018-082018-102018-122019-012019-032019-052019-062019-082019-092019-112019-122020-022020-042020-052020-07信號新聞情緒變動中證全指(右軸)12行情拐點一般伴隨著風(fēng)險偏好的突變, 在市場熱情高漲時關(guān)注風(fēng)險偏好的變化 可一定程度上監(jiān)測到行情的變化交易層面的風(fēng)險偏好可通過波動率和收 益的相關(guān)性來表示。相關(guān)性越大,表示 高波動的股票收益更高,即反應(yīng)投資者 的風(fēng)險偏好更強。3.3 新聞情緒 vs. 交易層面的風(fēng)險偏好:

19、通常具有較高的一致性資料來源:Wind,中信證券研究部情緒指標(biāo)與風(fēng)險偏好的滾動相關(guān)性vs中證全指資料來源:Wind,中信證券研究部情緒指標(biāo)vs風(fēng)險偏好0.800.600.400.200.00-0.20-0.40-0.60-0.80-1.00-0.14-0.09-0.040.010.060.112012-012012-022012-042012-052012-072012-082012-102012-122013-012013-032013-052013-062013-082013-092013-112013-122014-022014-042014-052014-072014-082014-1

20、02014-122015-012015-032015-042015-062015-072015-092015-112015-122016-022016-032016-052016-062016-082016-092016-112017-012017-022017-042017-062017-072017-082017-102017-122018-012018-032018-052018-062018-082018-092018-112018-122019-022019-042019-052019-072019-082019-102019-112020-012020-032020-042020-

21、06風(fēng)險偏好(右軸)情緒指標(biāo)20日均值-120日均值9,0008,0007,0006,0005,0004,0003,0002,0001.000.800.600.400.200.00-0.20-0.40-0.60-0.80-1.002012-012012-042012-082012-112013-032013-062013-102014-012014-052014-082014-122015-032015-072015-102016-022016-052016-092016-122017-042017-072017-112018-022018-062018-092019-012019-04201

22、9-082019-112020-0360日相關(guān)性中證全指(右軸)134. 短期擇時:結(jié)合波動率,提升擇時效果14市場波動率高時情緒指標(biāo)準(zhǔn)確性較高借助波動率優(yōu)化杠桿增強策略資料來源:Wind,中信證券研究部資料來源:Wind,中信證券研究部不同波動率下的滾動相關(guān)性(DIFF5,RET3)波動率分組下的滾動相關(guān)性(DIFF5,RET3)4.1 市場波動率高時情緒指標(biāo)準(zhǔn)確性較高按波動率分組來觀察波動率對相關(guān)性的影響。根據(jù)波動率0.1至0.9的分位點將其分為10 組。分別統(tǒng)計每組內(nèi)相關(guān)性的均值和標(biāo)準(zhǔn)差。當(dāng)波動率處于較高水平時,相關(guān)性基本為正,最高一組的均值達(dá)到0.34。另外每組的 標(biāo)準(zhǔn)差變化不大,這說

23、明波動率可以比較穩(wěn)定地確定相關(guān)性的范圍。y = 0.5176x - 0.01431.00.20.0-0.2-0.4-0.6-0.8-1.00%10%20%30%40%50%60%70%80%0.0-0.1-0.2-0.3158%13%18%23%28%33%38%43%48%根據(jù)均值回復(fù)性選擇在波動率高于均線 時一定程度時暫停使用情緒指標(biāo),該閾 值最終根據(jù)訓(xùn)練集上的信息率確定為 1.2%。杠桿增強策略的基本邏輯:在情緒指標(biāo) 相對5日均值變化(DIFF5)高于上閾值 時做多期指,低于下閾值時做空期指。優(yōu)化后凈值波動明顯下降,測試集信息 率提升

24、0.26,最大回撤降低8.30%4.2 借助波動率優(yōu)化杠桿增強策略資料來源:wind,中信證券研究部測試集優(yōu)化前和優(yōu)化后相對收益走勢資料來源:Wind,中信證券研究部不同20日波動率離差下未來5日波動率的變化30%20%10%0%-10%-20%-30%-40%-50%-10%-5%0%5%10%1.351.3051.101.051.000.950.902019-01-032019-01-212019-02-132019-03-012019-03-192019-04-042019-04-232019-05-142019-05-302019-06-182019-07-042

25、019-07-222019-08-072019-08-232019-09-102019-09-272019-10-222019-11-072019-11-252019-12-112019-12-272020-01-152020-02-102020-02-262020-03-132020-03-312020-04-172020-05-082020-05-262020-06-112020-07-01優(yōu)化前相對收益優(yōu)化后相對收益165. 風(fēng)格配置:顯著影響盈利、市值等因子風(fēng)格收益17情緒指標(biāo)有效解釋風(fēng)格因子多空收益情緒指標(biāo)對不同市值股票的作用效果不同風(fēng)險偏好下盈利因子多空組合收益資料來源:wind,

26、中信證券研究部因子多空收益和情緒指標(biāo)的回歸結(jié)果資料來源:Wind,中信證券研究部不同風(fēng)險偏好下市值因子多空組合收益5.1 情緒指標(biāo)有效解釋風(fēng)格因子多空收益盈利、市值、流動性和波動率四個因子 的規(guī)律均體現(xiàn)了穩(wěn)定性和顯著性。風(fēng)險偏好上升,有利于低盈利、小市值、 高流動性和高波動的股票;風(fēng)險偏好下降時,有利于高盈利、大市值、低流動性和低波動的股票。訓(xùn)練集測試集指標(biāo)p值p值盈利-0.250.00-0.620.00成長0.030.05-0.390.00價值-0.350.000.130.03市值0.300.000.600.00流動性-0.530.00-0.360.00動量-0.220.000.510.00

27、波動率-0.550.00-0.210.06-0.04-0.020.000.020.040.060.08-0.06-0.06-0.04-0.02資料來源:Wind,中信證券研究部0.000.020.040.060.100.080.060.040.020.00-0.02-0.04-0.06-0.08-0.06-0.0418-0.020.000.020.040.06資料來源:Wind,中信證券研究部。G1市值最大訓(xùn)練集上情緒變動與未來收益的關(guān)系資料來源:Wind,中信證券研究部,G1市值最大G1和G5的凈值比vsG1和G5的新聞情緒20日均線差資料來源:Wind,中信證券研究部。G1市值最大測試集上

28、情緒變動與未來收益的關(guān)系5.2 情緒指標(biāo)對不同市值股票的作用效果在2017年以前,小市值組合明顯跑贏大 市值組合,而之后就轉(zhuǎn)為大市值風(fēng)格。 在風(fēng)格切換的拐點處,大市值股票的情 緒面相對于小市值股票開始明顯提升, 并延續(xù)至今。在訓(xùn)練集和測試集上均體現(xiàn)出大市值組 合中相關(guān)性為負(fù),而小市值組合中的相 關(guān)性為正,表明新聞情緒更加適用于小 市值股票。80.060.040.020.00-0.02-0.04-0.06-0.08G1G2G3G4G5相關(guān)性(DIFF5,RET1)相關(guān)性(DIFF5,RET3)相關(guān)性(DIFF5,RET5)-0.10-0.050.000.050.100.15

29、G1G2G3G4G5相關(guān)性(DIFF5,RET1)相關(guān)性(DIFF5,RET3)相關(guān)性(DIFF5,RET5)0.3050.100.050.00-0.051.21.00.20.02012-01-042012-05-022012-08-162012-12-062013-04-022013-07-262013-11-192014-03-122014-07-012014-10-222015-02-062015-06-022015-09-182016-01-112016-05-042016-08-192016-12-132017-04-072017-07-262

30、017-11-152018-03-082018-06-282018-10-192019-02-122019-06-032019-09-182020-01-092020-05-07凈值比(G1/G5)新聞情緒20日均線差(G1-G5,右軸)196. 行業(yè)配置:捕捉適用行業(yè)的短期超額收益20情緒指標(biāo)的行業(yè)適用性分析基于情緒指標(biāo)的行業(yè)配置策略資料來源:Wind,中信證券研究部2020年以來前5個適用行業(yè)的情緒走勢資料來源:Wind,中信證券研究部2020年以來前5個適用行業(yè)的凈值走勢6.1 情緒指標(biāo)的行業(yè)適用性分析資料來源:Wind,中信證券研究部各行業(yè)情緒變動(DIFF5)和行業(yè)指數(shù)未來三日收益率

31、(RET3)的相關(guān)性00.080.060.040.020.00-0.02-0.04-0.06訓(xùn)練集測試集0.060.040.020.00-0.02-0.04-0.06-0.08-0.10-0.12-0.142019-12-312020-01-072020-01-132020-01-172020-01-232020-02-062020-02-122020-02-182020-02-242020-02-282020-03-052020-03-112020-03-172020-03-232020-03-272020-04-022020-04-092020-04-152020-0

32、4-212020-04-272020-05-062020-05-122020-05-182020-05-222020-05-282020-06-032020-06-09醫(yī)藥基礎(chǔ)化工房地產(chǎn)煤炭機械1.3051.101.051.000.950.900.850.802019-12-312020-01-072020-01-132020-01-172020-01-232020-02-062020-02-122020-02-182020-02-242020-02-282020-03-052020-03-112020-03-172020-03-232020-03-272020-04-0

33、22020-04-092020-04-152020-04-212020-04-272020-05-062020-05-122020-05-182020-05-222020-05-282020-06-032020-06-09醫(yī)藥基礎(chǔ)化工房地產(chǎn)煤炭機械216.2 基于情緒指標(biāo)的行業(yè)配置策略資料來源:Wind,中信證券研究部基于情緒指標(biāo)的增強組合與基準(zhǔn)組合凈值(截至2020年6月9日)選擇訓(xùn)練集上相關(guān)性在前15的行業(yè)進(jìn)行來進(jìn)短期的行業(yè)配置。每2日調(diào)一次倉,在每一個換倉日按照情緒變動(DIFF5)從高到低排序,選擇前5個行業(yè)構(gòu)建多頭增強組合增強組合的業(yè)績評價(截至2020年6月9日)

34、1.00.82012-012012-022012-042012-062012-072012-092012-102012-122013-012013-032013-052013-062013-082013-092013-112014-012014-022014-042014-052014-072014-082014-102014-122015-012015-032015-042015-062015-072015-092015-112015-122016-022016-032016-052016-072016-082016-102016-112017-012017-032017-042017-062017-072017-092017-102017-122018-012018-032018-052018-062018-082018-092018-112018-122019-022019-042019-052019-072019-082019-102019-1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論