版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第11章
行業(yè)聯(lián)動與輪動分析數(shù)據(jù)獲取布爾值指標計算日行業(yè)聯(lián)動與輪動關(guān)聯(lián)規(guī)則挖掘數(shù)據(jù)獲取第11章
以申銀萬國行業(yè)指數(shù)日行情數(shù)據(jù)為基礎(chǔ),分析行業(yè)的聯(lián)動現(xiàn)象與輪動現(xiàn)象。申銀萬國指數(shù)行業(yè)包括:農(nóng)林牧漁、采掘、化工、商業(yè)貿(mào)易、黑色金屬、有色金屬、紡織服裝、建筑建材、電子元器件、食品飲料、公用事業(yè)、信息服務(wù)、交運設(shè)備、綜合、醫(yī)藥生物、建筑材料、房地產(chǎn)、建筑裝飾、電氣設(shè)備、機械設(shè)備、國防軍工、金融服務(wù)、家用電器、計算機、傳媒、通信、信息設(shè)備、輕工制造、餐飲旅游、銀行、非銀金融、汽車、交通運輸、機械設(shè)備等34個行業(yè)。數(shù)據(jù)區(qū)間取2010年1月4日至2017年3月7日,共1741個交易日,不足1741個交易日的行業(yè)指數(shù)剔除,最終得到28個行業(yè)指數(shù)數(shù)據(jù)獲取第11章
相關(guān)數(shù)據(jù)表包括:交易日歷數(shù)據(jù)表、指數(shù)基本信息表和指數(shù)交易數(shù)據(jù)表。MarkettypeClddtDaywkState12010-01-041O12010-01-052O12010-01-063O12010-01-074O12010-01-085O12010-01-111O12010-01-122O12010-01-133O……………………IndexcdIdxinfo01801010農(nóng)林牧漁801020采掘801030化工801040黑色金屬801050有色金屬801060建筑建材801070機械設(shè)備801080電子元器件…………指數(shù)代碼交易日期收盤指數(shù)8010102010-01-042058.278010102010-01-052081.288010102010-01-062048.78010102010-01-071999.318010102010-01-082018.818010102010-01-112019.458010102010-01-122086.198010102010-01-132063.99………………日行業(yè)聯(lián)動與輪動分析(布爾值指標計算)第11章
我們只關(guān)心上漲的情況,不考慮下跌的情況,因此計算每個行業(yè)從2010年1月5日至2017年3月7日的指數(shù)行情上漲情況。所謂上漲是指:當前交易日行情數(shù)據(jù)與上一個交易日行情數(shù)據(jù)的差大于零,其指標名稱記為:行業(yè)名稱_up,如果上漲記為1,否則記為0。計算思路及算法如下:(1)預(yù)定義空的字典D。(2)對每一個指數(shù)代碼,提取其交易收盤價數(shù)據(jù),并按日期進行排序。(3)預(yù)定義一個與其長度相等的全0數(shù)組z21_up,同時收盤價按交易日期錯位相減,
如果大于0,表示上漲,z21_up對應(yīng)的位置賦值為1。(4)以行業(yè)名稱_up為鍵,z21_up為值,賦值給預(yù)定義的空字典D。(5)將D轉(zhuǎn)化為數(shù)據(jù)框,其中index為對應(yīng)的交易日期。日行業(yè)聯(lián)動與輪動分析(布爾指標計算)第11章
importnumpyasnpD=dict()fortinrange(len(code)):
dt=data.loc[data['指數(shù)代碼']==code[t],['交易日期','收盤價']].sort_values('交易日期')
dt1=dt.iloc[0:-1,[1]]['收盤價'];
dt2=dt.iloc[1:,[1]]['收盤價'];
z21_up=np.zeros(len(dt2))
z21_up[dt2.values-dt1.values>0]=1
D.setdefault(sname[code[t]]+'_up',z21_up)td=pd.read_excel('交易日歷數(shù)據(jù)表.xlsx')#讀取交易日歷數(shù)據(jù)Data=pd.DataFrame(D,index=td[‘Clddt’].values[1:])importpandasaspdcodename=pd.read_excel('指數(shù)基本信息表.xlsx')sname=pd.Series(list(codename.iloc[:,1]),index=codename.iloc[:,0])data=pd.read_excel('指數(shù)交易數(shù)據(jù)表.xlsx')code_record=data.iloc[:,0].value_counts()code=list(code_record[code_record==1741].index)日行業(yè)聯(lián)動與輪動分析(布爾值指標計算)第11章
計算結(jié)果(部分)以交通運輸_up這個字段為例進行說明,其中2010年1月5日、8日、11日、12日表示該行業(yè)為上漲,而2010年1月6日、7日、13日為下跌?;谠摂?shù)據(jù),我們就可以進行關(guān)聯(lián)規(guī)則挖掘了。日行業(yè)聯(lián)動與輪動分析(聯(lián)動規(guī)則挖掘)第11章
調(diào)用apriori關(guān)聯(lián)規(guī)則挖掘算法,獲得行業(yè)聯(lián)動關(guān)聯(lián)規(guī)則挖掘結(jié)果如下表。IDrulesupportconfidence1紡織服裝_up—綜合_up—輕工制造_up0.478160920.960739032電氣設(shè)備_up—紡織服裝_up—輕工制造_up0.4724137930.9569266593電氣設(shè)備_up—輕工制造_up—紡織服裝_up0.4724137930.9502890174綜合_up—輕工制造_up—紡織服裝_up0.478160920.9486887125紡織服裝_up—輕工制造_up—綜合_up0.478160920.9390519196紡織服裝_up—輕工制造_up—電氣設(shè)備_up0.4724137930.9277652377電氣設(shè)備_up—輕工制造_up0.4971264370.9134107718化工_up—輕工制造_up0.4948275860.9101479929電氣設(shè)備_up—紡織服裝_up0.4936781610.90707497410綜合_up—輕工制造_up0.5040229890.9050567611機械設(shè)備_up—輕工制造_up0.4833333330.90430107512商業(yè)貿(mào)易_up—紡織服裝_up0.491379310.90285110913紡織服裝_up—輕工制造_up0.5091954020.90040650414電子元器件_up—輕工制造_up0.4925287360.90021008415機械設(shè)備_up—紡織服裝_up0.4810344830.9最小支持度、最小置信度分別在47%和90%以上的,共有15條行業(yè)聯(lián)動的關(guān)聯(lián)規(guī)則。聯(lián)動規(guī)則揭示了當前的關(guān)聯(lián)情況,對未來沒有預(yù)測意義。日行業(yè)聯(lián)動與輪動分析(輪動規(guī)則挖掘)第11章
基于第5章一對一關(guān)聯(lián)規(guī)則挖掘程序案例,將其定義為函數(shù)的形式,其函數(shù)名稱記為rule,存儲于OneRule.py文件中。函數(shù)定義如下:輸入?yún)?shù)為布爾數(shù)據(jù)集Data、最小支持度s0和最小置信度c0,返回值為一對一行業(yè)輪動關(guān)聯(lián)規(guī)則defrule(Data,s0,c0):
importnumpyasnpimportpandasaspdc=list(Data.columns)#獲取字段名稱(行業(yè)名稱_up)轉(zhuǎn)化為列表list1=[]#預(yù)定義定義列表list1,用于存放規(guī)則list2=[]#預(yù)定義定義列表list2,用于存放規(guī)則的支持度list3=[]#預(yù)定義定義列表list3,用于存放規(guī)則的置信度forkinrange(len(c)):forqinrange(len(c)):
#對第c[k]個行業(yè)與第c[q]個行業(yè)計算行業(yè)輪動規(guī)則
#規(guī)則的前件為c[k]
#規(guī)則的后件為c[q],計算周期與c[k]需后移一個周期c1=Data[c[k]][0:-1]c2=Data[c[q]][1:]I1=c1.values==1I2=c2.values==1
t12=np.zeros((len(c1)))t1=np.zeros((len(c1)))t12[I1&I2]=1t1[I1]=1sp=sum(t12)/len(c1)#支持度co=sum(t12)/sum(t1)#置信度ifco>c0andsp>s0:list1.append(c[k]+'--'+c[q])list2.append(sp)list3.append(co)
#定義字典,用于存放關(guān)聯(lián)規(guī)則及其置信度、支持度
R={'rule':list1,'support':list2,'confidence':list3}
#將字典轉(zhuǎn)化為數(shù)據(jù)框R=pd.DataFrame(R)
#將結(jié)果導(dǎo)出到ExcelR.to_excel('R.xlsx')returnR日行業(yè)聯(lián)動與輪動分析(輪動規(guī)則挖掘)第11章
importOneRuleasORr=OR.rule(Data,0.3,0.59)本例設(shè)置行業(yè)關(guān)聯(lián)規(guī)則的最小支持度和最小置信度分別大于0.3和0.59,調(diào)用定義的rule函數(shù)進行行業(yè)輪動關(guān)聯(lián)規(guī)則挖掘IDrulesupportconfidence0公用事業(yè)_up—輕工制造_up0.32374930.600213221農(nóng)林牧漁_up—輕工制造_up0.32777460.5968586392醫(yī)藥生物_up—紡織服裝_up0.32317420.5953389833醫(yī)藥生物_up—輕工制造_up0.32259920.5942796614商業(yè)貿(mào)易_up—紡織服裝_up0.32374930.595
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 個人貨物運輸合同2
- 2025電腦設(shè)備銷售合同協(xié)議
- 2025年玩具維修師勞務(wù)派遣合同
- 個體戶員工勞動合同范本
- 扣繳企業(yè)所得稅合同備案和境外發(fā)包勞務(wù)合同備案
- 2025年糖、加工糖及制糖副產(chǎn)品合作協(xié)議書
- 2025年三維多向整體編織物合作協(xié)議書
- 2025年五金采購合同標準版本(2篇)
- 2025年買賣合同鴨飼料(2篇)
- 2025年產(chǎn)品供銷合同簡單版(2篇)
- 人教版四年級上冊豎式計算200題及答案
- 建設(shè)工程工作總結(jié)報告
- 脾破裂術(shù)后健康宣教課件
- 三廢環(huán)保管理培訓(xùn)
- 財務(wù)管控的間接成本
- 藏族唐卡藝術(shù)特色分析
- 操作系統(tǒng)課程設(shè)計報告
- 護士團隊的協(xié)作和領(lǐng)導(dǎo)力培養(yǎng)培訓(xùn)課件
- QFD模板含計算公式計分標準說明模板
- 醫(yī)院護理培訓(xùn)課件:《早產(chǎn)兒姿勢管理與擺位》
- 人工智能在生物醫(yī)學(xué)倫理與法律中的基因編輯與生命倫理問題研究
評論
0/150
提交評論