版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第四章使用pandas進行數(shù)據(jù)對象構(gòu)建和數(shù)據(jù)運算
任務(wù)4.4層次化索引操作pandas的索引分層索引MultiIndex數(shù)據(jù)源小費數(shù)據(jù)集tipsSeries的多層索引MultiIndexSeries有多層索引怎樣篩選數(shù)據(jù)DataFrame的多層索引MultiIndex
DataFrame有多層索引怎樣篩選數(shù)據(jù)pandas的索引pandas的索引:負責管理軸標簽和其他如軸名稱等元數(shù)據(jù)。構(gòu)建Series或DataFrame時,所用到的任何數(shù)組或其他序列的標簽都會被轉(zhuǎn)換成一個Index。Pandas的數(shù)據(jù)處理:pandas作為python中非常重要的數(shù)據(jù)處理工具,它提供了很多靈活的數(shù)學和統(tǒng)計方法。在數(shù)據(jù)處理中,經(jīng)常需要對數(shù)據(jù)進行索引的轉(zhuǎn)換,以適應(yīng)不同的統(tǒng)計和作圖的需要。分層索引MultiIndexPandas高維數(shù)據(jù)結(jié)構(gòu):?Pandas庫的名字來源于其中3種主要數(shù)據(jù)結(jié)構(gòu)開頭字母的縮寫,Panel、Dataframe、Series,其中Series表示一維數(shù)據(jù),Dataframe表示二維數(shù)據(jù),Panel表示三維數(shù)據(jù)。當數(shù)據(jù)高于二維時,我們一般用包含多層級索引的Dataframe進行表示,而不是使用Panel。原因是使用多層級索引展示數(shù)據(jù)更加直觀,操作數(shù)據(jù)更加靈活,并且可以表示3維,4維乃至任意維度的數(shù)據(jù)。MultiIndex:層次化索引對象,表示單個軸上的多層索引,可以看做由原數(shù)組組成的數(shù)組。MultiIndex可以理解為堆疊的一種索引結(jié)構(gòu),官方文檔提及到它為一些相當復雜的數(shù)據(jù)分析和操作打開了大門,尤其是在處理高維數(shù)據(jù)的時候顯得十分便利。從本質(zhì)上講,有了多級索引就可以在Series和DataFrame等低數(shù)據(jù)結(jié)構(gòu)中存儲和處理任意維數(shù)的數(shù)據(jù)。數(shù)據(jù)源小費數(shù)據(jù)集tips使用seaborn庫自帶的小費數(shù)據(jù)集tips,數(shù)據(jù)集中含有7個字段:消費總金額(totall_bill)(不含小費)小費金額(tip)顧客性別(sex)消費的星期(day)消費的時間段(time)用餐人數(shù)(size)顧客是否抽煙(smoker)Series的多層索引MultiIndex使用分組創(chuàng)建多層級索引Series有多層索引怎樣篩選數(shù)據(jù)圖1多層索引Series對象圖2取level=0級索引是Thur圖3取0級索引是Thur和Fri圖4取0級索引是Thur并且1級索引是Dinner圖5
取1級索引是Dinner圖6
按0級索引統(tǒng)計DataFrame的多層索引MultiIndex使用set_index方法將普通列轉(zhuǎn)成多層級索引tips.set_index([‘day’,‘time’],inplace=True)#將列變成行索引,并且修改原數(shù)據(jù)集,如圖1
tips.sort_index(inplace=True)#按行索引排序,并替換原數(shù)據(jù)集,如圖2圖1列轉(zhuǎn)成行圖2
行索引排序
DataFrame有多層索引MultiIndex怎樣篩選數(shù)據(jù)
在選擇數(shù)據(jù)時:元組(key1,key2)代表篩選多層索引,其中key1是索引0層,key2是1層,比如ey1=Thur,key2=Lunch列表[key1,key2]代表同一層的多個KEY,其中key1和key2是并列的同層索引,比如key1=Thur,key2=FriDataFrame有多層索引MultiIndex怎樣篩選數(shù)據(jù)DataFrame有多層索引MultiIndex怎樣篩選數(shù)據(jù)在索引運算[]里面使用:,:表示切片。但是在非索引運算[]以外,比如元組或列表中使用:則不能表示:是切片運算符。在非索引運算[]以外,要表達切片,需使用slice()或pandas.IndexSliceslice(None)表示切片:,slice('a','e')表示'a':'e'idx=pandas.IndexSlice,idx[:]表示切片,idx['a':'e']表示'a':'e'小結(jié)pandas的索引分層索引MultiIndex數(shù)據(jù)源小費數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《客房服務(wù)管理》課件
- 《孟非的激勵人生》課件
- 《實驗室管理》課件
- 2024-2025學年浙江省9+1聯(lián)考高一上學期期中考試歷史試題(解析版)
- 單位管理制度集合大合集【人事管理】十篇
- 單位管理制度集粹匯編【人力資源管理篇】
- 單位管理制度匯編大合集職員管理篇
- 單位管理制度合并匯編人力資源管理篇十篇
- 《漢字的結(jié)構(gòu)特點》課件
- 單位管理制度范例選集【員工管理篇】
- 外研版(三起)(2024)小學三年級上冊英語全冊教案
- 初一《皇帝的新裝》課本劇劇本
- 幼兒園意識形態(tài)風險點排查報告
- 英美文學導論21級學習通超星期末考試答案章節(jié)答案2024年
- 腰椎感染護理查房
- 2023-2024學年全國小學三年級上語文人教版期末考卷(含答案解析)
- 2024秋期國家開放大學??啤斗勺稍兣c調(diào)解》一平臺在線形考(形考任務(wù)1至4)試題及答案
- 七年級全冊語文古詩詞
- 銷售業(yè)務(wù)拓展外包協(xié)議模板2024版版
- 2024軟件維護合同范本
- 2022-2023學年北京市海淀區(qū)七年級上學期期末語文試卷(含答案解析)
評論
0/150
提交評論