【python-NOJ-季總結(jié)】-【第八季:Pandas庫(kù)】-表格Dataframe的建立和使用_第1頁(yè)
【python-NOJ-季總結(jié)】-【第八季:Pandas庫(kù)】-表格Dataframe的建立和使用_第2頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、ython-NOJ-Pandas表格Dataframe的建和使本章內(nèi)容寫(xiě)pandas庫(kù)的表格dataframe的相關(guān)使。內(nèi)容包括:表格的建(傳參數(shù)和設(shè)置index),添加/列(append),表格的篩選,刪除/列(drop),表格排序,數(shù)據(jù)透視(df.pivot),表格劃分(groupby)等。1.建表格df=pd.DataFrame(data,columns,index)般創(chuàng)建形式如下:df=pd.DataFrame(data,columns=columns,index=index)三個(gè)參數(shù),參數(shù)1data為建表格所需數(shù)據(jù),維數(shù)組;參數(shù)2column為列名,維數(shù)組,當(dāng)創(chuàng)建形式維字典創(chuàng)建時(shí),不

2、需要列名參數(shù),同時(shí)參數(shù)1是字典;參數(shù)3是索引,位數(shù)組,可有可,默認(rèn)是0,1,2(1)建個(gè)空的框架:df=pd.DataFrame()Empty DataFrameColumns: Index: 此時(shí)沒(méi)有傳參數(shù),建的是個(gè)空表格。(2)傳個(gè)維列表:data=zhang,10,li,20,wang,15df=pd.DataFrame(data,columns=Name,Age)同時(shí)在后可以設(shè)置數(shù)據(jù)類(lèi)型dtype=float,可以將表格中的數(shù)字?jǐn)?shù)據(jù)動(dòng)轉(zhuǎn)換成浮點(diǎn)數(shù)。注意,此處定是維列表,或者字典。(3)字典創(chuàng)建:data= Name:zhang,li,wang,Age:10,20,30df=pd.Dat

3、aFrame(data)字典創(chuàng)建列名動(dòng)帶了字典鍵,鍵值為表格元素。(4)關(guān)于聲明表頭可以在創(chuàng)建表格時(shí)聲明表頭,當(dāng)特定表頭的元素不存在,填充為NaN。df1=pd.DataFrame(data,columns=a,b)df2=pd.DataFrame(data,columns=a,d)0 1 NaN1 3 NaN2.添加元素dfcolumn_name,df.loc,df.iloc,df.append分為添加和添加列。關(guān)于添加列,只需要dfcolumn_name=即可,默認(rèn)添加到最后列;當(dāng)想添加到指定的位置時(shí),采df.insert()法;關(guān)于添加,有三種法。先df.iloc=,參數(shù)為數(shù)字,會(huì)被覆蓋

4、;其次df.loc,參數(shù)為索引名Index,根據(jù)索引名添加;最后df.append(),將兩個(gè)表格合成個(gè)。添加列:(1)添加到最后列df1score=80,98,67,90(2)具體插某列到位置:df.insert(iloc,column,value)三個(gè)參數(shù),插位置,列名,插值列表:df1.insert(2,birth,1995-07-01,1998-09-04,1993-11-03,1994-04-17)(3)添加:df.ilocindexindex是整數(shù),表添加到第,原數(shù)據(jù)會(huì)被覆蓋,且不能超過(guò)len(dataframe);first 6 7second 3 4(4)df.loc法根據(jù)索引

5、添加,此時(shí)添加的數(shù)值使給定的索引。當(dāng)添加的索引值已經(jīng)存在時(shí),更改;不存在時(shí),添加到最后。般這種法,表格的索引都是定義的。data=a:1,b:2,a:3,b:4df1=pd.DataFrame(data,columns=a,b)df1.loc3=6,70 1 21 3 43 6 7(5):添加到最后這是需要?jiǎng)?chuàng)建兩個(gè)表格,然后拼接成個(gè)。需要注意參數(shù)ignore_index,默認(rèn)保留原索引,改為T(mén)rue時(shí)表重新排序索引。般插個(gè)新的項(xiàng)時(shí),采簡(jiǎn)單法構(gòu)建個(gè)新的表格,然后append到標(biāo)表格去。data=1,2,3,4df1=pd.DataFrame(data,columns=a,b)data=5,6,7

6、,8df2=pd.DataFrame(data,columns=a,b)df=df1.append(df2,ignore_index=True)輸出:a b0 1 21 3 42 5 63 7 83.不同dataframe的拼接法df1.merge(df2,on,how)df=df1.merge(df2, on=合并的列名 , how=outer)how表內(nèi)連接(inner)或者外連接(outer):內(nèi)連接表保留共有元素,外連接表保留所有元素,沒(méi)有值的進(jìn)NaN填充;同時(shí),合并列名也可以選擇多個(gè)。df1=pd.DataFrame(data1,columns=Name,Sex,Age)df2=pd

7、.DataFrame(data2,columns=Name,Weights,Heights)df_merge=df1.merge(df2,on=Name,how=outer)df_merge2=df1.merge(df2,on=Name,how=inner)311001471122561 qian female1總結(jié)博客見(jiàn):4.更改dataframe中的值和df.ilocindex,column三種法,df.iloc,根據(jù)索引位置來(lái)查找,參數(shù)都為整數(shù),表列,等價(jià)于df.iat;df.loc,參數(shù)為index名和column名,等價(jià)于df.at;5.dataframe按照某列排序df.sort_

8、values(by,inplace,ascending)格式為:df.sort_values(by=A,inplace=True, ascending=True),參數(shù)1表按哪個(gè)列進(jìn)排序,會(huì)在原dataframe上進(jìn)修改df.sort_values(by=A,inplace=True, ascending=True)1 0 92 4 81 6 30 7 50 8 56.取指定范圍內(nèi)的值末,列列末,df.iloc有l(wèi)oc法和iloc法。loc法通過(guò)index和column來(lái)取,不能通過(guò)數(shù)字,iloc法通過(guò)數(shù)字索引來(lái)去,不能使索引名。同時(shí)需要注意,iloc法按照數(shù)字來(lái)取時(shí),不包含最后個(gè)元素。112male 7511147.08.刪除指定9.使groupby對(duì)表格進(jìn)劃分(1)#df1=dfSales.groupby(dfGroup).sum()print(df1)df1=dfSales.groupby(dfMon).sum()print(df1)10.數(shù)據(jù)透視表格df.pivot(index=Mon,columns=Part,values=Num)681 3 5 7 911 13 15 17 19122 4 6 8 1012 14 16 18 2011.添加的平均值dfM

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論