Python科學計算與數(shù)據(jù)處理pandas的數(shù)據(jù)結構入門

上傳人：d*** IP屬地：天津上傳時間：2021-05-03 格式：DOCX 頁數(shù)：16 大?。?9.57KB 積分：26 舉報 版權申訴

Python科學計算與數(shù)據(jù)處理pandas的數(shù)據(jù)結構入門_第2頁

Python科學計算與數(shù)據(jù)處理pandas的數(shù)據(jù)結構入門_第3頁

Python科學計算與數(shù)據(jù)處理pandas的數(shù)據(jù)結構入門_第4頁

已閱讀5頁，還剩11頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

1、Python 科學計算與數(shù)據(jù)處理 pandas 的數(shù)據(jù)結構入門熊貓條目目錄熊貓的數(shù)據(jù)結構介紹了系列數(shù)據(jù)框架索引對象的基本功能，重新索引指定軸上的丟棄項索引、選擇和過濾算術運算和數(shù)據(jù)對齊功能應用和映射排序和排序具有重復值的軸索引目錄摘要和計算描述統(tǒng)計相關系數(shù)和協(xié)方差唯一值、值計數(shù)和成員處理缺失數(shù)據(jù)過濾缺失數(shù)據(jù)填充缺失數(shù)據(jù)層二級索引根據(jù)排序摘要統(tǒng)計重新排列排序順序。使用數(shù)據(jù)框架的列。其他與熊貓相關的話題。熊貓包含先進的數(shù)據(jù)結構和操作工具，使數(shù)據(jù)分析更快更簡單。它建立在 NumPy 之上，使以 NumPy 為中心的應用程序更加容易。因為 Series和 DataFrame經常使用，所以將它們引

2、入本地命名空間更方便。從Frompandasimportseries開始，dataframemportpandassappandas數(shù)據(jù)結構介紹系列創(chuàng)建一個類似于一維數(shù)組的對象，它由一組數(shù)據(jù)(各種 NumPy 數(shù)據(jù)類型 )和一組與之相關的數(shù)據(jù)標記 (即索引 )組成。最簡單的系列只能從一組數(shù)據(jù)中生成:obj =系列 (，)objdtype:int 熊貓。序列的字符串表示如下:左邊是索引，右邊是值。由于沒有為數(shù)據(jù)指定索引，因此會自動創(chuàng)建一個到N 的整數(shù)索引 (N 是數(shù)據(jù)的長度 )。序列的數(shù)組表示和索引對象可以通過序列的值和索引屬性獲得 :objvaluesray(，dt type = INT)ob

3、jindexindindex( ，DTYPE = # INT#)熊貓的數(shù)據(jù)結構介紹，通常希望創(chuàng)建的序列將有一個可以標記每個數(shù)據(jù)點的索引:OBJ = 序列 ( ， Index = # D # ， B # ， A #， C#)OBJDBACDTYPE:intobINDEX(U # D # ，與普通的 NumPy 數(shù)組相比，熊貓的數(shù)據(jù)結構可以通過索引在序列中選擇一個或一組值:obj #A # obj # d # = obj # C # # A # # d # cadd type:int熊貓數(shù)據(jù)結構簡介NumPy 數(shù)組操作 (例如，基于布爾數(shù)組的過濾、標量乘法、數(shù)學函數(shù)的應用等。) 將保

4、留索引和值之間的鏈接 :objobjobj*npexp(obj)dbacdtype:float pandas 數(shù)據(jù)結構簡介還可以將序列視為固定長度的有序字典，因為它是索引值到數(shù)據(jù)值的映射。它可以用于許多最初需要字典參數(shù)的函數(shù):# b # inobjtrue # e# inobjfalsepanda的數(shù)據(jù)結構介紹，如果數(shù)據(jù)存儲在Python 字典中，也可以直接從該字典創(chuàng)建系列:sdata = # ohio #:，# Texas #:，# Oregon#:，# Utah #: obj = Series(sdata)objoiooregontexutahdtype:int熊貓介紹

5、，如果只傳入一個字典，結果系列中的索引就是原始字典的鍵(有序排列 )。在該示例中，將找到與各州索引匹配的sdata 值，并將其放在相應的位置，但是由于找不到對應于加利福尼亞州的sdata 值，因此結果是 NaN(即非數(shù)字 )州= # California #、俄亥俄 #、俄勒岡 #、德克薩斯 # OBJ = 系列 (SDATA ，索引 = 州 )OBJCALIFORNIA NanoHioOregonTexastype:FLOAT AMANS 數(shù)據(jù)結構簡介 NAN 用于表示缺失值或 NA 值。熊貓的是和不是函數(shù)可用于檢測丟失的數(shù)據(jù) :pdis(obj)#Series 有一個類似

6、的示例方法 : 加利福尼亞真 #objs()ohiofalsoregonfalsfalsfalsfalsdttype:boolpdnot(obj)加利福尼亞假脫機工作的數(shù)據(jù)結構對于許多應用程序來說， Series域的一個重要功能是在算術運算中自動對齊不同索引的數(shù)據(jù)。objobjobjcaliforianhioregontextasuthandtype:FLOAT 熊貓的數(shù)據(jù)結構介紹了系列對象本身及其索引具有名稱屬性，該屬性與熊貓的其他關鍵功能密切相關:objname = # POPULATION # OBJ INDEXNAME=#STATE#OBJSTATECALIENA

7、NIONOHIOREGONTEXANAME:POPULATION，DTYPE: FLOAT 熊貓系列的索引可以通過賦值就地修改:objobjindex= # Bob # # Steve # # # Jeff # # Ryan #OBJBOBBSTEVEJEFERANDTYPE:INTPANDAS數(shù)據(jù)結構介紹數(shù)據(jù)結構 )。數(shù)據(jù)框架既有行索引又有列索引，可以看作是由系列組成的字典 (共享相同的索引 )。與其他類似的數(shù)據(jù)結構 (如 r 的數(shù)據(jù)框架 )相比，數(shù)據(jù)框架中面向行和面向列的操作基本平衡。事實上，數(shù)據(jù)框架中的數(shù)據(jù)存儲在一個或多個二維塊中 (而不是 list 、字典或其他一維數(shù)據(jù)結構 )。熊貓

8、的數(shù)據(jù)結構引入了許多構建數(shù)據(jù)框架的方法。最常用的方法之一是直接傳遞到由等長列表或 NumPy 數(shù)組組成的字典中 :結果數(shù)據(jù)框將被自動編入索引 ( 就像序列一樣 )，所有列將按順序列出DATA = # STATE #: # OHIO # ，# OHIO # ，# Nevada #，數(shù)據(jù)結構 #NEVADA # ，# year #:，# pop #:， frame = 數(shù)據(jù)框 (數(shù)據(jù) )框架引入了如果指定列序列，數(shù)據(jù)幀的列將按指定的順序排列:像序列一樣，如果在數(shù)據(jù)中找不到傳入的列，將生成 NA 值 :數(shù)據(jù)幀 (數(shù)據(jù) )。columns= # year # # STATE # # pop #)F

9、RAME = DataFrame(數(shù)據(jù)，列 = # year # STATE # # pop # # debt #，index = # one # # two # # three # # four # #five #)FrameFrameColumnIndex(u # year #，u#state#，u#pop#，u#debt#，DTYPE = # OBJECT #)PANDAS 的數(shù)據(jù)結構介紹了數(shù)據(jù)幀的列可以通過類似于字典標記或屬性的方式作為一個序列來獲得:FRAME#STATE # 介紹了數(shù) 據(jù) 類型 :objectframeeyearonetwo other freefourve

10、name:year，數(shù)據(jù)類型 :int 熊貓的數(shù)據(jù)結構。請注意，返回的序列與原始數(shù)據(jù)幀具有相同的索引，并且其名稱屬性也相應地設置了。行也可以通過位置或名稱獲得。例如，索引字段 IX: Frameix#三# yearstatetopdebtnanname:Three，DType:object 熊貓的數(shù)據(jù)結構介紹列可以通過賦值來修改。例如，可以為空的債務列分配一個標量值或一組值:FRAME# DOUGH # = FRAME FRAME # DOUGH # = NParange()FRAME熊貓。數(shù)據(jù)結構引入了當一個列表或數(shù)組被分配給一列時，它的長度必須與數(shù)據(jù)幀的長度相匹配。如果分配了序列，它將

11、與數(shù)據(jù)幀的索引完全匹配。所有空格都將被缺少的值填充 :val = series(，index = # two # ，# four #，# five#)frame # debit # = valframepadas。當數(shù)據(jù)結構作為不存在的列賦值引入時，將創(chuàng)建一個新列。關鍵字 del 用于刪除列 :frame # eastern # = frame state = = #Ohio # framedefframe # eastern # frameeconsteinex(u # year ，#u # state#，u # pop #，u # debt #，DTYPE = # ObjectLSQUO)

12、熊貓的數(shù)據(jù)結構引入了另一種常見的數(shù)據(jù)形式:嵌套字典 (即字典字典 ):如果它被傳遞到數(shù)據(jù)框架，它將被解釋為 :外部字典的鍵充當列的鍵，內層的鍵充當行索引 :pop=#Nevada#: ，: ，#Ohio#: ， : ，: 幀 =數(shù)據(jù)幀 (pop)幀 T #也可以轉置結果。熊貓的數(shù)據(jù)結構引入了內部字典的關鍵字將被合并、排序以形成最終的索引。如果明確指定了索引，情況就不同了 :由序列組成的字典幾乎使用相同的用法 :dataframe (pop，index =，)framepdata = # ohio #:frame # ohio #:，# Nevada #:frame # Nevada #:

13、data frame(pdata)熊貓的數(shù)據(jù)結構介紹，如果設置了數(shù)據(jù)幀的索引和列的名稱屬性，也將顯示此信息 :如序列，values 屬性還將以二維數(shù)組的形式返回數(shù)據(jù)框架中的數(shù)據(jù) :frameindexname = # year # frameeconsumname= # state #frameframeframeindexname = # year # framecolumns name = # state #framevaluesarray(nan、)熊貓的數(shù)據(jù)結構介紹了如果數(shù)據(jù)框架的每一列的數(shù)據(jù)類型不同，則值數(shù)組的數(shù)據(jù)類型將被選擇為與所有列兼容:FrameFramEvalueSarra

14、y (L、# Ohio #、Nan、L、# Ohio #、L 、#等熊貓的索引對象負責管理軸標簽和其他元數(shù)據(jù) (如軸名等 )。 )。用于構造序列或數(shù)據(jù)幀的任何數(shù)組或其他序列的標簽被轉換成索引 :obj = series (range()，index = # a #， b #， c #)Index =objindexindex(u # a #，u # b #，u#c#，dt type = # object #)Index:Index(u# b #，u # c #，DTYPE = # ObjectLSQUO) 熊貓的數(shù)據(jù)結構引入了索引對象是不可變的，因此，用戶不能修改它 :不可修改性非常重要，因

15、為它使索引對象能夠在多個數(shù)據(jù)結構之間安全地共享:Index =# d #TypeError:indexesdoesnotsupportmutableoperationindex=pdIndex(nparange()obj=Series( ，， Index=Index)Objindexinsinriguepanals 的數(shù)據(jù)結構介紹了除了它看起來像數(shù)組索引的功能之外，它還類似于一組固定大小的索引:每個索引都有一些方法和屬性，可用于設置邏輯并回答關于索引中包含的數(shù)據(jù)的常見問題?？蚣?# Ohio # ImporeColumnStruenindex Fairpanals 的數(shù)據(jù)結構引入方法顯示，在

16、指示每個值是否包括在參數(shù)集中的布爾類型計算中， append 連接另一個索引對象以生成新的 Indexdiff 計算差集并獲得 Index 交集計算交集聯(lián)合計算并集。數(shù)組刪除刪除索引 I 處的元素，并獲取新的索引刪除來刪除傳入的值，并獲取新的索引插入來插入索引 I 處的元素，并獲取新的索引當每個元素大于或等于前一個元素時返回 Trueunique，當索引中沒有重復值時返回 true unique來計算索引中唯一值的數(shù)組索引的方法和屬性的基本函數(shù)重新索引熊貓對象的一個重要方法是重新索引，它用于創(chuàng)建適合新索引的新對象。作為一個簡單的例子， OBJ =系列 (，索引= # D #，B #，A#，

17、C #) OBJDBACDTYPE:FLOAT 基本函數(shù)調用系列的重新索引將根據(jù)新的索引重新排列。如果某個索引值目前不存在，則引入缺失值 :Obj=ObjReIndex(# A # # # B # # C # # D # # E #)ObjabCDENanobReIndex(#A # # B # # C # # D # # E #，F(xiàn)illValue =) 輸出 :ABCDE 的基本功能可能需要在重新索引有序數(shù)據(jù)(例如時間序列 )時進行一些插值處理。方法選項可以實現(xiàn)此目標。例如，ffill 可用于填充前向值 :obj=系列 (# blue # # #紫色 # #黃色 #，

18、index =，)obj reindex (range()，Method= # ffill#)bluebluezelpurpleyelloweview type:對象基本函數(shù) reindex 的(插值 )方法選項可針對DataFramereindex (row) index 、列或兩者進行修改。如果只傳入一個序列，將對行進行重新索引:參數(shù)描述ffill或 pad forward fill( 或 move)值 bfill 或 back back fill( 或 move)值 frame =data frame(nparange()reform()，index = # a # # # c # #

19、d #，columns = #Ohio # # Texas # # California #)frame = framereindex(# a # # b # # c #，#d#)框架的基本功能可以通過使用columns 關鍵字來重新索引列:行和列也可以同時重新索引，而插值只能通過行 (即軸 )來應用 :通過使用ix 的標簽索引功能，可以使重新索引任務變得更簡單:states=#Texas#、#Utah# 、# California # framereindex(columns = States)framereindex(index = # a # # # b # 、# c # # d #、

20、method = # ffill#， columns = states) frameix # a # 、# b # 、# c # 、# d # States reindex函數(shù)的基本函數(shù)參數(shù)描述新的序列索引被用作索引。它可以是索引實例，也可以是其他順序的Python 數(shù)據(jù)結構。索引將被完全使用，就像沒有副本一樣。方法插值 (填充 )方法。填充值在重新索引過程中需要引入缺失值時使用的替換值限制。正向或反向填充的最大填充級別與指定級別的多重索引的簡單索引相匹配。否則，選擇其子集副本。默認值為“真”。不管怎樣，收到。如果錯誤，新的和舊的是平等的?；竟δ懿粫粡椭?。丟棄指定軸上的項目。丟棄某個軸

21、上的一個或多個項目。只要有索引數(shù)組或列表，就很簡單。由于需要執(zhí)行一些數(shù)據(jù)整理和收集邏輯，drop 方法返回一個新對象，該對象具有在指定軸上刪除的指定值:obj = series(，index =# a # # # b # # # c # # d # # e #)new obj = objdrop(# c #)new objbdeobjectdrop(# d # # c #)數(shù)據(jù)框的基本函數(shù)，可以刪除任何軸上的索引值 :data = dataframe (nparange)()， index = # ohio #、colorado #、utah #、new York #、columns = #

22、 one #、two #、three #、four #) datadrop(# colorado #、ohio #) datadrop (# two #、axis =) datadrop (# two #、four#、axis =)基本函數(shù)index 、選擇和過濾序列索引(obj)的操作類似于NumPy 數(shù)組的索引，只是序列的索引值不只是一個整數(shù)。Obj = series(，index = # a # # # B # # C # # d #)obj # B # objobj:cdd type:int Basic functions obj # B # # a # # d # badd type

23、:INTOBJ ，BDD type:intobjobjabdtype:int Basic Function 與普通的Python 切片操作不同，當使用非整數(shù)作為切片索引時，將其結尾設置為 inclusive 的方法也非常簡單 :OBJ # B #:# C # Bcdtype:INTOBJ # B #:# C # = OBJACD Basic首先，通過切片或布爾數(shù) 組來選擇行 :data # two#ohiocoloradoutnewyorkdata # three # # one # data:data data data # three #另一種用法是通過布爾數(shù)據(jù)幀(如下面通過

24、標量比較操作獲得的數(shù)據(jù)幀)進行索引 :此代碼的目的是使數(shù)據(jù)幀在語法上更像 ndarray。 datadata=data = data的基本功能引入了一個特殊的索引字段ix，用于在數(shù)據(jù)幀的行上進行標簽索引。它可以通過數(shù)軸符號和軸標簽從數(shù)據(jù)框架中選擇行和列的子集。這也是一種簡單的重新索引方法 :data IX # COLORADO # #TWO # # TWOother name:COLORADO ， dtType:intdata IX#COLORADO #Utah # ， BasicFunctionDataIXonetwo3fourname:Utah ， dtType:INTDATAIX:#UT

25、AH# # #Two#OHOIOCOLORADOUTAHname:Two， DTYPE:INTDataIX#COLORADIXdathree， :DATAIX#COLORADORA#TWORTHERENAME:COLORADORA ，DTYPE:INT 基本函數(shù)索引選項用于數(shù)據(jù)幀 :類型描述對象選擇單列在一些特殊情況下很方便:布爾數(shù)組 (過濾行 )、切片 (行切片 )、布爾數(shù)據(jù)幀 (根據(jù)條件設置值 )。Objixval 選擇一行或一組數(shù)據(jù)框行。對象 :，val 選擇單個列或列的子集。值，同時選擇行和列。reindex 方法將一個或多個軸與新索引匹配。xs 方法根據(jù)標簽選擇一行或一列，并返回一個

26、序列。icol 、irow 方法根據(jù)整數(shù)位置選擇單行或單行，并返回一個序列。getvalue，setvalue方法根據(jù)行標簽和列標簽選擇單個值?；竟δ芩阈g運算和數(shù)據(jù)對齊熊貓最重要的功能之一是它可以對具有不同索引的對象執(zhí)行算術運算。如果在添加對象時有不同的索引對，則結果的索引是索引對的并集。S =系列 (，index = # a #，c #，d #，e #) s =系列 (，index= # a #，c #，e #，f #，g #) ss 添加它們的基本能力將產生 :自動數(shù)據(jù)對齊操作在非重疊索引處引入 na 值。缺失值在算術運算期間傳播。輸出 :acdnanefnangnandtype:flo

27、at DataFrame的基本函數(shù)，將在行和列上都進行對齊 :df =數(shù)據(jù)框架 (n 參數(shù) (，)，整形(，列=列表 (#BCD #) ，索引 = # ohio # ，德克薩斯 #，科羅拉多 #)df = 數(shù)據(jù)框架 (n 參數(shù)(，)，整形 (，)，列=列表 (#bde#)，索引 =#Utah#，俄亥俄 #，德克薩斯#，俄勒岡 #)dfdfdfdf# 添加它們之后，將返回一個新的數(shù)據(jù)框架。它的索引和列是原始兩個數(shù)據(jù)幀的并集。基本功能是用算術方法填充值。當對具有不同索引的對象執(zhí)行算術運算時，當在一個對象中的軸標簽在另一個對象中找不到時，可能需要填充一個特殊值 (例如 :df =數(shù)據(jù)框架 (np

28、arange()整形 (，)，Columns = List(# ABCD #)df = 數(shù)據(jù)框架(nparange()整形 (，)，Columns = List(# ABCDE #)DFdf # 添加它們時，將沒有重疊位置來生成NA 值?；竞瘮?shù) :使用 DF 的 add 方法和fillvalue 參數(shù)傳遞 DF: 類似地，當重新索引Series 或 DataFrame 時，填充值 :dfadd(df，F(xiàn)illvalue =)dfreindex(columns = dfcolumns，fill value =)靈活的算術方法 add方法 for addition() 方法 sub 方法 for

29、減法 ()方法 div 方法 for division() 方法 mul 方法 for 乘法 (*) 基本函數(shù) (如 NumPy 數(shù)組)數(shù)據(jù)框和 Series之間的算術運算也是明確定義的。讓我們看一個有啟發(fā)性的例子來計算一個二維數(shù)組和它的一行之間的差異 :ARR = NPA Range () RESHAPE () array(，)ARRAY( ，)基本函數(shù)這叫做廣播。數(shù)據(jù)幀和序列之間的運算也是如此 :默認情況下，數(shù)據(jù)幀和序列之間的算術運算將序列的索引匹配到數(shù)據(jù)幀的列，然后在行下廣播 frame =數(shù)據(jù)幀 (NPA 范圍 ()整形 ()。Columns = list (# bde

30、 #)，index= # Utah # # Ohio # # Texas # # Oregon #)Series = frameset frameset基本函數(shù)如果在數(shù)據(jù)框架的列或系列的索引中找不到索引值，則操作中涉及的兩個對象將被重新索引以形成聯(lián)合 :如果要匹配行并在列上廣播，則必須使用算術運算方法。例如，傳入的軸號是您想要匹配的軸。本例中的目的是匹配DauFrame和廣播的行索引。series=Series(range()，index=#b#，e#，f #)frameseries = Frame# d # Series framesub(Series，Axis=) 基本函數(shù)應用程序和映射

31、NumPy的 ufuncs(元素級數(shù)組方法)也可用于操作熊貓對象:Frame =數(shù)據(jù)框(NPRANDOM ，Columns =列表 (# BDE #) ，Index = # utah # ，俄亥俄#，德克薩斯 #，俄勒岡 #) Frame基本函數(shù)另一個常見的操作是將函數(shù)應用于由列或行構成的一維數(shù)組。數(shù)據(jù)框架的應用方法可以實現(xiàn)這個功能 :許多最常見的數(shù)組統(tǒng)計函數(shù)都是作為數(shù)據(jù)框架方法 (如求和和均值 )來實現(xiàn)的，因此不需要應用方法。f = lambdax:xmax()xmin()frame apply(f)frame apply(f ，axis =)基本函數(shù)除了標量值之外，傳遞給apply 的函數(shù)

32、還可以返回由多個值組成的序列 :deff (x): returnseries (xmin() ，xmax()，index = # min # # max #)frame apply(f)基本函數(shù)此外，元素級別的 Python 函數(shù)也可用。如果要獲取框架中每個浮點值的格式化字符串，可以使用applymap:它被稱為applymap，因為序列有一個應用元素級函數(shù)的映射方法 :FORMA T=LAMBDAX:#F#XFRAMEAPPLYMAP(FORMAT)FRAME# E # MAP(FORMAT) 基本函數(shù)排序和基于條件對數(shù)據(jù)集進行排序也是一個重要的內置操作。要對行或列索引進行排序(按字典順

33、序 )，請使用 sortindex 方法，該方法返回一個新的排序對象:obj = series (range()，index = # d #，a #，b #，C #) OBJSORTINDEX () ABCDD TYPE: INT基本函數(shù)，而對于數(shù)據(jù)框，它可以根據(jù)任何軸上的索引進行排序:默認情況下，數(shù)據(jù)按升序排序，但也可以按降序排序 :FRAME = 數(shù)據(jù)框架 (NPARange()整形 ()，INDEX = # THREE # # ONE # ，Columns = # D # # A # # B # C #)FRAME portIndex()FRAME portIndex(Axis =)FR

34、AME portIndex(Axis =，升序 = False)基本函數(shù)要按值對序列進行排序，請使用其排序方法 :obj =序列 (， )objorder () obj = Series(，npnan，npnan， )默認情況下，objorder()的缺失值將放在該系列的末尾。NaNNaN basic 函數(shù)可能希望根據(jù)一列或多列中的值對數(shù)據(jù)框進行排序。這可以通過將一個或多個列的名稱傳遞給by 選項來實現(xiàn) :根據(jù)多個列對傳入名稱列表進行排序:frame = dataframe (# b #:，# a#:，)frame frame index(by = # b #)frame frame inde

35、x(by = # a # # b #)基本函數(shù)排序與排序密切相關，它將添加一個排序值(從數(shù)組中有效數(shù)據(jù)的開頭到末尾 )。它類似于 numpyargsort生成的間接排序索引，只是它會根據(jù)某些規(guī)則破壞級別關系。序列和數(shù)據(jù)框架的等級方法:等級通過默認為每個組分配一個平均等級來破壞等級關系:obj =序列 (，)objprintobjrank() 基本函數(shù) objrank(方法 = #第一 #)#等級根據(jù)值在原始數(shù)據(jù)中出現(xiàn)的順序給出 :objrank( 升序 =False 。 method=#max#)#降序排列 : 基本函數(shù)DataFrame 可以計算行或列的排列:用于在排列期間破

36、壞水平關系的方法選項 :lsquofaveragersquo默認 :分配平均排名。相等分組中的每個值。使用整個分組的最小排名使用最大等級lsquo 在整個分組中， Irst按照值在原始數(shù)據(jù)中出現(xiàn)的順序分配排名幀=數(shù)據(jù)幀 (# b #:，# a#:，# c #:，。)frameframerank(axis=) 基本函數(shù) Axis with repeatableValues Index Series with repeatable Index Values:索引的 isunique屬性驗證其是否唯一 :OBJ = Series (Range()，Index = # A # # # A # # #

37、B # # C#)OBJAABBJINDEXUNiqueFALSE的基本函數(shù)在選擇具有重復值的索引數(shù)據(jù)時將具有不同的行為。如果一個索引對應于多個值，它將返回一個序列，而如果它對應于單個值，它將返回一個標量值。當索引數(shù)據(jù)框架的行時也是如此:obj # a # aa obj # c # df =data frame(nprandom rand(，index = # a # # a # # b # # b #)DFD fix # b# summary 和計算描述 statistics 熊貓對象具有一組常用的數(shù)學和統(tǒng)計方法。其中大多數(shù)屬于歸約和匯總統(tǒng)計，用于從序列中提取值 (如總和或平均值 )，或從數(shù)據(jù)框的行或列中提取序列。與相應的 NumPy 數(shù)組方法相比，它們都是基于沒有丟失數(shù)據(jù)的假設而構建的。讓我們來看一個簡單的數(shù)據(jù)框 :df =數(shù)據(jù)框 (，npnan，npnan，npnan，index = # a # ，b #，c #，d #，columns = # one #，two#)df匯總和計算描述統(tǒng)計信息調用數(shù)據(jù)框的sum 方法將返回一個帶有列小計的序列 :dfsum()一個兩個數(shù)據(jù)類型:float #傳入軸 =將按行進行匯總:dfsum(axis =)AbcAndTty

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

Python科學計算與數(shù)據(jù)處理pandas的數(shù)據(jù)結構入門

文檔簡介

溫馨提示

最新文檔

評論

Python科學計算與數(shù)據(jù)處理pandas的數(shù)據(jù)結構入門

文檔簡介

溫馨提示

最新文檔

評論

相關文檔